植物矮化的方法
本发明涉及一种矮化植物的方法以及一种用于该方法的分子。
小型植物对于农业和园艺学的许多领域是重要的。例如,降低植物的高度或茎的长度,可以获得具有新审美价值的观赏植物;小型化的蔬菜或水果可作为具有商业价值的新型作物,如适于嘴咬的大小。除这些工业上的应用之外,小型的试验植物不仅容易处理,而且减少了栽培植物所需的空间,从而可以有效利用实验室的空间。
在植物小型化的过程中,与野生型(正常型)相比,植物高度或茎长度降低的性状称为矮化。通过γ-射线或化学诱变获得了大量具有该性状的水稻品种,而且已经对其进行了长时间的遗传分析。迄今已发现了60多个不同的基因与矮化相关(Rice Genetic Newsletter,12:30-32(1995))。但是,除了通过对与植物生长激素赤霉素生物合成相关的基因进行突变获得了一些矮化突变株外,对矮化表型为何进行表达的内容知之甚少。
水稻的矮化突变株中,已知Daikoku矮化型是通过阻抑水稻的第二节间的伸长而使得植株的高度低于正常植株高度的一半,且使得谷粒更小、更圆(Masao Akemine,Nihon Gakuiutsukai Houkoku(Japan Science CouncilReport),1:108:314(1925);Tsutsumu Nakayama,Shinshudai Bunrigakubu Kiyou(Joumal ofFaculty ofLiveral Arts and Science Shinshu University),4:1-31(1954);Man-emon Takahashi and Kazuyoshi Takeda,Hokudai Nou Houbun Kiyou(Memories of the Faculty ofAgriculture Hokkaido University),7:32-43(1969))。此外,遗传分析已证实Daikoku矮化型受在水稻第5染色体上的单个隐性基因dl控制(Nagao and Takahashi,J.Fac.Agr.,Hokkaido Univ.53:72-130(1963);Iwata and Omura,Jpn.J.Genet.51:135-137(1976))。在dl基因的突变株体内,植物激素赤霉素含量与正常株相同,且通过外源赤霉素处理也不能使植株的高度恢复正常(Suge,H.and Y.Murakami,Plant and Cell Physiol 9:411-414(1968))。这种性状表明dl基因与植物体内的赤霉素的生物合成无关,但大概与赤霉素受体分子的遗传位点或此后的信号传导有关(Mitsunaga,S.,Tashiro,T.and Yamaguchi,J.,Theor.Appl.Genet.87:705-712(1994))。
因此,分离Daikoku矮化型基因dl,且揭示其基因产物的功能是尤为重要的,不仅可弄清植物的形态发生机理,同时也可利用所获得的结果人工控制植株的大小。
本发明的目的是分离与植物矮化相关的dl基因。本发明的另一个目的是提供一种通过控制dl基因表达而矮化植物的方法以及提供一种控制dl基因表达的分子。
迄今已知道,水稻矮化基因dl编码与水稻矮化相关的蛋白,且存在于水稻第5染色体大型区域的某一基因座上。为了从大型染色体区域分离dl基因,本发明人使用连锁分析测定了dl基因的位置,且通过作图克隆法成功地分离了所需的基因。更具体地说,经连锁分析,dl基因在染色体上所占的区域缩小到位于特定分子标记之间的区域。通过对比YAC克隆,获得了该缩小区域的周围区域的物理图谱。根据EST作图的结果,本发明人成功地识别了在这些YAC克隆中的单个cDNA克隆“ST5933”为dl基因的备选物。
通过在数据库中基因序列的同源性,分析了分离的克隆ST5933(362碱基对)的核苷酸序列。该基因具有植物中G蛋白α亚单元的特点。但是,该基因至今一直没有被认为与植物的矮化相关。
在活生物体,包括人类体内,G蛋白已知的功能是作为激素的受体或作为与受体的信号传导相关的因子。水稻矮化基因dl也可作为植物激素赤霉素的受体或者与此后的信号传导相关。预期具有类似于上述功能的G蛋白基因不仅存在于水稻植株内而且在植物界中广泛存在。本发明人已发现,通过阻抑dl基因或其它植物体内的其同源基因的表达,可以使多种植物矮化。
因此,本发明涉及一种通过阻抑与植物矮化相关的dl基因或其相应物的表达而矮化植物的方法,以及涉及一种用于阻抑该基因表达的分子。更具体地,本发明涉及:
(1)一种用于矮化植物的DNA,该DNA编码与下列DNA(a)、(b)或(c)的转录产物互补的反义RNA:
(a)编码含有SEQ ID NO:1的氨基酸序列的蛋白质的DNA;
(b)含有SEQ ID NO:2的核苷酸序列的DNA;或
(c)可与含有SEQ ID NO:2的核苷酸序列的DNA杂交且编码与含有SEQ ID NO:1的氨基酸序列的蛋白质功能相当的蛋白质的DNA;
(2)一种用于矮化植物的DNA,该DNA编码具有核酶活性的RNA,可专一性切割(1)中DNA(a)、(b)或(c)的转录产物;
(3)一种用于矮化植物的DNA,该DNA编码通过协同阻抑作用阻抑(1)中DNA(a)、(b)或(c)在植物细胞内表达的RNA;
(4)将(1)、(2)或(3)的DNA用于矮化植物的用途;
(5)一种矮化植物的方法,包含阻抑(1)中(a)、(b)或(c)的DNA在植物细胞内表达:
(6)(5)的方法,通过在植物细胞内表达(1)、(2)或(3)的DNA,而阻抑(1)中(a)、(b)或(c)的DNA表达;
(7)一种矮化植物的方法,其中包含以下步骤:
(a)向植物细胞内导入阻抑(1)中(a)、(b)或(c)的DNA表达的物质;和
(b)再生上述植物细胞,获得转基因植物;
(8)(7)的方法,其中所述的物质为(1)、(2)或(3)的DNA;
(9)一种保留(1)、(2)或(3)的DNA、且可表达该DNA的转化的植物细胞;
(10)一种含有(9)的细胞的矮化的转基因植物;
(11)一种(10)的植物的繁殖培养基。
图1显示了根据粗标度连锁分析推断的dl基因座区域。
图2显示了根据精密标度连锁分析推断的dl基因座区域。
图3表示2个野生型品种(Nipponbare和Kasalath)和9个dl突变株(F12,HO532,HO533,HO537,HO538,HO541,HO552,CM382和CM1792)以ST5933作为探针进行基因组Southem杂交的电泳图谱。样品采用0.8%琼脂糖凝胶电泳,且印迹于硝化纤维膜上。用ECL系统测定信号。
图4表示2个野生型品种(Nipponbare和Kasalath)和4个dl突变株(FL2,HO532,HO541和HO552)以ST5933作为探针进行Norrhem杂交的电泳图谱。
本发明涉及一种通过阻抑dl基因或其相应物的表达而矮化植物的方法,以及一种阻抑这些基因表达的分子。SEQ ID NO:2显示了dl基因的cDNA核苷酸序列(本发明人已经弄清该基因如何与水稻矮化相关),SEQ IDNO:3显示了其基因组DNA核苷酸序列,SEQ ID NO:1显示了这些DNA编码的蛋白质的氨基酸序列。(这些序列在Seo等人.,Plant.Mol.Biol.27:1119-1131(1995)和Ishikawa等人,Plant.Cell.Physiol.36(2):353-359(1995)中描述)。
迄今已知,dl基因提供水稻植物矮化的表型,且存在于水稻第5染色体的大型区域的某一基因座上。本发明人通过作图克隆法缩小了dl基因在水稻第5染色体的区域,最终成功地鉴定其为一单个基因。该基因被分离,且特征为编码与胞内信号传导有关的G蛋白三聚体的α-亚单位的蛋白(Seo等人,Plant.Mol.Biol.27:1119-1131(1995);和Ishikawa等人.,Plant.Cell.Physiol.36(2):353-359(1995)),同时我们首先证明该基因与植物矮化的关系。Northem杂交的结果表明,dl基因在野生型植株体内被表达,但在dl突变株体内不表达(实施例5)。基于这些数据,本发明人发现,可通过阻抑dl基因的表达而诱导植物矮化表型。
其表达被阻抑从而诱使植物矮化的本发明的靶标基因不限于水稻dl基因。除了水稻dl基因,任何来源于其它植物的基因,只要其可编码功能相当的蛋白质,均可作为本发明的靶标基因。术语“功能相当的蛋白质”的含义为一种除被dl基因表达的蛋白质外的G蛋白,阻抑其表达可诱使植物矮化。水稻矮化基因dl编码三聚化的G蛋白三聚体α-亚单位,表明它可能与植物激素赤霉素的受体有关,或与此后的信号传导有关。因此,其同源基因不仅存在于水稻中,而且也广泛存在于植物界中的推断是可合理的。本发明利用这些同源基因也可使除水稻以外的其它植物矮化。本发明中被矮化的靶标植物包括小麦、大麦、玉米、西红柿、豌豆和大豆,但不限于此。
编码与水稻dl基因编码的蛋白功能相当的蛋白质的基因通过本领域技术人员熟知的方法进行分离。这些方法包括:杂交技术(Southem杂交,E.M.,J.Mol.Biol.98:503(1975))和聚合酶链式反应(PCR)技术(Saiki,R.K.等人.,Science 230:1350-1354(1985);Saiki,R.K.等人.,Science 239:487-491(1988))。即,本领域技术人员以水稻dl基因核苷酸序列(SEQ ID NO:2)或其部分序列作为探针,以与dl基因(SEQ ID NO:2)专一性杂交的寡核苷酸作为引物,通过常规的方法可从水稻以外的植物中分离dl的同源基因。
在本发明中,通过阻抑植物内源dl基因或其相应物的表达,可以使得植物矮化。本发明中术语“阻抑基因表达”包括阻抑基因转录和阻抑翻译蛋白质。该术语还既包括基因表达的完全阻抑,也包括基因表达能力的下降。
植物中专一性内源基因的表达可通过利用反义技术的方法得以阻抑,该方法是本领域最通用的方法。Ecker等人使用瞬间基因表达的方法首先证实了通过电穿孔法在植物细胞中导入反义RNA的反义效果(J.R.Ecker和R.W.Davis,Proc.Natl.Acad.Sci.USA 83:5372(1986))。此后,有人报道,通过反义RNA的表达使得靶标基因在烟草和矮牵牛中的表达降低(A.R.van derKrol等人.,Nature 333:866(1988))。反义技术现已证明是植物体内阻抑靶标基因表达的一种手段。反义核酸阻抑靶标基因表达需要多种因子。这些因子包括:形成三链结构抑制转录起始;在RNA聚合酶形成的局部开环结构处形成杂交体阻抑转录;与合成的RNA形成杂交体抑制转录;在内含子和外显子之间的交接处形成杂交体阻抑剪接;在剪接体形成部位形成杂交体阻抑剪接;与mRNA形成杂交体阻抑mRNA从细胞核转移到胞质中;在帽化位点或聚腺苷酸加成位点形成杂交体阻抑剪接;在翻译起始因子结合部位形成杂交体阻抑翻译起始;在起始密码子附近的核糖酶结合部位形成杂交体阻抑翻译;在翻译区或在mRNA的多核糖体结合部位形成杂交体抑制多肽链的延伸;以及在核酸和蛋白质之间相互作用的部位形成杂交阻抑基因表达。这些因子通过阻抑转录、剪接或翻译而阻抑靶标基因的表达(Hirashima和Inoue,“Shin Seikagaku Jikken Koza(New.Biochemistry Experimentation Lectures)2,Kakusan(Nucleic Acids)IV,Idenshi No Fukusei To Hatsugen(Replication andExpression of Genes)”,Nihon Seikagakukai Hen(The Japanese BiochemicalSociety),Tokyo Kagaku Dozin,pp.319-347,(1993))。在本发明中使用的反义序列可通过上述任一机理阻抑靶标基因的表达。在一个实施方案中,如果设计一个反义序列与基因的mRNA 5′端附近的非翻译区互补,该反义序列将可有效地抑制基因的翻译。使用与编码区或非翻译区在3′端互补的序列也是可能的。因此,在本发明中使用的反义DNA包括与基因的非翻译区和翻译区均成反义序列的DNA。该反义DNA适于在合适的启动子下游处结合,且优选地,含有转录终止信号的序列在3′端结合。这样制备的DNA通过已知的方法可转染进入所需的植物中。反义DNA序列优选是与待转化植物的内源dl基因(或其相应物)互补的序列或其部分序列,只要能有效抑制基因的表达,则没有必要是完全互补。转录的RNA优选至少90%、最优选至少95%与靶标基因转录产物互补。为通过反义序列方法有效抑制靶标基因的表达,该反义DNA应至少15个碱基长,更优选至少100个碱基长,最优选至少500个碱基长。使用的反义DNA通常短于5kb,优选短于2.5kb。
编码核酶的DNA也可用于阻抑内源基因的表达。核酶是一种具有催化活性的RNA分子。现发现多种具有各种活性的核酶。对核酶作为RNA切割酶的研究使得设计一种RNA专一位点切割的核酶成为可能。一些I组内含子型核酶或包含在RNaseP中的M1RNA由400或400个以上的核苷酸组成,另一些属于锤头型或发卡型的核酶具有约40个核苷酸的活性结构域(Makoto Koizumi and Eiko Ohtsuka,Tanpakushitsu Kakusan Kohso(Nucleic acid,Protein,and Enzyme),35:2191(1990))。
锤头型核酶的自我切割结构域切割G13U14C15的C15的3′端。U14与第9位的A之间形成的核苷酸对被认为对于核酶活性具有重要作用。此外,当用A或U取代15位的核苷酸C,其仍然具有切割作用(M.Koizumi等人.,FEBS Lett.228:225(1988))。如果核酶的底物结合部位设计成与靶标位点相邻的RNA序列互补,将可能形成一个类似于限制性切割酶的RNA切割核酶,它可识别靶标RNA上的UC、UU或UA序列(M.Koizumi等人,FEBS Lett.239:285(1988);Makoto Koizumi and Eiko Ohsuka,Tanpakushitsu KakusanKohso(Protein,Nucleic acid,and Enzyme),35:2191(1990);M.Koizumi等人,Nucleic Acids Res.17:7059(1989))。例如,在dl基因(SEQ ID NO:2)的编码区存在100多个位点可作为靶标位点。
发卡型核酶也可用于本发明。例如,发卡型核酶存在于在烟草环斑病毒卫星RNA的负链上(J.M.Buzayan,Nature 323:349(1986))。也已表明该核酶.具有靶专一性切割RNA的特点(Y.Kikuchi and N.Sasaki,Nucleic Acids Res.19:6751(1992);Yo Kikuchi,Kagaku To Seibutsu(Chemistry and Biology)30:112(1992))。
为切割靶标而设计的核酶与启动子如花椰菜花叶病毒35S启动子和转录终止序列融合从而可以在植物细胞中转录。但是,如果额外序列添加到转录RNA的5′端或3′端,核酶可能失去活性。在这种情况下,可以插入一个附加的修饰核酶,其顺式功能是将核酶部分的5′端或3′端修剪,从而得以准确地从含有核酶的转录RNA上切除核酶蛋白(K.Taira等人.,Protein Eng.3:733(1990);A.M.Dzaianott and J.J.Bujarski,Proc.Natl.Acad.Sci.USA 86:4832(1989);C.A.Grosshands和R.T.Cech,Nucleoc Acids Res.19:3875(1991);K.Taira等人.Nucleic Acid Res.19:5125(1991))。通过串联排列运些结构单元,可以更有效地切割靶标基因中的多个位点(N.Yuyama等人,Biochem.Biophys.Res.Comnun.186:1271(1992))。本发明通过使用这些核酶,可能专一切割靶标基因的转录产物,从而阻抑该基因的表达。
通过转化与靶标基因序列相同或相似的序列的DNA的协同阻抑也可阻抑内源基因的表达。“协同阻抑”指当通过转化将含有与靶标内源基因序列相同或相似的序列的DNA导入植物体内后,导入的外源基因和靶标内源基因的表达同时被阻抑的现象。虽然协同阻抑的详细机理仍不清楚,但在植物中却经常被观测到(Curr.Biol.7:R793(1997),Curr.Biol.6:810(1996))。例如,如果希望获得dl基因被协同阻抑的植物体,可以用设计的载体DNA转化所研究的植物,以表达dl基因或具有相似序列的DNA,在所获得的植株中筛选具有dl突变性状的植株,即矮化的植株。用于协同阻抑的基因没有必要与靶标基因完全相同,但优选至少90%以上的序列相同。
此外,本发明中内源基因的表达也可通过将具有该靶标基因的显性失活表型的基因转化植物进行阻抑。具有显性失活表型的基因指一种基因在其表达后,可使植物本身的野生型内源基因的活性消失或降低。已知用于本发明的dl基因是一个异源三聚体G蛋白的α亚单位。一般而言,如果一个突变的蛋白(该突变发生在α亚单位上对GTP/GDP结合活性或GTPase活性重要的区域〕被表达,且对异源三聚体形成或受体结合重要的区域仍与野生型相同,则该蛋白将是显性失活表型,因为它与其它亚单位形成了复合体以及受体却不能被GTP激活。例如,一个G蛋白α亚单位上很保守的氨基酸序列(-Asp-Val-Gly-Gly-Gln-),被认为是与GTPγ位上磷酸基团相互作用的部位。例如,已表明G蛋白α亚单位的突变蛋白,其中上述氨基酸序列上第一个Gly被Thr取代,当在COS-1细胞中表达时,表现出了显性失活表型(J.Biol.Chem.266:4673(1991))。在转化植物中表达具有上述突变的显性失活蛋白,具信靶标基因的功能被阻抑。
本发明中用于矮化植物的物质不受特别限制,只要该物质可在植物细胞内阻抑植物的内源dl基因或其相应物的表达即可。
通过向植物细胞中导入所述物质,再生转化的植物细胞,即可获得转化的矮化植物体。该物质包括上文提到的DNA。
当所述物质为可阻抑基因表达的DNA时,DNA被插入到合适的载体中,载体导入植物细胞,然后再生转化的植物细胞。任何可以使插入的基因在植物细胞中表达的载体均可使用。例如,可使用具有可在植物细胞中表达组成型基因的启动子的载体(如花椰菜花叶病毒的35S启动子)。同时,如果使用植物的组织特异性启动子,则可能获得组织特异性矮化,如矮化植物的特定部分,如叶、花和果实。组织特异性启动子包括:种子特异性启动子如菜豆的β-菜豆蛋白基因(Bustos等人,EMBO J.10:1469-1479(1991))和大豆球蛋白基因(Lelievre等人.,Plant Physiol.98:387-391(1992))、叶特异性启动子如豌豆RbcS基因(Lam and Chua,Science 248:471-474(1990))和小麦Cab 1基因(Gotom等人.,Plant J.3:509-518(1993))以及根特异性启动子如烟草TobRB7基因(Yamamoto等人,Plant Cell 3:317-382(1991))和毛根农杆菌rolD基因(Elmayan和Tepfer,Transgenic Res.4:388-396(1995))。具有可被外源刺激激活的启动子的载体也可使用。任何植物细胞均可作为该载体的受体细胞,包括小麦、大麦、玉米、蕃茄、大豆、油菜籽、白杨、苹果和水稻。植物可以是任何针叶树、阔叶树、双子叶植物、或单子叶植物。此处的术语“植物细胞”包括各种形式的植物细胞如悬浮培养的细胞、原生质体、叶切片和愈伤组织。载体可通过本领域技术人员公知的方法导入植物细胞内,如聚乙二醇法、电穿孔法、农杆菌介导法和基因枪法。植物体可根据不同的植物细胞类型通过本领域技术人员公知的方法从转化的植物细胞再生获得(Toki等人.,PlantPhysiol.100:1503-1507(1995))。
与野生型植物相比,上述方法产生的或从繁殖培养基(如种子、块茎、穗等)中获得的的植物体内的靶标基因表达受到阻抑。植物体因此矮化。本发明中植物的矮化既包括整株植物体的矮化,也包括植物体的部分的矮缩。
因此,将我们分离的水稻dl基因或来源于其它植物的同源基因导入野生型植物体内,并表达该基因可使植物的生长增强。待导入植物细胞中基因的具体例子包括:
(1)编码由SEQ ID NO:1中氨基酸序列组成的蛋白质的DNA;
(2)编码含有修饰的SEQ ID NO:1中氨基酸序列的蛋白质的DNA,其中一个或多个氨基酸被取代、缺失或增加,且其功能与由SEQ ID NO:1中氨基酸序列组成的蛋白质相当;
(3)含有SEQ ID NO:2中核苷酸序列的编码区域的DNA;和
(4)与含有SEQ ID NO:2中核苷酸序列的DNA互补杂交的DNA,该DNA编码与由SEQ ID NO:1中氨基酸序列组成的蛋白质功能相当的蛋白质;
用于在植物细胞中表达基因的载体、载体导入的植物细胞以及再生植物体的方法均与上述矮化植物中的使用的相同。
本发明提供了一种通过阻抑与矮化有关的水稻dl基因或在其它植物中的相应物的表达而矮化植物的方法。例如,本方法可以创造出装饰性植物和新的具有商业价值的农业产品,因此本方法在农业和园艺学领域是特别有意义的。
下面的上实施例详细地描述了本发明,但不限定本发明的范围。实施例1
矮化基因dl的粗标度连锁分析
印度型品系IR24与带有dl基因的日本型遗传标记品系FL2杂交,获得100株植物F2种群,栽培,从每一F2植株中提取DNA。因为已知dl位于第5染色体,对dl基因与位于第5染色体上的RFLP标记之间进行了连锁分析,获得了连锁图谱。为更准确地测定位点,通过集群取样法(pooled samplingmethod)进行了连锁分析(Churchill等人,Proc.Natl.Acad.Sci.USA 90:16-20(1993))。即,通过以IR24为回归亲本与遗传标记品系FL2回交,获得约2600株BC3F2植物种群,在幼苗期进行筛选,获得644株矮化个体(隐性纯合子)。使用接近d1基因的标记对该种群进行RFLP分析,获得了更准确的连锁图谱。结果表明,dl基因与RFLP标记C309和S2351连结,频率约为0.8%(图1)。但是,大部分猜测位于dl基因附近的DNA标记在所用的分离种群的亲本间没有显示出多态性。因此,用于分析的种群已变化。实施例2
矮化基因dl的精密标度连锁图谱的绘制
为更确定地获得DNA标记的多态性,我们选择SL18作为分离种群的亲本品系。该品系除第5染色体被Kasalath的第5染色体取代外,具有Nipponbare的遗传背景(12种染色体)。将通过杂交SL18和FL2获得的约13000个F2代种子播下,筛选获得3185株矮化植物(隐性纯合子),并在幼苗期植入田间。每5个植株为一个集群,采集叶片样品,从637个集群中提取DNA,并进行RFLP分析。结果表明,37个集群含有dl与位于第5染色体上接近于dl基因座的RFLP标记V147之间重组的个体,71个集群含有dl与G5004之间重组的个体。根据这些结果,可推测dl位点位于V147和G5004之间的区域1(1.8cM)(图2)。为从含有重组体的集群中识别重组个体,从540个个体中提取DNA(5个体×108集群),通过RFLP分析筛选dl与V147之间或dl与G5004之间发生重组的个体。实施例3
筛选含有矮化基因dl的YAC克隆并制备这些克隆的排列图谱
为识别含有dl基因座的基因组克隆,使用V147和G5004筛选YAC库(Umehara等人,Molecular Breeding 1:79-89(1995))。结果,筛选出3个含有核苷酸序列V147的YAC克隆和2个含有序列G5004的YAC克隆。DNA片段通过盒式PCR方法制备。使用与每一YAC克隆两端均相应的DNA片段,我们可证实YAC克隆之间的重叠序列,可进行染色体步移,以及可将克隆定位于连锁图谱上。现已发现,Y5483、Y5483R的一个末端克隆与dl基因座紧密连锁,距离为0.03cM,且定位于dl基因座与G5004之间。这些结果表明,该YAC克隆含有dl基因座。此外,当使用上述YAC克隆的末端DNA片段对YAC克隆再次筛选时,获得3个新的YAC克隆(Y1988、Y3745和Y4488)。通过杂交或PCR方法检测这些YAC克隆之间的重叠序列,发现4个不同的YAC克隆含有dl基因。实施例4
矮化基因dl的备选基因的鉴定
在“水稻基因组研究项目”中正进行EST作图(相对于YAC克隆的cDNA克隆的直接定位)。该项目包括检测与上述YAC克隆相当的cDNA克隆的是否存在。根据目前积累的资料,发现ST5933位于YAC克隆Y5483上。使用该克隆作为探针,通过基因组Southem杂交方法对精密标度连锁分析指定的接近dl的重组个体进行RFLP分析。结果表明,来源于ST5933的9.6kb的带(Nipponbare)与dl基因同时分离(图2)。
使用分子标记ST5933作为探针,对dl突变株系进行基因组Southern杂交(图3)。结果,在两种正常水稻品系,Nipponbare(日本)和Kasalath(印度)中发现了大约9.6kb的带,但是在9个dl突变株系中有7个发现与正常水稻品系的带大小不同的带(FL2、HO532、HO533、HO537、HO538、HO541和HO552)。一般而言,在Nipponbare与Kasalath之间相当频繁地发现RFLP,但是日本品系之间的多态性极少被检测到。然而,这些结果显示,具有日本品系遗传背景的dl突变株系之间存在多态性。这表明,dl突变株系之间备选基因ST5933的基因组DNA区域存在很大的结构差异。这提示ST5933是一个极有希望的dl基因备选物。同源性研究的结果表明,ST5933编码三聚体G蛋白的α亚单位,它的cDNA和基因组DNA区域已经被分离,并且它的结构(核苷酸序列)也已被分析(Seo等人.,Plant.Mol.Biol.27:1119-1131(1995);Ishikawa等人.,Plant.Cell.Physiol.36(2):353-359(1995))。实施列5
ST5933表达模式的分析
通过基因组Southem杂交,在备选基因ST5933中存在结构差异的4个不同的dl突变株系中提取RNA。两个正常品系(Nipponbare和Kasalath)也提取RNA。然后两类RNA与ST5933探针进行Northem杂交(图4)。结果发现,两个正常品系中检测到了1.8kb的带,而4个dl突变株系中却没有发现。该结果支持了这样的假说:备选基因ST5933是矮化表型dl的因果基因。
序列表(1)概述
(i)申请人:NAKAGAWARA Masahiro,国立农业生物资源研究所(NIAR)总裁,农业,森林和渔业技术革新MAFF联合会
(ii)发明名称:植物矮化的方法
(iii)序列数目:3
(v)计算机可读格式:
(A)媒体类型:3.5英寸,1.44Mb内存的磁盘
(B)计算机:IBM PC兼容机
(C)操作系统:MS-DOS 3.30版本或3.30以上版本
(D)软件:PatentIn 2.0版本(2)SEQ ID NO:1资料
(i)序列特征:
(A)长度:380氨基酸
(B)类型:氨基酸
(C)链性:单链
(D)拓扑结构:线性
(ii)分子类型:蛋白质
(xi)序列描述:SEQ ID NO:1
Met Gly Ser Ser Cys Ser Arg Ser
1 5His Ser Leu Ser Glu Ala Glu Thr Thr Lys Asn Ala Lys Ser Ala Asp
10 15 20Ile Asp Arg Arg Ile Leu Gln Glu Thr Lys Ala Glu Gln His Ile His25 30 35 40Lys Leu Leu Leu Leu Gly Ala Gly Glu Ser Gly Lys Ser Thr Ile Phe
45 50 55Lys Gln Ile Lys Leu Leu Phe Gln Thr Gly Phe Asp Glu Ala Glu Leu
60 65 70Arg Ser Tyr Thr Ser Val Ile His Ala Asn Val Tyr Gln Thr Ile Lys
75 80 85Ile Leu Tyr Glu Gly Ala Lys Glu Leu Ser Gln Val Glu Ser Asp Ser
90 95 100Ser Lys Tyr Val Ile Ser Pro Asp Asn Gln Glu Ile Gly Glu Lys Leu105 110 115 120Ser Asp Ile Asp Gly Arg Leu Asp Tyr Pro Leu Leu Asn Lys Glu Leu
125 130 135Val Leu Asp Val Lys Arg Leu Trp Gln Asp Pro Ala Ile Gln Glu Thr
140 145 150Tyr Leu Arg Gly Ser Ile Leu Gln Leu Pro Asp Cys Ala Gln Tyr Phe
155 160 165Met Glu Asn Leu Asp Arg Leu Ala Glu Ala Gly Tyr Val Pro Thr Lys
170 175 180Glu Asp Val Leu Tyr Ala Arg Val Arg Thr Asn Gly Val Val Gln Ile185 190 195 200Gln Phe Ser Pro Val Gly Glu Asn Lys Arg Gly Gly Glu Val Tyr Arg
205 210 215Leu Tyr Asp Val Gly Gly Gln Arg Asn Glu Arg Arg Lys Trp Ile His
220 225 230Leu Phe Glu Gly Val Asn Ala Val Ile Phe Cys Ala Ala Ile Ser Glu
235 240 245Tyr Asp Gln Met Leu Phe Glu Asp Glu Thr Lys Asn Arg Met Met Glu
250 255 260Thr Lys Glu Leu Phe Asp Trp Val Leu Lys Gln Arg Cys Phe Glu Lys265 270 275 280Thr Ser Phe Ile Leu Phe Leu Asn Lys Phe Asp Ile Phe Glu Lys Lys
285 290 295Ile Gln Lys Val Pro Leu Ser Val Cys Glu Trp Phe Lys Asp Tyr Gln
300 305 310Pro Ile Ala Pro Gly Lys Gln Glu Val Glu His Ala Tyr Glu Phe Val
315 320 325Lys Lys Lys Phe Glu Glu Leu Tyr Phe Gln Ser Ser Lys Pro Asp Arg
330 335 340Val Asp Arg Val Phe Lys Ile Tyr Arg Thr Thr Ala Leu Asp Gln Lys345 350 355 360Leu Val Lys Lys Thr Phe Lys Leu Ile Asp Glu Ser Met Arg Arg Ser
365 370 375Arg Glu Gly Thr
380(2)SEQ ID NO:2资料
(i)序列特征:
(A)长度:1461碱基对
(B)类型:核酸
(C)链性:双链
(D)拓扑结构:线性(ii)分子类型:cDNA-mRNA(xi)特点:
(A)名称/关键词:CDS
(B)位置:91..1230
(C)鉴定方法:S
(xi)序列描述:SEQ ID NO:2GACGTCAACG TGCTTCCTGG AAAGAGAGAG GCTCAGGCAT GAGAGCATAC CTCTAAAATA 60ATGTCCGTGC TTACCTGTGT GCTTGATAAC ATG GGC TCA TCC TGT AGC AGA TCT 114
Met Gly Ser Ser Cys Ser Arg Ser
1 5CAT TCT TTA AGT GAG GCT GAA ACA ACC AAA AAT GCA AAA TCT GCA GAC 162His Ser Leu Ser Glu Ala Glu Thr Thr Lys Ash Ala Lys Ser Ala Asp
10 15 20ATT GAC AGG CGA ATT TTG CAA GAG ACA AAA GCA GAG CAA CAC ATC CAC 210Ile Asp Arg Arg Ile Leu Gln Glu Thr Lys Ala Glu Gln His Ile His25 30 35 40AAG CTC TTA CTT CTT GGT GCG GGA GAA TCA GGG AAG TCT ACG ATA TTT 258Lys Leu Leu Leu Leu Gly Ala Gly Glu Ser Gly Lys Ser Thr Ile Phe
45 50 55AAA CAG ATT AAG CTC CTT TTC CAA ACT GGC TTT GAT GAG GCA GAA CTT 306Lys Gln Ile Lys Leu Leu Phe Gln Thr Gly Phe Asp Glu Ala Glu Leu
60 65 70AGG AGC TAC ACA TCA GTT ATC CAT GCA AAC GTC TAT CAG ACA ATT AAA 354Arg Ser Tyr Thr Ser Val Ile His Ala Asn Val Tyr Gln Thr Ile Lys
75 80 85ATA CTA TAT GAA GGA GCA AAA GAA CTC TCA CAA GTG GAA TCA GAT TCC 402Ile Leu Tyr Glu Gly Ala Lys Glu Leu Ser Gln Val Glu Ser Asp Ser
90 95 100TCA AAG TAT GTT ATA TCC CCA GAT AAC CAG GAA ATT GGA GAA AAA CTA 450Ser Lys Tyr Val Ile Ser Pro Asp Asn Gln Glu Ile Gly Glu Lys Leu105 110 115 120TCA GAT ATT GAT GGC AGG TTG GAT TAT CCA CTG CTG AAC AAA GAA CTT 498Ser Asp Ile Asp Gly Arg Leu Asp Tyr Pro Leu Leu Asn Lys Glu Leu
125 130 135GTA CTC GAT GTA AAA AGG TTA TGG CAA GAC CCA GCC ATT CAG GAA ACT 546Val Leu Asp Val Lys Arg Leu Trp Gln Asp Pro Ala Ile Gln Glu Thr
140 145 150TAC TTA CGT GGA AGT ATT CTG CAA CTT CCT GAT TGT GCA CAA TAC TTC 594Tyr Leu Arg Gly Ser Ile Leu Gln Leu Pro Asp Cys Ala Gln Tyr Phe
155 160 165ATG GAA AAT TTG GAT CGA TTA GCT GAA GCA GGT TAT GTG CCA ACA AAG 642Met Glu Asn Leu Asp Arg Leu Ala Glu Ala Gly Tyr Val Pro Thr Lys
170 175 180GAG GAT GTG CTT TAT GCA AGA GTA CGG ACA AAT GGT GTT GTA CAA ATA 690Glu Asp Val Leu Tyr Ala Arg Val Arg Thr Asn Gly Val Val Gln Ile185 190 195 200CAA TTT AGT CCT GTT GGA GAA AAC AAA AGA GGT GGA GAG GTA TAT AGG 738Gln Phe Ser Pro Val Gly Glu Asn Lys Arg Gly Gly Glu Val Tyr Arg
205 210 215TTG TAT GAT GTA GGA GGC CAG AGG AAT GAG AGG AGA AAG TGG ATT CAT 786Leu Tyr Asp Val Gly Gly Gln Arg Asn Glu Arg Arg Lys Trp Ile His
220 225 230CTT TTT GAA GGT GTT AAT GCG GTA ATC TTT TGT GCT GCC ATT AGC GAA 834Leu Phe Glu Gly Val Asn Ala Val Ile Phe Cys Ala Ala Ile Ser Glu
235 240 245TAT GAT CAG ATG CTA TTT GAA GAT GAG ACA AAA AAC AGA ATG ATG GAG 882Tyr Asp Gln Met Leu Phe Glu Asp Glu Thr Lys Asn Arg Met Met Glu
250 255 260ACC AAG GAA CTC TTT GAC TGG GTT TTA AAG CAA AGA TGT TTT GAG AAA 930Thr Lys Glu Leu Phe Asp Trp Val Leu Lys Gln Arg Cys Phe Glu Lys265 270 275 280ACA TCA TTC ATT CTG TTT CTC AAC AAA TTT GAT ATA TTC GAG AAG AAA 978Thr Ser Phe Ile Leu Phe Leu Asn Lys Phe Asp Ile Phe Glu Lys Lys
285 290 295ATA CAA AAG GTT CCT TTA AGT GTG TGC GAG TGG TTT AAA GAC TAC CAG 1026Ile Gln Lys Val Pro Leu Ser Val Cys Glu Trp Phe Lys Asp Tyr Gln
300 305 310CCT ATT GCA CCT GGG AAA CAG GAG GTT GAA CAT GCA TAT GAG TTT GTC 1074Pro Ile Ala Pro Gly Lys Gln Glu Val Glu His Ala Tyr Glu Phe Val
315 320 325AAG AAG AAG TTT GAA GAG CTC TAC TTC CAG AGC AGC AAG CCT GAC CGT 1122Lys Lys Lys Phe Glu Glu Leu Tyr Phe Gln Ser Ser Lys Pro Asp Arg
330 335 340GTG GAC CGC GTC TTC AAA ATC TAC AGA ACT ACG GCC CTA GAC CAG AAA 1170Val Asp Arg Val Phe Lys Ile Tyr Arg Thr Thr Ala Leu Asp Gln Lys345 350 355 360CTT GTA AAG AAG ACA TTC AAG TTG ATT GAT GAG AGC ATG AGA CGC TCC 1218Leu Val Lys Lys Thr Phe Lys Leu Ile Asp Glu Ser Met Arg Arg Ser
365 370 375AGG GAA GGA ACT TGATTCAGAG CTAAGACTAG GTTGTAAGTC ACACAGGGAA 1270Arg Glu Gly Thr
380GGTAATTAGG ACGGCGAGAG GAACAAAGTT TCACACTGTC ACAGCTTTAT CTGTTGTAAT 1330TCTTTTACAC GTGGACCATT GATTGATCTT TTGGTTCTTA CTGTGGGCTG TTCAGGTCTG 1390TACCCTATTT TTGTTCTCT AGTTAGCCAT TGTGCAAATT TTCCTTGAAT CAGATTCTCT 1450ACCTGTTGTC T 1461(2)SEQ ID NO:3资料
(i)序列特征:
(A)长度:8107氨基对
(B)类型:核酸
(C)链性:双链
(D)拓扑结构:线性
(ii)分子类型:基因组DNA
(xi)序列描述:SEQ ID NO:3GAATTCTCAT GTCTGTAACT TCATTTTTAA GCCATAGAAA TCTAGTTCCA TCCAAAACAC 60CAAAACGGAT GGTGTTTTAC AGTAGCTTGT CATATGCTTT TAGGCGAGCT TACTAGTCTA 20TTTTTCATAA TACTTTTTCA CAATTTTGAA AGGCCTAGGG AGTAATATTT AATGGTGCAA 180AAGGGACGAG TTTTGAAACA TTTGTTTGTC GCAGAAGCAC CAGACCATTC TGATTGTTAT 240TGTAAGCTGT AACATCAAAG TTTTGGCAGC AGGTTTTCAT GTGCTCTTAA GCGTTGGGGG 300TTTGTTCCGT TTGGTTTTCA ACTGTATGCT AGCTTTCTCT ATTAGCCAAT GTAATGGCAG 360TTGCAAAATC TGTTGTAGTG CAGGCGTGCA GCTAAATGCA GTATAGCTGA CTGTTAACTT 420TAAGCTGATT GTCCCATGCA TGTCCCAGTA AAAGGACAGT CAGGAATGAG TCTCATGGGT 480CAATATATGG TGCAGACATG TCAGTAGGAT ATAGGAGTAT TACATTATAG TTTTTTCAGC 540TTCAATAACG TTCATGTTAG CTTGTACATT GTATGGCAAC CCTTCCATAC TTGCGTTAGC 600ACAAAAGTTC ACCATGTTAG CTTGGCTTTA GATCAGTTTA AACTGTCCTT TAATAGCAAA 660TTAATAATCC ATAAAATGAA ATTTTACTTC CACTGTTTAC CAGTGCTACT ACTGTTCTAC 720CTCCAGCGTT CAACAGCTGA GAAACGTGAG GAGTCCAGCA CCAGCAGTAT CATTTACTGC 780AATGCGAGAG AGATGTTCTC CGTTTCCTCC TTCACTGAGG CTTAGGAGTA GGAGGAGTAG 840TAGTGATTTT TTCGTGTCGA CTTGTTTAAC ATTATCATTA ACACCATCAA GTGTCAATGC 900CAGTAGGCTG CTGCTTCTAA TCATTTCTTC CTTCCCTCTT CTAACGCCAT TATCGTTTTA 960TCTCACCTTG CATTTATGTT CAAGTGACCA TGGTTCTTGA CAGAAGCAGC CCTTGTTCTT 1020TCCTGTCCCT TTGTTTGTTC AGTACGCTAT TATTCTCTTG GGTACTAGAC CTTGTATAAA 1080CCGGTTGTGA AATCCTCAAT CAAATAAAAG TTAACTCGAA ATTTGTGGCC TGTTCCAAGT 1140GTTTGGCAAA CCAATATGTA TATTATCCAC CCGATTATCT AATGGCAATA CAGTGCCTAA 1200AATTCCTGCT TCCGGAGTCT TAAACTTTAC CCGAATCCAA TCTGGAAACC GAAAAGACAG 1260CTGCTTAGCT GATGGCAAGT CACTGGGTAC ATTGATTTGT GTTAATTTTC AGTCCAATAA 1320AACAGCGCAA AAATTGTAAG GGTGATCCCT CTTTAGTAAA GCCATGCATT CTGCAAACTC 1380TGTTGCAATG CAAGCTGTAT CCTATATCCA GTGCCGATGA ACCAATTCTG TTTGCAGACT 1440GTACCCTATC TCTACTCTAC AAGCCAACCA AAGGAAAGTG TTTGATCTGC AGTGGAATAC 1500TAGCAGGTAT TCCACCATTT CAGGGTTGGG AGTGTGATTG ATATGCAGGA GATTGACATT 1560GTGCAGAACA TTGGCCGTCA GCTGCCGCTG CCGTCGCCGG TGGTGTCGGT GAGAAAGCCC 1620GGTGGTGGTG GTTGTGCCGG CGGCGAGGAG TGGCTGCAAC AGGATGGGCT GTTGTGCATG 1680GGCGGATCAG CGGGTGGCTT ATGGCGGTGG CCACGCTGTT AGCCGGCGAC GGACCCGGCG 1740GCGGCGTCCT TCACGAGGGA CGGCGCATGA TGATCCTGGA TAATTTCGAG ACTTCGGGCC 1800GGCGTTCGTG CAAAGCCCAT ACATATTCTA CGCGCAACTG TCACGCACAA AAACGAAGTT 1860TTTAGTACCA CATGGAAAAT CTATGACGAC TAACACCGGC ATAAAAGACG ACGCGCTCGC 1920ATAGCGGGAG TTGGCAGTTT TCGGCTGCTG GAGAAAACGA GGTTTCTCCC TCGATCGAAT 1980GGATGCAAAC ATCCTCCCGA CTTTGGCCCA CTAGGGAGGG AAGGTGTGAG TCACCCTGGG 2040CTCCAGACGG CTGCGTCATG GAGCGAAGAG GACCAACCGA CACCCTTCTC CCCACCCATT 2100GGCGAATGCC CTAGAGGTTT GGGCAACCGA CACCCTTCTC CCCACCTATT GACGAATGCC 2160CTTGGGTTGA GATAGGAGTA GAGGGGAGTG AGGTCTTCTC CCCACCCATT GGCGAATGCC 2220TTTGGGTTGA GATAGGAGTA GAGGGGAGTG AGGTCTTCTC CCCACCCATT GGCGAATGCC 2280CTAGAGGTTT GGGCAACCGA CACCCTTCTC CCCACCCATT GGCGAATGCC CTAGAGGTTT 2340GGGTTGAGAT AGGAGTAGAG GGGAGTGAGG TGGAAGAAGA TTGCTAGTTG GCTTGTGGGG 2400TTCCACGTGG GCCCTGCACT GACTCAGCCA CCACGTTAAC AAAACCGGAA AGCAATACTA 2460CCTTGGGATT AAAAGTGGTC CGTTTGCAAG ATTAGGGGTT CAGGGCCGTG TAAAACTCAA 2520CGACAAGATA AGGGACCTTA GATGAACTTT TTTGGGAGAT GAGGCGCCTG TGCATATGAC 2580CCATAGGCAG GCGACACCGC GGCAGAGCGG CGCTGCACGA CCTCCGCCTC CCCAATCCGT 2640CCCGTCTCCT CGCCCGCCGC CCTCGACTCC CGTCTCCTCG CCTGCCGCTG GCGCCGATCT 2700CCATCCTGCT AGCAGAGGTG GCGCCGGCGT CCTCCTGCTC CCGCCGCATT CGCATCCTAA 2760TCCATCCCAT CCGGCCTCGG CCTCGAATTT CGTCTCCTCG CCCGCCGCTT GCGCCGATCC 2820CATCCTGCGA GCAGAGGTGG CGCCCGGCGT CCTCCTTCCA CCGTATCGTA GCTCGCCGGT 2880GAGCATCCCT CCCTACCCAC ACCTCATCAG GTATTCTGCG TTATCCCTCA AAAAGTTTGG 2940GGGTTCAACC GAAACAGGGT TAGATCTGCC TCTGCCCAGC TCCACCTACT TTCAAGTTGT 3000TAATTTTGAT TTCCGTTTTT AGCAGATGTA ATTTGGTTAT TGAATCTCAT CCAAACACCC 3060TCAGAACGAA AAATGTAAGC TTACATAATT TGTACTCATC CAAACTTACA TAAATTTCTT 3120AAGGAGAATC TAGACCACAA ACTACCCATA GTCACACAAA ATATCTTTTT ATCAAGGTAT 3180TCTTATAAGT AATTTTAATT CCACAAAATT TTCTAAAGGA CATACTGTGA CACTTGGCAT 3240GAATCTAATT TAACATTCTT TCTTTATCAG GTTATAAATT GAAACCATTG AACGTATTTT 3300GTCTTCCCGT CCCTACAACA TTGTGATATA TCTGTAATAT TTTAATATTT TTAATTTTAA 3360AAATATTTAG ACTAATAATA TAGATATTTA ATTAGGTAAT TAATAAATTC AAATCAAATG 3420TAGTTTGAAA TAAATAAACA AAATGATATA TGCCAAGTAC AATCTAATAT CGGGCATGAT 3480TTTAGATGTA GTAGGTATTA TTCTGGAATA CTCCTCGTTG AAACATATGG AACGCATTTC 3540CCTGAAAAAG GAAAATTTTT TGCCCCGACC CCTCGACACC AACCCCGTCG GATGTGAAGC 3600CGACGCGCCA GATGGAGGCC AGCGGTGCCA ATGCGTAGGC CAATCGTGCC TCTGGGGAAA 3660TCTTATCTCC CGGGGCCGGA CGGCTCCGCT CCACTTCCCT CCCCGAGTCA CTCAAACCAT 3720CCAATCCCCC ACACTCCCTT CCCTTGCCCC CATTCCCCAC CGCCGCAAGG AAAAATATTG 3780TTAATAAACA ATGATGTTGA TGTATTATTA ATAAACAATG ATATTGATGT ATTTCTAAAT 3840ATTTTCACGT ATTATTTATT AAGTGTCAGT GATTGAAATG GATCCTGGTC GGAAATGAAT 3900CCTGGTCGGA AAATGGTTAC TAATGTTTTT CCTTCATATA ATATTTCTGG ATATGTATAA 3960CAATGTGGGT CAGCAATATT GAACTATGCA AACCATTACT CTGTACAATC TTTTCTTTTC 4020AAATGCTGGC CACATTTCGC TCGAGCTTAC TGCTCATGTA TGCAGCTCAT GGATCCTGAG 4080ATCTAGACGT CAACGTGCTT CCTGGAAAGA GAGAGGCTCA GGCATGAGAG CATACCTCTA 4140AAATAATGTC CGTGCTTACC TGAGTGCTTG ATAACATGGG CTCATCCTGT AGCAGATCTC 4200ATTCTTTAAG TGAGGCTGAA ACAACAAAAA ATGCAAAAGT AAGTTAGCAC TCGGACTTAC 4260TGAACAAGTA AATGCTAACT CAATTCTTGA TTTGAGAGTT GCCACATTTG GTTTCTTCTA 4320ATTCAGCTGG TAACAGTCTG CAGACATTGA CAGGCGAATT TTGCAAGAGA CAAAAGCAGA 4380GCAACACATC CACAAGCTCT TACTTCTTGG TATTGCTAAC TTTCCCAAAT TTAAGTGGTC 4440ATTTTCCTTG TCACAATTAT CTGCGCTACC TTTAGTATCT ATTGGTGGAG AAAATTAATT 4500GTTTCTGTTG TTCCTATTTA CCTCTATAAA AAAACCTTTC TCATGTTATT TCCAAAAAAA 4560AAGAAGATAA ATAAATGTAT CCTAGAAAAT TTTAGTTTGA ACTTGTTCTC AATGTGGATC 4620CATCCTTCTT TCTCTCTCTC AATTGCTTCT GTTTTAAGGT GCGGCAGAAT CAGGGAAGTC 4680TACGATATTT AAACAGGTGA TGAATGTTAT ATTCCATGGA GAATCATAAC CCGTACGCCG 4740CTAGTTAGTC TGATGTATTC TTACTGTTCA CCTGCAGATT AAGCTCCTTT TCCAAACTGG 4800CTTTGATGAG GCAGAACTTA GGAGCTACAC ATCAGTTATC CATGCAAACG TCTATCAGAC 4860AATTAAAGTA TGCAATACTG GAAAGGGTGT GTCTTTTTTT TCTTATTGCA AAGTGGGGAT 4920TATGTAGGAG AGTCGACTAG GGATTTGTAT TCTGTTCATA AGGAAATGCG TTCATACTTT 4980TCCTTTTTGT CGAGTAATGT GTTAAATGTT AACAGATACT ATATGAAGGA GCAAAAGAAC 5040TCTCACAAGT GGAATCAGAT TCCTCAAAGT ATGTTATATC CCCAGATAAC CAGGTTTGTC 5100CTTACTCTTT ACTCAACAGT TAAAGCTAAA TCTGTGCATA TGAACATGTC TTGTTAAATC 5160TGGGAATACA AACATTTTGA TTTGCAACAT TTCTGTTGTA GTCAAGCTGC TCGGCTCTAT 5220GTTTTAACCT GTTAAGACCT TGTAGACTGT GCTCGGCTCT ATTGTAGTCT TATATTTTAC 5280ACGGTCATTC TATAATGAAA ACTTGAAAAA GATATCTATT GAACCGTTCA ATGTACTGAA 5340CAAAGTAGAA AAGAACAATG AGATTTTGTA ACATTTATTC TTCCTTGTTT ATTTGATTGC 5400TTCAGACAAT TGTTGATATG CTAAAAATAA CTTGGTATCA AATGTGGGTG TTATAAGATT 5460CAATTTTTTC CTCAACCAGG TTAAAAAAAG TATACCTTTG TGCATTTCCC TGGTTCCGTT 5520GCTTTGGAAC TTTAAAGGAA AACTGACTTT CCTTAGGCAT TGAAAGACAA ATATCACCAG 5580TTTCACACTG TACACCTTAC CAACCAATTT GGTTTCTTAG ATGTCATTTA CTTTGTCATA 5640TCATCAGGAA ATTGGAGAAA AACTATCAGA TATTGATGGC AGGTTGGATT ATCCACTGCT 5700GAACAAAGAA CTTGTACTCG ATGTAAAAAG GTTATGGCAA GACCCAGTCA TTCAGGTGAA 5760AACAAATAGC CATTCAAATC TTTTGAAGTT ATATAGTTTT CCTGGCCAGG TGTGCTGAAG 5820CAATGCTCTA TACTGTAGGA AACTTACTTA CGTGGAAGTA TTCTGCAACT TCCTGATTGT 5880GCACAATACT TCATGGAAAA TTTGGTTCGA TTAGCCGAAG CAGGTTATGT GCCAACAAAG 5940GTGTGCTGTC CATGTTCATA GACAATTATT TACATATTCT CAGATATTTG TCCTGACACC 6000ATTTCATGTT GATTTTAAGT CTACTTAGTC AGAGGTTGTC AAATGGTTAA CTATGTGTAC 6060TGAGTCAGAG GTTGCCAAAT AGTTTTAAAA GATGGGCATA TGTTTATCCT TATCTTTTAA 6120ATAATATTGG AGGCTATCCT TTAAAATTCA ATATTAGGGA GGAGAAACTA TTATTCTACC 6180GTTATTACGC AGTCTACATA ACGAAGGTAA AAAATGTCCC TGTGAAACAT AGGGTGCAAA 6240ACTACTGTGA ATAAAACTCT ACTTATCTAA GCACCTTGAG CTTTTGAGTT CCCACATATT 6300AATCTTATGA CACTAGCATA TATTTTTTTT GTTCAGTTCC TTCAATAAGT TGCAAACCAC 6360AAATATGATC ACTGTACCAT CCACTTTTGC AACCATTTCC CGTCATTTCT TAAGCATAGA 6420AAATTGTTTG TCACTTGTTT AAGTCCACAC TGCATGAAAA TTCCAATTAA CTTTGTGTGC 6480TAAGTGAAGA TATGACTCCA TATTTCTGCA TTTAGCAGTC TGGATGGGAT AATTTGTGAT 6540TGTACCTTGT CTAATGGTTC GTTTGAAAGG CTGGTAGTTG ATCTTCCATA CTTAAGAATG 6600CTTGCAGTAT TATAGTTGTC AATATTATGA GTCATTTTCC AGGAGGATGT GCTTTATGCA 6660AGAGTACGGA CAAATGGTGT TGTACAAATA CAATTTAGGT AATCTGCTGA CACTATTTTT 6720TGCACATTTT TTTGCTGGTT GCTCTACTAT GTACAGAACG ACAAGTTGAA GTCCTTTTTT 6780CCTCCCTTTT CACTTCTAAG ATATGACCTG AGAGGTTCTG AATGTAGCTG TTATAAGATG 6840AGTTGAATCA TCTAGTTAAC TGGGTTTCTT TCTGCAGTCC TGTTGGAGAA AACAAAAGAG 6900GTGGAGAGGT ATATAGGTTG TATGATGTAG GAGGCCAGAG GAATGAGAGG AGAAAGTGGA 6960TTCATCTTTT TGAAGGTGTT AATGCGGTAA TCTTTTGTGC TGCCATTAGC GAGTAAGTAC 7020AATTTTTTTG ATTGTTGAAC TTATCCTAAT CTGCTAAGTT CTTCTCATAG GCTTCTTGTT 7080CATTTCAGAT ATGATCAGAT GCTATTTGAA GATGAGACAA AAAACAGAAT GATGGAGACC 7140AAGGAACTCT TTGACTGGGT TTTAAAGCAA AGATGTTTTG AGGTCTGCAT GCATCCATTT 7200CTGCAACCTT TGTGCTCATG CTTTTTTTTC TCATTTTGAA ACTAATTACG GTGCTATATT 7260GACCATCAGA AAACATCATT CATTCTGTTT CTCAACAAAT TTGATATATG CGAGAAGAAA 7320ATACAAAAGG TAAGGCCTGC TCTTTGTACC AATGCATAGT TTAGTACTAA ATGTTACCAA 7380CATTTATGTT TTCGCTGGTT ACGTAGGTTC CTTTAAGTGT GTGCGAGTGG TTTAAAGACT 7440ACCAGCCTAT TGCACCTGGG AAACAGGAGG TTGAACATGC ATATGAGTGA GTCCACTACT 7500CGCCCTCTCA GATGAACATG GGCATTTGGC CATTTGTAAT GTTGCTGCAT GGTGCACTTA 7560TATGCCTTGA TAAGTTTTTC CATTCTAATG TTATATAGTA TCAAACGTTC ATCATTACTG 7620TGGCTTATGG TCTGGAGTGA CGTTTTACAG GTTTGTCAAG AAGAAGTTTG AAGAGCTCTA 7680CTTCCAGAGC AGCAACGGTG ACCGTGTGGA CCGCGTCTTC AAAATCTACA GAACTACGGC 7740CCTAGACCAG AAACTTGTAA AGAAGACATT CAAGTTGATT GATGAGAGCA TGAGACGCTC 7800CAGGGAAGGA ACTTGATTCA GAGCTAAGAC TAGGTTGTAA GTCACACAGG GAAGGTAATT 7860AGGACGGCGA GAGGAACAAA GTTTCACACT GTCACAGCTT TATCTGTTGT AATTCTTTTA 7920CACGTGGACC ATTGATTGAC CTTTTGGTTC TTACTGTGGG CTGTTCAGGT CTGTACCCTA 7980TTTTTTGTTC TCTAGTTAGC CATTGTGCAA ATTTTCCTTG AATCAGATTC TCTACCTGTT 8040GTCTATGTGT GTTATCTTGG TCTGTTAATT TGCATAGCCC ACTTGTTACA AAAGGAGAGC 8100CGAATTC 8107