参与由细胞质雄性不育恢复至可育的蛋白质 及编码该蛋白质的基因
技术领域
本发明涉及参与由细胞质雄性不育恢复至可育的基因。更具体地说,本发明涉及参与为开发第一代杂交品种(以下略称为F1)所用的细胞质雄性不育特性(以下有时略称为cms)恢复的基因、含有该基因的载体以及性状转化体。
背景技术
谷类、蔬菜等农作物具有以下特征:(1)因杂种优势而形成优异的农业遗传特性;(2)收获物的均一性;(3)为了在下一代分离遗传特性,保护育种者的利益等,因而F1品种的开发很活跃,而且在很多主要作物中已实际应用。
作为生产F1品种的种子的方法之一,有由细胞质雄性不育(cms)系统及恢复该雄性不育(以下有时略称为Rf)的系统组成的cms/Rf采种系统,例如已在稻子、高粱、玉米等谷类以及葵花籽等油类作物中进行开发,但是这些都是采用交配和细胞融合技术开发得到的。
另一方面,对于油菜科,利用自身不相容性的F1采种系统已被广泛应用,但对油菜籽,因其不具有稳定的自身不相容性,需要利用cms系统和Rf系统的F1采种系统。
与此相对,近年来正在进行在油菜籽中利用来源于Kosena萝卜的细胞质雄性不育(Kosena cms)系统和来源于Ogura萝卜的细胞质雄性不育(Ogura cms)系统的研究。两种cms基因都在细胞质小器官线粒体的基因组中编码,而且其碱基序列也已知,但对萝卜的分子生物学研究没有进展,对于分离基因所必要的标记也处于几乎不知道的现状,所以很难从核分离基因,只能由萝卜的可育性恢复系统,使用交配或细胞融合技术将Rf基因引入油菜籽。
此外,关于Rf基因,根据植物的各cms系统,存在1种或多种恢复基因。对于萝卜,在恢复可育性时Rf1基因和Rf2基因必需同时存在。此外,已知Rf1基因能够大幅度减少作为萝卜的cms原因蛋白质已知的线粒体内ORF125蛋白质(M.Iwabuchi等,Plant Mol.Biol.39:183-188,1999)的积蓄量。(育种学杂志47(分册1)P186,1997;育种学杂志48(分册1)P197,1998)。
关于油菜籽,根据遗传解析试验还可知道,通过交配或细胞融合导入的萝卜的Rf1基因能够减少作为cms原因蛋白质已知的ORF125或ORF138蛋白质(M.Grelon等,Mol.Gen.Genet.243:540-547)的蓄积量,这些ORF125或ORF138蛋白质的积蓄量减少与可育性恢复的现象完全一致(N.Koizuka等,Theor Appl Gene,100:949-955,2000)。亦即,在油菜籽雄性不育系统中恢复可育性,必须减少ORF125或ORF138蛋白质的积蓄量,因此,Rf1基因是重要的基因。
但是,关于Rf基因的碱基序列,只鉴定和分离出Rf2基因,Rf2基因是玉米cms之一的T细胞质的恢复基因之一,而对其他植物的Rf基因的碱基序列则是完全未知的。
发明内容
已知通过交配或细胞融合导入了来源于Ogura萝卜的Rf1基因的油菜籽恢复系统和以该系统作为父本产生的F1品种中,葡萄糖异硫氰酸盐(glucosinolate)(以下简称为GSL)的含量比规定值高,实际应用上存在问题。认为这是由于与GSL生物合成有关的来源于萝卜的基因存在于Rf1基因附近,从而形成强的遗传连锁,因此使油菜籽的恢复系统(Rf系统)的GSL含量上升。GSL包含在油菜榨油后的渣滓中,已知将其作为饲料喂给动物时,会造成甲状腺肥大,因此,在北美要求在育种阶段油菜种子的GSL含量控制在18μmole/g以下,在欧洲要求控制在20μmole/g以下。
此外,近年来,通过基因重组添加除草剂耐性等功能的植物开发蓬勃开展,为了有效地创造出这些植物,仅有通过交配或细胞融合得到的油菜籽恢复系统是不够的,因此,希望分离Rf基因,尤其是来源于萝卜的Rf1基因。
亦即,本发明所要解决的问题在于分离Rf基因,特别是来源于萝卜的Rf1基因并鉴定其结构。而且,本发明所要解决的问题还在于提供利用分离的Rf基因建立油菜籽恢复系统的方法。
本发明者为了解决上述问题而进行了努力的研究,结果从萝卜和油菜籽成功地克隆了Rf1基因,解决了本课题的问题。
亦即,按照本发明,提供一种与细胞质雄性不育个体的不育性恢复为可育有关的蛋白质,其特征在于,具有PentatricopeptideRepeat(以下简称为PPR)基序14个以上,该PPR基序群分为3个以上的模序,每个模序至少有2个以上的PPR基序,而且,在羧基末端(C末端)一侧的模序有4个PPR基序。
根据上述蛋白质的优选方式提供:
PPR基序数为14-16个的蛋白质;
PPR基序群分为3个模序,自氨基末端(N末端)一侧起,各模序依次有5个、7个及4个PPR基序的蛋白质;
从氨基末端(N末端)一侧起第2个PPR基序中存在的第4个氨基酸为丝氨酸、苏氨酸或半胱氨酸以外的氨基酸的蛋白质;
从氨基末端(N末端)一侧起第2个PPR基序中存在的第4个氨基酸为天冬酰胺、谷氨酰胺、天冬氨酸、谷氨酸或组氨酸中任意一种的蛋白质;以及,
在氨基末端具有用于易位至线粒体的信号肽序列,或者羧基末端具有-LysAspGluLeu-序列的蛋白质。
根据本发明的另一个方面,提供参与细胞质雄性不育个体的不育性恢复至可育性的蛋白质,其特征在于,使其与细胞质雄性不育基因的转录产物接触后,使该转录产物发生凝胶移位。
根据本发明的另一个方面,提供:
具有序列号26所述的氨基酸序列,参与细胞质雄性不育个体的不育性恢复至可育性的蛋白质;
具有序列号27所述的氨基酸序列,参与细胞质雄性不育个体的不育性恢复至可育性的蛋白质;
具有序列号28所述的氨基酸序列,参与细胞质雄性不育个体的不育性恢复至可育性的蛋白质;以及
具有序列号29所述的氨基酸序列,参与细胞质雄性不育个体的不育性恢复至可育性的蛋白质。
根据本发明的另一个方面,提供下述任何一种蛋白质。
(1)具有序列号3所述氨基酸序列的第80-687的氨基酸序列、序列号17所述氨基酸序列的第80-687的氨基酸序列、或序列号19所述氨基酸序列的第82-690的氨基酸序列的蛋白质;或
(2)具有序列号3所述氨基酸序列的第80-687的氨基酸序列、序列号17所述氨基酸序列的第80-687的氨基酸序列、或序列号19所述氨基酸序列的第82-690的氨基酸序列中1个至多个氨基酸缺失、添加和/或置换的氨基酸序列,而且参与细胞质雄性不育个体的不育性恢复至可育性的蛋白质。
根据本发明的另一个方面,提供下述任何一种蛋白质。
(1)具有序列号3、序列号17、或序列号19所述氨基酸序列的蛋白质;或
(2)具有序列号3、序列号17、或序列号19所述氨基酸序列中1个至多个氨基酸缺失、添加和/或置换的氨基酸序列,而且参与细胞质雄性不育个体的不育性恢复至可育性的蛋白质。
在本发明中优选细胞质雄性不育个体含有Kosena萝卜和/或Ogura萝卜的细胞质雄性不育基因或其同源物。
根据本发明的另一个方面,提供编码上述本发明的任何一种蛋白的DNA。
根据本发明的另一个方面,提供:
具有序列号22所述碱基序列的DNA;
具有序列号23所述碱基序列的DNA;
具有序列号24所述碱基序列的DNA;以及
具有序列号25所述碱基序列的DNA。
根据本发明的另一个方面,提供下述任何一种DNA。
(1)具有序列号2、序列号16、或序列号18所述碱基序列的DNA;或
(2)具有序列号2、序列号16、或序列号18所述碱基序列中1至多个碱基缺失、添加和/或置换的碱基序列,而且参与细胞质雄性不育个体的不育性恢复至可育性的DNA;或
(3)与具有序列号2、序列号16、或序列号18所述碱基序列的DNA在严格条件下杂交,而且参与细胞质雄性不育个体的不育性恢复至可育性的DNA;
根据本发明的另一个方面,提供下述任何一种DNA。
(1)具有序列号1所述碱基序列的第3754-第8553位碱基的序列,或序列号15所述碱基序列的第812-第3002位碱基的序列的DNA;
(2)具有序列号1所述碱基序列的第3754-第8553位碱基的序列,或序列号15所述碱基序列的第812-第3002位碱基的序列中1至多个碱基缺失、添加和/或置换的碱基序列,而且参与细胞质雄性不育个体的不育性恢复至可育性的DNA;或
(3)与具有序列号1所述碱基序列的第3754-第8553位碱基的序列,或序列号15所述碱基序列的第812-第3002位碱基的序列的DNA在严格条件下杂交,而且参与细胞质雄性不育个体的不育性恢复至可育性的DNA。
根据本发明的另一个方面,提供下述任何一种DNA。
(1)具有序列号1或序列号15所述碱基序列的DNA;或
(2)具有序列号1或序列号15所述碱基序列中1至多个碱基缺失、添加和/或置换的碱基序列,而且参与细胞质雄性不育
个体的不育性恢复至可育性的DNA;或
(3)与具有序列号1或序列号15所述碱基序列的DNA在严格条件下杂交,而且参与细胞质雄性不育个体的不育性恢复至可育性的DNA。
在本发明中优选细胞质雄性不育个体含有Kosena萝卜和/或Ogura萝卜的细胞质雄性不育基因或其同源物。
根据本发明的另一个方面,提供含有本发明DNA的载体。
根据本发明的另一个方面,提供含有本发明DNA或本发明载体的性状转化体。性状转化体优选为性状转化植物。
根据本发明的另一个方面,提供一种将细胞质雄性不育个体的不育性恢复为可育的方法,其特征在于,使用本发明的DNA。
根据本发明的另一个方面,提供一种性状转化体,该性状转化体含有细胞质雄性不育基因,而且通过在含有本发明DNA的细胞中进一步导入本发明DNA的部分或全部以及诱导型启动子,能够调节雄性不育恢复基因表达。
根据本发明的另一个方面,提供一种通过利用上述性状转化体维持细胞质雄性不育系统的方法。
根据本发明的另一个方面,提供一种参与细胞质雄性不育恢复的基因的检测方法,使用由上述本发明DNA任意设定的15-50mer低聚核苷酸引物,或由上述本发明DNA的全部或部分构成的至少15mer以上的探针,通过确认在目的生物样品中用该引物扩增的碱基序列的量,或用探针检测的碱基序列的量在1个基因组中为1个基因以上,检测参与细胞质雄性不育恢复的基因。
根据本发明的另一个方面,提供具有序列号1所述碱基序列的第3754-第5091位碱基的序列,或序列号15所述碱基序列的第1-第811位碱基的序列的启动子DNA。
附图的简要说明
图1表示Rf标记基因图谱。
图2表示含有完整的序列号1所述碱基序列的lambda克隆CHI结构的模式图。
图3表示用PCR法检测性状转化体中导入的DNA的结果。
泳道1:对照载体;泳道2:性状转化油菜籽;泳道3:细胞质雄性不育油菜籽。
a:3186bp-3753bp,长度568bp
b:4869bp-5112bp,长度244bp
c:7766bp-8250bp,长485bp
图4表示用Western印迹法解析性状转化体中CMS蛋白质ORF125积畜量减少的结果。
泳道1:细胞质雄性不育油菜籽 -1- 15μg
泳道2:可育性恢复油菜籽15μg
泳道3:细胞质雄性不育油菜籽 -2- 15μg
泳道4-7:细胞质雄性不育油菜籽 -2-
15/2μg、15/4μg、15/8μg、15/16μg稀释系列
泳道8:性状转化油菜籽15μg
图5表示由性状转化油菜籽的开花体取出花粉,在显微镜下观察的结果。
图6表示pSTV125-5′#LA6和pSTV125-5′#LA12的碱基序列。
发明的最佳实施方式
以下,就本发明的实施方式进行详细说明。
(1)本发明蛋白质的实施方案
本发明的蛋白质涉及下述(i)至(v)的任何一种蛋白质。
(i)参与细胞质雄性不育个体的不育性恢复至可育的蛋白质,其特征在于,具有14个以上的Pentatricopeptide Repeat(以下略称为PPR)基序,该PPR基序群分为3个以上的模序,每个模序分别具有至少2个以上的PPR基序,而且,羧基末端(C末端)一侧的模序有4个PPR基序;
(ii)一种蛋白质,其特征在于,与细胞质雄性不育基因的转录产物接触后,使该转录产物发生凝胶移位;
(iii)参与细胞质雄性不育个体的不育性恢复至可育的蛋白质,其具有序列号26-29中任何一个序列所述的氨基酸序列;
(iv)下述任何一种蛋白质:
(1)具有序列号3所述氨基酸序列的第80-687位的氨基酸序列、序列号17所述氨基酸序列的第80-687位的氨基酸序列、或序列号19所述氨基酸序列的第82-690位的氨基酸序列的蛋白质;或
(2)具有序列号3所述氨基酸序列的第80-687位的氨基酸序列、序列号17所述氨基酸序列的第80-687位的氨基酸序列、或序列号19所述氨基酸序列的第82-690位的氨基酸序列中1个至多个氨基酸缺失、添加和/或置换的氨基酸序列,而且参与细胞质雄性不育个体的不育性恢复至可育性的蛋白质;以及
(v)下述任何一种蛋白质:
(1)具有序列号3、序列号17、或序列号19所述氨基酸序列的蛋白质;或
(2)具有序列号3、序列号17、或序列号19所述氨基酸序列中1个至多个氨基酸缺失、添加和/或置换的氨基酸序列,而且参与细胞质雄性不育个体的不育性恢复至可育性的蛋白质。
本说明书中,PPR基序是指“Pentatricopeptide Repeat”基序。该PPR基序是在进行拟南芥属基因组课题研究中发现的一种新型蛋白质的基序结构。其基本基序是35个简并(degenerate)的氨基酸序列在其蛋白质的一级结构上串联重复。PPR基序具有下述序列所代表的氨基酸共有序列:氨基末端(N末端)-“VTYNTLISGYCKNGKLEEALELFEEMKEKGIKPDV”-羧基末端(C末端)。该基序是由Small和Peeters(文献Trens Biochem Sci 2000,25 46-47)提出的,在该参考文献出版的当时,拟南芥属基因组中约有200个含有此基序的基因已在GeneBank(http//:WWW.ncbi.nlm.nih.gov/Genebank/index.html)等基因Bank中登记。现在,通过英国Sanger研究所内的Proteinfamilies database of alignments and HMNs(以下简称为Pfam,http//:WWW.Sanger.ac.uk/Software/Pfam/search.shtml)中的程序,很容易对某种任意蛋白质是否具有此基序结构作出判断。
到目前为止,含有PPR基序的蛋白质的功能已清楚的例子有:1)易位至线粒体的蛋白质,即酵母的PET309和粗糙脉孢菌的CYA-5,与线粒体基因coxl mRNA相互作用,在转录后加工或翻译水平上调节coxl的表达(Manthey and McEwen EMBO J 1995 14 4031-4043,Coffin等,Curr Genet 1997 32 273-280),以及2)易位至叶绿体的PPR基序蛋白质,即玉米的CRP1,是叶绿体基因petA和petD基因的翻译所必须的,而且也是petDmRNA的加工步骤所必须的(Fisk等,EMBO J1999 18 2621-2630)等,因此,可以推测含有PPR基序的蛋白质以某种方式参与翻译调控的可能性很大。
这次,本发明者在分离参与Kosena萝卜细胞质雄性不育个体的不育性恢复至可育的基因时,发现由该基因编码的蛋白质具有14个以上的Pentatricopeptide Repeat(以下简称为PPR)基序,此外该PPR基序群分为3个以上的模序,每个模序分别具有至少2个以上的PPR基序,而且,羧基最末端(C末端)一侧的模序有4个PPR基序。
作为上述参与细胞质雄性不育个体的不育性恢复至可育的蛋白质,优选PPR基序数为14-16个的蛋白质,更优选PPR基序群分为3个模序,从氨基末端(N末端)一侧起各模序依次有5个、7个及4个PPR基序。
具体是由以下(1)、(2)、(3)构成的蛋白质:
PPR簇#1:自N末端起第1个PPR基序至第5个PPR基序连续175个残基构成的PPR簇;
PPR簇#2:自N末端起第6个PPR基序至第12个PPR基序连续245个残基构成的PPR簇;
PPR簇#3:自N末端起第13个PPR基序至第16个PPR基序连续140个残基。
更优选自氨基末端(N末端)一侧起第2个PPR基序中存在的第4个氨基酸是丝氨酸、苏氨酸或半胱氨酸以外的氨基酸;更优选自氨基末端(N末端)一侧起第2个PPR基序中存在的第4个氨基酸是天冬酰胺、谷氨酰胺、天冬氨酸、谷氨酸或组氨酸中的任何一种;特别优选自氨基末端(N末端)一侧起第2个PPR基序中存在的第4个氨基酸是天冬酰胺。
已知通常可育性恢复基因存在于核基因组中,细胞质雄性不育基因存在线粒体中,因此优选参与上述细胞质雄性不育个体的不育性恢复至可育性的蛋白质,在其氨基末端进一步具有用于易位至线粒体的信号肽序列,或者在羧基末端进一步具有“LysAspGluLeu”构成的序列。
作为用于易位至线粒体的N末端的信号肽,可以例举通过以O.Emanuelsson等(J.Mol.Biol.300,1005-1016(2000))的算法为基础的预测程序“TargetP”(http://www.cbs.dtu.dk/services/TargetP/)或预测程序“Psort”(http://psort.nibb.ac.jp/)确认的物质,另外,作为该信号肽的具体例子,可以例举拟南芥(Arabidopsis thaliana)AtOXA1基因的信号肽(W.Sakamoto等,Plant Cell Physiol,41:1157-1163)(MetAlaPheArgGlnThrLeuSerIleArgSerArgLeuPheAlaArgArgAsnGlnProValTyrHisIleIleProArgGluSerAspHisGluArgAsp)序列。其中优选例举序列号3所述氨基酸序列中1-79位的氨基酸序列,特别优选例举序列号3所述氨基酸序列中1-34位的氨基酸序列。
另外,本发明的参与细胞质雄性不育个体的不育性恢复至可育的蛋白质,通过与细胞质雄性不育基因的转录产物结合,对其细胞质雄性不育基因的翻译产生抑制作用,从而使细胞质雄性不育个体的不育性恢复至可育。
作为细胞质雄性不育基因的转录产物,可以例举造成Kosena细胞质雄性不育的原因蛋白质ORF125,或造成Ogure细胞质雄性不育的原因蛋白质ORF138的各自基因的转录产物(mRNA),优选例举该基因的5-UTR(Bonhome等,Mol Gen Genet,235:340-348,1992)区域。
作为确定是否与细胞质雄性不育基因的转录产物结合的方法,可以例举在体外人工转录的orf125或orf138的mRNA中加入本发明的蛋白质,然后进行电泳的方法,即所谓的凝胶移位法。作为具体的操作方法,例如凝胶移位法,可以在通常所用的条件下进行。
此外,还可以例举使ORF125或ORF138的基因与β-半乳糖苷酶或荧光素酶等可检测的报道基因的融合基因在大肠杆菌等中表达,再在表达产物中加入本发明的蛋白质,确认表达是否得到抑制的方法。
具体而言,将序列号2的碱基序列所示的可育性恢复基因整合到大肠杆菌表达载体中,同时将orf125的5′-UTR区域和25个氨基酸的编码部分与LacZ基因融合成载体,然后将该载体整合到大肠杆菌中,经过诱导表达,只有与整合了可育性恢复基因的表达载体共存的场合,LacZ基因的表达才得到抑制,在X-Gal存在下,兰色的大肠杆菌菌落变成白色。这样利用编码本发明蛋白质的基因进行上述确认,也可以通过对细胞质雄性不育基因的翻译产生抑制作用,确认其具有使细胞质雄性不育个体的不育性恢复至可育的功能。
作为本发明的参与细胞质雄性不育个体的不育性恢复至可育的蛋白质中最优选的蛋白质,可以例举具有与共有序列,即序列号26-29所述的氨基酸序列具有70%以上,优选80%以上,更优选90%以上,进一步优选92%以上,进一步优选95%以上,特别优选97%以上的同源性的氨基酸序列的蛋白质。作为共有序列,可以例举序列号26所述的氨基酸序列,优选例举序列号27或序列号28所述的氨基酸序列,特别优选例举序列号29所述的氨基酸序列。
此外,作为上述蛋白质的优选具体实例,可以例举:
(1)具有序列号3所述氨基酸序列的第80-687位的氨基酸序列、序列号17所述氨基酸序列的第80-687位的氨基酸序列、或序列号19所述氨基酸序列的第82-690位的氨基酸序列的蛋白质;或
(2)具有序列号3所述氨基酸序列的第80-687位的氨基酸序列、序列号17所述氨基酸序列的第80-687位的氨基酸序列、或序列号19所述氨基酸序列的第82-690位的氨基酸序列中1个至多个氨基酸缺失、添加和/或置换的氨基酸序列,而且参与细胞质雄性不育个体的不育性恢复至可育的蛋白质。
此外,作为该序列中含有线粒体易位序列的蛋白质,可以例举:
(1)具有序列号3、序列号17、或序列号19所述氨基酸序列的蛋白质;或
(2)具有序列号3、序列号17、或序列号19所述氨基酸序列中1个至多个氨基酸缺失、添加和/或置换的氨基酸序列,而且参与细胞质雄性不育个体的不育性恢复至可育的蛋白质。
本发明的蛋白质是能够参与细胞质雄性不育个体的不育性恢复至可育的蛋白质。更具体地说,使导入了编码本发明蛋白质的DNA的性状转化植物(Rf系统)与细胞质雄性不育系统(cms系统)的个体交配时,可以获得恢复了可育性的F1种子。作为上述cms系统的个体,优选例如导入了Kosena萝卜和/或Ogura萝卜的细胞质雄性不育基因的个体。
本发明的蛋白质可以利用上述的凝胶移位法进行筛选、分离,也可以利用以下说明的本发明DNA进行分离或合成。本发明蛋白质的获得方法在后面叙述。
(2)本发明DNA的方式
本发明的DNA涉及下述(i)至(iv)中任意一种DNA。
(i)编码上述本发明蛋白质的DNA。
(ii)具有序列号22-序列号25中任意一个所述的碱基序列的DNA。
(iii)下述任何一种DNA
(1)具有序列号2、序列号16、或序列号18所述碱基序列的DNA;或
(2)具有序列号2、序列号16、或序列号18所述碱基序列中1个至多个碱基缺失、添加和/或置换的碱基序列,而且参与细胞质雄性不育个体的不育性恢复至可育的DNA;或
(3)与具有序列号2、序列号16、或序列号18所述碱基序列的DNA在严格条件下杂交,而且参与细胞质雄性不育个体的不育性恢复至可育的DNA。
(iv)下述任何一种DNA
(1)具有序列号1所述碱基序列的第3754-8553位的碱基序列,或序列号15所述碱基序列的第812-3002位的碱基序列的DNA;或
(2)具有序列号1所述碱基序列的第3754-8553位的碱基序列或序列号15所述碱基序列的第812-3002位的碱基序列中1个至多个碱基缺失、添加和/或置换的碱基序列,而且参与细胞质雄性不育个体的不育性恢复至可育的DNA;或
(3)与具有序列号1所述碱基序列的第3754-8553位的碱基序列或序列号15所述碱基序列的第812-3002位的碱基序列的DNA在严格条件下杂交,而且参与细胞质雄性不育个体的不育性恢复至可育的DNA。
(v)下述任何一种DNA
(1)具有序列号1或序列号15所述碱基序列的DNA;或
(2)具有序列号1或序列号15所述碱基序列中1个至多个碱基缺失、添加和/或置换的碱基序列,而且参与细胞质雄性不育个体的不育性恢复至可育的DNA;或
(3)与具有序列号1或序列号15所述碱基序列的DNA在严格条件下杂交,而且参与细胞质雄性不育个体的不育性恢复至可育的DNA。
在本说明书中,有时将本发明的DNA称为本发明的基因。
序列号1所示的碱基序列是由8553个碱基构成的基因组DNA碱基序列;序列号2所示的碱基序列是由序列号1得到的编码序列。序列号3是序列号2所述碱基序列编码的氨基酸序列。
序列号15所示的碱基序列是由3306个碱基构成的基因组DNA碱基序列;序列号16所示的碱基序列是由序列号15得到的编码序列。序列号17是序列号16所述的碱基序列编码的氨基酸序列。
在本说明书中,“1个至多个碱基缺失、添加和/或置换的碱基序列”是指,例如1-20个,优选1-15个,更优选1-10个,进一步优选1-5个的任意数目的碱基缺失、添加和/或置换的碱基序列。
在本说明书中,“1个至多个氨基酸缺失、添加和/或置换的氨基序列”是指,例如1-20个,优选1-15个,更优选1-10个,进一步优选1-5个的任意数目的氨基酸缺失、添加和/或置换的氨基酸序列。
在本说明书中,“在严格条件下杂交的DNA”是指,使用DNA作为探针,用菌落杂交法、噬斑杂交法、或Southern印迹杂交法等得到的DNA的碱基序列,例如,通过使用固定了来源于菌落或噬斑的DNA或该DNA片段的滤器,在0.7-1.0M的NaCl存在下,65℃下进行杂交后,用0.1-2×SSC溶液(1×SSC的组成为150mM氯化钠、15mM枸缘酸钠)在65℃条件下洗涤滤器,能够进行鉴定的DNA。
杂交可以按Molecular Cloning:A laboratory Mannual,2ndEd.,Cold Spring Harbor Laboratory,Cold SpringHarbor,NY.,1989.(以后简称为“分子克隆第2版”)等所述的方法进行。
作为在严格条件下杂交的DNA,可以例举与作为探针使用的DNA的碱基序列具有一定程度以上的同源性的DNA。这里所说的一定程度以上的同源性,例如为70%以上,优选80%以上,更优选90%以上,进一步优选93%以上,特别优选95%以上,最优选97%以上。另外,作为这里所说的具有一定程度以上的同源性的DNA,包括上述具有同源性的多核苷酸,及其互补链多核苷酸两者。
本发明的DNA是能够参与细胞质雄性不育个体的不育性恢复至可育的DNA。更具体地说,通过使导入了本发明DNA的性状转化植物(Rf系统)与细胞质雄性不育系统(cms系统)的个体交配,可以获得恢复了可育性的F1种子。作为上述cms系统的个体,优选例举导入了Kosena萝卜和/或Ogura萝卜的细胞质雄性不育基因的个体。
(3)本发明DNA的获得方法
对本发明DNA的获得方法没有特别的限定。根据本说明书中公开的序列号1或序列号2所述的碱基序列、以及序列号3所述的氨基酸序列或者以序列号3所述氨基酸序列的信息得到的PPR基序、或组合线粒体易位序列得到的氨基酸序列的信息,利用本领域技术人员所熟知的一般育种方法以及一般基因工程方法,可以分离或合成本发明的DNA。
具体而言,可以由能够表达本发明基因的适当植物来源获得,具体是包括萝卜品种或近缘种的Raphanus属植物,或者通过交配或细胞融合技术,引入了这些植物的含有细胞质雄性不育恢复基因的基因组DNA的其他植物,更具体是Kosena萝卜、Ogura萝卜、园红萝卜或这些萝卜品种或者近缘种等的Raphanus属植物,或者通过交配或细胞融合技术,引入了这些植物的含有细胞质雄性不育恢复基因的基因组DNA的油菜属植物。例如,分离位于Rf基因附近的DNA标记,制作表明该DNA标记和Rf基因的遗传距离关系的基因组图谱,然后以基因组图谱作为出发点,利用Rf区域的定位克隆法(亦称为染色体浸游),可以分离并获得本发明的基因。
这种技术首先是在基因组DNA上找出合适的DNA标记,通过测定Rf基因和DNA标记的遗传距离,制作基因组图谱。DNA标记必须能识别来源于父本的基因组和来源于母本的基因组,一般长度为数百bp。此外,DNA标记必须与基因位于同一染色体上,由于与基因的距离很近,其遗传模式几乎相同,也就是说要求是遗传上强连锁的标记。
关于DNA标记的分离方法,以前一直利用RFLP法,近年来则利用使用PCR的简便方法,即RAPD法和AFLP(Amplified fragment lengthpolymophism)法(Nucleic Acid Research,1995,Vol.23,No.21,4407-4414)。特别是AFLP法是获得遗传上强连锁的标记的有效方法。作为测定与标记的遗传距离的材料,通常可以采用以下的群体:使不携带Rf1基因的隐性纯合个体与携带纯合Rf1基因的显性纯合个体交配所得的F1世代通过自身授粉而得到的F2群体;使F1世代与其不带目的基因的隐性纯合个体的亲本交配得到的BC1群体。
作为上述隐性纯合个体,可以使用包括细胞质雄性不育系统的萝卜的品种、近缘种的Raphanus属植物;更具体是细胞质雄性不育系统的Kosena萝卜和Ogura萝卜、或引入了来源于Kosena萝卜的细胞质雄性不育(Kosena cms)和来源于Ogura萝卜的细胞质雄性不育(Oguracms)的油菜属植物,更具体是cms油菜籽。
作为上述显性纯合个体,可以使用包括Rf系统的萝卜的品种、近缘种的Raphanus属植物,更具体是细胞质雄性不育恢复系统的Kosena萝卜、Ogura萝卜、园红萝卜、或通过交配或细胞融合技术引入了包括这些萝卜品种和近缘种的Raphanus属植物的含有细胞质雄性不育恢复基因的基因组DNA的油菜属植物,更具体是Rf油菜籽。
对于这些使两种亲本交配所得的F1世代经自身授粉而得到的F2群体、F1世代与隐性纯合个体交配所得的BC1群体,通常要求对100个以上的个体,更优选1000个以上的个体进行解析,个体数越多,基因组图谱的精度越高,从DNA标记至目的基因的物理距离变短。Rf基因的场合也同样可能得到物理距离更短的DNA标记。
作为测定DNA标记与Rf基因的遗传距离的材料,例如可以使用按照N.Koizuka等,Theor Appl Genet,100:949-955,2000中所述的方法,使cms系统Kosena萝卜(Raphanus sativus cv.Kosena)和Rf系统的园红萝卜(Raphanus sativus cv.Yuanhong)交配得到的萝卜F1世代经自身授粉所得到的数千个F2群体。根据对这些群体的解析,可以分离出以夹持Rf基因的形态,分别在两侧遗传距离为0.2cM的位置连锁的DNA标记,由此可以制成图1所示的表示标记和Rf基因的遗传距离的基因组图谱。
基因组的图谱制成后,有必要对与其位置对应的基因组DNA进行克隆,使夹持目的基因的DNA标记间连接起来。通常,DNA标记与目的基因的物理距离较大,因此通过将多个含有基因组DNA片段的无性系连接起来,从而复盖DNA标记到目的基因区域。这种用含有基因组DNA片段的无性系将DNA标记间连接起来的过程称为重叠群的制备。Rf基因的场合同样也可以通过使用多个含有基因组DNA片段的无性系将距离Rf基因更近的位置上存在的DNA标记间连接,使之覆盖Rf基因区域,制备重叠群。
含有基因组DNA片段的无性系的集合体可以通过制作基因组文库来获得。通常,根据能克隆的基因组DNA的长度,使用几种载体,例如利用能克隆约20kb片段的λ噬菌体载体、能克隆比较长的片段(~40kb)的粘粒载体、能克隆更长的100kb以上片段的BAC(Bacterialartificial chromosome)载体等得到的文库。
无论哪一种文库,被克隆的片段的平均长度乘以文库中群体数所得的数值应为供于文库的基因组的全长(基因组大小)的4-5倍,这一点很重要。认为萝卜的基因组大小为约500Mbp,因此在使用λ噬菌体载体克隆平均长度20kb的场合,群体数为1.0×105个至1.25×105个;在粘粒文库平均长度为40kb的场合,群体数为5.0×104至6.25×104个。认为油菜籽的基因组大小为约1000Mbp,因此在使用λ噬菌体载体克隆平均长度20kb的场合,群体数为2.0×105个至2.5×105个;在粘粒文库平均长度为40kb的场合,群体数为1.0×105至1.25×105个。
供于文库的基因组DNA可以采用常规方法从含目的基因的生物中提取基因组DNA。在Rf基因的场合,可以使用包括Rf系统的萝卜品种、近缘种的Raphanus属植物,更具体是通过交配或细胞融合技术引入了包括细胞质雄性不育恢复系统的Kosena萝卜、Ogura萝卜、园红萝卜或这些萝卜品种和近缘种的Raphanus属植物的含有细胞质雄性不育恢复基因的基因组DNA的油菜属植物,更具体是Rf油菜籽。一般来说,认为最好从与制备F2群体和BC1群体时所用的亲本植物相同的Rf系统的植物提取基因组DNA,制备基因组文库。基因组DNA可以按照CTAB法(Murray,M.G.和Thompson,W.F.(1980)Nucleic AcidRes.,8,4321)等常规方法进行制备。
关于重叠群的制备,首先是分离含有位于Rf基因两侧的DNA标记的无性系。由基因组文库按照常规方法进行分离,在λ噬菌体文库的场合,采用噬菌斑杂交法进行分离,在粘粒文库和BAC文库的场合,采用菌落杂交法进行分离。然后,用该分离的无性系的末端区域作为指标,通过分离与该无性系邻接的无性系,制备重叠群。制成后,通过常规方法确定重叠群的碱基序列。
近年来,由于基因组计划的进展,根据基因组DNA的碱基序列推测功能性基因的技术也发展了起来。以“Genscan”为代表的基因发现程序能够以相当高的概率推定基因。此外,以“BLAST”为代表的同源性检索程序能够推定其他基因或蛋白质的类似性。利用这些分析软件进行目的基因的推定和分离。Rf基因的场合同样也可以利用相同的分析软件,对重叠群的基因组DNA序列进行分离、鉴定。另外,分析明确指出了基因组DNA碱基序列上的启动子区域、含有内含子的结构基因区域、终止子区域。同时,对于含有内含子的结构基因,还指明了除去内含子可翻译为蛋白质的形式的基因,以及相应于该基因的氨基酸序列。用这样的方式,能够以相当高的概率推测出重叠群上的Rf基因。
此外,为了以利用上述分析软件推定的基因序列为基础,确认实际上目的基因组在生物体内以何种形式表达,可通过纯化mRNA,分离与之互补的DNA(cDNA)来证明。另外,关于转录的起始点,作为一种简便方法,可以采用被称为5′-RACE法的利用PCR的方法、或更可靠的引物延伸法和SI图谱法等进行分析来证明。
以上的方法在Molecular Cloning:Alaboratory Mannual,2ndEd.,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY.,1989.等中有描述。
根据由上述技术推定的碱基序列而分离得到的本发明的基因,具体可以例举序列号2、序列号16、或序列号18所示的DNA。这样,以该DNA为基础,通过一般的基因工程技术,也可能容易地从其他植物来源等分离出cDNA。
具体而言,通过由能够表达本发明基因的适当植物来源,具体是包括萝卜品种或近缘种的Raphanus属植物,或者通过交配或细胞融合技术,有这些植物引入了含有细胞质雄性不育恢复基因的基因组DNA的其他植物,更具体是Kosena萝卜、Ogura萝卜、园红萝卜或这些萝卜品种或者近缘种等的Raphanus属植物,或者通过交配或细胞融合技术,引入了这些植物的含有细胞质雄性不育恢复基因的基因组DNA的油菜属植物,按照常规方法制作cDNA文库,以本发明基因特有的适当DNA片段作为探针,或者使用抗本发明基因的翻译产物的抗体,由该文库筛选所需的无性系,可以分离出相当于本发明基因的cDNA。
作为上述的cDNA的来源,可以例举表达本发明基因的各种细胞、组织和来源于这些细胞和组织的培养细胞。此外,由这些细胞、组织分离全长RNA、分离和纯化mRNA、获得cDNA及其克隆等都可以按照常规方法进行。
从cDNA文库筛选本发明基因的方法也没有特别的限制,可以按照常规方法进行。
作为这里所用的探针,一般可以使用以本发明基因的碱基序列的有关信息为基础化学合成的DNA等,但是已经获得的本发明基因或其片段也可以很好地使用。此外,也可以使用根据本发明基因的碱基序列信息设定的有义引物、反义引物作为筛选用探针。
上述作为探针使用的有义引物和反义引物的核苷酸序列,可以例举与编码序列号3、序列号17或序列号19所示氨基酸序列的DNA相对应的部分核苷酸序列中,至少具有15-50个连续的碱基,优选20-30个连续的碱基的序列。或者也可以使用含有上述序列的阳性克隆本身作为探针。
在获得本发明基因的过程中,可以将利用PCR法的DNA/RNA扩增法、以5′-RACE法等为代表的RACE法等通常用于基因分离的技术组合起来进行。
采用上述PCR法时使用的引物,能够以通过本发明明确的本发明基因的序列信息为基础适当地设计,并可按常规方法合成。此外,扩增的DNA/RNA片段的分离纯化可以按照上述常规方法,例如凝胶电泳法等进行。
此外,上述所得的本发明基因或各种DNA片段可以按照常规方法确定其碱基序列。
根据这样所得的本发明基因,例如通过利用该基因的部分或全部碱基序列,能够从特征上检测本发明基因在个体或各种组织中是否存在和表达。
如上所述,作为本发明的基因,可以例举编码序列号3、序列号17、或序列号19所示氨基酸序列的DNA,但不限于这些,也包括该基因的同源物。
这里所说的基因的同源物是指与本发明基因(或其基因产物)有序列相同性,根据上述结构特征以及上述其生物学功能的相似性,可认为是一个基因家族的一系列相关基因,当然也包括该基因的等位基因。
例如,本发明的基因不限于具有序列号1或序列号2所示特定碱基序列的基因,也可以具有将对应于序列号3所示各氨基酸残基的任意密码子组合而选择的碱基序列。同样,不限于具有序列号15或序列号16所示特定碱基序列的基因,也可以具有将对应于序列号17所示各氨基酸残基的任意密码子组合而选择的碱基序列;不限于具有序列号18所示特定碱基序列的基因,也可以具有将对应于序列号19所示各氨基酸残基的任意密码子组合而选择的碱基序列。密码子的选择可以按常规方法进行,例如可以从所用的宿主的密码子使用频率等来考虑。
此外,如上所述,本发明的基因也包括与具有序列号1、序列号2、序列号15、序列号16、序列号18或它们的一部分所示的碱基序列的DNA在严格条件下杂交的DNA。这样的DNA是与具有序列号1、序列号2、序列号15、序列号16、序列号18或它们的一部分所示的碱基序列的DNA具有一定程度以上同源性的DNA。
上述有一定程度以上同源性的DNA是指与序列号1、序列号2、序列号15、序列号16、序列号18所示碱基序列或其一部分,或者与编码序列号3、序列号17或序列号19所示氨基酸序列或其一部分的碱基序列至少有70%的同源性,优选至少有90%的同源性,更优选至少有95%的同源性,最优选至少有97的同源性的多核苷酸及其互补多核苷酸。
更具体地说,可以例举具有下述碱基序列的DNA,所述碱基序列为在含有0.1%SDS的0.2×SSC中50℃或者含有0.1%SDS的1×SSC中60℃的严格条件下,与具有序列号1、序列号2、序列号15、序列号16或序列号18所示的碱基序列或其部分碱基序列的DNA杂交的碱基序列。
此外,本发明的DNA中,特别是下述DNA,可以通过化学合成、基因工程技术、诱发突变等本领域技术人员已知的任何一种方法制备。例如,利用具有序列号1、2、15、16或18所述的碱基序列或其部分碱基序列的DNA,通过将变异引入这些DNA,即可获得变异基因:
具有序列号1或序列号15所述碱基序列或其一部分中1个至多个碱基缺失、添加和/或置换的碱基序列,并参与细胞质雄性不育个体的不育性恢复至可育的DNA;
具有序列号2、序列号16或序列号18所述碱基序列或其一部分中1个至多个碱基缺失、添加和/或置换的碱基序列,并参与细胞质雄性不育个体的不育性恢复至可育的DNA;以及
编码具有序列号3、序列号17或序列号19所述氨基酸序列或其一部分中1个至多个氨基酸缺失、添加和/或置换的氨基酸序列,并参与细胞质雄性不育个体的不育性恢复至可育的蛋白质的DNA。
作为获得变异基因的方法,可以采用公知的方法,例如使用随机突变体、有靶突变体、合成基因的方法等(参照新基因工程学实验指南,实验医学分册,羊土社,1996)。
具体地说,对于具有序列号1或序列号2的碱基序列或其部分碱基序列的DNA,可以采用使之与作为变异原的药剂接触的方法、紫外照射的方法、基因工程技术等方法进行。基因工程技术之一的定点诱变法是能够在特定位点引入特定变异的技术,因此是有用的技术,可以按照分子克隆第2版等所述的方法进行。
(4)含有本发明DNA的载体
本发明的DNA可以整合到适当的载体中作为重组载体使用。载体的种类可以是表达载体,也可以是非表达载体,可以根据目的选择。
作为克隆载体,优选大肠杆菌K12菌株中能自主复制的载体,噬菌体载体、质粒载体等都可使用,也可以将大肠杆菌的表达用载体用作克隆载体。具体可以例举ZAP Express[Strata Gene公司生产,Strategies,5,58(1992)]、pBluescrlpt II SK(+)[Nuclelc AcidsResearch,17,9494(1989)]、Lambda ZAP II(Strata Gene公司生产)、λgt10、λgt11[DNA Cloning,A Pract ical APPRoach,1,49(1985)]、λTripl Ex(Clonetec公司生产)、λExCell(Pharmacia公司生产)、pT7T318U(Pharmacia公司生产)、pcD2〔Mol.Gen.Biol.,3,280(1983)〕、pMW218(和光纯药公司生产)、pUC118(宝酒造公司生产)、pEG400〔J.Bac.,172,2392(1990)]、pQE-30(QIAGEN公司生产)等。
表达载体可以考虑与宿主的组合进行选择,优选采用可以在宿主细胞内自主复制或可整合到染色体中,而且在能转录本发明基因的位置含有启动子的表达载体。
用细菌作为宿主细胞时,优选用于使DNA表达的表达载体在该细菌中可自主复制,同时由启动子、核糖体结合序列、上述DNA和转录终止序列构成的重组载体。也可以含有调控启动子的基因。
作为细菌用的表达载体,可以例举pBTrP2、pBTac1、pBTac2(都由Boheringer Manheimde公司市售)、pKK233-2(Pharmacia公司生产)、pSE280(Invitrogen公司生产)、pGEMEX-1(Promega公司生产)、pQE-8(QIAGEN公司生产)、pQE-30(QIAGEN公司生产)、pKYP10(特开昭58-110600)、pKY200(Agrc.Biol.Chem.,48,669(1984))、PLSA1(Agrc.Blol.Chem.,53,277(1989))、pGEL1(Proc.Natl.Acad.Sci.USA,82,4306(1985))、pBluecrlptII SK+、pBluescriptII SK(-)(Stratagene公司生产)、pTrS30(FERMBP-5407)、pTrS32(FERM BP-5408)、pGEX(Pharmacia公司生产)、pET-3(Novagen公司生产)、pTerm2(US4686191、US4939094、US5160735)、pSupex、pUB110、pTP5、pC194、pUC18(Gene,33,103(1985))、pUC19(Gene,33,103(1985))、pSTV28(宝酒造公司生产)、pSTV29(宝酒造公司生产)、pUC118(宝酒造公司生产)、pPA1(特开昭63-233798)、pEG400[J.Bacteriol.,172,2392(1990)]、pQE-30(QIAGEN公司生产)等。作为细菌用的启动子,可例举trp启动子(Ptrp)、lac启动子(Plac)、PL启动子、PR启动子、PSE启动子等来源于大肠杆菌或噬菌体的启动子、SP01启动子、SP02启动子、penP启动子等。
作为酵母用的表达载体,可例举YEp13(ATCC37115)、YEp24(ATCC37051)、Ycp50(ATCC37419)、pHS19、pHS15等。作为酵母用的启动子,可以例举PH05启动子、PGK启动子、GAP启动子、ADH启动子、ga11启动子、ga110启动子、热激蛋白质启动子、MFa1启动子、CUP1启动子等启动子。
作为动物细胞用的表达载体,可以例举pcDNAI、pcDM8(由Funakoshi公司市售)、pAGE107(特开平3-22979;Cytotechnology,3,133,(1990))、pAS3-3(特开平2-227075)、pCDM8〔Nature,329,840,(1987)〕、pcDNAI/AmP(Invitrogen公司生产)、pREP4(Invitrogen公司生产)、pAGE103〔J.Biochem.,101,1307(1978)]、pAGE210等。作为动物细胞用的启动子,可举出巨细胞病毒(人CMV)的IE(立即早期,immediate early)基因的启动子、SV40的初期启动子、逆转录病毒的启动子、金属硫蛋白启动子、热激蛋白启动子、SRα启动子等。
作为植物细胞用的表达载体,可以例举pIG121-Hm[Plant CellReport,15,809-814(1995)]、pBI121[EMBO J.6,3901-3907(1987)]、pLAN411和pLAN421(Plant Cell Report,10(1991)286-290)。此外,特别是将10kb以上的长DNA片段导入植物时,要求使用能使长链DNA稳定保持并导入的改良载体。例如,pBIBAC2(Gene200(1997)107-116)、pYLTAC7(PNAS96(1999)6535-6540)和pBIGRZ2(Bioscience and Industry 55(1997)37-39)。
作为植物细胞用的启动子,可以例举花椰菜花叶病毒35S启动子[Mol.Gen.Genet(1990)220,389-392]等。此外,关于植物性状转化的详细情况在后面另述。
(5)含有本发明DNA的性状转化体
含有本发明DNA的性状转化体可通过将上述重组载体(优选表达载体)导入宿主中而制成。
作为细菌的宿主细胞的具体例子,可以例举属于埃希氏属(Escherichia)、棒杆菌属(Corynebacterium)、短杆菌属(Brevibacterium)、芽孢杆菌属(Bacillus)、微杆菌属(Microbacterium)、沙雷氏菌属(Serratia)、假单胞菌属(Pseudomonas)、土壤杆菌属(Agrobacterium)、脂环酸杆菌属(Alicyclobacillus)、鱼腥蓝细菌属(Anabaena)、组襄蓝细菌属(Anacystis)、节杆菌属(Arthrobacter)、固氮菌属(Azobacter)、着色菌属(Chromatium)、欧文氏菌属(Erwinia)、甲基杆菌属(Methylobacterium)、席蓝细菌属(Phormidium)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红螺菌属(Rhodospirillum)、Scenedesmun菌属、链霉菌属(Streptomyces)、聚球蓝细菌属(Synnecoccus)、发酵单胞菌属(Zymomonas)等的微生物。作为将重组载体导入细菌宿主的方法,可以例举利用钙的方法和原生质体法等。
作为酵母宿主的具体例子,可以例举啤酒糖酵母(Saccharomycescerevisae)、粟洒裂殖糖酵母(Schizosaccharomyces pombe)、乳克鲁维氏酵母(Kluyveromyces lactis)、茁芽丝孢酵母(Trichoaporonpullulans)、河岸许旺氏酵母(Schwanniomyces alluvius)等。
作为将重组载体导入酵母宿主的方法,只要是将DNA导入酵母的方法,任何一种均可使用,例如电穿孔法、原生质球法、醋酸锂法等。
作为动物细胞宿主,可以例举Namalva细胞、COS1细胞、COS7细胞、CHO细胞等。
作为将重组载体导入动物细胞的方法,可以使用能够将DNA导入动物细胞的任何一种方法,例如电穿孔法、磷酸钙法、脂转染法等。
使用植物细胞的性状转化体将在后面叙述。
(6)本发明蛋白质的获得方法
对本发明蛋白质的获得方法没有特别限定。将本说明书公开的序列号3、序列号17或序列号19所述的氨基酸序列,或根据序列号3、序列号17或序列号19所述氨基酸序列的信息得到的PPR基序和线粒体易位序列组合起来,获得氨基酸序列的信息,根据由此所得的信息,本领域的技术人员可以利用一般的基因工程技术,分离、表达或合成本发明的蛋白质。
例如,分离或合成编码本发明蛋白质的DNA,通过将其导入细胞,可以使其表达。
本发明蛋白质例如可以用下述方法获得:培养含有本发明基因的性状转化体,使本发明蛋白质在培养物中产生和蓄积,然后由该培养物收集该蛋白质。
含有本发明基因的性状转化体的培养方法可以按照培养宿主所用的常规方法进行。
本发明的性状转化体是大肠杆菌等原核生物、酵母菌等真核生物的场合,培养这些微生物的培养基可以是天然培养基,也可以是合成培养基,只要该培养基含有该微生物能够利用的碳源、氮源、无机盐类等,而且能有效地培养性状转化体即可。培养优选在振荡培养或深部通气搅拌培养等需氧条件下进行,培养温度通常为15-40℃,培养时间通常为16小时-7天。培养过程中的pH保持在3.0-9.0。pH的调整采用无机或有机酸、碱溶液、尿素、碳酸钙、氨等进行。此外,在培养过程中根据需要也可以在培养基中添加氨苄青霉素或四环素等抗生素。
培养以动物细胞为宿主细胞得到的性状转化体时,采用的培养基是通常使用的RPM11640培养基[The Journal of the AmericanMedical Association,199,519(1967)]、Eagle的MEM培养基[Science,122,501(1952)]、DMEM培养基[Virology,8,396(1959)]、199培养基[Proceeding of the Society for theBiological Medicine,73,1(1950)]或在这些培养基中添加胎牛血清等得到的培养基等。通常在pH6-8、30-40℃、5%CO2存在的条件下培养1-7天。此外,在培养过程中根据需要也可以在培养基中添加卡那霉素、青霉素等抗生素。
培养以植物细胞为宿主细胞得到的性状转化体时,培养基可以使用MS培养基、R2P培养基等通常根据其植物种类使用的培养基。通常在pH6-8、15-35℃等条件下培养1-21天。另外,在培养过程中根据需要也可以在培养基中添加卡那霉素、潮霉素等抗生素。
由性状转化体的培养物分离、纯化参与细胞质雄性不育个体的不育性恢复至可育的本发明蛋白质时,可以采用通常的蛋白质分离、纯化方法。
例如,本发明的蛋白质在细胞内以溶解状态表达时,培养结束后,通过离心分离回收细胞,悬浮于水性缓冲液中,用超声波破碎机、法兰西压榨机、Manton Gaulin均化器、Dynomill碾磨机等将细胞破碎,得到无细胞提取液。由离心分离该无细胞提取液得到的上清液,采用通常的蛋白质分离纯化法,即单独或组合使用溶剂提取法、利用硫铵等的盐析法、脱盐法、利用有机溶剂的沉淀法、使用二乙氨基乙基(DEAE)琼脂糖或DIAION HPA-75(三菱化学公司生产)等树脂的阴离子交换层析法、使用S-Sepharose FF(Pharmacia公司生产)等树脂的阳离子交换层析法、使用丁基琼脂糖或苯基琼脂糖等树脂的疏水层析法、使用分子筛的凝胶过滤法、亲和层析法、层析聚焦法、等电点电泳等电泳法等技术,可以得到纯化的标准品。
此外,该蛋白质在细胞内的形成不溶物进行表达时,同样,将细胞回收后破碎,通过离心分离得到沉淀级分,按照常规方法由沉淀级分回收该蛋白质后,用蛋白质改性剂将该蛋白质的不溶物溶解。将该溶解液稀释或透析成不含蛋白质改性剂的溶液,或蛋白质改性剂的浓度达到不会使蛋白质变性的程度的稀薄溶液,使该蛋白质构成正常的立体结构后,采用与上述同样的分离纯化方法,可以得到纯化的标准品。
本发明的蛋白质或其糖修饰体等衍生物分泌到细胞外时,可以从培养上清液中回收该蛋白质或其糖链加成体等衍生物。亦即,采用与上述同样的离心分离等方法处理该培养物,得到可溶性级分,采用与上述同样的分离纯化方法,可以由该可溶性级分得到纯化的标准品。
此外,本发明的蛋白质也可以通过Fmoc法(芴基甲氧基羰基法)或tBoc法(叔丁氧基羰基法)等化学合成法制造。或者,也可以使用桑和贸易(美国Advanced Chem Tech公司生产)、Perkin Elmer Japan(美国Perkin Elmer公司生产)、Amersham Pharmacia Biotech(Amersham Pharmacia Biotech公司生产)、Aroca(美国ProteinTeghnology Instrument公司生产)、Kurabou(美国Synthecell-Vega公司生产)、日本PerSeptive(美国PerSeptive公司生产)、岛津制作所等的肽合成仪进行合成。
(7)含有本发明DNA的植物转化体
序列号1和序列号15所述的碱基序列是由植物基因组原来的碱基序列分离出来的碱基序列形式。该碱基序列含有基因表达所必需的可操作形式的启动子和终止子。导入的载体在直接导入法的场合,可以将该基因克隆到一般的克隆载体,例如粘粒pWE15(STRATAGENE公司生产)等中。利用土壤杆菌时,可以克隆到一般的植物性状转化用载体,例如pBI121(Clonetec公司生产)。
此外,也可以将由该序列(基因组序列)抽出一部分内含子得到的碱基序列的DNA、几乎抽出全部内含子得到的碱基序列的DNA、序列号2或其第238-2064位碱基所示的DNA、序列号16或其第238-2064位碱基所示的DNA、序列号18或其第244-2073位碱基所示的DNA、或者编码序列号3或相当于其第80-687位残基的区域、或序列号17或相当于其80-687位残基的区域、或序列号19或相当于其第82-690位残基的区域表示的蛋白质的DNA,导入植物细胞内。
这里,含有序列号1所述碱基序列的第3754-5091位的碱基序列、或序列号15所述碱基序列的第1-811位的碱基序列的DNA是,具有在花药中转录mRNA能力的启动子,优选用于恢复雄性不育性。
此外,启动子和终止子区域也可以用已知植物细胞中的功能启动子和终止子取代。
另外,将上述序列号2或其第238-2064位碱基所示的DNA、序列号16或其第238-2064位碱基所示的DNA、序列号18或其第244-2073位碱基所示的DNA、或者编码序列号3或相当于其80-687位残基的区域,序列号17或相当于其第80-687位残基的区域,或序列号19或相当于其第82-690位残基的区域所示的蛋白质的DNA导入植物细胞时,除了该DNA之外,还必须有启动子和终止子。作为常用的一般表达载体,可以例举pBI121(Clonetec公司生产),该载体使用花椰菜花叶病毒的35S启动子作为启动子,使用存在于A.tumefacience的Ti质粒中存在的胭脂氨酸合成酶的终止子作为终止子。此外,作为表达所必要的启动子,并不限于上述的花椰菜花叶病毒的35S启动子,也可使用植物中广泛存在的rbcS启动子等,更优选花粉的发育期间表达的种类的启动子,例如TA29启动子,进一步优选位于该基因上游的原来的启动子。对于终止子也不限于上述胭脂氨酸合成酶的终止子,可以用花椰菜花叶病毒的35S终止子等,更优选用位于该基因下游的原来的终止子。
此外,使用上述序列号2或其第238-2064位的碱基所示的DNA、序列号16或其第238-2064位的碱基所示的DNA、序列号18或其第244-2073位的碱基所示的DNA、或者编码序列号3或相当于其第80-687位残基的区域、序列号17或相当于其第80-687位残基的区域、或序列号19或相当于其第82-690位残基的区域所示的蛋白质的DNA,用于使细胞质雄性不育个体的不育性恢复至可育的目的时,除了该序列以外,还必须要有线粒体易位序列。
作为该线粒体易位序列,可以利用上述序列号2的第1-237位的碱基所示的DNA或编码序列号3的第1-79位的氨基酸序列的DNA、上述序列号16的第1-237位的碱基所示的DNA或编码上述序列号17的第1-79位的氨基酸序列的DNA、或者上述序列18号的第1-243位的碱基所示的DNA或编码上述序列号19的第1-81位的氨基酸序列的DNA、其他上述公知的易位序列等。
在以下的实施例中,本发明者制备了植物性状转化用载体,以便将含有内含子的Rf基因的DNA,按本来的形式导入植物中,其中所说的内含子包含序列号1所示的基因组中存在的本来的启动子至终止子之间的内含子。用限制性酶从构成一部分重叠群的无性系切出序列号1所示的碱基序列后,亚克隆到适当的克隆载体中,然后将亚克隆的片段导入植物性状转化用载体pKM424、pBIGRZ2中,得到能够将该片段导入植物中的载体。将此载体导入植物性状转化用土壤杆菌中。通过使植物感染携带该载体的土壤杆菌,该DNA片段即可整合到植物基因组中。
本发明基因适用的植物可以例举油菜籽、向日葵、大豆、棕榈椰子等油料作物;稻米、玉米、小麦等谷类作物;烟草、喇叭花等花卉类植物;西红柿、花椰菜、卷心菜、白菜、胡萝卜等蔬菜类。
其中,优选油菜籽、卷心菜、白菜、花椰菜等芥属植物和西红柿等,特别优选油菜籽、卷心菜、白菜、花椰菜;最优选油菜籽。
本说明书中,作为性状转化植物源,可以例举种子、胚芽、幼苗、愈伤组织、培养细胞、植物体等。例如,对于油菜籽,选用胚芽或原生质体;对于大豆,选用胚芽、愈伤组织或培养细胞;对于向日葵,选用胚芽;对于棕榈椰子,选用愈伤组织或培养细胞;对于稻米,选用胚芽、愈伤组织、培养细胞或原生质体;对于玉米,选用胚芽、幼苗、愈伤组织、培养细胞或原生质体;对于小麦,选用胚芽、愈伤组织或培养细胞;对于卷心菜、花椰菜,选用胚芽、愈伤组织、培养细胞或原生质体;对于胡萝卜,选用胚芽、愈伤组织、培养细胞或原生质体等,如上所述可以按本领域的技术人员通常的做法,根据对象植物适当地选择合适的部位。
植物的性状转化可以按照常规方法进行,例如将载体一度导入土壤杆菌后,用该土壤杆菌感染植物细胞,从而将载体导入植物的方法;或者电穿孔法、DEAE葡聚糖法、磷酸钙法、聚乙二醇法、粒子枪法等将载体直接导入细胞的方法等。
例如,对于油菜籽来说,作为优选的基因导入方法,可以例举下述记载的方法。
在含有蔗糖等糖类作为碳源的MS培养基上使油菜品种无菌发芽,然后将其下胚轴在含2,4-二氯苯氧乙酸和蔗糖的培养基上进行前培养。离心收集在YEB培养基上生长的土壤杆菌,再悬浮于含蔗糖的MS培养基中。将上述的油菜籽下胚轴加入该悬浮液中,振荡后,将取出的下胚轴放回原来的前培养基中共同培养3天,然后转移至含有玉米素、苯甲氨基嘌呤等植物激素、羧苄青霉素和卡那霉素的选择培养基上进行筛选。通过将这样得到的绿色再生芽,在任选含有苯甲氨基嘌呤等植物激素的生长培养基上培养,然后在任选含有萘乙酸、苯甲氨基嘌呤等植物激素的发根培养基上培养,可以得到再生个体,将此个体与cms系统的个体交配,即可得到恢复了可育性的F1杂种。
通过这样将本发明的DNA导入植物中,可以使细胞质雄性不育个体的不育性恢复至可育。
此外,上述再生个体通过与cms系统的油菜籽交配,检查其后代的可育性,可以确认其表达。以具有cms细胞质的油菜籽作为材料进行性状转化时,将上述形成了根的性状转化体(再生个体)移至含有普通肥料的土壤中使其开花,即可以检查花粉的可育性,从时间、操作上考虑都较简便,因此优选。
另外,在上述性状转化中,作为使用的细胞,利用含有cms细胞质的油菜籽的细胞或组织,优选胚轴、子叶、叶、花粉、培养细胞、愈伤组织、原生质体,如上所述进行性状转化时,将按上述方法得到的植物体(再生个体)移至含有普通肥料的土壤中使其开花,可以得到恢复了花粉可育性的植物个体。
亦即,使用cms细胞,按照上述基因导入法将本发明的DNA导入该cms细胞中,以卡那霉素等抗生素耐性或除草剂耐性筛选标记为指标,筛选该DNA整合到核内的细胞,然后在上述生长培养基及发根培养基中培养,可以得到该DNA整合到核内的植物体。该植物体由雄性不育性状恢复至可育。
作为检测参与细胞质雄性不育恢复的基因的方法,可以通过使用由权利要求1至4中任何一项所述的DNA任意设定的15-50mer的低聚核苷酸引物,或由权利要求1至4中任何一项所述的DNA的全部或部分构成的至少15mer以上的探针,确认在目的生物样品中通过该引物扩增的碱基序列的量、或通过探针检测出的碱基序列的量在1个基因组中有1个以上基因。
作为具体的确定方法,例如有PCR法、Southern杂交法等,其中优选PCR法。这些方法可按照Molecular Cloning:A laboratoryMannual,2nd Ed.,Cold Spring Harbor Laboratory,Cold SpringHarbor,NY.,1989.(以后简称为“分子克隆第2版”)中所述的方法进行。
要确认在1个基因组中存在1个以上基因,按照PCR法,作为一种简便方法,以同样拷贝数的DNA作为模板,必须要确认同样程度的扩增,更精确的是采用定量PCR法,用使已知1个基因组存在1个基因的已知基因扩增的任意引物作为内部标准,在相同量的生物样品中,比较该已知基因的扩增量与通过该引物扩增的碱基序列的量,即可进行确认。按照Southern杂交法,已知该DNA在1个基因组中存在1个基因的可育性恢复系统植物个体的DNA与目的植物样品的DNA等量比较,确认检测的DNA的量相同或更多。
PCR法中所用的引物可以例举与序列号1或序列号2所述DNA序列相同或互补的15-50mer的低聚核苷酸。
Southern杂交法所用的探针可以例举与序列号1或序列号2所述DNA序列相同的双链DNA的全部或其至少15mer以上的一部分,或者单链DNA或其互补链的全部或其至少15mer以上的一部分。此外,还可举出与上述作为探针使用的DNA的碱基序列有一定程度以上的同源性的DNA。这里所说的一定程度以上的同源性是指例如70%以上,优选80%以上,更优选90%以上,进一步优选93%以上,特别优选95%以上,最优选97%以上的同源性。另外,作为这里所说的有一定程度以上同源性的DNA,包括有上述同源性的多核苷酸及其互补链多核苷酸。
以上所述的检测基因的方法不仅能确认该DNA是否整合到性状转化体中,而且也能确认在通过交配试图导入Rf基因的个体中是否存在Rf基因。使用这种方法,在将Rf基因导入细胞质雄性不育个体中时,可以在开花之前确认Rf基因是否存在。此外,在将Rf基因导入具有通常细胞质的个体中时,必须对开花时的花粉与细胞质雄性不育个体交配所得的下一代个体的能育性进行确认,但使用这种方法,能够确认该在此之前Rf基因是否存在。这种使用方法,一般称为标记DNA的利用或标记DNA育种。Rf基因的场合,考虑可以用作Rf基因的标记DNA(Rf标记)。如上所述,Rf标记在利用导入该DNA的重组个体、或通过交配导入Rf基因的非重组体植物作为母本培育实用品种方面很重要。
此外,为了确认导入的DNA是否发挥Rf基因的功能,可以通过如上所述证实性状转化体的可育性恢复来确认,此外,也可以按照下述方法进行。
如上所述,Rf基因通过减少cms原因蛋白质ORF125或ORF138蛋白质在线粒体内的蓄积量,使植物体的可育性恢复。因此,通过确认性状转化个体的线粒体中ORF125或ORF138蛋白质的蓄积量减少,可以确认导入的基因为Rf基因。
作为证实线粒体中ORF125或ORF138蛋白质的蓄积量减少的方法,如下所述:按照本说明书所述的条件,采用Western印迹法检测出ORF125或ORF138蛋白质时,证实用作内部标准的来源于线粒体基因组的蛋白质的抗体,例如在N.Koizuka等,Theor Appl Genet,100:949-955,2000中所述的抗F1-F0ATPase(以下省略为ATPA)的信号量,在细胞质雄性不育个体,以及可育性恢复个体或细胞质雄性不育个体中导入了该DNA的性状转化体中是等量的,而且,与细胞质雄性不育个体的ORF125或ORF138蛋白质的蓄积量相比,可育性恢复个体或细胞质雄性不育个体中导入了该DNA的性状转化体中的蓄积量减少了50%以上,优选60%以上,更优选减少80%以上。
实际上,对于含有ORF125的细胞质雄性不育萝卜的花蕾,一旦导入可育性回恢基因Rf,ORF125蛋白质的蓄积量即大幅度减少,几乎检测不出。另外,对于油菜籽,在含有细胞质ORF125的细胞质雄性不育油菜籽中通过交配导入可育性恢复基因得到的可育性恢复油菜籽的花蕾中,可观察到ORF125蛋白质的蓄积量减少了80%以上。此外,在实施例中,在细胞质雄性不育个体中导入该DNA得到的性状转化油菜籽的花蕾中,也可观察到ORF125蛋白质的蓄积量减少了80%以上。
另外,上述方法中ORF125和ORF138蛋白质的抗体可以用下述的一般方法获得。亦即,可以将这些蛋白质作为抗原给动物免疫而得到抗血清,再用结合了蛋白A的亲和层析柱,纯化免疫球蛋白G抗体。所用的抗原可由正在表达的细胞质雄性不育植物或其培养细胞,通过常规方法将蛋白纯化而获得。此外,也可以通过将ORF125和ORF138基因与表达载体连接,使其在大肠杆菌或酵母中表达,然后同样进行纯化而获得。另外,也可以使用化学合成ORF125或ORF138的全长或一部分得到的肽作为抗原。ATPA的抗体也可以用同样的方法获得。
此外,在含有cms细胞质且具有本发明DNA的细胞中,进一步导入诱导型启动子与本发明基因的一部分或全部,通过对本发明DNA的表达进行特异且暂时的调控,可以制成不需要生产杂交种子所必须的雄性不育性维持系统(维持系统)的新型杂交种子生产系统。
亦即,通常由于cms系统的油菜籽是不育的,为了使cms系统增殖和维持,必须另外有cms和Rf不参与的维持系统,以前为了生产杂交种子,必须要有Rf系统、cms系统、维持系统这3种系统的植物,但是由于本发明已分离、鉴定出Rf基因,因此在生产杂种时,采用由化学物质诱导启动子从而调控恢复基因的表达的方法,可以构建即使没有维持系统也能增殖、维持的cms系统。
具体而言,将本发明基因的一部分或全长按反义或有义方向整合到含有外部诱导的启动子,例如药物敏感性的启动子的载体中,然后用该载体,性状转化含有cms细胞质且含有本发明DNA的细胞。
作为含有cms细胞质且含有本发明DNA的细胞,不仅可以是按上述方法,用本发明DNA性状转化含有cms细胞质的细胞得到的细胞,也可以是将cms系统与Rf系统等交配得到的细胞。
作为上述可以诱导的启动子,例如可以通过特开平6-46697号公报得知;作为载体的制备以及性状转化方法,可以例举与上述同样的方法。
进一步将诱导型启动子与本发明DNA的一部分或全长一起整合到由上述方法所得的含有cms细胞质且含有本发明DNA的细胞中形成性状转化体,该性状转化体通常不能诱导启动子,因此由于原来存在的Rf基因,植物表现出可育性,该系统的维持也可以通过自身授粉进行,但在生产杂种时,通过使具有诱导启动子能力的化学物质作用于该植物,诱导启动子,可以抑制Rf基因的表达。这样,该植物就变成雄性不育,因此可以在生产杂种时作为cms系统使用。
因此,通过采用该方法,即使是cms系统,也能通过自身授粉进行增殖、维持,因而虽然以前生产杂种时必须有3种系统,但是现在能够不需要维持系统,从而能够使生产成本大幅度降低。
此外,主张本申请优先权的基础,即特愿2001-128008号、特愿2001-202082号、以及特愿2002-20083号的各说明书中公开的内容在此全文引用,作为本说明书中公开的内容。
以下,对实施例作更详细的说明,但本发明不受这些实施例的任何限定。
实施例
实施例1:与细胞质雄性不育恢复基因连锁的DNA标记的分离以及基因组图谱的制作
为了分离可育性恢复基因(Rf基因),首先,必须分离位于Rf基因附近的DNA标记,制作表明该DNA和Rf基因的遗传距离关系的基因组图谱。作为其出发点,进行了Rf区域的定位克隆。
在DNA标记分离方法中,按照AFLP(Ampified fragment lengthpolymorphism)法(Nucleic Acids Research,1995,Vol.23,No.214407-4414),用GIBCO BRL公司的AFLP Analysis System I AFLPStarter Primer Kit进行AFLP。作为测定与标记的遗传距离的材料,采用约2100个体的F2群体,该F2群体是通过使cms系统Kosena萝卜(Raphanus sativus cv.Kosena)的1个个体((KC2/KA1)-1)和Rf系统的圆红萝卜(Raphanus sativus cv.Yuanhong)的1个个体(Yuan10-3),按照N.Koizuka等,Theor ApplGenet,100:949-955 2000中所述的方法进行交配得到的萝卜F1世代的8个个体,经自身授粉后所得。结果,分离出以夹持Rf基因的形态,在离两侧遗传距离分别为0.2~0.3cm的位置连锁的5个标记。表示各DNA标记和Rf基因的遗传距离的基因组图谱如图1所示。
实施例2:以基因组图谱为基础的重叠群制作和Rf基因的解析
基因组图谱制成后,必须将该位置对应的基因组DNA克隆化,将夹持Rf基因的DNA标记连起来。其中,由于DNA标记和Rf基因的距离是隔开的,通过将多个含有基因组DNA片段的无性系连接起来,制成复盖DNA标记间的Rf基因区域的重叠群。
含有基因组DNA片段的无性系的集合体称为基因组文库,我们制作了2种文库。作为DNA供给体,由制作F2群体时利用的与恢复系统的亲本同样的园红萝卜,按常规方法,用CTAB法(Mur ray,M.G和Thompson,W.F.(1980)Nucleic Acids Res.,8,4321)制备基因组DNA。用λDASHII载体(STRATAGENE公司生产)作为λ载体,制备平均长度为20kb,群体数1.5×105个的λ噬菌体文库。此外,采用作为粘粒载体的pWEB:TNC载体(EPICENTRE TECHNOLOGIES公司生产),制备平均长度为40kb,群体数5.5×104个的粘粒文库。
制备重叠群时,首先以位于Rf基因两侧的DNA标记为指标,从上述制备的λ噬菌体文库,采用噬斑杂交法,分离λ无性系。另外,从粘粒文库,用菌落杂交法分离出粘粒无性系,完成图1所示的复盖两端DNA标记间的重叠群。按照常规方法,测定构成部分重叠群的粘粒无性系NIT7/2和T03-2的碱基序列。
随后,用“Genscan”(三菱Space/Software公司生产),将对拟南芥的参数考虑在内,对上述构成部分重叠群的粘粒无性系NIT7/2和TO3-2的碱基序列进行解析,拟南芥与萝卜的基因组DNA序列很相似,最近其全部基因组序列的测定已完成。结果,发现认为表达Rf基因的启动子区、含有内含子的结构基因区域、以及终止子区域。此外,还得到了除去了内含子的翻译为蛋白质的形式的基因以及与该基因相应的氨基酸序列。
实施例3:基因组DNA区域的亚克隆
通过使用片段回收用琼脂糖(FMC公司生产)的凝胶电泳,将序列号1所述的由第1-8553位碱基序列构成的DNA的HpaI-SwaI片段(8546bp)与载体分离,该片段充分含有用“Gensca”推定的启动子至终止子区域。用凝胶分解酶(Epicentre Technologies公司生产)将含DNA片段的凝胶消化,回收DNA。再将所得的片段用限制酶BamHI切断后得到克隆片段。将这些DNA片段亚克隆到pGEM-T easy载体(Promega公司生产)中,得到cds6BT/pGEM-T easy。以下作详细说明。
在100μl的1×K限制酶缓冲液(200mM Tris-HCl(pH8.5),10mMMgCl2,1mM二硫苏糖醇,100mM KCl)中,加入1μg的NIT7/2粘粒DNA和10unit的限制酶HpaI(宝酒造公司生产),37℃下加温1小时。
加温后,加入10μl的3M醋酸钠(pH5.6)和250μl的乙醇,搅拌后,在-80℃下冷却5分钟,15000rpm、4℃下离心15分钟。除去上清,再缓慢加入1ml的70%乙醇,15000rpm、4℃下离心5分钟。除去上清液,用离心真空干燥机,将沉淀干燥5分钟。在回收的DNA沉淀中加入89μl无菌水使其溶解。
在溶解的DNA溶液中,加入10μl的10×H限制酶缓冲液(500mMTris-HCl(pH7.5),100mM MgCl2,10mM二硫苏糖醇,1000mM NaCl)、1μl的10unit/μl限制性酶SwaI(宝酒造公司生产),25℃下加温1小时。然后加入11μl的10×加样(loading)缓冲液(1%SDS,50%甘油,0.05%溴酚兰)。
将1.2g的低融点琼脂糖SeaPlaqueGTG琼脂糖(FMC公司生产)和150ml的1×TAE(40mM Tris-醋酸盐,1mM EDTA)缓冲液混和后,100℃下加热使琼脂糖溶解,边搅拌边冷却至45℃。在14×15cm的胶盘中,放置30mm宽×1mm厚的梳,然后将冷却的凝胶倒入盘中使其凝固。将加入了加样染料(loading Dye)的DNA倒入凝胶梳中,并在1×TAE、30V/30cm的电压下电泳18小时。
将电泳后的凝胶移入0.5μg/ml溴乙锭/1×TAE溶液中,染色30分钟。然后将凝胶放在用365nm的长波紫外线照射的透射仪上,用无菌刀切出所需的8546bp的片段。再将凝胶切成边长约1mm的小块,然后转移至预先称量的2ml微量管中,称量凝胶的重量。
对50mg重量的凝胶加入1μl的50×GELase缓冲液(2M Bis-Tris(pH6.0),2M NaCl)。将加入了凝胶的管放在加温至68℃的干热装置中,不时将管子翻转进行搅拌,加温10分钟,使凝胶完全溶解。再将该管移至45℃的干热装置中,不时将管子翻转进行搅拌,温育5分钟。在该管中按每200mg的凝胶重量加入1unit的GELase(EpicertreTechnologies公司生产),在45℃的干热装置中,将管子不时地翻转进行搅拌,温育30分钟。
根据凝胶的容量,加入1/3容量的10M醋酸铵(pH7.0)并搅拌,15000rpm下离心5分钟。将上清移至新的2ml微量管中,加入2倍上清容量的乙醇。将管搅拌后,在15000rpm、4℃下离心20分钟。除去上清,再缓慢加入1ml的70%乙醇,在15000rpm、4℃下离心5分钟。除去上清,用离心真空干燥机,将沉淀干燥5分钟。在沉淀中加入20μl的TE缓冲液(10mM Tris-HCl(pH8.0),1mM EDTA),使其完全溶解,回收DNA片段。
回收的20μl DNA溶液中,加入10μl的10×K限制酶缓冲液(200mM Tris-HCl(pH8.5),100mM MgCl2,10mM二硫苏糖醇,1000mMKCl)、68μl的dH2O、2μl的100unit/μl的限制酶BamHI(宝酒造公司生产),30℃下温育1小时。温育后,加入10μl的3M醋酸钠(pH5.6)和250μl的乙醇搅拌后,-80℃下冷却5分钟,15000rpm、4℃下离心5分钟。将上清除去,再缓慢加入1ml的70%乙醇,15000rpm、4℃下离心5分钟。除去上清液,用离心真空干燥机,使沉淀干燥5分钟。在回收的DNA沉淀中,加入灭菌水20μl使其溶解。加入55μl的灭菌水、10μl的10×PCR缓冲液(100mM Tris-HCl(pH8.3),500mM KCl)、6μl的25mM MgCl2、8μl的2.5mM dNTP混合物、1ml的5unit/μl的rTaq DNA聚合酶(宝酒造公司生产)并混合后,72℃下温育30分钟,在3’末端付加dATP。
将上述反应液移至超滤装置:Microcon-50(Millipore公司生产)中,5000rpm、4℃下离心20分钟。弃去收集器中的水,再加入100μl的灭菌水,5000rpm、4℃下离心20分钟。加入20μl的TE缓冲液(10mM Tris-HCl(pH8.0),1mM EDTA),取出过滤装置,反向安装于新的微量管中。3000rpm、4℃下离心5分钟,回收过滤装置上的DNA。
在按照上述方法得到的5μl纯化DNA中,混合1μl的50ng/μlpGEM-T easy载体(Promega公司生产)、6μl的DNA Ligation KitVer.2(宝酒造公司生产)的I溶液后,16℃下温育30分钟。
将上述反应液与100μl灭菌水一起移至超滤装置:Microcon-50(Millipore公司生产)中,5000rpm、4℃下离心20分钟。弃去收集器中的水,再加入100μl的灭菌水,5000rpm、4℃下离心20分钟。卸下超滤装置,反向安装在新的微量管上。
3000rpm、4℃下离心5分钟,回收超滤装置上的DNA。
回收的DNA连管一起置于冰上冷却。将30μl电穿孔用大肠杆菌DH10B(Gibco BRL公司生产)放入管内,轻轻混合。将和DNA混和后的大肠杆菌移至预先在冰上冷却的电穿孔用(电极间隔1mm)小杯(USAScientific Plastics公司生产)中。用Electro Cell Manipulator600(BTX公司生产),在1.25kv、129Ω、50μF的条件下进行电穿孔。然后将预热到37℃的500μl SOC培养基(Gibco BRL公司生产)立即加入小杯中。将大肠杆菌移至10ml的培养管中,37℃下振荡培养1小时。将培养的大肠杆菌涂布在添加了100μg/ml的氨苄青霉素(和光纯药公司生产)、200μg/ml的X-Gal(宝酒造公司生产)、1mM的IPTG(宝酒造公司生产)的LB琼脂培养基(1%Bacto-Trypton,0.5%Bacto-Yeast Extract,1%NaCl,1.5%Bacto-Agar)中,37℃下培养18小时以上。
将在琼脂培养基上出现的白色菌落,用添加了100μg/ml氨苄青霉素的2ml LB培养基,在37℃下培养18小时以上。由培养的大肠杆菌,按常规方法提取质粒DNA。用限制酶EcoRI(宝酒造公司生产)切断,确认目的片段克隆到质粒DNA中,从而得到cds6BT/pGEM-Teasy。
将按照上述方法得到的携带cds6BT/pGEM-T easy的每个大肠杆菌DH10B,用加入了100μg/ml氨苄青霉素的100ml LB培养基中,在37℃下培养18小时以上。采用Qiagen Midikit(QIAGEN公司生产),按照碱性SDS法进行纯化。
实施例4-1:植物性状转化用载体的制备(1)
将cds6BT/pGEM-Teasy用限制酶EcoRI切断后,通过使用片段回收用琼脂糖的凝胶电泳与载体分离,将回收的DNA片段克隆到植物性状转化用载体pKM424(在pKM424中加入CaMV35S启动子:GUS基因:NOS终止子的片段得到的载体为pLAN421(Plant Cell Reports 10(1991)286-2900)载体)的EcoRI位点,制成植物性状转化用载体cds6BT/pKM424。详细叙述如下。
在100μl的1×H限制酶缓冲液(50mM Tris-HCl(pH7.5),10mMMgCl2,1mM二硫苏糖醇,100mM NaCl)中,加入1μg的cds6BT/pGEM-Teasy DNA和10unit的限制酶EcoRI(宝酒造公司生产),37℃下温育1小时。
以下,按照与上述分离HpaI-SwaI片段同样的方法,从cds6BT/pGEM-T easy中分离回收含有cds6BT的EcoRI片段。
在100μl的1×H限制酶缓冲液(50mM Tris-HCl(pH7.5),10mMMgCl2,1mM二硫苏糖醇,100mM NaCl)中,加入1μg的植物性状转化用载体pKM424和10unit的限制酶EcoRI(宝酒造公司生产),37℃下温育1小时。温育后,加入100μl的1M Tris-HCl(pH8.0)和1 unit的细菌碱性磷酸酶(宝酒造公司生产)并混和后,50℃下温育1小时进行脱磷酸化。
加入用200μl的TE缓冲液(10mM Tris-HCl(pH8.0),1mM EDTA)饱和的苯酚·氯仿,激烈搅拌。15000rpm离心5分钟后,将上清移至新的管内。重复一次同样的操作,除去蛋白质。加入20μl的3M醋酸钠(pH5.6)和500μl的乙醇并搅拌后,在-80℃下冷却5分钟,15000rpm、4℃下离心15分钟。除去上清,再缓慢加入1ml的70%乙醇,15000rpm、4℃下离心5分钟。除去上清,用离心真空干燥机使沉淀干燥5分钟。在沉淀中加入100tl的TE缓冲液(10mM Tris-HCl(pH8.0),1mMEDTA),使沉淀完全溶解,浓度达到10ng/μl。
将10μl的纯化EcoRI片段、1μl的脱磷酸化pKM424载体、11μl的DAN Ligation Kit Ver.2(宝酒造公司生产)I溶液混和后,16℃下温育30分钟。
将上述反应液与100μl灭菌水一起移至超滤装置:Micorcon-50(Milipore公司生产)中,5000rpm、4℃下离心20分钟,弃去收集器的水,再加入100μl的灭菌水,5000rpm、4℃下离心20分钟。卸下超滤装置,反向安装在新的微量管上。
3000rpm、4℃下离心5分钟,回收超滤装置中的DNA。
将回收的DNA连管一起置于冰上冷却。将30μl的电穿孔用大肠杆菌DH10B(Gibco BRL公司生产)放入管内,轻轻混合。然后将与DNA混和后的大肠杆菌移至预先在冰上冷却的电穿孔用(电极间隔1mm)小杯(USA Scientific Plastics公司生产)中。用Electro CellManipulator 600(BTX公司生产),在1.25kv、129Ω、50μF的条件下进行电穿孔,然后立即将预热至37℃的500μl SOC培养基(GibcoBRL公司生产)加入小杯中。将大肠杆菌移至10ml的培养管中,37℃下振荡培养1小时。将培养的大肠杆菌涂布在添加了50μg/ml的壮观霉素(Sigma公司生产)的LB培养基(1%Bacto-Tryptone,0.5%Bacto-Yeast Extract,1%NaCl,1.5%Bacto-Agar)上,37℃下培养18小时以上。
将琼脂培养基上出现的菌落,用添加了50μg/ml壮观霉素的2mlLB培养基,在37℃下培养18小时以上。由培养的大肠杆菌,按常规方法提取质粒DNA。用限制酶HindIII(宝酒造公司生产)切断,证实BamHI位点至HpaI位点的区域被克隆到质粒DNA中,得到cds6BT/pKM424。
将携带cds6BT/pKM424的大肠杆菌DH10B,用添加了50μg/ml壮观霉素的250ml LB培养基,在37℃下培养18小时。用Qiagen MidiKit(Qiaqen公司),按照碱性SDS法进行纯化。
实施例4-2:植物性状转化用载体的制备(2)
将充分携带序列号1所述碱基序列的λ无性系CHI(参照图2,克隆片段长约17kb),用多克隆位点上存在的限制酶NotI(宝酒造公司生产)切断后,用片段回收用琼脂糖,通过凝胶电泳与载体分离,将回收的DNA片段克隆到植物性状转化用载体pBIGRZ2(Bioscience andIndustry 55(1997)37-39)的NotI位点,制成植物性状转化用载体CHI/pBIGRZ2。详细叙述如下。
在100μl的1×H限制酶缓冲液(50mM Tris-HCl(pH7.5),10mMMgCl2,1mM二硫苏糖醇,100mM NaCl,0.01%BSA,0.01%TritonX-100)中,加入1μg的λ无性系CHI DNA和10unit的限制酶NotI(宝酒造公司生产),37℃下温育1小时。以下,按照与上述分离HpaI-SwaI片段同样的方法,分离回收λ无性系CHI的NotI片段。
在100μl的1×H限制酶缓冲液(50mM Tris-HCl(pH7.5),10mMMgCl2,1mM二硫苏糖醇,100mM NaCl,0.01%BSA,0.01%TritonX-100)中,加入1μg的植物性状转化用的载体pBIGRZ2和10unit的限制酶NotI(宝酒造公司生产),37℃下温育1小时。温育后,加入100μl的Tris-HCl(pH8.0)和1unit的细菌碱性磷酸酶(宝酒造公司生产)并混和后,50℃下温育1小时,进行脱磷酸化。
加入200μl用TE缓冲液(10mM Tris-HCl(pH8.0),1mMEDTA)饱和的苯酚-氯仿,激烈搅拌。15000rpm下离心5分钟后,将上清移至新的管内。重复一次同样的操作,除去蛋白质。加入20μl的3M醋酸钠(pH5.6)和500μl的乙醇并搅拌后,在-80℃下冷却5分钟,15000rpm、4℃下离心15分钟。除去上清,再缓慢加入1ml的70%乙醇,15000rpm、4℃下离心5分钟。除去上清,用离心真空干燥机将沉淀干燥5分钟。在沉淀中加入100μl的TE缓冲液(10mM Tris-HCl(pH8.0),1mM EDTA)使其完全溶解,浓度为10ng/μl。
将10μl的纯化NotI片段、1μl的脱磷酸化pBI GRZ2载体、11μ1的DNA Ligation Kit Ver.2(宝酒造公司生产)I溶液混和后,16℃下温育30分钟。
将上述反应液与100μl灭菌水一起移至超滤装置:Microcon-50(Milipore公司生产)中,5000rpm、4℃下离心20分钟。弃去收集器中的水,再加入100μl的灭菌水,5000rpm、4℃下离心20分钟。卸下超滤装置,反向地安装在新的微量管上。
3000rpm、4℃下离心5分钟,回收超滤装置上的DNA。
将回收的DNA连同管子一起置于冰上浴却。管内加入30μl的电穿孔用大肠杆菌DH10B(Gibco BRL公司生产),轻轻混合。然后将与DNA混合后的大肠杆菌移至预先在冰上冷却的电穿孔用(电极间隔1mm)小杯(USA Scientific Plastics公司生产)中,用Electro CellManipulator 600(BTX公司生产)在1.25kv、129Ω、50μF的条件下进行电穿孔,然后立即将预热至37℃的500μl SOC培养基(GibcoBRL公司生产)加入小杯中。将大肠杆菌移至10ml的培养管中,37℃下振荡培养1小时。将大肠杆菌涂于添加了25μg/ml的卡那酶素(和光纯药公司生产)的LB琼脂培养基(1%Bacto-Tryptone,0.5%Bacto-Yeast Extract,1%NaCl,1.5%Bacto-Agar)上,37℃下培养18小时以上。
将琼脂培养基上出现的菌落,用添加了25μg/ml卡那霉素的2mlLB琼脂培养基,在37℃下培养18小时以上。从培养的大肠杆菌用常规方法提取质粒DNA。用限制酶HindIII(宝酒造公司生产)切断,确认在质粒DNA中克隆了目的片段,得到CHI/pBIGRZ2。
将携带CHI/pBIGRZ2的大肠杆菌DH10B在添加了25μg/ml卡那霉素的250ml LB培养基中37℃下培养18小时。用Qiagen Midi Kit(Qiagen公司生产)按照碱性SDS法进行纯化。
实施例5:植物性状转化用载体导入土壤杆菌
制备土壤杆菌的感受态细胞,分别将实施例4-1和4-2所得的cds6BT/pKM424载体及CHT/pBIGRZ载体导入所制备的植物性状转化用土壤杆菌EHA101中。详细说明如下。
用以下方法制备土壤杆菌EHA101的电穿孔用感受态细胞。将土壤杆菌EHA101在添加了50μg/ml卡那霉素(和光纯药公司生产)、25μg/ml氯霉素(和光纯药公司生产)的LB琼脂培养基上划线,28℃下培养24小时以上,得到单菌落。在50ml离心管中加入20ml添加了50μg/ml卡那霉素、25μg/ml氯霉素的LB培养基,接种直径约1mm的菌落,28℃下振荡培养40小时。40小时后,将离心管的盖子开闭一次,再同样地培养4小时。将培养液在1500×g、4℃下离心,收集菌体。弃去上清,在内加入40ml冰冷的灭菌10%甘油,使菌体再悬浮,1500×g、4℃下离心,收集菌体。重复上述操作2次。在所得菌体中,加入500μl冰冷的灭菌10%甘油,使菌体再悬浮。在每个灭菌的微量管中分别注入100μl的菌体,用液氮冻结后,置于-80℃下冷冻保存。
将土壤杆菌EHA101的电穿孔用感受态细胞放在冰水上溶化。在预先冷却的1.5ml管内加入40μl的电穿孔感受态细胞,分别加入100ng的cds6BT/pKM424或CHT/pBIGRZ的质粒DNA,轻轻混合。
将与DNA混和后的土壤杆菌移至预先在冰上冷却的电穿孔用(电极间隔1mm)小杯(USA Scientific Plastics公司生产)中,用ElectroCell Manipulator 600(BTX公司生产),在1.44kv、129Ω、50μF的条件下进行电穿孔,然后立即将预热至30℃的500μl SOC培养基(GibcoBRL公司生产)加入小杯中。将土壤杆菌移至10ml的培养管中,30℃下振荡培养1小时。
对于导入了cds6BT/pKM424载体的土壤杆菌,在添加了50μg/ml卡那霉素(和光纯药公司生产)、25μg/ml氯霉素(和光纯药公司生产)、50μg/ml壮观霉素(Sigma公司生产)、2.5μg/ml四环素(Sigma公司生产)的LB琼脂培养基(1%Bacto-Tryptone,0.55%Bacto-YeastExtract,1%NaCl,1.5%Bacto-Agar)上涂布培养后的土壤杆菌,28℃下培养24小时以上。
对于导入CHI/pBIGRZ2载体的土壤杆菌,在添加了50μg/ml卡那霉素(和光纯药公司生产)、25μg/ml氯霉素(和光纯药公司生产)、30μg/ml潮霉素(Sigma公司生产)的LB琼脂培养基上涂布培养后的土壤杆菌,28℃下培养24小时以上。
将琼脂培养基上出现的菌落,在添加了适合于每种载体的上述抗生素的2ml LB培养基上,30℃下培养24小时以上。从培养的土壤杆菌用常规方法提取质粒DNA。用限制酶HindIII(宝酒造公司生产)切断,确认cds 6BT/pKM424载体或CHT/pBIGRZ2载体已导入土壤杆菌中。对于确认的无性系,在培养24小时后的培养液中加入等量的灭菌80%甘油,混和后在-80℃下保存,用于油菜籽的性状转化。
实施例6:油菜籽性状转化体的制备
油菜籽的性状转化如下所述进行。用10%的次氯酸溶液对含有来源于萝卜的cms原因基因orf125的CMS油菜籽(SW18)的种子进行灭菌处理,用不含激素的MS培养基(T.Murashige and F.Skoog Physiol.Plant.15:485,1962)使其发芽。从发芽后7天-14天的幼嫩植物仅切出胚轴部分,再切成3-5mm长,用MS培养基(Sigma公司M5519)+蔗糖3%+2.4-D1mg/l、琼脂糖(Sigma公司,typeI)0.4%,在23℃下前培养12-16小时。这时,为了进行保育培养,与来源于烟草的细胞系统BY-2进行共存培养。
另一方面,将含有CHI/pBIGRZ2的土壤杆菌在28℃下培养8-48小时,使其生长至OD600=1.0左右。土壤杆菌的菌体悬浮于无激素的液体MS培养基中。使切碎的胚轴与该土壤杆菌溶液混合,约共存培养20分钟。共培养后,用滤纸将土壤杆菌除去,得到的胚轴在MS基本培养基+维生素B5(Sigma公司,M0404)+蔗糖3%+2,4-D1mg/L的培养基中培养2天,使其感染。感染后,将胚轴移植至在MS基本培养基+维生素B5+3%蔗糖+1mg/L 2,4-D的培养基中以500mg/L的浓度添加了抗生素羧苄青霉素(Pfeizer公司,zeopen或GIBCO-BRL公司:羧苄青霉素二钠盐)的除菌培养基中,除去土壤杆菌。
用上述除菌培养基培养5天至1周后,将胚轴用除MS基本培养基+维生素B5+1%蔗糖+3mg/L苯甲氨基嘌呤+500mg/L的羧苄青霉素以外,还添加了5mg/L硝酸银、用于筛选的5-30mg/L卡那霉素(Nakalaitesk公司,卡那霉素硫酸盐)的培养基培养14天-21天。这时,有时会出现绿色的愈伤组织,应立即接种转移至下一步的培养基中。
作为下一步的培养基,例如是含有MS培养基(Sigma公司,M5519)+1%蔗糖+3mg/L苯甲氨基嘌呤+1mg/L的玉米素+500mg/L的羧苄青霉素+5-30mg/L卡那霉素的筛选培养基。将由切口形成了愈伤组织的胚轴移植至上述培养基上,23℃下培养3周,此后至绿色的愈伤组织出现为止,每3周反复进行3-5次移植。
发现绿色的愈伤组织后立即从胚轴切下,移至同样组成的培养基中。以后,只将绿色部分切下并进行培育,形成非正常芽的几率为1-30%。非正常芽随后移至B5基本培养基(Sigma公司,G5893)+3%蔗糖+1mg/L苯甲氨基嘌呤上培育后,在含有MS培养基(Sigma公司,M5519)+3%蔗糖+0.1mg/L萘乙酸+0.01mg/L苯甲氨基嘌呤的培养基上使其发根。
实施例7:性状转化体的分析(检测导入DNA)
从实施例6所得形成了花蕾的性状转化体的1个个体取1片叶子,用Qiagen公司的DNA分离试剂盒(DNeasy plant mini)分离DNA。
用PCR法对导入DNA片段的3个部位(a,b,c部位)进行检测(结果如图3所示)。部位a是序列号1的碱基序列中3186bp至3753bp的568bp,正向引物使用“5’-GAAGCAAAAAAGAAAACGAGCAGAG-3’”(序列号4)、反向引物使用“5’-CCAAAAATCCGAAATCCGAATAGAC-3’”(序列号5)。部位b是序列号1的碱基序列中4869bp至5112bp的244bp,正向引物使用“5’-CTCGGCTCTGGGTTTAGTGA-3’”(序列号6)、反向引物使用“5’-TCCACAAACCCTAGCCAACA-3’”(序列号7)。部位c是序列号1的碱基序列中7766bp至8250bp的485bp,正向引物使用“5’-GCTTATGCTTCTCTGGTTCGCCTC-3’”(序列号8)、反向引物使用“5’-CTCAGTTTTCGTCACCTTACACAATGC-3’”(序列号9)。
在1μl的性状转化体DNA溶液(50ng/μl)中,加入12.1μl的灭菌水、2μl的10×PCR缓冲液(100Mm Tris-HCl(pH8.3),500mMKCl)、1.2μl的25mM MgCl2、1.6μl的2.5mM dNTP混合物、1μl各部位的10μM正向引物溶液、1μl各部位的10μM反向引物溶液、0.1μl的5unit/μl的rTaq DNA聚合酶(宝酒造公司生产),混和后,进行重复94℃40秒、55℃30秒、72℃1分钟的循环35次,扩增DNA。热循环仪使用UNOII(Biometra公司生产)。反应结束后,通过4%Nusive3:1 Agarose(FMC公司生产)/1×TBE(89mM Tris-硼酸盐,89mM硼酸,2mM EDTA)缓冲液的凝胶电泳,确认扩增产物(参照图3)。
由结果可知,部位a未导入该性状转化油菜籽中。其余2个部位(b,c部位)得到与阳性对照同样大小的扩增产物,确认该DNA巳整合到性状转化油菜籽中。
实施例8:性状转化体的分析(确认cms原因蛋白质ORF125蓄积量的减少)
取与实施例7同样个体的1个花蕾,用Western印迹法分析CMS蛋白质ORF125蓄积量的减少。结果如图4所示。
(1)由性状转化个体提取蛋白质
关于蛋白质的提取法、Western印迹法,按照N.Koizuka等(TheorAppl Genet(2000)100:949-955)的方法进行。
具体而言,将所得性状转化油菜籽的花蕾(长1mm)1个与100μ1冰冷的蛋白质提取缓冲液(50mM Tris-HCl(pH7.5)、2%(W/V)SDS)放入冰冷的乳钵中,用杵研磨。将此溶液移至微量离心管中,15000rpm、4℃下离心15分钟。离心后,将上清液移至新的微量离心管中,100℃下加热5分钟。再次在15000rpm、4℃下离心15分钟,将上清液移至新的微量离心管中,制得SDS可溶性蛋白质溶液。用利用Bradford法的蛋白质定量试剂盒(Bio-rad公司生产)测定SDS可溶性蛋白质溶液的浓度。与此平行,由细胞质雄性不育系统的油菜籽和可育性恢复系统的油菜籽的花蕾,也同样地提取SDS可溶性蛋白质溶液,测定其浓度。
(2)用SDS-PAGE法分离蛋白质并转移至PVDF膜:Western印迹
用7×10cm矩形的10%的SDS聚丙烯酰胺凝胶,每1泳道加载15μg的SDS可溶性蛋白质,通过电泳进行分离。此外,为了比较ORF125蛋白质的蓄积量,也同样加载细胞质雄性不育系统的油菜籽的稀释系列,进行分离。电泳的条件为10mA下1小时、15mA下1小时。电泳后用半干印迹装置(日本泳动公司生产),将聚丙烯酰胺凝胶中的蛋白质在100mA、1小时的条件下转移到PVDF膜(Milipore公司生产)上。
(3)用抗体检测蛋白质:Western印迹
将转移了蛋白质的PVDF膜分成上、下2张,转移至10ml印迹溶液(20mM Tris-HCl(pH7.5)、500mM NaCl、0.05%Tween20、5%脱脂牛奶)中,振荡1小时进行印迹。上面的PVDF膜,检测作为线粒体蛋白质量的对照的ATPA,下面的PVDF膜,检测细胞质雄性不育相关蛋白质ORF125。将PVDF膜移至10ml的第一抗体反应液(在10ml封闭溶液中加入用于检测ATPA的100μl ATPA单克隆抗体,加入用于检测ORF125的2μl抗ORF125的兔抗血清(M.Iwabuchi等,PlantMolecular Biology(1999)39:183-188))中,振动18小时。将PVDF膜移入100ml的TTBS(20mM Tris-HCl(pH7.5)、500mM NaCl、0.05% Tween20)中,振动10分钟。重复该操作3次,将过剩的第一抗体洗去。将PVDF膜移至10ml的第二抗体反应液(在10ml的封闭溶液中,加入用于检测ATPA的10μl过氧化物酶标记的羊抗小鼠IgG(Amersham公司生产)、用于检测ORF125的10μl碱性磷酸酶标记的羊抗兔IgG(Bio-red公司生产)(M.Iwabuchi等,Plant MolecularBiology(1999)39:183-188))中,分别振荡1小时。将PVDF膜移至100ml的TTBS(20mM Tris-HCl(pH7.5)、500mM NaCl、0.05%Tween20)中,振荡10分钟。该操作重复3次,洗去过剩的第二抗体。对于ATPA的检测,采用针对过氧化物酶的化学发光系统“ECL+”(Amersham公司生产),曝光5秒钟,进行检测。对于ORF125的检测,采用碱性磷酸酶的发色基质BCIP/NBT(MOSS Inc.公司生产),发色5分钟,进行检测。
结果表明,2种系统的细胞质雄性不育油菜籽的花蕾、可育性恢复油菜籽、细胞质雄性不育系统中插入该DNA得到的性状转化体油菜籽的花蕾中,对照ATPA的蓄积量几乎无变化,但性状转化体油菜籽的ORF125蛋白质蓄积量明显减少。该减少的程度与在细胞质雄性不育系统中通过交配导入可育性恢复基因得到的可育性恢复系统同等(图4及M.Iwabuchi等,Plant Molecular Biology(1999)39:183-188))。此外,ORF125蛋白质蓄积量的减少程度与稀释系列相比,可育性恢复油菜籽为1/8-1/16;性状转化油菜籽为约1/8。如以上所述,油菜籽的可育性恢复和ORF125蛋白质蓄积量的减少密切相关,具有同义的关系,因此,可以证明该DNA序列具有减少线粒体内ORF125蛋白质蓄积量的功能,是携带可育性恢复基因的基因组DNA序列。
进一步从开花体取出花粉在显微镜下观察,证实形成了正常的花粉(图5)。
实施例9:cDNA的分离
从制作基因图谱时所用的F2群体中,选择含有纯合Rf1基因的花粉可育性F2个体作为RNA供体,由花蕾纯化mRNA后,合成cDNA,然后用5’-RACE或3’-RACE法进行cDNA的分离。
(mRNA的纯化)
由含有纯合Rf1基因的花粉可育性F2个体的花蕾,用常规的异硫氰酸胍法,采用RNeasy试剂盒(Qiagen公司生产)提取全长RNA。由全长RNA采用利用寡脱氧胸苷酸(Origo(dT))纤维素柱的“mRNA纯化试剂盒”(Amersham Pharmacia公司)纯化PolyA+RNA,得到mRNA。
(用5’-RACE和3’-RACE法分离cDNA)
用1μg纯化的mRNA,采用“Marathon RACE system 5’RACE 3’RACE”试剂盒,按照5’-RACE和3’-RACE法分离cDNA。作为基因特异性引物,在5’-RACE中,使用5’-GATTCCTTTCTCTTGCATTTCAG-3’(序列号10);在3’-RACE中,使用5’-ATCTCGTCCTTTACCTTCTGTGG-3’(序列号11)。确认所得无性系的碱基序列后,得到cDNA序列(序列号2)。
实施例10:cDNA向氨基酸序列的转换及其分析
(1)cDNA向氨基酸序列的转换采用通常的遗传密码子,并使用基因分析软件“Genetyx-SV”(软件开发有限公司)进行,得到序列号3所示的氨基酸序列。PPR基序的分析用Protein families database ofalignment and HMNs(以下略称为Pfam,http//:www.sanger.ac.uk/Software/Pfam/search.shtml)中的程序进行。分析的结果,发现序列号1所示的可育性恢复基因的翻译产物是含有16个PPR基序的蛋白质。另外,PPR基序有3个PPR簇。该3个蔟为:
①PPR簇#1:由N末端起第1个PPR基序至第5个基序的连续175个氨基酸残基组成的PPR簇;
②PPR簇#2:由N末端起第6个PPR基序至第12个基序的连续245个氨基酸残基组成的PPR簇;以及
③PPR簇#3:由N末端起第13个PPR基序至第16个基序的连续140个氨基酸残基组成的PPR簇。
实施例11:本发明蛋白质的解析
进行试验确认,通过造成Kosena细胞质雄性不育的原因蛋白质ORF125的基因与转录产物(mRNA)结合是否对大肠杆菌中的翻译起抑制作用。
将序列号2所示的可育性恢复基因导入大肠杆菌表达载体pQE-80L(Qiagen公司)的BamHI-SphI部位,构建成N末端添加6个组氨酸残基(6×His)的表达载体(pQEB1/cds6)。另外,用pSTV29(宝酒造)载体作为模板,采用导入BamHI位点的引物:CGGGATCCGCTCACAATT(序列号12)、M13引物(宝酒造公司)进行DNA扩增。DNA的扩增采用Takara LA PCR试剂盒(宝酒造公司)。将扩增的DNA用限制酶BamHI、EcoRI(宝酒造公司)切断后,用Suprec-02(宝酒造公司)纯化。为了合成在orf125基因的5’-UTR区域和orf125的25个氨基酸的两端含有BamHI和EcoRI位点的DNA片段,用2根引物,按照藤本的方法(植物的PCR实验方案:合成DNA的实际PP84-87(秀润公司))进行PCR。引物采用下述两种引物:
125-5’BamHI:
GCGGATCCCAATTTCATTCTGCATCACTCTCCCTGTCGTTATCGACCTCGCAAGGTTTTTGAAACGGCCGAAACGGGAAGTGACAATACCGCTTTTCTTC(序列号13)
125-5’EcoRI:
GGAATTCACTAACTTTACATTCAGTAGGAGTGAGATTATGACAAAAAGTGGACAATTTTTCGAAAAAGGTAATCATGCATTTATATGCTGAAGAAAAGCG(序列号14)
扩增的DNA用限制酶BamHI、EcoRI(宝酒造公司)切断后,用Suprec-02(宝酒造公司)纯化。纯化的DNA用TaKaRa Ligation试剂盒(宝酒造公司)连接,性状转化大肠杆菌DH10B(Gibco BRL公司生产)。在添加了50μg/ml的氯霉素(Sigma公司)的LB琼脂培养基(1%Bacto-Tryptone,0.5%Bacto-Yeast Extract,1%NaCl,1.5%Bacto-Agar,0.1mM IPTG,20μg/ml X-Gal)上,37℃下培养18小时以上。用常规方法从浅兰色的菌落提取质粒,确定其碱基序列。这样,构建在EcoRI位点至1acZ基因的转录起始点之间导入了含有orf125基因的5’-UTR区域和orf125的25个氨基酸的174bp(图6所述碱基序列中第7-180位)的载体(pSTV125-5’#LA6)。此外,同时还获得了含有在相应于该174bp的部分产生数个突变点的片段(图6所述碱基序列中的第7-183位)的载体(pSTV125-5’#LA12)。
将该载体pSTV125-5’#LA6及pSTV125-5’#LA12分别导入大肠杆菌10B(Gibco BRL公司)中,用在LB培养基中添加500μg/ml氯霉素(和光纯药公司)、200μMIPTG(和光纯药公司),40μg/ml X-Gal(宝酒造公司)得到的琼脂培养基,在37℃下培养过夜,使菌落生长,呈现浅兰色。亦即,确认导入了任何一种载体的大肠杆菌中都能表达LacZ基因。
此外,为了将上述pSTV125-5’载体和pQEB1/cds6载体一起导入与上述同样的大肠杆菌中,采用在上述培养基中加入50μg/ml氨苄青霉素得到的培养基进行培养时,在与pSTV125-5’#LA6共存的场合,产生白色的菌落;与导入片段部位有变异的pSTV125-5’#LA12共存的场合,产生浅兰色的菌落,兰色的深浅与#LA12单独的场合没有变化。此外,对于导入的这些载体是否从大肠杆菌脱落,可以将每个菌落培养后,用常规方法提取载体进行确认。
根据以上结果可以认为,通过pQEB1/cds6载体在大肠杆菌内表达的蛋白质与pSTV125-5’#LA6的mRNA结合的结果,抑制了LacZ基因的表达,形成了白色菌落。此外,与pSTV125-5’#LA12共存的场合,由于导入片段部位有变异,来源于pQEB1/cds6的蛋白质不能与mRNA结合,结果LacZ基因表达,形成兰色菌落。
由此可以推测,具有序列号3所述氨基酸序列的蛋白质与orf125的mRNA,更具体是至少与orf125-5’UTR区域和ORF125的25个氨基酸的编码区域的转录产物有关,抑制ORF125蛋白质的表达。
亦即,可以推测本发明基因的翻译产物在转运至线粒体后,在该线粒体内与雄性不育基因结合,抑制其翻译,减少造成细胞质雄性不育的蛋白质的蓄积量,从而使细胞质雄性不育恢复至可育。
实施例12:Kosena油菜籽可育性恢复基因的分离
由通过细胞融合导入Kosena萝卜的可育性恢复基因得到的油菜籽系统(以下称为Kosena油菜籽),用PCR法得到可育性恢复基因的基因组序列。用Qiage公司的DNA分离试剂盒(DNeasy plant mini),从0.1g Kosena油菜籽的叶提取DNA。为了进行DNA扩增,将序列号1的碱基序列中1027bp至1059bp的序列5’-ACATAAAAATCACTAGATACTTGACATGGAGGC-3’(序列号30)设定为正向引物,序列号1的碱基序列中7675bp至7651bp的序列5’-AAGAGGAGGAAGATGGCATCACAGC-3’(序列号31)设定为反向引物。
在10μl的Kosena油菜籽DNA溶液(50ng/μl)中,加入49μl的灭菌水、10μl的10×LA PCR缓冲液(宝酒造公司生产)、10μl的25mM MgCl2、16μl的2.5mM dNTP混合物、2μl的10μM正向引物溶液、2μl的10μM反向引物溶液、1μl的5unit/μl的TaKaRa LATAq(宝酒造公司生产)并混和后,反复进行98℃20秒、68℃15分的循环30次,扩增DNA。热循环仪使用UNOII(Biometra公司生产)。反应结束后,用超滤过滤器Microcon-PCR(Milipore公司生产)纯化约6kb的扩增产物。用纯化的扩增产物作为模板,用常规方法确定相当于序列号1中第4280-7585位部分的3306bp碱基序列(序列号15)。所得Kosena油菜籽的基因组碱基序列与园红萝卜的序列比较,3306bp中只发现7bp的DNA碱基发生置换,由此可知二者具有高度的同源性。
此外,用RT-PCR法获得Kosena油菜籽的可育性恢复基因的3’部分cDNA序列,确认内含子的剪接方式与园红萝卜的相同。由Kosena油菜籽的花蕾按照常规方法AGPC(Acid Guanidium-Phenol-Chloroform)法(秀润社细胞工学分册生物实验实例②基因分析的基础P161-166),提取全长RNA。由1μg的全长RNA,用SUPERSCRIPTII RNaseH-Reverse Transcriptase(Invitrogen公司生产),合成cDNA。可育性恢复基因3’部分特异性正向引物使用5’-TGGAGTAAAGAGGAACTAAAAAGGGC-3’(序列号32),可育性恢复基因3’部分特异性反向引物使用5’-CAGACAATAGACGCATAAAAGGC-3’(序列号33)。在1μl的Kosena油菜籽cDNA溶液中加入14.9μl的灭菌水、2.5μl的10×PCR缓冲液(宝酒造公司生产)、1.5μl的25mM MgCl2、2μl的2.5mM dNTP混合物、1.5μl的10μM正向引物溶液、1.5μl的10μM反向引物溶液、0.1μl的5unit/μl的TaKaRa Taq(宝酒造公司生产)并混和后,反复进行94℃40秒、60℃30秒、72℃2分的循环35次,扩增DNA。热循环仪使用UNOII(Biometra公司生产)。在3μl的扩增产物中,加入1μl pGEM-Teasy载体(Promega公司生产)和5μl的2×连接缓冲液(Promega公司生产)、1μl的T4 DNA连接酶(Promega公司生产),室温下放置1小时,使其与载体结合。用该载体性状转化大肠杆菌DH5α(Gibco BRL公司生产),得到无性系。用常规的方法测定所得无性系的碱基序列,可以确认Kosena油菜籽的cDNA中其内含子的剪接方式与园红萝卜相同。亦即,通过上述基因组序列的比较发现的7bp的碱基置换存在于序列号1的5444bp-5814bp中,对剪接没有影响。
由以上可知,Kosena油菜籽的可育性恢复基因以与园红萝卜同样的形式表达mRNA。只编码翻译区域的cDNA序列如序列号16所示。此外,由该cDNA序列得到了氨基酸序列(序列号17)。
实施例13:萝卜野生种Raphanus raphanistrum(以下称为R.raphanistrum)可育性恢复基因部分序列的分离
由cDNA分离R.raphanistrum的可育性恢复基因的部分序列
(mRNA的纯化)
由R.raphanistrum的花蕾按照常规方法AGPC(AcidGuanidium-Phenol-Chlorroform)法(秀润社细胞工学分册生物实验实例②基因分析的基础P161-166),提取全长RNA。由全长RNA采用利用寡脱氧胸苷酸纤维素柱的“mRNA纯化试剂盒”(AmershamPharmacia公司)纯化PolyA+RNA,得到mRNA。
(cDNA的部分序列分离)
由1μg纯化的mRNA,采用“Marathon RACE system5’RACE3’RACE”试剂盒(Clonetech公司生产)合成cDNA。
可育性恢复基因特异性正向引物使用5’-GATTCCTTTCTCTTGCATTTCAG-3’(序列号34)、可育性恢复基因特异性反向引物使用5’-ATCTCGTCCTTTACCTTCTGTGG-3’(序列号35)。
在1μl的R.raphanistrum cDNA溶液中加入14.4μl的灭菌水、2.5μl的10×Pyrobest PCR缓冲液(宝酒造公司生产)、2μl的2.5mM dNTP混合物、2.5μl的10μM正向引物溶液、2.5μl的10μM反向引物溶液、0.1μl的5unit/μl的Pyrobest DNA聚合酶(宝酒造公司生产)并混和后,反复进行98℃5秒、55℃ 30秒、72℃1分30秒的循环30次,扩增DNA。热循环仪使用UNOII(Biometra公司生产)。在扩增的DNA溶液中,加入0.1μl的5unit/μl TaKaRa Taq(宝酒造公司生产)混和后,72℃下加温处理10分钟,在DNA的3’末端添加腺嘌呤核苷酸。在3μl的扩增产物中加入1μl pGEM-Teasy载体(Promega公司生产)和5μl的2×连接缓冲液(Promega公司生产)、1μl的T4 DNA连接酶(Promega公司生产),室温下放置1小时,使其与载体结合。用该载体性状转化大肠杆菌DH5α(Gibco BRL公司生产),得到无性系。用常规的方法测定所得无性系的碱基序列后,得到cDNA部分序列(序列号20)。进一步由cDNA序列得到氨基酸序列(序列号21)。
实施例14:Ogura油菜籽可育性恢复基因的分离
由通过交配导入Ogura萝卜的可育性恢复基因得到的油菜籽系统(以下称为Ogura油菜籽),用5’-RACE法和3’-RACE法分离可育性恢复基因的cDNA序列。
(mRNA的纯化)
由Ogura油菜籽的花蕾按照常规方法AGPC(Acid Guanidium-Phenol-Chloroform)法(秀润社细胞工学分册生物实验实例②基因分析的基础161-166),提取全长RNA。由全长RNA采用利用寡脱氧胸苷酸纤维素柱的“mRNA纯化试剂盒”(Amersham Pharmacia公司)纯化PolyA+RNA,得到mRNA。
(cDNA部分序列的分离)
用1μg纯化的mRNA,采用“Marathon RACE system 5’RACE3’RACE”试剂盒(Clontech公司生产)合成cDNA。可育性恢复基因特异性正向引物使用5’-GATCCATGCATTTGTCAAGG-3’(序列号36),可育性恢复基因特异性反向引物使用5’-CATTTGTGTAGCCTCATCTAGG-3’(序列号37)。
在1μl的Ogura油菜籽cDNA溶液中加入14.4μl的灭菌水、2.5μl的10×Pyrobest PCR缓冲液(宝酒造公司生产)、2μl的2.5mMdNTP混合物、2.5μl的10μM正向引物溶液、2.5μl的10μM反向引物溶液、0.1μl的5unit/μl的Pyrobest DNA聚合酶(宝酒造公司生产)并混和后,反复进行98℃5秒、55℃30秒、72℃1分30秒的循环30次,扩增DNA。热循环仪使用UNOII(Biometra公司生产)。在扩增的DNA溶液中,加入0.1μl的5unit/μl TaKaRa Taq混和后,72℃下加温处理10分钟,在DNA的3’末端添加腺嘌呤核苷酸。在3μl的扩增产物中加入1μl pGEM-Teasy载体(Promega公司生产)和5μl的2×连接缓冲液(Promega公司生产)、1μl的T4 DNA连接酶(Promega公司生产),室温下放置1小时,使其与载体结合。用该载体性状转化大肠杆菌DH5α(Gibco BRL公司生产),得到无性系。用常规的方法测定所得无性系的碱基序列后,得到4种cDNA部分序列。根据所得的4种序列信息,在4种序列的共同部分设定5’-RACE和3’-RACE用引物,分别进行cDNA的分离。
(通过5’-RACE和3’-RACE分离cDNA)
与上述同样合成cDNA,采用“Mara thon RACE system 5’RACE3’RACE”试剂盒(Clontech公司生产)进行5’-RACE和3’-RACE,分离cDNA。作为基因特异性引物,在5’-RACE中,使用5’-CATTTGTGTAGCCTCATCTAGG-3’(序列号37)和5’-GTCCGGAGAGCAGCCCTTGGTAG-3’(序列号38),在3’-RACE中,使用5’-TCATCGTATAATTCTTCAGCCTC-3’(序列号39)。
在5’-RACE中,进行2次PCR得到DNA。在2μl的250倍稀释的Ogura油菜籽cDNA溶液中,加入8.6μl的灭菌水、2μl的10×LA PCR缓冲液(宝酒造公司生产)、2μl的25mM MgCl2、3.2μl的2.5mM dNTP混合物、1μl的10μM序列号9907F的引物溶液、1μl的10μM衔接头引物溶液(Marathon RACE system 5’RACE 3’RACE’试剂盒,Clontech公司生产)、0.2μl的5unit/μl的TaKaRa LA Taq(宝酒造公司生产)并混和后,反复进行98℃5秒、72℃3分的循环5次;98℃5秒、70℃3分3的循环5次;98℃5秒、68℃3分的循环25次,扩增DNA。将所得的DNA溶液稀释100倍,向其中的2μl中,加入8.6μl的灭菌水、2μl的10×LA PCR缓冲液(宝酒造公司生产)、2μl的25mM MgCl2、3.2μl的2.5mM dNTP混合物、1μl的10μM序列号5’ogu-1的引物溶液、1μl的10μM衔接头引物溶液(MarathonRACE system 5’RACE 3’RACE’试剂盒,Clontech公司生产)、0.2μl的5unit/μl的TaKaRa LA Taq(宝酒造公司生产)并混和后,反复进行98℃5秒、72℃3分的循环5次;98℃5秒、70℃3分的循环5次;98℃5秒、68℃3分的循环25次,扩增DNA。热循环仪使用UNOII(Biometra公司生产)。
3’-RACE中,在2μl的50倍稀释的Ogura油菜籽cDNA溶液中,加入8.6μl的灭菌水、2μl的10×LAPCR缓冲液(宝酒造公司生产)、2μl的25mM MgCl2、3.2μl的2.5mM dNTP混合物、1μl的10μM序列号3’ogu-1的引物溶液、1μl的10μM衔接头引物溶液(Marathon RACE system 5’RACE 3’RACE’试剂盒,Clontech公司生产)、0.2μl的5unit/μl的TaKaRa LA Taq(宝酒造公司生产),混和后,反复进行98℃5秒、68℃30秒、72℃2分的循环35次,扩增DNA。
在3μl的扩增产物中加入1μl pGEM-Teasy载体(Promega公司生产)和5μl的2×连接缓冲液(Promega公司生产)、1μl的T4 DNA连接酶(Promega公司生产),室温下放置1小时,使其与载体结合。用该载体性状转化大肠杆菌DH5α(Gibco BRL公司生产),得到无性系。测定所得无性系的碱基序列后,得到与上述4种cDNA部分序列对应的5’-RACE序列和3’-RACE序列,将各序列结合起来,即得到全长cDNA序列。其中与园红萝卜的cDNA序列同源性最高的序列为Kosena油菜籽的可育性恢复基因(序列号18)。进一步由cDNA得到氨基酸序列(序列号19)。
实施例15:可育性恢复基因的解析
对由上述方法所得的各可育性恢复基因,用基因分析软件“MacVector 6.5”(Oxford Molecular Ltd.)分析cDNA序列及氨基酸序列的同源性,用英国的Sanger研究所的Protein families database ofaligments and HMNs对其基序进行分析。
本发明的来源于园红萝卜、Kosena油菜籽和Ogura油菜籽的Rf基因都有16个PPR基序,这些PPR基序群从氨基末端一侧起分割为5个、7个及4个基序的3个模序,位于从氨基末端侧起第2个PPR基序的第4个氨基酸是天冬酰胺。此外,对于来源于Raphanusraphanistrum的部分片段,对其相当于上述序列的部分(序列号26的第94-264位)首次进行了分析,其含有相当于氨基末端的第1至第6的PPR基序的部分,PPR基序群和位于氨基末端侧起第2个PPR基序的第4个氨基酸也具有上述特征。
此外,由园红萝卜、Kosena油菜籽、Ogura油菜籽得到的3种可育性恢复基因与R.raphanistrum的可育性恢复基因部分序列的分析结果得到的本发明蛋白质(序列号26)及其编码基因(序列号22)中,园红萝卜和Kosena油菜籽的同源性非常高,氨基酸序列表现出高达99.6%的值(仅发现3个位置的氨基酸不同);碱基序列表现出高达99.7%的值,因此特别优选具有序列号29所述氨基酸序列的蛋白质及其编码基因(序列号25)。
另一方面,比较Ogura油菜籽与园红萝卜、Ogura油菜籽与Kosena油菜籽,都显示出高的同源性,其氨基酸序列的同源性如下,Ogura油菜籽与园红萝卜比较为92.0%,Ogura油菜籽与Kosena油菜籽比较为91.6%,碱基序列的同源性均为约95%,这些值都低于园红萝卜与Kosena油菜籽间的同源性。
工业实用性
根据本发明,分离了Rf基因,特别是来源于萝卜的Rf1基因,并鉴定了其结构。此外,根据本发明,利用分离的Rf基因,可以提供建立油菜籽恢复系统的方法。
序列表
<110>三菱化学公司
<120>参与由细胞质雄性不育恢复至可育的蛋白质及编码该蛋白质的基因
<130>A21220A
<160>39
<210>1
<211>8553
<212>DNA
<213>萝卜
<400>1
atttaaattt tatacttaat atgtatttaa actctccaat gcaataaggg atataaacaa 60
aaggtattca tagatgttat gtattcgtac accgatgtat tcgtatacct taaatatatg 120
tatacttatg tatacatata cttgtgtatt cgtacacctt aagtattcga tgggttatgt 180
tggtattcgt atattttatg tatttgtaca ccttatgtat acttatgtat atgtacacct 240
tatgtatttg tacatcttaa gtattagatg agttatgttg atattcgtac accttatgta 300
ttcgtacacc ttctgtatac cttaggtatt cgtacacctt aggtatttgt acacctaagg 360
tattcgtaca ccttatgtat acttatgtat acgtacacct tatatattcg aacaccttag 420
atattcgtac atcttatgta tacgtatact tatttcttga gttatagtga attagattgt 480
attaaacgtt agacataggg ttccggattt atccaagggt tccagattgt ttcagattct 540
ggatttaccc aatggttctg gatttaccca agggttccgg atttaggatt caaggtttag 600
agtttaggat tttaggttta gtgttttgtt gatgattttt aatatttaag ataaatgtag 660
acaaatttgt tcttcctacc attttgacaa aaaatgaaag atctatgtag gtttccaagt 720
ttattaaatt tacccagatt tatgaaaatt atccataaat ttatataatt ttatgaataa 780
tttatcattt atttgggtaa atttcataaa tatgaaagtt tcttttatgg gtcaaaatgt 840
ataatttatt cggattctgg atttacccaa gggttccgga tttacccaag gattccagat 900
ttaggattca tggtttagag tttaggagtt tatgtttagt gttttgttga tgattttaaa 960
tatttaagat aagaagttta tgcgagagaa tttggtcaaa ctcaggttga gtcttaactt 1020
cttaagacat aaaaatcact agatacttga catggaggca ccaaattatc ctatattttt 1080
tggacttaat cttggtgtac ccctagagta aaccttaagg ttcaccaacc aatagaaatc 1140
actcatttca cagttgatat cttttaaaaa agtaaacaaa atattgtcga gttatattac 1200
atttttaaaa taaaaatatt aaaaaataaa aataataata tatgcaaaaa aaaagatttt 1260
ttaaaaagat tttaatttcg tcaacaaaac actaaactct aaactctaaa tcctaaaccc 1320
ttggataaat actaaaccct aaattaaaaa cattaaacca taatagtatt tttaagattt 1380
aatgttttag tgtttagtgt ttttgattta gaatttagga ttatccaagt gtttatgatt 1440
tatccaaggg tttagggttt agaatttagg gtttagggtt tagagtttaa aattatccaa 1500
gggtctaggg tatacccaag ggtttagggt ttaggattta gggtttaggg tttagaattt 1560
agggtttagg gtttagagtt taaaattatc caagggttta gggtataccc aagggtttag 1620
ggtttaggat ttagggttta aggtttagtg ttttttgacg atattaaaaa tagttttcaa 1680
aaattcattt tttgtaacgg ctattatttt ttttttatat tttatttatt ttaaaaacat 1740
aatataactt gacaatattt tcttttcttt ttaaaaaaaa tattaattat gaaatacttg 1800
attcctattg gttgggtgaa cctaaatgtt cactctaggg gtgaacctaa ggataactct 1860
attttttggg gtgaaatagc actatagcgg atatcttttt caatagatta taagcacggc 1920
tctacctatg actaatcaag aacttgggat gattggaaat ctgcaggttg tactcaatat 1980
gggattatat tggttctaac aagtagatat gatccttgaa aattaaagtt attagatcag 2040
ttcatcgtga aaggtgtagg gtttgtcatt ttattaacaa atttgtcatt tcattaacaa 2100
tttttgtcat tttataaaca tgaaaattat aacgaatgca ctttgctgcc agatcccaat 2160
ttgtcatttt atttttggga aaaaaatgta gcatttcgtg agtgtttcta tttttggcaa 2220
aaacaaaaag tgtgagatca attttgacca aaaaaaaatg taagattcac gtaggtttcc 2280
aaatttatta aatttaccca actatattaa aattaaatgt agacaaattt gttttcctgc 2340
cattttggca aaaaatgaag gatctatgaa ggtttccaag tttattaaat ttactcagat 2400
ttatgataat tatccataaa tttacataat tttatgaatt atcatttatt tgggtagatt 2460
tcataaatat gaaagtttct tttatgagtc aaaatgtata atttattggg taactttcat 2520
aaattttaga atttacatcg attttatatt aattcgtata gatttatgtt gactttatat 2580
atgaaaaaat atgtattata ttaaaagtag ttgctcatat atgattttta aatattaaat 2640
atgatccaaa agtttaatga ataaagaatg tttatggaat ttacaaaagt tagttgttaa 2700
aagttagtgg gaaaaaaatt attttttata ggcaaagtgg attttgggtc ccacgaaatt 2760
acttttccaa cttgccaagt ttaataggca aaaaggttaa aaatgtcata aatttattct 2820
ctctctacta ggttgcccaa ttgcctaata taaacttgag gtggcctatt tttctaattc 2880
aaacttaaaa gttgcccttt cccctaattg acccataaaa gaatgaaaga catttttctt 2940
ttccaaatta caatccctag ataattttat tttgtaggtg cattccatcg gttatgatta 3000
cagaatagct acgcttctct attgattctt attgcgccgt tggtgacgtt ttccatggaa 3060
tcaagtagtg ttttatctcc tatcactaac aacatattca tagattttgt ttatcacttg 3120
ttctgtgttc ctgatcatat acttgactca gtttctgtga tttcatcaag tttttgagaa 3180
cagaagaagc aaaaaagaaa acgagcagag ctgctcttac aatgttttaa ccgtgagtga 3240
taaatttatt tacataaaag tattttaaaa atagatttaa tcaaccaatt taatatatta 3300
ttttatattt agttcatttt tttttgacat cttttatatt tagtttagaa cacctctatt 3360
tgagtacaac atagattata atgataaatt tataaaatag cataattttt tattttcatt 3420
gttttatgat aaaattctaa ataacaataa ttataatatt attatattac taattgcaaa 3480
aattaattaa tacattattt tataataaat atttaaaacg ttgggtagga ttttgttaga 3540
tttttttcaa caaattttgt tatagctaaa ataaaattca aatgtattgt taaaattgat 3600
tttttttttt tttgattatt aagatttaat ataaataaac atatatgtca tattaaatat 3660
ttaactaagt ggtcctaatc tttgaactag gggtgggcgt tcgggtacct attcgggttt 3720
cggttcgagt ctattcggat ttcggatttt tggggtcaaa gattttagcc ccattcggtt 3780
atttctaaat tacggttcgg gttcggttcg gatccttgcg gattcggttc gggttcggat 3840
aacccgttta aattattttc aaaattttaa aatttcatta tatattttaa acttttcgaa 3900
atttgtaaac aaaataatat attacatata aatttcaata atatgtgtcg aagtaccaaa 3960
acttaacatg taaattggtt tgatttggat atttggatag aaaatcaatc atattttata 4020
tatttttggt gttttgagta tgctttaact atttatacat gtacttttta atgtttttat 4080
atattttcta gtattttgaa caatttaaaa gtattatata tattttagat gctttttaat 4140
atatattcaa tctaaaaata gttaaatata tatgtatatt aatctatttc ggatacattc 4200
ggatatccaa aatattttgg ttcggatcgg gttcggtttt ggttctttaa ataccaaaaa 4260
tttaaaccta ttcggatatt caattaattt cggttcggat ttggtattac ttttgcagat 4320
cggattcggt tcggttcttt ggattcagtt tttttgtcca gccctactct gaacagtaga 4380
taaaaaatag aaccctaaat taataggtta gattttggtt aggtctttct aattagtatg 4440
gagattctcg attccttctc attgcagtgt ggtatgtcca actcattgtt tatgtacata 4500
tccaatttag ttttgagtca aatgtttagt tacttaagag ttgaatgaaa taggggatga 4560
tattgatggc caaggttctc ccaaagtaaa taactttgtt tatattttaa gttagcttat 4620
aacatcaata aaaatgtcat taactggttc aataaaaatg tcattaactg gttcctctaa 4680
tataattatt taacacacct ggctgttgat aaatttttat gatcgtttaa taattttaga 4740
agtggatagt ctgtaaatgg tctttgattg gtcgtcttga tttttaaaag tggactaaac t800
aagaaggctt agtaataaat actgaaccgg aactctactg gtttcaatag ctcggtttat 4860
caatttctct cggctctggg tttagtgaat catgtggccc tgtgggttta aacaaggaac 4920
tcaatcaatc aactggtgac aaatctgaac cggaaattgt ataattcaaa ctgaaccggt 4980
tcttgtaaaa caaatggaac ccgtttgtac tttatctctc gtttattttc tcagtcacga 5040
gtttttttta gagatcgacg aagaacaaaa tttaggcgaa acaaaaataa aatgttggct 5100
agggtttgtg gattcaagtg ttcttcttct cctgctgagt ctgcggctag attgttctgt 5160
acgagatcga ttcgtgatac tctggccaag gcaagcggag agagttgcga agcaggtttt 5220
ggaggagaga gtttgaagct gcaaagtggg tttcatgaaa tcaaaggttt agaggatgcg 5280
attgatttgt tcagtgacat gcttcgatct cgtcctttac cttctgtggt tgatttctgt 5340
aaattgatgg gtgtggtggt gagaatggaa cgcccggatc ttgtgatttc tctctatcag 5400
aagatggaaa ggaaacagat tcgatgtgat atatacagct tcaatattct gataaaatgt 5460
ttctgcagct gctctaagct cccctttgct ttgtctacat ttggtaagat caccaagctt 5520
ggactccacc ctgatgttgt taccttcacc accctgctcc atggattatg tgtggaagat 5580
agggtttctg aagccttgga tttttttcat caaatgtttg aaacgacatg taggcccaat 5640
gtcgtaacct tcaccacttt gatgaacggt ctttgccgcg agggtagaat tgtcgaagcc 5700
gtagctctgc ttgatcggat gatggaagat ggtctccagc ctacccagat tacttatgga 5760
acaatcgtag atgggatgtg taagaaggga gatactgtgt ctgcactgaa tctgctgagg 5520
aagatggagg aggtgagcca catcataccc aatgttgtaa tctatagtgc aatcattgat 5880
agcctttgta aagacggacg tcatagcgat gcacaaaatc ttttcactga aatgcaagag 5940
aaaggaatct ttcccgattt atttacctac aacagtatga tagttggttt ttgtagctct 6000
ggtagatgga gcgacgcgga gcagttgttg caagaaatgt tagaaaggaa gatcagccct 6060
gatgttgtaa cttataatgc tttgatcaat gcatttgtca aggaaggcaa gttctttgag 6120
gctgaagaat tatacgatga gatgcttcca aggggtataa tccctaatac aatcacatat 6180
agttcaatga tcgatggatt ttgcaaacag aatcgtcttg atgctgctga gcacatgttt 6240
tatttgatgg ctaccaaggg ctgctctccc aacctaatca ctttcaatac tctcatagac 6300
ggatattgtg gggctaagag gatagatgat ggaatggaac ttctccatga gatgactgaa 6360
acaggattag ttgctgacac aactacttac aacactctta ttcacgggtt ctatctggtg 6420
ggcgatctta atgctgctct agacctttta caagagatga tctctagtgg tttgtgccct 6480
gatatcgtta cttgtgacac tttgctggat ggtctctgcg ataatgggaa actaaaagat 6540
gcattggaaa tgtttaaggt tatgcagaag agtaagaagg atcttgatgc tagtcacccc 6600
ttcaatggtg tggaacctga tgttcaaact tacaatatat tgatcagcgg cttgatcaat 6660
gaagggaagt ttttagaggc cgaggaatta tacgaggaga tgccccacag gggtatagtc 6720
ccagatacta tcacctatag ctcaatgatc gatggattat gcaagcagag ccgcctagat 6780
gaggctacac aaatgtttga ttcgatgggt agcaagagct tctctccaaa cgtagtgacc 6840
tttactacac tcattaatgg ctactgtaag gcaggaaggg ttgatgatgg gctggagctt 6900
ttctgcgaga tgggtcgaag agggatagtt gctaacgcaa ttacttacat cactttgatt 6960
tgtggttttc gtaaagtggg taatattaat ggggctctag acattttcca ggagatgatt 7020
tcaagtggtg tgtatcctga taccattacc atccgcaata tgctgactgg tttatggagt 7080
aaagaggaac taaaaagggc agtggcaatg cttgagaaac tgcagatgag tatggtatgt 7140
aagtttctgt tcagtctatg tattttttat ataaacaaga atgtatacat tcttttgtgt 7200
gtagcttcag attgatgata cacgttctgg aattaaccat tggtttggtt ttgcattgta 7260
ggatctatca tttgggggat gaatgatcaa agattttctt ctgtttgcgc agcagagctt 7320
caatgtcatt ttgtttctgc tgctgcatgt ataccctact aatgtttgat caaatcgttg 7380
aatagagtga tcatagtgaa aaattgtgtg gttagtaagt tattttgctg ctattctaat 7440
gacagccttt tatgcgtcta ttgtctgggc ttaataaatt tgaccatttc caattaaatt 7500
ccatacactt gtttcacgca agattattgg tctgaactaa agaggcacac cttccagaag 7560
atttcaggtg ttaaaagatg tttaggtgtc tgcccgttct gtagctgtca ccatggttat 7620
cgtcaagctc ggtcttcatg agagctgata gctgtgatgc catcttcctc ctcttcttca 7680
tattggctct gtcctgcctt gtctgctccc atgtgggttc aggaggagat catgttcttt 7740
taatcttggt ggaaatgttg ttgtcgctta tgcttctctg gttcgcctct tgacttgctt 7800
agcttcattc tttatctcca aattgctatg aaatcaattt accataagta gaataaactt 7860
gcagattcat tctattattg cttaagcttt tgttaatcaa caaagaaacc agagacgaga 7920
aatacaaact ctataagctt ctcttttttc tttcttgata gtaaaaccgg ttagagagta 7980
gagattgatc atatgaacta aaaatcgata ctaaaacggt ttggctccga cttataaacc 8040
ggaaccccac cgttttgcat ctctctctca aacatcacac aatgtccaag atgaagaagt 8100
atttgtgttg tcatctctct gggtgaggag atgcaaatgt tatattctaa ttgttttcag 8160
tgcttggtct aactttttta agagattact cccagtggtt ggatcaaaga aagagtcaac 8220
attgcattgt gtaaggtgac gaaaactgag ttaaagtaag tgagaacaat acttcaatgc 8280
ttttcttgtg acaacctgtg taatcatcgc atttgaatat atatgtatat gatgcttatg 8340
atgaagctat gagaataggc aaatagggtc tgtgttattt ccctgcgatt ctagattctg 8400
atttgttttt ccttcttaat atttagatta ggtggtcttg cttatcctgt tttagtatta 8460
gagtcggagt tttggggatg aatcatcccg gatgatatat acaattgtgt attttatgaa 8520
tttcagtttt tagtggataa tgaacacgtt aac 8553
<210>2
<211>2064
<212>DNA
<213>萝卜
<400>2
atg ttg gct agg gtt tgt gga ttc aag tgt tct tct tct cct gct gag 48
Met Leu Ala Arg Val Cys Gly Phe Lys Cys Ser Ser Ser Pro Ala Glu
1 5 10 15
tct gcg gct aga ttg ttc tgt acg aga tcg att cgt gat act ctg gcc 96
Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg Asp Thr Leu Ala
20 25 30
aag gca agc gga gag agt tgc gaa gca ggt ttt gga gga gag agt ttg 144
Lys Ala Ser Gly Glu Ser Cys Glu Ala Gly Phe Gly Gly Glu Ser Leu
35 40 45
aag ctg caa agt ggg ttt cat gaa atc aaa ggt tta gag gat gcg att 192
Lys Leu Gln Ser Gly Phe His Glu Ile Lys Gly Leu Glu Asp Ala Ile
50 55 60
gat ttg ttc agt gac atg ctt cga tct cgt cct tta cct tct gtg gtt 240
Asp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser Val Val
65 70 75 80
gat ttc tgt aaa ttg atg ggt gtg gtg gtg aga atg gaa cgc ccg gat 288
Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Glu Arg Pro Asp
85 90 95
ctt gtg att tct ctc tat cag aag atg gaa agg aaa cag att cga tgt 336
Leu Val Ile Ser Leu Tyr Gln Lys Met Glu Arg Lys Gln Ile Arg Cys
100 105 110
gat ata tac agc ttc aat att ctg ata aaa tgt ttc tgc agc tgc tct 384
Asp Ile Tyr Ser Phe Asn Ile Leu Ile Lys Cys Phe Cys Ser Cys Ser
115 120 125
aag ctc ccc ttt gct ttg tct aca ttt ggt aag atc acc aag ctt gga 432
Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Ile Thr Lys Leu Gly
130 135 140
ctc cac cct gat gtt gtt acc ttc acc acc ctg ctc cat gga tta tgt 480
Leu His Pro Asp Val Val Thr Phe Thr Thr Leu Leu His Gly Leu Cys
145 150 155 160
gtg gaa gat agg gtt tct gaa gcc ttg gat ttt ttt cat caa atg ttt 528
Val Glu Asp Arg Val Ser Glu Ala Leu Asp Phe Phe His Gln Met Phe
165 170 175
gaa acg aca tgt agg ccc aat gtc gta acc ttc acc act ttg atg aac 576
Glu Thr Thr Cys Arg Pro Asn Val Val Thr Phe Thr Thr Leu Met Asn
180 185 190
ggt ctt tgc cgc gag ggt aga att gtc gaa gcc gta gct ctg ctt gat 624
Gly Leu Cys Arg Glu Gly Arg Ile Val Glu Ala Val Ala Leu Leu Asp
195 200 205
cgg atg atg gaa gat ggt ctc cag cct acc cag att act tat gga aca 672
Arg Met Met Glu Asp Gly Leu Gln Pro Thr Gln Ile Thr Tyr Gly Thr
210 215 220
atc gta gat ggg atg tgt aag aag gga gat act gtg tct gca ctg aat 720
Ile Val Asp Gly Met Cys Lys Lys Gly Asp Thr Val Ser Ala Leu Asn
225 230 235 240
ctg ctg agg aag atg gag gag gtg agc cac atc ata ccc aat gtt gta 768
4eu Leu Arg Lys Met Glu Glu Val Ser His Ile Ile Pro Asn Val Val
245 250 255
atc tat agt gca atc att gat agc ctt tgt aaa gac gga cgt cat agc 816
Ile Tyr Ser Ala Ile Ile Asp Ser Leu Cys Lys Asp Gly Arg His Ser
260 265 270
gat gca caa aat ctt ttc act gaa atg caa gag aaa gga atc ttt ccc 864
Asp Ala Gln Asn Leu Phe Thr Glu Met Gln Glu Lys Gly Ile Phe Pro
275 280 285
gat tta ttt acc tac aac agt atg ata gtt ggt ttt tgt agc tct ggt 912
Asp Leu Phe Thr Tyr Asn Ser Met Ile Val Gly Phe Cys Ser Ser Gly
290 295 300
aga tgg agc gac gcg gag cag ttg ttg caa gaa atg tta gaa agg aag 960
Arg Trp Ser Asp Ala Glu Gln Leu Leu Gln Glu Met Leu Glu Arg Lys
305 310 315 320
atc agc cct gat gtt gta act tat aat gct ttg atc aat gca ttt gtc 1008
Ile Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn Ala Phe Val
325 330 335
aag gaa ggc aag ttc ttt gag gct gaa gaa tta tac gat gag atg ctt 1056
Lys Glu Gly Lys Phe Phe Glu Ala Glu Glu Leu Tyr Asp Glu Met Leu
340 345 350
cca agg ggt ata atc cct aat aca atc aca tat agt rca atg arc gat 1104
Pro Arg Gly Ile Ile Pro Asn Thr Ile Thr Tyr Ser Ser Met Ile Asp
355 360 365
gga ttt tgc aaa cag aat cgt ctt gat gct gct gag cac atg ttt tat 1152
Gly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met Phe Tyr
370 375 380
ttg atg gct acc aag ggc tgc tct ccc aac cta atc act ttc aat act 1200
Leu Met Ala Thr Lys Gly Cys Ser Pro Asn Leu Ile Thr Phe Asn Thr
385 390 395 400
ctc ata gac gga tat tgt ggg gct aag agg ata gat gat gga atg gaa 1248
Leu Ile Asp Gly Tyr Cys Gly Ala Lys Arg Ile Asp Asp Gly Met Glu
405 410 415
ctt ctc cat gag atg act gaa aca gga tta gtt gct gac aca act act 1296
Leu Leu His Glu Met Thr Glu Thr Gly Leu Val Ala Asp Thr Thr Thr
420 425 430
tac aac act ctt att cac ggg ttc tat ctg gtg ggc gat ctt aat gct 1344
Tyr Asn Thr Leu Ile His Gly Phe Tyr Leu Val Gly Asp Leu Asn Ala
435 440 445
gct cta gac ctt tta caa gag atg atc tct agt ggt ttg tgc cct gat 1392
Ala Leu Asp Leu Leu Gln Glu Met Ile Ser Ser Gly Leu Cys Pro Asp
450 455 460
atc gtt act tgt gac act ttg ctg gat ggt ctc tgc gat aat ggg aaa 1440
Ile Va1 Thr Cys Asp Thr Leu Leu Asp Gly Leu Cys Asp Asn Gly Lys
465 470 475 480
cta aaa gat gca ttg gaa atg ttt aag gtt atg cag aag agt aag aag 1488
Leu Lys Asp Ala Leu Glu Met Phe Lys Val Met Gln Lys Ser Lys Lys
485 490 495
gat ctt gat gct agt cac ccc ttc aat ggt gtg gaa cct gat gtt caa 1536
Asp Leu Asp Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp Val Gln
500 505 510
act tac aat ata ttg atc agc ggc ttg atc aat gaa ggg aag ttt tta 1584
Thr Tyr Asn Ile Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys Phe Leu
515 520 525
gag gcc gag gaa tta tac gag gag atg ccc cac agg ggt ata gtc cca 1632
Glu Ala Glu Glu Leu Tyr Glu Glu Met Pro His Arg Gly Ile Val Pro
530 535 540
gat act atc acc tat agc tca atg atc gat gga tta tgc aag cag agc 1680
Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys Gln Ser
545 550 555 560
cgc cta gat gag gct aca caa atg ttt gat tcg atg ggt agc aag agc 1728
Arg Leu Asp Glu Ala Thr Gln Met Phe Asp Ser Met Gly Ser Lys Ser
565 570 575
ttc tct cca aac gta gtg acc ttt act aca ctc att aat ggc tac tgt 1776
Phe Ser Pro Asn Val Val Thr Phe Thr Thr Leu Ile Asn Gly Tyr Cys
580 585 590
aag gca gga agg gtt gat gat ggg ctg gag ctt ttc tgc gag atg ggt 1824
Lys Ala Gly Arg Val Asp Asp Gly Leu Glu Leu Phe Cys Glu Met Gly
595 600 605
cga aga ggg ata gtt gct aac gca att act tac atc act ttg att tgt 1872
Arg Arg Gly Ile Val Ala Asn Ala Ile Thr Tyr Ile Thr Leu Ile Cys
610 615 620
ggt ttt cgt aaa gtg ggt aat att aat ggg gct cta gac att ttc cag 1920
Gly Phe Arg Lys Val Gly Asn Ile Asn Gly Ala Leu Asp Ile Phe Gln
625 630 635 640
gag atg att tca agt ggt gtg tat cctgatacc att acc atc cgc aat 1968
Glu Met Ile Ser Ser Gly Val Tyr Pro Asp Thr Ile Thr Ile Arg Asn
645 650 655
atg ctg act ggt tta tgg agt aaa gag gaa cta aaa agg gca gtg gca 2016
Met Leu Thr Gly Leu Trp Ser Lys Glu Glu Leu Lys Arg Ala Val Ala
660 665 670
atg ctt gag aaa ctg cag atg agt atg gat cta tca ttt ggg gga tga 2064
Met Leu Glu Lys Leu Gln Met Ser Met Asp Leu Ser Phe Gly Gly
675 680 685
<210>3
<2ll>687
<212>PRT
<213>萝卜
<400>3
Met Leu Ala Arg Val Cys Gly Phe Lys Cys Ser Ser Ser Pro Ala Glu
1 5 10 15
Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg Asp Thr Leu Ala
20 25 30
Lys Ala Ser Gly Glu Ser Cys Glu Ala Gly Phe Gly Gly Glu Ser Leu
35 40 45
Lys Leu Gln Ser Gly Phe His Glu Ile Lys Gly Leu Glu Asp Ala Ile
50 55 60
Asp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser Val Val
65 70 75 80
Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Glu Arg Pro Asp
85 90 95
Leu Val Ile Ser Leu Tyr Gln Lys Met Glu Arg Lys Gln Ile Arg Cys
100 105 110
Asp Ile Tyr Ser Phe Asn Ile Leu Ile Lys Cys Phe Cys Ser Cys Ser
115 120 125
Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Ile Thr Lys Leu Gly
130 135 140
Leu His Pro Asp Val Val Thr Phe Thr Thr Leu Leu His Gly Leu Cys
145 150 155 160
Val Glu Asp Arg Val Ser Glu Ala Leu Asp Phe Phe His Gln Met Phe
165 170 175
Glu Thr Thr Cys Arg Pro Asn Val Val Thr Phe Thr Thr Leu Met Asn
180 185 190
Gly Leu Cys Arg Glu Gly Arg Ile Val Glu Ala Val Ala Leu Leu Asp
195 200 205
Arg Met Met Glu Asp Gly Leu Gln Pro Thr Gln Ile Thr Tyr Gly Thr
210 215 220
Ile Val Asp Gly Met Cys Lys Lys Gly Asp Thr Val Ser Ala Leu Asn
225 230 235 240
Leu Leu Arg Lys Met Glu Glu Val Ser His Ile Ile Pro Asn Val Val
245 250 255
Ile Tyr Ser Ala Ile Ile Asp Ser Leu Cys Lys Asp Gly Arg His Ser
260 265 270
Asp Ala Gln Asn Leu Phe Thr Glu Met Gln Glu Lys Gly Ile Phe Pro
275 280 285
Asp Leu Phe Thr Tyr Asn Ser Met Ile Val Gly Phe Cys Ser Ser Gly
290 295 300
Arg Trp Ser Asp Ala Glu Gln Leu Leu Gln Glu Met Leu Glu Arg Lys
305 310 315 320
Ile Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn Ala Phe Val
325 330 335
Lys Glu Gly Lys Phe Phe Glu Ala Glu Glu Leu Tyr Asp Glu Met Leu
340 345 350
Pro Arg Gly Ile Ile Pro Asn Thr Ile Thr Tyr Ser Ser Met Ile Asp
355 360 365
Gly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met Phe Tyr
370 375 380
Leu Met Ala Thr Lys Gly Cys Ser Pro Asn Leu Ile Thr Phe Asn Thr
385 390 395 400
Leu Ile Asp Gly Tyr Cys Gly Ala Lys Arg Ile Asp Asp Gly Met Glu
405 410 415
Leu Leu His Glu Met Thr Glu Thr Gly Leu Val Ala Asp Thr Thr Thr
420 425 430
Tyr Asn Thr Leu Ile His Gly Phe Tyr Leu Val Gly Asp Leu Asn Ala
435 440 445
Ala Leu Asp Leu Leu Gln Glu Met Ile Ser Ser Gly Leu Cys Pro Asp
450 455 460
lle Val Thr Cys Asp Thr Leu Leu Asp Gly Leu Cys Asp Asn Gly Lys
465 470 475 480
Leu Lys Asp Ala Leu G1u Met Phe Lys Val Met Gln Lys Ser Lys Lys
485 490 495
Asp Leu Asp Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp Val Gln
500 505 510
Thr Tyr Asn Ile Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys Phe Leu
515 520 525
Glu Ala Glu Glu Leu Tyr Glu Glu Met Pro His Arg Gly Ile Val Pro
530 535 540
Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys Gln Ser
545 550 555 560
Arg Leu Asp Glu Ala Thr Gln Met Phe Asp Ser Met Gly Ser Lys Ser
565 570 575
Phe Ser Pro Asn Val Val Thr Phe Thr Thr Leu Ile Asn Gly Tyr Cys
580 585 590
Lys Ala Gly Arg Val Asp Asp Gly Leu Glu Leu Phe Cys Glu Met Gly
595 600 605
Arg Arg Gly Ile Val Ala Asn Ala Ile Thr Tyr Ile Thr Leu Ile Cys
610 615 620
Gly Phe Arg Lys Val Gly Asn Ile Asn Gly Ala Leu Asp Ile Phe Gln
625 630 635 640
Glu Met Ile Ser Ser Gly Val Tyr Pro Asp Thr Ile Thr Ile Arg Asn
645 650 655
Met Leu Thr Gly Leu Trp Ser Lys Glu Glu Leu Lys Arg Ala Val Ala
660 665 670
Met Leu Glu Lys Leu Gln Met Ser Met Asp Leu Ser Phe Gly Gly
675 680 685
<210>4
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>4
gaagcaaaaa agaaaacgag cagag 25
<210>5
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>5
ccaaaaatcc gaaatccgaa tagac 25
<210>6
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>6
ctcggctctg ggtttagtga 20
<210>7
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>7
tccacaaacc ctagccaaca 20
<210>8
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>8
gcttatgctt ctctggttcg cctc 24
<210>9
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>9
ctcagttttc gtcaccttac acaatgc 27
<210>10
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>10
gattcctttc tcttgcattt cag 23
<210>11
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>11
atctcgtcct ttaccttctg tgg 23
<210>12
<211>18
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>12
cgggatccgc tcacaatt 18
<210>13
<211>100
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>13
gcggatccca atttcattct gcatcactct ccctgtcgttatcgacctcg caaggttttt 60
gaaacggccg aaacgggaag tgacaatacc gcttttcttc 100
<210>14
<211>100
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>14
ggaattcact aactttacat tcagtaggagtgagattatg acaaaaagtg gacaattttt 60
cgaaaaaggt aatcatgcat ttatatgctg aagaaaagcg 100
<210>15
<211>3306
<212>DNA
<213>萝卜
<400>15
caattaattt cggttcggat ttggtattac ttttgcagat cggattcggt tcggttcttt 60
ggattcagtt tttttgtcca gccctactct gaacagtaga taaaaaatag aaccctaaat 120
taataggtta gattttggtt aggtctttct aattagtatg gagattctcg attccttctc 180
attgcagtgt ggtatgtcca actcattgtt tatgtacata tccaatttag ttttgagtca 240
aatgtttagt tacttaagag ttgaatgaaa taggggatga tattgatggc caaggttctc 300
ccaaagtaaa taactttgtt tatattttaa gttagcttat aacatcaata aaaatgtcat 360
taactggttc aataaaaatg tcattaactg gttcctctaa tataattatt taacacacct 420
ggctgttgat aaatttttat gatcgtttaa taattttaga agtggatagt ctgtaaatgg 480
tctttgattg gtcgtcttga tttttaaaag tggactaaac aagaaggctt agtaataaat 540
actgaaccgg aactctactg gtttcaatag ctcggtttat caatttctct cggctctggg 600
tttagtgaat catgtggccc tgtgggttta aacaaggaac tcaatcaatc aactggtgac 660
aaatctgaac cggaaattgt ataattcaaa ctgaaccggt tcttgtaaaa caaatggaac 720
ccgtttgtac tttatctctc gtttattttc tcagtcacga gtttttttta gagatcgacg 780
aagaacaaaa tttaggcgaa acaaaaataa aatgttggct agggtttgtg gattcaagtg 840
ttcttcttct cctgctgagt ctgcggctag attgttctgt acgagatcga ttcgtgatac 900
tctggccaag gcaagcggag agagttgcga agcaggtttt ggaggagaga gtttgaagct 960
gcaaagtggg tttcatgaaa tcaaaggttt agaggatgcg attgatttgt tcagtgacat 1020
gcttcgatct cgtcctttac cttctgtggt tgatttctgt aaattgatgg gtgtggtggt 1080
gagaatggaa cgcccggatc ttgtgatttc tctctatcag aagatggaaa ggaaacagat 1140
tcgatgtgat atatacagct tcaatattct gataaaatgt ttctgcagct gctctaagct 1200
cccctttgct ttgtctacat ttggtaagct caccaagctt ggactccacc ctgatgttgt 1260
taccttcacc accctgctcc acggattgtg cgtggaagat agggtttctg aagctttgaa 1320
tttgtttcat caaatgtttg aaacgacatg taggcccaat gtcgtaacct tcaccacttt 1380
gatgaacggt ctttgccgcg agggtagaat tgtcgaagcc gtagctctgc ttgatcggat 1440
gatggaagat ggtctccagc ctacccagat tacttatgga acaatcgtag atgggatgtg 1500
taagaaggga gatactgtgt ctgcactgaa tctgctgagg aagatggagg aggtgagcca 1560
catcataccc aatgttgtaa tctatagtgc aatcattgat agcctttgta aagacggacg 1620
tcatagcgat gcacaaaatc ttttcactga aatgcaagag aaaggaatct ttcccgattt 1680
atttacctac aacagtatga tagttggttt ttgtagctct ggtagatgga gcgacgcgga 1740
gcagttgttg caagaaatgt tagaaaggaa gatcagccct gatgttgtaa cttataatgc 1800
tttgatcaat gcatttgtca aggaaggcaa gttctttgag gctgaagaat tatacgatga 1860
gatgcttcca aggggtataa tccctaatac aatcacatat agttcaatga tcgatggatt 1920
ttgcaaacag aatcgtcttg atgctgctga gcacatgttt tatttgatgg ctaccaaggg 1980
ctgctctccc aacctaatca ctttcaatac tctcatagac ggatattgtg gggctaagag 2040
gatagatgat ggaatggaac ttctccatga gatgactgaa acaggattag ttgctgacac 2100
aactacttac aacactctta ttcacgggtt ctatctggtg ggcgatctta atgctgctct 2160
agacctttta caagagatga tctctagtgg tttgtgccct gatatcgtta cttgtgacac 2220
tttgctggat ggtctctgcg ataatgggaa actaaaagat gcattggaaa tgtttaaggt 2280
tatgcagaag agtaagaagg atcttgatgc tagtcacccc ttcaatggtg tggaacctga 2340
tgttcaaact tacaatatat tgatcagcgg cttgatcaat gaagggaagt ttttagaggc 2400
cgaggaatta tacgaggaga tgccccacag gggtatagtc ccagatacta tcacctatag 2460
ctcaatgatc gatggattat gcaagcagag ccgcctagat gaggctacac aaatgtttga 2520
ttcgatgggt agcaagagct tctctccaaa cgtagtgacc tttactacac tcattaatgg 2580
ctactgtaag gcaggaaggg ttgatgatgg gctggagctt ttctgcgaga tgggtcgaag 2640
agggatagtt gctaacgcaa ttacttacat cactttgatt tgtggttttc gtaaagtggg 2700
taatattaat ggggctctag acattttcca ggagatgatt tcaagtggtg tgtatcctga 2760
taccattacc atccgcaata tgctgactgg tttatggagt aaagaggaac taaaaagggc 2820
agtggcaatg cttgagaaac tgcagatgag tatggtatgt aagtttctgt tcagtctatg 2880
tattttttat ataaacaaga atgtatacat tcttttgtgt gtagcttcag attgatgata 2940
cacgttctgg aattaaccat tggtttggtt ttgcattgta ggatctatca tttgggggat 3000
gaatgatcaa agattttctt ctgtttgcgc agcagagctt caatgtcatt ttgtttctgc 3060
tgctgcatgt ataccctact aatgtttgat caaatcgttg aatagagtga tcatagtgaa 3120
aaattgtgtg gttagtaagt tattttgctg ctattctaat gacagccttt tatgcgtcta 3180
ttgtctgggc ttaataaatt tgaccatttc caattaaatt ccatacactt gtttcacgca 3240
agattattgg tctgaactaa agaggcacac cttccagaag atttcaggtg ttaaaagatg 3300
tttagg 3306
<210>16
<211>2064
<212>DNA
<213>萝卜
<400>16
atg ttg gct agg gtt tgt gga ttc aag tgt tct tct tct cct gct gag 48
Met Leu Ala Arg Val Cys Gly Phe Lys Cys Ser Ser Ser Pro Ala Glu
1 5 10 15
tct gcg gct aga ttg ttc tgt acg aga tcg att cgt gat act ctg gcc 96
Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg Asp Thr Leu Ala
20 25 30
aag gca agc gga gag agt tgc gaa gca ggt ttt gga gga gag agt ttg 144
Lys Ala Ser Gly Glu Ser Cys Glu Ala Gly Phe Gly Gly Glu Ser Leu
35 40 45
aag ctg caa agt ggg ttt cat gaa atc aaa ggt tta gag gat gcg att 192
Lys Leu Gln Ser Gly Phe His Glu Ile Lys Gly Leu Glu Asp Ala Ile
50 55 60
gat ttg ttc agt gac atg ctt cga tct cgt cct tta cct tct gtg gtt 240
Asp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser Val Val
65 70 75 80
gat ttc tgt aaa ttg atg ggt gtg gtg gtg aga atg gaa cgc ccg gat 288
Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Glu Arg Pro Asp
85 90 95
ctt gtg att tct ctc tat cag aag atg gaa agg aaa cag att cga tgt 336
Leu Val Ile Ser Leu Tyr Gln Lys Met Glu Arg Lys Gln Ile Arg Cys
100 105 110
gat ata tac agc ttc aat att ctg ata aaa tgt ttc tgc agc tgc tct 384
Asp Ile Tyr Ser Phe Asn Ile Leu Ile Lys Cys Phe Cys Ser Cys Ser
115 120 125
aag ctc ccc ttt gct ttg tct aca ttt ggt aag ctc acc aag ctt gga 432
Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Leu Thr Lys Leu Gly
130 135 140
ctc cac cct gat gtt gtt acc ttc acc acc ctg ctc cac gga ttg tgc 480
Leu His Pro Asp Val Val Thr Phe Thr Thr Leu Leu His Gly Leu Cys
145 150 155 160
gtg gaa gat agg gtt tct gaa gct ttg aat ttg ttt cat caa atg ttt 528
Val Glu Asp Arg Val Ser Glu Ala Leu Asn Leu Phe His Gln Met Phe
165 170 175
gaa acg aca tgt agg ccc aat gtc gta acc ttc acc act ttg atg aac 576
Glu Thr Thr Cys Arg Pro Asn Val Val Thr Phe Thr Thr Leu Met Asn
180 185 190
ggt ctt tgc cgc gag ggt aga att gtc gaa gcc gta gct ctg ctt gat 624
Gly Leu Cys Arg Glu Gly Arg Ile Val Glu Ala Val Ala Leu Leu Asp
195 200 205
cgg atg atg gaa gat ggt ctc cag cct acc cag att act tat gga aca 672
Arg Met Met Glu Asp Gly Leu Gln Pro Thr Gln Ile Thr Tyr Gly Thr
210 215 220
atc gta gat ggg atg tgt aag aag gga gat act gtg tct gca ctg aat 720
Ile Val Asp Gly Met Cys Lys Lys Gly Asp Thr Val Ser Ala Leu Asn
225 230 235 240
ctg ctg agg aag atg gag gag gtg agc cac atc ata ccc aat gtt gta 768
Leu Leu Arg Lys Met Glu Glu Val Ser His Ile Ile Pro Asn Val Val
245 250 255
atc tat agt gca atc att gat agc ctt tgt aaa gac gga cgt cat agc 816
Ile Tyr Ser Ala Ile Ile Asp Ser Leu Cys Lys Asp Gly Arg His Ser
260 265 270
gat gca caa aat ctt ttc act gaa atg caa gag aaa gga atc ttt ccc 864
Asp Ala Gln Asn Leu Phe Thr Glu Met Gln Glu Lys Gly Ile Phe Pro
275 280 285
gat tta ttt acc tac aac agt atg ata gtt ggt ttt tgt agc tct ggt 912
Asp Leu Phe Thr Tyr Asn Ser Met Ile Val Gly Phe Cys Ser Ser Gly
290 295 300
aga tgg agc gac gcg gag cag ttg ttg caa gaa atg tta gaa agg aag 960
Arg Trp Ser Asp Ala Glu Gln Leu Leu Gln Glu Met Leu Glu Arg Lys
305 310 315 320
atc agc cct gat gtt gta act tat aat gct ttg atc aat gca ttt gtc 1008
Ile Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn Ala Phe Val
325 330 335
aag gaa ggc aag ttc ttt gag gct gaa gaa tta tac gat gag atg ctt 1056
Lys Glu Gly Lys Phe Phe Glu Ala Glu Glu Leu Tyr Asp Glu Met Leu
340 345 350
cca agg ggt ata atc cct aat aca atc aca tat agt tca atg atc gat 1104
Pro Arg Gly Ile Ile Pro Asn Thr Ile Thr Tyr Ser Ser Met Ile Asp
355 360 365
gga ttt tgc aaa cag aat cgt ctt gat gct gct gag cac atg ttt tat 1152
Gly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met Phe Tyr
370 375 380
ttg atg gct acc aag ggc tgc tct ccc aac cta atc act ttc aat act 1200
Leu Met Ala Thr Lys Gly Cys Ser Pro Asn Leu Ile Thr Phe Asn Thr
385 390 395 400
ctc ata gac gga tat tgt ggg gct aag agg ata gat gat gga atg gaa 1248
Leu Ile Asp Gly Tyr Cys Gly Ala Lys Arg Ile Asp Asp Gly Met Glu
405 410 415
ctt ctc cat gag atg act gaa aca gga tta gtt gct gac aca act act 1296
Leu Leu His Glu Met Thr Glu Thr Gly Leu Val Ala Asp Thr Thr Thr
420 425 430
tac aac act ctt att cac ggg ttc tat ctg gtg ggc gat ctt aat gct 1344
Tyr Asn Thr Leu Ile His Gly Phe Tyr Leu Val Gly Asp Leu Asn Ala
435 440 445
gct cta gac ctt tta caa gag atg atc tct agt ggt ttg tgc cct gat 1392
Ala Leu Asp Leu Leu Gln Glu Met Ile Ser Ser Gly Leu Cys Pro Asp
450 455 460
atc gtt act tgt gac act ttg ctg gat ggt ctc tgc gat aat ggg aaa 1440
Ile Val Thr Cys Asp Thr Leu Leu Asp Gly Leu Cys Asp Asn Gly Lys
465 470 475 480
cta aaa gat gca ttg gaa atg ttt aag gtt atg cag aag agt aag aag 1488
Leu Lys Asp Ala Leu Glu Met Phe Lys Val Met Gln Lys Ser Lys Lys
485 490 495
gat ctt gat gct agt cac ccc ttc aat ggt gtg gaa cct gat gtt caa 1536
Asp Leu Asp Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp Val Gln
500 505 510
act tac aat ata ttg atc agc ggc ttg atc aat gaa ggg aag ttt tta 1584
Thr Tyr Asn Ile Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys Phe Leu
515 520 525
gag gcc gag gaa tta tac gag gag atg ccc cac agg ggt ata gtc cca 1632
Glu Ala Glu Glu Leu Tyr Glu Glu Met Pro His Arg Gly Ile Val Pro
530 535 540
gat act atc acc tat agc tca atg atc gat gga tta tgc aag cag agc 1680
Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys Gln Ser
545 550 555 560
cgc cta gat gag gct aca caa atg ttt gat tcg atg ggt agc aag agc 1728
Arg Leu Asp Glu Ala Thr Gln Met Phe Asp Ser Met Gly Ser Lys Ser
565 570 575
ttc tct cca aac gta gtg acc ttt act aca ctc att aat ggc tac tgt 1776
Phe Ser Pro Asn Val Val Thr Phe Thr Thr Leu Ile Asn Gly Tyr Cys
580 585 590
aag gca gga agg gtt gat gat ggg ctg gag ctt ttc tgc gag atg ggt 1824
Lys Ala Gly Arg Val Asp Asp Gly Leu Glu Leu Phe Cys Glu Met Gly
595 600 605
cga aga ggg ata gtt gct aac gca att act tac atc act ttg att tgt 1872
Arg Arg Gly Ile Val Ala Asn Ala Ile Thr Tyr Ile Thr Leu Ile Cys
610 615 620
ggt ttt cgt aaa gtg ggt aat att aat ggg gct cta gac att ttc cag 1920
Gly Phe Arg Lys Val Gly Asn Ile Asn Gly Ala Leu Asp Ile Phe Gln
625 630 635 640
gag atg att tca agt ggt gtg tat cct gat acc att acc atc cgc aat 1968
Glu Met Ile Ser Ser Gly Val Tyr Pro Asp Thr Ile Thr Ile Arg Asn
645 650 655
atg ctg act ggt tta tgg agt aaa gag gaa cta aaa agg gca gtg gca 2016
Met Leu Thr Gly Leu Trp Ser Lys Glu Glu Leu Lys Arg Ala Val Ala
660 665 670
atg ctt gag aaa ctg cag atg agt atg gat cta tca ttt ggg gga tga 2064
Met Leu Glu Lys Leu Gln Met Ser Met Asp Leu Ser Phe Gly Gly Xaa
675 680 685
<210>17
<211>688
<212>PRT
<213>萝卜
<400>17
Met Leu Ala Arg Val Cys Gly Phe Lys Cys Ser Ser Ser Pro Ala Glu
1 5 10 15
Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg Asp Thr Leu Ala
20 25 30
Lys Ala Ser Gly Glu Ser Cys Glu Ala Gly Phe Gly Gly Glu Ser Leu
35 40 45
Lys Leu Gln Ser Gly Phe His Glu Ile Lys Gly Leu Glu Asp Ala Ile
50 55 60
Asp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser Val Val
65 70 75 80
Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Glu Arg Pro Asp
85 90 95
Leu Val Ile Ser Leu Tyr Gln Lys Met Glu Arg Lys Gln Ile Arg Cys
100 105 110
Asp Ile Tyr Ser Phe Asn Ile Leu Ile Lys Cys Phe Cys Ser Cys Ser
115 120 125
Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Leu Thr Lys Leu Gly
130 135 140
Leu His Pro Asp Val Val Thr Phe Thr Thr Leu Leu His Gly Leu Cys
145 150 155 160
Val Glu Asp Arg Val Ser Glu Ala Leu Asn Leu Phe His Gln Met Phe
165 170 175
Glu Thr Thr Cys Arg Pro Asn Val Val Thr Phe Thr Thr Leu Met Asn
180 185 190
Gly Leu Cys Arg Glu Gly Arg Ile Val Glu Ala Val Ala Leu Leu Asp
195 200 205
Arg Met Met Glu Asp Gly Leu Gln Pro Thr Gln Ile Thr Tyr Gly Thr
210 215 220
Ile Val Asp Gly Met Cys Lys Lys Gly Asp Thr Val Ser Ala Leu Asn
225 230 235 240
Leu Leu Arg Lys Met Glu Glu Val Ser His Ile Ile Pro Asn Val Val
245 250 255
Ile Tyr Ser Ala Ile Ile Asp Ser Leu Cys Lys Asp Gly Arg His Ser
260 265 270
Asp Ala Gln Asn Leu Phe Thr Glu Met Gln Glu Lys Gly Ile Phe Pro
275 280 285
Asp Leu Phe Thr Tyr Asn Ser Met Ile Val Gly Phe Cys Ser Ser Gly
290 295 300
Arg Trp Ser Asp Ala Glu Gln Leu Leu Gln Glu Met Leu Glu Arg Lys
305 310 315 320
Ile Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn Ala Phe Val
325 330 335
Lys Glu Gly Lys Phe Phe Glu Ala Glu Glu Leu Tyr Asp Glu Met Leu
340 345 350
Pro Arg Gly Ile Ile Pro Asn Thr Ile Thr Tyr Ser Ser Met Ile Asp
355 360 365
Gly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met Phe Tyr
370 375 380
Leu Met Ala Thr Lys Gly Cys Ser Pro Asn Leu Ile Thr Phe Asn Thr
385 390 395 400
Leu Ile Asp Gly Tyr Cys Gly Ala Lys Arg Ile Asp Asp Gly Met Glu
405 410 415
Leu Leu His Glu Met Thr Glu Thr Gly Leu Val Ala Asp Thr Thr Thr
420 425 430
Tyr Asn Thr Leu Ile His Gly Phe Tyr Leu Val Gly Asp Leu Asn Ala
435 440 445
Ala Leu Asp Leu Leu Gln Glu Met Ile Ser Ser Gly Leu Cys Pro Asp
450 455 460
Ile Val Thr Cys Asp Thr Leu Leu Asp Gly Leu Cys Asp Asn Gly Lys
465 470 475 480
Leu Lys Asp Ala Leu Glu Met Phe Lys Val Met Gln Lys Ser Lys Lys
485 490 495
Asp Leu Asp Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp Val Gln
500 505 510
Thr Tyr Asn Ile Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys Phe Leu
515 520 525
Glu Ala Glu Glu Leu Tyr Glu Glu Met Pro His Arg Gly Ile Val Pro
530 535 540
Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys Gln Ser
545 550 555 560
Arg Leu Asp Glu Ala Thr Gln Met Phe Asp Ser Met Gly Ser Lys Ser
565 570 575
Phe Ser Pro Asn Val Val Thr Phe Thr Thr Leu Ile Asn Gly Tyr Cys
580 585 590
Lys Ala Gly Arg Val Asp Asp Gly Leu Glu Leu Phe Cys Glu Met Gly
595 600 605
Arg Arg Gly Ile Val Ala Asn Ala Ile Thr Tyr Ile Thr Leu Ile Cys
610 615 620
Gly Phe Arg Lys Val Gly Asn Ile Asn Gly Ala Leu Asp Ile Phe Gln
625 630 635 640
Glu Met Ile Ser Ser Gly Val Tyr Pro Asp Thr Ile Thr Ile Arg Asn
645 650 655
Met Leu Thr Gly Leu Trp Ser Lys Glu Glu Leu Lys Arg Ala Val Ala
660 665 670
Met Leu Glu Lys Leu Gln Met Ser Met Asp Leu Ser Phe Gly Gly Xaa
675 680 685
<210>18
<211>2073
<212>DNA
<213>萝卜
<400>18
atg ttg gct agg gtt tgt gga ttc aag tgt tct tct tct cct gct gtg 48
Met Leu Ala Arg Val Cys Gly Phe Lys Cys Ser Ser Ser Pro Ala Val
1 5 10 15
tct gcg gct aga ttg ttc tgt acg aga tcg att cgt gat act ctg gcc 96
Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg Asp Thr Leu Ala
20 25 30
aag gca agc agg gat gga gag agt tgc gaa gca ggt ttt gga gga gag 144
Lys Ala Ser Arg Asp Gly Glu Ser Cys Glu Ala Gly Phe Gly Gly Glu
35 40 45
agt ttg aag ctg caa agt ggg ttt cat gaa atc aaa ggt tta gag gat 192
Ser Leu Lys Leu Gln Ser Gly Phe His Glu Ile Lys Gly Leu Glu Asp
50 55 60
gcg att gat ttg ttc agt gac atg ctt cga tct cgt cct tta cct tct 240
Ala Ile Asp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser
65 70 75 80
gtg gtt gat ttc tgt aaa ttg atg ggt gtg gtg gtg agg atg aaa cgc 288
Val Val Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Lys Arg
85 90 95
ccg gat gtt gtg att tct ctc cat aag aag atg gaa atg cgg cgc att 336
Pro Asp Val Val Ile Ser Leu His Lys Lys Met Glu Met Arg Arg Ile
100 105 110
cca tgt gat gca tac agc ttc aat att ctg ata aag tgt ttc tgc agc 384
Pro Cys Asp Ala Tyr Ser Phe Asn Ile Leu Ile Lys Cys Phe Cys Ser
115 120 125
tgc tct aag ctg ccc ttt gct ttg tct aca ttt ggt aag ctc acc aag 432
Cys Ser Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Leu Thr Lys
130 135 140
ctt gga ctc cac cct gat gtt gtt acc ttc acc acc ctt ctc cac gga 480
Leu Gly Leu His Pro Asp Val Val Thr Phe Thr Thr Leu Leu His Gly
145 150 155 160
ttg tgt gtg gaa aat agg ggt tct gaa gct ttg aat ttg ttt cat caa 528
Leu Cys Val Glu Asn Arg Gly Ser Glu Ala Leu Asn Leu Phe His Gln
165 170 175
atg ttt gaa acg rca tgt agg ccc aat gtc gta acc ttc acc act ttg 576
Met Phe Glu Thr Thr Cys Arg Pro Asn Val Val Thr Phe Thr Thr Leu
180 185 190
atg aac ggt ctt tgc cgc gag ggt aga att gtc gaa gcc gta gct cta 624
Met Asn Gly Leu Cys Arg Glu Gly Arg Ile Val Glu Ala Val Ala Leu
195 200 205
ctt gat cgg atg atg gaa gat ggt ctc cag cct acc cag att act tat 672
Leu Asp Arg Met Met Glu Asp Gly Leu Gln Pro Thr Gln Ile Thr Tyr
210 215 220
gga aca atc gta gat ggg atg tgt aag aag gga gat act gtg tct gca 720
Gly Thr Ile Val Asp Gly Met Cys Lys Lys Gly Asp Thr Val Ser Ala
225 230 235 240
ctg aat ctg ctg agg aag atg gag gag gtg agc cac atc ata ccc aat 768
Leu Asn Leu Leu Arg Lys Met Glu Glu Val Ser His Ile Ile Pro Asn
245 250 255
gtt gta atc tat agt gca atc att gat agc ctt tgt aaa gac gga cgt 816
Val Val Ile Tyr Ser Ala Ile Ile Asp Ser Leu Cys Lys Asp Gly Arg
260 265 270
cat agc gat tct caa aat ctt ttc act gaa atg caa gag aaa gga atc 864
His Ser Asp Ser Gln Asn Leu Phe Thr Glu Met Gln Glu Lys Gly Ile
275 280 285
ttt cca gat tta ttt acc tac aac tgt atg atc aac ggg ttt tgt agc 912
Phe Pro Asp Leu Phe Thr Tyr Asn Cys Met Ile Asn Gly Phe Cys Ser
290 295 300
tct ggt aga tgg atc gac gcg gag cag ttg ttg caa gaa atg tta gaa 960
Ser Gly Arg Trp Ile Asp Ala Glu Gln Leu Leu Gln Glu Met Leu Glu
305 310 315 320
agg aag atc agc cct gat gtt gta act tat aat gct ttg atc aat gca 1008
Arg Lys Ile Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn Ala
325 330 335
ttt gtc aag gaa ggc aag ttc ttt gag gct gaa gaa tta tac gat gag 1056
Phe Val Lys Glu Gly Lys Phe Phe Glu Ala Glu Glu Leu Tyr Asp Glu
340 345 350
atg ctt cct agg ggt ata atc cct aat aca atc aca tat agt tca atg 1104
Met Leu Pro Arg Gly Ile Ile Pro Asn Thr Ile Thr Tyr Ser Ser Met
355 360 365
atc gat gga ttt tgc aaa cag aat cgt ctt gat gct gct gag cac atg 1152
Ile Asp Gly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met
370 375 380
ttt tat ttg atg cct acc aag ggc tgc tct ccg gac gta ttc act ttc 1200
Phe Tyr Leu Met Pro Thr Lys Gly Cys Ser Pro Asp Val Phe Thr Phe
385 390 395 400
aat act ctc ata gac gga tat cgt ggg gct aag agg ata gat gat gga 1248
Asn Thr Leu Ile Asp Gly Tyr Arg Gly Ala Lys Arg Ile Asp Asp Gly
405 410 415
atg gaa ctt ctc cat gag atg act gaa gca gga tta gtt gct aac aca 1296
Met Glu Leu Leu His Glu Met Thr Glu Ala Gly Leu Val Ala Asn Thr
420 425 430
gtt act tac aac act ctt att cac ggg ttt tgt cag gtg ggc gat ctt 1344
Val Thr Tyr Asn Thr Leu Ile His Gly Phe Cys Gln Val Gly Asp Leu
435 440 445
act gct gct cta gac ctt cta cat gag atg att tct agt ggt gtg tgc 1392
Thr Ala Ala Leu Asp Leu Leu His Glu Met Ile Ser Ser Gly Val Cys
450 455 460
cct aat gtc gtt act tgt agc act ttg ctg gat ggt ctc tgc gat aac 1440
Pro Asn Val Val Thr Cys Ser Thr Leu Leu Asp Gly Leu Cys Asp Asn
465 470 475 480
ggg aaa cta aaa gat gca tgg gaa ctg ttt aag gtt atg cag aag agt 1488
Gly Lys Leu Lys Asp Ala Trp Glu Leu Phe Lys Val Met Gln Lys Ser
485 490 495
aag atg gat ctt gat gct agt cac ccc ttc aat ggt gtg gaa cct gat 1536
Lys Met Asp Leu Asp Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp
500 505 510
gtt caa act tac aat ata ttg atc agc ggc ttg atc aat gaa ggg aag 1584
Val Gln Thr Tyr Asn Ile Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys
515 520 525
ttt tta gag gct gag gaa tta tac aag gag atg ccc cac agg ggt ata 1632
Phe Leu Glu Ala Glu Glu Leu Tyr Lys Glu Met Pro His Arg Gly Ile
530 535 540
gtc cca gat act att acc tat agc tca atg atc gat gga cta tgc aag 1680
Val Pro Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys
545 550 555 560
cag agc cgc ctg gat gag gct aca caa atg ttt gat tcg atg ggt agc 1728
Gln Ser Arg Leu Asp Glu Ala Thr Gln Met Phe Asp Ser Met Gly Ser
565 570 575
aag agc ttc tct cca aac gta gtg acc ttt act aca ctc att gat ggc 1776
Lys Ser Phe Ser Pro Asn Val Val Thr Phe Thr Thr Leu Ile Asp Gly
580 585 590
tac tgt aaa gca gga agg gtt gat gat ggg ctg gag ctt ttc tgc gag 1824
Tyr Cys Lys Ala Gly Arg Val Asp Asp Gly Leu Glu Leu Phe Cys Glu
595 600 605
atg ggt aga aga ggg ata gtt gct aat aca att act tac atc act ttg 1872
Met Gly Arg Arg Gly Ile Val Ala Asn Thr Ile Thr Tyr Ile Thr Leu
610 615 620
att cgt ggt ttt cgc aat gtg ggt aat att aat ggg gct cta gac att 1920
Ile Arg Gly Phe Arg Asn Val Gly Asn Ile Asn Gly Ala Leu Asp Ile
625 630 635 640
ttc cag gag atg att tca agt ggt gtg tat cct ggt atc att act atc 1968
Phe Gln Glu Met Ile Ser Ser Gly Val Tyr Pro Gly Ile Ile Thr Ile
645 650 655
cgc agt atg ctg act ggt tta tgg agt aaa gag gaa cta aaa agg aca 2016
Arg Ser Met Leu Thr Gly Leu Trp Ser Lys Glu Glu Leu Lys Arg Thr
660 665 670
gtg gca atg ctt gag gaa ctg cag atg agt gtg ggg tat cag ttg gag 2064
Val Ala Met Leu Glu Glu Leu Gln Met Ser Val Gly Tyr Gln Leu Glu
675 680 685
gat gaa tga 2073
Asp Glu Xaa
690
<210>19
<211>691
<212>PRT
<213>萝卜
<400>19
Met Leu Ala Arg Val Cys Gly Phe Lys Cys Ser Ser Ser Pro Ala Val
1 5 10 15
Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg Asp Thr Leu Ala
20 25 30
Lys Ala Ser Arg Asp Gly Glu Ser Cys Glu Ala Gly Phe Gly Gly Glu
35 40 45
Ser Leu Lys Leu Gln Ser Gly Phe His Glu Ile Lys Gly Leu Glu Asp
50 55 60
Ala Ile Asp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser
65 70 75 80
Val Val Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Lys Arg
85 90 95
Pro Asp Val Val Ile Ser Leu His Lys Lys Met Glu Met Arg Arg Ile
100 105 110
Pro Cys Asp Ala Tyr Ser Phe Asn Ile Leu Ile Lys Cys Phe Cys Ser
115 120 125
Cys Ser Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Leu Thr Lys
130 135 140
Leu Gly Leu His Pro Asp Val Val Thr Phe Thr Thr Leu Leu His Gly
145 150 155 160
Leu Cys Val Glu Asn Arg Gly Ser Glu Ala Leu Asn Leu Phe His Gln
165 170 175
Met Phe Glu Thr Thr Cys Arg Pro Asn Val Val Thr Phe Thr Thr Leu
180 185 190
Met Asn Gly Leu Cys Arg Glu Gly Arg Ile Val Glu Ala Val Ala Leu
195 200 205
Leu Asp Arg Met Met Glu Asp Gly Leu Gln Pro Thr Gln Ile Thr Tyr
210 215 220
Gly Thr Ile Val Asp Gly Met Cys Lys Lys Gly Asp Thr Val Ser Ala
225 230 235 240
Leu Asn Leu Leu Arg Lys Met Glu Glu Val Ser His Ile Ile Pro Asn
245 250 255
Val Val Ile Tyr Ser Ala Ile Ile Asp Ser Leu Cys Lys Asp Gly Arg
260 265 270
His Ser Asp Ser Gln Asn Leu Phe Thr Glu Met Gln Glu Lys Gly Ile
275 280 285
Phe Pro Asp Leu Phe Thr Tyr Asn Cys Met Ile Asn Gly Phe Cys Ser
290 295 300
Ser Gly Arg Trp Ile Asp Ala Glu Gln Leu Leu Gln Glu Met Leu Glu
305 310 315 320
Arg Lys Ile Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn Ala
325 330 335
Phe Val Lys Glu Gly Lys Phe Phe Glu Ala Glu Glu Leu Tyr Asp Glu
340 345 350
Met Leu Pro Arg Gly Ile Ile Pro Asn Thr Ile Thr Tyr Ser Ser Met
355 360 365
Ile Asp Gly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met
370 375 380
Phe Tyr Leu Met Pro Thr Lys Gly Cys Ser Pro Asp Val Phe Thr Phe
385 390 395 400
Asn Thr Leu Ile Asp Gly Tyr Arg Gly Ala Lys Arg Ile Asp Asp Gly
405 410 415
Met Glu Leu Leu His Glu Met Thr Glu Ala Gly Leu Val Ala Asn Thr
420 425 430
Val Thr Tyr Asn Thr Leu Ile His Gly Phe Cys Gln Val Gly Asp Leu
435 440 445
Thr Ala Ala Leu Asp Leu Leu His Glu Met Ile Ser Ser Gly Val Cys
450 455 460
Pro Asn Val Val Thr Cys Ser Thr Leu Leu Asp Gly Leu Cys Asp Asn
465 470 475 480
Gly Lys Leu Lys Asp Ala Trp Glu Leu Phe Lys Val Met Gln Lys Ser
485 490 495
Lys Met Asp Leu Asp Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp
500 505 510
Val Gln Thr Tyr Asn Ile Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys
515 520 525
Phe Leu Glu Ala Glu Glu Leu Tyr Lys Glu Met Pro His Arg Gly Ile
530 535 540
Val Pro Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys
545 550 555 560
Gln Ser Arg Leu Asp Glu Ala Thr Gln Met Phe Asp Ser Met Gly Ser
565 570 575
Lys Ser Phe Ser Pro Asn Val Val Thr Phe Thr Thr Leu Ile Asp Gly
580 585 590
Tyr Cys Lys Ala Gly Arg Val Asp Asp Gly Leu Glu Leu Phe Cys Glu
595 600 605
Met Gly Arg Arg Gly Ile Val Ala Asn Thr Ile Thr Tyr Ile Thr Leu
610 615 620
Ile Arg Gly Phe Arg Asn Val Gly Asn Ile Asn Gly Ala Leu Asp Ile
625 630 635 640
Phe Gln Glu Met Ile Ser Ser Gly Val Tyr Pro Gly Ile Ile Thr Ile
645 650 655
Arg Ser Met Leu Thr Gly Leu Trp Ser Lys Glu Glu Leu Lys Arg Thr
660 665 670
Val Ala Met Leu Glu Glu Leu Gln Met Ser Val Gly Tyr Gln Leu Glu
675 680 685
Asp Glu Xaa
690
<210>20
<211>516
<212>DNA
<213>野萝卜
<400>20
a atg gaa cgc ccg gat ctt gtg att tct ctc tat caa aag atg gaa agg 49
Met Glu Arg Pro Asp Leu Val Ile Ser Leu Tyr Gln Lys Met Glu Arg
1 5 l0 15
aaa cag att cca tgt gat gta tac agc ttt aat att ctg ata aaa tgt 97
Lys Gln Ile Pro Cys Asp Val Tyr Ser Phe Asn Ile Leu Ile Lys Cys
20 25 30
ttc tgc agt tgc tct aag ctt ccc ttt gct ttg tct aca ttt ggt aag 145
Phe Cys Ser Cys Ser Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys
35 40 45
atc acc aag ctt gga ctc cac cct gat gtt gct acc ttc aac acc ctg 193
Ile Thr Lys Leu Gly Leu His Pro Asp Val Ala Thr Phe Asn Thr Leu
50 55 60
ctc cac gga tta tgt ctt gat aag agg gtt tct gaa gcc ttg gat ttg 241
Leu His Gly Leu Cys Leu Asp Lys Arg Val Ser Glu Ala Leu Asp Leu
65 70 75 80
ttt cat caa atg ttt gaa acg aca tgt agg ccg aac atc ata acg ttt 289
Phe His Gln Met Phe Glu Thr Thr Cys Arg Pro Asn Ile Ile Thr Phe
85 90 95
acc acg ctg atg aac ggt ctt tgc tac gag ggt aga gtt gtc gaa gct 337
Thr Thr Leu Met Asn Gly Leu Cys Tyr Glu Gly Arg Val Val Glu Ala
100 105 110
gta gct ctg ctt gat cgg atg cta gaa gat ggt ctc cag cct gac cag 385
Val Ala Leu Leu Asp Arg Met Leu Glu Asp Gly Leu Gln Pro Asp Gln
115 120 125
att act tac gga aca att gta gac ggg atg tgt aag atg gga gac act 433
Ile Thr Tyr Gly Thr Ile Val Asp Gly Met Cys Lys Met Gly Asp Thr
130 135 140
gtg tct gca ttg aat ctt ctg agg aag atg gag gag ttg agc cac atc 481
Val Ser Ala Leu Asn Leu Leu Arg Lys Met Glu Glu Leu Ser His Ile
145 150 155 160
aaa ccc aat gtg gta atc tat agt gcc atc att ga 516
Lys Pro Asn Val Val Ile Tyr Ser Ala Ile Ile
165 170
<210>21
<211>171
<212>DNA
<213>野萝卜
<400>21
Met Glu Arg Pro Asp Leu Val Ile Ser Leu Tyr Gln Lys Met Glu Arg
1 5 10 15
Lys Gln Ile Pro Cys Asp Val Tyr Ser Phe Asn Ile Leu Ile Lys Cys
20 25 30
Phe Cys Ser Cys Ser Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys
35 40 45
Ile Thr Lys Leu Gly Leu His Pro Asp Val Ala Thr Phe Asn Thr Leu
50 55 60
Leu His Gly Leu Cys Leu Asp Lys Arg Val Ser Glu Ala Leu Asp Leu
65 70 75 80
Phe His Gln Met Phe Glu Thr Thr Cys Arg Pro Asn Ile Ile Thr Phe
85 90 95
Thr Thr Leu Met Asn Gly Leu Cys Tyr Glu Gly Arg Val Val Glu Ala
100 105 110
Val Ala Leu Leu Asp Arg Met Leu Glu Asp Gly Leu Gln Pro Asp Gln
115 120 125
Ile Thr Tyr Gly Thr Ile Val Asp Gly Met Cys Lys Met Gly Asp Thr
130 135 140
Val Ser Ala Leu Asn Leu Leu Arg Lys Met Glu Glu Leu Ser His Ile
145 150 155 160
Lys Pro Asn Val Val Ile Tyr Ser Ala Ile Ile
165 170
<210>22
<211>2073
<212>DNA
<213>萝卜属
<400>22
atgttggcta gggtttgtgg attcaagtgt tcttcttctc ctgctgwgtc tgcggctaga 60
ttgttctgta cgagatcgat tcgtgatact ctggccaagg caagcrgrga krnnnnnngt 120
tgcgaagcag gttttggagg agagagtttg aagctgcaaa gtgggtttca tgaaatcaaa 180
ggtttagagg atgcgattga tttgttcagt gacatgcttc gatctcgtcc tttaccttct 240
gtggttgatt tctgtaaatt gatgggtgtg gtggtgagra tgraacgccc ggatsttgtg 300
atttctctcy atmaraagat ggaaakgmrr crsattcsat gtgatryata cagcttyaat 360
attctgataa artgtttctg cagytgctct aagctbccct ttgctttgtc tacatttggt 420
aagmtcacca agcttggact ccaccctgat gttgytacct tcamcaccct kctccaygga 480
ttrtgystkg awrakagggk ttctgaagcy ttgratttkt ttcatcaaat gtttgaaacg 540
rcatgtaggc csaayrtcrt aacsttyacc ackytgatga acggtctttg cyrcgagggt 600
agarttgtcg aagcygtagc tctrcttgat cggatgmtrg aagatggtct ccagcctrmc 660
cagattactt ayggaacaat ygtagayggg atgtgtaaga wgggagayac tgtgtctgca 720
ytgaatctkc tgaggaagat ggaggagktg agccacatca wacccaatgt kgtaatctat 780
agtgcmatca ttgatagcct ttgtaaagac ggacgtcata gcgatkcwca aaatcttttc 840
actgaaatgc aagagaaagg aatctttccm gatttattta cctacaacwg tatgatmrwy 900
ggkttttgta gctctggtag atggakcgac gcggagcagt tgttgcaaga aatgttagaa 960
aggaagatca gccctgatgt tgtaacttat aatgctttga tcaatgcatt tgtcaaggaa 1020
ggcaagttct ttgaggctga agaattatac gatgagatgc ttccwagggg tataatccct 1080
aatacaatca catatagttc aatgatcgat ggattttgca aacagaatcg tcttgatgct 1140
gctgagcaca tgttttattt gatgsctacc aagggctgct ctccsracst awtcactttc 1200
aatactctca tagacggata tygtggggct aagaggatag atgatggaat ggaacttctc 1260
catgagatga ctgaarcagg attagttgct racacaryta cttacaacac tcttattcac 1320
gggttytrtc wggtgggcga tcttamtgct gctctagacc ttytacawga gatgatytct 1380
agtggtktgt gccctratrt cgttacttgt rrcactttgc tggatggtct ctgcgataay 1440
gggaaactaa aagatgcatk ggaamtgttt aaggttatgc agaagagtaa gawggatctt 1500
gatgctagtc accccttcaa tggtgtggaa cctgatgttc aaacttacaa tatattgatc 1560
agcggcttga tcaatgaagg gaagttttta gaggcygagg aattatacra ggagatgccc 1620
cacaggggta tagtcccaga tactatyacc tatagctcaa tgatcgatgg aytatgcaag 1680
cagagccgcc trgatgaggc tacacaaatg tttgattcga tgggtagcaa gagcttctct 1740
ccaaacgtag tgacctttac tacactcatt ratggctact gtaargcagg aagggttgat 1800
gatgggctgg agcttttctg cgagatgggt mgaagaggga tagttgctaa yrcaattact 1860
tacatcactt tgattygtgg ttttcgyaaw gtgggtaata ttaatggggc tctagacatt 1920
ttccaggaga tgatttcaag tggtgtgtat cctgrtayca ttacyatccg cartatgctg 1980
actggtttat ggagtaaaga ggaactaaaa aggrcagtgg caatgcttga graactgcag 2040
atgagtrtgg rkywwymrtt kgrggrwkra tga 2073
<210>23
<211>2073
<212>DNA
<213>萝卜属
<400>23
atgttggcta gggtttgtgg attcaagtgt tcttcttctc ctgctgwgtc tgcggctaga 60
ttgttctgta cgagatcgat tcgtgatact ctggccaagg caagcrgrga krnnnnnngt 120
tgcgaagcag gttttggagg agagagtttg aagctgcaaa gtgggtttca tgaaatcaaa 180
ggtttagagg atgcgattga tttgttcagt gacatgcttc gatctcgtcc tttaccttct 240
gtggttgatt tctgtaaatt gatgggtgtg gtggtgagra tgraacgccc ggatsttgtg 300
atttctctcy atmagaagat ggaaakgmrr crsattcsat gtgatryata cagcttcaat 360
attctgataa artgtttctg cagctgctct aagctsccct ttgctttgtc tacatttggt 420
aagmtcacca agcttggact ccaccctgat gttgttacct tcaccaccct kctccaygga 480
ttrtgygtgg aaratagggk ttctgaagcy ttgratttkt ttcatcaaat gtttgaaacg 540
rcatgtaggc ccaatgtcgt aaccttcacc actttgatga acggtctttg ccgcgagggt 600
agaattgtcg aagccgtagc tctrcttgat cggatgatgg aagatggtct ccagcctacc 660
cagattactt atggaacaat cgtagatggg atgtgtaaga agggagatac tgtgtctgca 720
ctgaatctgc tgaggaagat ggaggaggtg agccacatca tacccaatgt tgtaatctat 780
agtgcaatca ttgatagcct ttgtaaagac ggacgtcata gcgatkcwca aaatcttttc 840
actgaaatgc aagagaaagg aatctttccm gatttattta cctacaacwg tatgatmrwy 900
ggkttttgta gctctggtag atggakcgac gcggagcagt tgttgcaaga aatgttagaa 960
aggaagatca gccctgatgt tgtaacttat aatgctttga tcaatgcatt tgtcaaggaa 1020
ggcaagttct ttgaggctga agaattatac gatgagatgc ttccwagggg tataatccct 1080
aatacaatca catatagttc aatgatcgat ggattttgca aacagaatcg tcttgatgct 1140
gctgagcaca tgttttattt gatgsctacc aagggctgct ctccsracst awtcactttc 1200
aatactctca tagacggata tygtggggct aagaggatag atgatggaat ggaacttctc 1260
catgagatga ctgaarcagg attagttgct racacaryta cttacaacac tcttattcac 1320
gggttytrtc wggtgggcga tcttamtgct gctctagacc ttytacawga gatgatytct 1380
agtggtktgt gccctratrt cgttacttgt rrcactttgc tggatggtct ctgcgataay 1440
gggaaactaa aagatgcatk ggaamtgttt aaggttatgc agaagagtaa gawggatctt 1500
gatgctagtc accccttcaa tggtgtggaa cctgatgttc aaacttacaa tatattgatc 1560
agcggcttga tcaatgaagg gaagttttta gaggcygagg aattatacra ggagatgccc 1620
cacaggggta tagtcccaga tactatyacc tatagctcaa tgatcgatgg aytatgcaag 1680
cagagccgcc trgatgaggc tacacaaatg tttgattcga tgggtagcaa gagcttctct 1740
ccaaacgtag tgacctttac tacactcatt ratggctact gtaargcagg aagggttgat 1800
gatgggctgg agcttttctg cgagatgggt mgaagaggga tagttgctaa yrcaattact 1860
tacatcactt tgattygtgg ttttcgyaaw gtgggtaata ttaatggggc tctagacatt 1920
ttccaggaga tgatttcaag tggtgtgtat cctgrtayca ttacyatccg cartatgctg 1980
actggtttat ggagtaaaga ggaactaaaa aggrcagtgg caatgcttga graactgcag 2040
atgagtrtgg rkywwymrtt kgrggrwkra tga 2073
<210>24
<211>2064
<212>DNA
<213>萝卜属
<400>24
atgttggcta gggtttgtgg attcaagtgt tcttcttctc ctgctgagtc tgcggctaga 60
ttgttctgta cgagatcgat tcgtgatact ctggccaagg caagcggaga gagttgcgaa 120
gcaggttttg gaggagagag tttgaagctg caaagtgggt ttcatgaaat caaaggttta 180
gaggatgcga ttgatttgtt cagtgacatg cttcgatctc gtcctttacc ttctgtggtt 240
gatttctgta aattgatggg tgtggtggtg agaatggaac gcccggatct tgtgatttct 300
ctctatcara agatggaaag gaaacagatt csatgtgatr tatacagctt yaatattctg 360
ataaaatgtt tctgcagytg ctctaagcty ccctttgctt tgtctacatt tggtaagmtc 420
accaagcttg gactccaccc tgatgttgyt accttcamca ccctgctcca yggattrtgy 480
stkgawraka gggtttctga agcyttgrat ttktttcatc aaatgtttga aacgacatgt 540
aggccsaayr tcrtaacstt yaccackytg atgaacggtc tttgcyrcga gggtagartt 600
gtcgaagcyg tagctctgct tgatcggatg mtrgaagatg gtctccagcc trmccagatt 660
acttayggaa caatygtaga ygggatgtgt aagawgggag ayactgtgtc tgcaytgaat 720
ctkctgagga agatggagga gktgagccac atcawaccca atgtkgtaat ctatagtgcm 780
atcattgata gcctttgtaa agacggacgt catagcgatg cacaaaatct tttcactgaa 840
atgcaagaga aaggaatctt tcccgattta tttacctaca acagtatgat agttggtttt 900
tgtagctctg gtagatggag cgacgcggag cagttgttgc aagaaatgtt agaaaggaag 960
atcagccctg atgttgtaac ttataatgct ttgatcaatg catttgtcaa ggaaggcaag 1020
ttctttgagg ctgaagaatt atacgatgag atgcttccaa ggggtataat ccctaataca 1080
atcacatata gttcaatgat cgatggattt tgcaaacaga atcgtcttga tgctgctgag 1140
cacatgtttt atttgatggc taccaagggc tgctctccca acctaatcac tttcaatact 1200
ctcatagacg gatattgtgg ggctaagagg atagatgatg gaatggaact tctccatgag 1260
atgactgaaa caggattagt tgctgacaca actacttaca acactcttat tcacgggttc 1320
tatctggtgg gcgatcttaa tgctgctcta gaccttttac aagagatgat ctctagtggt 1380
ttgtgccctg atatcgttac ttgtgacact ttgctggatg gtctctgcga taatgggaaa 1440
ctaaaagatg cattggaaat gtttaaggtt atgcagaaga gtaagaagga tcttgatgct 1500
agtcacccct tcaatggtgt ggaacctgat gttcaaactt acaatatatt gatcagcggc 1560
ttgatcaatg aagggaagtt tttagaggcc gaggaattat acgaggagat gccccacagg 1620
ggtatagtcc cagatactat cacctatagc tcaatgatcg atggattatg caagcagagc 1680
cgcctagatg aggctacaca aatgtttgat tcgatgggta gcaagagctt ctctccaaac 1740
gtagtgacct ttactacact cattaatggc tactgtaagg caggaagggt tgatgatggg 1800
ctggagcttt tctgcgagat gggtcgaaga gggatagttg ctaacgcaat tacttacatc 1860
actttgattt gtggttttcg taaagtgggt aatattaatg gggctctaga cattttccag 1920
gagatgattt caagtggtgt gtatcctgat accattacca tccgcaatat gctgactggt 1980
ttatggagta aagaggaact aaaaagggca gtggcaatgc ttgagaaact gcagatgagt 2040
atggatctat catttggggg atga 2064
<210>25
<211>2064
<212>DNA
<213>萝卜属
<400>25
atgttggcta gggtttgtgg attcaagtgt tcttcttctc ctgctgagtc tgcggctaga 60
ttgttctgta cgagatcgat tcgtgatact ctggccaagg caagcggaga gagttgcgaa 120
gcaggttttg gaggagagag tttgaagctg caaagtgggt ttcatgaaat caaaggttta 180
gaggatgcga ttgatttgtt cagtgacatg cttcgatctc gtcctttacc ttctgtggtt 240
gatttctgta aattgatggg tgtggtggtg agaatggaac gcccggatct tgtgatttct 300
ctctatcaga agatggaaag gaaacagatt cgatgtgata tatacagctt caatattctg 360
ataaaatgtt tctgcagctg ctctaagctc ccctttgctt tgtctacatt tggtaagmtc 420
accaagcttg gactccaccc tgatgttgtt accttcacca ccctgctcca yggattrtgy 480
gtggaagata gggtttctga agcyttgrat ttktttcatc aaatgtttga aacgacatgt 540
aggcccaatg tcgtaacctt caccactttg atgaacggtc tttgccgcga gggtagaatt 600
gtcgaagccg tagctctgct tgatcggatg atggaagatg gtctccagcc tacccagatt 660
acttatggaa caatcgtaga tgggatgtgt aagaagggag atactgtgtc tgcactgaat 720
ctgctgagga agatggagga ggtgagccac atcataccca atgttgtaat ctatagtgca 780
atcattgata gcctttgtaa agacggacgt catagcgatg cacaaaatct tttcactgaa 840
atgcaagaga aaggaatctt tcccgattta tttacctaca acagtatgat agttggtttt 900
tgtagctctg gtagatggag cgacgcggag cagttgttgc aagaaatgtt agaaaggaag 960
atcagccctg atgttgtaac ttataatgct ttgatcaatg catttgtcaa ggaaggcaag 1020
ttctttgagg ctgaagaatt atacgatgag atgcttccaa ggggtataat ccctaataca 1080
atcacatata gttcaatgat cgatggattt tgcaaacaga atcgtcttga tgctgctgag 1140
cacatgtttt atttgatggc taccaagggc tgctctccca acctaatcac tttcaatact 1200
ctcatagacg gatattgtgg ggctaagagg atagatgatg gaatggaact tctccatgag 1260
atgactgaaa caggattagt tgctgacaca actacttaca acactcttat tcacgggttc 1320
tatctggtgg gcgatcttaa tgctgctcta gaccttttac aagagatgat ctctagtggt 1380
ttgtgccctg atatcgttac ttgtgacact ttgctggatg gtctctgcga taatgggaaa 1440
ctaaaagatg cattggaaat gtttaaggtt atgcagaaga gtaagaagga tcttgatgct 1500
agtcacccct tcaatggtgt ggaacctgat gttcaaactt acaatatatt gatcagcggc 1560
ttgatcaatg aagggaagtt tttagaggcc gaggaattat acgaggagat gccccacagg 1620
ggtatagtcc cagatactat cacctatagc tcaatgatcg atggattatg caagcagagc 1680
cgcctagatg aggctacaca aatgtttgat tcgatgggta gcaagagctt ctctccaaac 1740
gtagtgacct ttactacact cattaatggc tactgtaagg caggaagggt tgatgatggg 1800
ctggagcttt tctgcgagat gggtcgaaga gggatagttg ctaacgcaat tacttacatc 1860
actttgattt gtggttttcg taaagtgggt aatattaatg gggctctaga cattttccag 1920
gagatgattt caagtggtgt gtatcctgat accattacca tccgcaatat gctgactggt 1980
ttatggagta aagaggaact aaaaagggca gtggcaatgc ttgagaaact gcagatgagt 2040
atggatctat catttggggg atga 2064
<210>26
<211>690
<212>PRT
<213>萝卜属
<220>
<221>Xaa
<222>16
<223>Glu或Val
<221>Xaa
<222>36
<223>Arg或无
<221>Xaa
<223>37,Asp或无
<221>Xaa
<222>95
<223>Glu或Lys
<221>Xaa
<222>99
<223>leu或Val
<221>Xaa
<222>104
<223>Tyr或His
<221>Xaa
<222>105
<223>Gln或Lys
<221>Xaa
<222>109
<223>Arg或Met
<221>Xaa
<222>110
<223>Lys或Arg
<221>Xaa
<222>111
<223>Gln或Arg
<221>Xaa
<222>113
<223>Arg或Pro
<221>Xaa
<222>116
<223>Ile,Ala或Val
<221>Xaa
<222>142
<223>Leu或Ile
<221>Xaa
<222>152
<223>Val或Ala
<221>Xaa
<222>155
<223>Thr或Asn
<221>Xaa
<222>163
<223>Val,或Leu
<221>Xaa
<222>164
<223>Glu或Asp
<221>Xaa
<222>165
<223>Asp,Asn或Lys
<221>Xaa
<222>167
<223>Val或Gly
<221>Xaa
<222>172
<223>Asn或Asp
<221>Xaa
<222>173
<223>Leu或Phe
<221>Xaa
<222>186
<223>Val或Ile
<221>Xaa
<222>187
<223>Val或Ile
<221>Xaa
<222>198
<223>Arg或Tyr
<221>Xaa
<222>202
<223>Ile或yal
<221>Xaa
<222>213
<223>Met或Leu
<221>Xaa
<222>220
<223>Thr或Asp
<221>Xaa
<222>234
<223>Lys或Met
<221>Xaa
<222>250
<223>Val或Leu
<221>Xaa
<222>254
<223>Ile或Lys
<221>Xaa
<222>276
<223>Ala或Ser
<221>Xaa
<222>297
<223>Ser或Cys
<221>Xaa
<222>300
<223>Val或Asn
<221>Xaa
<222>309
<223>Ser或Ile
<221>Xaa
<222>389
<223>Ala或Pro
<221>Xaa
<222>396
<223>Asn或Asp
<221>Xaa
<222>397
<223>Leu或Val
<221>Xaa
<222>398
<223>Ile或Phe
<221>Xaa
<222>408
<223>Cys或Arg
<221>Xaa
<222>426
<223>Thr或Ala
<221>Xaa
<222>431
<223>Asp或Asn
<221>Xaa
<222>433
<223>Thr或Val
<221>Xaa
<222>443
<223>Tyr或Cys
<221>Xaa
<222>444
<223>Leu或Gln
<221>Xaa
<222>449
<223>Asn或Thr
<221>Xaa
<222>456
<223>Gln或His
<221>Xaa
<222>463
<223>Leu或Val
<221>Xaa
<222>466
<223>Asp或Asn
<221>Xaa
<222>467
<223>Ile或Val
<221>Xaa
<222>471
<223>Asp或Ser
<221>Xaa
<222>487
<223>Leu或Trp
<221>Xaa
<222>489
<223>Met或Leu
<221>Xaa
<222>498
<223>Lys或Met
<221>Xaa
<222>537
<223>Glu或Lys
<221>Xaa
<222>591
<223>Asn或Asp
<221>Xaa
<222>618
<223>Ala或Thr
<221>Xaa
<222>626
<223>Cys或Arg
<221>Xaa
<222>630
<223>Lys或Asn
<221>Xaa
<222>652
<223>Asp或Gly
<221>Xaa
<222>653
<223>Thr或Ile
<221>Xaa
<222>658
<223>Asn或Ser
<221>Xaa
<222>672
<223>Ala或Thr
<221>Xaa
<222>678
<223>Lys或Glu
<221>Xaa
<222>683
<223>Met或Val
<221>Xaa
<222>684
<223>Asp或Gly
<221>Xaa
<222>685
<223>Leu或Tyr
<221>Xaa
<222>686
<223>Ser或Gln
<221>Xaa
<222>687
<223>Phe或Leu
<221>Xaa
<222>688
<223>Gly或Glu
<221>Xaa
<222>689
<223>Gly或Asp
<221>Xaa
<222>690
<223>Glu或无
<400>26
Met Leu Ala Arg Val Cys Gly Phe Lys Cys Ser Ser Ser Pro Ala Xaa
1 5 10 15
Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg Asp Thr Leu Ala
20 25 30
Lys Ala Ser Xaa Xaa Gly Glu Ser Cys Glu Ala Gly Phe Gly Gly Glu
35 40 45
Ser Leu Lys Leu Gln Ser Gly Phe His Glu Ile Lys Gly Leu Glu Asp
50 55 60
Ala Ile Asp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser
65 70 75 80
Val Val Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Xaa Arg
85 90 95
Pro Asp Xaa Val Ile Ser Leu Xaa Xaa Lys Met Glu Xaa Xaa Xaa Ile
100 105 110
Xaa Cys Asp Xaa Tyr Ser Phe Asn Ile Leu Ile Lys Cys Phe Cys Ser
115 120 125
Cys Ser Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Xaa Thr Lys
130 135 140
Leu Gly Leu His Pro Asp Val Xaa Thr Phe Xaa Thr Leu Leu His Gly
145 150 155 160
Leu Cys Xaa Xaa Xaa Arg Xaa Ser Glu Ala Leu Xaa Xaa Phe His Gln
165 170 175
Met Phe Glu Thr Thr Cys Arg Pro Asn Xaa Xaa Thr Phe Thr Thr Leu
180 185 190
Met Asn Gly Leu Cys Xaa Glu Gly Arg Xaa Val Glu Ala Val Ala Leu
195 200 205
Leu Asp Arg Met Xaa Glu Asp Gly Leu Gln Pro Xaa Gln Ile Thr Tyr
210 215 220
Gly Thr Ile Val Asp Gly Met Cys Lys Xaa Gly Asp Thr Val Ser Ala
225 230 235 240
Leu Asn Leu Leu Arg Lys Met Glu Glu Xaa Ser His Ile Xaa Pro Asn
245 250 255
Val Val Ile Tyr Ser Ala Ile Ile Asp Ser Leu Cys Lys Asp Gly Arg
260 265 270
His Ser Asp Xaa Gln Asn Leu Phe Thr Glu Met Gln Glu Lys Gly Ile
275 280 285
Phe Pro Asp Leu Phe Thr Tyr Asn Xaa Met Ile Xaa Gly Phe Cys Ser
290 295 300
Ser Gly Arg Trp Xaa Asp Ala Glu Gln Leu Leu Gln Glu Met Leu Glu
305 310 315 320
Arg Lys Ile Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn Ala
325 330 335
Phe Val Lys Glu Gly Lys Phe Phe Glu Ala Glu Glu Leu Tyr Asp Glu
340 345 350
Met Leu Pro Arg Gly Ile Ile Pro Asn Thr Ile Thr Tyr Ser Ser Met
355 360 365
Ile Asp Gly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met
370 375 380
Phe Tyr Leu Met Xaa Thr Lys Gly Cys Ser Pro Xaa Xaa Xaa Thr Phe
385 390 395 400
Asn Thr Leu Ile Asp Gly Tyr Xaa Gly Ala Lys Arg Ile Asp Asp Gly
405 410 415
Met Glu Leu Leu His Glu Met Thr Glu Xaa Gly Leu Val Ala Xaa Thr
420 425 430
Xaa Thr Tyr Asn Thr Leu Ile His Gly Phe Xaa Xaa Val Gly Asp Leu
435 440 445
Xaa Ala Ala Leu Asp Leu Leu Xaa Glu Met Ile Ser Ser Gly Xaa Cys
450 455 460
Pro Xaa Xaa Val Thr Cys Xaa Thr Leu Leu Asp Gly Leu Cys Asp Asn
465 470 475 480
Gly Lys Leu Lys Asp Ala Xaa Glu Xaa Phe Lys Val Met Gln Lys Ser
485 490 495
Lys Xaa Asp Leu Asp Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp
500 505 510
Val Gln Thr Tyr Asn Ile Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys
515 520 525
Phe Leu Glu Ala Glu Glu Leu Tyr Xaa Glu Met Pro His Arg Gly Ile
530 535 540
Val Pro Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys
545 550 555 560
Gln Ser Arg Leu Asp Glu Ala Thr Gln Met Phe Asp Ser Met Gly Ser
565 570 575
Lys Ser Phe Ser Pro Asn Val Val Thr Phe Thr Thr Leu Ile Xaa Gly
580 585 590
Tyr Cys Lys Ala Gly Arg Val Asp Asp Gly Leu Glu Leu Phe Cys Glu
595 600 605
Met Gly Arg Arg Gly Ile Val Ala Asn Xaa Ile Thr Tyr Ile Thr Leu
610 615 620
Ile Xaa Gly Phe Arg Xaa Val Gly Asn Ile Asn Gly Ala Leu Asp Ile
625 630 635 640
Phe Gln Glu Met Ile Ser Ser Gly Val Tyr Pro Xaa Xaa Ile Thr Ile
645 650 655
Arg Xaa Met Leu Thr Gly Leu Trp Ser Lys Glu Glu Leu Lys Arg Xaa
660 665 670
Val Ala Met Leu Glu Xaa Leu Gln Met Ser Xaa Xaa Xaa Xaa Xaa Xaa
675 680 685
Xaa Xaa
690
<210>27
<211>690
<212>PRT
<213>萝卜属
<220>
<221>Xaa
<222>16
<223>Glu或Val
<221>Xaa
<222>36
<223>Arg或无
<221>Xaa
<223>37,Asp或无
<221>Xaa
<222>95
<223>Glu或Lys
<221>Xaa
<222>99
<223>leu或Val
<221>Xaa
<222>104
<223>Tyr或His
<221>Xaa
<222>105
<223>Gln或Lys
<221>Xaa
<222>109
<223>Arg或Met
<221>Xaa
<222>110
<223>Lys或Arg
<221>Xaa
<222>111
<223>Gln或Arg
<221>Xaa
<222>113
<223>Arg或Pro
<221>Xaa
<222>116
<223>Ile或Ala
<221>Xaa
<222>142
<223>Leu或Ile
<221>Xaa
<222>165
<223>Asp或Asn
<221>Xaa
<222>167
<223>Val或Gly
<221>Xaa
(此页无内容)
<222>398
<223>Ile或Phe
<221>Xaa
<222>408
<223>Cys或Arg
<221>Xaa
<222>426
<223>Thr或Ala
<221>Xaa
<222>431
<223>Asp或Asn
<221>Xaa
<222>433
<223>Thr或Val
<221>Xaa
<222>443
<223>Tyr或Cys
<221>Xaa
<222>444
<223>Leu或Gln
<221>Xaa
<222>449
<223>Asn或Thr
<221>Xaa
<222>456
<223>Gln或His
<221>Xaa
<222>463
<223>Leu或Val
<221>Xaa
<222>466
<223>Asp或Asn
<221>Xaa
<222>467
<223>Ile或Val
<221>Xaa
<222>471
<223>Asp或Ser
<221>Xaa
<222>487
<223>Leu或Trp
<221>Xaa
<222>489
<223>Met或Leu
<221>Xaa
<222>498
<223>Lys或Met
<221>Xaa
<222>537
<223>Glu或Lys
<221>Xaa
<222>591
<223>Asn或Asp
<221>Xaa
<222>618
<223>Ala或Thr
<221>Xaa
<222>626
<223>Cys或Arg
<221>Xaa
<222>630
<223>Lys或Asn
<221>Xaa
<222>652
<223>Asp或Gly
<221>Xaa
<222>653
<223>Thr或Ile
<221>Xaa
<222>658
<223>Asn或Ser
<221>Xaa
<222>672
<223>Ala或Thr
<221>Xaa
<222>678
<223>Lys或Glu
<221>Xaa
<222>683
<223>Met或Val
<221>Xaa
<222>684
<223>Asp或Gly
<221>Xaa
<222>685
<223>Leu或Tyr
<221>Xaa
<222>686
<223>Ser或Gln
<221>Xaa
<222>687
<223>Phe或Leu
<221>Xaa
<222>688
<223>Gly或Glu
<221>Xaa
<222>689
<223>Gly或Asp
<221>Xaa
<222>690
<223>Glu或none
<400>27
Met Leu Ala Arg Val Cys Gly Phe Lys Cys Ser Ser Ser Pro Ala Xaa
1 5 10 15
Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg Asp Thr Leu Ala
20 25 30
Lys Ala Ser Xaa Xaa Gly Glu Ser Cys Glu Ala Gly Phe Gly Gly Glu
35 40 45
Ser Leu Lys Leu Gln Ser Gly Phe His Glu Ile Lys Gly Leu Glu Asp
50 55 60
Ala Ile Asp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser
65 70 75 80
Val Val Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Xaa Arg
85 90 95
Pro Asp Xaa Val Ile Ser Leu Xaa Xaa Lys Met Glu Xaa Xaa Xaa Ile
100 105 110
Xaa Cys Asp Xaa Tyr Ser Phe Asn Ile Leu Ile Lys Cys Phe Cys Ser
115 120 125
Cys Ser Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Xaa Thr Lys
130 135 140
Leu Gly Leu His Pro Asp Val Val Thr Phe Thr Thr Leu Leu His Gly
145 150 155 160
Leu Cys Val Glu Xaa Arg Xaa Ser Glu Ala Leu Xaa Xaa Phe His Gln
165 170 175
Met Phe Glu Thr Thr Cys Arg Pro Asn Val Val Thr Phe Thr Thr Leu
180 185 190
Met Asn Gly Leu Cys Arg Glu Gly Arg IIe Val Glu Ala Val Ala Leu
195 200 205
Leu Asp Arg Met Met Glu Asp Gly Leu Gln Pro Thr Gln Ile Thr Tyr
210 215 220
Gly Thr Ile Val Asp Gly Met Cys Lys Lys Gly Asp Thr Val Ser Ala
225 230 235 240
Leu Asn Leu Leu Arg Lys Met Glu Glu Val Ser His Ile Ile Pro Asn
245 250 255
Val Val Ile Tyr Ser Ala Ile Ile Asp Ser Leu Cys Lys Asp Gly Arg
260 265 270
His Ser Asp Xaa Gln Asn Leu Phe Thr Glu Met Gln Glu Lys Gly Ile
275 280 285
Phe Pro Asp Leu Phe Thr Tyr Asn Xaa Met Ile Xaa Gly Phe Cys Ser
290 295 300
Ser Gly Arg Trp Xaa Asp Ala Glu Gln Leu Leu Gln Glu Met Leu Glu
305 310 315 320
Arg Lys Ile Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn Ala
325 330 335
Phe Val Lys Glu Gly Lys Phe Phe Glu Ala Glu Glu Leu Tyr Asp Glu
340 345 350
Met Leu Pro Arg Gly Ile Ile Pro Asn Thr Ile Thr Tyr Ser Ser Met
355 360 365
Ile Asp Gly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met
370 375 380
Phe Tyr Leu Met Xaa Thr Lys Gly Cys Ser Pro Xaa Xaa Xaa Thr Phe
385 390 395 400
Asn Thr Leu Ile Asp Gly Tyr Xaa Gly Ala Lys Arg Ile Asp Asp Gly
405 4l0 415
Met Glu Leu Leu His Glu Met Thr Glu Xaa Gly Leu Val Ala Xaa Thr
420 425 430
Xaa Thr Tyr Asn Thr Leu Ile His Gly Phe Xaa Xaa Val Gly Asp Leu
435 440 445
Xaa Ala Ala Leu Asp Leu Leu Xaa Glu Met Ile Ser Ser Gly Xaa Cys
450 455 460
Pro Xaa Xaa Val Thr Cys Xaa Thr Leu Leu Asp Gly Leu Cys Asp Asn
465 470 475 480
Gly Lys Leu Lys Asp Ala Xaa Glu Xaa Phe Lys Val Met Gln Lys Ser
485 490 495
Lys Xaa Asp Leu Asp Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp
500 505 510
Val Gln Thr Tyr Asn Ile Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys
515 520 525
Phe Leu Glu Ala Glu Glu Leu Tyr Xaa Glu Met Pro His Arg Gly Ile
530 535 540
Val Pro Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys
545 550 555 560
Gln Ser Arg Leu Asp Glu Ala Thr Gln Met Phe Asp Ser Met Gly Ser
565 570 575
Lys Ser Phe Ser Pro Asn Val Val Thr Phe Thr Thr Leu Ile Xaa Gly
580 585 590
Tyr Cys Lys Ala GlyArg Val Asp Asp Gly Leu Glu Leu Phe Cys Glu
595 600 605
Met Gly Arg Arg Gly Ile Val Ala Asn Xaa Ile Thr Tyr Ile Thr Leu
610 615 620
Ile Xaa Gly Phe Arg Xaa Val Gly Asn Ile Asn Gly Ala Leu Asp Ile
625 630 635 640
Phe Gln Glu Met Ile Ser Ser Gly Val Tyr Pro Xaa Xaa Ile Thr Ile
645 650 655
Arg Xaa Met Leu Thr Gly Leu Trp Ser Lys Glu Glu Leu Lys Arg Xaa
660 665 670
Val Ala Met Leu Glu Xaa Leu Gln Met Ser Xaa Xaa Xaa Xaa Xaa Xaa
675 680 685
Xaa Xaa
690
<210>28
<211>687
<212>PRT
<213>萝卜属
<220>
<221>Xaa
<222>111
<223>Arg或Pro
<221>Xaa
<222>114
<222>Ile或Val
<221>Xaa
<222>140
<223>Leu或Ile
<221>Xaa
<222>150
<223>Val或Ala
<221>Xaa
<222>153
<223>Thr或Asn
<221>Xaa
<222>161
<223>Val或Leu
<221>Xaa
<222>162
<223>Glu或Asp
<221>Xaa
<222>163
<223>Asp或Lys
<221>Xaa
<222>170
<223>Asn或Asp
<221>Xaa
<222>171
<223>Leu或Phe
<221>Xaa
<222>184
<223>Val或Ile
<221>Xaa
<222>185
<223>Val或Ile
<221>Xaa
<222>196
<223>Arg或Tyr
<221>Xaa
<222>200
<223>Ile或Val
<221>Xaa
<222>211
<223>Met或Leu
<221>Xaa
<222>218
<223>Thr或Asp
<221>Xaa
<222>232
<223>Lys或Met
<221>Xaa
<222>248
<223>Val或Leu
<221>Xaa
<222>252
<223>Ile或Lys
<400>28
Met Leu Ala Arg Val Cys Gly Phe Lys Cys Ser Ser Sar Pro Ala Glu
1 5 10 15
Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg Asp Thr Leu Ala
20 25 30
Lys Ala Ser Gly Glu Ser Cys Glu Ala Gly Phe Gly Gly Glu Ser Leu
35 40 45
Lys Leu Gln Ser Gly Phe His Glu Ile Lys Gly Leu Glu Asp Ala Ile
50 55 60
Asp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser Val Val
65 70 75 80
Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Glu Arg Pro Asp
85 90 95
Leu Val Ile Ser Leu Tyr Gln Lys Met Glu Arg Lys Gln Ile Xaa Cys
100 105 110
Asp Xaa Tyr Ser Phe Asn Ile Leu Ile Lys Cys Phe Cys Ser Cys Ser
115 120 125
Lys Leu Pro Phe Mla Leu Ser Thr Phe Gly Lys Xaa Thr Lys Leu Gly
130 135 140
Leu His Pro Asp Val Xaa Thr Phe Xas Thr Leu Leu His Gly Leu Cys
145 150 155 160
Xaa Xaa Xaa Arg Val Ser Glu Ala Leu Xaa Xaa Phe His Gln Met Phe
165 170 175
Glu Thr Thr Cys Arg Pro Asn Xaa Xaa Thr Phe Thr Thr Leu Met Asn
180 185 190
Gly Leu Cys Xaa Glu Gly Arg Xaa Val Glu Ala Val Ala Leu Leu Asp
195 200 205
Arg Met Xaa Glu Asp Gly Leu Gln Pro Xaa Gln Ile Thr Tyr Gly Thr
210 215 220
Ile Val Asp Gly Met Cys Lys Xaa Gly Asp Thr Val Ser Ala Leu Asn
225 230 235 240
Leu Leu Arg Lys Met Glu Glu Xaa Ser His Ile Xaa Pro Asn Val Val
245 250 255
Ile Tyr Ser Ala Ile Ile Asp Ser Leu Cys Lys Asp Gly Arg His Ser
260 265 270
Asp Ala Gln Asn Leu Phe Thr Glu Met Gln Glu Lys Gly Ile Phe Pro
275 280 285
Asp Leu Phe Thr Tyr Asn Ser Met Ile Val Gly Phe Cys Ser Ser Gly
290 295 300
Arg Trp Ser Asp Ala Glu Gln Leu Leu Gln Glu Met Leu Glu Arg Lys
305 310 315 320
Ile Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn Ala Phe Val
325 330 335
Lys Glu Gly Lys Phe Phe Glu Ala Glu Glu Leu Tyr Asp Glu Met Leu
340 345 350
Pro Arg Gly Ile Ile Pro Asn Thr Ile Thr Tyr Ser Ser Met Ile Asp
355 360 365
Gly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met Phe Tyr
370 375 380
Leu Met Ala Thr Lys Gly Cys Ser Pro Asn Leu Ile Thr Phe Asn Thr
385 390 395 400
Leu Ile Asp Gly Tyr Cys Gly Ala Lys Arg lle Asp Asp Gly Met Glu
405 410 415
Leu Leu His Glu Met Thr Glu Thr Gly Leu Val Ala Asp Thr Thr Thr
420 425 430
Tyr Asn Thr Leu Ile His Gly Phe Tyr Leu Val Gly Asp Leu Asn Ala
435 440 445
Ala Leu Asp Leu Leu Gln Glu Met Ile Ser Ser Gly Leu Cys Pro Asp
450 455 460
Ile Val Thr Cys Asp Thr Leu Leu Asp Gly Leu Cys Asp Asn Gly Lys
465 470 475 480
Leu Lys Asp Ala Leu Glu Met Phe Lys Val Met Gln Lys Ser Lys Lys
485 490 495
Asp Leu Asp Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp Val Gln
500 505 510
Thr Tyr Asn Ile Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys Phe Leu
515 520 525
Glu Ala Glu Glu Leu Tyr Glu Glu Met Pro His Arg Gly Ile Val Pro
530 535 540
Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys Gln Ser
545 550 555 560
Arg Leu Asp Glu Ala Thr Gln Met Phe Asp Ser Met Gly Ser Lys Ser
565 570 575
Phe Ser Pro Asn Val Val Thr Phe Thr Thr Leu Ile Asn Gly Tyr Cys
580 585 590
Lys Ala Gly Arg Val Asp Asp Gly Leu Glu Leu Phe Cys Glu Met Gly
595 600 605
Arg Arg Gly Ile Val Ala Asn Ala Ile Thr Tyr Ile Thr Leu Ile Cys
610 615 620
Gly Phe Arg Lys Val Gly Asn Ile Asu Gly Ala Leu Asp Ile Phe Gln
625 630 635 640
Glu Met Ile Ser Ser Gly Val Tyr Pro Asp Thr Ile Thr Ile Arg Asn
645 650 655
Met Leu Thr Gly Leu Trp Ser Lys Glu Glu Leu Lys Arg Ala Val Ala
660 665 670
Met Leu Glu Lys Leu Gln Met Ser Met Asp Leu Ser Phe Gly Gly
675 680 685
<210>29
<211>687
<212>PRT
<213>萝卜属
<220>
<221>Xaa
<222>140
<223>Leu或Ile
<221>Xaa
<222>170
<223>Asn或Asp
<221>Xaa
<222>171
<223>Leu或Phe
<400>29
Met Leu Ala Arg Val Cys Gly Phe Lys Cys Ser Ser Ser Pro Ala Glu
1 5 10 15
Ser Ala Ala Arg Leu Phe Cys Thr Arg Ser Ile Arg Asp Thr Leu Ala
20 25 30
Lys Ala Ser Gly Glu Ser Cys Glu Ala Gly Phe Gly Gly Glu Ser Leu
35 40 45
Lys Leu Gln Ser Gly Phe His Glu Ile Lys Gly Leu Glu Asp Ala Ile
50 55 60
Asp Leu Phe Ser Asp Met Leu Arg Ser Arg Pro Leu Pro Ser Val Val
65 70 75 80
Asp Phe Cys Lys Leu Met Gly Val Val Val Arg Met Glu Arg Pro Asp
85 90 95
Leu Val Ile Ser Leu Tyr Gln Lys Met Glu Arg Lys Gln Ile Arg Cys
100 105 110
Asp Ile Tyr Ser Phe Asn Ile Leu Ile Lys Cys Phe Cys Ser Cys Ser
115 120 125
Lys Leu Pro Phe Ala Leu Ser Thr Phe Gly Lys Xaa Thr Lys Leu Gly
130 135 140
Leu His Pro Asp Val Val Thr Phe Thr Thr Leu Leu His Gly Leu Cys
145 150 155 160
Val Glu Asp Arg Val Ser Glu Ala Leu Xaa Xaa Phe His Gln Met Phe
165 170 175
Glu Thr Thr Cys Arg Pro Asn Val Val Thr Phe Thr Thr Leu Met Asn
180 185 190
Gly Leu Cys Arg Glu Ghy Arg Ile Val Glu Ala Val Ala Leu Leu Asp
195 200 205
Arg Met Met Glu Asp Gly Let Gln Pro Thr Gln Ile Thr Tyr Gly Thr
210 215 220
Ile Val Asp Gly Met Cys Lys Lys Gly Asp Thr Val Ser Ala Leu Asn
225 230 235 240
Leu Leu Arg Lys Met Glu Glu Val Ser His Ile Ile Pro Asn Val Val
245 250 255
Ile Tyr Ser Ala Ile Ile Asp Ser Leu Cys Lys Asp Ghy Arg His Ser
260 265 270
Asp Ala Gln Asn Leu Phe Thr Glu Met Gln Glu Lys Gly Ile Phe Pro
275 280 285
Asp Leu Phe Thr Tyr Asn Ser Met Ile Val Gly Phe Cys Ser Ser Gly
290 295 300
Arg Trp Ser Asp Ala Glu Glr Leu Leu Gln Glu Met Leu Glu Arg Lys
305 310 315 320
Ile Ser Pro Asp Val Val Thr Tyr Asn Ala Leu Ile Asn Ala Phe Val
325 330 335
Lys Glu Gly Lys Phe Phe Glu Ala Glu Glu Leu Tyr Asp Glu Met Leu
340 345 350
Pro Arg Gly Ile Ile Pro Asr Thr Ile Thr Tyr Ser Ser Met Ile Asp
355 360 365
Gly Phe Cys Lys Gln Asn Arg Leu Asp Ala Ala Glu His Met Phe Tyr
370 375 380
Leu Met Ala Thr Lys Gly Cys Ser Pro Asn Leu Ile Thr Phe Asn Thr
385 390 395 400
Leu Ile Asp Gly Tyr Cys Gly Ala Lys Arg Ile Asp Asp Gly Met Glu
405 410 415
Leu Leu His Glu Met Thr Glu Thr Gly Leu Val Ala Asp Thr Thr Thr
420 425 430
Tyr Asn Thr Leu Ile His Gly Phe Tyr Leu Val Gly Asp Leu Asn Ala
435 440 445
Ala Leu Asp Leu Leu Gln Glu Met Ile Ser Ser Gly Leu Cys Pro Asp
450 455 460
Ile Val Thr Cys Asp Thr Leu Leu Asp Gly Leu Cys Asp Asn Gly Lys
465 470 475 480
Leu Lys Asp Ala Leu Glu Met Phe Lys Val Met Gln Lys Ser Lys Lys
485 490 495
Asp Leu Asp Ala Ser His Pro Phe Asn Gly Val Glu Pro Asp Val Gln
500 505 510
Thr Tyr Asn Ile Leu Ile Ser Gly Leu Ile Asn Glu Gly Lys Phe Leu
515 520 525
Glu Ala Glu Glu Leu Tyr Glu Glu Met Pro His Arg Gly Ile Val Pro
530 535 540
Asp Thr Ile Thr Tyr Ser Ser Met Ile Asp Gly Leu Cys Lys Gln Ser
545 550 555 560
Arg Leu Asp Glu Ala Thr Gln Met Phe Asp Ser Met Gly Ser Lys Ser
565 570 575
Phe Ser Pro Asn Val Val Thr Phe Thr Thr Leu Ile Asn Gly Tyr Cys
580 585 590
Lys Ala Gly Arg Val Asp Asp Gly Leu Glu Leu Phe Cys Glu Met Gly
595 600 605
Arg Arg Gly Ile Val Ala Asn Ala Ile Thr Tyr Ile Thr Leu Ile Cys
610 615 620
Gly Phe Arg Lys Val Gly Asn Ile Asn Gly Ala Leu Asp Ile Phe Gln
625 630 635 640
Glu Met Ile Ser Ser Gly Val Tyr Pro Asp Thr Ile Thr Ile Arg Asn
645 650 655
Met Leu Thr Gly Leu Trp Ser Lys Glu Glu Leu Lys Arg Ala Val Ala
660 665 670
Met Leu Glu Lys Leu Gln Met Ser Met Asp Leu Ser Phe Gly Gly
675 680 685
<210>30
<211>33
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>30
acataaaaat cactagatac ttgacatgga ggc 33
<210>31
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>31
aagaggagga agatggcatc acagc 25
<210>32
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>32
tggagtaaag aggaactaaa aagggc 26
<210>33
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>33
cagacaatag acgcataaaa ggc 23
<210>34
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>34
gattcctttc tcttgcattt cag 23
<210>35
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>35
atctcgtcct ttaccttctg tgg 23
<210>36
<211>20
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>36
gatccatgca tttgtcaagg 20
<210>37
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>37
catttgtgta gcctcatcta gg 22
<210>38
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>38
gtccggagag cagcccttgg tag 23
<210>39
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列说明:合成DNA
<400>39
tcatcgtata attcttcagc ctc 23