具体实施方式
本发明者使用与到目前为止已知的、作为木脂素羟化酶的多酚氧化酶不同的、属于氧化酶家族的2-酮戊二酸(以下称为2-OG。)依赖性双加氧酶基因作为探针,由芝麻种子cDNA文库中综合式得到芝麻2-OG依赖性双加氧酶样基因群组(以下称为SiD基因)。使得到的各SiD基因在大肠杆菌中表达。使这些重组蛋白质与松脂醇或胡椒醇反应后,使用HPLC分析、LC-MS分析及NMR分析,筛选催化羟基松脂醇或羟基胡椒醇生成的酶。其结果可知,SiD6催化由松脂醇生成9-羟基松脂醇的反应,且可知Sid6催化由胡椒醇生成9-羟基胡椒醇的反应。此木脂素是到目前为止从未报道过的新型羟基木脂素。
以下详细叙述本发明所涉及的具有木脂素羟基化活性的多肽、编码该多肽的多核苷酸及所述多肽、多核苷酸的利用。
(1)多肽
本发明者发现了以木脂素、特别是以胡椒醇及/或松脂醇为主要底物的新型羟化酶,从而完成了本发明。本发明者还发现上述新型羟化酶羟基化胡椒醇,而到目前为止,羟基胡椒醇还未被发现。
首先,本发明提供多肽,其为具有木脂素羟基化活性的多肽,含有(a)序列号:26的氨基酸序列;(b)序列号:26的氨基酸序列中,1~15个氨基酸发生缺失、插入、取代及/或附加的氨基酸序列;或(c)与序列号:26的氨基酸序列有至少80%同源性的氨基酸序列。
在本说明书中使用时,术语“多肽”可与“肽”或“蛋白质”互换使用。此外,多肽的“片段”指该多肽的部分片段。此外,本发明所涉及的多肽可为由天然供给源分离的多肽,也可为化学合成后的多肽。
术语“被分离”的多肽或蛋白质,指从其天然环境中提取的多肽或蛋白质。例如,在宿主细胞中表达的重组产生的多肽及蛋白质,可认为与通过任意的适当的技术实质上纯化的天然或重组的多肽及蛋白质同样被分离。
本发明所涉及的多肽,包括天然的纯化产物、通过化学合成方法合成的产物及由原核生物宿主或真核生物宿主(例如,包括细菌细胞、酵母细胞、高等植物细胞、昆虫细胞及哺乳动物细胞)通过重组技术产生的产物。依赖重组产生方法中所使用的宿主,本发明所涉及的多肽可被羟基化或未被羟基化。且本发明所涉及的多肽在一些时候,作为宿主介导过程的结果,可含有起始改变的蛋氨酸残基。
在本说明书中使用时,“木脂素羟基化活性”是指对木脂素进行羟基化的活性(优选生成9-羟基化木脂素活性),即指向木脂素转移羟基的活性。即在本说明书中使用时,羟化酶与羟基转移酶可互换使用。
在实施方式之一中,本发明所涉及的多肽优选是由序列号26的氨基酸序列组成的多肽。
在其他实施方式中,本发明所涉及的多肽优选是如上所述的由序列号26的氨基酸序列组成的多肽的突变体、且具有木脂素羟基化活性。
此种突变体可例举为包含缺失、插入、倒位、重复、及形式(type)取代(例如,亲水性残基取代为其他残基,但是通常,强疏水性残基不取代强亲水性残基)的突变体。特别是多肽中,“中性”氨基酸取代一般基本不影响其多肽的活性。
多肽氨基酸序列中的一些氨基酸可在不显著影响此多肽的结构或功能的情况下被容易地改变,这是该领域中众所周知的。且不仅是人为改变,在天然的蛋白质中存在有不使该蛋白质的结构或功能显著改变的突变体也是众所周知的。
本领域技术人员可使用周知技术,容易地使多肽氨基酸序列中1~多个氨基酸发生突变。例如,根据公知的定点诱变法,可使编码多肽的多核苷酸的任意碱基发生突变。此外,可针对编码多肽的多核苷酸的任意位点设计引物,制备缺失突变体或附加突变体。且如使用本说明书中所述的方法,可容易地确定所制备的突变体是否具有所需活性。
优选突变体具有保守性或非保守性氨基酸取代、缺失或添加。优选沉默取代、添加及缺失,特别优选保守性取代。这些均不改变本发明所涉及的多肽活性。
被认为是代表性的保守性取代,为脂肪族氨基酸Ala、Val、Leu、及Ile中1个氨基酸取代为其他氨基酸;羟基残基Ser及Thr的互换、酸性残基Asp及Glu的互换、酰胺残基Asn及Gln之间的取代、碱基性残基Lys及Arg的互换、以及芳香族残基Phe、Tyr之间的取代。
如上详示,有关哪种氨基酸的变化可能是沉默表达型(即是否对功能无显著有害的效果)的进一步的介绍,可见于Bowie,J.U.等《Deciphering theMessage in Protein Sequences:Tolerance to Amino AcidSubstitutions》,Science 247:1306-1310(1990)(在本说明书中作为参考引用)中。
本发明中的优选多肽,是具有木脂素羟基化活性的多肽,含有(a)序列号:26的氨基酸序列;或(b’)序列号:26的氨基酸序列中,1~多个氨基酸发生缺失、插入、取代及/或附加的氨基酸序列。此种突变多肽,不局限于如上所述的、具有通过公知的突变多肽制备法人为导入的突变的多肽,还可以是分离纯化天然存在的多肽后的产物。
本发明所涉及的多肽,可以是氨基酸以肽键结合形成的多肽,但不限于此,也可为包含多肽以外的结构的复合多肽。在本说明书中使用时,“多肽以外的结构”,可例举为糖链、异戊二烯基等,但无特别限定。
此外,本发明所涉及的多肽也可包含附加多肽。附加多肽,例如可为组氨酸标签(His tag)、c-Myc标签(c-Myc tag)、Flag等的表位标记多肽。
此外,本发明所涉及的多肽,可以是将编码本发明所涉及的多肽的多核苷酸导入宿主细胞中,使该多肽在细胞内表达的状态,也可以是从细胞、组织等中分离纯化的状态。且本发明所涉及的多肽也可为化学合成。
在其他的实施方式中,本发明所涉及的多肽可如融合蛋白一样,以改变了的形态重组表达。例如,本发明所涉及的多肽的附加氨基酸[标签(tag)]、特别是带电氨基酸的区域,为改善在宿主细胞内、在纯化期间或持续操作及保存期间的稳定性及持续性,可附加在多肽的N末端及/或C末端。多肽可具有多个标签(tag),各个标签(tag)的位置可分离也可连续。
在本实施方式中涉及的多肽的N末端或C末端可附加标签(tag)标记[标签(tag)序列或标记(marker)序列],标签标记,例如是编码使融合多肽容易进行纯化的肽的序列。此种序列可在多肽的最终制备前除去。在本发明的此特定优选实施方式中,标签氨基酸序列是六聚组氨酸肽[例如,由pQE载体(Qiagen,Inc.)提供的标签],其他情况下,很多可由公共的及/或商业手段获得。例如,如Gentz等、Proc.Natl.Acad.Sci.USA 86:821-824(1989)(本说明书中作为参考引用)中记载,六聚组氨酸用于融合蛋白的简单的纯化。“HA”标签是用于针对来自流感红血球凝集素(HA)蛋白的表位进行纯化的其他有用的肽,在Wilson等、Cell 37:767(1984)(本说明书中作为参考引用)中有所记载。其他的此种融合蛋白,包括在N或C末端进行Fc融合的本实施方式所涉及的多肽或其片段。
本发明所涉及的多肽,如以下详述可重组生成,也可化学合成。
重组生成的进行可使用该领域中众所周知的方法,例如,可使用以下详述的载体及细胞进行。
合成肽可使用化学合成的公知方法合成。例如,Houghten记载了用于多数的肽合成的简单方法,其中,多数的肽为用不足4星期时间制备且具有特征的、表示HA1多肽片段的单一氨基酸改造物的10~20mg的248个不同的13残基肽。Houghten,R.A.,Proc.Natl.Acad.Sci.USA 82:5131-5135(1985)。此“Simultaneous Multiple Peptide Synthesis(SMPS)”方法并在Houghten等(1986)的美国专利第4,631,211号中记载。此方法中,将用于各种肽的固相合成的各种树脂置于各自的溶剂透过性袋(packet)中,可最佳使用与固相法相关的大量相同的重复工序。完整的操作手册的步骤,可同时进行500~1000以上的合成(Houghten等、前面已出现、5134)。这些文献在本说明书中作为参考引用。
如下详述,本发明所涉及的多肽,在用于对木脂素进行羟基化以得到羟基化木脂素的方法及在试剂盒中有用。
本发明所涉及的多肽,可催化木脂素(特别是胡椒醇或松脂醇)的羟基化反应。
如此可以说,本发明所涉及的多肽至少含有序列号26所示的氨基酸序列即可。即应该注意的是,由序列号26所示的氨基酸序列和具有特定功能[例如标签(tag)]的任意的氨基酸序列组成的多肽也包含于本发明中。且序列号26所示的氨基酸序列及该任意的氨基酸序列,可在不妨碍各自功能的情况下用适合的连接肽连接。
此外,本发明所涉及的多肽,因该多肽除具有对松脂醇进行羟基化的活性以外还具有对胡椒醇进行羟基化的活性,所以,该多肽的用途应不限定于对松脂醇进行羟基化生成它们的羟基化物。
也就是说,本发明的目的在于提供具有对木脂素进行羟基化活性的多肽,不在于本说明书中具体记载的多肽制备方法等。因此,必须注意的是,通过上述各方法以外的方法得到的具有羟基化木脂素活性的多肽也属于本发明的技术范围。
(2)多核苷酸
此外,本发明还提供编码具有木脂素羟基化活性的本发明所涉及的多肽的多核苷酸。具体地说,本发明提供多核苷酸,其特征在于,是下述(a)~(e)的任一个。
(a)多核苷酸,其含有序列号27的碱基序列;
(b)多核苷酸,其编码含有序列号:26的氨基酸序列的蛋白质;
(c)多核苷酸,其编码序列号:26的氨基酸序列中,1~15个氨基酸发生缺失、取代、插入及/或附加的、且具有木脂素羟基化活性的多肽;
(d)多核苷酸,其编码与序列号:26的氨基酸序列有至少80%同源性、且具有木脂素羟基化活性的多肽;或
(e)多核苷酸,其与序列号:27的碱基序列的互补碱基序列所组成的多核苷酸在严谨条件下杂交,且编码具有木脂素羟基化活性的多肽。
在本说明书中使用时,术语“多核苷酸”可与“基因”、“核酸”或“核酸分子”互换使用,指核苷酸的聚合体。在本说明书中使用时,术语“碱基序列”可与“核酸序列”或“核苷酸序列”互换使用,用脱氧核糖核酸(省略为A、G、C及T)的序列表示。“含有序列号1所示的碱基序列的多核苷酸或其片段”是指包含用序列号1的各脱氧核苷酸A、G、C及/或T表示的序列的多核苷酸或其片段部分。
本发明所涉及的多核苷酸可以RNA(例如mRNA)的形态或DNA的形态(例如cDNA或基因组DNA)存在。DNA可以是双链或单链。单链DNA或RNA可以是编码链(也称作正义链)或也可以是非编码链(也称为反义链)。
在本说明书中使用时,术语“寡核苷酸”是指几个至数十个核苷酸结合的产物,可与“多核苷酸”互换使用。寡核苷酸,短的称为二核苷酸(二聚体)、三核苷酸(三聚体),长的用30mers或100mers聚合的核苷酸的数量表示。寡核苷酸可作为更长的多核苷酸的片段生成,也可化学合成。
本发明所涉及的多核苷酸的片段,至少为12nt(核苷酸),优选为至少约15nt,更优选为至少约20nt,且更优选为至少约30nt,进一步更优选为至少约40nt长度的片段。至少20nt长度的片段,例如是指包含序列号1所示的碱基序列中的20个以上连续的碱基片段。参考本说明书,因本说明书已提供序列号1所示的碱基序列,所以,本领域技术人员可容易地制备基于序列号1的DNA片段。例如,为制备各种大小的片段,可方便地使用限制性核酸内切酶来切割或通过超音波剪切,或此种片段也可合成制备。适合的片段(寡核苷酸)可通过Applied Biosystems Incorporated(ABI,850 Lincoln CenterDr.,Foster City,CA 94404)392型合成仪等合成。
本发明所涉及的多核苷酸,其5’端或3’端可与编码上述标签(tag)标记[标签(tag)序列或标记(marker)序列)]的多核苷酸融合。
本发明所涉及的多核苷酸,优选编码具有木脂素羟基化活性的多肽或其突变体的多核苷酸。
本发明提供编码具有木脂素羟基化活性的多肽的多核苷酸的突变体。“突变体”,可如天然的等位基因突变体一样天然形成。“等位基因突变体”,是指占据生物染色体上指定基因座的基因的一些可交替的形态之一。非天然存在的突变体,例如可使用该领域众所周知的诱变技术生成。
在实施方式之一中,本发明所涉及的多核苷酸,优选编码具有木脂素羟基化活性的多肽的多核苷酸的碱基序列中1个~多个碱基发生缺失、插入、取代或附加的突变体。突变体可在编码区或非编码区或其两者中产生突变。编码区中的突变,可产生保守或非保守的氨基酸的缺失、插入、取代及/或附加。
本发明中的优选多核苷酸,编码具有木脂素羟基化活性的多肽,且是下述(f)~(i)中的任一个多核苷酸。
(f)多核苷酸,其由序列号:27的碱基序列组成;
(g)多核苷酸,其与序列号:27的碱基序列的互补碱基序列所组成的多核苷酸在严谨条件下杂交;
(h)多核苷酸,其由与序列号:27的碱基序列至少90%同源的碱基序列组成;或
(i)多核苷酸,其为序列号:27的碱基序列中,1~多个碱基发生缺失、插入、取代及/或附加的多核苷酸。
在其他的实施方式中,本发明所涉及的多核苷酸,包括编码具有木脂素羟基化活性的多肽的多核苷酸、或与该多核苷酸在严谨杂交条件下杂交的多核苷酸,优选分离后的多核苷酸。
本发明中最优选的多核苷酸,是序列号:27的碱基序列所组成的多核苷酸。
杂交可使用如Sambrook等、Molecular Cloning,A LaboratoryManual,2d Ed.,Cold Spring Harbor Laboratory(1989)中所述的众所周知的方法进行。通常温度越高,盐浓度越低,其严谨性越高(杂交越难),可获得更高同源性的多核苷酸。适宜的杂交温度因碱基序列、其碱基序列的长度不同而不同,例如,以编码6个氨基酸的18个碱基所组成的DNA片段为探针使用时,优选50℃以下的温度。
在此,“在严谨条件下杂交的多核苷酸”是指例如,以序列号:27的碱基序列的互补碱基序列所组成的多核苷酸或编码序列号:26的氨基酸序列的多核苷酸的全部或一部分为探针,通过使用菌落杂交法、噬菌斑杂交法或Southern杂交法等所得到的多核苷酸(例如,DNA)。杂交的方法,例如可使用Molecular Cloning 3rd Ed.、Current Protocols in Molecular Biology,John Wiley & Sons 1987-1997等中所记载的方法。
本说明书中所述的“严谨条件”,可为低严谨条件、中严谨条件及高严谨条件中的任一种。“低严谨条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、32℃的条件。“中严谨条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、42℃的条件。“高严谨条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、50℃的条件。在上述条件中,越提高温度,越能期待高效获得具有高同源性的多核苷酸(例如,DNA)。但影响杂交严谨性的因素还可为温度、探针浓度、探针长度、离子强度、时间、盐浓度等多种因素,本领域技术人员可通过适当选择这些因素,实现同样的严谨条件。
且杂交中使用市售的试剂盒时,例如,可使用Alkphos Direct LabellingReagents(Amersham Pharmacia公司制)。此时,根据试剂盒中附带的说明方案,与标记后的探针保温过夜后,将膜在55℃的条件下用含有0.1%(w/v)SDS的1次洗涤缓冲液洗涤,之后可检测杂交后的多核苷酸(例如,DNA)。
除上述以外,可杂交的多核苷酸,通过FASTA、BLAST等同源性搜索软件,使用默认参数计算时,可例举为与编码序列号:26的多核苷酸有80%以上、81%以上、82%以上、83%以上、84%以上、85%以上、86%以上、87%以上、88%以上、89%以上、90%以上、91%以上、92%以上、93%以上、94%以上、95%以上、96%以上、97%以上、98%以上、99%以上、99.1%以上、99.2%以上、99.3%以上、99.4%以上、99.5%以上、99.6%以上、99.7%以上99.8%以上、99.9%以上同源性的多核苷酸。
且氨基酸序列、碱基序列的同源性,可使用根据Karlin及Altschul的BLAST算法(Proc.Natl.Acad.Sci.USA,87,2264-2268,1990;Proc.Natl.Acad.Sci.USA,90:5873,1993)决定。开发了基于BLAST算法、被称为BLASTN、BLASTX的程序(Altschul SF,et al:J.Mol.Biol.215:403,1990)。使用BLASTN分析碱基序列时,参数例如为score=100、wordlength=12。且使用BLASTX分析氨基酸序列时,参数例如为score=50、wordlength=3。使用BLAST和Gapped BLAST程序时,使用各程序的默认参数。
且本发明提供上述多核苷酸的片段或其互补序列所组成的寡核苷酸。
即使在本发明所涉及的寡核苷酸不编码木脂素羟基化多肽时,本领域技术人员也可容易地理解,本发明所涉及的多核苷酸可作为聚合酶链式反应(PCR)的引物用于制备本发明所涉及的多肽。不编码木脂素羟基化多肽的本发明所涉及的寡核苷酸的其他用途,可例举为以下各项:(1)cDNA文库中的木脂素羟化酶基因或其等位基因或拼接改造物的分离;(2)用于提供木脂素羟化酶基因的正确的染色体位置的、向分裂中期染色体铺展的原位杂交(例如,“FISH”)(Verma等,Human Chromosomes:A Manual of BasicTechniques,Pergamon Press,New York(1988)中所记载);及(3)用于检测特定组织中木脂素羟化酶mRNA表达的Northern印迹分析。
本发明所涉及的多核苷酸或寡核苷酸,不仅仅为双链DNA,包括构成其的正义链及反义链的各单链DNA、RNA。本发明所涉及的多核苷酸或寡核苷酸,可作为用于通过反义RNA机理的基因表达操作的工具使用。通过反义RNA技术,可观察到来自内源性基因的基因产物的减少。通过导入本发明所涉及的寡核苷酸,可使具有木脂素羟基化活性的多肽的含量降低,其结果,可控制植物中的羟基化木脂素含量或含量比(增加或减少)。本发明所涉及的多核苷酸或寡核苷酸,可以是包含非翻译区(UTR)的序列、载体序列(包括表达载体序列)等的序列。
获得本发明所涉及的多核苷酸或寡核苷酸的方法,可例举为分离包含本发明所涉及的多核苷酸或寡核苷酸的DNA片段的各种公知的方法。例如,制备与本发明所涉及的多核苷酸碱基序列的一部分特异性杂交的探针,筛选基因组DNA文库或cDNA文库,可得到本发明所涉及的多核苷酸或寡核苷酸。此种探针,只要是与本发明所涉及的多核苷酸的碱基序列或其互补序列的至少一部分特异性杂交的多核苷酸(寡核苷酸)即可。
通过此种杂交筛选的多核苷酸,可例举为天然的多核苷酸(例如,来自芝麻科植物、苔藓植物等植物的多核苷酸),也可为来自植物以外的多核苷酸。
获得本发明所涉及的多核苷酸的其他方法,可为使用PCR的方法。该PCR扩增方法的特征在于,例如,包括利用本发明所涉及的多核苷酸的cDNA的5’端及/或3’端的序列(或其互补序列)制备引物的工序、使用上述引物以基因组DNA(或cDNA)等为模板进行PCR扩增的工序,使用本方法,即可大量获得含有本发明所涉及的多核苷酸的DNA片段。
用于得到本发明所涉及的多核苷酸的供给源无特别限定,但优选含有胡椒醇或松脂醇的生物材料。在本说明书中使用时,术语“生物材料”指生物学样品(由生物体得到的组织样品或细胞样品)。下述实施例中使用芝麻,但不限于此。
使用本发明所涉及的多核苷酸,可合成转化体或在细胞中具有木脂素羟基化活性的多肽。
使用本发明所涉及的多核苷酸,通过检测杂交的多核苷酸,可容易地检测出表达了具有木脂素羟基化活性的多肽的生物。
本发明所涉及的寡核苷酸,通过作为检测编码具有木脂素羟基化活性的多肽的多核苷酸的杂交探针或用于扩增该多核苷酸的引物使用,可容易地检测出表达了具有木脂素羟基化活性的多肽的生物或组织。且进一步,将上述寡核苷酸作为反义寡核苷酸使用,可抑制上述生物体或其组织或细胞中具有木脂素羟基化活性的多肽的表达。
本发明所涉及的多核苷酸,由该多核苷酸编码的多肽除具有对松脂醇进行羟基化的活性以外,还具有对胡椒醇进行羟基化的活性。因此,本发明所涉及的多核苷酸的用途,不限定于仅将松脂醇作为底物进行羟基化,生成这些羟基化物(例如,9位的羟基化物)。
也就是说,本发明的目的在于,提供编码具有对胡椒醇或松脂醇进行羟基化活性的多肽的多核苷酸、及与该多核苷酸杂交的寡核苷酸,而不在于本说明书中具体记载的多核苷酸及寡核苷酸的制备方法等。因此,必须注意的是,通过上述各方法以外的方法得到的、编码具有对胡椒醇或松脂醇进行羟基化活性的多肽的多核苷酸,也属于本发明的技术范围。
(3)本发明所涉及的多肽或多核苷酸的利用
本发明还提供通过使用本发明所涉及的多肽或多核苷酸,用于调节(增加或减少)生物(优选植物)中的木脂素及羟基化木脂素的量的方法及该得到调节的生物(优选植物)的利用。
(A)载体
本发明提供为生成具有木脂素羟基化活性的多肽而使用的载体。本发明所涉及的载体可以是用于体外翻译的载体,也可以是用于重组表达的载体。
本发明所涉及的载体只要含有上述本发明所涉及的多核苷酸,无特别限定。例如,可例举为插入了编码具有木脂素羟基化活性的多肽的多核苷酸的cDNA的重组表达载体等。重组表达载体的制备方法可例举使用质粒、噬菌体或粘粒等的方法,无特别限定。
载体的具体种类无特别限定,可适当选择在宿主细胞中可表达的载体。即选择与宿主细胞的种类相应的、确实使本发明所涉及的多核苷酸表达的适合的启动子序列,将其与本发明的多核苷酸整合进各种质粒等中的载体作为表达载体使用。
本发明所涉及的表达载体,依赖于应导入的宿主的种类,含有表达调控区(例如,启动子、终止子及/或复制起点等)。作为细菌用表达载体的启动子,可使用常用的启动子(例如,trc启动子、tac启动子、lac启动子等),作为酵母用启动子,例如可例举为3-磷酸甘油醛脱氢酶启动子、PH05启动子等,作为丝状菌用启动子例如可例举为淀粉酶、trpC等。并且作为动物细胞宿主用启动子可例举为病毒性启动子(例如,SV40早期启动子、SV40晚期启动子等)。表达载体的制备,可使用限制酶及/或连接酶等根据常用的方法进行。通过表达载体的宿主的转化也根据常用的方法进行。
将使用上述表达载体转化的宿主进行培养、栽培或饲育后,可从培养物等中根据常用的方法(例如,过滤、离心分离、细胞破碎、凝胶过滤色谱法、离子交换色谱法等),回收、纯化目的蛋白质。
表达载体优选含有至少1个选择标记。此种标记,真核生物细胞培养时可例举为二氢叶酸还原酶或新霉素抗性遺伝子及大肠杆菌(E.coli)、及其他细菌中的培养时可例举为四环素抗性基因或氨苄青霉素抗性基因。
只要使用上述选择性标记,即可确认宿主细胞中是否导入了本发明所涉及的多核苷酸,且可进一步确认在宿主细胞中是否确实进行了表达。或也可将本发明所涉及的多肽作为融合多肽使其表达,例如,也可将来自碗水母(Aequorea coerulescens)的绿色荧光多肽GFP(Green FluorescentProtein)作为标记使用,将本发明所涉及的多肽作为GFP融合多肽使其表达。
上述的宿主细胞无特别限定,可优选使用以往公知的各种细胞。具体地说,例如,可例举为大肠杆菌(Escherichia coli)等的细菌、酵母(酿酒酵母Saccharomyces cerevisiae、裂殖酵母SchizoSaccharomycespombe)、线虫(Caenorhabditis elegans)、非洲爪蟾(Xenopus laevis)的卵母细胞等,但无特别限定。用于上述宿主细胞的适合的培养基及条件为本领域所公知。
将上述表达载体导入宿主细胞的方法即转化法也无特别限定,可优选使用电穿孔法、磷酸钙法、脂质体法、DEAE葡聚糖法等以往公知的方法。此外,例如,用昆虫转移表达本发明所涉及的多肽时,可利用使用了杆状病毒的表达系统。
如使用本发明所涉及的载体、将上述多核苷酸导入生物或细胞中,即可使该生物或细胞中具有木脂素羟基化活性的多肽表达。且只要将本发明所涉及的载体用于无细胞蛋白质合成系统,即可合成具有木脂素羟基化活性的多肽。
如此可以说,本发明所涉及的载体至少含有编码本发明所涉及的多肽的多核苷酸即可。即应注意的是,表达载体以外的载体也包含于本发明的技术范围中。
即本发明的目的在于,提供含有编码本发明所涉及的多肽的多核苷酸的载体,而不在于本说明书中具体记载的各个载体种类及细胞种类、以及载体制备方法及细胞导入方法。因此,必须注意的是,使用上述以外的载体种及载体制备方法制得的载体,也属于本发明的技术范围。
(B)转化体或细胞
本发明提供导入了如上所述的编码具有木脂素羟基化活性的多肽的多核苷酸的转化体或细胞。在本说明书中使用时,术语“转化体”不仅包括组织或器官,还包括生物个体。
转化体或细胞的制备方法(生产方法)无特别限定,例如,可例举将上述重组载体导入宿主后转化的方法。此外,成为转化对象的生物也无特别限定,可以是在上述宿主细胞中例举的各种微生物、植物或动物。
本发明所涉及的转化体或细胞,其特征在于,上述转化体或细胞中天然具有的木脂素及/或羟基化木脂素的组成已被改变。本发明所涉及的转化体或细胞,优选来自植物或其后代或来自植物或其后代的组织,特别优选为芝麻、连翘或亚麻。此种转化体或细胞,可通过使用控制本发明所涉及的羟基化木脂素含量的方法,增加或减少产生木脂素的生物中的羟基化木脂素含量。
在实施方式之一中,本发明所涉及的转化体可以是植物转化体。本实施方式所涉及的植物转化体,可通过将含有本发明所涉及的多核苷酸的重组载体导入植物中,使该多核苷酸编码的多肽可表达,从而得到该植物转化体。
使用重组表达载体时,用于植物体转化的重组表达载体,只要是可使本发明所涉及的多核苷酸在该植物内表达的载体,无特别限定。此种载体,例如,可例举为具有在植物细胞内使多核苷酸组成型表达的启动子(例如,花椰菜花叶病毒的35 S启动子)的载体或具有通过外界刺激而被诱导性地激活的启动子(例如,金属硫蛋白启动子)的载体。
本发明中成为转化对象的植物,可以指植物体全株、植物器官(例如叶、花瓣、茎、根、种子等)、植物组织(例如表皮、韧皮部、薄壁组织、木质部、维管束、柵状组织、海绵组织等)或植物培养细胞或各种形态的植物细胞(例如,悬浮培养细胞)、原生质体、叶片切片、愈伤组织等的任一个。用于转化的植物无特别限定,可属于单子叶植物纲或双子叶植物纲的植物的任一个。
向植物内导入基因,可使用本领域技术人员公知的转化方法(例如,土壤杆菌法、基因枪法、PEG法、电穿孔法等)。例如,土壤杆菌介导的方法和直接向植物细胞导入的方法为众所周知。使用土壤杆菌法时,将构建的植物用表达载体导入适合的土壤杆菌[例如,根癌土壤杆菌(Agrobacteriumtumefaciens)],此菌株根据叶盘法(内宫博文著,植物基因操作手册,1990,27~31页,讲谈社scientific,东京)(日语原名:「内宫博文著,植物遺伝子操作マニユアル,1990,27~31頁,講談社サイエンテイフイツク,東京」)等感染无菌培养叶片,可获得转化植物。还可使用Nagel等的方法[Micribiol.Lett.,67,325(1990)]。此方法为如下方法,首先,例如将表达载体导入土壤杆菌,然后将经转化的土壤杆菌用Plant Molecular BiologyManual(S.B.Gelvin等、Academic Press Publishers)中记载的方法导入植物细胞或植物组织。此处,“植物组织”包括通过植物细胞培养而得到的愈伤组织。使用土壤杆菌法进行转化时,可使用双元载体(pBI121或pPZP202等)。
将基因直接导入植物细胞或植物组织的方法,已知有电穿孔法、基因枪法。使用基因枪时,可直接使用植物体、植物器官、植物组织自身,可在制备切片后使用,也可制备原生质体后使用。可将如此制备的样品使用基因导入装置[例如PDS-1000(BIO-RAD公司)等]处理。处理条件因植物或样品不同而不同,通常用450~2000psi左右的压力、4~12cm左右的距离进行。
导入了基因的细胞或植物组织,首先使用潮霉素抗性等的抗药性选择,其次通过常规方法使植物体再生。由转化细胞进行的植物体的再生,可用与植物细胞的种类相应的本领域技术人员公知的方法进行。
将植物培养细胞作为宿主使用时,转化是将重组载体用基因枪、电穿孔法等导入培养细胞。作为转化结果而得到的愈伤组织、芽条、须根等可直接用于细胞培养、组织培养或器官培养,还可使用以往已知的植物组织培养法,通过投入适当浓度的植物激素(生长素、细胞分裂素、赤霉素、脱落酸、乙烯、油菜素内酯等)使植物体再生。
确认基因是否被导入,可通过PCR法、Southern杂交法、Northern杂交法等进行。例如,从转化植物中制备DNA,设计DNA特异性引物以进行PCR。PCR可用与制备上述质粒时所使用的条件同样的条件进行。之后,对扩增产物进行琼脂糖凝胶电泳、聚丙烯酰胺凝胶电泳或毛细管电泳等,用溴化乙锭、SYBRGreen液等染色,且通过检测扩增产物的1条扩增带,可确认进行了转化。此外,使用预先通过荧光色素等标记的引物进行PCR,也可检测扩增产物。而且也可采用在酶标板等的固相上结合扩增产物,通过荧光或酶反应等确认扩增产物的方法。
一旦获得本发明所涉及的多核苷酸整合进基因组内的转化体,即可通过该植物体的有性生殖或无性生殖得到其后代。从该植物体或其后代或这些的克隆中,例如可得到种子、果实、切穗、块茎、块根、植株、愈伤组织、原生质体等,以这些为基础可进行该植物体的量产。因此,本发明中也包括可表达地导入本发明所涉及的多核苷酸的植物体或与该植物体具有同源特性的该植物体的后代或来自它们的组织。
此外,已报到了各种植物的转化方法。本发明所涉及的转化体植物,例如,可例举为芝麻、稻子、烟草、大麦、小麦、菜籽、马铃薯、番茄、杨树、香蕉、桉树、甘薯、黄豆、紫花苜蓿、羽扇豆、玉米、菜花、月季、菊花、香石竹、金鱼草、仙客来、兰花、洋桔梗、小苍兰、非洲菊、唐菖蒲、霞草、长寿花、百合、天竺葵、老鹳草、矮牵牛、蓝猪耳、郁金香、连翘、拟南芥及百脉根等,但并不限于此。
在优选实施形态中,可使用芝麻制备与本发明有关的转化体。芝麻转化体的制备方法,例如,可例举T.Asamizu:Transformation of sesame plantsusing MAT vector system:introduction of fatty acid desaturasegenes.Sesame Newsletter 16:22~25(2002)中记载的公知的方法。连翘的转化,可例举Carlo Rosati,et al.:Regeneration andAgrobacterium-mediated transuformation of Forsytia×intermedia“Spring Glory”中记载的公知的方法。
因使用上述得到的转化芝麻及连翘,可在该芝麻内生产羟基化木脂素,所以,可用低成本且对环境负荷低的生产流程生产羟基化木脂素(羟基胡椒醇及/或羟基松脂醇)。
在其他优选实施方式中,本发明所涉及的转化体可优选用于烟草。烟草与矮牵牛等均是容易转化的代表性植物,由1个去除了细胞壁的细胞(原生质体)即可再生1个植物个体。此再生的1个植物个体,因与来自多细胞的1个体不同,不会形成嵌合状,所以可高效制备转化体。
烟草转化的优选方法可例举叶盘法。此方法是操作简便,且从1枚叶切片可得到多个独立转化体的方法。转化的方法,如“新生物化学实验手册3核酸的分离·分析和基因实验法 化学同人1996年”(日语原名:「新生物化学実験の手引き3 核酸の分離·分析と遺伝子実験法 化学同人1996年」)中记载。
具体地说,在无菌培养皿上从无菌培育的烟草的叶上切取叶盘,将切取的叶盘在NB培养基中进行预培养。然后,将预培养后的叶盘浸入土壤杆菌的感染菌液中共培养,将叶盘植入补充了羧苄青霉素和卡那霉素的NB培养基中,由叶盘开始继代培养形成愈伤组织直至产生芽条后,可得到芽条。芽条生长到与茎叶部的区别很明确时,从茎部切取,移入不含抗生物质及激素的MS培养基中。切取的芽条生根后,将其在温室培养。将芽条移入含有激素的培养基中促其发根,同时从此芽条上切取叶子的一部分,移植到补充了羧苄青霉素及卡那霉素的检验培养基。移植约10天后,产生愈伤组织的叶子看成是卡那霉素抗性个体而回收,发生褐变的叶子看成是卡那霉素敏感性个体而废弃。
因使用如上所述得到的转化烟草可在该烟草内生产羟基化木脂素,所以,可用低成本且对环境负荷低的生产流程生产羟基化木脂素(羟基胡椒醇及/或羟基松脂醇)。
在其他优选实施方式中,本发明所涉及的转化体可优选使用稻子。制备稻子转化体地实施方式之一如以下所述。
将本发明所涉及的多核苷酸导入含有潮霉素抗性基因的双元载体pPZP202中,构建转化载体。本发明所涉及的多核苷酸可与启动子CaMV35S在框内起作用地连接。
使用所得到的转化载体,通过电穿孔法,在50mg/l的卡那霉素及潮霉素的选择下转化根癌土壤杆菌EHA101株(Agrobacterium tumefaciensEHA101株)。所得到的土壤杆菌株到使用之前可冷冻保存。
除去野生型种子的颖片作为糙米,将其用70%乙醇杀菌3分钟,用灭菌蒸馏水洗涤3次后,再用50%的次氯酸钠溶液杀菌30分钟,然后用灭菌蒸馏水洗涤5次。将此糙米置于添加30g/l蔗糖、0.3g/l酪蛋白水解物、2.8g/l的脯氨酸、2.0mg/l的2,4-滴(2,4-D)的、含有用4.0g/l的Gel Lyte固化的N6培养基(Chu等、1975、Sci.Sinica、18、659-668)的愈伤组织诱导培养基上。且培养基pH在放入高压灭菌器前调整到pH5.8。使糙米在28℃下明处生长4星期,得到约5mm大小的愈伤组织。此愈伤组织用于感染土壤杆菌。
使在甘油中冷冻保存的上述土壤杆菌在含有20mg/l的卡那霉素、50mg/l的潮霉素、100mg/l的壮观霉素、调整到pH7.2的、用15g/l的琼脂固化的AB培养基(Chilton等、1974、Proc.Natl.Acad.Sci.USA、71、3672-3676)上暗处、28℃下培养3天。收集土壤杆菌菌体,在含有10mg/l的乙酰丁香酮(Hiei等、1994、Plant J.、6、271-282)的液体AAM培养基(Hiei等、1994)中悬浮。在所得到的悬浮液中将上述的愈伤组织浸渍2分钟后,用杀菌纸巾吸除多余的水分,将其置于含有10mg/l乙酰丁香酮的上述愈伤组织诱导培养基中,暗处28℃下进行3天的共培养,以感染土壤杆菌。将所得到的感染愈伤组织用灭菌蒸馏水洗涤10次,最后用含有500mg/l羧苄青霉素的灭菌蒸馏水洗涤1次后,用杀菌纸巾吸除多余的水分。将此愈伤组织在含有10mg/l乙酰丁香酮、50mg/l潮霉素、300mg/l羧苄青霉素的上述愈伤组织诱导培养基中28℃下培养2星期,再在含有50mg/l潮霉素、100mg/l羧苄青霉素的愈伤组织诱导培养基中培养4星期。选择潮霉素抗性愈伤组织,移入含有30g/l的蔗糖、30g/l的山梨糖醇、2g/l的酪蛋白水解物、2.2mg/l的细胞分裂素、1.0mg/l的萘乙酸(NAA)、100mg/l的羧苄青霉素、50mg/l的潮霉素及4g/l的Gel Lyte的pH5.8的MS基础培养基(Murashige及Skoog、1962、Physiol.Plant.、15、473-497)的再生培养基中。
如此得到转化体可在含有潮霉素的再生培养基中容易地再生后,移入土壤栽培。
因使用如上所述得到的转化稻,可在该稻子内生产羟基化木脂素,所以,可用低成本且对环境负荷低的生产流程生产羟基化木脂素(羟基胡椒醇及/或羟基松脂醇)。
本发明所涉及的转化体,只要是含有木脂素(特别是松脂醇或胡椒醇)的生物,不论生物种是什么,均可通过导入上述多核苷酸生产该木脂素的羟基化物。
因使用导入了含有编码本发明所涉及的多肽的多核苷酸的重组表达载体的转化体,可催化将植物等的生物内源的木脂素羟基化的反应,所以,可用低成本且对环境负荷低的生产流程大量制备羟基化木脂素。且本发明可通过大量制备羟基化木脂素,提供廉价的食品或工业产品。
只要使用本发明所涉及的转化体,即可在低成本且对环境负荷低的条件下提供催化木脂素羟基化反应的多肽。
在实施方式之一中,本发明所涉及的细胞可以是各种细菌宿主。本实施方式所涉及的细胞,可通过将含有本发明所涉及的多核苷酸的重组载体导入细胞中,使该多核苷酸编码的多肽可表达,从而来获得。
宿主可使用原核生物或真核生物。原核生物宿主,可使用例如属于埃希氏菌属(Escherichia)的细菌[例如大肠杆菌(Escherichia coli)等]、例如属于芽孢杆菌属(Bacillus)的细菌(例如枯草芽孢杆菌(Bacillussubtilis)等。真核生物宿主,可使用低等真核生物(例如,酵母或丝状菌等的真核生物微生物)。酵母,例如可例举为酵母属(Saccharomyces)微生物,[例如,酿酒酵母(Saccharomyces cerevisiae)等],丝状菌可例举为,曲霉属(Aspergillus)微生物[例如,米曲霉(Aspergillus oryzae)、黑曲霉(Aspergillus niger)等]及青霉属(Penicillium)微生物。此外,动物细胞或植物细胞也可作为宿主使用。动物细胞可例举为小鼠、仓鼠、猴、人等的细胞。而且昆虫细胞(例如,蚕细胞或蚕的成虫)也可作为宿主使用。
本领域技术人员可容易地理解为,根据本说明书中的记载,只要导入含有编码具有木脂素羟基化活性的多肽的多核苷酸的重组表达载体,即可赋予从细菌到高等植物的大范围的生物以木脂素羟基化的能力。
本发明所涉及的细胞,只要是含有木脂素(特别是松脂醇或胡椒醇)的生物,不论生物种是什么,均可通过导入上述多核苷酸生产该羟基木脂素。
因使用导入了含有编码本发明所涉及的多肽的多核苷酸的重组表达载体的细胞,可催化该细胞内的木脂素羟基化反应,所以,可用低成本且对环境负荷低的生产流程大量制备羟基化木脂素。且本发明还可通过大量制备羟基化木脂素,提供廉价的食品或工业产品。
只要使用本发明所涉及的细胞,即可在低成本且对环境负荷低的条件下提供催化木脂素羟基化反应的多肽。
如上所述,可以说本发明所涉及的转化体或细胞,至少导入编码本发明所涉及的多肽的多核苷酸即可。即应注意的是,通过重组表达载体以外的手段生成的转化体或细胞也包含于本发明的技术范围。
且如上所述,本发明所涉及的多肽,该多肽除具有对松脂醇进行羟基化的活性以外,还具有对胡椒醇进行羟基化的活性,所以,本发明所涉及的转化体或细胞的用途不只限定于对松脂醇进行羟基化、生成这些的羟基化物。
即本发明的目的在于,提供其特征为导入编码本发明所涉及的多肽的多核苷酸的转化体或细胞,而不在于本说明书中具体记载的各个载体种及导入方法。因此,必须注意的是,使用上述以外的载体种类及细胞种类、以及载体制备方法及细胞导入方法得到的转化体或细胞也属于本发明的技术范围。
(C)多肽的生产方法
本发明提供生产本发明所涉及的多肽的方法。使用本发明所涉及的多肽的生产方法,可在低成本且对环境负荷低的条件下提供催化木脂素羟基化反应的多肽。此外,使用本发明所涉及的多肽的生产方法,可容易地生产催化木脂素羟基化反应的多肽。
本发明的实施方式之一所涉及的多肽的生产方法中,使用含有编码本发明的多肽的多核苷酸的载体。
本发明的实施方式之一所涉及的多肽的生产方法中,优选将上述载体用于无细胞蛋白质合成系统。使用无细胞蛋白质合成系统时,可使用各种市售的试剂盒。本实施方式所涉及的多肽的生产方法,优选包含将上述载体与无细胞蛋白质合成液同时温育的工序。
本发明的其他实施方式所涉及的多肽的生产方法中,优选使用重组表达系统。使用重组表达系统时,可采用将本发明所涉及的多核苷酸整合进重组表达载体后,通过公知方法使其可表达地导入宿主,并将在宿主内翻译后得到的上述多肽纯化的方法等。重组表达载体,可以是质粒也可以不是,只要在宿主中导入目的多核苷酸即可。本实施方式所涉及的多肽的生产方法,优选包含将上述载体导入宿主的工序。
如此在宿主中导入外源多核苷酸时,为使外源多核苷酸可表达,表达载体优选整合了能在宿主中起作用的启动子。纯化重组产生的多肽的方法,因使用的宿主、多肽的性质不同而不同,但通过标签的利用等,可比较容易地纯化目的多肽。
本实施方式中所涉及的多肽的生产方法,优选进一步包含从含有本发明所涉及的多肽的细胞或组织的提取液中纯化该多肽的工序。纯化多肽的工序优选用公知的方法(例如,破坏细胞或组织后离心分离,回收可溶性组分的方法)从细胞、组织中制备细胞提取液后,再从此细胞提取液中利用公知的方法(例如,硫酸铵沉淀或乙醇沉淀、酸提取、阴离子或阳离子交换色谱法、磷酸纤维素色谱法、疏水相互作用色谱法、亲和层析法、羟基磷灰石色谱法及外源凝集素色谱法)纯化的工序,但不限于此。最优选使用高效液相色谱法(“HPLC”)进行纯化。
本发明的其他实施方式所涉及的多肽的生产方法,为从天然表达本发明所涉及的多肽的细胞或组织中纯化该多肽。本实施方式中所涉及的多肽的生产方法,优选包含使用或寡核苷酸,鉴定天然表达本发明所涉及的多肽的细胞或组织的工序。且本实施方式中所涉及的多肽的生产方法还优选进一步包含纯化上述多肽的工序。
且在其他实施方式中,本发明所涉及的多肽的生产方法的特征在于,化学合成本发明所涉及的多肽。本领域技术人员应容易理解,如基于本说明书中所述的本发明所涉及的多肽氨基酸序列,应用公知的化学合成技术,即可化学合成本发明所涉及的多肽。
如上所述,根据生产本发明所涉及的多肽的方法而获得的多肽,可以是天然存在的突变多肽,也可以是人工制备的突变多肽。
制备突变多肽的方法也无特别限定。例如,可通过使用利用定点诱变法[例如参考Hashimoto-Gotoh,Gene 152:271-275(1995)]、PCR法在碱基序列中导入点突变以制备突变多肽的方法或通过插入转座子的突变株制备法等的公知的突变多肽制备法,制备突变多肽。突变多肽的制备可使用市售的试剂盒。
如此可以说,本发明所涉及的多肽的生产方法,至少使用基于具有木脂素羟基化活性的多肽氨基酸序列或编码具有木脂素羟基化活性的多肽的多核苷酸的碱基序列的公知常用技术即可。
也就是说,本发明的目的在于,提供具有木脂素羟基化活性的多肽的生产方法,必须注意的是,包含上述各种工序以外的工序的生产方法也属于本发明的技术范围。
(D)羟基化木脂素的生产方法
到目前为止,木脂素及羟基化木脂素的生产是通过从植物中提取来进行的,具有不能大量生产等的问题,但根据本发明,可用低成本大量生产木脂素及羟基化木脂素。
本发明提供使用表达本发明所涉及的多肽的生物体或细胞来生产羟基化木脂素的方法。上述生物体,可为天然的未改造生物体,也可为使用重组表达系统的转化体。本发明所涉及的羟基化木脂素生产方法,可高效生产木脂素(特别是松脂醇或胡椒醇)。
本发明的实施方式之一所涉及的羟基化木脂素生产方法,其特征在于,使用由编码本发明所涉及的多肽的多核苷酸转化的生物体或其组织来生产羟基化木脂素。上述生物体优选为上述转化体植物或细菌,特别优选为大肠杆菌、芝麻、连翘或亚麻。
本发明的优选实施方式所涉及的羟基化木脂素生产方法,包含将编码本发明所涉及的多肽的多核苷酸导入上述生物体的工序。将多核苷酸导入上述生物体的工序,可使用上述各种基因导入方法。本实施方式的此种情况下,上述生物体在转化前产生的羟基化木脂素与转化后产生的羟基化木脂素之间的组成不同。具体地说,从上述生物体中得到的木脂素及其羟基化物,其含有率增加了。本实施方式的此情况所涉及的羟基化木脂素生产方法,优选进一步包含从上述生物体中提取羟基化木脂素的工序。
在其他的实施方式中,本发明所涉及的羟基化木脂素生产方法,包含在天然表达本发明所涉及的多肽的生物体中,将本发明所涉及的寡核苷酸作为反义寡核苷酸导入的工序。将寡核苷酸导入上述生物体的工序,可使用上述反义RNA技术。本实施方式所涉及的羟基化木脂素生产方法,还优选进一步包含使用或寡核苷酸、鉴定天然表达本发明所涉及的多肽的生物体的工序。本实施方式的此情况所涉及的羟基化木脂素生产方法,还优选进一步包含从上述生物体中提取羟基化木脂素的工序。
本实施方式中,上述生物体在导入上述寡核苷酸前产生的羟基化木脂素与导入后产生的羟基化木脂素之间的组成不同。具体地说,从上述生物体中得到的木脂素及其羟基化物,其含有率减少了。
如此可以说,本发明所涉及的羟基化木脂素的生产方法,至少使用表达本发明所涉及的多肽的生物体即可。
即本发明的目的在于,提供基于通过本发明所涉及的多肽其羟基化木脂素的组成改变了的生物体的羟基化木脂素生产方法,必须注意的是,上述生物体使用动物、植物或各种细胞的生产方法也属于本发明的技术范围。
(E)食品及工业产品
本发明提供使用通过上述羟基化木脂素的生产方法制得的羟基化木脂素而制造的食品及工业产品。本项中所述的食品,可以是上述转化植物体的种子、果实、切穗、块茎及/或块根,也可以是使用从上述转化植物体中提取的羟基化木脂素而制造的食品(例如,芝麻、连翘或亚麻或这些的加工食品)。本发明所涉及的食品或工业产品,可含有所需量的木脂素(特别是松脂醇或胡椒醇)。
例如,从如上所述的羟基化木脂素含量增加了的本发明所涉及的转化植物中提取的羟基化木脂素提取液,被作为羟基化木脂素含量高的食品提供。且不限于提取的羟基化木脂素,上述转化植物体的种子、果实、切穗、块茎及/或块根等也可被作为大量含有羟基化木脂素的食品提供。改变羟基化木脂素组成的对象无特别限定,除植物以外,还可以动物、细菌或酵母等所有的生物为对象。
此外,基于木脂素及羟基化木脂素的独特物性,本发明所涉及的多肽或多核苷酸可作为工业产品(例如,实验用试剂、薄膜、生物分解性塑料、功能性纤维、润滑油或洗涤剂等的工业产品)的原料利用。
本发明涉及具有木脂素羟基化活性的全部多肽及其利用,这一点本领域技术人员应明白。木脂素羟化酶可来自植物、动物或微生物的任一种,只要具有木脂素羟化酶活性,即可控制木脂素量。且本发明涉及通过导入编码木脂素羟化酶的多核苷酸而制备的木脂素量得到调节的植物、其后代或它们的组织,其形态也可为切花。如使用本发明所涉及的木脂素羟基化多肽,即可促进或抑制羟基化木脂素的生成。此外,本领域技术人员应容易理解,使用常用的方法,在植物中导入上述多核苷酸使该多核苷酸组成型或组织特异性表达,从而使目的多肽的表达增加,以及通过使用反义法、同时使用抑制法及RNA i法等,即可抑制目的多肽的表达。
实施例
基于以下实施例具体说明本发明,但本发明不限于以下实施例。此外,实施例中使用的分子生物学的方法,只要无其他详述,均根据MolecularCloning(Sambrook等,Cold Spring Harbour Laboratory Press,1989)中记载的方法。
(实施例1:芝麻cDNA文库的制备)
根据制造商推荐的方法使用RNeasy Plant Mini Kit(Qiagen),从芝麻的种子中提取总RNA。然后,使用Oligotex MAG mRNA纯化试剂盒(TaKaRa),得到poly A(+)RNA 5μg。根据制造商推荐的方法使用ZAP Express cDNASynthesis Kit and Zap Express cDNA Gigapack 3 Gold Cloning Kit(Stratagene),由此poly A(+)RNA制备cDNA文库。制备的文库为1×107pfu/ml(参考文献:Ono et al.,Proc.Natl.Acad.Sci.USA 103,10116-10121.2006)。
(实施例2:杂交探针的制备)
使用RNeasy Plant Mini Kit(QIAGEN),从十字花科拟南芥中提取总RNA的后,根据制造商推荐的条件使用SuperScriptTM Firtst-StrandSynthesis System for RT-PCR(Invitrogen),由1μg总RNA合成cDNA。将拟南芥的2-酮戊二酸依赖性双加氧酶(以下2OG-双加氧酶)样基因At3g13610使用At3g13610-Fw(序列号1)及At3g13610-Rv引物(序列号2),将扩增片段作为筛选探针。
序列号1:At3g13610-Fw:5’-ATG GCT CCA ACA CTC TTG ACA ACC CAA-3’
序列号2:At3g13610-Rv:5’-TCA GAT CTT GGC GTA ATC GAC GGT TTT-3’
将非放射性同位素的DIG-核酸检测系统(Roche公司)按照制造者推荐的PCR条件使用,在通过RT-PCR得到的片段(fragment)中导入DIG标记。具体地说,PCR反应液(50μl)的组成为:各cDNA 1μl、1×Taq缓冲液(TaKaRa)、0.2nM dTPs、引物(序列号1及2)各0.4pmol/μl、rTaq聚合酶2.5U。PCR反应在94℃、反应5分钟后,进行30个循环的94℃ 1分钟、53℃ 1分钟、72℃ 2分钟的反应的扩增。将此DIG标记化片段作为杂交用探针用于以下的实验。
(实施例3:芝麻2OG-双加氧酶基因的筛选)
将非放射性同位素的DIG-核酸检测系统(Roche公司)(roche-diagnostics)按照制造者推荐的方法使用,将实施例1中得到的cDNA文库用实施例2中得到的探针进行筛选。
使用杂交缓冲液[5×SSC、30%甲酰胺、50mM磷酸钠缓冲液(pH7.0)、1%SDS、2%封闭试剂(Roche公司)、0.1%十二烷基肌氨酸、80g/ml鲑鱼精子DNA),37℃下进行2小时预杂交后,添加实施例2中得到的探针,保温过夜。将膜在含有1%SDS的5×SSC洗涤液中55℃下洗涤30分钟。筛选约1×106pfu的噬菌斑,得到约200个阳性克隆。
按照制造者推荐的方法使用cDNA文库合成试剂盒,将上述500个的克隆插入pBK-CMV质粒(Stratagene)。使用M13RV及M13M4(-20)的引物对,确定插入物的部分DNA序列。使用基于所得到的DNA序列得到的推定氨基酸序列,通过Blast x进行数据库检索,得到来自芝麻的2OG-双加氧酶(以下、SiD)的部分序列。使用DNA Sequencer model 3100(Appllied Biosystems),使用合成寡核苷酸引物通过引物步查法确定碱基序列。通过Clustal-W分析得到最终的7种SiD样基因(SiD 1~7)。除SiD4及SiD 7以外的SiD基因,因通过文库筛选所得到的克隆不包含推测ORF的5’或3’端区域,所以,将Gene Racer kit(Invitorogen)按照制造者推荐的方法进行cDNA末端快速扩增[Rapid Amplification of cDNA End(以下、RACE)],扩增各自的Sid基因的5’及3’端区域。RACE使用如以所示的各SiD基因特异性引物对(序列号3~15及46)。将各扩增产物使用合成寡核苷酸引物通过引物步查法确定碱基序列,得到含有全长ORF的SiD序列。
序列号3:GR-SiD1-Fw3:5’-GGG GAA CGG GCG CAG CTT GCG GGA AGATT
序列号4:GR-SiD1-Rv3:5’-GGC ATC ACC ATC GGT TCC CCC ACC GTG AAA
序列号5:SiD1-nest-Fw2:5’-TGA TCT CGT GCT GGG GTT GAA
序列号6:SiD1-nest-Rv:5’-TGC TCA TAA TCT CCA TTT GGT
序列号7:GR-SiD2-Fw:5’-GGT CGA CAC AAG GAC GGC GGG GCG TTA
序列号8:GR-SiD2-Rv:5’-ACG CCC CGC CGT CCT TGT GTC GAC CTA
序列号9:SiD2-nest-Fw:5’-ACT GAT GGC GAA TGG ATT CTT
序列号10:SiD2-nest-Rv2:5’-TTC CTT CCA GTC CCT GAC ATT
序列号11:GR-SiD3-Rv:5’-GGG GTT CGG ACA CTT GGG GTA GTA GA
序列号12:SiD3-nest-Rv:5’-CAA GGC GGA TTC TTT GAC CTT
序列号13:GR-SiD5-Rv:5’-TGA TCC ACT TCT CGC CCC GCC GGA CTT
序列号14:SiD5-nest-Rv:5’-TGA GGG CAT TTT GGG TAA TAG
序列号15:GR-SiD6-Rv:5’-TGC GGG TCA GGT GGA TGA GGG GCC ATT
序列号46:SiD6-nest-Rv:5’-CAT TAC ACA AGT GAT AGT AT
所得到的含有全长ORF的各SiD基因的氨基酸序列与DNA序列如下所示(序列号16~19)。
序列号16:Sid1蛋白质
MAGVASPPAEVLLSKRVQELVITGEDPSGPYVCRNDDDNGELDATTENSPIPVVNIGHFLSGKWSD
DESVQELKKLHSALSTWGCFQGIGHGIPSCFLDEVRRVGREFFEQPMEEKNKYGKTVTEFQGYGAD
PVPEEGQSLDWSDRLFLELVPEDQRNYRFWPQNPSSFKGTLEEYSEKMKTVTEIISKSMARSLHLE
ETCFLKQFGERAQLAGRFNYYSPCRRPDLVLGLKPHADGSGYTVILQDEPGLQVLNHGKWYTVPKN
PDALLVLMGDQMEIMSNGVFRSPVHRVLSNGERDRISVAVFYTPEVGKEIGPEEGLISAEAPRVFK
MVKDYADIHVGYYQRGMRSLHTVRV
序列号17:Sid1 DNA
ATGGCTGGAGTTGCATCCCCACCCGCTGAAGTATTGCTGTCCAAAAGAGTCCAAGAATTGGTCATC
ACCGGTGAGGACCCGTCGGGGCCATACGTGTGTAGAAACGACGACGACAACGGGGAATTAGACGCG
ACAACTGAGAATTCTCCGATTCCAGTTGTGAACATTGGACACTTCTTGTCGGGAAAATGGTCCGAT
GATGAAAGTGTACAAGAGCTGAAGAAACTCCACTCGGCTCTCTCCACATGGGGATGCTTTCAGGGC
ATAGGTCATGGGATCCCGAGTTGTTTCCTGGACGAGGTACGAAGAGTTGGGAGGGAGTTCTTCGAG
CAGCCAATGGAGGAGAAGAACAAGTATGGGAAAACGGTGACGGAGTTTCAAGGGTATGGAGCTGAT
CCCGTCCCGGAAGAAGGGCAGTCGCTCGACTGGTCGGATCGTCTTTTCCTAGAGTTAGTCCCTGAA
GATCAAAGAAATTACAGATTCTGGCCTCAGAACCCATCCTCTTTCAAAGGAACACTGGAAGAGTAC
TCGGAGAAGATGAAAACAGTGACTGAGATAATATCCAAATCCATGGCAAGATCACTTCATCTTGAG
GAGACCTGCTTCTTGAAACAGTTCGGGGAACGGGCGCAGCTTGCGGGAAGATTCAACTACTATTCG
CCTTGCAGGAGGCCTGATCTCGTGCTGGGGTTGAAGCCTCACGCCGACGGATCAGGCTACACCGTT
ATACTGCAGGATGAACCCGGCCTTCAAGTACTCAACCATGGCAAATGGTATACTGTCCCCAAGAAC
CCTGATGCCCTTCTAGTCCTCATGGGGGACCAAATGGAGATTATGAGCAACGGGGTGTTCAGAAGT
CCGGTGCACAGGGTGCTGAGCAATGGGGAGAGGGACAGGATCTCTGTGGCTGTATTTTACACGCCG
GAGGTGGGGAAGGAGATCGGGCCGGAAGAGGGGTTGATCAGTGCGGAGGCACCGAGAGTGTTCAAG
ATGGTGAAAGATTATGCTGACATTCACGTGGGGTACTATCAGAGGGGAATGAGATCGCTTCATACT
GTCAGAGTTTGATGCTCTATATATATAGGGAAAGTTTAGTCCATCTCGAGTTTGGTCAGATCTAAA
TCAATTATATGTCAAGTCAATACATTTGTCGTGATTAGTGTATAATTTAAAAAATGACTAATCATG
TGACAAATGTATCACACTTGCTCTATAATTGATTTAGTTCAATGAAAGCTGATATAGATAAAAATT
TTGCATGTANATATGGNGTGTGTTGGATGCCTTTCCAATGTTTAAATAACCATATTGCTGCTTGGG
ATTTCTTTTG
序列号18:Sid2蛋白质
MGEVDPAFIQALEHRPKPHSVEAQGIPLIDLSPANSPDPDPGSLSALAAEIGDACEKWGFFQVINH
GVPLHVREKIDLVSRKFFALPKEEKKKVSRDEVNPSGYYDTEHTKNVRDWKEVFDFTVGEPMVMPA
SHEPDDRELKEVINQWPENPSEMREVCEEYGAEMQKLGHKLLELIALSLGLARDRFNGFFKDQTTF
IRLNYYAPCPIPDLALGVGRHKDGGALTILAQDDVGGLEVKRKTDGEWILVKPTPDAYIINVGDII
QVWSNDKYESVEHRVKVNSERERFS IPFFLNPAHYTMVEPLEELVNKQNPANYNPYNWGKFFSTRK
RSNYKKLDVENIQIHHFKNY*
序列号19:Sid2 DNA
ATGGGAGAAGTCGACCCTGCATTCATCCAAGCGCTCGAACACAGGCCTAAACCCCACAGCGTCGAG
GCCCAAGGCATCCCGTTAATCGATCTCTCCCCCGCCAACTCCCCGGACCCCGATCCGGGTTCCCTG
TCAGCTCTCGCCGCCGAAATTGGTGATGCGTGCGAGAAATGGGGATTTTTCCAGGTGATCAACCAC
GGGGTGCCGTTGCATGTTCGGGAGAAAATTGACCTGGTTTCCAGGAAATTTTTTGCTCTGCCGAAA
GAGGAGAAGAAGAAGGTTTCCAGGGATGAGGTGAACCCGTCGGGGTATTACGACACTGAGCACACT
AAGAATGTCAGGGACTGGAAGGAAGTGTTTGATTTCACGGTGGGGGAACCGATGGTGATGCCGGCT
TCGCATGAGCCTGATGACAGGGAGCTGAAAGAAGTGATCAATCAGTGGCCTGAGAATCCTTCAGAA
ATGAGGGAAGTGTGTGAAGAATACGGTGCAGAAATGCAAAAATTGGGACACAAGTTGCTGGAACTC
ATAGCCCTGAGCCTAGGCTTGGCGAGAGATCGATTCAATGGGTTTTTCAAGGATCAAACCACCTTC
ATTCGGCTGAATTACTATGCGCCATGCCCGATCCCTGATCTAGCTCTTGGCGTAGGTCGACACAAG
GACGGCGGGGCGTTAACAATTCTTGCTCAAGACGATGTAGGGGGGCTGGAGGTGAAGAGGAAAACT
GATGGCGAATGGATTCTTGTGAAACCTACTCCTGATGCCTATATAATCAATGTTGGTGACATTATA
CAGGTTTGGAGCAACGATAAGTACGAGAGTGTGGAACACAGAGTGAAAGTGAATTCAGAGAGAGAG
AGATTTTCGATTCCCTTCTTCCTCAACCCTGCACATTATACTATGGTAGAACCGCTGGAGGAGCTG
GTGAACAAGCAGAATCCTGCCAACTACAATCCTTACAACTGGGGAAAGTTCTTCTCCACCCGAAAA
CGCAGTAACTACAAGAAGCTTGATGTGGAGAACATTCAAATACATCACTTCAAGAACTACTGAAGG
TTGCCCTTTTGGGCCTAAGTGTTCACATTCTCAATGATTATGCTTACAGACTGATGGATTTGGCTC
TCTTGACTGTGCATGTATTATGAATAAATAATTACTTTAGATATATTATAAAAAAAAAAAAAAAAA
AAA
序列号20:Sid3蛋白质
MSELLSEPDNLIDFMLNKGNGVKGLSQINLKQIPDRFIQPPEERLDHIQIATQESVPVIDVSRWDD
PGIAESICEAAAKWGFFQIINHGIPDEVLENVKRAAHDFFELPVEERRRYLKENSPTHTVMLKTSF
SPLAEKILEWKDYLMHYCDGQENEHSKFWPPLSRDQVLDYVNWIKPIIRKLLTVLLNGIKVEQIDK
VKESALMGSPVVTLLYYPKCPNPNVAAGAGRHSDVSSITILLQDDVGGLYVRATEGDQWIHIAPTK
GALVVNIGDVLQIMSNDRYKSIEHRVFVNGSKNRVSVPVFVNPSSDAIIGPLPEVLKAGEKPIYKH
VVFSDYFNYFFSKGHDGKRSLDYAKI*
序列号21:Sid3 DNA
ATGTCTGAACTACTCTCGGAACCCGACAACCTCATAGATTTTATGCTGAACAAAGGAAATGGAGTG
AAGGGTCTCTCTCAGATAAACCTTAAACAAATCCCAGATCGATTCATCCAGCCCCCTGAAGAAAGA
TTGGACCATATCCAAATTGCGACCCAAGAATCCGTACCCGTTATCGATGTGTCCAGATGGGATGAC
CCGGGAATTGCAGAATCAATCTGCGAGGCAGCAGCCAAGTGGGGTTTCTTTCAGATCATCAATCAT
GGAATCCCAGATGAGGTTCTTGAAAATGTGAAGAGGGCTGCTCATGATTTCTTTGAGTTGCCTGTT
GAGGAGAGGAGGAGGTATTTGAAGGAGAATTCTCCCACTCACACTGTGATGTTGAAGACTAGCTTT
AGTCCTCTTGCTGAGAAGATTTTGGAGTGGAAAGACTATCTTATGCACTACTGTGATGGCCAAGAA
AATGAGCATTCCAAGTTCTGGCCACCTTTGTCTAGAGATCAAGTTTTGGACTACGTAAACTGGATA
AAGCCCATTATCAGAAAGCTACTGACAGTGTTGCTCAATGGTATTAAGGTGGAACAAATTGACAAG
GTCAAAGAATCCGCCTTGATGGGCTCACCAGTTGTCACCCTTCTCTACTACCCCAAGTGTCCGAAC
CCCAATGTTGCAGCTGGAGCTGGCCGTCACTCTGATGTGTCATCAATCACCATCCTCCTACAAGAC
GACGTAGGTGGACTCTACGTACGAGCAACTGAAGGCGACCAGTGGATCCATATAGCACCAACCAAA
GGAGCTCTTGTTGTAAACATCGGAGATGTGCTGCAGATCATGAGCAACGACAGGTACAAAAGCATC
GAGCATCGTGTATTTGTGAATGGGAGCAAGAACAGGGTTTCCGTGCCCGTCTTTGTCAACCCTTCA
AGTGACGCCATCATTGGCCCTCTGCCGGAAGTGCTGAAGGCCGGAGAGAAACCAATCTATAAACAT
GTTGTCTTCTCGGATTACTTCAATTACTTCTTTAGTAAAGGTCATGATGGCAAACGATCGCTGGAT
TATGCGAAAATATGACGTGTTTGTGTTTTGTAGGATAGCTTATCTTCACAAGTCTTTGCTGTCTTC
TTGCATAGGCTGTGTCATATACTCACAGATTTATCTCCG
序列号22:Sid4蛋白质
MEPKLTKLGSSLPVPIVQELAKEKLATVPPRYVRPDQHQHTILSALNSSFPQIPVIDMQKFSDIYI
MDSELQALHNACQEWGFFQLINHGVDSAVMEKMKIEIQEFFNLPIEEKKKFKHEEGDIQGYGQAFV
VSEDQKLDWGDVFAIVTSPIYLRKPHLIAKLPATFRDATEVYASELKVLAMKILKLMAKALDMKAE
EMETLFAEGMHSMRMNYYPPCPQPELVTGLCPHSDADGLTILLQVNEMDGLQIKKDGVWIPVSPLP
NAFTINIGDNLEILTNGAYRSIEHRATVNKEKERISIATFLGANLDGDMGPSPSLVTPQTPAKFKR
IGVTQYLKELFSRELMGKSYLDLMRI*
序列号23:Sid4 DNA
ATGGAACCAAAATTAACAAAGCTAGGCAGCTCTCTTCCGGTGCCTATCGTACAAGAATTGGCCAAG
GAGAAATTAGCAACGGTTCCTCCAAGATACGTGCGCCCAGATCAACATCAACACACGATTCTCTCT
GCTCTTAATTCTTCCTTCCCTCAAATTCCTGTCATCGATATGCAGAAGTTTTCAGACATCTATATA
ATGGATTCTGAGCTTCAGGCCCTACATAATGCATGCCAAGAATGGGGTTTCTTTCAGTTGATCAAC
CATGGGGTGGACTCTGCTGTAATGGAGAAAATGAAGATAGAAATTCAAGAATTCTTTAATCTCCCA
ATAGAGGAGAAGAAGAAATTTAAGCATGAGGAAGGGGACATACAGGGTTATGGGCAAGCCTTTGTT
GTATCAGAAGATCAAAAGCTCGACTGGGGAGACGTGTTTGCCATTGTTACCTCACCAATTTACCTC
AGAAAGCCTCACTTAATCGCCAAGCTTCCTGCTACCTTCAGGGACGCCACAGAAGTGTATGCATCG
GAACTCAAAGTTCTCGCCATGAAGATTCTAAAGCTAATGGCAAAAGCCTTAGACATGAAAGCTGAA
GAAATGGAAACGCTATTCGCAGAAGGGATGCATTCCATGAGGATGAACTACTATCCTCCGTGTCCC
CAGCCCGAGCTCGTCACGGGCCTCTGCCCTCACTCCGATGCAGATGGGCTCACCATTCTCCTCCAA
GTGAATGAAATGGATGGCCTCCAGATCAAGAAAGATGGAGTCTGGATTCCCGTTTCTCCACTCCCT
AATGCCTTCACCATCAATATTGGAGATAACTTGGAGATTCTGACAAACGGTGCTTATAGGAGCATT
GAGCATAGAGCAACTGTCAACAAGGAGAAAGAAAGAATCTCCATTGCCACATTTCTGGGCGCGAAT
CTAGATGGTGATATGGGTCCGTCGCCAAGCCTCGTCACTCCTCAGACTCCGGCAAAATTCAAGAGG
ATCGGGGTGACTCAATATTTGAAGGAACTATTCTCGCGGGAACTCATGGGGAAATCATATCTAGAC
CTTATGAGGATTTAGGGTGTAGTACTGGGGTATGGTAATAACACCAACATGAGTTTGTACCTAATA
AGTTATCAACCATTAGATTACAAATAATACTATGATCATGTGTAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
序列号24:Sid5蛋白质
MMSCLQSWPEPVVRVQHLSDSGIRVIPERYVKKLSDRPSFCDSLSGEVNIPVIDMKGLYSDDASVR
KKTAGMISGACREWGFFQVVNHGVRQEVMGRAREAWREFFKLPLEEKQKYANSPSTYEGYGSRLGV
EKGISLDWSDYFFLNYLPLALRDQNKWPALPLSCREMVGEYCREVVELGGRLMKILSSNLGLEEEY
LQEAFGGEEFGACMRVNYYPKCPQPDLTLGLSPHSDPGGMTLLFPDENVSGLQVRRGEKWITVDPV
PNAFIVNIGDQLEVLSNGNYKSVEHRVIVNSEKERVSIALFYNPRGDMLIKPADELVTEDRPPLYP
PTVYDEYRLYMRTRGPRGKSQVHSLKSLQ*
序列号25:Sid5 DNA
ATGATGAGCTGCTTGCAGAGCTGGCCCGAACCCGTTGTCAGGGTCCAACACCTCTCCGACAGCGGG
ATTCGGGTAATCCCCGAACGCTACGTGAAGAAACTCTCAGACAGGCCGAGCTTTTGCGACTCCCTC
TCCGGCGAAGTTAACATTCCAGTCATCGACATGAAGGGGTTGTACTCGGACGACGCCTCAGTCCGG
AAGAAGACGGCCGGGATGATCAGCGGGGCATGCCGCGAGTGGGGGTTCTTCCAGGTGGTGAACCAC
GGGGTGAGACAGGAGGTGATGGGGCGGGCCAGGGAGGCGTGGCGCGAGTTTTTTAAGCTGCCGCTG
GAGGAGAAGCAGAAGTACGCGAATTCGCCGAGCACGTATGAGGGGTACGGCAGCCGCCTGGGTGTG
GAGAAGGGAATATCACTGGATTGGAGTGACTACTTTTTCCTGAATTACCTTCCTCTCGCACTCAGA
GACCAGAATAAGTGGCCTGCACTTCCTCTTTCATGCAGGGAAATGGTGGGAGAGTACTGTAGAGAA
GTGGTTGAACTTGGTGGAAGATTGATGAAGATTCTGTCGAGCAATCTTGGGCTGGAAGAAGAGTAT
CTTCAAGAAGCATTTGGAGGAGAGGAGTTTGGGGCATGCATGAGGGTTAACTATTACCCAAAATGC
CCTCAACCGGACCTCACACTCGGCCTTTCTCCTCATTCCGACCCGGGTGGGATGACCCTTCTCTTC
CCCGACGAGAACGTATCGGGTCTCCAAGTCCGGCGGGGCGAGAAGTGGATCACCGTCGACCCAGTC
CCCAATGCGTTTATCGTCAATATAGGAGATCAACTTGAGGTGTTAAGCAATGGGAATTACAAGAGT
GTGGAGCATAGGGTGATTGTGAATTCAGAGAAAGAGAGAGTGTCAATCGCATTGTTCTACAATCCA
AGGGGTGATATGCTGATAAAGCCGGCGGATGAGCTGGTGACGGAGGACCGCCCACCGCTCTACCCG
CCCACCGTTTACGACGAGTATAGGCTGTACATGAGGACAAGGGGCCCTCGTGGCAAGTCCCAAGTC
CATTCACTTAAATCACTTCAATAACTTAATTAATATTATATTTAAATAATAATTTTAGGTAGTATT
GTTCCATGAATTGTAGTGTTGTTTGTTAATTAATTTCCGCATTTTATGTAATTTGGATTGTACTAC
ACATATATATCATGACTACTACTCATCATGGGTTAATTAAAAAAAAAAAAAAAA
序列号26:Sid6蛋白质
MEVQTMKVHAYDRLSELKAFDDSKSGVKGLVDAGVTKIPRFFINDNDMPGSEPCNFNSEAIFPVID
LSGMHHAANRAGIVSRVKEACEKWGFFQIINHEMPLRVMDEMIAGVRRFHEQDAEVKKKYYGRDVT
KKFQYNSNFDLYKTRAAMWRDTITCVMAPHPPDPQELPDVCRDIMFEYSKHVMRVGHTVYELLSEA
LGLNPSYLRDIGCIESNFIVGHYSPACPEPELTFGIRSHVDFGLLTILLQDQIGGLQVLHQNQWVD
VSPLPGSLIINVGDFIQLISNDKFKSVKHRALSKRVGPRISVGVFIKPYYADGDNLRVYGPIKELL
TEEEPAIYRETTYKDYERFYFANCDDGTTKLPYFRLGT*
序列号27:Sid6 DNA
ATGGAAGTTCAGACAATGAAAGTTCATGCATACGATCGACTAAGTGAACTAAAAGCATTCGATGAT
TCAAAATCAGGCGTGAAGGGACTTGTTGATGCTGGTGTTACGAAGATCCCACGCTTCTTCATTAAT
GATAATGATATGCCTGGATCCGAACCGTGCAACTTCAACTCAGAAGCCATCTTTCCAGTCATAGAT
TTATCAGGCATGCACCATGCTGCAAACCGTGCTGGAATTGTCAGCAGAGTGAAAGAGGCATGTGAG
AAGTGGGGATTCTTTCAGATAATCAATCATGAGATGCCGCTGCGAGTGATGGATGAAATGATTGCA
GGGGTTCGAAGATTTCACGAGCAAGATGCTGAGGTTAAGAAGAAATACTACGGTCGTGATGTCACG
AAAAAGTTTCAGTACAATAGCAATTTCGATCTTTACAAAACACGGGCGGCCATGTGGAGGGATACT
ATCACTTGTGTAATGGCCCCTCATCCACCTGACCCGCAGGAATTGCCAGATGTATGCAGAGACATC
ATGTTTGAATACTCTAAGCATGTCATGAGAGTGGGGCATACCGTGTATGAATTGCTGTCGGAGGCT
TTGGGCCTCAATCCCAGCTACCTGAGAGACATTGGCTGTATTGAGTCGAATTTCATCGTGGGCCAT
TATTCTCCGGCTTGCCCAGAACCAGAACTGACCTTTGGCATCAGAAGCCACGTCGACTTCGGCTTG
CTCACAATACTCTTGCAGGACCAGATTGGCGGTCTCCAGGTGCTTCACCAGAATCAGTGGGTCGAC
GTTTCTCCCTTGCCTGGAAGTCTAATAATAAATGTTGGGGACTTTATACAGCTGATCAGTAACGAC
AAATTCAAAAGCGTGAAACACAGAGCACTATCAAAAAGGGTAGGGCCAAGAATTTCAGTTGGTGTT
TTCATTAAACCCTACTACGCTGATGGAGATAATTTGCGGGTGTACGGACCTATCAAGGAGCTGTTA
ACTGAAGAAGAGCCGGCTATCTACAGGGAAACAACTTATAAAGACTATGAAAGATTCTACTTCGCC
AATTGTGATGACGGAACCACCAAGCTGCCGTATTTCAGGCTGGGCACCTGATCAATGGTCCTGCAG
TGGCAGCTTGTCAAGTACTGGATAGTTGTGAACTGACCTTCTTCACCA
序列号28:Sid7蛋白质
MAWRSQTEANYDRASELKAFDDTKTGVKGLVDSGITQVPRIFITPRNDSDKNLKPSDSQLKFPIID
LENIDEDPIRFKKVVDEVRDASGTWGFFQVINHGIPGSVLEEMLDGVRKFYEQDPEERKKWYTRDR
KRSVVYNSNFDLYSAPAANWRDTFFCKMAPHPPSPEELPAVCRDIMFEYTKQVLKLGTSLFKLLSE
ALGLDANHLGDMKCADGLALLCHYYPFCPQPELTMGASQHADSDFLTVLLNDNVTGLQVLYQNQWF
DVPSVPGSLVVNVGDLLQLISNDRLISSEHRVLANNVRSRVSVACFFRSDIDKSDELYGPIQELLS
EDNPPKYRATTMKEYVNYYNAKGLDGTSALLHFRV*
序列号29:Sid7 DNA
ATGGCCTGGAGATCTCAGACAGAAGCAAACTACGACAGAGCAAGCGAACTAAAAGCTTTTGATGAC
ACCAAAACTGGTGTCAAAGGCTTAGTTGACAGTGGTATAACCCAAGTCCCGAGAATCTTCATCACC
CCACGAAATGATTCAGACAAGAACCTTAAACCTTCCGATTCACAACTCAAATTCCCAATAATTGAC
CTCGAAAACATCGATGAAGATCCAATCAGGTTTAAGAAGGTCGTGGACGAGGTTCGAGATGCTTCA
GGGACATGGGGTTTCTTCCAGGTGATCAATCATGGGATTCCGGGTTCTGTTTTGGAGGAGATGCTA
GATGGGGTCCGGAAATTCTATGAACAAGATCCTGAGGAGAGGAAAAAGTGGTACACAAGGGATAGA
AAAAGAAGTGTTGTTTACAATAGCAACTTTGATTTGTATAGTGCACCAGCAGCTAATTGGAGGGAC
ACTTTCTTCTGTAAAATGGCTCCTCATCCTCCAAGCCCTGAGGAGTTGCCCGCTGTGTGCAGAGAT
ATAATGTTTGAGTACACAAAGCAAGTTTTGAAACTGGGAACAAGTTTGTTTAAATTGTTGTCCGAG
GCCCTTGGTCTGGATGCCAACCACCTTGGGGACATGAAATGTGCTGACGGGCTTGCTCTCCTGTGC
CATTACTACCCCTTCTGCCCTCAGCCGGAGTTAACTATGGGCGCCAGCCAGCACGCGGACAGTGAC
TTCCTGACGGTGCTCCTAAATGACAATGTAACCGGCCTGCAAGTTCTTTACCAAAACCAGTGGTTT
GATGTTCCCTCAGTGCCCGGATCTCTGGTGGTAAATGTTGGAGATCTTCTACAGCTTATATCAAAT
GATAGGTTGATTAGTTCGGAGCATAGAGTACTAGCAAACAACGTTCGTTCAAGGGTATCAGTCGCA
TGTTTCTTTAGAAGCGACATAGATAAGTCGGACGAGCTCTACGGACCAATCCAGGAACTCTTGTCT
GAAGATAATCCACCAAAATACAGGGCAACCACCATGAAAGAGTATGTGAACTACTACAACGCCAAG
GGGTTGGACGGAACTTCTGCTTTGTTACATTTCCGCGTTTGAATTGAAATGATATGATGGGAAGAT
GTTACTTTCCATATTAATATAATCCGGGAAAACGGAACATTCGAAATGTAGTATGAAAGAAAAATG
TGCGGTCTATTTCTATTTTATTAGTAAAACCATAACGAATGTTGATTAACTATGATTAAAATTAAG
CTTTCACTTTAAAAAAAAAAAAAAAAA
(实施例4:芝麻2OG-双加氧酶(SiD)的大肠杆菌表达载体的构建)
设计在各SiD的cDNA的起始蛋氨酸密码子(ATG)的上游具有BamHI或BglII位点、在终止密码子的下游具有XhoI位点的引物(序列号30~序列号43),将含有各SiD基因ORF的片段通过PCR扩增。
序列号30:Bgl2NcoI-SiD1-Fw:5’-TTT AGA TCT TCC ATG GCT GGA GTTGCA TCC CCA
序列号31:Sid1-endXhoI-Rv:5’-TTG ACA TAT AAT TGA TTT AGA TCT
序列号32:BamNco-SiD2-Fw:5’-AAA GGA TCC ATG GGA GAA GTC GAC CCTGCA TT
序列号33:SiD2-KpnXho-Rv:5’-AAA CTC GAG GTA CCC AAC CTT CAGTAG TTC TTG AAG T
序列号34:Bgl2-SiD3-Fw:5’-TTT AGA TCT ATG TCT GAA CTA CTC TCGGAA
序列号35:SiD3-KpnXho-Rv:5’-AAA CTC GAG GTA CCA ACA CGT CAT ATTTTC GCA TA
序列号36:BamNco-SiD4-Fw:5’-AAA GGA TCC ATG GAA CCA AAA TTA ACAAAG CTA
序列号37:SiD4-KpnXho-Rv:5’-AAA CTC GAG GTA CCT ACT ACA CCC TAAATC CTC ATA A
序列号38:BamHI-SiD5-Fw:5’-AAA GGA TCC ATG AGC TGC TTG CAG AGCT
序列号39:SiD5-KpnXho-Rv:5’-AAA CTC GAG GTA CCT TAA TTA AGT TATTGA AGT GAT TT
序列号40:Bgl2Nco-SiD6-Fw:5’-AAA GAT CTT CCA TGG AAG TTC AGACAA TGA AA
序列号41:SiD6-KpnXho-Rv:5’-AAA CTC GAG GTA CCT GAT CAG GTG CCCAGC CTG AAA TA
序列号42:BamNco-SiD7-Fw:5’-AAA GGA TCC ATG GCC TGG AGA TCT CAGACA GAA
序列号43:SiD7-KpnXho-Rv:5’-AAA CTC GAG GTA CCT TCA ATT CAA ACGCGG AAA TGT AA
PCR反应液(25μl),由作为模板的芝麻种子cDNA、各引物0.2pmol/μl、1×KOD plus缓冲液(TOYOBO)、0.2mM dNTPs、1mM MgSO4、1U KODplus聚合酶组成。94℃反应5分钟后,进行30个循环94℃1分钟、55℃1分钟、72℃ 2分钟的反应的PCR扩增后,72℃保持3分钟。将所得到的各PCR产物根据制造者推荐的方法插入pCR4 Blunt-TOPO vector(Invitrogen)的多克隆位点。确认通过序列分析插入的PCR产物无错误。
将亚克隆上述7种SiD后的质粒用BamHI或BglII及XhoI或KpnI酶切后所得到的含有全长SiD的约1.1kb的DNA片段,插入作为大肠杆菌表达载体的pET-30a载体(Novagen)的BamHI和XhoI或KpnI位点,得到7种的SiD大肠杆菌表达载体。
(实施例5:芝麻中SiD基因的表达分析)
将7种SiD基因的芝麻植物体中的基因表达模式用RT-PCR法分析。根据先行文献[Ono et al.,Proc.Natl.Acad.Sci.USA.103,10116-10121(2006)]将芝麻分为成熟叶、花瓣、茎、蒴果、种子(级别1~6)、幼芽(发芽诱导后1日和7日)。从1g分离器官中使用RNeasy Plant Mini Kit(QIAGEN)提取RNA。以所得到的RNA 1μg为模板进行反转录反应,得到cDNA。cDNA合成使用SuperScript First-Strand Synthesis System for RT-PCR(GIBCO BRL),合成条件根据本系统制造商推荐的条件。以所得到的各级别cDNA为模板,使用实施例4中记载的SiD基因特异性引物(序列号30~43)进行PCR反应。并且为了比较SiD基因和内源基因表达量,内部标准基因使用芝麻的18S核糖体RNA,为了扩增本基因,合成Si18S-Fw(序列号44)及Si18S-Rv引物(序列号45)。
序列号44:Si18S-Fw:5’-TAT GCT TGT CTC AAA GAT TAA
序列号45:Si18D-Rv:5’-AAC ATC TAA GGG CAT CAC AGA
由cDNA 1μl、1×Ex-Taq缓冲液(TaKaRa)、0.2nM dNTPs、引物各0.2pmol/μl、Ex-Taq聚合酶 1.25U组成。94℃反应5分钟后,进行30个循环94℃ 1分钟、55℃ 1分钟、72℃ 2分钟的反应的PCR扩增后,72℃保持7分钟。将PCR产物用1.0%琼脂糖凝胶进行电泳,通过溴化乙锭染色检测扩增片段。其结果显示,虽然7种SiD基因有不同的表达模式,但全部在积累了木脂素的芝麻种子中表达(图1)。
(实施例6:通过大肠杆菌的SiD重组蛋白质的表达)
将用实施例4构建的SiD基因的大肠杆菌表达载体通过规定方法转化到大肠杆菌BL21(DE3)株。将这些重组大肠杆菌在含有最终浓度为20μg/ml的氨苄青霉素的LB培养基中37℃下进行一夜预培养。将预培养液的一部分添加在含有氨苄青霉素50μg/ml、酪蛋白水解物0.5%的M9培养基(10ml)中,振荡培养到A600=0.6~1.0。其次,在培养液中加入最终浓度0.5mM的IPTG(异丙基-β-D-硫代半乳糖苷),进一步在30℃下振荡培养一夜后,3000rpm、4℃下离心分离10分钟进行集菌。将菌体悬浮于10ml的缓冲液[30mMTris-HCl(pH7.5)、30mM NaCl]中后,进行超音波処理以破碎大肠杆菌,之后,15,000rpm、4℃离心分离10分钟,将所得到的上清作为粗酶液用于测定以下的活性。
(实施例7:SiD重组蛋白质的酶分析)
松脂醇等的木脂素,例如,可根据公知的方法[日本农艺化学会志67:1693(1993)](日语原名:「日本農芸化学学会誌67:1693(1993)」)从芝麻中提取及纯化。底物溶解在少量的DMSO中后再溶解在70%乙醇中作为底物溶液(1mg/ml)。将此底物溶液5μl、在大肠杆菌表达的各SiD的上述粗酶液145μl、0.1M抗坏血酸钠10μl、0.1M 2-酮戊二酸(2OG)10μl及10mMFeSO4 10μl在反应管中混合后,30℃下反应1小时。
通过将100%乙腈(150μl)添加到反应管中,使酶反应停止。将反应管用旋涡混合器剧烈搅拌后,15,000rpm、4℃下离心分离5分钟,将所得到的上清用过滤器(孔径0.45mm、4mm Millex-LH,Millipore)净化后,用高效液相色谱法(以下HPLC)分析此上清。木脂素及其羟基化物的分析条件如下所示。
使用C-30色谱柱(野村化学C30-UG-5、4.6mm×150mm)进行液相色谱法[Lc-2010C(岛津制作所)]。流动相中A液使用0.1%TFA,B液使用含有0.1%TFA的90%乙腈。使用A液65%∶B液35%的混合液平衡色谱柱(20分钟)后,用直线浓度梯度(A液65%∶B液35%→A液0%∶B液100%)洗脱20分钟(流速0.6ml/分钟),用B液100%洗脱7分钟。测定287nm的吸收,检测样品中含有的化合物。将化合物的各谱峰用SPD-10AV(岛津制作所)测定190nm~400nm的光谱,寻找具有木脂素特征性2个最大吸收(230nm及280nm)的物质。在此条件下,在约8.7分钟检测出松脂醇标准品、在约12.8分钟检测出胡椒醇标准品、在保留时间约7.9分钟检测出丁香脂素标准品、及在约6.2分钟检测出开环异落叶松脂素标准品(图2)。
酶反应液的HPLC分析的结果,仅在Sid6重组蛋白质和松脂醇的反应液中,得到具有木脂素的光谱的生成物P1(保留时间约6.2分钟)及生成物P2(保留时间约4.3分钟)(图2)。而且还在Sid6重组蛋白质和胡椒醇的反应液中,新得到具有木脂素的吸收光谱(保留时间约9.7分钟)的生成物P3(图2)。此外,还在SiD6和丁香脂素的反应液中,新得到具有木脂素的吸收光谱的生成物P4(保留时间约5.8分钟)及生成物P5(保留时间约4.2分钟)(图2)。另外,在与开环异落叶松脂素的反应液中,未发现新的生成物(图2)。且不仅未发现芝麻素、芝麻素酚(sesaminol)及芝麻林酚(sesamolin)的生成物,也未发现为类黄酮之一的柚皮素的生成物。由以上结果可知,SiD6与具有呋喃环、且在苯环上至少具有相邻的羟基和甲氧基的木脂素反应。(图2)。
将来自表达SiD6的大肠杆菌的粗提取液10μl用于SDS-PAGE,CBB染色,结果发现了来自转化pET-30a载体的大肠杆菌的粗提取液中未曾发现的约45kDa左右的显著的条带(图3)。此条带大小与SiD6的推测分子量39.1kDa、来自pET-30a载体的His-Tag、凝血酶识别位点、肠激酶识别位点及S-Tag加在一起的条带大小一致,所以,结论是表达的45kDa的条带是重组SiD6蛋白质。因从酶反应液中除去2OG时,未发现新的生成物(图2),所以强烈支持了反应液中发现的生成物是由SiD6生成的木脂素的结论。
通过Blastx软件检索同源性的结果,SiD6与长春花的吲哚生物碱的羟化酶Desacetoxyvindoline 4-hydroxylase有最高47%的序列同源性,而至今为止还没有关于芝麻中本生物碱的报道,且用2OG双加氧酶的家族的酶对木脂素进行羟基化的活性为新发现。
(实施例8:SiD6的生成物的LC-MS分析)
通过LC-MS分析,进行了实施例7中SiD6的生成物P1及P3的分子量的分析。
将充填了1ml DIAION SEPABEADS HP20树脂(三菱化学)的色谱柱用10ml的50%丙酮洗涤后,用10ml的蒸馏水平衡。然后,将含有实施例7的SiD6的生成物的酶反应液200μl用蒸馏水分别定量到1ml后的产物加入色谱柱,用5ml的蒸馏水洗涤,除去蛋白质及盐类。其后,将用2ml的80%丙酮洗脱木脂素后的产物用蒸发器干燥。
将DIAIONHP-20树脂(三菱化学)1ml充填的色谱柱用50%丙酮5ml洗涤后,用水10ml平衡。将含有实施例7的松脂醇生成物P1的酶反应液加入色谱柱,用5ml水洗涤杂质后,用80%丙酮2ml洗脱反应生成物。用蒸发器干固洗脱液后,在含有1%甲酸的50%乙腈(100μl)中溶解,作为LC-MS分析样品。LC条件如下所示。
使用Develosil C30-UG-3色谱柱[野村化学(株)、3.0mm×150mm],流动相中A液使用含有10mM乙酸铵的水、B液使用100%乙腈。用10分钟的直线浓度梯度(A液70%∶B液30%→A液30%∶B液70%)洗脱,其后,用A液30%∶B液70%进行5分钟等度洗脱。(流速:0.2ml/分钟)。
检测用光电二极管阵列检测器[SPD-M10A、株式会社岛津制作所]收集230-500nm的数据,测定A280nm的色谱。且在PDA检测器之后,连接TOF-MS检测器(LCMS-IT-TOF株式会社岛津制作所),进行分子量的测定。MS的测定条件,在阴性及阳性的两种模式下、测定分子量范围为100-1000Da、接口电压分别为4.5KV及一3.5KV。
在此条件下,松脂醇及松脂醇反应生成物P1在10.1分钟、7.9分钟分别被洗脱。且胡椒醇及胡椒醇生成物P3在13.3分钟、10.9分钟分别被洗脱。LC-MS分析的结果,P1为阳性模式时,提供m/z 375.13[M+H]+,为阴性模式时提供m/z 373.13[M+H]-的分子离子,推测为在松脂醇上附加了羟基。且P3为阳性模式时,提供m/z 373.12[M+H]+,为阴性模式时,提供m/z 371.11[M+H]-的分子离子,推测为在胡椒醇上附加了羟基。
由以上结果可知,来自芝麻的SiD6基因编码对松脂醇及胡椒醇具有羟基化活性的木脂素羟化酶。
(实施例9:SiD6的生成物的纯化及NMR分析)
为了鉴定松脂醇的羟基化生成物P1及P2、胡椒醇的羟基化生成物P3的羟基化位点,进行各自的纯化及NMR分析。对松脂醇反应液,将充填了100ml的DIAION SEPABEADS HP20树脂(三菱化学)的色谱柱用200ml的50%丙酮洗涤后,用500ml的蒸馏水平衡。之后,将含有实施例7的SiD6的生成物P1及P2的酶反应液100ml装入色谱柱,进一步用200ml的蒸馏水洗涤,以除去蛋白质。最后将用200ml的50%丙酮洗脱P1、P2的产物用蒸发器减压浓缩后,进行冷冻干燥。对胡椒醇羟基化生成物P3同样进行纯化。之后,将其用色谱柱:Develosil C30-UG-5(20×250mm,野村化学)、A液:蒸馏水,B液:90%乙腈,洗脱条件:松脂醇羟基化物(P1·P2)∶20%-70%B液(60min)、胡椒醇羟基化物(P3)∶60-100%B液(60min)、流速:6ml/min、检测波长:280nm进行分离纯化。回收生成的主峰的组分,制备冷冻干燥标准品。将其用NMR(BRUKER公司、750MHz)分析的结果,可如下鉴定。
P1:9-羟基松脂醇(洗脱时间31.0min组分):NMR:δppm(DMSO-d6);2.47(1H,dd),3.08(1H,t),3.62(1H,ddd),3.66(1H,t),3.76(6H,s),4.40(1H,d),5.30(1H,d),5.45(1H,s),6.74(2H,brs),6.75(2H,brs),6.89(2H,brs)。
P2:9,9’-二羟基松脂醇(洗脱时间22.9min组分):NMR:δppm(DMSO-d6);2.77(2H,d),3.76(6H,s),4.75(2H,d),5.39(2H,d),6.60(2H,d),6.73(2H,d),6.85(2H,dd),7.13(2H,d)。
对于P3,进行各信号的归属确认(图4)的结果,确认其为9-羟基胡椒醇(图5)。9-羟基胡椒醇是新型化合物。从芝麻素代谢物分析来看,本新型木脂素在生物体内代谢转换为儿茶酚型的木脂素,发挥抗氧化性[先行文献:Nakai,M.,et al.J.Agric.Food.Chem.51,1666-1670.(2003)]。
由以上结果可知,本酶是具有呋喃骈呋喃型木脂素的9位羟基化活性的酶(图6)。从松脂醇及胡椒醇的羟基化位置类推,与丁香脂素反应的反应物P4及P5,其9位或9,9’位也同样被羟基化。
本发明不限于上述实施方式,可在权利要求所示范围内作种种变更。即对于在权利要求所示范围内组合适宜变更的技术手段后所得到的实施方式,也包含于本发明的技术范围内。
如上所述,本发明所涉及的多肽及多核苷酸对木脂素的羟基化有用。且可表达地导入本发明所涉及的多核苷酸的转化体或细胞,在食品领域、各种工业领域中,在木脂素羟基化或生产使用该物质的产品上极为有用。因上述转化体为植物体时,可将植物体自身作为食品使用,所以,在农业领域等中也非常有用。
并且,通过将本发明所涉及的多肽及多核苷酸与本发明者发现的其他酶(合成胡椒醇及芝麻素的酶SiP189)组合,可确定特定的木脂素分子种的生产体系,其结果,可扩大特定的木脂素分子种的生产量。因此,本发明可广泛用于农业、食品产业、医药品产业及与与上述产业相关联的产业。
序列表(SEQUENCE LISTING)
<110>三得利株式会社(SUNTORY LTD.)
<120>木脂素羟化酶(LIGNAN HYDROXYRASE)
<130>PIF083480C
<150>JP 2007-339510
<151>2007-12-28
<160>46
<170>PatentIn version 3.4
<210>1
<211>27
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)At3g13610-Fw
<400>1
atggctccaa cactcttgac aacccaa 27
<210>2
<211>27
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)At3g13610-Rv
<400>2
tcagatcttg gcgtaatcga cggtttt 27
<210>3
<211>29
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)GR-SiD1-Fw3
<400>3
ggggaacggg cgcagcttgc gggaagatt 29
<210>4
<211>30
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)GR-SiD1-Rv3
<400>4
ggcatcacca tcggttcccc caccgtgaaa 30
<210>5
<211>21
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD1-nest-Fw2
<400>5
tgatctcgtg ctggggttgaa 21
<210>6
<211>21
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD1-nest-Rv
<400>6
tgctcataat ctccatttgg t 21
<210>7
<211>27
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)GR-SiD2-Fw
<400>7
ggtcgacaca aggacggcgg ggcgtta 27
<210>8
<211>27
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)GR-SiD2-Rv
<400>8
acgccccgcc gtccttgtgt cgaccta 27
<210>9
<211>21
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD2-nest-Fw
<400>9
actgatggcg aatggattct t 21
<210>10
<211>21
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD2-nest-Rv2
<400>10
ttccttccag tccctgacat t 21
<210>11
<211>26
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)GR-SiD3-Rv
<400>11
ggggttcgga cacttggggt agtaga 26
<210>12
<211>21
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD3-nest-Rv
<400>12
caaggcggat tctttgacct t 21
<210>13
<211>27
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)GR-SiD5-Rv
<400>13
tgatccactt ctcgccccgc cggactt 27
<210>14
<211>21
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD5-nest-Rv
<400>14
tgagggcatt ttgggtaata g 21
<210>15
<211>27
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)GR-SiD6-Rv
<400>15
tgcgggtcag gtggatgagg ggccatt 27
<210>16
<211>355
<212>PRT
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid1蛋白(protein)
<400>16
Met Ala Gly Val Ala Ser Pro Pro Ala Glu Val Leu Leu Ser Lys Arg
1 5 10 15
Val Gln Glu Leu Val Ile Thr Gly Glu Asp Pro Ser Gly Pro Tyr Val
20 25 30
Cys Arg Asn Asp Asp Asp Asn Gly Glu Leu Asp Ala Thr Thr Glu Asn
35 40 45
Ser Pro Ile Pro Val Val Asn Ile Gly His Phe Leu Ser Gly Lys Trp
50 55 60
Ser Asp Asp Glu Ser Val Gln Glu Leu Lys Lys Leu His Ser Ala Leu
65 70 75 80
Ser Thr Trp Gly Cys Phe Gln Gly Ile Gly His Gly Ile Pro Ser Cys
85 90 95
Phe Leu Asp Glu Val Arg Arg Val Gly Arg Glu Phe Phe Glu Gln Pro
100 105 110
Met Glu Glu Lys Asn Lys Tyr Gly Lys Thr Val Thr Glu Phe Gln Gly
115 120 125
Tyr Gly Ala Asp Pro Val Pro Glu Glu Gly Gln Ser Leu Asp Trp Ser
130 135 140
Asp Arg Leu Phe Leu Glu Leu Val Pro Glu Asp Gln Arg Asn Tyr Arg
145 150 155 160
Phe Trp Pro Gln Asn Pro Ser Ser Phe Lys Gly Thr Leu Glu Glu Tyr
65 170 175
Ser Glu Lys Met Lys Thr Val Thr Glu Ile Ile Ser Lys Ser Met Ala
180 185 190
Arg Ser Leu His Leu Glu Glu Thr Cys Phe Leu Lys Gln Phe Gly Glu
195 200 205
Arg Ala Gln Leu Ala Gly Arg Phe Asn Tyr Tyr Ser Pro Cys Arg Arg
210 215 220
Pro Asp Leu Val Leu Gly Leu Lys Pro His Ala Asp Gly Ser Gly Tyr
225 230 235 240
Thr Val Ile Leu Gln Asp Glu Pro Gly Leu Gln Val Leu Asn His Gly
245 250 255
Lys Trp Tyr Thr Val Pro Lys Asn Pro Asp Ala Leu Leu Val Leu Met
260 265 270
Gly Asp Gln Met Glu Ile Met Ser Asn Gly Val Phe Arg Ser Pro Val
275 280 285
His Arg Val Leu Ser Asn Gly Glu Arg Asp Arg Ile Ser Val Ala Val
290 295 300
Phe Tyr Thr Pro Glu Val Gly Lys Glu Ile Gly Pro Glu Glu Gly Leu
305 310 315 320
Ile Ser Ala Glu Ala Pro Arg Val Phe Lys Met Val Lys Asp Tyr Ala
325 330 335
Asp Ile His Val Gly Tyr Tyr Gln Arg Gly Met Arg Ser Leu His Thr
340 345 350
Val Arg Val
355
<210>17
<211>1330
<212>DNA
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sidl DNA
<220>
<221>misc_feature
<222>(1264)..(1264)
<223>n is a,c,g,or t
<220>
<221>misc_feature
<222>(1271)..(1271)
<223>n is a,c,g,or t
<400>17
atggctggag ttgcatcccc acccgctgaa gtattgctgt ccaaaagagt ccaagaattg 60
gtcatcaccg gtgaggaccc gtcggggcca tacgtgtgta gaaacgacga cgacaacggg 120
gaattagacg cgacaactga gaattctccg attccagttg tgaacattgg acacttcttg 180
tcgggaaaat ggtccgatga tgaaagtgta caagagctga agaaactcca ctcggctctc 240
tccacatggg gatgctttca gggcataggt catgggatcc cgagttgttt cctggacgag 300
gtacgaagag ttgggaggga gttcttcgag cagccaatgg aggagaagaa caagtatggg 360
aaaacggtga cggagtttca agggtatgga gctgatcccg tcccggaaga agggcagtcg 420
ctcgactggt cggatcgtct tttcctagag ttagtccctg aagatcaaag aaattacaga 480
ttctggcctc agaacccatc ctctttcaaa ggaacactgg aagagtactc ggagaagatg 540
aaaacagtga ctgagataat atccaaatcc atggcaagat cacttcatct tgaggagacc 600
tgcttcttga aacagttcgg ggaacgggcg cagcttgcgg gaagattcaa ctactattcg 660
ccttgcagga ggcctgatct cgtgctgggg ttgaagcctc acgccgacgg atcaggctac 720
accgttatac tgcaggatga acccggcctt caagtactca accatggcaa atggtatact 780
gtccccaaga accctgatgc ccttctagtc ctcatggggg accaaatgga gat tatgagc 840
aacggggtgt tcagaagtcc ggtgcacagg gtgctgagca atggggagag ggacaggatc 900
tctgtggctg tattttacac gccggaggtg gggaaggaga tcgggccgga agaggggttg 960
atcagtgcgg aggcaccgag agtgttcaag atggtgaaag attatgctga cattcacgtg 1020
gggtactatc agaggggaat gagatcgctt catactgtca gagtttgatg ctctatatat 1080
atagggaaag tttagtccat ctcgagtttg gtcagatcta aatcaattat atgtcaagtc 1140
aatacatttg tcgtgattag tgtataattt aaaaaatgac taatcatgtg acaaatgtat 1200
cacacttgct ctataattga tttagttcaa tgaaagctga tatagataaa aattttgcat 1260
gtanatatgg ngtgtgttgg atgcctttcc aatgtttaaa taaccatatt gctgcttggg 1320
atttcttttg 1330
<210>18
<211>350
<212>PRT
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid2蛋白(protein)
<400>18
Met Gly Glu Val Asp Pro Ala Phe Ile Gln Ala Leu Glu His Arg Pro
1 5 10 15
Lys Pro His Ser Val Glu Ala Gln Gly Ile Pro Leu Ile Asp Leu Ser
20 25 30
Pro Ala Asn Ser Pro Asp Pro Asp Pro Gly Ser Leu Ser Ala Leu Ala
35 40 45
Ala Glu Ile Gly Asp Ala Cys Glu Lys Trp Gly Phe Phe Gln Val Ile
50 55 60
Asn His Gly Val Pro Leu His Val Arg Glu Lys Ile Asp Leu Val Ser
65 70 75 80
Arg Lys Phe Phe Ala Leu Pro Lys Glu Glu Lys Lys Lys Val Ser Arg
85 90 95
Asp Glu Val Asn Pro Ser Gly Tyr Tyr Asp Thr Glu His Thr Lys Asn
100 105 110
Val Arg Asp Trp Lys Glu Val Phe Asp Phe Thr Val Gly Glu Pro Met
115 120 125
Val Met Pro Ala Ser His Glu Pro Asp Asp Arg Glu Leu Lys Glu Val
130 135 140
Ile Asn Gln Trp Pro Glu Asn Pro Ser Glu Met Arg Glu Val Cys Glu
145 150 155 160
Glu Tyr Gly Ala Glu Met Gln Lys Leu Gly His Lys Leu Leu Glu Leu
165 170 175
Ile Ala Leu Ser Leu Gly Leu Ala Arg Asp Arg Phe Asn Gly Phe Phe
180 185 190
Lys Asp Gln Thr Thr Phe Ile Arg Leu Asn Tyr Tyr Ala Pro Cys Pro
195 200 205
Ile Pro Asp Leu Ala Leu Gly Val Gly Arg His Lys Asp Gly Gly Ala
210 215 220
Leu Thr Ile Leu Ala Gln Asp Asp Val Gly Gly Leu Glu Val Lys Arg
225 230 235 240
Lys Thr Asp Gly Glu Trp Ile Leu Val Lys Pro Thr Pro Asp Ala Tyr
245 250 255
Ile Ile Asn Val Gly Asp Ile Ile Gln Val Trp Ser Asn Asp Lys Tyr
260 265 270
Glu Ser Val Glu His Arg Val Lys Val Asn Ser Glu Arg Glu Arg Phe
275 280 285
Ser Ile Pro Phe Phe Leu Asn Pro Ala His Tyr Thr Met Val Glu Pro
290 295 300
Leu Glu Glu Leu Val Asn Lys Gln Asn Pro Ala Asn Tyr Asn Pro Tyr
305 310 315 320
Asn Trp Gly Lys Phe Phe Ser Thr Arg Lys Arg Ser Asn Tyr Lys Lys
325 330 335
Leu Asp Val Glu Asn Ile Gln Ile His His Phe Lys Asn Tyr
340 345 350
<210>19
<211>1191
<212>DNA
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid2 DNA
<400>19
atgggagaag tcgaccctgc attcatccaa gcgctcgaac acaggcctaa accccacagc 60
gtcgaggccc aaggcatccc gttaatcgat ctctcccccg ccaactcccc ggaccccgat 120
ccgggttccc tgtcagctct cgccgccgaa attggtgatg cgtgcgagaa atggggattt 180
ttccaggtga tcaaccacgg ggtgccgttg catgttcggg agaaaattga cctggtttcc 240
aggaaatttt ttgctctgcc gaaagaggag aagaagaagg tttccaggga tgaggtgaac 300
ccgtcggggt attacgacac tgagcacact aagaatgtca gggactggaa ggaagtgttt 360
gatttcacgg tgggggaacc gatggtgatg ccggcttcgc atgagcctga tgacagggag 420
ctgaaagaag tgatcaatca gtggcctgag aatccttcag aaatgaggga agtgtgtgaa 480
gaatacggtg cagaaatgca aaaattggga cacaagttgc tggaactcat agccctgagc 540
ctaggcttgg cgagagatcg attcaatggg tttttcaagg atcaaaccac cttcattcgg 600
ctgaattact atgcgccatg cccgatccct gatctagctc ttggcgtagg tcgacacaag 660
gacggcgggg cgttaacaat tcttgctcaa gacgatgtag gggggctgga ggtgaagagg 720
aaaactgatg gcgaatggat tcttgtgaaa cctactcctg atgcctatat aatcaatgtt 780
ggtgacatta tacaggtttg gagcaacgat aagtacgaga gtgtggaaca cagagtgaaa 840
gtgaattcag agagagagag attttcgatt cccttcttcc tcaaccctgc acattatact 900
atggtagaac cgctggagga gctggtgaac aagcagaatc ctgccaacta caatccttac 960
aactggggaa agttcttctc cacccgaaaa cgcagtaact acaagaagct tgatgtggag 1020
aacattcaaa tacatcactt caagaactac tgaaggttgc ccttttgggc ctaagtgttc 1080
acattctcaa tgattatgct tacagactga tggatttggc tctcttgact gtgcatgtat 1140
tatgaataaa taattacttt agatatatta taaaaaaaaa aaaaaaaaaa a 1191
<210>20
<211>356
<212>PRT
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid3蛋白(protein)
<400>20
Met Ser Glu Leu Leu Ser Glu Pro Asp Asn Leu Ile Asp Phe Met Leu
1 5 10 15
Asn Lys Gly Asn Gly Val Lys Gly Leu Ser Gln Ile Asn Leu Lys Gln
20 25 30
Ile Pro Asp Arg Phe Ile Gln Pro Pro Glu Glu Arg Leu Asp His Ile
35 40 45
Gln Ile Ala Thr Gln Glu Ser Val Pro Val Ile Asp Val Ser Arg Trp
50 55 60
Asp Asp Pro Gly Ile Ala Glu Ser Ile Cys Glu Ala Ala Ala Lys Trp
65 70 75 80
Gly Phe Phe Gln Ile Ile Asn His Gly Ile Pro Asp Glu Val Leu Glu
85 90 95
Asn Val Lys Arg Ala Ala His Asp Phe Phe Glu Leu Pro Val Glu Glu
100 105 110
Arg Arg Arg Tyr Leu Lys Glu Asn Ser Pro Thr His Thr Val Met Leu
115 120 125
Lys Thr Ser Phe Ser Pro Leu Ala Glu Lys Ile Leu Glu Trp Lys Asp
130 135 140
Tyr Leu Met His Tyr Cys Asp Gly Gln Glu Asn Glu His Ser Lys Phe
145 150 155 160
Trp Pro Pro Leu Ser Arg Asp Gln Val Leu Asp Tyr Val Asn Trp Ile
165 170 175
Lys Pro Ile Ile Arg Lys Leu Leu Thr Val Leu Leu Asn Gly Ile Lys
180 185 190
Val Glu Gln Ile Asp Lys Val Lys Glu Ser Ala Leu Met Gly Ser Pro
195 200 205
Val Val Thr Leu Leu Tyr Tyr Pro Lys Cys Pro Asn Pro Asn Val Ala
210 215 220
Ala Gly Ala Gly Arg His Ser Asp Val Ser Ser Ile Thr Ile Leu Leu
225 230 235 240
Gln Asp Asp Val Gly Gly Leu Tyr Val Arg Ala Thr Glu Gly Asp Gln
245 250 255
Trp Ile His Ile Ala Pro Thr Lys Gly Ala Leu Val Val Asn Ile Gly
260 265 270
Asp Val Leu Gln Ile Met Ser Asn Asp Arg Tyr Lys Ser Ile Glu His
275 280 285
Arg Val Phe Val Asn Gly Ser Lys Asn Arg Val Ser Val Pro Val Phe
290 295 300
Val Asn Pro Ser Ser Asp Ala Ile Ile Gly Pro Leu Pro Glu Val Leu
305 310 315 320
Lys Ala Gly Glu Lys Pro Ile Tyr Lys His Val Val Phe Ser Asp Tyr
325 330 335
Phe Asn Tyr Phe Phe Ser Lys Gly His Asp Gly Lys Arg Ser Leu Asp
340 345 350
Tyr Ala Lys Ile
355
<210>21
<211>1161
<212>DNA
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid3 DNA
<400>21
atgtctgaac tactctcgga acccgacaac ctcatagatt ttatgctgaa caaaggaaat 60
ggagtgaagg gtctctctca gataaacctt aaacaaatcc cagatcgatt catccagccc 120
cctgaagaaa gattggacca tatccaaatt gcgacccaag aatccgtacc cgttatcgat 180
gtgtccagat gggatgaccc gggaattgca gaatcaatct gcgaggcagc agccaagtgg 240
ggtttctttc agatcatcaa tcatggaatc ccagatgagg ttcttgaaaa tgtgaagagg 300
gctgctcatg atttctttga gttgcctgtt gaggagagga ggaggtattt gaaggagaat 360
tctcccactc acactgtgat gttgaagact agctttagtc ctcttgctga gaagattttg 420
gagtggaaag actatcttat gcactactgt gatggccaag aaaatgagca ttccaagttc 480
tggccacctt tgtctagaga tcaagttttg gactacgtaa actggataaa gcccattatc 540
agaaagctac tgacagtgtt gctcaatggt attaaggtgg aacaaattga caaggtcaaa 600
gaatccgcct tgatgggctc accagttgtc acccttctct actaccccaa gtgtccgaac 660
cccaatgttg cagctggagc tggccgtcac tctgatgtgt catcaatcac catcctccta 720
caagacgacg taggtggact ctacgtacga gcaactgaag gcgaccagtg gatccatata 780
gcaccaacca aaggagctct tgttgtaaac atcggagatg tgctgcagat catgagcaac 840
gacaggtaca aaagcatcga gcatcgtgta tttgtgaatg ggagcaagaa cagggtttcc 900
gtgcccgtct ttgtcaaccc ttcaagtgac gccatcattg gccctctgcc ggaagtgctg 960
aaggccggag agaaaccaat ctataaacat gttgtcttct cggattactt caattacttc 1020
tttagtaaag gtcatgatgg caaacgatcg ctggattatg cgaaaatatg acgtgtttgt 1080
gttttgtagg atagcttatc ttcacaagtc tttgctgtct tcttgcatag gctgtgtcat 1140
atactcacag atttatctcc g 1161
<210>22
<211>356
<212>PRT
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid4蛋白(protein)
<400>22
Met Glu Pro Lys Leu Thr Lys Leu Gly Ser Ser Leu Pro Val Pro Ile
1 5 10 15
Val Gln Glu Leu Ala Lys Glu Lys Leu Ala Thr Val Pro Pro Arg Tyr
20 25 30
Val Arg Pro Asp Gln His Gln His Thr Ile Leu Ser Ala Leu Asn Ser
35 40 45
Ser Phe Pro Gln Ile Pro Val Ile Asp Met Gln Lys Phe Ser Asp Ile
50 55 60
Tyr Ile Met Asp Ser Glu Leu Gln Ala Leu His Asn Ala Cys Gln Glu
65 70 75 80
Trp Gly Phe Phe Gln Leu Ile Asn His Gly Val Asp Ser Ala Val Met
85 90 95
Glu Lys Met Lys Ile Glu Ile Gln Glu Phe Phe Asn Leu Pro Ile Glu
100 105 110
Glu Lys Lys Lys Phe Lys His Glu Glu Gly Asp Ile Gln Gly Tyr Gly
115 120 125
Gln Ala Phe Val Val Ser Glu Asp Gln Lys Leu Asp Trp Gly Asp Val
130 135 140
Phe Ala Ile Val Thr Ser Pro Ile Tyr Leu Arg Lys Pro His Leu Ile
145 150 155 160
Ala Lys Leu Pro Ala Thr Phe Arg Asp Ala Thr Glu Val Tyr Ala Ser
165 170 175
Glu Leu Lys Val Leu Ala Met Lys Ile Leu Lys Leu Met Ala Lys Ala
180 185 190
Leu Asp Met Lys Ala Glu Glu Met Glu Thr Leu Phe Ala Glu Gly Met
195 200 205
His Ser Met Arg Met Asn Tyr Tyr Pro Pro Cys Pro Gln Pro Glu Leu
210 215 220
Val Thr Gly Leu Cys Pro His Ser Asp Ala Asp Gly Leu Thr Ile Leu
225 230 235 240
Leu Gln Val Asn Glu Met Asp Gly Leu Gln Ile Lys Lys Asp Gly Val
245 250 255
Trp Ile Pro Val Ser Pro Leu Pro Asn Ala Phe Thr Ile Asn Ile Gly
260 265 270
Asp Asn Leu Glu Ile Leu Thr Asn Gly Ala Tyr Arg Ser Ile Glu His
275 280 285
Arg Ala Thr Val Asn Lys Glu Lys Glu Arg Ile Ser Ile Ala Thr Phe
290 295 300
Leu Gly Ala Asn Leu Asp Gly Asp Met Gly Pro Ser Pro Ser Leu Val
305 310 315 320
Thr Pro Gln Thr Pro Ala Lys Phe Lys Arg Ile Gly Val Thr Gln Tyr
325 330 335
Leu Lys Glu Leu Phe Ser Arg Glu Leu Met Gly Lys Ser Tyr Leu Asp
340 345 350
Leu Met Arg Ile
355
<210>23
<211>1208
<212>DNA
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid4 DNA
<400>23
atggaaccaa aattaacaaa gctaggcagc tctcttccgg tgcctatcgt acaagaattg 60
gccaaggaga aattagcaac ggttcctcca agatacgtgc gcccagatca acatcaacac 120
acgattctct ctgctcttaa ttcttccttc cctcaaattc ctgtcatcga tatgcagaag 180
ttttcagaca tctatataat ggattctgag cttcaggccc tacataatgc atgccaagaa 240
tggggtttct ttcagttgat caaccatggg gtggactctg ctgtaatgga gaaaatgaag 300
atagaaattc aagaattctt taatctccca atagaggaga agaagaaatt taagcatgag 360
gaaggggaca tacagggtta tgggcaagcc tttgttgtat cagaagatca aaagctcgac 420
tggggagacg tgtttgccat tgttacctca ccaatttacc tcagaaagcc tcacttaatc 480
gccaagcttc ctgctacctt cagggacgcc acagaagtgt atgcatcgga actcaaagtt 540
ctcgccatga agattctaaa gctaatggca aaagccttag acatgaaagc tgaagaaatg 600
gaaacgctat tcgcagaagg gatgcattcc atgaggatga actactatcc tccgtgtccc 660
cagcccgagc tcgtcacggg cctctgccct cactccgatg cagatgggct caccattctc 720
ctccaagtga atgaaatgga tggcctccag atcaagaaag atggagtctg gattcccgtt 780
tctccactcc ctaatgcctt caccatcaat attggagata acttggagat tctgacaaac 840
ggtgcttata ggagcattga gcatagagca actgtcaaca aggagaaaga aagaatctcc 900
attgccacat ttctgggcgc gaatctagat ggtgatatgg gtccgtcgcc aagcctcgtc 960
actcctcaga ctccggcaaa attcaagagg atcggggtga ctcaatattt gaaggaacta 1020
ttctcgcggg aactcatggg gaaatcatat ctagacctta tgaggattta gggtgtagta 1080
ctggggtatg gtaataacac caacatgagt ttgtacctaa taagttatca accattagat 1140
tacaaataat actatgatca tgtgtaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1200
aaaaaaaa 1208
<210>24
<211>359
<212>PRT
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid5蛋白(protein)
<400>24
Met Met Ser Cys Leu Gln Ser Trp Pro Glu Pro Val Val Arg Val Gln
1 5 10 15
His Leu Ser Asp Ser Gly Ile Arg Val Ile Pro Glu Arg Tyr Val Lys
20 25 30
Lys Leu Ser Asp Arg Pro Ser Phe Cys Asp Ser Leu Ser Gly Glu Val
35 40 45
Asn Ile Pro Val Ile Asp Met Lys Gly Leu Tyr Ser Asp Asp Ala Ser
50 55 60
Val Arg Lys Lys Thr Ala Gly Met Ile Ser Gly Ala Cys Arg Glu Trp
65 70 75 80
Gly Phe Phe Gln Val Val Asn His Gly Val Arg Gln Glu Val Met Gly
85 90 95
Arg Ala Arg Glu Ala Trp Arg Glu Phe Phe Lys Leu Pro Leu Glu Glu
100 105 110
Lys Gln Lys Tyr Ala Asn Ser Pro Ser Thr Tyr Glu Gly Tyr Gly Ser
115 120 125
Arg Leu Gly Val Glu Lys Gly Ile Ser Leu Asp Trp Ser Asp Tyr Phe
130 135 140
Phe Leu Asn Tyr Leu Pro Leu Ala Leu Arg Asp Gln Asn Lys Trp Pro
145 150 155 160
Ala Leu Pro Leu Ser Cys Arg Glu Met Val Gly Glu Tyr Cys Arg Glu
165 170 175
Val Val Glu Leu Gly Gly Arg Leu Met Lys Ile Leu Ser Ser Asn Leu
180 185 190
Gly Leu Glu Glu Glu Tyr Leu Gln Glu Ala Phe Gly Gly Glu Glu Phe
195 200 205
Gly Ala Cys Met Arg Val Asn Tyr Tyr Pro Lys Cys Pro Gln Pro Asp
210 215 220
Leu Thr Leu Gly Leu Ser Pro His Ser Asp Pro Gly Gly Met Thr Leu
225 230 235 240
Leu Phe Pro Asp Glu Asn Val Ser Gly Leu Gln Val Arg Arg Gly Glu
245 250 255
Lys Trp Ile Thr Val Asp Pro Val Pro Asn Ala Phe Ile Val Asn Ile
260 265 270
Gly Asp Gln Leu Glu Val Leu Ser Asn Gly Asn Tyr Lys Ser Val Glu
275 280 285
His Arg Val Ile Val Asn Ser Glu Lys Glu Arg Val Ser Ile Ala Leu
290 295 300
Phe Tyr Asn Pro Arg Gly Asp Met Leu Ile Lys Pro Ala Asp Glu Leu
305 310 315 320
Val Thr Glu Asp Arg Pro Pro Leu Tyr Pro Pro Thr Val Tyr Asp Glu
325 330 335
Tyr Arg Leu Tyr Met Arg Thr Arg Gly Pro Arg Gly Lys Ser Gln Val
340 345 350
His Ser Leu Lys Ser Leu Gln
355
<210>25
<211>1242
<212>DNA
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid5 DNA
<400>25
atgatgagct gcttgcagag ctggcccgaa cccgttgtca gggtccaaca cctctccgac 60
agcgggattc gggtaatccc cgaacgctac gtgaagaaac tctcagacag gccgagcttt 120
tgcgactccc tctccggcga agttaacatt ccagtcatcg acatgaaggg gttgtactcg 180
gacgacgcct cagtccggaa gaagacggcc gggatgatca gcggggcatg ccgcgagtgg 240
gggttcttcc aggtggtgaa ccacggggtg agacaggagg tgatggggcg ggccagggag 300
gcgtggcgcg agttttttaa gctgccgctg gaggagaagc agaagtacgc gaattcgccg 360
agcacgtatg aggggtacgg cagccgcctg ggtgtggaga agggaatatc actggattgg 420
agtgactact ttttcctgaa ttaccttcct ctcgcactca gagaccagaa taagtggcct 480
gcacttcctc tttcatgcag ggaaatggtg ggagagtact gtagagaagt ggttgaactt 540
ggtggaagat tgatgaagat tctgtcgagc aatcttgggc tggaagaaga gtatcttcaa 600
gaagcatttg gaggagagga gtttggggca tgcatgaggg ttaactatta cccaaaatgc 660
cctcaaccgg acctcacact cggcctttct cctcattccg acccgggtgg gatgaccctt 720
ctcttccccg acgagaacgt atcgggtctc caagtccggc ggggcgagaa gtggatcacc 780
gtcgacccag tccccaatgc gtttatcgtc aatataggag atcaacttga ggtgttaagc 840
aatgggaatt acaagagtgt ggagcatagg gtgattgtga attcagagaa agagagagtg 900
tcaatcgcat tgttctacaa tccaaggggt gatatgctga taaagccggc ggatgagctg 960
gtgacggagg accgcccacc gctctacccg cccaccgttt acgacgagta taggctgtac 1020
atgaggacaa ggggccctcg tggcaagtcc caagtccatt cacttaaatc acttcaataa 1080
cttaattaat attatattta aataataatt ttaggtagta ttgttccatg aattgtagtg 1140
ttgtttgtta attaatttcc gcattttatg taatttggat tgtactacac atatatatca 1200
tgactactac tcatcatggg ttaattaaaa aaaaaaaaaa aa 1242
<210>26
<211>368
<212>PRT
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid6蛋白(protein)
<400>26
Met Glu Val Gln Thr Met Lys Val His Ala Tyr Asp Arg Leu Ser Glu
1 5 10 15
Leu Lys Ala Phe Asp Asp Ser Lys Ser Gly Val Lys Gly Leu Val Asp
20 25 30
Ala Gly Val Thr Lys Ile Pro Arg Phe Phe Ile Asn Asp Asn Asp Met
35 40 45
Pro Gly Ser Glu Pro Cys Asn Phe Asn Ser Glu Ala Ile Phe Pro Val
50 55 60
Ile Asp Leu Ser Gly Met His His Ala Ala Asn Arg Ala Gly Ile Val
65 70 75 80
Ser Arg Val Lys Glu Ala Cys Glu Lys Trp Gly Phe Phe Gln Ile Ile
85 90 95
Asn His Glu Met Pro Leu Arg Val Met Asp Glu Met Ile Ala Gly Val
100 105 110
Arg Arg Phe His Glu Gln Asp Ala Glu Val Lys Lys Lys Tyr Tyr Gly
115 120 125
Arg Asp Val Thr Lys Lys Phe Gln Tyr Asn Ser Asn Phe Asp Leu Tyr
130 135 140
Lys Thr Arg Ala Ala Met Trp Arg Asp Thr Ile Thr Cys Val Met Ala
145 150 155 160
Pro His Pro Pro Asp Pro Gln Glu Leu Pro Asp Val Cys Arg Asp Ile
165 170 175
Met Phe Glu Tyr Ser Lys His Val Met Arg Val Gly His Thr Val Tyr
180 185 190
Glu Leu Leu Ser Glu Ala Leu Gly Leu Asn Pro Ser Tyr Leu Arg Asp
195 200 205
Ile Gly Cys Ile Glu Ser Asn Phe Ile Val Gly His Tyr Ser Pro Ala
210 215 220
Cys Pro Glu Pro Glu Leu Thr Phe Gly Ile Arg Ser His Val Asp Phe
225 230 235 240
Gly Leu Leu Thr Ile Leu Leu Gln Asp Gln Ile Gly Gly Leu Gln Val
245 250 255
Leu His Gln Asn Gln Trp Val Asp Val Ser Pro Leu Pro Gly Ser Leu
260 265 270
Ile Ile Asn Val Gly Asp Phe Ile Gln Leu Ile Ser Asn Asp Lys Phe
275 280 285
Lys Ser Val Lys His Arg Ala Leu Ser Lys Arg Val Gly Pro Arg Ile
290 295 300
Ser Val Gly Val Phe Ile Lys Pro Tyr Tyr Ala Asp Gly Asp Asn Leu
305 310 315 320
Arg Val Tyr Gly Pro Ile Lys Glu Leu Leu Thr Glu Glu Glu Pro Ala
325 330 335
Ile Tyr Arg Glu Thr Thr Tyr Lys Asp Tyr Glu Arg Phe Tyr Phe Ala
340 345 350
Asn Cys Asp Asp Gly Thr Thr Lys Leu Pro Tyr Phe Arg Leu Gly Thr
355 360 365
<210>27
<211>1170
<212>DNA
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid6 DNA
<400>27
atggaagttc agacaatgaa agttcatgca tacgatcgac taagtgaact aaaagcattc 60
gatgattcaa aatcaggcgt gaagggactt gttgatgctg gtgttacgaa gatcccacgc 120
ttcttcatta atgataatga tatgcctgga tccgaaccgt gcaacttcaa ctcagaagcc 180
atctttccag tcatagattt atcaggcatg caccatgctg caaaccgtgc tggaattgtc 240
agcagagtga aagaggcatg tgagaagtgg ggattctttc agataatcaa tcatgagatg 300
ccgctgcgag tgatggatga aatgattgca ggggttcgaa gatttcacga gcaagatgct 360
gaggttaaga agaaatacta cggtcgtgat gtcacgaaaa agtttcagta caatagcaat 420
ttcgatcttt acaaaacacg ggcggccatg tggagggata ctatcacttg tgtaatggcc 480
cctcatccac ctgacccgca ggaattgcca gatgtatgca gagacatcat gtttgaatac 540
tctaagcatg tcatgagagt ggggcatacc gtgtatgaat tgctgtcgga ggctttgggc 600
ctcaatccca gctacctgag agacattggc tgtattgagt cgaatttcat cgtgggccat 660
tattctccgg cttgcccaga accagaactg acctttggca tcagaagcca cgtcgacttc 720
ggcttgctca caatactctt gcaggaccag attggcggtc tccaggtgct tcaccagaat 780
cagtgggtcg acgtttctcc cttgcctgga agtctaataa taaatgttgg ggactttata 840
cagctgatca gtaacgacaa attcaaaagc gtgaaacaca gagcactatc aaaaagggta 900
gggccaagaa tttcagttgg tgttttcatt aaaccctact acgctgatgg agataatttg 960
cgggtgtacg gacctatcaa ggagctgtta actgaagaag agccggctat ctacagggaa 1020
acaacttata aagactatga aagattctac ttcgccaatt gtgatgacgg aaccaccaag 1080
ctgccgtatt tcaggctggg cacctgatca atggtcctgc agtggcagct tgtcaagtac 1140
tggatagttg tgaactgacc ttcttcacca 1170
<210>28
<211>365
<212>PRT
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid7蛋白(protein)
<400>28
Met Ala Trp Arg Ser Gln Thr Glu Ala Asn Tyr Asp Arg Ala Ser Glu
1 5 10 15
Leu Lys Ala Phe Asp Asp Thr Lys Thr Gly Val Lys Gly Leu Val Asp
20 25 30
Ser Gly Ile Thr Gln Val Pro Arg Ile Phe Ile Thr Pro Arg Asn Asp
35 40 45
Ser Asp Lys Asn Leu Lys Pro Ser Asp Ser Gln Leu Lys Phe Pro Ile
50 55 60
Ile Asp Leu Glu Asn Ile Asp Glu Asp Pro Ile Arg Phe Lys Lys Val
65 70 75 80
Val Asp Glu Val Arg Asp Ala Ser Gly Thr Trp Gly Phe Phe Gln Val
85 90 95
Ile Asn His Gly Ile Pro Gly Ser Val Leu Glu Glu Met Leu Asp Gly
100 105 110
Val Arg Lys Phe Tyr Glu Gln Asp Pro Glu Glu Arg Lys Lys Trp Tyr
115 120 125
Thr Arg Asp Arg Lys Arg Ser Val Val Tyr Asn Ser Asn Phe Asp Leu
130 135 140
Tyr Ser Ala Pro Ala Ala Asn Trp Arg Asp Thr Phe Phe Cys Lys Met
145 150 155 160
Ala Pro His Pro Pro Ser Pro Glu Glu Leu Pro Ala Val Cys Arg Asp
165 170 175
Ile Met Phe Glu Tyr Thr Lys Gln Val Leu Lys Leu Gly Thr Ser Leu
180 185 190
Phe Lys Leu Leu Ser Glu Ala Leu Gly Leu Asp Ala Asn His Leu Gly
195 200 205
Asp Met Lys Cys Ala Asp Gly Leu Ala Leu Leu Cys His Tyr Tyr Pro
210 215 220
Phe Cys Pro Gln Pro Glu Leu Thr Met Gly Ala Ser Gln His Ala Asp
225 230 235 240
Ser Asp Phe Leu Thr Val Leu Leu Asn Asp Asn Val Thr Gly Leu Gln
245 250 255
Val Leu Tyr Gln Asn Gln Trp Phe Asp Val Pro Ser Val Pro Gly Ser
260 265 270
Leu Val Val Asn Val Gly Asp Leu Leu Gln Leu Ile Ser Asn Asp Arg
275 280 285
Leu Ile Ser Ser Glu His Arg Val Leu Ala Asn Asn Val Arg Ser Arg
290 295 300
Val Ser Val Ala Cys Phe Phe Arg Ser Asp Ile Asp Lys Ser Asp Glu
305 310 315 320
Leu Tyr Gly Pro Ile Gln Glu Leu Leu Ser Glu Asp Asn Pro Pro Lys
325 330 335
Tyr Arg Ala Thr Thr Met Lys Glu Tyr Val Asn Tyr Tyr Asn Ala Lys
340 345 350
Gly Leu Asp Gly Thr Ser Ala Leu Leu His Phe Arg Val
355 360 365
<210>29
<211>1281
<212>DNA
<213>芝麻(Sesamum indicum)
<220>
<221>misc_feature
<223>Sid7 DNA
<400>29
atggcctgga gatctcagac agaagcaaac tacgacagag caagcgaact aaaagctttt 60
gatgacacca aaactggtgt caaaggctta gttgacagtg gtataaccca agtcccgaga 120
atcttcatca ccccacgaaa tgattcagac aagaacctta aaccttccga ttcacaactc 180
aaattcccaa taattgacct cgaaaacatc gatgaagatc caatcaggtt taagaaggtc 240
gtggacgagg ttcgagatgc ttcagggaca tggggtttct tccaggtgat caatcatggg 300
attccgggtt ctgttttgga ggagatgcta gatggggtcc ggaaattcta tgaacaagat 360
cctgaggaga ggaaaaagtg gtacacaagg gatagaaaaa gaagtgttgt ttacaatagc 420
aactttgatt tgtatagtgc accagcagct aattggaggg acactttctt ctgtaaaatg 480
gctcctcatc ctccaagccc tgaggagttg cccgctgtgt gcagagatat aatgtttgag 540
tacacaaagc aagttttgaa actgggaaca agtttgttta aattgttgtc cgaggccctt 600
ggtctggatg ccaaccacct tggggacatg aaatgtgctg acgggcttgc tctcctgtgc 660
cattactacc ccttctgccc tcagccggag ttaactatgg gcgccagcca gcacgcggac 720
agtgacttcc tgacggtgct cctaaatgac aatgtaaccg gcctgcaagt tctttaccaa 780
aaccagtggt ttgatgttcc ctcagtgccc ggatctctgg tggtaaatgt tggagatctt 840
ctacagctta tatcaaatga taggttgatt agttcggagc atagagtact agcaaacaac 900
gttcgttcaa gggtatcagt cgcatgtttc tttagaagcg acatagataa gtcggacgag 960
ctctacggac caatccagga actcttgtct gaagataatc caccaaaata cagggcaacc 1020
accatgaaag agtatgtgaa ctactacaac gccaaggggt tggacggaac ttctgctttg 1080
ttacatttcc gcgtttgaat tgaaatgata tgatgggaag atgttacttt ccatattaat 1140
ataatccggg aaaacggaac attcgaaatg tagtatgaaa gaaaaatgtg cggtctattt 1200
ctattttatt agtaaaacca taacgaatgt tgattaacta tgattaaaat taagctttca 1260
ctttaaaaaa aaaaaaaaaa a 1281
<210>30
<211>33
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)Bgl2NcoI-SiD1-Fw
<400>30
tttagatctt ccatggctgg agttgcatcc cca 33
<210>31
<211>24
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)Sid1-endXhoI-Rv
<400>31
ttgacatata attgatttag atct 24
<210>32
<211>32
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)BamNco-SiD2-Fw
<400>32
aaaggatcca tgggagaagt cgaccctgca tt 32
<210>33
<211>37
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD2-KpnXho- Rv
<400>33
aaactcgagg tacccaacct tcagtagttc ttgaagt 37
<210>34
<211>30
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)Bgl2-SiD3-Fw
<400>34
tttagatcta tgtctgaact actctcggaa 30
<210>35
<211>35
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD3-KpnXho-Rv
<400>35
aaactcgagg taccaacacg tcatattttc gcata 35
<210>36
<211>33
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)BamNco-SiD4-Fw
<400>36
aaaggatcca tggaaccaaa attaacaaag cta 33
<210>37
<211>37
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD4-KpnXho-Rv
<400>37
aaactcgagg tacctactac accctaaatc ctcataa 37
<210>38
<211>28
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)BamHI-SiD5-Fw
<400>38
aaaggatcca tgagctgctt gcagagct 28
<210>39
<211>38
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD5-KpnXho-Rv
<400>39
aaactcgagg taccttaatt aagttattga agtgattt 38
<210>40
<211>32
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)Bgl2Nco-SiD6-Fw
<400>40
aaagatcttc catggaagtt cagacaatga aa 32
<210>41
<211>38
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD6-KpnXho-Rv
<400>41
aaactcgagg tacctgatca ggtgcccagc ctgaaata 38
<210>42
<211>33
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)BamNco-SiD7-Fw
<400>42
aaaggatcca tggcctggag atctcagaca gaa 33
<210>43
<211>38
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD7-KpnXho-Rv
<400>43
aaactcgagg taccttcaat tcaaacgcgg aaatgtaa 38
<210>44
<211>21
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)Si18S-Fw
<400>44
tatgcttgtc tcaaagatta a 21
<210>45
<211>21
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)Si18D-Rv
<400>45
aacatctaag ggcatcacag a 21
<210>46
<211>20
<212>DNA
<213>人工序列(Artificial)
<220>
<223>引物(Primer)SiD6-nest-Rv
<400>46
cattacacaa gtgatagtat 20