非专利文献4 J.Pharmacy and Pharmacology,(2005)57,233.
非专利文献9 De Montellano,P.R.O.,Cytochrome P450-structure,mechanisum,and biochemistry.3rd edition.Kluwer Academic/PlenumPublishers,NY.(2005)及
非专利文献10 J.Biol.Chem.(2004)279,1206.
具体实施方式
本发明者使用与到目前为止已知的、作为木脂素羟化酶的多酚氧化酶不同的、属于氧化酶家族的2—酮戊二酸(以下称为2-OG。)依赖性双加氧酶基因作为探针,由芝麻种子cDNA文库中综合式得到芝麻2-OG依赖性双加氧酶样基因群组(以下称为SiD基因)。使得到的各SiD基因在大肠杆菌中表达。使这些重组蛋白质与松脂醇或胡椒醇反应后,使用HPLC分析、LC-MS分析及NMR分析,筛选催化羟基松脂醇或羟基胡椒醇生成的酶。其结果可知,SiD6催化由松脂醇生成9—羟基松脂醇的反应,且可知Sid6催化由胡椒醇生成9—羟基胡椒醇的反应。此木脂素是到目前为止从未报道过的新型羟基木脂素。
以下详细叙述本发明所涉及的具有木脂素羟基化活性的多肽、编码该多肽的多核苷酸及所述多肽、多核苷酸的利用。
(1)多肽
本发明者发现了以木脂素、特别是以胡椒醇及/或松脂醇为主要底物的新型羟化酶,从而完成了本发明。本发明者还发现上述新型羟化酶羟基化胡椒醇,而到目前为止,羟基胡椒醇还未被发现。
首先,本发明提供多肽,其为具有木脂素羟基化活性的多肽,含有(a)序列号:26的氨基酸序列;(b)序列号:26的氨基酸序列中,1~15个氨基酸发生缺失、插入、取代及/或附加的氨基酸序列;或(c)与序列号:26的氨基酸序列有至少80%同源性的氨基酸序列。
在本说明书中使用时,术语“多肽”可与“肽”或“蛋白质”互换使用。此外,多肽的“片段”指该多肽的部分片段。此外,本发明所涉及的多肽可为由天然供给源分离的多肽,也可为化学合成后的多肽。
术语“被分离”的多肽或蛋白质,指从其天然环境中提取的多肽或蛋白质。例如,在宿主细胞中表达的重组产生的多肽及蛋白质,可认为与通过任意的适当的技术实质上纯化的天然或重组的多肽及蛋白质同样被分离。
本发明所涉及的多肽,包括天然的纯化产物、通过化学合成方法合成的产物及由原核生物宿主或真核生物宿主(例如,包括细菌细胞、酵母细胞、高等植物细胞、昆虫细胞及哺乳动物细胞)通过重组技术产生的产物。依赖重组产生方法中所使用的宿主,本发明所涉及的多肽可被羟基化或未被羟基化。且本发明所涉及的多肽在一些时候,作为宿主介导过程的结果,可含有起始改变的蛋氨酸残基。
在本说明书中使用时,“木脂素羟基化活性”是指对木脂素进行羟基化的活性(优选生成9—羟基化木脂素活性),即指向木脂素转移羟基的活性。即在本说明书中使用时,羟化酶与羟基转移酶可互换使用。
在实施方式之一中,本发明所涉及的多肽优选是由序列号26的氨基酸序列组成的多肽。
在其他实施方式中,本发明所涉及的多肽优选是如上所述的由序列号26的氨基酸序列组成的多肽的突变体、且具有木脂素羟基化活性。
此种突变体可例举为包含缺失、插入、倒位、重复、及形式(type)取代(例如,亲水性残基取代为其他残基,但是通常,强疏水性残基不取代强亲水性残基)的突变体。特别是多肽中,“中性”氨基酸取代一般基本不影响其多肽的活性。
多肽氨基酸序列中的一些氨基酸可在不显著影响此多肽的结构或功能的情况下被容易地改变,这是该领域中众所周知的。且不仅是人为改变,在天然的蛋白质中存在有不使该蛋白质的结构或功能显著改变的突变体也是众所周知的。
本领域技术人员可使用周知技术,容易地使多肽氨基酸序列中1~多个氨基酸发生突变。例如,根据公知的定点诱变法,可使编码多肽的多核苷酸的任意碱基发生突变。此外,可针对编码多肽的多核苷酸的任意位点设计引物,制备缺失突变体或附加突变体。且如使用本说明书中所述的方法,可容易地确定所制备的突变体是否具有所需活性。
优选突变体具有保守性或非保守性氨基酸取代、缺失或添加。优选沉默取代、添加及缺失,特别优选保守性取代。这些均不改变本发明所涉及的多肽活性。
被认为是代表性的保守性取代,为脂肪族氨基酸Ala、Val、Leu、及Ile中1个氨基酸取代为其他氨基酸;羟基残基Ser及Thr的互换、酸性残基Asp及Glu的互换、酰胺残基Asn及Gln之间的取代、碱基性残基Lys及Arg的互换、以及芳香族残基Phe、Tyr之间的取代。
如上详示,有关哪种氨基酸的变化可能是沉默表达型(即是否对功能无显著有害的效果)的进一步的介绍,可见于Bowie,J.U.等《Deciphering theMessagein Protein Sequences:Tolerance to Amino AcidSubstitutions》,Science 247:1306-1310(1990)(在本说明书中作为参考引用)中。
本发明中的优选多肽,是具有木脂素羟基化活性的多肽,含有(a)序列号:26的氨基酸序列;或(b’)序列号:26的氨基酸序列中,1~多个氨基酸发生缺失、插入、取代及/或附加的氨基酸序列。此种突变多肽,不局限于如上所述的、具有通过公知的突变多肽制备法人为导入的突变的多肽,还可以是分离纯化天然存在的多肽后的产物。
本发明所涉及的多肽,可以是氨基酸以肽键结合形成的多肽,但不限于此,也可为包含多肽以外的结构的复合多肽。在本说明书中使用时,“多肽以外的结构”,可例举为糖链、异戊二烯基等,但无特别限定。
此外,本发明所涉及的多肽也可包含附加多肽。附加多肽,例如可为组氨酸标签(His tag)、c-Myc标签(c-Myc tag)、Flag等的表位标记多肽。
此外,本发明所涉及的多肽,可以是将编码本发明所涉及的多肽的多核苷酸导入宿主细胞中,使该多肽在细胞内表达的状态,也可以是从细胞、组织等中分离纯化的状态。且本发明所涉及的多肽也可为化学合成。
在其他的实施方式中,本发明所涉及的多肽可如融合蛋白一样,以改变了的形态重组表达。例如,本发明所涉及的多肽的附加氨基酸[标签(tag)]、特别是带电氨基酸的区域,为改善在宿主细胞内、在纯化期间或持续操作及保存期间的稳定性及持续性,可附加在多肽的N末端及/或C末端。多肽可具有多个标签(tag),各个标签(tag)的位置可分离也可连续。
在本实施方式中涉及的多肽的N末端或C末端可附加标签(tag)标记[标签(tag)序列或标记(marker)序列],标签标记,例如是编码使融合多肽容易进行纯化的肽的序列。此种序列可在多肽的最终制备前除去。在本发明的此特定优选实施方式中,标签氨基酸序列是六聚组氨酸肽[例如,由pQE载体(Qiagen,Inc.)提供的标签],其他情况下,很多可由公共的及/或商业手段获得。例如,如Gentz等、Proc.Natl.Acad.Sci.USA 86:821-824(1989)(本说明书中作为参考引用)中记载,六聚组氨酸用于融合蛋白的简单的纯化。“HA”标签是用于针对来自流感红血球凝集素(HA)蛋白的表位进行纯化的其他有用的肽,在Wilson等、Cell 37:767(1984)(本说明书中作为参考引用)中有所记载。其他的此种融合蛋白,包括在N或C末端进行Fc融合的本实施方式所涉及的多肽或其片段。
本发明所涉及的多肽,如以下详述可重组生成,也可化学合成。
重组生成的进行可使用该领域中众所周知的方法,例如,可使用以下详述的载体及细胞进行。
合成肽可使用化学合成的公知方法合成。例如,Houghten记载了用于多数的肽合成的简单方法,其中,多数的肽为用不足4星期时间制备且具有特征的、表示HA1多肽片段的单一氨基酸改造物的10~20mg的248个不同的13残基肽。Houghten,R.A.,Proc.Natl.Acad.Sci.USA 82:5131-5135(1985)。此“Simultaneous Multiple Peptide Synthesis(SMPS)”方法并在Houghten等(1986)的美国专利第4,631,211号中记载。此方法中,将用于各种肽的固相合成的各种树脂置于各自的溶剂透过性袋(packet)中,可最佳使用与固相法相关的大量相同的重复工序。完整的操作手册的步骤,可同时进行500~1000以上的合成(Houghten等、前面已出现、5134)。这些文献在本说明书中作为参考引用。
如下详述,本发明所涉及的多肽,在用于对木脂素进行羟基化以得到羟基化木脂素的方法及在试剂盒中有用。
本发明所涉及的多肽,可催化木脂素(特别是胡椒醇或松脂醇)的羟基化反应。
如此可以说,本发明所涉及的多肽至少含有序列号26所示的氨基酸序列即可。即应该注意的是,由序列号26所示的氨基酸序列和具有特定功能[例如标签(tag)]的任意的氨基酸序列组成的多肽也包含于本发明中。且序列号26所示的氨基酸序列及该任意的氨基酸序列,可在不妨碍各自功能的情况下用适合的连接肽连接。
此外,本发明所涉及的多肽,因该多肽除具有对松脂醇进行羟基化的活性以外还具有对胡椒醇进行羟基化的活性,所以,该多肽的用途应不限定于对松脂醇进行羟基化生成它们的羟基化物。
也就是说,本发明的目的在于提供具有对木脂素进行羟基化活性的多肽,不在于本说明书中具体记载的多肽制备方法等。因此,必须注意的是,通过上述各方法以外的方法得到的具有羟基化木脂素活性的多肽也属于本发明的技术范围。
(2)多核苷酸
此外,本发明还提供编码具有木脂素羟基化活性的本发明所涉及的多肽的多核苷酸。具体地说,本发明提供多核苷酸,其特征在于,是下述(a)~(e)的任一个。
(a)多核苷酸,其含有序列号27的碱基序列;
(b)多核苷酸,其编码含有序列号:26的氨基酸序列的蛋白质;
(c)多核苷酸,其编码序列号:26的氨基酸序列中,1~15个氨基酸发生缺失、取代、插入及/或附加的、且具有木脂素羟基化活性的多肽;
(d)多核苷酸,其编码与序列号:26的氨基酸序列有至少80%同源性、且具有木脂素羟基化活性的多肽;或
(e)多核苷酸,其与序列号:27的碱基序列的互补碱基序列所组成的多核苷酸在严谨条件下杂交,且编码具有木脂素羟基化活性的多肽。
在本说明书中使用时,术语“多核苷酸”可与“基因”、“核酸”或“核酸分子”互换使用,指核苷酸的聚合体。在本说明书中使用时,术语“碱基序列”可与“核酸序列”或“核苷酸序列”互换使用,用脱氧核糖核酸(省略为A、G、C及T)的序列表示。“含有序列号1所示的碱基序列的多核苷酸或其片段”是指包含用序列号1的各脱氧核苷酸A、G、C及/或T表示的序列的多核苷酸或其片段部分。
本发明所涉及的多核苷酸可以RNA(例如mRNA)的形态或DNA的形态(例如cDNA或基因组DNA)存在。DNA可以是双链或单链。单链DNA或RNA可以是编码链(也称作正义链)或也可以是非编码链(也称为反义链)。
在本说明书中使用时,术语“寡核苷酸”是指几个至数十个核苷酸结合的产物,可与“多核苷酸”互换使用。寡核苷酸,短的称为二核苷酸(二聚体)、三核苷酸(三聚体),长的用30mers或100mers聚合的核苷酸的数量表示。寡核苷酸可作为更长的多核苷酸的片段生成,也可化学合成。
本发明所涉及的多核苷酸的片段,至少为12nt(核苷酸),优选为至少约15nt,更优选为至少约20nt,且更优选为至少约30nt,进一步更优选为至少约40nt长度的片段。至少20nt长度的片段,例如是指包含序列号1所示的碱基序列中的20个以上连续的碱基片段。参考本说明书,因本说明书已提供序列号1所示的碱基序列,所以,本领域技术人员可容易地制备基于序列号1的DNA片段。例如,为制备各种大小的片段,可方便地使用限制性核酸内切酶来切割或通过超音波剪切,或此种片段也可合成制备。适合的片段(寡核苷酸)可通过Applied Biosystems Incorporated(ABI,850 Lincoln CenterDr.,Foster City,CA 94404)392型合成仪等合成。
本发明所涉及的多核苷酸,其5’端或3’端可与编码上述标签(tag)标记[标签(tag)序列或标记(marker)序列)]的多核苷酸融合。
本发明所涉及的多核苷酸,优选编码具有木脂素羟基化活性的多肽或其突变体的多核苷酸。
本发明提供编码具有木脂素羟基化活性的多肽的多核苷酸的突变体。“突变体”,可如天然的等位基因突变体一样天然形成。“等位基因突变体”,是指占据生物染色体上指定基因座的基因的一些可交替的形态之一。非天然存在的突变体,例如可使用该领域众所周知的诱变技术生成。
在实施方式之一中,本发明所涉及的多核苷酸,优选编码具有木脂素羟基化活性的多肽的多核苷酸的碱基序列中1个~多个碱基发生缺失、插入、取代或附加的突变体。突变体可在编码区或非编码区或其两者中产生突变。编码区中的突变,可产生保守或非保守的氨基酸的缺失、插入、取代及/或附加。
本发明中的优选多核苷酸,编码具有木脂素羟基化活性的多肽,且是下述(f)~(i)中的任一个多核苷酸。
(f)多核苷酸,其由序列号:27的碱基序列组成;
(g)多核苷酸,其与序列号:27的碱基序列的互补碱基序列所组成的多核苷酸在严谨条件下杂交;
(h)多核苷酸,其由与序列号:27的碱基序列至少90%同源的碱基序列组成;或
(i)多核苷酸,其为序列号:27的碱基序列中,1~多个碱基发生缺失、插入、取代及/或附加的多核苷酸。
在其他的实施方式中,本发明所涉及的多核苷酸,包括编码具有木脂素羟基化活性的多肽的多核苷酸、或与该多核苷酸在严谨杂交条件下杂交的多核苷酸,优选分离后的多核苷酸。
本发明中最优选的多核苷酸,是序列号:27的碱基序列所组成的多核苷酸。
杂交可使用如Sambrook等、Molecular Cloning,A LaboratoryManual,2d Ed.,Cold Spring Harbor Laboratory(1989)中所述的众所周知的方法进行。通常温度越高,盐浓度越低,其严谨性越高(杂交越难),可获得更高同源性的多核苷酸。适宜的杂交温度因碱基序列、其碱基序列的长度不同而不同,例如,以编码6个氨基酸的18个碱基所组成的DNA片段为探针使用时,优选50℃以下的温度。
在此,“在严谨条件下杂交的多核苷酸”是指例如,以序列号:27的碱基序列的互补碱基序列所组成的多核苷酸或编码序列号:26的氨基酸序列的多核苷酸的全部或一部分为探针,通过使用菌落杂交法、噬菌斑杂交法或Southern杂交法等所得到的多核苷酸(例如,DNA)。杂交的方法,例如可使用Molecular Cloning 3rd Ed.、Current Protocols in Molecular Biology,John Wiley & Sons 1987-1997等中所记载的方法。
本说明书中所述的“严谨条件”,可为低严谨条件、中严谨条件及高严谨条件中的任一种。“低严谨条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、32℃的条件。“中严谨条件”,例如,为5×SSC、5×Denhardt溶液、0.5%SDS、50%甲酰胺、42℃的条件。“高严谨条件”,例如,为5×SSC、5×Denhardt溶液、0.5% SDS、50%甲酰胺、50℃的条件。在上述条件中,越提高温度,越能期待高效获得具有高同源性的多核苷酸(例如,DNA)。但影响杂交严谨性的因素还可为温度、探针浓度、探针长度、离子强度、时间、盐浓度等多种因素,本领域技术人员可通过适当选择这些因素,实现同样的严谨条件。
且杂交中使用市售的试剂盒时,例如,可使用Alkphos Direct LabellingReagents(Amersham Pharmacia公司制)。此时,根据试剂盒中附带的说明方案,与标记后的探针保温过夜后,将膜在55℃的条件下用含有0.1%(w/v)SDS的1次洗涤缓冲液洗涤,之后可检测杂交后的多核苷酸(例如,DNA)。
除上述以外,可杂交的多核苷酸,通过FASTA、BLAST等同源性搜索软件,使用默认参数计算时,可例举为与编码序列号:26的多核苷酸有80%以上、81%以上、82%以上、83%以上、84%以上、85%以上、86%以上、87%以上、88%以上、89%以上、90%以上、91%以上、92%以上、93%以上、94%以上、95%以上、96%以上、97%以上、98%以上、99%以上、99.1%以上、99.2%以上、99.3%以上、99.4%以上、99.5%以上、99.6%以上、99.7%以上99.8%以上、99.9%以上同源性的多核苷酸。
且氨基酸序列、碱基序列的同源性,可使用根据Karlin及Altschul的BLAST算法(Proc.Natl.Acad.Sci.USA,87,2264-2268,1990;Proc.Natl.Acad.Sci.USA,90:5873,1993)决定。开发了基于BLAST算法、被称为BLASTN、BLASTX的程序(Altschul SF,et al:J.Mol.Biol.215:403,1990)。使用BLASTN分析碱基序列时,参数例如为score=100、wordlength=12。且使用BLASTX分析氨基酸序列时,参数例如为score=50、wordlength=3。使用BLAST和Gapped BLAST程序时,使用各程序的默认参数。
且本发明提供上述多核苷酸的片段或其互补序列所组成的寡核苷酸。
即使在本发明所涉及的寡核苷酸不编码木脂素羟基化多肽时,本领域技术人员也可容易地理解,本发明所涉及的多核苷酸可作为聚合酶链式反应(PCR)的引物用于制备本发明所涉及的多肽。不编码木脂素羟基化多肽的本发明所涉及的寡核苷酸的其他用途,可例举为以下各项:(1)cDNA文库中的木脂素羟化酶基因或其等位基因或拼接改造物的分离;(2)用于提供木脂素羟化酶基因的正确的染色体位置的、向分裂中期染色体铺展的原位杂交(例如,“FISH”)(Verma等,Human Chromosomes:A Manual of BasicTechniques,Pergamon Press,New York(1988)中所记载);及(3)用于检测特定组织中木脂素羟化酶mRNA表达的Northern印迹分析。
本发明所涉及的多核苷酸或寡核苷酸,不仅仅为双链DNA,包括构成其的正义链及反义链的各单链DNA、RNA。本发明所涉及的多核苷酸或寡核苷酸,可作为用于通过反义RNA机理的基因表达操作的工具使用。通过反义RNA技术,可观察到来自内源性基因的基因产物的减少。通过导入本发明所涉及的寡核苷酸,可使具有木脂素羟基化活性的多肽的含量降低,其结果,可控制植物中的羟基化木脂素含量或含量比(增加或减少)。本发明所涉及的多核苷酸或寡核苷酸,可以是包含非翻译区(UTR)的序列、载体序列(包括表达载体序列)等的序列。
获得本发明所涉及的多核苷酸或寡核苷酸的方法,可例举为分离包含本发明所涉及的多核苷酸或寡核苷酸的DNA片段的各种公知的方法。例如,制备与本发明所涉及的多核苷酸碱基序列的一部分特异性杂交的探针,筛选基因组DNA文库或cDNA文库,可得到本发明所涉及的多核苷酸或寡核苷酸。此种探针,只要是与本发明所涉及的多核苷酸的碱基序列或其互补序列的至少一部分特异性杂交的多核苷酸(寡核苷酸)即可。
通过此种杂交筛选的多核苷酸,可例举为天然的多核苷酸(例如,来自芝麻科植物、苔藓植物等植物的多核苷酸),也可为来自植物以外的多核苷酸。
获得本发明所涉及的多核苷酸的其他方法,可为使用PCR的方法。该PCR扩增方法的特征在于,例如,包括利用本发明所涉及的多核苷酸的cDNA的5’端及/或3’端的序列(或其互补序列)制备引物的工序、使用上述引物以基因组DNA(或cDNA)等为模板进行PCR扩增的工序,使用本方法,即可大量获得含有本发明所涉及的多核苷酸的DNA片段。
用于得到本发明所涉及的多核苷酸的供给源无特别限定,但优选含有胡椒醇或松脂醇的生物材料。在本说明书中使用时,术语“生物材料”指生物学样品(由生物体得到的组织样品或细胞样品)。下述实施例中使用芝麻,但不限于此。
使用本发明所涉及的多核苷酸,可合成转化体或在细胞中具有木脂素羟基化活性的多肽。
使用本发明所涉及的多核苷酸,通过检测杂交的多核苷酸,可容易地检测出表达了具有木脂素羟基化活性的多肽的生物。
本发明所涉及的寡核苷酸,通过作为检测编码具有木脂素羟基化活性的多肽的多核苷酸的杂交探针或用于扩增该多核苷酸的引物使用,可容易地检测出表达了具有木脂素羟基化活性的多肽的生物或组织。且进一步,将上述寡核苷酸作为反义寡核苷酸使用,可抑制上述生物体或其组织或细胞中具有木脂素羟基化活性的多肽的表达。
本发明所涉及的多核苷酸,由该多核苷酸编码的多肽除具有对松脂醇进行羟基化的活性以外,还具有对胡椒醇进行羟基化的活性。因此,本发明所涉及的多核苷酸的用途,不限定于仅将松脂醇作为底物进行羟基化,生成这些羟基化物(例如,9位的羟基化物)。
也就是说,本发明的目的在于,提供编码具有对胡椒醇或松脂醇进行羟基化活性的多肽的多核苷酸、及与该多核苷酸杂交的寡核苷酸,而不在于本说明书中具体记载的多核苷酸及寡核苷酸的制备方法等。因此,必须注意的是,通过上述各方法以外的方法得到的、编码具有对胡椒醇或松脂醇进行羟基化活性的多肽的多核苷酸,也属于本发明的技术范围。
(3)本发明所涉及的多肽或多核苷酸的利用
本发明还提供通过使用本发明所涉及的多肽或多核苷酸,用于调节(增加或减少)生物(优选植物)中的木脂素及羟基化木脂素的量的方法及该得到调节的生物(优选植物)的利用。
(A)载体
本发明提供为生成具有木脂素羟基化活性的多肽而使用的载体。本发明所涉及的载体可以是用于体外翻译的载体,也可以是用于重组表达的载体。
本发明所涉及的载体只要含有上述本发明所涉及的多核苷酸,无特别限定。例如,可例举为插入了编码具有木脂素羟基化活性的多肽的多核苷酸的cDNA的重组表达载体等。重组表达载体的制备方法可例举使用质粒、噬菌体或粘粒等的方法,无特别限定。
载体的具体种类无特别限定,可适当选择在宿主细胞中可表达的载体。即选择与宿主细胞的种类相应的、确实使本发明所涉及的多核苷酸表达的适合的启动子序列,将其与本发明的多核苷酸整合进各种质粒等中的载体作为表达载体使用。
本发明所涉及的表达载体,依赖于应导入的宿主的种类,含有表达调控区(例如,启动子、终止子及/或复制起点等)。作为细菌用表达载体的启动子,可使用常用的启动子(例如,trc启动子、tac启动子、lac启动子等),作为酵母用启动子,例如可例举为3—磷酸甘油醛脱氢酶启动子、PHO5启动子等,作为丝状菌用启动子例如可例举为淀粉酶、trpC等。并且作为动物细胞宿主用启动子可例举为病毒性启动子(例如,SV40早期启动子、SV40晚期启动子等)。表达载体的制备,可使用限制酶及/或连接酶等根据常用的方法进行。通过表达载体的宿主的转化也根据常用的方法进行。
将使用上述表达载体转化的宿主进行培养、栽培或饲育后,可从培养物等中根据常用的方法(例如,过滤、离心分离、细胞破碎、凝胶过滤色谱法、离子交换色谱法等),回收、纯化目的蛋白质。
表达载体优选含有至少1个选择标记。此种标记,真核生物细胞培养时可例举为二氢叶酸还原酶或新霉素抗性遺伝子及大肠杆菌(E.coli)、及其他细菌中的培养时可例举为四环素抗性基因或氨苄青霉素抗性基因。
只要使用上述选择性标记,即可确认宿主细胞中是否导入了本发明所涉及的多核苷酸,且可进一步确认在宿主细胞中是否确实进行了表达。或也可将本发明所涉及的多肽作为融合多肽使其表达,例如,也可将来自碗水母(Aequorea coerulescens)的绿色荧光多肽GFP(Green FluorescentProtein)作为标记使用,将本发明所涉及的多肽作为GFP融合多肽使其表达。
上述的宿主细胞无特别限定,可优选使用以往公知的各种细胞。具体地说,例如,可例举为大肠杆菌(Escherichia coli)等的细菌、酵母(酿酒酵母Saccharomyces cerevisiae、裂殖酵母SchizoSaccharomycespombe)、线虫(Caenorhabditis elegans)、非洲爪蟾(Xenopus laevis)的卵母细胞等,但无特别限定。用于上述宿主细胞的适合的培养基及条件为本领域所公知。
将上述表达载体导入宿主细胞的方法即转化法也无特别限定,可优选使用电穿孔法、磷酸钙法、脂质体法、DEAE葡聚糖法等以往公知的方法。此外,例如,用昆虫转移表达本发明所涉及的多肽时,可利用使用了杆状病毒的表达系统。
如使用本发明所涉及的载体、将上述多核苷酸导入生物或细胞中,即可使该生物或细胞中具有木脂素羟基化活性的多肽表达。且只要将本发明所涉及的载体用于无细胞蛋白质合成系统,即可合成具有木脂素羟基化活性的多肽。
如此可以说,本发明所涉及的载体至少含有编码本发明所涉及的多肽的多核苷酸即可。即应注意的是,表达载体以外的载体也包含于本发明的技术范围中。
即本发明的目的在于,提供含有编码本发明所涉及的多肽的多核苷酸的载体,而不在于本说明书中具体记载的各个载体种类及细胞种类、以及载体制备方法及细胞导入方法。因此,必须注意的是,使用上述以外的载体种及载体制备方法制得的载体,也属于本发明的技术范围。
(B)转化体或细胞
本发明提供导入了如上所述的编码具有木脂素羟基化活性的多肽的多核苷酸的转化体或细胞。在本说明书中使用时,术语“转化体”不仅包括组织或器官,还包括生物个体。
转化体或细胞的制备方法(生产方法)无特别限定,例如,可例举将上述重组载体导入宿主后转化的方法。此外,成为转化对象的生物也无特别限定,可以是在上述宿主细胞中例举的各种微生物、植物或动物。
本发明所涉及的转化体或细胞,其特征在于,上述转化体或细胞中天然具有的木脂素及/或羟基化木脂素的组成已被改变。本发明所涉及的转化体或细胞,优选来自植物或其后代或来自植物或其后代的组织,特别优选为芝麻、连翘或亚麻。此种转化体或细胞,可通过使用控制本发明所涉及的羟基化木脂素含量的方法,增加或减少产生木脂素的生物中的羟基化木脂素含量。
在实施方式之一中,本发明所涉及的转化体可以是植物转化体。本实施方式所涉及的植物转化体,可通过将含有本发明所涉及的多核苷酸的重组载体导入植物中,使该多核苷酸编码的多肽可表达,从而得到该植物转化体。
使用重组表达载体时,用于植物体转化的重组表达载体,只要是可使本发明所涉及的多核苷酸在该植物内表达的载体,无特别限定。此种载体,例如,可例举为具有在植物细胞内使多核苷酸组成型表达的启动子(例如,花椰菜花叶病毒的35S启动子)的载体或具有通过外界刺激而被诱导性地激活的启动子(例如,金属硫蛋白启动子)的载体。
本发明中成为转化对象的植物,可以指植物体全株、植物器官(例如叶、花瓣、茎、根、种子等)、植物组织(例如表皮、韧皮部、薄壁组织、木质部、维管束、柵状组织、海绵组织等)或植物培养细胞或各种形态的植物细胞(例如,悬浮培养细胞)、原生质体、叶片切片、愈伤组织等的任一个。用于转化的植物无特别限定,可属于单子叶植物纲或双子叶植物纲的植物的任一个。
向植物内导入基因,可使用本领域技术人员公知的转化方法(例如,土壤杆菌法、基因枪法、PEG法、电穿孔法等)。例如,土壤杆菌介导的方法和直接向植物细胞导入的方法为众所周知。使用土壤杆菌法时,将构建的植物用表达载体导入适合的土壤杆菌[例如,根癌土壤杆菌(Agrobacteriumtumefaciens)],此菌株根据叶盘法(内宫博文著,植物基因操作手册,1990,27~31页,讲谈社scientific,东京)(日语原名:「内宫博文著,植物遺伝子操作マニユアル,1990,27~31頁,講談社サイエンテイフイツク,東京」)等感染无菌培养叶片,可获得转化植物。还可使用Nagel等的方法[Micribiol.Lett.,67,325(1990)]。此方法为如下方法,首先,例如将表达载体导入土壤杆菌,然后将经转化的土壤杆菌用Plant Molecular BiologyManual(S.B.Gelvin等、Academic Press Publishers)中记载的方法导入植物细胞或植物组织。此处,“植物组织”包括通过植物细胞培养而得到的愈伤组织。使用土壤杆菌法进行转化时,可使用双元载体(pBI121或pPZP202等)。
将基因直接导入植物细胞或植物组织的方法,已知有电穿孔法、基因枪法。使用基因枪时,可直接使用植物体、植物器官、植物组织自身,可在制备切片后使用,也可制备原生质体后使用。可将如此制备的样品使用基因导入装置[例如PDS—1000(BIO-RAD公司)等]处理。处理条件因植物或样品不同而不同,通常用450~2000psi左右的压力、4~12cm左右的距离进行。
导入了基因的细胞或植物组织,首先使用潮霉素抗性等的抗药性选择,其次通过常规方法使植物体再生。由转化细胞进行的植物体的再生,可用与植物细胞的种类相应的本领域技术人员公知的方法进行。
将植物培养细胞作为宿主使用时,转化是将重组载体用基因枪、电穿孔法等导入培养细胞。作为转化结果而得到的愈伤组织、芽条、须根等可直接用于细胞培养、组织培养或器官培养,还可使用以往已知的植物组织培养法,通过投入适当浓度的植物激素(生长素、细胞分裂素、赤霉素、脱落酸、乙烯、油菜素内酯等)使植物体再生。
确认基因是否被导入,可通过PCR法、Southern杂交法、Northern杂交法等进行。例如,从转化植物中制备DNA,设计DNA特异性引物以进行PCR。PCR可用与制备上述质粒时所使用的条件同样的条件进行。之后,对扩增产物进行琼脂糖凝胶电泳、聚丙烯酰胺凝胶电泳或毛细管电泳等,用溴化乙锭、SYBRGreen液等染色,且通过检测扩增产物的1条扩增带,可确认进行了转化。此外,使用预先通过荧光色素等标记的引物进行PCR,也可检测扩增产物。而且也可采用在酶标板等的固相上结合扩增产物,通过荧光或酶反应等确认扩增产物的方法。
一旦获得本发明所涉及的多核苷酸整合进基因组内的转化体,即可通过该植物体的有性生殖或无性生殖得到其后代。从该植物体或其后代或这些的克隆中,例如可得到种子、果实、切穗、块茎、块根、植株、愈伤组织、原生质体等,以这些为基础可进行该植物体的量产。因此,本发明中也包括可表达地导入本发明所涉及的多核苷酸的植物体或与该植物体具有同源特性的该植物体的后代或来自它们的组织。
此外,已报到了各种植物的转化方法。本发明所涉及的转化体植物,例如,可例举为芝麻、稻子、烟草、大麦、小麦、菜籽、马铃薯、番茄、杨树、香蕉、桉树、甘薯、黄豆、紫花苜蓿、羽扇豆、玉米、菜花、月季、菊花、香石竹、金鱼草、仙客来、兰花、洋桔梗、小苍兰、非洲菊、唐菖蒲、霞草、长寿花、百合、天竺葵、老鹳草、矮牵牛、蓝猪耳、郁金香、连翘、拟南芥及百脉根等,但并不限于此。
在优选实施形态中,可使用芝麻制备与本发明有关的转化体。芝麻转化体的制备方法,例如,可例举T.Asamizu:Transformation of sesame plantsusing MAT vector system:introduction of fatty acid desaturasegenes.Sesame Newsletter 16:22~25(2002)中记载的公知的方法。连翘的转化,可例举Carlo Rosati,et al.:Regeneration andAgrobacterium-mediated transuformation of Forsytia×intermedia“Spring Glory”中记载的公知的方法。
因使用上述得到的转化芝麻及连翘,可在该芝麻内生产羟基化木脂素,所以,可用低成本且对环境负荷低的生产流程生产羟基化木脂素(羟基胡椒醇及/或羟基松脂醇)。
在其他优选实施方式中,本发明所涉及的转化体可优选用于烟草。烟草与矮牵牛等均是容易转化的代表性植物,由1个去除了细胞壁的细胞(原生质体)即可再生1个植物个体。此再生的1个植物个体,因与来自多细胞的1个体不同,不会形成嵌合状,所以可高效制备转化体。
烟草转化的优选方法可例举叶盘法。此方法是操作简便,且从1枚叶切片可得到多个独立转化体的方法。转化的方法,如“新生物化学实验手册3核酸的分离·分析和基因实验法化学同人1996年”(日语原名:「新生物化学実験の手引き3 核酸の分離·分析と遺伝子実験法 化学同人1996年」)中记载。
具体地说,在无菌培养皿上从无菌培育的烟草的叶上切取叶盘,将切取的叶盘在NB培养基中进行预培养。然后,将预培养后的叶盘浸入土壤杆菌的感染菌液中共培养,将叶盘植入补充了羧苄青霉素和卡那霉素的NB培养基中,由叶盘开始继代培养形成愈伤组织直至产生芽条后,可得到芽条。芽条生长到与茎叶部的区别很明确时,从茎部切取,移入不含抗生物质及激素的MS培养基中。切取的芽条生根后,将其在温室培养。将芽条移入含有激素的培养基中促其发根,同时从此芽条上切取叶子的一部分,移植到补充了羧苄青霉素及卡那霉素的检验培养基。移植约10天后,产生愈伤组织的叶子看成是卡那霉素抗性个体而回收,发生褐变的叶子看成是卡那霉素敏感性个体而废弃。
因使用如上所述得到的转化烟草可在该烟草内生产羟基化木脂素,所以,可用低成本且对环境负荷低的生产流程生产羟基化木脂素(羟基胡椒醇及/或羟基松脂醇)。
在其他优选实施方式中,本发明所涉及的转化体可优选使用稻子。制备稻子转化体地实施方式之一如以下所述。
将本发明所涉及的多核苷酸导入含有潮霉素抗性基因的双元载体pPZP202中,构建转化载体。本发明所涉及的多核苷酸可与启动子CaMV35S在框内起作用地连接。
使用所得到的转化载体,通过电穿孔法,在50mg/l的卡那霉素及潮霉素的选择下转化根癌土壤杆菌EHA101株(Agrobacterium tumefaciensEHA101株)。所得到的土壤杆菌株到使用之前可冷冻保存。
除去野生型种子的颖片作为糙米,将其用70%乙醇杀菌3分钟,用灭菌蒸馏水洗涤3次后,再用50%的次氯酸钠溶液杀菌30分钟,然后用灭菌蒸馏水洗涤5次。将此糙米置于添加30g/l蔗糖、0.3g/l酪蛋白水解物、2.8g/l的脯氨酸、2.0mg/l的2,4-滴(2,4-D)的、含有用4.0g/l的Gel Lyte固化的N6培养基(Chu等、1975、Sci.Sinica、18、659-668)的愈伤组织诱导培养基上。且培养基pH在放入高压灭菌器前调整到pH5.8。使糙米在28℃下明处生长4星期,得到约5mm大小的愈伤组织。此愈伤组织用于感染土壤杆菌。
使在甘油中冷冻保存的上述土壤杆菌在含有20mg/l的卡那霉素、50mg/l的潮霉素、100mg/l的壮观霉素、调整到pH7.2的、用15g/l的琼脂固化的AB培养基(Chilton等、1974、Proc.Natl.Acad.Sci.USA、71、3672-3676)上暗处、28℃下培养3天。收集土壤杆菌菌体,在含有10mg/l的乙酰丁香酮(Hiei等、1994、Plant J.、6、271-282)的液体AAM培养基(Hiei等、1994)中悬浮。在所得到的悬浮液中将上述的愈伤组织浸渍2分钟后,用杀菌纸巾吸除多余的水分,将其置于含有10mg/l乙酰丁香酮的上述愈伤组织诱导培养基中,暗处28℃下进行3天的共培养,以感染土壤杆菌。将所得到的感染愈伤组织用灭菌蒸馏水洗涤10次,最后用含有500mg/l羧苄青霉素的灭菌蒸馏水洗涤1次后,用杀菌纸巾吸除多余的水分。将此愈伤组织在含有10mg/l乙酰丁香酮、50mg/l潮霉素、300mg/l羧苄青霉素的上述愈伤组织诱导培养基中28℃下培养2星期,再在含有50mg/l潮霉素、100mg/l羧苄青霉素的愈伤组织诱导培养基中培养4星期。选择潮霉素抗性愈伤组织,移入含有30g/l的蔗糖、30g/l的山梨糖醇、2g/l的酪蛋白水解物、2.2mg/l的细胞分裂素、1.0mg/l的萘乙酸(NAA)、100mg/l的羧苄青霉素、50mg/l的潮霉素及4g/l的Gel Lyte的pH5.8的MS基础培养基(Murashige及Skoog、1962、Physiol.Plant.、15、473-497)的再生培养基中。
如此得到转化体可在含有潮霉素的再生培养基中容易地再生后,移入土壤栽培。
因使用如上所述得到的转化稻,可在该稻子内生产羟基化木脂素,所以,可用低成本且对环境负荷低的生产流程生产羟基化木脂素(羟基胡椒醇及/或羟基松脂醇)。
本发明所涉及的转化体,只要是含有木脂素(特别是松脂醇或胡椒醇)的生物,不论生物种是什么,均可通过导入上述多核苷酸生产该木脂素的羟基化物。
因使用导入了含有编码本发明所涉及的多肽的多核苷酸的重组表达载体的转化体,可催化将植物等的生物内源的木脂素羟基化的反应,所以,可用低成本且对环境负荷低的生产流程大量制备羟基化木脂素。且本发明可通过大量制备羟基化木脂素,提供廉价的食品或工业产品。
只要使用本发明所涉及的转化体,即可在低成本且对环境负荷低的条件下提供催化木脂素羟基化反应的多肽。
在实施方式之一中,本发明所涉及的细胞可以是各种细菌宿主。本实施方式所涉及的细胞,可通过将含有本发明所涉及的多核苷酸的重组载体导入细胞中,使该多核苷酸编码的多肽可表达,从而来获得。
宿主可使用原核生物或真核生物。原核生物宿主,可使用例如属于埃希氏菌属(Escherichia)的细菌[例如大肠杆菌(Escherichia coli)等]、例如属于芽孢杆菌属(Bacillus)的细菌(例如枯草芽孢杆菌(Bacillussubtilis)等。真核生物宿主,可使用低等真核生物(例如,酵母或丝状菌等的真核生物微生物)。酵母,例如可例举为酵母属(Saccharomyces)微生物,[例如,酿酒酵母(Saccharomyces cerevisiae)等],丝状菌可例举为,曲霉属(Aspergillus)微生物[例如,米曲霉(Aspergillus oryzae)、黑曲霉(Aspergillus niger)等]及青霉属(Penicillium)微生物。此外,动物细胞或植物细胞也可作为宿主使用。动物细胞可例举为小鼠、仓鼠、猴、人等的细胞。而且昆虫细胞(例如,蚕细胞或蚕的成虫)也可作为宿主使用。
本领域技术人员可容易地理解为,根据本说明书中的记载,只要导入含有编码具有木脂素羟基化活性的多肽的多核苷酸的重组表达载体,即可赋予从细菌到高等植物的大范围的生物以木脂素羟基化的能力。
本发明所涉及的细胞,只要是含有木脂素(特别是松脂醇或胡椒醇)的生物,不论生物种是什么,均可通过导入上述多核苷酸生产该羟基木脂素。
因使用导入了含有编码本发明所涉及的多肽的多核苷酸的重组表达载体的细胞,可催化该细胞内的木脂素羟基化反应,所以,可用低成本且对环境负荷低的生产流程大量制备羟基化木脂素。且本发明还可通过大量制备羟基化木脂素,提供廉价的食品或工业产品。
只要使用本发明所涉及的细胞,即可在低成本且对环境负荷低的条件下提供催化木脂素羟基化反应的多肽。
如上所述,可以说本发明所涉及的转化体或细胞,至少导入编码本发明所涉及的多肽的多核苷酸即可。即应注意的是,通过重组表达载体以外的手段生成的转化体或细胞也包含于本发明的技术范围。
且如上所述,本发明所涉及的多肽,该多肽除具有对松脂醇进行羟基化的活性以外,还具有对胡椒醇进行羟基化的活性,所以,本发明所涉及的转化体或细胞的用途不只限定于对松脂醇进行羟基化、生成这些的羟基化物。
即本发明的目的在于,提供其特征为导入编码本发明所涉及的多肽的多核苷酸的转化体或细胞,而不在于本说明书中具体记载的各个载体种及导入方法。因此,必须注意的是,使用上述以外的载体种类及细胞种类、以及载体制备方法及细胞导入方法得到的转化体或细胞也属于本发明的技术范围。
(C)多肽的生产方法
本发明提供生产本发明所涉及的多肽的方法。使用本发明所涉及的多肽的生产方法,可在低成本且对环境负荷低的条件下提供催化木脂素羟基化反应的多肽。此外,使用本发明所涉及的多肽的生产方法,可容易地生产催化木脂素羟基化反应的多肽。
本发明的实施方式之一所涉及的多肽的生产方法中,使用含有编码本发明的多肽的多核苷酸的载体。
本发明的实施方式之一所涉及的多肽的生产方法中,优选将上述载体用于无细胞蛋白质合成系统。使用无细胞蛋白质合成系统时,可使用各种市售的试剂盒。本实施方式所涉及的多肽的生产方法,优选包含将上述载体与无细胞蛋白质合成液同时温育的工序。
本发明的其他实施方式所涉及的多肽的生产方法中,优选使用重组表达系统。使用重组表达系统时,可采用将本发明所涉及的多核苷酸整合进重组表达载体后,通过公知方法使其可表达地导入宿主,并将在宿主内翻译后得到的上述多肽纯化的方法等。重组表达载体,可以是质粒也可以不是,只要在宿主中导入目的多核苷酸即可。本实施方式所涉及的多肽的生产方法,优选包含将上述载体导入宿主的工序。
如此在宿主中导入外源多核苷酸时,为使外源多核苷酸可表达,表达载体优选整合了能在宿主中起作用的启动子。纯化重组产生的多肽的方法,因使用的宿主、多肽的性质不同而不同,但通过标签的利用等,可比较容易地纯化目的多肽。
本实施方式中所涉及的多肽的生产方法,优选进一步包含从含有本发明所涉及的多肽的细胞或组织的提取液中纯化该多肽的工序。纯化多肽的工序优选用公知的方法(例如,破坏细胞或组织后离心分离,回收可溶性组分的方法)从细胞、组织中制备细胞提取液后,再从此细胞提取液中利用公知的方法(例如,硫酸铵沉淀或乙醇沉淀、酸提取、阴离子或阳离子交换色谱法、磷酸纤维素色谱法、疏水相互作用色谱法、亲和层析法、羟基磷灰石色谱法及外源凝集素色谱法)纯化的工序,但不限于此。最优选使用高效液相色谱法(“HPLC”)进行纯化。
本发明的其他实施方式所涉及的多肽的生产方法,为从天然表达本发明所涉及的多肽的细胞或组织中纯化该多肽。本实施方式中所涉及的多肽的生产方法,优选包含使用或寡核苷酸,鉴定天然表达本发明所涉及的多肽的细胞或组织的工序。且本实施方式中所涉及的多肽的生产方法还优选进一步包含纯化上述多肽的工序。
且在其他实施方式中,本发明所涉及的多肽的生产方法的特征在于,化学合成本发明所涉及的多肽。本领域技术人员应容易理解,如基于本说明书中所述的本发明所涉及的多肽氨基酸序列,应用公知的化学合成技术,即可化学合成本发明所涉及的多肽。
如上所述,根据生产本发明所涉及的多肽的方法而获得的多肽,可以是天然存在的突变多肽,也可以是人工制备的突变多肽。
制备突变多肽的方法也无特别限定。例如,可通过使用利用定点诱变法[例如参考Hashimoto-Gotoh,Gene 152:271-275(1995)]、PCR法在碱基序列中导入点突变以制备突变多肽的方法或通过插入转座子的突变株制备法等的公知的突变多肽制备法,制备突变多肽。突变多肽的制备可使用市售的试剂盒。
如此可以说,本发明所涉及的多肽的生产方法,至少使用基于具有木脂素羟基化活性的多肽氨基酸序列或编码具有木脂素羟基化活性的多肽的多核苷酸的碱基序列的公知常用技术即可。
也就是说,本发明的目的在于,提供具有木脂素羟基化活性的多肽的生产方法,必须注意的是,包含上述各种工序以外的工序的生产方法也属于本发明的技术范围。
(D)羟基化木脂素的生产方法
到目前为止,木脂素及羟基化木脂素的生产是通过从植物中提取来进行的,具有不能大量生产等的问题,但根据本发明,可用低成本大量生产木脂素及羟基化木脂素。
本发明提供使用表达本发明所涉及的多肽的生物体或细胞来生产羟基化木脂素的方法。上述生物体,可为天然的未改造生物体,也可为使用重组表达系统的转化体。本发明所涉及的羟基化木脂素生产方法,可高效生产木脂素(特别是松脂醇或胡椒醇)。
本发明的实施方式之一所涉及的羟基化木脂素生产方法,其特征在于,使用由编码本发明所涉及的多肽的多核苷酸转化的生物体或其组织来生产羟基化木脂素。上述生物体优选为上述转化体植物或细菌,特别优选为大肠杆菌、芝麻、连翘或亚麻。
本发明的优选实施方式所涉及的羟基化木脂素生产方法,包含将编码本发明所涉及的多肽的多核苷酸导入上述生物体的工序。将多核苷酸导入上述生物体的工序,可使用上述各种基因导入方法。本实施方式的此种情况下,上述生物体在转化前产生的羟基化木脂素与转化后产生的羟基化木脂素之间的组成不同。具体地说,从上述生物体中得到的木脂素及其羟基化物,其含有率增加了。本实施方式的此情况所涉及的羟基化木脂素生产方法,优选进一步包含从上述生物体中提取羟基化木脂素的工序。
在其他的实施方式中,本发明所涉及的羟基化木脂素生产方法,包含在天然表达本发明所涉及的多肽的生物体中,将本发明所涉及的寡核苷酸作为反义寡核苷酸导入的工序。将寡核苷酸导入上述生物体的工序,可使用上述反义RNA技术。本实施方式所涉及的羟基化木脂素生产方法,还优选进一步包含使用或寡核苷酸、鉴定天然表达本发明所涉及的多肽的生物体的工序。本实施方式的此情况所涉及的羟基化木脂素生产方法,还优选进一步包含从上述生物体中提取羟基化木脂素的工序。
本实施方式中,上述生物体在导入上述寡核苷酸前产生的羟基化木脂素与导入后产生的羟基化木脂素之间的组成不同。具体地说,从上述生物体中得到的木脂素及其羟基化物,其含有率减少了。
如此可以说,本发明所涉及的羟基化木脂素的生产方法,至少使用表达本发明所涉及的多肽的生物体即可。
即本发明的目的在于,提供基于通过本发明所涉及的多肽其羟基化木脂素的组成改变了的生物体的羟基化木脂素生产方法,必须注意的是,上述生物体使用动物、植物或各种细胞的生产方法也属于本发明的技术范围。
(E)食品及工业产品
本发明提供使用通过上述羟基化木脂素的生产方法制得的羟基化木脂素而制造的食品及工业产品。本项中所述的食品,可以是上述转化植物体的种子、果实、切穗、块茎及/或块根,也可以是使用从上述转化植物体中提取的羟基化木脂素而制造的食品(例如,芝麻、连翘或亚麻或这些的加工食品)。本发明所涉及的食品或工业产品,可含有所需量的木脂素(特别是松脂醇或胡椒醇)。
例如,从如上所述的羟基化木脂素含量增加了的本发明所涉及的转化植物中提取的羟基化木脂素提取液,被作为羟基化木脂素含量高的食品提供。且不限于提取的羟基化木脂素,上述转化植物体的种子、果实、切穗、块茎及/或块根等也可被作为大量含有羟基化木脂素的食品提供。改变羟基化木脂素组成的对象无特别限定,除植物以外,还可以动物、细菌或酵母等所有的生物为对象。
此外,基于木脂素及羟基化木脂素的独特物性,本发明所涉及的多肽或多核苷酸可作为工业产品(例如,实验用试剂、薄膜、生物分解性塑料、功能性纤维、润滑油或洗涤剂等的工业产品)的原料利用。
本发明涉及具有木脂素羟基化活性的全部多肽及其利用,这一点本领域技术人员应明白。木脂素羟化酶可来自植物、动物或微生物的任一种,只要具有木脂素羟化酶活性,即可控制木脂素量。且本发明涉及通过导入编码木脂素羟化酶的多核苷酸而制备的木脂素量得到调节的植物、其后代或它们的组织,其形态也可为切花。如使用本发明所涉及的木脂素羟基化多肽,即可促进或抑制羟基化木脂素的生成。此外,本领域技术人员应容易理解,使用常用的方法,在植物中导入上述多核苷酸使该多核苷酸组成型或组织特异性表达,从而使目的多肽的表达增加,以及通过使用反义法、同时使用抑制法及RNA i法等,即可抑制目的多肽的表达。
实施例
基于以下实施例具体说明本发明,但本发明不限于以下实施例。此外,实施例中使用的分子生物学的方法,只要无其他详述,均根据MolecularCloning(Sambrook等,Cold Spring Harbour Laboratory Press,1989)中记载的方法。
(实施例1:芝麻cDNA文库的制备)
根据制造商推荐的方法使用RNeasy Plant Mini Kit(Qiagen),从芝麻的种子中提取总RNA。然后,使用Oligotex MAG mRNA纯化试剂盒(TaKaRa),得到poly A(+)RNA 5μg。根据制造商推荐的方法使用ZAP Express cDNASynthesis Kit and Zap Express cDNA Gigapack 3 Gold Cloning Kit(Stratagene),由此poly A(+)RNA制备cDNA文库。制备的文库为1×107pfu/ml(参考文献:Ono et al.,Proc.Natl.Acad.Sci.USA 103,10116-10121.2006)。
(实施例2:杂交探针的制备)
使用RNeasy Plant Mini Kit(QIAGEN),从十字花科拟南芥中提取总RNA的后,根据制造商推荐的条件使用SuperScriptTM Firtst—StrandSynthesis System for RT-PCR(Invitrogen),由1μg总RNA合成cDNA。将拟南芥的2—酮戊二酸依赖性双加氧酶(以下20G—双加氧酶)样基因At3g13610使用At3g13610-Fw(序列号1)及At3g13610-Rv引物(序列号2),将扩增片段作为筛选探针。
序列号1:At3g13610-Fw:5’-ATG GCT CCA ACA CTC TTG ACA ACC CAA-3’
序列号2:At3g13610-Rv:5’-TCA GAT CTT GGC GTA ATC GAC GGT TTT-3’
将非放射性同位素的DIG—核酸检测系统(Roche公司)按照制造者推荐的PCR条件使用,在通过RT—PCR得到的片段(fragment)中导入DIG标记。具体地说,PCR反应液(50μ1)的组成为:各cDNA1μl、1×Taq缓冲液(TaKaRa)、0.2nM dTPs、引物(序列号1及2)各0.4pmol/μl、rTaq聚合酶2.5U。PCR反应在94℃、反应5分钟后,进行30个循环的94℃ 1分钟、53℃ 1分钟、72℃ 2分钟的反应的扩增。将此DIG标记化片段作为杂交用探针用于以下的实验。
(实施例3:芝麻20G-双加氧酶基因的筛选)
将非放射性同位素的DIG—核酸检测系统(Roche公司)(roche-diagnostics)按照制造者推荐的方法使用,将实施例1中得到的cDNA文库用实施例2中得到的探针进行筛选。
使用杂交缓冲液[5×SSC、30%甲酰胺、50mM磷酸钠缓冲液(pH7.0)、1%SDS、2%封闭试剂(Roche公司)、0.1%十二烷基肌氨酸、80g/ml鲑鱼精子DNA),37℃下进行2小时预杂交后,添加实施例2中得到的探针,保温过夜。将膜在含有1%SDS的5×SSC洗涤液中55℃下洗涤30分钟。筛选约1×106pfu的噬菌斑,得到约200个阳性克隆。
按照制造者推荐的方法使用cDNA文库合成试剂盒,将上述500个的克隆插入pBK—CMV质粒(Stratagene)。使用M13RV及M13M4(—20)的引物对,确定插入物的部分DNA序列。使用基于所得到的DNA序列得到的推定氨基酸序列,通过Blast x进行数据库检索,得到来自芝麻的20G-双加氧酶(以下、SiD)的部分序列。使用DNA Sequencer model 3100(Appllied Biosystems),使用合成寡核苷酸引物通过引物步查法确定碱基序列。通过Clustal—W分析得到最终的7种SiD样基因(SiD1~7)。除SiD4及SiD 7以外的SiD基因,因通过文库筛选所得到的克隆不包含推测ORF的5’或3’端区域,所以,将Gene Racer kit(Invitorogen)按照制造者推荐的方法进行cDNA末端快速扩增[Rapid Amplification of cDNA End(以下、RACE)],扩增各自的Sid基因的5’及3’端区域。RACE使用如以所示的各SiD基因特异性引物对(序列号3~15及46)。将各扩增产物使用合成寡核苷酸引物通过引物步查法确定碱基序列,得到含有全长ORF的SiD序列。
序列号3:GR-SiD1-Fw3:5’-GGG GAA CGG GCG CAG CTT GCG GGA AGATT
序列号4:GR-SiD1-Rv3:5’-GGC ATC ACC ATC GGT TCC CCC ACC GTG AAA
序列号5:SiD1-nest-Fw2:5’-TGA TCT CGT GCT GGG GTT GAA
序列号6:SiD1-nest-Rv:5’-TGC TCA TAA TCT CCA TTT GGT
序列号7:GR-SiD2-Fw:5’-GGT CGA CAC AAG GAC GGC GGG GCG TTA
序列号8:GR-SiD2-Rv:5’-ACG CCC CGC CGT CCT TGT GTC GAC CTA
序列号9:SiD2-nest-Fw:5’-ACT GAT GGC GAA TGG ATT CTT
序列号10:SiD2-nest-Rv2:5’-TTC CTT CCA GTC CCT GAC ATT
序列号11:GR-SiD3-Rv:5’-GGG GTT CGG ACA CTT GGG GTA GTA GA
序列号12:SiD3-nest-Rv:5’-CAA GGC GGA TTC TTT GAC CTT
序列号13:GR-SiD5-Rv:5’-TGA TCC ACT TCT CGC CCC GCC GGA CTT
序列号14:SiD5-nest-Rv:5’-TGA GGG CAT TTT GGG TAA TAG
序列号15:GR-SiD6-Rv:5’-TGC GGG TCA GGT GGA TGA GGG GCC ATT
序列号46:SiD6-nest-Rv:5’-CAT TAC ACA AGT GAT AGT AT
所得到的含有全长ORF的各SiD基因的氨基酸序列与DNA序列如下所示(序列号16~19)。
序列号16:Sid1蛋白质
MAGVASPPAEVLLSKRVQELVITGEDPSGPYVCRNDDDNGELDATTENSPIPVVNIGHFLSGKWSD
DESVQELKKLHSALSTWGCFQGIGHGIPSCFLDEVRRVGREFFEQPMEEKNKYGKTVTEFQGYGAD
PVPEEGQSLDWSDRLFLELVPEDQRNYRFWPQNPSSFKGTLEEYSEKMKTVTEIISKSMARSLHLE
ETCFLKQFGERAQLAGRFNYYSPCRRPDLVLGLKPHADGSGYTVILQDEPGLQVLNHGKWYTVPKN
PDALLVLMGDQMEIMSNGVFRSPVHRVLSNGERDRISVAVFYTPEVGKEIGPEEGLISAEAPRVFK
MVKDYADIHVGYYQRGMRSLHTVRV
序列号17:Sid1 DNA
ATGGCTGGAGTTGCATCCCCACCCGCTGAAGTATTGCTGTCCAAAAGAGTCCAAGAATTGGTCATC
ACCGGTGAGGACCCGTCGGGGCCATACGTGTGTAGAAACGACGACGACAACGGGGAATTAGACGCG
ACAACTGAGAATTCTCCGATTCCAGTTGTGAACATTGGACACTTCTTGTCGGGAAAATGGTCCGAT
GATGAAAGTGTACAAGAGCTGAAGAAACTCCACTCGGCTCTCTCCACATGGGGATGCTTTCAGGGC
ATAGGTCATGGGATCCCGAGTTGTTTCCTGGACGAGGTACGAAGAGTTGGGAGGGAGTTCTTCGAG
CAGCCAATGGAGGAGAAGAACAAGTATGGGAAAACGGTGACGGAGTTTCAAGGGTATGGAGCTGAT
CCCGTCCCGGAAGAAGGGCAGTCGCTCGACTGGTCGGATCGTCTTTTCCTAGAGTTAGTCCCTGAA
GATCAAAGAAATTACAGATTCTGGCCTCAGAACCCATCCTCTTTCAAAGGAACACTGGAAGAGTAC
TCGGAGAAGATGAAAACAGTGACTGAGATAATATCCAAATCCATGGCAAGATCACTTCATCTTGAG
GAGACCTGCTTCTTGAAACAGTTCGGGGAACGGGCGCAGCTTGCGGGAAGATTCAACTACTATTCG
CCTTGCAGGAGGCCTGATCTCGTGCTGGGGTTGAAGCCTCACGCCGACGGATCAGGCTACACCGTT
ATACTGCAGGATGAACCCGGCCTTCAAGTACTCAACCATGGCAAATGGTATACTGTCCCCAAGAAC
CCTGATGCCCTTCTAGTCCTCATGGGGGACCAAATGGAGATTATGAGCAACGGGGTGTTCAGAAGT
CCGGTGCACAGGGTGCTGAGCAATGGGGAGAGGGACAGGATCTCTGTGGCTGTATTTTACACGCCG
GAGGTGGGGAAGGAGATCGGGCCGGAAGAGGGGTTGATCAGTGCGGAGGCACCGAGAGTGTTCAAG
ATGGTGAAAGATTATGCTGACATTCACGTGGGGTACTATCAGAGGGGAATGAGATCGCTTCATACT
GTCAGAGTTTGATGCTCTATATATATAGGGAAAGTTTAGTCCATCTCGAGTTTGGTCAGATCTAAA
TCAATTATATGTCAAGTCAATACATTTGTCGTGATTAGTGTATAATTTAAAAAATGACTAATCATG
TGACAAATGTATCACACTTGCTCTATAATTGATTTAGTTCAATGAAAGCTGATATAGATAAAAATT
TTGCATGTANATATGGNGTGTGTTGGATGCCTTTCCAATGTTTAAATAACCATATTGCTGCTTGGG
ATTTCTTTTG
序列号18:Sid2蛋白质
MGEVDPAFIQALEHRPKPHSVEAQGIPLIDLSPANSPDPDPGSLSALAAEIGDACEKWGFFQVINH
GVPLHVREKIDLVSRKFFALPKEEKKKVSRDEVNPSGYYDTEHTKNVRDWKEVFDFTVGEPMVMPA
SHEPDDRELKEVINQWPENPSEMREVCEEYGAEMQKLGHKLLELIALSLGLARDRFNGFFKDQTTF
IRLNYYAPCPIPDLALGVGRHKDGGALTILAQDDVGGLEVKRKTDGEWILVKPTPDAYIINVGDII
QVWSNDKYESVEHRVKVNSERERFSIPFFLNPAHYTMVEPLEELVNKQNPANYNPYNWGKFFSTRK
RSNYKKLDVENIQIHHFKNY*
序列号19:Sid2 DNA
ATGGGAGAAGTCGACCCTGCATTCATCCAAGCGCTCGAACACAGGCCTAAACCCCACAGCGTCGAG
GCCCAAGGCATCCCGTTAATCGATCTCTCCCCCGCCAACTCCCCGGACCCCGATCCGGGTTCCCTG
TCAGCTCTCGCCGCCGAAATTGGTGATGCGTGCGAGAAATGGGGATTTTTCCAGGTGATCAACCAC
GGGGTGCCGTTGCATGTTCGGGAGAAAATTGACCTGGTTTCCAGGAAATTTTTTGCTCTGCCGAAA
GAGGAGAAGAAGAAGGTTTCCAGGGATGAGGTGAACCCGTCGGGGTATTACGACACTGAGCACACT
AAGAATGTCAGGGACTGGAAGGAAGTGTTTGATTTCACGGTGGGGGAACCGATGGTGATGCCGGCT
TCGCATGAGCCTGATGACAGGGAGCTGAAAGAAGTGATCAATCAGTGGCCTGAGAATCCTTCAGAA
ATGAGGGAAGTGTGTGAAGAATACGGTGCAGAAATGCAAAAATTGGGACACAAGTTGCTGGAACTC
ATAGCCCTGAGCCTAGGCTTGGCGAGAGATCGATTCAATGGGTTTTTCAAGGATCAAACCACCTTC
ATTCGGCTGAATTACTATGCGCCATGCCCGATCCCTGATCTAGCTCTTGGCGTAGGTCGACACAAG
GACGGCGGGGCGTTAACAATTCTTGCTCAAGACGATGTAGGGGGGCTGGAGGTGAAGAGGAAAACT
GATGGCGAATGGATTCTTGTGAAACCTACTCCTGATGCCTATATAATCAATGTTGGTGACATTATA
CAGGTTTGGAGCAACGATAAGTACGAGAGTGTGGAACACAGAGTGAAAGTGAATTCAGAGAGAGAG
AGATTTTCGATTCCCTTCTTCCTCAACCCTGCACATTATACTATGGTAGAACCGCTGGAGGAGCTG
GTGAACAAGCAGAATCCTGCCAACTACAATCCTTACAACTGGGGAAAGTTCTTCTCCACCCGAAAA
CGCAGTAACTACAAGAAGCTTGATGTGGAGAACATTCAAATACATCACTTCAAGAACTACTGAAGG
TTGCCCTTTTGGGCCTAAGTGTTCACATTCTCAATGATTATGCTTACAGACTGATGGATTTGGCTC
TCTTGACTGTGCATGTATTATGAATAAATAATTACTTTAGATATATTATAAAAAAAAAAAAAAAAA
AAA
序列号20:Sid3蛋白质
MSELLSEPDNLIDFMLNKGNGVKGLSQINLKQIPDRFIQPPEERLDHIQIATQESVPVIDVSRWDD
PGIAESICEAAAKWGFFQIINHGIPDEVLENVKRAAHDFFELPVEERRRYLKENSPTHTVMLKTSF
SPLAEKILEWKDYLMHYCDGQENEHSKFWPPLSRDQVLDYVNWIKPIIRKLLTVLLNGIKVEQIDK
VKESALMGSPVVTLLYYPKCPNPNVAAGAGRHSDVSSITILLQDDVGGLYVRATEGDQWIHIAPTK
GALVVNIGDVLQIMSNDRYKSIEHRVFVNGSKNRVSVPVFVNPSSDAIIGPLPEVLKAGEKPIYKH
VVFSDYFNYFFSKGHDGKRSLDYAKI*
序列号21:Sid3 DNA
ATGTCTGAACTACTCTCGGAACCCGACAACCTCATAGATTTTATGCTGAACAAAGGAAATGGAGTG
AAGGGTCTCTCTCAGATAAACCTTAAACAAATCCCAGATCGATTCATCCAGCCCCCTGAAGAAAGA
TTGGACCATATCCAAATTGCGACCCAAGAATCCGTACCCGTTATCGATGTGTCCAGATGGGATGAC
CCGGGAATTGCAGAATCAATCTGCGAGGCAGCAGCCAAGTGGGGTTTCTTTCAGATCATCAATCAT
GGAATCCCAGATGAGGTTCTTGAAAATGTGAAGAGGGCTGCTCATGATTTCTTTGAGTTGCCTGTT
GAGGAGAGGAGGAGGTATTTGAAGGAGAATTCTCCCACTCACACTGTGATGTTGAAGACTAGCTTT
AGTCCTCTTGCTGAGAAGATTTTGGAGTGGAAAGACTATCTTATGCACTACTGTGATGGCCAAGAA
AATGAGCATTCCAAGTTCTGGCCACCTTTGTCTAGAGATCAAGTTTTGGACTACGTAAACTGGATA
AAGCCCATTATCAGAAAGCTACTGACAGTGTTGCTCAATGGTATTAAGGTGGAACAAATTGACAAG
GTCAAAGAATCCGCCTTGATGGGCTCACCAGTTGTCACCCTTCTCTACTACCCCAAGTGTCCGAAC
CCCAATGTTGCAGCTGGAGCTGGCCGTCACTCTGATGTGTCATCAATCACCATCCTCCTACAAGAC
GACGTAGGTGGACTCTACGTACGAGCAACTGAAGGCGACCAGTGGATCCATATAGCACCAACCAAA
GGAGCTCTTGTTGTAAACATCGGAGATGTGCTGCAGATCATGAGCAACGACAGGTACAAAAGCATC
GAGCATCGTGTATTTGTGAATGGGAGCAAGAACAGGGTTTCCGTGCCCGTCTTTGTCAACCCTTCA
AGTGACGCCATCATTGGCCCTCTGCCGGAAGTGCTGAAGGCCGGAGAGAAACCAATCTATAAACAT
GTTGTCTTCTCGGATTACTTCAATTACTTCTTTAGTAAAGGTCATGATGGCAAACGATCGCTGGAT
TATGCGAAAATATGACGTGTTTGTGTTTTGTAGGATAGCTTATCTTCACAAGTCTTTGCTGTCTTC
TTGCATAGGCTGTGTCATATACTCACAGATTTATCTCCG
序列号22:Sid4蛋白质
MEPKLTKLGSSLPVPIVQELAKEKLATVPPRYVRPDQHQHTILSALNSSFPQIPVIDMQKFSDIYI
MDSELQALHNACQEWGFFQLINHGVDSAVMEKMKIEIQEFFNLPIEEKKKFKHEEGDIQGYGQAFV
VSEDQKLDWGDVFAIVTSPIYLRKPHLIAKLPATFRDATEVYASELKVLAMKILKLMAKALDMKAE
EMETLFAEGMHSMRMNYYPPCPQPELVTGLCPHSDADGLTILLQVNEMDGLQIKKDGVWIPVSPLP
NAFTINIGDNLEILTNGAYRSIEHRATVNKEKERISIATFLGANLDGDMGPSPSLVTPQTPAKFKR
IGVTQYLKELFSRELMGKSYLDLMRI*
序列号23:Sid4 DNA
ATGGAACCAAAATTAACAAAGCTAGGCAGCTCTCTTCCGGTGCCTATCGTACAAGAATTGGCCAAG
GAGAAATTAGCAACGGTTCCTCCAAGATACGTGCGCCCAGATCAACATCAACACACGATTCTCTCT
GCTCTTAATTCTTCCTTCCCTCAAATTCCTGTCATCGATATGCAGAAGTTTTCAGACATCTATATA
ATGGATTCTGAGCTTCAGGCCCTACATAATGCATGCCAAGAATGGGGTTTCTTTCAGTTGATCAAC
CATGGGGTGGACTCTGCTGTAATGGAGAAAATGAAGATAGAAATTCAAGAATTCTTTAATCTCCCA
ATAGAGGAGAAGAAGAAATTTAAGCATGAGGAAGGGGACATACAGGGTTATGGGCAAGCCTTTGTT
GTATCAGAAGATCAAAAGCTCGACTGGGGAGACGTGTTTGCCATTGTTACCTCACCAATTTACCTC
AGAAAGCCTCACTTAATCGCCAAGCTTCCTGCTACCTTCAGGGACGCCACAGAAGTGTATGCATCG
GAACTCAAAGTTCTCGCCATGAAGATTCTAAAGCTAATGGCAAAAGCCTTAGACATGAAAGCTGAA
GAAATGGAAACGCTATTCGCAGAAGGGATGCATTCCATGAGGATGAACTACTATCCTCCGTGTCCC
CAGCCCGAGCTCGTCACGGGCCTCTGCCCTCACTCCGATGCAGATGGGCTCACCATTCTCCTCCAA
GTGAATGAAATGGATGGCCTCCAGATCAAGAAAGATGGAGTCTGGATTCCCGTTTCTCCACTCCCT
AATGCCTTCACCATCAATATTGGAGATAACTTGGAGATTCTGACAAACGGTGCTTATAGGAGCATT
GAGCATAGAGCAACTGTCAACAAGGAGAAAGAAAGAATCTCCATTGCCACATTTCTGGGCGCGAAT
CTAGATGGTGATATGGGTCCGTCGCCAAGCCTCGTCACTCCTCAGACTCCGGCAAAATTCAAGAGG
ATCGGGGTGACTCAATATTTGAAGGAACTATTCTCGCGGGAACTCATGGGGAAATCATATCTAGAC
CTTATGAGGATTTAGGGTGTAGTACTGGGGTATGGTAATAACACCAACATGAGTTTGTACCTAATA
AGTTATCAACCATTAGATTACAAATAATACTATGATCATGTGTAAAAAAAAAAAAAAAAAAAAAAA
AAAAAAAAAAAAAAAAAAAA
序列号24:Sid5蛋白质
MMSCLQSWPEPVVRVQHLSDSGIRVIPERYVKKLSDRPSFCDSLSGEVNIPVIDMKGLYSDDASVR
KKTAGMISGACREWGFFQVVNHGVRQEVMGRAREAWREFFKLPLEEKQKYANSPSTYEGYGSRLGV
EKGISLDWSDYFFLNYLPLALRDQNKWPALPLSCREMVGEYCREVVELGGRLMKILSSNLGLEEEY
LQEAFGGEEFGACMRVNYYPKCPQPDLTLGLSPHSDPGGMTLLFPDENVSGLQVRRGEKWITVDPV
PNAFIVNIGDQLEVLSNGNYKSVEHRVIVNSEKERVSIALFYNPRGDMLIKPADELVTEDRPPLYP
PTVYDEYRLYMRTRGPRGKSQVHSLKSLQ*
序列号25:Sid5 DNA
ATGATGAGCTGCTTGCAGAGCTGGCCCGAACCCGTTGTCAGGGTCCAACACCTCTCCGACAGCGGG
ATTCGGGTAATCCCCGAACGCTACGTGAAGAAACTCTCAGACAGGCCGAGCTTTTGCGACTCCCTC
TCCGGCGAAGTTAACATTCCAGTCATCGACATGAAGGGGTTGTACTCGGACGACGCCTCAGTCCGG
AAGAAGACGGCCGGGATGATCAGCGGGGCATGCCGCGAGTGGGGGTTCTTCCAGGTGGTGAACCAC
GGGGTGAGACAGGAGGTGATGGGGCGGGCCAGGGAGGCGTGGCGCGAGTTTTTTAAGCTGCCGCTG
GAGGAGAAGCAGAAGTACGCGAATTCGCCGAGCACGTATGAGGGGTACGGCAGCCGCCTGGGTGTG
GAGAAGGGAATATCACTGGATTGGAGTGACTACTTTTTCCTGAATTACCTTCCTCTCGCACTCAGA
GACCAGAATAAGTGGCCTGCACTTCCTCTTTCATGCAGGGAAATGGTGGGAGAGTACTGTAGAGAA
GTGGTTGAACTTGGTGGAAGATTGATGAAGATTCTGTCGAGCAATCTTGGGCTGGAAGAAGAGTAT
CTTCAAGAAGCATTTGGAGGAGAGGAGTTTGGGGCATGCATGAGGGTTAACTATTACCCAAAATGC
CCTCAACCGGACCTCACACTCGGCCTTTCTCCTCATTCCGACCCGGGTGGGATGACCCTTCTCTTC
CCCGACGAGAACGTATCGGGTCTCCAAGTCCGGCGGGGCGAGAAGTGGATCACCGTCGACCCAGTC
CCCAATGCGTTTATCGTCAATATAGGAGATCAACTTGAGGTGTTAAGCAATGGGAATTACAAGAGT
GTGGAGCATAGGGTGATTGTGAATTCAGAGAAAGAGAGAGTGTCAATCGCATTGTTCTACAATCCA
AGGGGTGATATGCTGATAAAGCCGGCGGATGAGCTGGTGACGGAGGACCGCCCACCGCTCTACCCG
CCCACCGTTTACGACGAGTATAGGCTGTACATGAGGACAAGGGGCCCTCGTGGCAAGTCCCAAGTC
CATTCACTTAAATCACTTCAATAACTTAATTAATATTATATTTAAATAATAATTTTAGGTAGTATT
GTTCCATGAATTGTAGTGTTGTTTGTTAATTAATTTCCGCATTTTATGTAATTTGGATTGTACTAC
ACATATATATCATGACTACTACTCATCATGGGTTAATTAAAAAAAAAAAAAAAA
序列号26:Sid6蛋白质
MEVQTMKVHAYDRLSELKAFDDSKSGVKGLVDAGVTKIPRFFINDNDMPGSEPCNFNSEAIFPVID
LSGMHHAANRAGIVSRVKEACEKWGFFQIINHEMPLRVMDEMIAGVRRFHEQDAEVKKKYYGRDVT
KKFQYNSNFDLYKTRAAMWRDTITCVMAPHPPDPQELPDVCRDIMFEYSKHVMRVGHTVYELLSEA
LGLNPSYLRDIGCIESNFIVGHYSPACPEPELTFGIRSHVDFGLLTILLQDQIGGLQVLHQNQWVD
VSPLPGSLIINVGDFIQLISNDKFKSVKHRALSKRVGPRISVGVFIKPYYADGDNLRVYGPIKELL
TEEEPAIYRETTYKDYERFYFANCDDGTTKLPYFRLGT*
序列号27:Sid6 DNA
ATGGAAGTTCAGACAATGAAAGTTCATGCATACGATCGACTAAGTGAACTAAAAGCATTCGATGAT
TCAAAATCAGGCGTGAAGGGACTTGTTGATGCTGGTGTTACGAAGATCCCACGCTTCTTCATTAAT
GATAATGATATGCCTGGATCCGAACCGTGCAACTTCAACTCAGAAGCCATCTTTCCAGTCATAGAT
TTATCAGGCATGCACCATGCTGCAAACCGTGCTGGAATTGTCAGCAGAGTGAAAGAGGCATGTGAG
AAGTGGGGATTCTTTCAGATAATCAATCATGAGATGCCGCTGCGAGTGATGGATGAAATGATTGCA
GGGGTTCGAAGATTTCACGAGCAAGATGCTGAGGTTAAGAAGAAATACTACGGTCGTGATGTCACG
AAAAAGTTTCAGTACAATAGCAATTTCGATCTTTACAAAACACGGGCGGCCATGTGGAGGGATACT
ATCACTTGTGTAATGGCCCCTCATCCACCTGACCCGCAGGAATTGCCAGATGTATGCAGAGACATC
ATGTTTGAATACTCTAAGCATGTCATGAGAGTGGGGCATACCGTGTATGAATTGCTGTCGGAGGCT
TTGGGCCTCAATCCCAGCTACCTGAGAGACATTGGCTGTATTGAGTCGAATTTCATCGTGGGCCAT
TATTCTCCGGCTTGCCCAGAACCAGAACTGACCTTTGGCATCAGAAGCCACGTCGACTTCGGCTTG
CTCACAATACTCTTGCAGGACCAGATTGGCGGTCTCCAGGTGCTTCACCAGAATCAGTGGGTCGAC
GTTTCTCCCTTGCCTGGAAGTCTAATAATAAATGTTGGGGACTTTATACAGCTGATCAGTAACGAC
AAATTCAAAAGCGTGAAACACAGAGCACTATCAAAAAGGGTAGGGCCAAGAATTTCAGTTGGTGTT
TTCATTAAACCCTACTACGCTGATGGAGATAATTTGCGGGTGTACGGACCTATCAAGGAGCTGTTA
ACTGAAGAAGAGCCGGCTATCTACAGGGAAACAACTTATAAAGACTATGAAAGATTCTACTTCGCC
AATTGTGATGACGGAACCACCAAGCTGCCGTATTTCAGGCTGGGCACCTGATCAATGGTCCTGCAG
TGGCAGCTTGTCAAGTACTGGATAGTTGTGAACTGACCTTCTTCACCA
序列号28:Sid7蛋白质
MAWRSQTEANYDRASELKAFDDTKTGVKGLVDSGITQVPRIFITPRNDSDKNLKPSDSQLKFPIID
LENIDEDPIRFKKVVDEVRDASGTWGFFQVINHGIPGSVLEEMLDGVRKFYEQDPEERKKWYTRDR
KRSVVYNSNFDLYSAPAANWRDTFFCKMAPHPPSPEELPAVCRDIMFEYTKQVLKLGTSLFKLLSE
ALGLDANHLGDMKCADGLALLCHYYPFCPQPELTMGASQHADSDFLTVLLNDNVTGLQVLYQNQWF
DVPSVPGSLVVNVGDLLQLISNDRLISSEHRVLANNVRSRVSVACFFRSDIDKSDELYGPIQELLS
EDNPPKYRATTMKEYVNYYNAKGLDGTSALLHFRV*
序列号29:Sid7 DNA
ATGGCCTGGAGATCTCAGACAGAAGCAAACTACGACAGAGCAAGCGAACTAAAAGCTTTTGATGAC
ACCAAAACTGGTGTCAAAGGCTTAGTTGACAGTGGTATAACCCAAGTCCCGAGAATCTTCATCACC
CCACGAAATGATTCAGACAAGAACCTTAAACCTTCCGATTCACAACTCAAATTCCCAATAATTGAC
CTCGAAAACATCGATGAAGATCCAATCAGGTTTAAGAAGGTCGTGGACGAGGTTCGAGATGCTTCA
GGGACATGGGGTTTCTTCCAGGTGATCAATCATGGGATTCCGGGTTCTGTTTTGGAGGAGATGCTA
GATGGGGTCCGGAAATTCTATGAACAAGATCCTGAGGAGAGGAAAAAGTGGTACACAAGGGATAGA
AAAAGAAGTGTTGTTTACAATAGCAACTTTGATTTGTATAGTGCACCAGCAGCTAATTGGAGGGAC
ACTTTCTTCTGTAAAATGGCTCCTCATCCTCCAAGCCCTGAGGAGTTGCCCGCTGTGTGCAGAGAT
ATAATGTTTGAGTACACAAAGCAAGTTTTGAAACTGGGAACAAGTTTGTTTAAATTGTTGTCCGAG
GCCCTTGGTCTGGATGCCAACCACCTTGGGGACATGAAATGTGCTGACGGGCTTGCTCTCCTGTGC
CATTACTACCCCTTCTGCCCTCAGCCGGAGTTAACTATGGGCGCCAGCCAGCACGCGGACAGTGAC
TTCCTGACGGTGCTCCTAAATGACAATGTAACCGGCCTGCAAGTTCTTTACCAAAACCAGTGGTTT
GATGTTCCCTCAGTGCCCGGATCTCTGGTGGTAAATGTTGGAGATCTTCTACAGCTTATATCAAAT
GATAGGTTGATTAGTTCGGAGCATAGAGTACTAGCAAACAACGTTCGTTCAAGGGTATCAGTCGCA
TGTTTCTTTAGAAGCGACATAGATAAGTCGGACGAGCTCTACGGACCAATCCAGGAACTCTTGTCT
GAAGATAATCCACCAAAATACAGGGCAACCACCATGAAAGAGTATGTGAACTACTACAACGCCAAG
GGGTTGGACGGAACTTCTGCTTTGTTACATTTCCGCGTTTGAATTGAAATGATATGATGGGAAGAT
GTTACTTTCCATATTAATATAATCCGGGAAAACGGAACATTCGAAATGTAGTATGAAAGAAAAATG
TGCGGTCTATTTCTATTTTATTAGTAAAACCATAACGAATGTTGATTAACTATGATTAAAATTAAG
CTTTCACTTTAAAAAAAAAAAAAAAAA
(实施例4:芝麻20G-双加氧酶(SiD)的大肠杆菌表达载体的构建)
设计在各SiD的cDNA的起始蛋氨酸密码子(ATG)的上游具有BamHI或BglII位点、在终止密码子的下游具有XhoI位点的引物(序列号30~序列号43),将含有各SiD基因ORF的片段通过PCR扩增。
序列号30:Bgl2NcoI-SiD1-Fw:5’-TTT AGA TCT TCC ATG GCT GGA GTTGCA TCC CCA
序列号31:Sid1-endXhoI-Rv:5’-TTG ACA TAT AAT TGA TTT AGA TCT
序列号32:BamNco-SiD2-Fw:5’-AAA GGA TCC ATG GGA GAA GTC GAC CCTGCA TT
序列号33:SiD2-KpnXho-Rv:5’-AAA CTC GAG GTA CCC AAC CTT CAGTAG TTC TTG AAG T
序列号34:Bgl2-SiD3-Fw:5’-TTT AGA TCT ATG TCT GAA CTA CTC TCGGAA
序列号35:SiD3-KpnXho-Rv:5’-AAA CTC GAG GTA CCA ACA CGT CAT ATTTTC GCA TA
序列号36:BamNco-SiD4-Fw:5’-AAA GGA TCC ATG GAA CCA AAA TTA ACAAAG CTA
序列号37:SiD4-KpnXho-Rv:5’-AAA CTC GAG GTA CCT ACT ACA CCC TAAATC CTC ATA A
序列号38:BamHI-SiD5-Fw:5’-AAA GGA TCC ATG AGC TGC TTG CAG AGCT
序列号39:SiD5-KpnXho-Rv:5’-AAA CTC GAG GTA CCT TAA TTA AGT TATTGA AGT GAT TT
序列号40:Bgl2Nco-SiD6-Fw:5’-AAA GAT CTT CCA TGG AAG TTC AGACAA TGA AA
序列号41:SiD6-KpnXho-Rv:5’-AAA CTC GAG GTA CCT GAT CAG GTG CCCAGC CTG AAA TA
序列号42:BamNco-SiD7-Fw:5’-AAA GGA TCC ATG GCC TGG AGA TCT CAGACA GAA
序列号43:SiD7-KpnXho-Rv:5’-AAA CTC GAG GTA CCT TCA ATT CAA ACGCGG AAA TGT AA
PCR反应液(25μl),由作为模板的芝麻种子cDNA、各引物0.2pmol/μl、1×KOD plus缓冲液(TOYOBO)、0.2mM dNTPs、1mM MgSO4、1U KODplus聚合酶组成。94℃反应5分钟后,进行30个循环94℃ 1分钟、55℃ 1分钟、72℃ 2分钟的反应的PCR扩增后,72℃保持3分钟。将所得到的各PCR产物根据制造者推荐的方法插入pCR4 Blunt-TOPO vector(Invitrogen)的多克隆位点。确认通过序列分析插入的PCR产物无错误。
将亚克隆上述7种SiD后的质粒用BamHI或BglII及XhoI或KpnI酶切后所得到的含有全长SiD的约1.1kb的DNA片段,插入作为大肠杆菌表达载体的pET-30a载体(Novagen)的BamHI和XhoI或KpnI位点,得到7种的SiD大肠杆菌表达载体。
(实施例5:芝麻中SiD基因的表达分析)
将7种SiD基因的芝麻植物体中的基因表达模式用RT-PCR法分析。根据先行文献[Ono et al.,Proc.Natl.Acad.Sci.USA.103,10116-10121(2006)]将芝麻分为成熟叶、花瓣、茎、蒴果、种子(级别1~6)、幼芽(发芽诱导后1日和7日)。从1g分离器官中使用RNeasy Plant Mini Kit(QIAGEN)提取RNA。以所得到的RNA 1μg为模板进行反转录反应,得到cDNA。cDNA合成使用SuperScript First-Strand Synthesis System for RT-PCR(GIBCO BRL),合成条件根据本系统制造商推荐的条件。以所得到的各级别cDNA为模板,使用实施例4中记载的SiD基因特异性引物(序列号30~43)进行PCR反应。并且为了比较SiD基因和内源基因表达量,内部标准基因使用芝麻的18S核糖体RNA,为了扩增本基因,合成Si18S-Fw(序列号44)及Si18S-Rv引物(序列号45)。
序列号44:Si18S-Fw:5’-TAT GCT TGT CTC AAA GAT TAA
序列号45:Si18D-Rv:5’-AAC ATC TAA GGG CAT CAC AGA
由cDNA1μl、1×Ex—Taq缓冲液(TaKaRa)、0.2nM dNTPs、引物各0.2pmol/μl、Ex—Taq聚合酶1.25U组成。94℃反应5分钟后,进行30个循环94℃ 1分钟、55℃ 1分钟、72℃ 2分钟的反应的PCR扩增后,72℃保持7分钟。将PCR产物用1.0%琼脂糖凝胶进行电泳,通过溴化乙锭染色检测扩增片段。其结果显示,虽然7种SiD基因有不同的表达模式,但全部在积累了木脂素的芝麻种子中表达(图1)。
(实施例6:通过大肠杆菌的SiD重组蛋白质的表达)
将用实施例4构建的SiD基因的大肠杆菌表达载体通过规定方法转化到大肠杆菌BL21(DE3)株。将这些重组大肠杆菌在含有最终浓度为20μg/ml的氨苄青霉素的LB培养基中37℃下进行一夜预培养。将预培养液的一部分添加在含有氨苄青霉素50μg/ml、酪蛋白水解物0.5%的M9培养基(10ml)中,振荡培养到A600=0.6~1.0。其次,在培养液中加入最终浓度0.5mM的IPTG(异丙基-β-D-硫代半乳糖苷),进一步在30℃下振荡培养一夜后,3000rpm、4℃下离心分离10分钟进行集菌。将菌体悬浮于10ml的缓冲液[30mMTris-HCl(pH7.5)、30mM NaCl]中后,进行超音波処理以破碎大肠杆菌,之后,15,000rpm、4℃离心分离10分钟,将所得到的上清作为粗酶液用于测定以下的活性。
(实施例7:SiD重组蛋白质的酶分析)
松脂醇等的木脂素,例如,可根据公知的方法[日本农艺化学会志67:1693(1993)](日语原名:「日本農芸化学学会誌67:1693(1993)」)从芝麻中提取及纯化。底物溶解在少量的DMSO中后再溶解在70%乙醇中作为底物溶液(1mg/ml)。将此底物溶液5μl、在大肠杆菌表达的各SiD的上述粗酶液145μl、0.1M抗坏血酸钠10μl、0.1M 2-酮戊二酸(20G)10μl及10mMFeSO410μl在反应管中混合后,30℃下反应1小时。
通过将100%乙腈(150μl)添加到反应管中,使酶反应停止。将反应管用旋涡混合器剧烈搅拌后,15,000rpm、4℃下离心分离5分钟,将所得到的上清用过滤器(孔径0.45mm、4mm Millex-LH,Millipore)净化后,用高效液相色谱法(以下HPLC)分析此上清。木脂素及其羟基化物的分析条件如下所示。
使用C-30色谱柱(野村化学C30-UG-5、4.6mm×150mm)进行液相色谱法[Lc—2010C(岛津制作所)]。流动相中A液使用0.1%TFA,B液使用含有0.1%TFA的90%乙腈。使用A液65%:B液35%的混合液平衡色谱柱(20分钟)后,用直线浓度梯度(A液65%:B液35%→A液0%:B液100%)洗脱20分钟(流速0.6ml/分钟),用B液100%洗脱7分钟。测定287nm的吸收,检测样品中含有的化合物。将化合物的各谱峰用SPD—10AV(岛津制作所)测定190nm~400nm的光谱,寻找具有木脂素特征性2个最大吸收(230nm及280nm)的物质。在此条件下,在约8.7分钟检测出松脂醇标准品、在约12.8分钟检测出胡椒醇标准品、在保留时间约7.9分钟检测出丁香脂素标准品、及在约6.2分钟检测出开环异落叶松脂素标准品(图2)。
酶反应液的HPLC分析的结果,仅在Sid6重组蛋白质和松脂醇的反应液中,得到具有木脂素的光谱的生成物P1(保留时间约6.2分钟)及生成物P2(保留时间约4.3分钟)(图2)。而且还在Sid6重组蛋白质和胡椒醇的反应液中,新得到具有木脂素的吸收光谱(保留时间约9.7分钟)的生成物P3(图2)。此外,还在SiD6和丁香脂素的反应液中,新得到具有木脂素的吸收光谱的生成物P4(保留时间约5.8分钟)及生成物P5(保留时间约4.2分钟)(图2)。另外,在与开环异落叶松脂素的反应液中,未发现新的生成物(图2)。且不仅未发现芝麻素、芝麻素酚(sesaminol)及芝麻林酚(sesamolin)的生成物,也未发现为类黄酮之一的柚皮素的生成物。由以上结果可知,SiD6与具有呋喃环、且在苯环上至少具有相邻的羟基和甲氧基的木脂素反应。(图2)。
将来自表达SiD6的大肠杆菌的粗提取液10μl用于SDS-PAGE,CBB染色,结果发现了来自转化pET-30a载体的大肠杆菌的粗提取液中未曾发现的约45kDa左右的显著的条带(图3)。此条带大小与SiD6的推测分子量39.1kDa、来自pET—30a载体的His-Tag、凝血酶识别位点、肠激酶识别位点及S-Tag加在一起的条带大小一致,所以,结论是表达的45kDa的条带是重组SiD6蛋白质。因从酶反应液中除去20G时,未发现新的生成物(图2),所以强烈支持了反应液中发现的生成物是由SiD6生成的木脂素的结论。
通过Blastx软件检索同源性的结果,SiD6与长春花的吲哚生物碱的羟化酶Desacetoxyvindoline 4-hydroxylase有最高47%的序列同源性,而至今为止还没有关于芝麻中本生物碱的报道,且用20G双加氧酶的家族的酶对木脂素进行羟基化的活性为新发现。
(实施例8:SiD6的生成物的LC-MS分析)
通过LC-MS分析,进行了实施例7中SiD6的生成物P1及P3的分子量的分析。
将充填了1ml DIAION SEPABEADS HP20树脂(三菱化学)的色谱柱用10ml的50%丙酮洗涤后,用10ml的蒸馏水平衡。然后,将含有实施例7的SiD6的生成物的酶反应液200μl用蒸馏水分别定量到1ml后的产物加入色谱柱,用5ml的蒸馏水洗涤,除去蛋白质及盐类。其后,将用2ml的80%丙酮洗脱木脂素后的产物用蒸发器干燥。
将DIAIONHP-20树脂(三菱化学)1ml充填的色谱柱用50%丙酮5ml洗涤后,用水10ml平衡。将含有实施例7的松脂醇生成物P1的酶反应液加入色谱柱,用5ml水洗涤杂质后,用80%丙酮2ml洗脱反应生成物。用蒸发器干固洗脱液后,在含有1%甲酸的50%乙腈(100μl)中溶解,作为LC-MS分析样品。LC条件如下所示。
使用Develosil C30-UG-3色谱柱[野村化学(株)、3.0mm×150mm],流动相中A液使用含有10mM乙酸铵的水、B液使用100%乙腈。用10分钟的直线浓度梯度(A液70%:B液30%→A液30%:B液70%)洗脱,其后,用A液30%:B液70%进行5分钟等度洗脱。(流速:0.2ml/分钟)。
检测用光电二极管阵列检测器[SPD-M10A、株式会社岛津制作所]收集230-500nm的数据,测定A280nm的色谱。且在PDA检测器之后,连接TOF-MS检测器(LCMS-IT-TOF株式会社岛津制作所),进行分子量的测定。MS的测定条件,在阴性及阳性的两种模式下、测定分子量范围为100-1000Da、接口电压分别为4.5KV及一3.5KV。
在此条件下,松脂醇及松脂醇反应生成物P1在10.1分钟、7.9分钟分别被洗脱。且胡椒醇及胡椒醇生成物P3在13.3分钟、10.9分钟分别被洗脱。LC-MS分析的结果,P1为阳性模式时,提供m/z 375.13[M+H]+,为阴性模式时提供m/z 373.13[M+H]-的分子离子,推测为在松脂醇上附加了羟基。且P3为阳性模式时,提供m/z 373.12[M+H]+,为阴性模式时,提供m/z 371.11[M+H]-的分子离子,推测为在胡椒醇上附加了羟基。
由以上结果可知,来自芝麻的SiD6基因编码对松脂醇及胡椒醇具有羟基化活性的木脂素羟化酶。
(实施例9:SiD6的生成物的纯化及NMR分析)
为了鉴定松脂醇的羟基化生成物P1及P2、胡椒醇的羟基化生成物P3的羟基化位点,进行各自的纯化及NMR分析。对松脂醇反应液,将充填了100ml的DIAION SEPABEADS HP20树脂(三菱化学)的色谱柱用200ml的50%丙酮洗涤后,用500ml的蒸馏水平衡。之后,将含有实施例7的SiD6的生成物P1及P2的酶反应液100ml装入色谱柱,进一步用200ml的蒸馏水洗涤,以除去蛋白质。最后将用200ml的50%丙酮洗脱P1、P2的产物用蒸发器减压浓缩后,进行冷冻干燥。对胡椒醇羟基化生成物P3同样进行纯化。之后,将其用色谱柱:Develosil C30-UG-5(20×250mm,野村化学)、A液:蒸馏水,B液:90%乙腈,洗脱条件:松脂醇羟基化物(P1·P2):20%—70%B液(60min)、胡椒醇羟基化物(P3):60—100%B液(60min)、流速:6ml/min、检测波长:280nm进行分离纯化。回收生成的主峰的组分,制备冷冻干燥标准品。将其用NMR(BRUKER公司、750MHz)分析的结果,可如下鉴定。
P1:9—羟基松脂醇(洗脱时间31.0min组分):NMR:δppm(DMSO-d6);2.47(1H,dd),3.08(1H,t),3.62(1H,ddd),3.66(1H,t),3.76(6H,s),4.40(1H,d),5.30(1H,d),5.45(1H,s),6.74(2H,brs),6.75(2H,brs),6.89(2H,brs)。
P2:9,9’—二羟基松脂醇(洗脱时间22.9min组分):NMR:δppm(DMSO-d6);2.77(2H,d),3.76(6H,s),4.75(2H,d),5.39(2H,d),6.60(2H,d),6.73(2H,d),6.85(2H,dd),7.13(2H,d)。
对于P3,进行各信号的归属确认(图4)的结果,确认其为9-羟基胡椒醇(图5)。9—羟基胡椒醇是新型化合物。从芝麻素代谢物分析来看,本新型木脂素在生物体内代谢转换为儿茶酚型的木脂素,发挥抗氧化性[先行文献:Nakai,M.,et al.J.Agric.Food.Chem.51,1666-1670.(2003)]。
由以上结果可知,本酶是具有呋喃骈呋喃型木脂素的9位羟基化活性的酶(图6)。从松脂醇及胡椒醇的羟基化位置类推,与丁香脂素反应的反应物P4及P5,其9位或9,9’位也同样被羟基化。
本发明不限于上述实施方式,可在权利要求所示范围内作种种变更。即对于在权利要求所示范围内组合适宜变更的技术手段后所得到的实施方式,也包含于本发明的技术范围内。
如上所述,本发明所涉及的多肽及多核苷酸对木脂素的羟基化有用。且可表达地导入本发明所涉及的多核苷酸的转化体或细胞,在食品领域、各种工业领域中,在木脂素羟基化或生产使用该物质的产品上极为有用。因上述转化体为植物体时,可将植物体自身作为食品使用,所以,在农业领域等中也非常有用。
并且,通过将本发明所涉及的多肽及多核苷酸与本发明者发现的其他酶(合成胡椒醇及芝麻素的酶SiP189)组合,可确定特定的木脂素分子种的生产体系,其结果,可扩大特定的木脂素分子种的生产量。因此,本发明可广泛用于农业、食品产业、医药品产业及与与上述产业相关联的产业。