CN1886499A - 编码催化木脂素物生合成的酶的基因及其利用 - Google Patents

编码催化木脂素物生合成的酶的基因及其利用 Download PDF

Info

Publication number
CN1886499A
CN1886499A CNA200480028559XA CN200480028559A CN1886499A CN 1886499 A CN1886499 A CN 1886499A CN A200480028559X A CNA200480028559X A CN A200480028559XA CN 200480028559 A CN200480028559 A CN 200480028559A CN 1886499 A CN1886499 A CN 1886499A
Authority
CN
China
Prior art keywords
leu
gene
val
glu
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200480028559XA
Other languages
English (en)
Other versions
CN1886499B (zh
Inventor
小野荣一郎
田中良和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Suntory Holdings Ltd
Original Assignee
Suntory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suntory Ltd filed Critical Suntory Ltd
Publication of CN1886499A publication Critical patent/CN1886499A/zh
Application granted granted Critical
Publication of CN1886499B publication Critical patent/CN1886499B/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/181Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8243Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits involving biosynthetic or metabolic pathways, i.e. metabolic engineering, e.g. nicotine, caffeine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Cell Biology (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nutrition Science (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明提供催化从松脂醇向胡椒醇的反应及从胡椒醇向芝麻素的反应的酶、以及编码该酶的基因。本发明进一步提供含有编码上述酶的基因的载体及转化体、以及使用该转化体的蛋白质的生产方法。

Description

编码催化木脂素物生合成的酶的基因及其利用
技术领域
本发明涉及催化芝麻的胡椒醇及芝麻素生物合成的酶、编码该酶的基因以及该蛋白质和该基因的利用。
背景技术
一般为人所知的芝麻(Sesamum indicum)这种植物,属于胡麻科胡麻属(Sesamum)。芝麻的原产地是中非,是具有6000年左右历史的最古老的栽培油料作物,在全世界均有栽培。
芝麻种子的成分中含有约50%的脂质及约20%的蛋白质。芝麻种子中还含有维生素B1、B2及E等。芝麻种子中,作为脂质的主要成分,含有以油酸和亚油酸为主要构成要素的甘油三酯,特别是作为特征成分,还含有芝麻素、芝麻林酚素(Sesamolin)等总称为木脂素的植物的次级代谢产物。
已知此芝麻素具有多种生理活性,对胆固醇代谢、肝功能及免疫功能的改善很有效(例如,参考非专利文献1)。从芝麻种子或芝麻种子的芝麻粕中分离纯化芝麻素的方法已被实际应用(例如,参考专利文献1、2),且以芝麻素为主要成分,具有促进酒精分解作用等的肝功能活性增强剂也已被市场销售。另外,有报道认为芝麻素以外的芝麻木脂素(芝麻醇、芝麻林酚素等)也具有生理活性作用(例如,参考非专利文献2)。
关于木脂素的生物合成,在该领域有若干见解(例如,参考非专利文献3)。图1表示了一般为人所知的木脂素生物合成途径的模式图。木脂素以苯丙素(phenylpropanoid)化合物为起始物质合成,在植物中对植物的生物体防御机构起作用。如图1所示,松柏醇聚合合成的松脂醇是生物合成中最初的木脂素,从松脂醇再经各植物种特有的生物合成途径合成各种木脂素。
并且,有关芝麻素的生物合成如图1所示,胡椒醇合成酶催化(+)-松脂醇,通过一处形成甲二氧基氧桥(图中,用圆圈出的区域)的酶学作用合成胡椒醇。之后,通过芝麻素合成酶进一步在此胡椒醇的另一处形成甲二氧基氧桥,以合成芝麻素。而且,在使用芝麻种子的膜组分的实验中显示了,催化上述两反应的酶分别是2种不同的细胞色素P450(例如,参考非专利文献4)。
上述甲二氧基氧桥的形成,在生物碱、类黄酮的生物合成中屡屡可见。例如在花菱草(Eschscholtzia californica)培养细胞的膜组分中,由于(S)-金黄紫堇碱(scoulerine)及(S)-碎叶紫堇碱(cheilanthifoline)形成了甲二氧基氧桥,所以可知其存在着分别催化生成(S)-碎叶紫堇碱及(S)-刺罂粟碱(stylopine)的反应的细胞色素P450(例如,参考非专利文献5)。
有报道认为在鹰嘴豆(Cicer arietinum)的培养细胞的膜组分中,由于毛蕊异黄酮(calycosin)及红车轴草素(pratensein)形成了甲二氧基氧桥,所以分别存在着催化生物合成野靛黄素(pseudobaptigenin)及5’-羟基野靛黄素的反应的酶,其酶是细胞色素P450(例如,参考非专利文献6)。
并且,也有文献指出了Linum flavum的培养细胞中去氧鬼臼毒素(deoxypodophyllotoxin)6-羟化酶是细胞色素P450(例如,参考非专利文献7)。
另外,通过在(S)-四氢非洲防己胺(tetrahydrocolimbamine)中形成甲二氧基氧桥,合成(S)-四氢小蘖碱,所以参与生物合成苄基异喹啉生物碱小檗碱的酶仍然是细胞色素P450,已从Coptis japonica中克隆出编码此酶的基因(例如,参考非专利文献8)。
如上述催化种种反应的细胞色素P450,形成含有多种分子种的超家族,并通过其氨基酸序列的同源性分类。大致上,将同一性为40%或大于40%的作为家族,55%或大于55%的作为亚家族分类,家族用数字,亚家族用罗马字母表示(例如,参考非专利文献9)。各家族及其相互关系用图3的系统树表示。例如,与上述小檗碱的生物合成有关的细胞色素P450属于“CYP719”。
细胞色素P450在一个植物种中存在数百个分子种。但是,如图4所示,其中鉴定了生物化学机能或生理机能的细胞色素P450分子种只为少数。
作为来源于芝麻的细胞色素P450,虽与本发明涉及的芝麻素或胡椒醇的合成反应无直接关系,但编码p-香豆酸盐(coumarate)3-羟化酶的基因已被克隆(AY065995)。
在其他生物种中的细胞色素P450基因的克隆与其功能分析,有如下的一些报告。
例如,来源于矮牵牛的类黄酮3’,5’羟化酶(F3’,5’H)基因(例如,参考非专利文献10)、或类黄酮3’-羟化酶(F3’H:CYP75B)基因(例如,参考非专利文献11)、或编码来源于甘草的(2S)-二氢黄酮2-羟化酶(F2H:CYP93B1)(例如,参考非专利文献12)、2-羟基-异二氢黄酮合成酶(IFS:CYP93C2)(例如,参考非专利文献13)、或异黄酮2’-羟化酶(I2’H:CYP81E1)(例如,参考非专利文献14)的基因已被克隆。并且,编码黄酮合成酶II(FNSII,CYP93B3)(例如,参考非专利文献15)的基因,已使用I2’H从金鱼草中被克隆。
另外,属于CYP81家族的细胞色素P450的氨基酸序列在「http://drnelson.utmem.edu/CytochromeP450.html」中也有许多记载。其功能为,来源于菊芋(Helianthus tuberosus)的CYP81B1催化脂肪酸的羟化反应(非专利文献16),上述的I2’H属于CPY81E。
但是,此处列举的细胞色素P450不参与甲二氧基氧桥的形成。
与木脂素生物合成有关的酶的基因,报道了在连翘(Forsythiaintermedia)等中参与松脂醇合成的dirigent蛋白质(例如,参考非专利文献17、专利文献3)。还有关于连翘的松脂醇-落叶松脂素还原酶的基因(非专利文献18、专利文献3)及北美乔柏(Thuja plicata)的松脂醇-落叶松脂素还原酶的基因(非专利文献19)的报道。也有关于重组闭联异落叶松脂素(secoisolariciresinol)脱氢酶及其使用方法的报道(专利文献4、非专利文献20)。
[专利文献1]
日本特开2001-139579号公报(公开日:2001年5月22日)
[专利文献2]
日本特开平10-7676号公报(公开日:1998年1月13日)
[专利文献3]
日本特表2001-507931号公报(公表日:2001年6月19日)
[专利文献4]
日本特表2002-512790号公报(公表日:2002年5月8日)
[非专利文献1]
并木满夫著《芝麻其科学和功能性》日本丸善PLANET株式会社出版
[非专利文献2]
日本农艺化学会志76 805-813 2002
[非专利文献3]
Lignans:biosynthesis and function,Comprehensive natural productschemistry vol 1.640-713,1999
[非专利文献4]
Phytochemisity,49,387,1998
[非专利文献5]
Phytochemisity,30,2953,1991
[非专利文献6]
Phytochemisity,41,457,1996
[非专利文献7]
Planta,214,288,2001
[非专利文献8]
J Biol Chem.2003,May 5[Epub ahead of print].
[非专利文献9]
Nelson et al.Pharmacogenetics 6,1-42,1996
[非专利文献10]
Nature 366 276-279,1993
[非专利文献11]
Plant J.19,441-451,1999
[非专利文献12]
FEBS Letters,431,287,1998
[非专利文献13]
Plant Physiology,121,821,1999
[非专利文献14]
Biochemical and Biophysical Research Communications,251,67,1998
[非专利文献15]
Plant and Cell Physiology,40,1182,1999
[非专利文献16]
J.Biol.Chem.273,7260,1998
[非专利文献17]
Plant Physiol.123,453,2000
[非专利文献18]
J.Biol.Chem.271,29473,1996
[非专利文献19]
J.Biol.Chem.271,618,1999
[非专利文献20]
J.Biol.Chem.2001 Apr 20;276(16):12614-23,Epub 2001 Jan 18.
如上述,已证明芝麻素是有多种生理活性,具有各种改善效果的物质。但是,以往的芝麻素的生产方法,如上所述,只有从芝麻种子中获得的方法。因此,由于芝麻素的生产依赖于芝麻种子,其结果,对芝麻素的产量扩大及/或生产成本的削减造成了困难。
为解决上述问题,优选使用基因工程的方法。但是,对于已知的、在芝麻种子中参与芝麻素生物合成的上述2种细胞色素P450,这些酶还未被纯化,编码其酶的基因也未被克隆。而且,对于其他生物种中形成甲二氧基氧桥的上述细胞色素P450,这些酶也未被纯化,编码其酶的基因也未被克隆。另外,关于上述的其他的细胞色素P450,这些酶也未被纯化,编码其酶的基因也未被克隆。特别是已被克隆的其他生物种中木脂素的生物合成酶,不是参与芝麻素及/或胡椒醇合成的酶。
来源于芝麻种子的基因中,存在着一些被克隆的基因。例如,种子的贮存蛋白质球蛋白AF240004、AF240005、AF240006等、与脂质的合成及贮藏有关的基因油质蛋白(oleosin)(J Biochem.122:819-24.1997)、酰基载体蛋白不饱和酶(Plant Cell Physiol.1996 37,201-5)、油体固醇蛋白(sterolesin)(Plant Physiol.2002 128:1200-11)、脂肪酸不饱和酶[PlantSci.161 935-941(2001)]等。但这些均不是参与木脂素合成的基因。
所以,编码参与木脂素合成的酶的基因还不明了。因此,十分需要鉴定这样的酶及编码该酶的基因。
鉴于上述问题,本发明的目的在于鉴定催化由木脂素的羟基和甲基形成甲二氧基氧桥的反应的酶,优选鉴定催化由松脂醇向胡椒醇的反应及/或从胡椒醇向芝麻素的反应的酶的基因,并使用所得到的来源于芝麻的酶的基因,由重组生物等实现生产芝麻素及/或胡椒醇的方法。
发明内容
本发明者等为解决上述问题锐意研究的结果,从芝麻种子的cDNA文库中获得了芝麻种子细胞色素P450基因群(以下,称SiP基因),并使其在酵母中表达。并且,从其重组酵母中回收微粒体组分,使其与松脂醇或胡椒醇反应,通过HPLC分析检测是否分别生成了胡椒醇或芝麻素。其结果,鉴定了催化从松脂醇向胡椒醇反应、及从胡椒醇向芝麻素反应的蛋白质及其基因,使本发明得以完成。
即,本发明作为工业上有用的物质或方法,包含下述1)~21)的发明。
1)编码催化胡椒醇及/或芝麻素生物合成的蛋白质的基因(编码催化从松脂醇向胡椒醇、及/或从胡椒醇向芝麻素生物合成的蛋白质的基因)。
2)编码催化松脂醇及/或胡椒醇形成甲二氧基氧桥反应的蛋白质的基因。
3)编码催化胡椒醇及/或芝麻素生物合成的蛋白质,且含有以下(a)或(b)的基因:
(a)序列号1、64或78中所示的氨基酸序列;或
(b)在上述氨基酸序列中,1个或大于1个的氨基酸被取代、缺失、插入及/或附加了的氨基酸序列。
4)编码催化胡椒醇及/或芝麻素生物合成的蛋白质,且含有对于序列号1、64或78中所示的氨基酸序列具有50%或大于50%同源性的氨基酸的基因。
5)具有把序列号2、65或79中所示的碱基序列作为开放阅读框区域的基因。
6)编码催化胡椒醇及/或芝麻素生物合成的蛋白质,且在以下(a)~(c)中任一严谨条件下杂交的基因:
(a)含有序列号2、65或79中所示的碱基序列的多核苷酸;
(b)含有编码序列号1、64或78中所示氨基酸序列的碱基序列的多核苷酸;或
(c)上述多核苷酸的片段。
7)来源于芝麻的、上述1)~6)中任一项所述的基因。
8)由上述1)~7)中任一项所述的基因编码的蛋白质。
9)催化胡椒醇及/或芝麻素的生物合成,且含有以下(a)或(b)的蛋白质:
(a)序列号1、64或78中所示的氨基酸序列;或
(b)在上述氨基酸序列中,1个或大于1个的氨基酸被取代、缺失、插入及/或附加了的氨基酸序列。
10)识别上述8)或9)中所述蛋白质的抗体。
11)含有上述1)~7)中任一项所述基因的重组表达载体。
12)含有包含上述1)~7)中任一项所述基因的重组表达载体的转化体。
13)包含培养或繁殖上述12)中所述转化体的过程,及从该转化体中获得催化胡椒醇及/或芝麻素生物合成的蛋白质的过程的蛋白质的生产方法。
14)导入了上述1)~7)中任一项所述基因的植物或该植物的后代或其组织。
15)包含使用上述1)~7)中任一项所述的基因、或8)或9)中所述蛋白质的过程的胡椒醇及/或芝麻素的生产方法。
16)包含使用上述1)~7)中任一项所述基因的过程的生产高含量木脂素的转化体的方法。
17)包含使用上述1)~7)中任一项所述基因的过程的生产高含量胡椒醇及/或芝麻素的植物体的方法。
18)包含使用上述1)~7)中任一项所述基因的过程的生产低含量木脂素的转化体的方法。
19)包含使用上述1)~7)中任一项所述基因的过程的生产低含量胡椒醇及/或芝麻素的植物体的方法。
20)包含使用上述1)~7)中任一项所述基因的过程的培育芝麻的方法。
21)具备以含有上述1)~7)中任一项所述基因中至少一部分的碱基序列或其互补序列的多核苷酸为探针的基因检测工具。
本发明其他的目的、特征及优点,通过以下说明可十分明了。并且,本发明的益处从参考附图的以下说明中也会非常清楚。
附图说明
图1是表示芝麻木脂素一般合成途径的模式图。1:松柏醇;2:松脂醇;3:胡椒醇合成酶;4:胡椒醇;5:芝麻素合成酶;6:芝麻素。
图2a~图2f是表示测定了SiP189基因编码的酶活性的HPLC结果示意图。
图3是从细胞色素P450编码的氨基酸一级结构分析得到的树形图。
图4是表示与SiP189基因编码的蛋白质之间同源性分析的结果示意图。
图5是表示SiP189基因Southern分析的结果示意图。
图6a~图6d是表示测定了SrSiP189基因编码的蛋白质活性的HPLC分析结果示意图。
图7是表示转基因烟草中SiP基因表达分析的结果示意图。
图8a~图8d是表示植物细胞内SiP蛋白质的功能分析结果示意图。
图9A~图9H是表示对表达调节因子分析SiP189基因启动子区域的结果示意图。
图10是表示存在于SiP189基因启动子区域的表达调节因子的示意图。
图11A~图11H是表示对表达调节因子分析SrSiP189基因启动子区域的结果示意图。
图12A~图12C是表示SiP189基因与SrSiP基因之间同源性比较的示意图。
具体实施方式
以下说明本发明的实施方式,但本发明不限于以下所述。
(1)与本发明有关的基因及该基因编码的蛋白质的结构
与本发明有关的基因,编码催化胡椒醇及/或芝麻素生物合成的蛋白质。在此所述的“胡椒醇及/或芝麻素的生物合成”,是指由松脂醇向胡椒醇、及/或由胡椒醇向芝麻素的生物合成,更详细地说,是指松脂醇及/或胡椒醇形成甲二氧基氧桥的反应。本实施方式中,与本发明有关的基因,以编码催化来源于芝麻种子的胡椒醇及芝麻素生物合成的蛋白质的基因SiP189(序列号2所示的碱基序列)为例,进行说明。且本申请中,把开放阅读框区域看作从起始密码子到终止密码子的区域。
(1-1)与本发明有关的基因
在本说明书中使用时,术语“基因”与“多核苷酸”、“核酸”或“核酸分子”可交换使用,意指核苷酸的聚合物。在本说明书中使用时,术语“碱基序列”与“核酸序列”或“核苷酸序列”可交换使用,作为脱氧核糖核苷酸(省略为A、G、C及T)的序列表示。
本发明的基因,例如,可为编码序列号1、64或78中所示的氨基酸序列的基因。但是,具有通过复数个氨基酸附加、缺失及/或与其他的氨基酸取代而修饰的氨基酸序列的蛋白质,也可维持与原有蛋白质同样的酶活性。即在本发明中,只要是编码催化胡椒醇及芝麻素生物合成的蛋白质的基因,即包含(a)编码含有序列号1、64或78中所示的氨基酸序列的蛋白质的基因,(b)在上述氨基酸序列中,含有1个或大于1个的氨基酸被取代、缺失、插入及/或附加了的氨基酸序列、且编码具有催化胡椒醇及/或芝麻素生物合成作用的蛋白质的基因。此种基因,可例举为将序列号2、65或79中所示的碱基序列作为开放阅读框(ORF)的基因。且在后述实施例中也有说明,与本发明有关的基因可换说成编码细胞色素P450蛋白质的基因。
此处,“1个或大于1个的氨基酸被取代、缺失、插入及/或附加了”是指使用定位诱变法[Hashimoto-Gotoh,Gene 152,271-275(1995)其他]等公知的突变蛋白质制作法,可取代、缺失、插入及/或附加数量(优选为10个或小于10个,更优选为7个或小于7个,特别优选为5个或小于5个)的氨基酸被取代、缺失、插入及/或附加了。因此,编码上述(b)中蛋白质的基因是编码上述(a)中蛋白质的突变蛋白质的基因。并且在本说明书中使用时,“突变蛋白质”主要是指通过公知的突变蛋白质制作法人为导入的突变蛋白质,但也可指从天然分离纯化的同样的突变蛋白质。
并且,与本发明有关的基因不只是双链DNA,也可是构成它的有义链及反义链的各单链DNA或RNA。反义链可作为探针或反义药利用。DNA中包含使用克隆技术或化学合成技术或其组合得到的cDNA或基因组DNA等。而且,与本发明有关的基因还可包含编码上述(a)或(b)的氨基酸序列以外的、非翻译区域(UTR)的序列或载体序列(包含表达载体序列)等的序列。
另外与本发明有关的基因,对于序列号1、64或78中所示的氨基酸序列,是具有20%或大于20%、优选为50%或大于50%、特别优选为60%或大于60%、或70%或大于70%同源性的蛋白质,且包含编码催化胡椒醇及/或芝麻素生物合成的蛋白质的基因,相关基因还可用于木脂素量的控制或植物育种。并且,在本说明书中使用时,“同源性”是指氨基酸序列中相同序列所占的比例,此值越高,两者越为近缘关系。
同时,与本发明有关的基因,可以是含有序列号2、65或79中所示的碱基序列的多核苷酸,也可以是含有编码序列号1、64或78中所示氨基酸序列的碱基序列的多核苷酸,或这些多核苷酸的片段,还包含例如,对于含有编码6个或大于6个氨基酸的碱基序列(即18个碱基)的多核苷酸,编码在严谨条件下杂交、且催化胡椒醇及/或芝麻素生物合成的蛋白质的基因。上述“严谨条件”是指,在序列间至少有80%的同一性,优选至少有95%的同一性,最优选至少有97%的同一性时发生的杂交。具体地说,可例举为可在5×SSC、50℃的条件下杂交的条件。
上述的杂交可用J.Sambrook et al.Molecular Cloning,A LaboratoryManual,2d Ed.,Cold Spring Harbor Laboratory(1989)等记载的公知的方法进行。通常,温度越高,及/或盐浓度越低,严谨性越高(杂交越难)。且适宜的杂交温度因碱基序列或其碱基序列的长度不同而不同,例如,以含有编码6个氨基酸的18个碱基的DNA片段为探针时,优选50℃或小于50℃的温度。
通过上述杂交选择的基因,可例举为来自天然的基因[如,来源于植物的基因(例如,来源于苔藓类植物的基因)],但也可为来自植物以外的基因。另外,通过上述杂交选择的基因可以是cDNA,也可以是基因组DNA。
(1-2)与本发明有关的蛋白质
与本发明有关的蛋白质,最好是由上述(1-1)所述的与本发明有关的基因编码的蛋白质。只要是这样的蛋白质,就可催化由松脂醇向胡椒醇、或由胡椒醇向芝麻素的生物合成。且在本发明中,也包含催化松脂醇或胡椒醇形成甲二氧基氧桥反应的蛋白质。作为相关蛋白质,还可例举为具有上述(a)序列号1、64或78中所示氨基酸序列的蛋白质,或(b)在上述氨基酸序列中,含有1个或大于1个的氨基酸被取代、缺失、插入及/或附加了的氨基酸序列,且具有催化胡椒醇及/或芝麻素生物合成作用的蛋白质。
与本发明有关的蛋白质,可以是将上述(1-1)所述的与本发明有关的基因导入宿主细胞,并使其蛋白质在细胞内表达的状态,也可以是从细胞或组织等中分离纯化出来的状态。另外,与本发明有关的蛋白质还可以是与其他的蛋白质融合的蛋白质。特别是与本发明有关的蛋白质还可以是经化学合成的物质。
而且,与本发明有关的蛋白质,最好是氨基酸以肽键结合形成的多肽,但并不限于此,可以是包含多肽以外结构的复合蛋白质,也可以是包含附加多肽的蛋白质。多肽被附加时,例如,可为His、Myc、Flag等的种种表位(epitope)标记与本发明有关的蛋白质。
(2)与本发明有关的基因及蛋白质的获得方法
与本发明有关的基因及蛋白质的获得方法(生产方法)不受特别限定,其代表性方法可例举为以下所示的各种方法。
(2-1)基因的获得方法
与本发明有关的基因的获得方法,对于具有与生俱来的碱基序列的基因,如后述实施例具体所示,例如,可通过cDNA文库的筛选获得。
另外,获得与本发明有关的基因的方法,例如可使用PCR等扩增的方法。例如,与本发明有关的基因的cDNA序列中,以5’侧及3’侧的序列(或其互补序列)为基础设计引物,使用其引物以基因组DNA(或cDNA)等为模板进行PCR,由扩增两引物间的DNA区域,可获得大量含有与本发明有关基因的DNA片段。
并且,以基因序列信息为基础,使用公知的化学合成方法,也可合成具有所需序列的多核苷酸。
编码具有被修饰的氨基酸序列的酶的DNA,相对于具有与生俱来的碱基序列的DNA,可使用常用的定位诱变法或PCR法合成。例如,通过原有的cDNA或基因组DNA的限制性内切酶处理,得到应导入修饰的DNA片段,以此为模板,使用导入了所需突变的引物进行定位诱变法或PCR法,可得到导入了所需修饰的DNA片段。之后,只需将导入了此突变的DNA片段的DNA片段,与从编码目的酶的多核苷酸(DNA)中去除与此DNA片段对应的区域后的多核苷酸连接即可。或者,为获得编码含有短缩了的氨基酸序列的酶的DNA时,例如,通过由所需限制性内切酶切断,可获得编码比目的氨基酸序列长的氨基酸序列(例如,全长氨基酸序列)。所得DNA片段未编码目的氨基酸序列的全体时,只需合成包含不足部分的序列的DNA片段后连接即可。
另外,将所得基因用于大肠杆菌或酵母中的基因表达系统,使编码的蛋白质表达。通过测定此蛋白质的酶活性,可鉴定所得基因是编码催化从松脂醇向胡椒醇、或从胡椒醇向芝麻素生物合成的蛋白质的基因。而且,通过将该基因导入细胞内,可得到该基因的产物,即催化从松脂醇向胡椒醇的生物合成、或从胡椒醇向芝麻素生物合成的蛋白质。
或者使用相对于含有序列号1、64或78中所述氨基酸序列的蛋白质的抗体,也可克隆其他生物的胡椒醇及芝麻素合成酶基因。
(2-2)蛋白质的获得方法
获得与本发明有关的蛋白质的方法(生产方法),可例举为从表达与本发明有关的蛋白质的细胞、组织等中分离纯化的方法,但并不限于此。表达与本发明有关的蛋白质的细胞或组织,可以是自然发生型,例如也可以是感染了重组昆虫杆状病毒的细胞、组织。纯化方法无限定,可通过含有如上所述与本发明有关的基因的表达载体,培养、栽培或饲育被转化的宿主后,根据通常方法,例如过滤、离心分离、细胞破碎(细胞融解)、凝胶过滤层析法、离子交换色谱法等,从培养物中回收及/或纯化目的蛋白质。
另外获得与本发明有关的蛋白质的方法,还可例举为使用基因重组技术等方法。此时,例如可使用如下方法,将与本发明有关的基因整合到载体等后,用公知方法导入到宿主细胞,使其能表达,并纯化在细胞内经翻译后所得的上述蛋白质等。基因的导入(转化)或基因的表达等具体方法见后述。
或者,使用相对于含有序列号1、64或78中所述的氨基酸序列的蛋白质的抗体,也可得到胡椒醇及芝麻素合成酶的蛋白质。特别是使用此抗体,还可克隆催化其他生物的胡椒醇及芝麻素生物合成的蛋白质、及编码该蛋白质的基因。
同时,将外源基因导入宿主时,为使宿主及外源基因表达,而在宿主内整合了发挥作用的启动子的表达载体有各种各样,可根据目的适宜选择。纯化生成的蛋白质的方法,根据使用的宿主或目的蛋白质的性质不同而不同,但通过利用标记等,可较容易地纯化目的蛋白质。
对制作突变蛋白质的方法无特别限定。例如,可使用如下众所周知的突变蛋白质的制作法,如利用定位诱变法(Hashimoto-Gotoh,Gene 152,271-275(1995)其他)或PCR法在碱基序列导入点突变以制作突变蛋白质的方法,或通过插入转座子、制作突变株的方法等。还可使用上述方法,在编码上述(a)蛋白质的cDNA的碱基序列中,可通过加入使1个或大于1个的碱基被取代、缺失、插入及/或附加的改变,制作突变蛋白质。另外,突变蛋白质的制作,也可利用市场销售的试剂盒。
而且,与本发明有关的蛋白质,其获得方法不限于上述方法,例如,可使用市场销售的肽合成器等进行化学合成。作为其他实例,也可利用无细胞体系的蛋白质合成液[Proc.Natl.Acad.Sci.USA,78,5598-5602(1981)、J.Biol.Chem.、253,3753-3756(1978)等],由与本发明有关的基因合成与本发明有关的蛋白质。
(3)与本发明有关的抗体
与本发明有关的抗体,是以上述(1-2)中所述的与本发明有关的蛋白质[例如,上述(a)或(b)的蛋白质,或其片段]为抗原,通过公知的方法获得的抗体(多克隆抗体或单克隆抗体)。公知的方法例如可例举为[Harlow等的《Antibodies:A laboratory manual》美国纽约冷泉港实验室(Cold Spring Harbor Laboratory,New York(1988),岩崎等的《单克隆抗体杂交瘤与ELISA》、日本讲谈社(1991)]中所述的方法。所得抗体可用于与本发明有关的蛋白质的检测及/或测定等。
(4)与本发明有关的重组载体
与本发明有关的重组表达载体含有如上述(1-1)中所述的与本发明有关的基因[例如,编码上述(a)或(b)蛋白质的基因]。与本发明有关的重组表达载体,例如,可为插入了cDNA的重组表达载体。在重组表达载体的制作中,可使用质粒、噬菌体或粘粒等,但并不限于此。且重组表达载体的制作方法可使用公知的方法。
对载体无限定,可例举为在宿主细胞中能表达的载体。即对应于宿主细胞的种类,适宜选择确实可使基因表达的启动子序列,再使用将此启动子序列和与本发明有关的基因整合进质粒等中的表达载体即可。
为鉴定与本发明有关的基因是否导入了宿主细胞,且被编码的蛋白质在宿主细胞中是否确实进行了表达,可使用各种标记物。将含有标记物(例如,在使用的宿主细胞缺失的基因)和与本发明有关的基因的质粒等作为表达载体导入宿主细胞。在导入了此表达载体的宿主细胞中,根据标记物是否表达,可鉴定与本发明有关的基因的导入。或者,也可把与本发明有关的蛋白质作为融合蛋白质,使其在宿主细胞中表达。例如,也可使与本发明有关的蛋白质和来自Aequorea coerulescensBRANDT的绿色荧光蛋白质GFP(Green Fluorescent Protein)融合形成融合蛋白质,并使其表达后,将GFP作为标记物使用。
对上述宿主细胞无特别限定,可使用以往公知的各种细胞。具体地说,作为原核宿主,可使用细菌[例如,属于埃希氏菌属(Escherichia)的细菌(例如大肠杆菌(Escherichia coli))或芽孢杆菌属(Bacillus)的微生物(例如枯草芽孢杆菌(Bacillus subtilis))]等。真核生物宿主可使用低等真核生物[例如,真核微生物(例如,真菌的酵母或丝状菌)]。酵母,例如可为酵母属(Saccharomyces)微生物,[例如,啤酒酵母(Saccharomyces cerevisiae)]等,或丝状菌可例举为,曲霉属(Aspergillus)微生物[例如,米曲霉(Aspergillus oryzae)、黑曲霉(Aspergillus niger)]及青霉属(Penicillium)微生物。特别是可将动物细胞或植物细胞作为宿主细胞使用。植物细胞可利用胡麻科植物、禾本科植物等种种的植物细胞作为宿主细胞,动物细胞可利用小鼠、仓鼠、猴、人等的细胞系作为宿主细胞。而且,也可利用昆虫细胞(例如,蚕细胞或蚕的成虫自身)。
与本发明有关的重组表达载体,依赖于目的宿主细胞的种类,含有表达控制区域(例如,启动子、终止子及/或复制起点等)。作为细菌用的表达载体的启动子,可使用常用的启动子(例如,trc启动子、tac启动子、lac启动子等),酵母用启动子,例如可使用3-磷酸甘油醛脱氢酶(GAPDH)启动子、PH05启动子等,丝状菌用启动子,例如可使用淀粉酶启动子、trpC启动子等。且动物细胞宿主用启动子,可使用病毒性启动子(例如,SV40初期启动子、SV40后期启动子等)。表达载体的制作,可使用限制性内切梅及/或连接酶等根据常法进行。并且,通过表达载体的宿主的转化,也可根据通常方法进行。
将上述表达载体导入宿主细胞的方法,即转化方法,不受特别限制,可使用电穿孔法、磷酸钙法、脂质体法、DEAE葡聚糖法、显微注射法等公知的方法进行。
(5)与本发明有关的转化体
与本发明有关的转化体,是导入了上述(1-1)中记载的与本发明有关的基因[例如,编码上述(a)或(b)蛋白质的基因]的转化体。在此,“导入了基因”是指利用公知的基因操作技术,导入到目的细胞(宿主细胞)内。另外,于本说明书中使用时,术语“转化体”不只指细胞、组织或器官,生物个体也包含在内。
与本发明有关的转化体的制作方法(生产方法),可以是使用上述(4)中所述与本发明有关的重组表达载体的转化方法。且作为转化对象的生物也不受特别限制,可使用上述举例的各种微生物或植物。同时,如适宜选择启动子或载体,动物或昆虫也可作为转化的对象。
优选的实施形态中,可使用芝麻制作与本发明有关的转化体。芝麻转化体的制作方法,例如T.Asamizu:Transformation of sesame plants using MATvector system:introduction of fatty acid desaturase genes.Sesame Newsletter 16:22~25(2002)中所述的公知的方法。
并且,于本说明书中使用时,术语“转化体”还包含导入了与本发明有关的基因的植物、或与其具有同样特性的该植物的后代或其组织。
(6)与本发明有关的基因检测工具
与本发明有关的基因检测工具,具备作为探针的、含有与本发明有关的基因中至少一部分的碱基序列或其互补序列的多核苷酸。与本发明有关的基因检测工具,可用于各种条件下、与本发明有关的基因的表达方式的检测及/或测定等。
与本发明有关的基因检测工具,可例举为,将与本发明的基因特异性杂交的上述探针固定于基板(载体)上的DNA芯片。在本说明书中使用时,“DNA芯片”主要指,将合成的寡核苷酸用于探针的合成型DNA芯片,但将PCR产物等的cDNA作为探针使用的粘贴型DNA微阵列也包含于“DNA芯片”内。
在本发明中使用时,术语“寡核苷酸”是指核苷酸从数个至数十个结合的产物,可与“多核苷酸”交换使用。寡核苷酸可作为更长的多核苷酸的片段生成,也可被化学合成。
作为探针使用多核苷酸的碱基序列,可通过从cDNA序列中特定特异性配列的公知的方法[例如,SAGE(Serial Analysis of GeneExpression)法(Science 276:1268,1997;Cell 88:243,1997;Science 270:484,1995;Nature 389:300,1997;美国专利第5,695,937号)等]测定。
DNA芯片的制造可采用公知的方法。例如,使用合成寡核苷酸时,可通过组合使用照相技术(Photo Lithography)和固相法DNA合成技术,在基板上合成该寡核苷酸。同时,作为寡核苷酸使用cDNA时,可使用阵列机粘贴于基板上。
另外,与一般的DNA芯片相同,通过配置完全匹配探针(寡核苷酸)和在该完全匹配探针中,一个碱基被取代了的错配探针,也可更加提高基因的检测精度。而且,为同时检测不同的基因,还可制造将复数种寡核苷酸固定于同一基板上的DNA芯片。
(7)与本发明有关的基因及蛋白质等的利用方法(有效性)
本说明书中,主要叙述了有关生物合成芝麻的胡椒醇及/或芝麻素的酶,但本发明不只限于来源于芝麻的基因,还涉及生物合成胡椒醇及/或芝麻素的酶的利用。生物合成胡椒醇及/或芝麻素的酶的起源,可以是植物、动物或微生物,只要具有生物合成胡椒醇及/或芝麻素的酶活性,同样可用于木脂素的量的控制。特别是本发明涉及通过导入编码生物合成胡椒醇及/或芝麻素的酶的基因而得到的、使木脂素的量得到调节的植物、或其后代或其组织,其形态也可为切花形态。使用由本发明获得的编码生物合成胡椒醇及/或芝麻素的酶的基因时,可生成胡椒醇或芝麻素,也可抑制胡椒醇或芝麻素的生成。根据现有的技术水平,可在植物中导入基因,使其基因组成性或组织特异性表达,也可通过反义法、共抑制法及RNAi法等,抑制目的基因的表达。可转化的植物可例举为,芝麻、稻、连翘、烟草、拟南芥、百脉根、大麦、小麦、菜籽、马铃薯、番茄、杨树、香蕉、桉树、甘薯、黄豆、紫花苜蓿、羽扇豆、玉米、菜花、月季、菊花、香石竹、金鱼草、仙客来、兰花、洋桔梗、小苍兰、非洲菊、唐菖蒲、霞草、长寿花、百合、天竺葵、矮牵牛、蓝猪耳、郁金香等,但并不限于此。
而且,本发明提供蛋白质的生产方法,其包含培养、繁殖上述(5)中所述的转化体,并从该转化体中获得催化胡椒醇及/或芝麻素生物合成的蛋白质的过程。根据上述方法,可简便、大量地生产具有催化生物合成胡椒醇或芝麻素的反应活性的蛋白质。并且,本方法只要包含上述过程即可,对其他的具体条件(例如,宿主的种类、使用的材料、条件等)无特别限制,可适宜设定。
另外,与本发明有关的基因或与本发明有关的蛋白质,也可用于生物合成胡椒醇及/或芝麻素的、胡椒醇及/或芝麻素的生产方法。根据上述方法,可简便且大量地生产胡椒醇及/或芝麻素,还可用于含有胡椒醇及/或芝麻素的食品(特别是保健食品)或医药品等的制造。且,“使用基因或蛋白质”是指在体内、体外或来自体内等各种条件下使用基因或蛋白质。胡椒醇及/或芝麻素的生产方法,可例举为在植物细胞中导入上述基因,在所得转基因植物的生物体内生物合成胡椒醇及/或芝麻素的方法,在生物体外,使与本发明有关的蛋白质与胡椒醇或芝麻素的前体反应,生物合成胡椒醇及/或芝麻素的方法,或使用生物反应器等生产胡椒醇及/或芝麻素的方法等。因基因直接使用时不具有生物合成的酶活性,所以,优选以由该基因编码的蛋白质进行表达的状态使用。
同时,通过使用与本发明有关的基因,生产高含量木脂素的转化体或低含量木脂素的转化体的方法也包含于本发明。根据上述方法,可简便、容易地生产调节了木脂素含量的转化体,还可从转化体中提取木脂素,或将转化体自身作为食品、医药品或其前体物质进行利用。
并且,在本说明书中使用时,“高含量胡椒醇及/或芝麻素的植物体”是指胡椒醇及/或芝麻素含量多的植物体,“低含量胡椒醇及/或芝麻素的植物体”是指胡椒醇及/或芝麻素含量少的植物体。
与本发明有关的基因,也可用于培育芝麻的方法。根据此方法,例如,将与本发明有关的基因导入芝麻,可培育胡椒醇及/或芝麻素含量多的芝麻。所以,从相关的转基因芝麻的种子中,可提取胡椒醇或芝麻素含量多的脂质。
以下,根据附图显示实施例,进一步详细说明本发明的实施形态。当然,本发明不限于以下实施例,对于细部可有各种形态,不一一进行说明。特别是,本发明不限于上述实施形态,可在权利要求所示的范围内进行种种变更,对于适当组合各种已公开的技术方法所获得的实施形态,也包含于本发明的技术范围内。
实施例
以下,根据实施例详述本发明。在无特殊情况下,分子生物学的方法遵照Molecular Cloning(Sambrook等)。
〔实施例1:从连翘中配制木脂素〕
将干燥后的连翘叶60g置于3L水中煮沸30分钟后,使用滤纸(circle;300mm日本东京滤纸株式会社制)过滤提取液。使用蒸发器,在分注的滤液的溶剂体积减少后,冷冻干燥(30/N),得到提取物冷冻干燥样品(21.6837g)。
将此提取物冷冻干燥样品7g再溶解于100ml的水中,用超声波均化。将充填了离子交换树脂HP-20树脂(日本三菱化学公司制)400ml的色谱柱,用50%丙酮800ml清洗后,用2L水平衡。将上述均化后的样品使用色谱柱粗纯化。具体地说,在色谱柱中注入上述样品后,用800ml水清洗,用50%甲醇800ml一次洗脱,之后再用100%甲醇800ml二次洗脱。
上述一次洗脱样品及二次洗脱样品,用以下条件进行HPLC分析,确认了木脂素的存在。流动相,使用A液[0.1%三氟乙酸(TFA)]、和B液(0.1%TFA、90%乙腈),色谱柱,使用Develosil C30-UG-5(日本野村化学公司制、4.6mm×150mm)。用A60%、B40%的混合液平衡色谱柱(20分钟)后,使用A60%、B40%→A10%、B90%的直线浓度梯度,流速0.6ml/分钟洗脱15分钟,再用A10%、B90%洗脱10分钟。用吸收波长287nm检测出蛋白质,分离每1分钟的组分(粗分离分析)。使用SPD-10AV(日本岛津制作所制),对各组分,测定了从220nm~400nm的光谱,找到了具有木脂素特有的2个最大吸收波长(230nm及280nm)的物质。其结果显示,具有木脂素最大吸收波长的物质,主要包含于二次洗脱液中。
之后,为分离木脂素,用以下条件进行了分离(正式分离)。将二次洗脱液用蒸发器浓缩后,冷冻干燥(干重1.0325g)。将此提取物冷冻干燥样品1g利用超声波溶解于1ml的二甲基亚砜(DMSO)中后,再利用超声波溶解于6ml的B30%溶液中。将其溶解液通过1,5000rpm离心分离后,取其上清约6ml注入色谱柱[DevelosilODS-UG-15/30;C-18(日本野村化学公司制、50mm×500mm)]。流动相使用A液(0.05%TFA)、B液(0.05%TFA、90%乙腈)。用流速32ml/分钟,A70%、B30%平衡20分钟后,注入样品,用A70%、B30%→A10%、B90%的直线浓度梯度洗脱60分钟后,用A10%、B90%洗脱30分钟。在吸收波长280nm进行检测,分离每1分钟的洗脱液(32ml)(检测器:115UV detector.Gilson公司)。最后,得到了具有280nm吸收峰值的组分8个。将所得8个组分用蒸发器浓缩后,冷冻干燥。对于上述组分,使用与上述粗分离分析时同样的条件进行了HPLC分析。在显示了此8种木脂素特有吸收光谱的组分中,对被认为是单一木脂素的组分,通过1H NMR分析鉴定松脂醇。最后得到了49.7mg的松脂醇。
〔实施例2:芝麻种子的木脂素分析〕
从栽培中的芝麻蒴果中回收未成熟的芝麻种子,冷冻干燥后,用丙酮提取木脂素成分。丙酮提取液的配制方法如下所示。
将粉碎后的芝麻种子的冷冻干燥物(约100mg)溶解于1ml的丙酮中,得到丙酮提取液。将此丙酮提取液100μl干燥后,在20μl DMSO中再次溶解,加入80μl的含有0.1%TFA的50%乙腈。之后,将此溶液用Millex-LH过滤器(MILLIPORE公司制、0.45μm/4mm)过滤,作为HPLC分析用样品。对此样品进行HPLC分析的结果,确认了其中存在有与对照品(control)芝麻木脂素的胡椒醇(保留时间约12分钟)、芝麻素(保留时间约16分钟)及芝麻林酚素(sesamolin)(保留时间约18分钟)的保留时间一致的木脂素。
进一步将芝麻种子按从小到大的成长阶段分为4阶段。
阶段1:种子蒴果为1.5cm或小于1.5cm
阶段2:种子蒴果为1.5~2cm、
阶段3:种子蒴果为2cm或大于2cm,蒴果色为黄绿色
阶段4:种子蒴果为2cm或大于2cm,蒴果色为深绿色。
将这些种子使用上述条件同样进行HPLC分析的结果,确认了在阶段3及阶段4中,有胡椒醇、芝麻素及芝麻林酚素的积累。
以上结果显示,在本实施例中使用的芝麻品种中,存在生成胡椒醇及芝麻素的酶、以及编码该酶的基因。
〔实施例3:芝麻cDNA文库的构建〕
从实施例2中使用的芝麻种子中,按照制造业者推荐的方法,使用RNeasy Plant Mini Kit(Qiagen公司制),提取total RNA,之后使用OLIGO TEX-MAG mRNA纯化试剂盒(日本TaKaRa公司制),得到了polyA(+)RNA 5μg。以此polyA(+)RNA为模板,按照制造业者推荐的方法,使用ZAP Express cDNA Synthesis Kitand ZAP Express cDNA Gigapack3 Gold Cloning Kit(Stratagene公司制),构建了cDNA文库。构建的文库为1×107pfu/ml。
〔实施例4:来自芝麻的木脂素生物合成酶基因的克隆〕
将基因组序列已全被测定的拟南芥的细胞色素P450基因的序列作为探针使用,筛选了上述cDNA文库约30万pfu。
具体地说,把拟南芥细胞色素P450基因群以一级序列为基础系统分类(参照图3),把含有CYP90A、CYP72B、CYP71B、CYP84A、CYP96A、CYP710A、CYP86A、CYP74、CYP75B、CYP79F、CYP81D、CYP705A、及CYP83A的13种拟南芥细胞色素P450基因作为筛选芝麻种子文库的探针使用。通过使用序列号5~30的引物进行扩增,在探针内导入了DIG标记。PCR条件如下所示。使用RNeasyPlant Mini Kit(Qiagen公司制),从拟南芥中提取total RNA后,以total RNA 1μg为模板进行逆转录反应,得到cDNA。根据制造业者推荐的条件,利用SuperScriptTM First-Strand Synthesis System forRT-PCR(Invitrogen公司)进行了cDNA合成。PCR反应液(50μl)含有拟南芥的基因组DNA 1μl、1×Taq buffer(TaKaRa)、0.2mM dNTPs、引物(序列号5~30分别为0.4pmol/μl)、及rTaq polymerase 2.5U。94℃反应5分钟后,进行了94℃ 1分钟、53℃ 1分钟、72℃ 2分钟的反应28个循环。在探针中导入DIG标记时,也用与PCR相同的条件进行。筛选及阳性克隆的检测,使用DIG-DNA标记&诊断试剂盒(Detection Kit)(Roche公司制)进行。
以制造业者推荐的方法为基本,在下述低严谨杂交条件下,进行阳性克隆的检测。即,使用杂交缓冲液[含有5×SSC、30%甲酰胺、50mM磷酸钠缓冲液(pH 7.0)、1%SDS、2%Bloking试剂(Roche公司制)、0.1%十二烷基肌氨酸、80μg/ml鲑鱼精子DNA],在37℃下进行2小时预杂交后,加入由DIG标记了的混合探针,再杂交一夜。将膜置于含有1%SDS的5×SSC洗涤液中,58℃下清洗1小时。
二次筛选后,得到了独立的96个阳性克隆。之后使用cDNA文库合成试剂盒制造业者推荐的方法,将此96个克隆插入到pBK-CMV质粒(Stratagene公司制),将插入区域5’末端及3’末端的核苷酸序列分别使用M13 RV引物及M13 M4(-20)引物确定。其结果,46个克隆具有类似细胞色素P450的序列。并测定了插入区域的全核苷酸序列。其结果,将所得克隆分类成SiP168、SiP189、SiP236、SiP249、及SiP288的独立的5种P450同源基因(Sesamum indicum P450;SiP)。然后,将从芝麻叶及种子配制的RNA逆转录后所得的cDNA用于模板,使用此5种SiP基因的特异性引物(序列号31~40),进行了RT-PCR。由其结果可知,此5种SiP基因在种子中进行了表达。且在上述RT-PCR中使用的PCR反应液(25μl),含有各cDNA 1μl、1×Ex-Taq buffer(日本TaKaRa公司制)、0.2mM dNTPs、引物各0.2pmol/μl、及Ex-Taq polymerase1.25U。94℃反应3分钟后,进行了94℃ 1分钟、53℃ 1分钟、72℃ 2分钟的反应26个循环。为比较表达量,芝麻内部标准基因采用了Ribosomal 18 SRNA(AJ236041)。扩增引物使用含有序列号3及4的引物。
〔实施例5:含有SiP基因表达载体的转化体的制作〕
上述5种Sip基因中,SiP249(pSPB2031)及SiP288(pSPB2034)编码全部的开放阅读框(ORF)(序列号53~56)。把含有cDNA在内、用BamHI及XhoI酶切pSPB2031后所得的约1.8kb的DNA片段,插入到酵母表达载体pYE22m(Holton,T.A et al.,Nature 366,276-279.1993)的BamHI位点及SalI位点,得到了pSPB2046。酵母表达载体pYE22m的多克隆位点,夹在3-磷酸甘油醛脱氢酶(glyceraldehyde-3-phosphatedehydrogenase)基因(GAPDH)启动子和GAPD H终止子之间,插入到此多克隆位点的插入片段,在酵母中,GAPDH启动子的控制下组成性表达。且与此载体有关的选择标记是色氨酸。同时,将含有cDNA在内的、通过BamHI及XhoI酶切pSPB2034后所得的约1.8kb DNA片段,插入到酵母表达载体pYE22m的BamHI位点及SalI位点,得到了pSPB2047。之后,使用2种酵母表达载体,根据通常方法转化酵母INVsc株(Invitrogen公司制),分别得到了INVsc/pYE22m/SiP249及INVsc/pYE22m/SiP288。
另外,因SiP168、189、236的开放阅读框不完全,所以按照制造业者推荐的方法,使用GeneRacer试剂盒(Invitrogen公司制)扩增5’区域,获得了含有完全开放阅读框的序列(序列号1~2、57~60)。扩增用引物,使用含有序列号41~46的引物。
为克隆3种SiP基因的全长开放阅读框,使用附加了以下限制酶切位点的引物,以来源于芝麻的cDNA为模板,进行了PCR扩增。PCR条件如下所示。PCR反应液(50μl)含有来源于模板芝麻种子的cDNA 1μl、1×KOD plus buffer(日本TOYOBO公司制)、0.2mM dNTPs、引物(序列号47~52)各0.4pmol/μl、1mM MgSO4、KOD plus DNA polymerase 1U。94℃反应5分钟后,进行了94℃ 1分钟、55℃ 1分钟、72℃ 2分钟的反应30个循环。将含有全长SiP的此扩增片段,插入到pCR-blunt II TOPO载体(Invitrogen公司制)的多克隆位点,得至了TOPO-SiP168(pSPB2064)、TOPO-SiP189(pSPB2055)、及TOPO-SiP236(pSPB2048)。
酶切扩增pSPB2064、pSPB2055、及pSPB2048时使用的附加在引物上的限制酶切位点后,获得含有cDNA在内的约1.5kb的DNA片段,将其与用BamHI及SalI酶切pYE22m载体后得到的约8.3kb DNA片段连接,得到了pYE22m/SiP168(pSPB2052)、pYE22m/SiP189(pSPB2053)、及pYE22m/SiP236(pSPB2049)。
之后,使用此3种酵母表达载体,转化酵母INVsc株(Invitrogen社製),得到了INVsc/pYE22m/SiP168、INVsc/pYE22m/SiP189、及INVsc/pYE22m/SiP236。
〔实施例6:在转化体中芝麻木脂素的生物合成〕
将上述INVsc/pYE22m/SiP249、INVsc/pYE22m/SiP288、和INVsc/pYE22m/SiP168、INVsc/pYE22m/SiP189、及INVsc/pYE22m/SiP236置于具有以下组成的YNBDglc培养基400mL(0.67%Yeast Nitrogen Base、2%Glucose、20mg/L除色氨酸以外的各种氨基酸)中,30℃、培养36小时。根据公知的超离心分离法(Holton,T.A et al.,Nature 366,276-279.1993),从上述转基因酵母培养液中回收了微粒体组分。
将微粒体沉淀,悬浮于悬浮缓冲液[0.1M磷酸钾缓冲液(pH7.4)、20%甘油、0.3μl/ml巯基乙醇]1ml中,得到了微粒体溶液。在此微粒体溶液240μl中,加入1M磷酸钾缓冲液(pH7.4)30μl、50mM NADPH6μl、267μM松脂醇或胡椒醇24μl,于30℃反应1小时。在此酶反应液中,等量加入含有0.1%TFA的100%乙腈(最终浓度为50%的乙腈溶液)。之后,离心分离此溶液(15000rpm、3分钟、4℃),将其上清150μl使用Millex-LH过滤器(MILLIPORE公司制、0.45μm/4mm)纯化,用与实施例1的粗分离分析同样的条件进行了HPLC分析。
对于INVsc/pYE22m/SiP189进行的HPLC分析的结果,如下所示。松脂醇[图2(a):保留时间约8分]在INVsc/pYE22m/SiP189中,变成了保留时间分别约为12分钟及约为16分钟、具有类似新型木脂素的吸收光谱的2个生成物[图2(b)]。特别是,胡椒醇[图2(d):保留时间约12分钟],通过INVsc/pYE22m/SiP189,变成了保留时间约为16分钟的、具有类似新型木脂素的吸收光谱的生成物[图2(e)]。这些物质,从保留时间考虑,分别应为胡椒醇(保留时间约为12分钟)及芝麻素(保留时间约为16分钟)。
之后,对此2个峰值(保留时间约12分钟和约16分钟),通过LC-MS/MS分析(LC为Waters 2790,Waters公司制、MS为QUATRO micro,Micro MS公司制),比较分子量及片段类型时,与分子量对照品一致。因此,可知通过SiP189的2个生成物,是胡椒醇及芝麻素。LC-MS/MS分析的条件如下所示。LC,使用Develosil C30-UG-5(日本野村化学公司制、2.0×50mm),流动相A液使用H2O、B液甲醇、C液10mM CH3COONH4,洗脱使用10%C液,用流速为0.25ml/min.进行。在此条件下,胡椒醇在8.4分钟、芝麻素在10.1分钟时被检测出。MS用测定模式POSITIVE进行。由此可知,SiP189编码了由松脂醇经过胡椒醇合成芝麻素的酶。另外,曾认为合成从松脂醇到胡椒醇、从胡椒醇到芝麻素的反应是由不同的酶催化的,但结果证明了,用本发明得到的基因编码的单一的酶催化双方的反应。
而且,从使用上述酶反应液中不加NADPH的反应系统分析的结果,可知INVsc/pYE22m/SiP189的胡椒醇的生成活性依赖于NADPH[图2(b)·(c)]。此现象在芝麻素的生成活性上也同样[图2(e)·(f)]。另外,与NADPH存在时相比,不存在NADPH时,胡椒醇的生成活性和芝麻素的生成活性分别减少到约14%和约18%。
之后,将INVsc/pYE22m/SiP189的微粒体组分通过一氧化碳还原后,使用分光光度计(日本日立制作所制U-3000PSpectrophotometer)测定了吸收光谱。其结果,此微粒体组分与对照转基因酵母INVsc/pYE22m比较,显示了450nm时的吸收。由此可知,INVsc/pYE22m/SiP189的微粒体组分中,生成了细胞色素P450蛋白质。
如实施例2中所示,从分离成生长阶段不同的4个阶段的芝麻种子中,使用与实施例2同样的方法提取RNA,并使用扩增SiP189的序列号49和50的Primer Set及扩增Si18SrRNA的序列号3和4的Primer Set,进行了RT-PCR。PCR反应液(25μl)含有各cDNA 1μl、1×Ex-Taq buffer(TaKaRa公司制)、0.2mM dNTPs、引物各0.2pmol/μl、Ex-Taq polymerase  1.25U。94℃反应3分钟后,进行94℃ 1分钟、53℃ 1分钟、72℃ 2分钟的反应26个循环。其结果,在种子中芝麻素的显著积累的种子阶段4中,确认了SiP189呈高表达。从依赖于生长阶段的木脂素的积累、与具有生成活性的SiP189基因表达的时期一致上,可显示出芝麻种子内生成胡椒醇及芝麻素的酶基因是SiP189。
以上结果显示出,SiP189基因编码催化从松脂醇到胡椒醇、及从胡椒醇到芝麻素的生物合成反应的细胞色素P450。图3中、SiP189用箭头表示。由图3可知,SiP189属于细胞色素P450超家族的CYP81家族。
通过利用本基因,使用芝麻或其他的植物或生物,或使用生物反应器等系统,可合成芝麻素及胡椒醇。
〔实施例7:栽培种芝麻Sesamum indicum中SiP189基因的基因组分析〕
为明确S.indicum基因组内SiP189基因的拷贝数,进行了基因组Southern分析。
按照制造业者推荐的方法,使用Nucleon Phytopure for PlantExtraction Kit(Amersham公司制),从S.indicum的叶(真濑金品种)中提取了基因组DNA。将提取的基因组DNA10μg,分别用EcoRI、NcoI、及XbaI的3种限制内切酶完全酶切,再通过琼脂糖凝胶电泳分离基因组DNA。使用0.25M HCl,将琼脂糖凝胶加水分解15分钟,然后使用含有1.5M NaCl和0.5MNaOH的溶液进行30分钟变性反应,再使用含有1.5M NaCl和Tris-HCl(pH 7.5)的溶液进行中和。之后,在20×SSC中,将基因组DNA转录到膜上(Hybribond-N、Amersham公司制)。将转录到膜上的基因组DNA通过UV照射,使其结合到膜上。将此膜置于含有7%SDS、50%甲酰胺、5×SSC、2%封闭液(blocking reagent)、0.1%十二烷基肌氨酸、及50mM磷酸钠缓冲液(pH 7.0)的杂交缓冲液(高SDS缓冲液、Roche公司)中,42℃预杂交1小时。
在杂交探针中,使用了从SiP189 cDNA起始蛋氨酸位点开始的、约900bp的ORF区域。将此区域使用序列号61(Bam-SST-FW2)的引物及序列号62(SiP189-Nco-RV)的引物,通过PCR,导入了DIG标记。PCR反应液含有包含SiP189 cDNA的质粒(pSPB2055)1ng、1×PCR缓冲液、1×DIG-dNTP mixture(PCR DIG Labeling Mix、Roche公司)、0.2pmol/μl各引物、及rTaq polymerase 1U(日本TAKARA BIO公司制)。PCR反应用95℃ 30秒、53℃ 30秒、72℃ 1分钟的反应、30个循环的条件进行。
将使用葡聚糖凝胶G(Sephadex G)-50 Quick Spin Columns(Boehringer公司制)纯化的PCR产物热变性后,立即置于冰上,并将其作为杂交探针,加入到预杂交液中10μl,42℃温育一夜。
在含有0.1%SDS的0.2×SSC溶液中,用65℃ 30分钟的条件,洗涤膜2次(高严谨杂交条件)。根据DIG应用手册(Roche公司制),使用DIG-标记&诊断试剂盒(Roche公司制)获得杂交信号。
检测结果如图5所示。如图5所示,在上述3种限制性内切酶处理中,SiP189基因均以单一扩增带被检测出。其结果显示,S.indicum基因组中SiP189作为单一基因存在,而不存在与SiP189同源性高的基因。也就是说,在芝麻植物中,生成胡椒醇及芝麻素的活性是由SiP189产生的。
〔实施例8:从非洲芝麻Sesamum radiatum中分离类似SiP189的基因〕
非洲芝麻Sesamum radiatum是非洲现存的芝麻植物,通过细胞遗传学分析,染色体数2n=64,与栽培芝麻(S.indicum)(2n=26)是细胞遗传学上不同的系统(参考文献、并木满夫、小林贞作《芝麻的科学》日本朝仓书店)。但是,有关于非洲芝麻种子中木脂素含量分析的报道,证实了其有芝麻素的积累(参考文献、Bedigian,D.等人,Biochemical Systematics and Ecology 13,133-139.1985)。因此,非洲芝麻的基因组中,应存在编码与栽培芝麻SiP189对应的酶的基因(SrSiP189)。而且,期望非洲芝麻中具有的基因(SrSiP189),是与SiP189序列同源性高的基因。
从非洲芝麻的种子中,与实施例4同法配制了cDNA。以此cDNA 1μl为模板,把[序列号61(Bam-SST-FW2)及序列号63(GR-SST-RV1)]作为引物使用,与实施例4同法进行了RT-PCR反应。以SiP189的序列为基础,设计上述引物,以扩增可含有全长ORF的片段。RT-PCR的结果,得到了认为是含有SrSiP189的约1.5kb的扩增片段。将此片段插入到pCR-blunt IITOPO载体(Invitrogen公司制),获得了pSPB2068。确定了插入了片段的核苷酸序列。其结果,与来源于S.indicum的SiP189比较,在DNA水平上显示了96%的序列同一性,在氨基酸水平上显示了95%的序列同一性(序列号64表示了SrSiP189的氨基酸序列,序列号65表示了SrSiP189的核苷酸序列)。根据实施例4,使用前述的引物(序列号61及序列号63),以从S.radiatum种子及叶中配制的cDNA为模板,进行了RT-PCR。从结果可知,SrSiP189的表达在种子是高表达,而在叶中则几乎不表达。由此RT-PCR的表达分析,可显示出SrSiP189在种子中发挥了作用。
〔实施例9:非洲芝麻Sesamum radiatum中SrSiP189基因的功能分析〕
为证明SrSiP189具有的生物化学的功能,在酵母中使重组SrSiP189蛋白质表达,并检测了此重组SrSiP189蛋白质所具有的木脂素生物合成活性。首先,将用限制性内切酶BamHI及XhoI酶切pSPB2068后所得到的、含有cDNA在内、约1.5kb的全长SrSiP189的片段,插入到酵母表达载体pYE22m的BamHI位点及SalI位点,得到了pSPB2069。与实施例6同法,进行了转基因酵母的微粒体配制及木脂素生物合成活性的测定。图6显示了通过HPLC分析的测定结果。如图6所示,重组SrSiP189蛋白质,与来源于S.indicum的SiP189同样,依存于NADPH,具有从松脂醇向胡椒醇变换的活性及从胡椒醇向芝麻素变换的活性[图6(a)及图6(b)]。在不含有NADPH的酶反应液中,胡椒醇的生成活性降低到16.9%,芝麻素的生成活性降低到8.4%[图6(c)及图6(d)]。由上可证实,SrSiP189在S.radiatum中,是SiP189的counterpart基因。
从以上结果可证实,持有类似SiP189的序列的基因超越了种而存在,此基因编码具有从松脂醇向胡椒醇变换的活性、及从胡椒醇向芝麻素变换的活性的酶。
〔实施例10:植物细胞中SiP189蛋白质的功能分析〕
为明确植物细胞中SiP189蛋白质的生物化学功能,使用SiP189基因转化了烟草(N.tabaccum)。
将含有SiP189的pSPB2055用BamHI及XhoI酶切,得到了含有SiP189的ORF的约1.5kb的DNA片段。将此片段与植物转化用双元载体pSPB176的BamHI位点及SalI位点联接,得到了双元载体pSPB2057。pSPB176的多克隆位点,在CaMV35S启动子和NOS终止子之间,插入到此位点的插入片段,在植物细胞内、CaMV35S启动子的控制下,组成性超表达。
之后,利用公知的方法[下西等、新·生物化学实验入门3.日本化学同人(122~124页)],使用pSPB2057转化农杆菌(菌株:Aglo),使具有pSPB2057的转化体农杆菌感染烟草叶盘。
从所得到的转化体13系统的叶中,使用与实施例2同样的方法配制cDNA,使用含有序列号49及序列号50中所示的碱基序列的引物,按照与实施例4同样的方法,进行了RT-PCR。将作为内部标准基因的烟草的泛素基因(NtUBQ存取号:U66264),使用含有序列号66及序列号67中所示的核苷酸序列的引物(分别为NtUBQ-FW及NtUBQ-RW)进行了扩增。其结果,在系统6、系统7及系统12中,鉴定了高表达的SiP189基因(图7)。
以下的操作在冰上或4℃下进行。将转化体(系统6、系统7及系统12)、以及非转化体的叶约15g,用在液氮中的研钵粉碎,溶解于30ml的均质缓冲液(0.1M磷酸钾缓冲液,pH 7.0、0.5M甘露糖醇、5mM EDTA、42mM巯基乙醇、50mM抗坏血酸钠、0.1%BSA、1mM PMSF、1%PVPP)中。
将粉碎溶液用10,000×g离心分离20分钟后所得的上清,用Miller Cross过滤。将此过滤液用100,000×g超离心分离90分钟后,得到粗提取微粒体组分。使用此微粒体组分(240μl),按照与实施例4同样的方法,与胡椒醇进行酶反应,用HPLC分析生成物。
HPLC分析的结果,在超表达SiP189的、来源于烟草的微粒体中,观察到了具有280nm吸收波长、保留时间约为17分钟的峰。此峰在非转化体中未观察到,且依存于酶反应液中存在的NADPH。因为此峰值与芝麻素标准品的保留时间一致,所以SiP189作为植物细胞内具有芝麻素生成活性的蛋白质发挥作用(图8)。
〔实施例11:SiP189基因表达调节区域的鉴定〕
为获得有关SiP189基因的转录调节的结论,分离SiP189基因的5’-非编码区域,测定序列,且进行了分析。使用λBlueSTARTM Vector system(NOVAGEN公司制),从芝麻(S.indicum)的基因组DNA中,制作了基因组文库。
将芝麻基因组DNA 200μg用限制性内切酶Sau3AI酶切,使片段长度约为20kb,之后,在10℃下、25000rpm、进行蔗糖密度梯度离心分离(10%~40%)24小时(SW28rotor、Beckman公司制)。将离心分离后的样品,使用AUTOMATIC LIQUID CHARGER(Advantec公司制)及Micro Tube Pump(EYELA公司制),按每1ml分离。对于分离了的样品,通过脉冲场凝胶电泳(Pulsed-field Gelelectrophoresis),确认了片段的长度。脉冲场凝胶电泳电泳使用含有1%Agarose NA(Amersham bioscience公司制)、0.5×TBE的凝胶,在0.5×TBE的缓冲液内,用120°/1秒-1秒6V/cm的条件下进行(CHEF MAPPER、Invitrogen公司制)。使用包含此具有约20kb平均片段长度的片段的组分,按照制造业者推荐的方法,制作了基因组文库。制作的文库具有1.5×106pfu/500μl的效价。将通过含有序列号68及序列号69中所示的碱基序列的引物(分别为SiP189-bam-FW及SiP189-nco-RV)扩增了的SiP189基因的约850bp ORF区域用作探针,筛选此基因组文库(500,000克隆)。
按照制造业者推荐的方法,使用Alka Phos的直接标记和检测系统(Direct Labeling and Detection system)(Amersham bioscience公司制),进行探针的标记及检测。杂交的条件如下所示。
探针:5ng/ml杂化作用缓冲液
预杂交:55℃1小时
杂交:55℃一夜
洗涤:55℃30分钟2次。
筛选3次后,分离9种阳性克隆,从其中得到了插入物长度约为12kb的gSiP189-#6。
之后,使用含有序列号68及序列号69中所示的核苷酸序列的引物、噬菌体臂引物STAR-LF1(序列号70)及STAR-LR1(序列号71),进行PCR,鉴定了gSiP189-#6内探针的插入方向及位置关系。
其结果,PCR分析显示了gSiP189-#6包含5kb或大于5kb的SiP189 5’非编码区域。因此,对此gSiP189-#6的全部碱基进行了序列测定。
以gSiP189-#6为模板,通过LA-PCR,扩增了插入片段。LA-PCR反应液含有阳性克隆SM缓冲悬浮液1μl、1×LA缓冲液(日本TaKaRa公司制)、各引物50pmol、0.4mM dNTP、2mM MgCl2、2.5单位的LA-Taq聚合酶。96℃反应5分钟后,进行98℃ 10秒、55℃ 10秒、68℃10分钟的反应30个循环,最后用72℃延伸15分钟。
将所得扩增片段物理式切割后,分离具有约1~2kb范围长度的DNA片段,补平这些片段的末端。将补平了末端的片段插入到pUC118(日本TaKaRa公司制)的HincII位点,制作了ShotGun文库。此文库具有2.8×106cfu/μl的效价。
使用此来源于gSiP189-#6的Shot Gun文库,利用电穿孔法,转化大肠杆菌DH10B株(Invitrogen公司制),随机拾取192个菌落,使用Templi Phi DNA测序模板放大试剂盒(Sequencing Template Amplification kit)(Amersham bioscience公司制),配制了DNA。使用DYEnamic ET染料终止子试剂盒(dye terminator kit)(Amersham Bioscience公司制),将配制的DNA通过M13-47(F)引物(序列号72)及RV-M(R)引物(序列号73)扩增。
将此扩增产物使用Clean SEQ(Agecourt公司制)纯化,通过Mega BASE4000(Amersham Bioscience公司制)测定序列。将所得序列数据通过PHRAP(CAP4)装配,得到了含有从SiP189基因的起始蛋氨酸位点开始、上游约13kb序列的邻近序列。
为鉴定此SiP189基因5’区域的调节cis-因子,对从SiP189基因的起始蛋氨酸位点开始上游的约3kb的序列(序列号74),进行了PLACE分析( http://www.dna.af frc.go.jp/PLACE/)。PLACE分析的结果显示了,从SiP189基因的起始蛋氨酸位点开始、上游约3kb的范围内特定的转录因子家族的结合位点及特定的信号应答的调节cis-因子多数已被鉴定,这些会影响SiP189基因的表达(图9及10)。
之后,分离了合成胡椒醇及芝麻素的、来源于非洲芝麻的酶的基因SrSiP189基因的表达调节区域。以非洲芝麻基因组DNA为模板,使用含有序列号75及序列号76中所示的碱基序列的引物(分别为gSST-FW1及gSST-RV2),进行了PCR扩增。根据序列号74中所示的SiP189的基因组序列,设计了这些引物。
反应溶液包含基因组DNA 1μl(50ng)、1×Ex-Taq buffer(TakaRa公司制)、0.2mM dNTPs、引物各0.2pmol/μl、Ex-Taq polymerase1.25U。94℃反应5分钟后,进行94℃ 1分钟、55℃ 1分钟、72℃ 4分钟的反应30个循环,最后72℃延伸4分钟。将所得扩增片段进行电泳,得到了约3kb的片段。将所得片段按照制造业者推荐的方法,插入到pCR-TOPO-XL vector(Invitrogen公司制)的多克隆位点上,得到了pSPB2664。将插入到pSPB2664的片段的全核苷酸序列通过引物走查法(primer walking法)测定。其结果,获得了含有SrSiP189基因的调节cis-因子、基因组SrSiP189基因5’侧的约2.8kb的片段(序列号77)。与SiP189基因同样进行PLACE分析的结果,大量鉴定了应答特定的转录因子家族的结合位点及特异性信号的因子(图11)。
在来源于栽培芝麻(S.indicum)的SiP189基因、与来源于非洲芝麻(S.radiatum)的SrSiP189基因之间,使用Clustal-W分析(Mac Vector ver.7.2.2、Symantech公司),求出了DNA水平的序列同一性。其结果,两基因在5’-非编码区域约3kb的区域,显示了78%的序列同一性。另外,也证明了两基因的ORF间序列同一性非常高(96%)(图12)。以上结果支持SiP189及SrSiP189虽高度保存了蛋白质的功能,但两基因的表达方式存在着差异的见解。RT-PCR分析及这些cis-因子分析支持2个木脂素生物合成基因(来源于S.indicum的SiP189及来源于S.radiatum的SrSiP189)不在同一转录调节下的结论。
〔实施例12:非洲芝麻Sesamum alatum中类似SiP189基因的分离〕
S.alatum是在形态学上与栽培种S.indicum有很大差异的非洲芝麻野生种(并木等、芝麻的科学、日本朝仓书店)。染色体数与S.indicum相同,2n=26,但其地理位置为非洲的尼日利亚、苏丹、及莫桑比克。
与实施例8中从非洲芝麻S.radiatum中分离SrSiP189基因的方法相同,从S.alatum中分离了SiP189的counterpart基因(SaSiP189)。
PCR的模板,使用了S.alatum种子阶段4的cDNA。使用序列号61及序列号63的引物,将用PCR扩增了的约1.5kb的扩增片段在pCR-blunt II TOPO(Invitrogen)上亚克隆,通过引物步查法(Primer Walking法)测定了插入片段的碱基序列。序列号78表示了SaSiP189的氨基酸序列,序列号79表示了SaSiP189的核苷酸序列。
所得SaSiP189与SiP189,在DNA水平上显示了90%的序列同一性,在氨基酸水平上显示了86%的序列同一性。上述结果显示,木脂素生物合成酶基因SiP189,超越了地理间隔、形态学及细胞遗传学上的差异,是被高度保存的基因。
并且,在具体实施方式中举出的具体实施形态或实施例,只是明确本发明技术内容的内容,而不应狭义地解释成只限于其中的具体实例,在本发明的精神和以下所述的权利要求的范围内,可进行各种变更。
众所周知,芝麻素是具有多种生理活性且具有各种各样改善功能的物质,通过本发明,鉴定了催化从松脂醇到胡椒醇、或从胡椒醇到芝麻素生物合成的酶的基因,并使用此被鉴定的来源于芝麻的细胞色素P450基因(SiP基因),通过重组生物使芝麻素及胡椒醇等的生产得以实现,所以,对扩大芝麻素产量及削减生产成本均很有作用。
综上所述,与本发明有关的来源于芝麻种子的SiP189基因及SrSiP189基因,是编码催化从松脂醇到胡椒醇及从胡椒醇到芝麻素生物合成反应的细胞色素P450的基因。从古至今都属于贵重食品,且作为对健康有益的食品的代表为人所知的芝麻的种子,及从该种子中获得的油、芝麻种子的提取物,今后会日益受到重视和关注。其中,芝麻素将以其生理活性受到重视。因此,由本发明鉴定的SiP189基因及SrSiP189基因,可用于至今为止只从芝麻种子中生产芝麻素的生产方式中,并可由衷地期待其产量的扩大。
所以,本发明可用于农业、食品行业、医药品行业及其相关的行业中。
                                   序列表
<110>三得利株式会社(SUNTORY LIMITED)
<120>编码催化木脂素生物合成的酶的基因及其利用(A gene encoding an enzyme catalyzingbiosynthesis of lignan,and the use thereof)
<130>SU0411/PCT
<150>JP 2003-341313
<151>2003-09-30
<150>JP 2003-432383
<151>2003-12-26
<160>79
<170>PatentIn Ver.2.1
<210>1
<211>506
<212>PRT
<213>芝麻(Sesamum indicum)
<220>
<223>SiP189
<400>1
Met Glu Ala Glu Met Leu Tyr Ser Ala Leu Ala Leu Thr Phe Ala Ile
  1               5                  10                  15
Phe Met Val Tyr Arg Ile Leu Ser Asn Ser Gln Asp Lys Arg Ser Leu
             20                  25                  30
Thr Lys Leu Pro Pro Ser Pro Pro Gly Trp Leu Pro Val Ile Gly His
         35                  40                  45
Ala His Leu Met Lys Asn Leu Leu His Arg Thr Leu Tyr Asp Phe Ser
     50                  55                  60
Gln Lys Leu Gly Pro Ile Phe Ser Ile Arg Phe Gly Ser Arg Leu Val
 65                  70                  75                  80
Val Val Val Ser Ser Ser Ser Leu Val Glu Glu Cys Phe Thr Lys Tyr
                 85                  90                  95
Asp Ile Val Leu Ala Asn Arg Pro Gln Ala Ser Val Asp Arg Arg Ser
            100                 105                 110
Leu Gly Phe Ser Thr Thr Ser Val Ile Gly Ala Pro Tyr Gly Asp His
        115                 120                 125
Trp Arg Asn Leu Arg Lys Leu Cys Asp Leu Glu Val Phe Ala Pro Thr
    130                 135                 140
Arg Leu Ala Ser Phe Leu Ser Ile Arg Leu Asp Glu Arg Asp Arg Met
145                 150                 155                 160
Ile Ser Ala Leu Tyr Lys Ile Ser Ser Ala Gly Phe Ala Lys Val Asn
                165                 170                 175
Leu Glu Ala Lys Ile Val Glu Leu Thr Phe Asn Asn Ile Met Arg Met
            180                 185                 190
Val Ala Ala Lys Arg Tyr Tyr Gly Glu Glu Ala Glu Asp Asp Glu Glu
        195                 200                 205
Ala Lys Arg Phe Arg Asp Leu Thr Lys Glu Ala Leu Glu Leu Thr Ser
    210                 215                 220
Ala Ser Asn Pro Gly Glu Ile Phe Pro Ile Leu Arg Trp Leu Gly Cys
225                 230                 235                 240
Asn Gly Leu Glu Lys Lys Leu Ala Val His Ser Arg Lys Thr Asp Glu
                245                 250                 255
Phe Met Gln Gly Leu Leu Asp Glu His Arg Arg Gly Glu Arg Gln Asn
            260                 265                 270
Thr Met Val Asp His Leu Leu Ser Leu Gln Glu Ser Gln Pro Glu Tyr
        275                 280                 285
Tyr Thr Asp Glu Ile Ile Thr Gly Leu Ile Val Ala Leu Ile Ile Ala
    290                 295                 300
Gly Thr Asp Ala Ser Val Val Thr Thr Glu Trp Ala Met Ser Leu Leu
305                 310                 315                 320
Leu Asn His Pro Lys Val Leu Glu Lys Ala Arg Lys Glu Leu Asp Thr
                325                 330                 335
Leu Val Gly His Glu Arg Met Val Asp Glu His Asp Leu Pro Lys Leu
            340                 345                 350
Arg Tyr Leu His Cys Ile Val Leu Glu Thr Leu Arg Leu Phe Pro Ser
        355                 360                 365
Val Pro Thr Leu Val Pro His Glu Pro Ser Glu Asp Cys Lys Ile Gly
    370                 375                 380
Gly Tyr Asn Val Pro Lys Gly Thr Met Val Leu Val Asn Ala Trp Ala
385                 390                 395                 400
Ile His Arg Asp Pro Lys Val Trp Asp Asp Pro Leu Ser Phe Lys Pro
                405                 410                 415
Asp Arg Phe Glu Ile Met Glu Val Glu Thr His Lys Leu Leu Pro Phe
            420                 425                 430
Gly Met Gly Arg Arg Ala Cys Pro Gly Ala Gly Leu Ala Gln Lys Phe
        435                 440                 445
Val Gly Leu Ala Leu Gly Ser Leu Ile Gln Cys Phe Asp Trp Glu Arg
    450                 455                 460
Thr Ser Pro Glu Lys Ile Asp Leu Asn Glu Gly Ser Gly Ile Thr Leu
465                 470                 475                 480
Pro Lys Ala Lys Thr Leu Glu Ala Met Cys Lys Pro Arg His Val Met
                485                 490                 495
Glu Lys Val Leu Arg Gln Val Ser Asn Val
            500                 505
<210>2
<211>1518
<212>DNA
<213>芝麻(Sesamum indicum)
<220>
<223>SiP189
<400>2
atggaagctg aaatgctata ttcagctctc gctctcacct tcgccatatt catggtttac    60
agaattcttt ctaattcgca ggacaagcgc agcctgacta agctgcctcc gagcccgccc    120
ggttggctgc cggtgatcgg ccacgctcat ctcatgaaaa atctcctcca tagaacacta    180
tacgacttct cccagaaact gggacccata ttttccatcc ggttcgggtc gcgcctcgtg    240
gtggtggtgt cctcctcctc cctggtggag gaatgtttca ccaagtatga cattgtcttg    300
gcaaatcgcc ctcaggcttc tgttgaccgg cgctcacttg ggttcagcac caccagcgta    360
atcggggccc cgtacgggga ccattggcgc aacctgcgaa agttgtgcga tcttgaagta    420
ttcgccccga cccgtctcgc ctcgttttta tccatcaggc ttgacgagag ggaccgcatg    480
atttccgcgt tatacaaaat ctcgtccgcc ggtttcgcga aggtgaattt ggaagcgaag    540
attgtggagc tgacgtttaa taacataatg aggatggtgg cggcgaagag atactatggg    600
gaggaggcgg aggacgacga ggaggcgaag aggttcaggg acctgacgaa ggaggctttg    660
gagttgacga gcgcttccaa tcctggtgag atatttccaa tattgcggtg gcttggttgc    720
aatgggctgg agaagaagct ggctgttcac tcgcggaaga cggatgagtt catgcaaggg    780
ctgctggacg aacaccgacg gggcgagcgc cagaacacca tggttgatca tttgctttcg    840
ttgcaggaat ctcaacctga gtactacact gatgaaatca tcactggcct catagttgca    900
ttgataattg cgggaacgga tgcatcggtt gtaactacag aatgggcgat gtccctttta    960
ctaaatcatc ccaaagtact tgaaaaggct agaaaagaac tggacactct agtaggacac    1020
gaacgcatgg ttgatgaaca cgatctcccc aaactacgtt accttcactg catagtcttg    1080
gagaccttaa ggttattccc ttctgttcca actttggtgc cacacgaacc atcagaggat    1140
tgtaaaattg ggggatacaa tgtccccaag gggacaatgg tattagtgaa tgcttgggca    1200
atacaccgag accccaaggt gtgggacgac cccttgagct ttaagcccga caggtttgag    1260
ataatggaag tggagacaca caagttgttg ccgttcggaa tgggcaggag agcgtgtcct    1320
ggagctggac tggcgcagaa gtttgtgggg ttggctttgg ggtcgctgat tcagtgtttc    1380
gactgggaga gaacgagtcc cgagaaaatt gacttgaacg aaggttctgg gataaccttg    1440
cctaaagcta agacgttgga agccatgtgc aaacctagac atgtcatgga aaaagttctt    1500
cgtcaggttt ccaacgtt                                                  1518
<210>3
<211>21
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,Si18SrRNA-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,Si18SrRNA-FW)
<400>3
tatgcttgtc tcaaagatta a                                              21
<210>4
<211>21
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,Si18SrRNA-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,Si18SrRNA-RV)
<400>4
aacatctaag ggcatcacag a                                              21
<210>5
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP90A-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP90A-FW)
<400>5
ttttccgatg aagagattgt tgac                                           24
<210>6
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP90A-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP90A-RV)
<400>6
tgccatctcc aagggttg                                                  18
<210>7
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP72B-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP72B-FW)
<400>7
cttaatgttc aaatgataat ggat                                           24
<210>8
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP72B-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP72B-RV)
<400>8
gtaaatcgtt cagggttg                                                  18
<210>9
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP71B-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP71B-FW)
<400>9
ttcaccactg atcatctcaa agga                                           24
<210>10
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP71B-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP71B-RV)
<400>10
agaaacctgt cagggtta                                                  18
<210>11
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP84A-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP84A-FW)
<400>11
cttacccgtg acaatatcaa agca                                           24
<210>12
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP84A-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP84A-RV)
<400>12
aaaaacctcg atggtcta                                                  18
<210>13
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP96A-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP96A-FW)
<400>13
agtcatgata agttcctcag ggac                                           24
<210>14
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP96A-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP96A-RV)
<400>14
atccatctct ctggcttg                                                  18
<210>15
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP710A-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP710A-FW)
<400>15
tccgaagacg aagccatcgg cggt                                           24
<210>16
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP710A-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP710A-RV)
<400>16
ctaaaccggt ccggatcg                                                  18
<210>17
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP86A-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP86A-FW)
<400>17
cgcgtggcgc tcaacttcat ccta                                           24
<210>18
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP86A-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP86A-RV)
<400>18
atccatctct ctggtttg                                                  18
<210>19
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP74-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP74-FW)
<400>19
cgagaagaag ctactcacaa tctt                                           24
<210>20
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP74-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP74-RV)
<400>20
acgaatctct ccggcaca                                                  18
<210>21
<211>25
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP75B-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP75B-FW)
<400>21
ttaacggata ctgagattaa agcct                                          25
<210>22
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP75B-RV(Description of ArtificialSequence:Artificially Synthesi zed Primer Sequence,CYP75B-RV)
<400>22
aagaatctct cgggttta                                                  18
<210>23
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP79F-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP79F-FW)
<400>23
gtcacaccag acgaaatcaa agct                                           24
<210>24
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP79F-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP79F-RV)
<400>24
aggtgacgct ccggtttg                                                  18
<210>25
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP81D-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP81D-FW)
<400>25
tacatggacc gcatcatcaa agga                                           24
<210>26
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP81D-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP81D-RV)
<400>26
tcgaacctct ctggcttg                                                  18
<210>27
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP705A-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP705A-FW)
<400>27
catatcaagt cgcttctcac ggta                                           24
<210>28
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP705A-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP705A-RV)
<400>28
agaaacctct ctggttta                                                  18
<210>29
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP83A-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP83A-FW)
<400>29
tttactgatg ataatgtcaa agcc                                           24
<210>30
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,CYP83A-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,CYP83A-RV)
<400>30
agaaacctct cgggccta                                                  18
<210>31
<211>21
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP168-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP168-FW
<400>31
tttcccttgt tctcctactc t                                              21
<210>32
<211>21
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP168-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP168-RV)
<400>32
aaataatgat agctaaattt t                                              21
<210>33
<211>21
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP189-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP189-FW)
<400>33
tcgtttttat ccatcaggct t                                              21
<210>34
<211>21
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP189-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP189-RV)
<400>34
caaacgttgg aaacctgacg a                                              21
<210>35
<211>21
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP236-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP236-FW)
<400>35
ggatgttctg tggaagttaa a                                              21
<210>36
<211>21
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP236-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP236-RV)
<400>36
atctaagttt catgcagttt t                                              21
<210>37
<211>21
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP249-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP249-FW)
<400>37
ctaagcttca aaatgtcgat a                                              21
<210>38
<211>21
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP249-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP249-RV)
<400>38
ccaacttact tattacagat a                                              21
<210>39
<211>21
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP288-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP288-FW)
<400>39
aaaatggtgg gaattgtgta t                                              21
<210>40
<211>19
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP288-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP288-RV)
<400>40
tacatctcaa tttttctta                                                 19
<210>41
<211>32
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,GR-SiP168-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,GR-SiP168-RV)
<400>41
cacgatcctg gagatttccg gggaggatac aa                                  32
<210>42
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,GR-SiP168-Nest-RV(Description ofArtificial Sequence:Artificially Synthesized Primer Sequence,GR-SiP168-Nest-RV)
<400>42
gtaggttttg gagagttt                                                  18
<210>43
<211>31
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,GR-SiP189-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,GR-SiP189-RV)
<400>43
ctcgtcgtcc tccgcctcct ccccatagta t                                   31
<210>44
<211>21
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,GR-SiP189-Nest-RV(Description ofArtificial Sequence:Artificially Synthesized Primer Sequence,GR-SiP189-Nest-RV)
<400>44
accatcctca ttatgttatt a                                              21
<210>45
<211>28
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,GR-SiP236-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,GR-SiP236-RV)
<400>45
ccaggagaga gttgttgctg ttgtgtct                                       28
<210>46
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,GR-SiP236-Nest-RV(Description ofArtificial Sequence:Artificially Synthesized Primer Sequence,GR-SiP236-Nest-RV)
<400>46
tataaagctt attgttat                                                  18
<210>47
<211>33
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP168-BamHI-FW(Description ofArtificial Sequence:Artificially Synthesized Primer Sequence,SiP168-BamHI-FW)
<400>47
ggatccaaaa gagcaaatta tggatctact act                                 33
<210>48
<211>33
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP168-XhoI-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP168-XhoI-RV)
<400>48
ctcgagaagg gaaaataatg atagctaaat ttt                                 33
<210>49
<211>30
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP189-BamHI-FW(Description ofArtificial Sequence:Artificially Synthesized Primer Sequence,SiP189-BamHI-FW)
<400>49
ggatcctttt cagccaacat ggaagctgaa                                     30
<210>50
<211>33
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP189-XhoI-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP189-XhoI-RV)
<400>50
ctcgagaaaa agagcatcat ttaatcatac act                                 33
<210>51
<211>35
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP236-BamHI-FW(Description ofArtificial Sequence:Artificially Synthesized Primer Sequence,SiP236-BamHI-FW)
<400>51
ggatccttca cttcacttca ttgctcaatg gcaaa                               35
<210>52
<211>33
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP236-XhoI-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP236-XhoI-RV)
<400>52
ctcgagaaca gctgagaccc cacagcaatc taa                                 33
<210>53
<211>1503
<212>DNA
<213>芝麻(Sesamum indicum)
<220>
<223>SiP249
<400>53
atgtcgatac ctctccttat ctctctctca ttaatcatcc ttgttttcct actagtccga    60
cgacgccgca acagcccggc tggtcgaaaa ctccggcgtc ctccggggcc tcctggcctt    120
cccttcctcg ggaacttgct ccaatacaac ccctccgatc tccatctccg cctgacaaaa    180
ctctcagaaa agtacggccc gcttatgtac atgacgttcg tcggaaagcc cgtggttgtg    240
atttcatcgg cccgagtggc caaagaggct ttgaagtaca atgaccttgc attttcgagc    300
aggccttcta ccattgcatc gcgcaaagtg gcttacaaca acagtgacat ctccatgtca    360
ccgtacacag agtactggag agaactgcgg aaaatggtcg ttcttcgcct ctttacggtc    420
aaacaagtga actctttccg ccctgctcga gaagaagaag tggcccgcat ggtgaaagag    480
atttccagac gggccaacgc gcatcagccc gttaacatta atgaaatagc gttgtcgttg    540
tcgagcagga tgatatctag gtttgcactg gggaagaggt acgacgagga gaacgggccg    600
gaaaagagga ggttcgacag gattctgcag ctgcttcagt tggtgtcggt ggaaattttc    660
tttggtgatt attctccatg gctgggctgg attgacagac tgtgtggtaa ggtttctcag    720
cttgagaagg cgttcaagga tttggattca ttgtatgaag agatgatcgc ggagcatctg    780
agcccgaata ggcccgagtc tatgaacgga gacattcttg atatgctaat tcagatgaaa    840
gaagatcggt cgtcgacggt tcaaattgat tgggatcata tcaagggcgt actcatgaac    900
atgttcgtag ccggaacaga cacaactgca gctacaataa catgggcaat gacagctctg    960
atcaagaagc ctcaagtact gaacaaagtg caacaagaaa tcagatctgt ggtcggaaag    1020
aaaggcagcg tagccgaaga tgatatacaa aaacttccct attttaaagc ggtggtgaag    1080
gagactctga gactgtacgc accagctcca ctctcactgc ccagactgac aatcaaaagc    1140
agcgtcatag atggatacga cattgaaccc aacaccatag tttacgtgaa cgtttgggcg    1200
attagccgag acaaggattt ttgggagaac ccggatgagt tcttgcccga aagattcttg    1260
aacagtagcg tggactttaa aggccaagat ttcgggtttc ttccattcgg gtcggggcga    1320
agagtgtgcc ctggaatggc cttggggact gcagaagtgg aggtgtcgct tgctaatatt    1380
ctgtattgct tccactggga attgccgcct ggaatggtag aagatgacgt tgatatggac    1440
tttttgcctg gaattactac tcataagaaa aatgcactct atttgatggc caaaagctat    1500
ctg                                                                  1503
<210>54
<211>501
<212>PRT
<213>芝麻(Sesamum indicum)
<220>
<223>SiP249
<400>54
Met Ser Ile Pro Leu Leu Ile Ser Leu Ser Leu Ile Ile Leu Val Phe
  1               5                  10                  15
Leu Leu Val Arg Arg Arg Arg Asn Ser Pro Ala Gly Arg Lys Leu Arg
             20                  25                  30
Arg Pro Pro Gly Pro Pro Gly Leu Pro Phe Leu Gly Asn Leu Leu Gln
         35                  40                  45
Tyr Asn Pro Ser Asp Leu His Leu Arg Leu Thr Lys Leu Ser Glu Lys
     50                  55                  60
Tyr Gly Pro Leu Met Tyr Met Thr Phe Val Gly Lys Pro Val Val Val
 65                  70                  75                  80
Ile Ser Ser Ala Arg Val Ala Lys Glu Ala Leu Lys Tyr Asn Asp Leu
                 85                  90                  95
Ala Phe Ser Ser Arg Pro Ser Thr Ile Ala Ser Arg Lys Val Ala Tyr
            100                 105                 110
Asn Asn Ser Asp Ile Ser Met Ser Pro Tyr Thr Glu Tyr Trp Arg Glu
        115                 120                 125
Leu Arg Lys Met Val Val Leu Arg Leu Phe Thr Val Lys Gln Val Asn
    130                 135                 140
Ser Phe Arg Pro Ala Arg Glu Glu Glu Val Ala Arg Met Val Lys Glu
145                 150                 155                 160
Ile Ser Arg Arg Ala Asn Ala His Gln Pro Val Asn Ile Asn Glu Ile
                165                 170                 175
Ala Leu Ser Leu Ser Ser Arg Met Ile Ser Arg Phe Ala Leu Gly Lys
            180                 185                 190
Arg Tyr Asp Glu Glu Asn Gly Pro Glu Lys Arg Arg Phe Asp Arg Ile
        195                 200                 205
Leu Gln Leu Leu Gln Leu Val Ser Val Glu Ile Phe Phe Gly Asp Tyr
    210                 215                 220
Ser Pro Trp Leu Gly Trp Ile Asp Arg Leu Cys Gly Lys Val Ser Gln
225                 230                 235                 240
Leu Glu Lys Ala Phe Lys Asp Leu Asp Ser Leu Tyr Glu Glu Met Ile
                245                 250                 255
Ala Glu His Leu Ser Pro Asn Arg Pro Glu Ser Met Asn Gly Asp Ile
            260                 265                 270
Leu Asp Met Leu Ile Gln Met Lys Glu Asp Arg Ser Ser Thr Val Gln
        275                 280                 285
Ile Asp Trp Asp His Ile Lys Gly Val Leu Met Asn Met Phe Val Ala
    290                 295                 300
Gly Thr Asp Thr Thr Ala Ala Thr Ile Thr Trp Ala Met Thr Ala Leu
305                 310                 315                 320
Ile Lys Lys Pro Gln Val Leu Asn Lys Val Gln Gln Glu Ile Arg Ser
                325                 330                 335
Val Val Gly Lys Lys Gly Ser Val Ala Glu Asp Asp Ile Gln Lys Leu
            340                 345                 350
Pro Tyr Phe Lys Ala Val Val Lys Glu Thr Leu Arg Leu Tyr Ala Pro
        355                 360                 365
Ala Pro Leu Ser Leu Pro Arg Leu Thr Ile Lys Ser Ser Val Ile Asp
    370                 375                 380
Gly Tyr Asp Ile Glu Pro Asn Thr Ile Val Tyr Val Asn Val Trp Ala
385                 390                 395                 400
Ile Ser Arg Asp Lys Asp Phe Trp Glu Asn Pro Asp Glu Phe Leu Pro
                405                 410                 415
Glu Arg Phe Leu Asn Ser Ser Val Asp Phe Lys Gly Gln Asp Phe Gly
            420                 425                 430
Phe Leu Pro Phe Gly Ser Gly Arg Arg Val Cys Pro Gly Met Ala Leu
        435                 440                 445
Gly Thr Ala Glu Val Glu Val Ser Leu Ala Asn Ile Leu Tyr Cys Phe
    450                 455                 460
His Trp Glu Leu Pro Pro Gly Met Val Glu Asp Asp Val Asp Met Asp
465                 470                 475                 480
Phe Leu Pro Gly Ile Thr Thr His Lys Lys Asn Ala Leu Tyr Leu Met
                485                 490                 495
Ala Lys Ser Tyr Leu
            500
<210>55
<211>1545
<212>DNA
<213>芝麻(Sesamum indicum)
<220>
<223>SiP288
<400>55
atggtgggaa ttgtgtatat tgagcttttc ttgtcagtta tgtggtttat ggctttgtgg    60
gtgtggttga attacagggc cctggcgtgg aactggcctg tgatcggaat gctgccgacg    120
cttctgcttc acgtgagccg gattcacgac aattgcacgg agattatggg gaagtcccga    180
cggggaactt ttcatttccg gggtccctgg ttggctgata tggacatgat ggggactgct    240
gatcctgaga atgttcacta cattatgagc gcgaacttcc agaatttccc gaaaggcccc    300
aagttcaggg aaatttttga tgttcttgga gatgggattt tcaatgcaga ttcggagtcc    360
tggagggacc agagaagggt tgccagggcc ctgatttctc accatggttt cctccggttt    420
ctggcgaaga tcagccgtga gaaggtagag aaaggcctga ttccagttct tgaaacggtg    480
tgcctggaaa atcgggtggt cgatttgcag gatttgttcc agaggttgac gtttgataca    540
acttgtacat ttgttactgg ttatgatcct ggatgcttgt ctgttgattt gcctgatgtt    600
cctttctcga aagccctaga tgatgccgaa gaagcgatat tcatgcgcca tgtggttcct    660
gaaaagattt ggaaacttca gaggtggttt ggggttggat ctgagagaaa attgagcaag    720
gctcgtgaag tcttggatag cgtcattggc aggtatatcg cgctgaagcg cggcgaaatg    780
agaagccgag gaatttcgat tgattgtgaa aatgaagatg gtgtggatct gctcacgtct    840
tacatgactg tgggagacga tggtactcaa acccatgatt tgaaatgtga tgacaagttc    900
ttgagggaca cgatactgaa tctaatgatt gcagggcggg acacgacgag ttctgctctg    960
acatggttta tatggcttgt gtcgacacat gctgaagtgg aaaagaggat cagggatgaa    1020
ctgaagtcct ttctgcccgc cggagaacgt gaaaagtggc gtgtgtttgg ggttgaagaa    1080
accaagaagt tggtttacat gcatggagca atttgcgaag ccctacgact atatccacca    1140
gtcccgttcc agcataagga gccggtggaa ccagatatcc ttccgagcgg gcattttgtg    1200
gaaccgacaa tgaaagtgat gttctcattg tacgccatgg gacggatgga atccgtttgg    1260
ggcgaggatt gcttggaatt caagccggag aggtggattt ctgatagggg atcgatcaag    1320
cacgagccct catacaagtt cttggctttc aatgctggtc cgaggacttg cttggggaag    1380
gatgtggctt tcgctcaggt gaaggcagtg gccgccacct taatccataa ctaccaagtt    1440
cacgtggcag acggccaccg cgtgctgccc aattgttcca tcatcctcta catgaggaat    1500
ggattgaagg ttagggttgc caatagatgg tctgctaaga aaaat                    1545
<210>56
<211>515
<212>PRT
<213>芝麻(Sesamum indicum)
<220>
<223>SiP288
<400>56
Met Val Gly Ile Val Tyr Ile Glu Leu Phe Leu Ser Val Met Trp Phe
  1               5                  10                  15
Met Ala Leu Trp Val Trp Leu Asn Tyr Arg Ala Leu Ala Trp Asn Trp
             20                  25                  30
Pro Val Ile Gly Met Leu Pro Thr Leu Leu Leu His Val Ser Arg Ile
         35                  40                  45
His Asp Asn Cys Thr Glu Ile Met Gly Lys Ser Arg Arg Gly Thr Phe
     50                  55                  60
His Phe Arg Gly Pro Trp Leu Ala Asp Met Asp Met Met Gly Thr Ala
 65                  70                  75                  80
Asp Pro Glu Asn Val His Tyr Ile Met Ser Ala Asn Phe Gln Asn Phe
                 85                  90                  95
Pro Lys Gly Pro Lys Phe Arg Glu Ile Phe Asp Val Leu Gly Asp Gly
            100                 105                 110
Ile Phe Asn Ala Asp Ser Glu Ser Trp Arg Asp Gln Arg Arg Val Ala
        115                 120                 125
Arg Ala Leu Ile Ser His His Gly Phe Leu Arg Phe Leu Ala Lys Ile
    130                 135                 140
Ser Arg Glu Lys Val Glu Lys Gly Leu Ile Pro Val Leu Glu Thr Val
145                 150                 155                 160
Cys Leu Glu Asn Arg Val Val Asp Leu Gln Asp Leu Phe Gln Arg Leu
                165                 170                 175
Thr Phe Asp Thr Thr Cys Thr Phe Val Thr Gly Tyr Asp Pro Gly Cys
            180                 185                 190
Leu Ser Val Asp Leu Pro Asp Val Pro Phe Ser Lys Ala Leu Asp Asp
        195                 200                 205
Ala Glu Glu Ala Ile Phe Met Arg His Val Val Pro Glu Lys Ile Trp
    210                 215                 220
Lys Leu Gln Arg Trp Phe Gly Val Gly Ser Glu Arg Lys Leu Ser Lys
225                 230                 235                 240
Ala Arg Glu Val Leu Asp Ser Val Ile Gly Arg Tyr Ile Ala Leu Lys
                245                 250                 255
Arg Gly Glu Met Arg Ser Arg Gly Ile Ser Ile Asp Cys Glu Asn Glu
            260                 265                 270
Asp Gly Val Asp Leu Leu Thr Ser Tyr Met Thr Val Gly Asp Asp Gly
        275                 280                 285
Thr Gln Thr His Asp Leu Lys Cys Asp Asp Lys Phe Leu Arg Asp Thr
    290                 295                 300
Ile Leu Asn Leu Met Ile Ala Gly Arg Asp Thr Thr Ser Ser Ala Leu
305                 310                 315                 320
Thr Trp Phe Ile Trp Leu Val Ser Thr His Ala Glu Val Glu Lys Arg
                325                 330                 335
Ile Arg Asp Glu Leu Lys Ser Phe Leu Pro Ala Gly Glu Arg Glu Lys
            340                 345                 350
Trp Arg Val Phe Gly Val Glu Glu Thr Lys Lys Leu Val Tyr Met His
        355                 360                 365
Gly Ala Ile Cys Glu Ala Leu Arg Leu Tyr Pro Pro Val Pro Phe Gln
    370                 375                 380
His Lys Glu Pro Val Glu Pro Asp Ile Leu Pro Ser Gly His Phe Val
385                 390                 395                 400
Glu Pro Thr Met Lys Val Met Phe Ser Leu Tyr Ala Met Gly Arg Met
                405                 410                 415
Glu Ser Val Trp Gly Glu Asp Cys Leu Glu Phe Lys Pro Glu Arg Trp
            420                 425                 430
Ile Ser Asp Arg Gly Ser Ile Lys His Glu Pro Ser Tyr Lys Phe Leu
        435                 440                 445
Ala Phe Asn Ala Gly Pro Arg Thr Cys Leu Gly Lys Asp Val Ala Phe
    450                 455                 460
Ala Gln Val Lys Ala Val Ala Ala Thr Leu Ile His Asn Tyr Gln Val
465                 470                 475                 480
His Val Ala Asp Gly His Arg Val Leu Pro Asn Cys Ser Ile Ile Leu
                485                 490                 495
Tyr Met Arg Asn Gly Leu Lys Val Arg Val Ala Asn Arg Trp Ser Ala
            500                 505                 510
Lys Lys Asn
        515
<210>57
<211>1494
<212>DNA
<213>芝麻(Sesamum indicum)
<220>
<223>SiP168
<400>57
atggatctac tactttccct tgttctccta ctctgttctg cagcatgcat ttggtttctc    60
cgggtggtcc tgaaacccaa tccagggccc cggaaatcag ccaatctccc tccagggcca    120
aaacctcttc ccataatcgg caacattctt gagcttggtg agaaacccca ccaatctctc    180
gccaaactct ccaaaaccta cgggcccctg atgcgtctca agctgggaac catgacaaca    240
gttgttgtat cctccccgga aatctccagg atcgtgctgc aacaatatga ccaagttttc    300
tccagccgaa cacacgcaga tgccatccga gcacttgacc accacaaaca ttccgtcgcc    360
tggataccgg cggacaatca gtggcggaaa atccgtaaac tgtgcaaaga gaagatgttt    420
tcgggccaaa agcttgatgc gaaccagggc ctgaggaggg agaagttgcg taatttgcaa    480
gactatgtga atgaatgctg cgttagtggc caggtcgtgg atattggtgt agctgccttt    540
acgacgaccc ttaatctgat atcggccact cttttctcgg tggattttgc tgattttggt    600
tctggttcgt ctcaagagct taaggatgtt atgagcggga tagcgtctat catcggccga    660
ccaaattttg ctgattgttt ccctcttctt cggctggttg atccacaggg catcttccgc    720
cagaccacgt tacatttcaa caagtgtttt aagatctttg atgaaattat ccgtcaaagg    780
ctacagacca atgattcggg gacgaaaagt gacatgctga aagagcttct tgaaatcaac    840
cagaaagatg agtctgaatt gagctttgac gagatcaagc atttactcct ggatctactt    900
gtcgcaggaa cggacacaac ttcagttaca gtggaatggg caatgacgga gctagtgcgc    960
caccctgaga aaatgtcgaa agccagaaat gagttaagaa atgtggtggg actgaataaa    1020
gaaattcaag aatcagacat ctcaagactc ccttacctac gagcagtggt gaaagaaagt    1080
ttcaggcttc accctgcaac tcctttatcg gtacctcaca aggccgacga ggaagcagaa    1140
atcaatggct atatagtccc taaaggagca caagttctca tgaacgtgtg ggccatcggc    1200
agagattcaa gcatatggag gaaccctgat gtattcatgc ccgagaggtt cttggagaca    1260
gaaattgatg tccgtggcca acacttcgag ctgcttcctt ttggcggggg gaggaggatt    1320
tgcgtggggc tgccgttagc ctatcgtatg atccatctcg tgcttgccac tttcataagc    1380
gactatgatt ggaaacttga aggagggctg aaaactgaag aaatggacat gagtgaaaag    1440
ttcggcctca ccctgcaaaa agccattcct ctcaaggcac ttccagttaa aatt          1494
<210>58
<211>498
<212>PRT
<213>芝麻(Sesamum indicum)
<220>
<223>SiP168
<400>58
Met Asp Leu Leu Leu Ser Leu Val Leu Leu Leu Cys Ser Ala Ala Cys
  1               5                  10                  15
Ile Trp Phe Leu Arg Val Val Leu Lys Pro Asn Pro Gly Pro Arg Lys
             20                  25                  30
Ser Ala Asn Leu Pro Pro Gly Pro Lys Pro Leu Pro Ile Ile Gly Asn
         35                  40                  45
Ile Leu Glu Leu Gly Glu Lys Pro His Gln Ser Leu Ala Lys Leu Ser
     50                  55                  60
Lys Thr Tyr Gly Pro Leu Met Arg Leu Lys Leu 6ly Thr Met Thr Thr
 65                  70                  75                  80
Val Val Val Ser Ser Pro Glu Ile Ser Arg Ile Val Leu Gln Gln Tyr
                 85                  90                  95
Asp Gln Val Phe Ser Ser Arg Thr His Ala Asp Ala Ile Arg Ala Leu
            100                 105                 110
Asp His His Lys His Ser Val Ala Trp Ile Pro Ala Asp Asn Gln Trp
        115                 120                 125
Arg Lys Ile Arg Lys Leu Cys Lys Glu Lys Met Phe Ser Gly Gln Lys
    130                 135                 140
Leu Asp Ala Asn Gln Gly Leu Arg Arg Glu Lys Leu Arg Asn Leu Gln
145                 150                 155                 160
Asp Tyr Val Asn Glu Cys Cys Val Ser Gly Gln Val Val Asp Ile Gly
                165                 170                 175
Val Ala Ala Phe Thr Thr Thr Leu Asn Leu Ile Ser Ala Thr Leu Phe
            180                 185                 190
Ser Val Asp Phe Ala Asp Phe Gly Ser Gly Ser Ser Gln Glu Leu Lys
        195                 200                 205
Asp Val Met Ser Gly Ile Ala Ser Ile Ile Gly Arg Pro Asn Phe Ala
    210                 215                 220
Asp Cys Phe Pro Leu Leu Arg Leu Val Asp Pro Gln Gly Ile Phe Arg
225                 230                 235                 240
Gln Thr Thr Leu His Phe Asn Lys Cys Phe Lys Ile Phe Asp Glu Ile
                245                 250                 255
Ile Arg Gln Arg Leu Gln Thr Asn Asp Ser Gly Thr Lys Ser Asp Met
            260                 265                 270
Leu Lys Glu Leu Leu Glu Ile Asn Gln Lys Asp Glu Ser Glu Leu Ser
        275                 280                 285
Phe Asp Glu Ile Lys His Leu Leu Leu Asp Leu Leu Val Ala Gly Thr
    290                 295                 300
Asp Thr Thr Ser Val Thr Val Glu Trp Ala Met Thr Glu Leu Val Arg
305                 310                 315                 320
His Pro Glu Lys Met Ser Lys Ala Arg Asn Glu Leu Arg Asn Val Val
                325                 330                 335
Gly Leu Asn Lys Glu Ile Gln Glu Ser Asp Ile Ser Arg Leu Pro Tyr
            340                 345                 350
Leu Arg Ala Val Val Lys Glu Ser Phe Arg Leu His Pro Ala Thr Pro
        355                 360                 365
Leu Ser Val Pro His Lys Ala Asp Glu Glu Ala Glu Ile Asn Gly Tyr
    370                 375                 380
Ile Val Pro Lys Gly Ala Gln Val Leu Met Asn Val Trp Ala Ile Gly
385                 390                 395                 400
Arg Asp Ser Ser Ile Trp Arg Asn Pro Asp Val Phe Met Pro Glu Arg
                405                 410                 415
Phe Leu Glu Thr Glu Ile Asp Val Arg Gly Gln His Phe Glu Leu Leu
            420                 425                 430
Pro Phe Gly Gly Gly Arg Arg Ile Cys Val Gly Leu Pro Leu Ala Tyr
        435                 440                 445
Arg Met Ile His Leu Val Leu Ala Thr Phe Ile Ser Asp Tyr Asp Trp
    450                 455                 460
Lys Leu Glu Gly Gly Leu Lys Thr Glu Glu Met Asp Met Ser Glu Lys
465                 470                 475                 480
Phe Gly Leu Thr Leu Gln Lys Ala Ile Pro Leu Lys Ala Leu Pro Val
                485                 490                 495
Lys Ile
<210>59
<211>1545
<212>DNA
<213>芝麻(Sesamum indicum)
<220>
<223>SiP236
<400>59
atggcaaacc ccattgattt tctcctcagc ccaacaccat atgtggctac aacccttctt    60
tacgttctct tctctgttct tattgttaga ttcctcagca gaaagctgct cgggaagaag    120
aggtaccatc ccattggtgg taccgtgttc aaccagctgc tgaacttcta taggttgcat    180
gattatatgg ctgatcttgc agggaagtac aagacttaca gactgattgc cccttttcgg    240
actgaggtct atacatctga ccccgctaat gttgagcaca tgttgaaaac gaatttcgaa    300
agttatggca agggacctta caattgcagc attctggggg atttgtttgg tgaaggaatt    360
ttcgcaatcg atggccataa gtggagggag cagagaaaag tgtcaagcct tgagttttct    420
acaagggttc tgagggatta cagtagcatc gtcttcagga aaaacgccgt aaggctcgca    480
aaaattctgt ctggagctgc aacttccaac caaccagtgg atattcaaga tcttttcatg    540
aaatcaactt ttgattctat ttcggaagtt gctttaggag ttgagcttga cagcttgggt    600
ggttcaaatg aagaaggtgc caaatttagc attgctgcag acgacgtgag tatgaggaca    660
ctttggagat acgtggatgt tctgtggaag ttaaagagag ctctaaatgt tggttcagaa    720
gcaaaactga agaaaagcct tcaagtggtt gatgaatttg tgtataagct gattcatagt    780
aggactcagc aaatgaacat gccaggaaat gattctgtta tgcagctgaa gaaagacgac    840
attttgtcaa gattcttgca acttactgag gccactccca agtacttgag ggacataaca    900
ataagcttta tagttgctgg taaagacaca acagcaacaa ctctctcctg gtttatttac    960
atgctttgca agtatcctca tgttcaggaa aaggtggagc aagagataaa agatgcgaca    1020
ggctgcaaag aggtagcaga tatctcagaa ttttcagcct gtgtgacaga agaagctttg    1080
ggcaagatgc attatctcca tgcagcattg acagaaacac tgaggattta tccagcagtt    1140
gcggtggatg caaagcaatg tttgtgtgat gatataatgc cggatgggtt cagtgttaag    1200
aagggggaca tggtggctta tcaaccatat gcaatgggaa ggatgaaatc catatggggt    1260
aatgatgcag aagagttcaa accagagaga tggcttgaca aaaacggttg cttccagcag    1320
gccagccctt ttaagtttac agctttccag gccggccctc gtctttgttt ggggaaagag    1380
tttgcttatc ggcagatgaa gatattctca gccattctgc tgagattctt taccatgaaa    1440
ctaagtgatg aaagaaagac agtaaactac agaccaatgc tcactcttct catcgacggt    1500
ggtctcattg tccgcccctt tcacagaatg gacgagaaaa ctgca                    1545
<210>60
<211>515
<212>PRT
<213>芝麻(Sesamum indicum)
<220>
<223>SiP236
<400>60
Met Ala Asn Pro Ile Asp Phe Leu Leu Ser Pro Thr Pro Tyr Val Ala
  1               5                  10                  15
Thr Thr Leu Leu Tyr Val Leu Phe Ser Val Leu Ile Val Arg Phe Leu
             20                  25                  30
Ser Arg Lys Leu Leu Gly Lys Lys Arg Tyr His Pro Ile Gly Gly Thr
         35                  40                  45
Val Phe Asn Gln Leu Leu Asn Phe Tyr Arg Leu His Asp Tyr Met Ala
     50                  55                  60
Asp Leu Ala Gly Lys Tyr Lys Thr Tyr Arg Leu Ile Ala Pro Phe Arg
 65                  70                  75                  80
Thr Glu Val Tyr Thr Ser Asp Pro Ala Asn Val Glu His Met Leu Lys
                 85                  90                  95
Thr Asn Phe Glu Ser Tyr Gly Lys Gly Pro Tyr Asn Cys Ser Ile Leu
            100                 105                 110
Gly Asp Leu Phe Gly Glu Gly Ile Phe Ala Ile Asp Gly His Lys Trp
        115                 120                 125
Arg Glu Gln Arg Lys Val Ser Ser Leu Glu Phe Ser Thr Arg Val Leu
    130                 135                 140
Arg Asp Tyr Ser Ser Ile Val Phe Arg Lys Asn Ala Val Arg Leu Ala
145                 150                 155                 160
Lys Ile Leu Ser Gly Ala Ala Thr Ser Asn Gln Pro Val Asp Ile Gln
                165                 170                 175
Asp Leu Phe Met Lys Ser Thr Phe Asp Ser Ile Ser Glu Val Ala Leu
            180                 185                 190
Gly Val Glu Leu Asp Ser Leu Gly Gly Ser Asn Glu Glu Gly Ala Lys
        195                 200                 205
Phe Ser Ile Ala Ala Asp Asp Val Ser Met Arg Thr Leu Trp Arg Tyr
    210                 215                 220
Val Asp Val Leu Trp Lys Leu Lys Arg Ala Leu Asn Val Gly Ser Glu
225                 230                 235                 240
Ala Lys Leu Lys Lys Ser Leu Gln Val Val Asp Glu Phe Val Tyr Lys
                245                 250                 255
Leu Ile His Ser Arg Thr Gln Gln Met Asn Met Pro Gly Asn Asp Ser
            260                 265                 270
Val Met Gln Leu Lys Lys Asp Asp Ile Leu Ser Arg Phe Leu Gln Leu
        275                 280                 285
Thr Glu Ala Thr Pro Lys Tyr Leu Arg Asp Ile Thr Ile Ser Phe Ile
    290                 295                 300
Val Ala Gly Lys Asp Thr Thr Ala Thr Thr Leu Ser Trp Phe Ile Tyr
305                 310                 315                 320
Met Leu Cys Lys Tyr Pro His Val Gln Glu Lys Val Glu Gln Glu Ile
                325                 330                 335
Lys Asp Ala Thr Gly Cys Lys Glu Val Ala Asp Ile Ser Glu Phe Ser
            340                 345                 350
Ala Cys Val Thr Glu Glu Ala Leu Gly Lys Met His Tyr Leu His Ala
        355                 360                 365
Ala Leu Thr Glu Thr Leu Arg Ile Tyr Pro Ala Val Ala Val Asp Ala
    370                 375                 380
Lys Gln Cys Leu Cys Asp Asp Ile Met Pro Asp Gly Phe Ser Val Lys
385                 390                 395                 400
Lys Gly Asp Met Val Ala Tyr Gln Pro Tyr Ala Met Gly Arg Met Lys
                405                 410                 415
Ser Ile Trp Gly Asn Asp Ala Glu Glu Phe Lys Pro Glu Arg Trp Leu
            420                 425                 430
Asp Lys Asn Gly Cys Phe Gln Gln Ala Ser Pro Phe Lys Phe Thr Ala
        435                 440                 445
Phe Gln Ala Gly Pro Arg Leu Cys Leu Gly Lys Glu Phe Ala Tyr Arg
    450                 455                 460
Gln Met Lys Ile Phe Ser Ala Ile Leu Leu Arg Phe Phe Thr Met Lys
465                 470                 475                 480
Leu Ser Asp Glu Arg Lys Thr Val Asn Tyr Arg Pro Met Leu Thr Leu
                485                 490                 495
Leu Ile Asp Gly Gly Leu Ile Val Arg Pro Phe His Arg Met Asp Glu
            500                 505                 510
Lys Thr Ala
        515
<210>61
<211>34
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,Bam-SST-FW2(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,Bam-SST-FW2)
<400>61
tggatcccaa ctcatagagt actcaaaaac gctt                                34
<210>62
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP189-Nco-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP189-Nco-RV)
<400>62
gcaaatgatc aaccatggtg ttct                                           24
<210>63
<211>27
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,GR-SST-RV1(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,GR-SST-RV1)
<400>63
cacatgaacg agacgaactg ggtttgg                                        27
<210>64
<211>506
<212>PRT
<213>非洲芝麻(Sesamum radiatum)
<220>
<223>SrSiP189
<400>64
Met Glu Ala Glu Met Leu Tyr Ser Ala Leu Ala Leu Thr Phe Ala Ile
  1               5                  10                  15
Phe Met Val Tyr Arg Ile Leu Ser Asn Ser Gln Glu Lys Ser Ser Leu
             20                  25                  30
Ile Lys Leu Pro Pro Ser Pro Pro Gly Trp Leu Pro Val Ile Gly His
         35                  40                  45
Val His Leu Met Lys Asn Leu Leu His Arg Thr Leu Tyr Asp Phe Ser
     50                  55                  60
Gln Lys Leu Gly Pro Ile Phe Ser Leu Arg Phe Gly Thr Arg Leu Val
 65                  70                  75                  80
Val Val Val Ser Ser Ser Ser Leu Val Glu Glu Cys Phe Thr Lys Tyr
                 85                  90                  95
Asp Ile Val Leu Ala Asn Arg Pro Gln Pro Ser Val Asp Arg Arg Ser
            100                 105                 110
Leu Gly Phe Ser Thr Thr Ser Val Ile Gly Ala Pro Tyr Gly Asp His
        115                 120                 125
Trp Arg Asn Leu Arg Lys Leu Cys Asp Leu Glu Val Phe Ala Pro Thr
    130                 135                 140
Arg Leu Ala Ser Phe Leu Ser Ile Arg Leu Asp Glu Arg Asp Arg Met
145                 150                 155                 160
Ile Ser Ser Leu Tyr Lys Ile Ser Ser Ala Gly Phe Ala Lys Val Asn
                165                 170                 175
Leu Glu Thr Lys Ile Val Glu Leu Thr Phe Asn Asn Ile Met Arg Met
            180                 185                 190
Val Ala Gly Lys Arg Tyr Tyr Gly Glu Glu Ala Glu Asp Asp Glu Glu
        195                 200                 205
Ala Lys Arg Phe Arg Asp Leu Thr Lys Glu Ala Leu Glu Leu Thr Ser
    210                 215                 220
Ala Ser Asn Pro Gly Glu Ile Phe Pro Ile Leu Arg Trp Leu Gly Phe
225                 230                 235                 240
Asn Gly Leu Glu Lys Lys Leu Ala Val His Ala Arg Lys Thr Asp Glu
                245                 250                 255
Phe Met Gln Gly Leu Leu Asp Glu His Arg Arg Gly Glu Arg Gln Asn
            260                 265                 270
Thr Met Val Asp His Leu Leu Ser Leu Gln Glu Ser Gln Pro Glu Tyr
        275                 280                 285
Tyr Thr Asp Glu Ile Ile Thr Gly Leu Ile Val Ala Leu Ile Ile Ala
    290                 295                 300
Gly Thr Asp Ala Ser Val Val Thr Thr Glu Trp Ala Met Ser Leu Ile
305                 310                 315                 320
Leu Asn His Pro Gln Val Leu Glu Lys Ala Arg Lys Glu Leu Asp Thr
                325                 330                 335
Leu Val Gly His Glu Arg Met Val Asp Glu His Asp Leu Pro Lys Leu
            340                 345                 350
Arg Tyr Leu His Cys Ile Val Leu Glu Thr Leu Arg Leu Phe Pro Ser
        355                 360                 365
Val Pro Thr Leu Val Pro His Glu Pro Ser Glu Asp Cys Lys Ile Gly
    370                 375                 380
Gly Tyr Asn Val Pro Lys Gly Thr Met Ile Leu Val Asn Ala Trp Ala
385                 390                 395                 400
Ile His Arg Asp Pro Lys Val Trp Asp Asp Pro Leu Ser Phe Lys Pro
                405                 410                 415
Asp Arg Phe Glu Thr Met Glu Val Glu Thr His Lys Leu Leu Pro Phe
            420                 425                 430
Gly Met Gly Arg Arg Ala Cys Pro Gly Ala Gly Leu Ala Gln Lys Phe
        435                 440                 445
Val Gly Leu Ala Leu Gly Ser Leu Ile Gln Cys Phe Glu Trp Glu Arg
    450                 455                 460
Met Ser Ala Glu Lys Ile Asp Leu Asn Glu Gly Ser Gly Ile Thr Leu
465                 470                 475                 480
Pro Lys Ala Lys Thr Leu Glu Ala Met Cys Lys Pro Arg His Ile Met
                485                 490                 495
Glu Arg Val Leu Arg Gln Val Ser Asn Val
            500                 505
<210>65
<211>1518
<212>DNA
<213>非洲芝麻(Sesamum radiatum)
<220>
<223>SrSiP189
<400>65
atggaagctg aaatgctata ttcagctctc gctctcacct tcgccatatt catggtttac    60
agaattcttt ctaattcgca ggagaaaagc agcctgatta agctgccgcc gagcccgccg    120
ggttggctcc cggtgatcgg ccacgttcat ctcatgaaaa atctcctcca tagaacacta    180
tacgacttct cccagaaact gggacccata ttttccctcc ggttcggcac ccgcctcgtg    240
gtagtggtgt cctcctcctc cctggtcgag gaatgtttca ccaagtacga cattgtcttg    300
gccaaccgcc ctcagccctc tgtcgaccgg cgctcactcg ggttcagcac caccagcgta    360
atcggcgccc cgtacgggga ccattggcgc aacctgcgaa agttgtgcga tcttgaagta    420
ttcgccccga cccgtctcgc ctcgttttta tccatcaggc ttgacgagag ggaccgcatg    480
atttcgtcgt tgtacaaaat ctcgtccgcc ggtttcgcga aggtgaattt ggagacgaag    540
attgttgagc tgacgtttaa taacataatg aggatggtgg cggggaagag atactatggg    600
gaggaggcgg aggacgacga ggaggcgaag aggttcaggg acctgacgaa ggaggctttg    660
gagttgacga gcgcttccaa tcctggtgag atatttccaa tattgcggtg gcttggtttc    720
aatgggttgg agaagaagct ggctgttcac gcgcggaaga cggatgagtt catgcaaggg    780
ctgctggacg aacaccgacg gggcgagcgc cagaacacca tggttgatca tttgctttcg    840
ttgcaggaat ctcaacctga gtactacact gatgaaatca tcactggcct catagttgca    900
ttgataattg cgggaacgga tgcatcggtt gtaactacag aatgggcgat gtcccttata    960
ctaaatcatc cccaagtact tgaaaaggct agaaaagaac tggacactct agtaggacac    1020
gaacgcatgg tcgatgaaca tgatctgccc aaactacgtt accttcactg catagtcttg    1080
gagaccttaa ggttatttcc ttctgttcca acgttggtgc cacacgaacc atcggaggat    1140
tgtaaaattg ggggatacaa tgtccccaag gggacaatga tactggtgaa tgcttgggca    1200
atacaccgag accccaaggt gtgggacgac cccttgagct ttaagcccga caggtttgag    1260
acaatggaag tggagacaca caagctgttg ccgttcggga tgggcaggag agcgtgtccc    1320
ggagctggat tggcgcagaa gtttgtgggg ttggctttgg ggtcgctgat tcagtgtttc    1380
gagtgggaga gaatgagtgc ggagaaaatt gacttgaacg aaggttctgg gataaccttg    1440
cctaaagcta agacgttgga agccatgtgc aaacctagac atatcatgga gagagttctt    1500
cgtcaggttt cgaacgtc                                                  1518
<210>66
<211>20
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,NtUBQ-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,NtUBQ-FW)
<400>66
ggaatgcaga tcttcgtcaa                                                20
<210>67
<211>18
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,NtUBQ-RW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,NtUBQ-RW)
<400>67
cctagaaacc accacgga                                                  18
<210>68
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP189-bam-FW(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP189-bam-FW)
<400>68
ttttcagcca acatggaagc tgaa                                           24
<210>69
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,SiP189-nco-RV(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,SiP189-nco-RV)
<400>69
gcaaatgatc aaccatggtg ttct                                           24
<210>70
<211>25
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,STAR-LF1(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,STAR-LF1)
<400>70
acgaagttat gcggccaatt aaccc                                          25
<210>71
<211>25
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,STAR-LR1(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,STAR-LR1)
<400>71
ccacctgacg tcgcggccta atacg                                          25
<210>72
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,M13-47(F)(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,M13-47(F))
<400>72
cgccagggtt ttcccagtca cgac                                           24
<210>73
<211>24
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,RV-M(R)(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,RV-M(R))
<400>73
gagcggataa caatttcaca cagg                                           24
<210>74
<211>3069
<212>DNA
<213>Sesamun indium
<400>74
tacgtggttg taaattaagg tggcatagtc aaagctgtgt aggatggagg aattagacac    60
ttccccagtc ccccacagac tattcccgag ctgaccaaac acagtcgaaa gtgtggggcc    120
caatgaaatt gacagatgac gtctagtgta gtgtgaatgt gtgatatttt tgcagaatat    180
tgtaaaagag ggttcaccaa atctcactag tttgtgacta attgactatt tttgcagaaa    240
attcgtattt agtatagggt cttggtcaaa ttaattaatt atataacaaa tgtgatatat    300
ttaatttgtt attaattttt ttatatttgt tgtgtaatta gttaggattt tatataagaa    360
tttgaaaaaa tgagatgttt ttttgtaaat caaattacac aatatcatgt attgggtttt    420
tcgtcctgaa gtcgcttgaa aattgattag atcggcggac ttgaacagac gagtgaatgg    480
acatgattta aaattttaag gataaatata tatagtatca gttatcaaaa taaaaaattt    540
ccttcaaaat catggtcttg tttaagatag ttttttgagt aatgtggcac cataattccc    600
aagcactaga agtgcaattg taaatccaac ggtacctagt ttaattgata aaattaaagt    660
ccaaaaattt tcctgagaaa ccaattcgag caagggtaca tcaaaggtgc caccagggag    720
ttaagcaaga aatgtcccct aaactttagg catgaggtat ccctataaaa taaattgacc    780
taaaaagatt caaatggctt agagtcgaga aaaagactaa gtagaccatt agggaagccc    840
acatgcctaa gatcctccag ccgaagtaga ggcctatgcg gcagtcagcc tagtgacttg    900
ggattcccta gctctgaaag aattaatatt gtcccaagaa tctaaggcta catagtagaa    960
atgaaaacaa agcgaattta aatttgaagc cagcatgatt gaattttttt tttttttttc    1020
aggtgtttaa gcactcaaac atgtacaata aataaacgtg tggctaattt aaagaacatt    1080
gaaagctggc caagaattat accttttaaa gcgagtggag tttccgatgt ttgagctctc    1140
attcaatccg ttcacatcta gatgaacaaa cgtctctttt aatggtatcc acgatacctt    1200
tgtcgagggg atttctcgtc tccttgctag aggattcaat attaccaagg ggtcaaaact    1260
atactaactt aaagaagatt gagaacacac tattaaattc tcgatcccaa ttttcaagcc    1320
tttgcaccta gttgaaagct tgtgcgtaga gatgcttttg agagagtgtc ggggaggaga    1380
ggggatggaa cacaaaattt taggcttatt ttttcttttt tttttttgtc aaaaatgtct    1440
ctgttaaagt tttgtgcatg tcctctatat gccaaatatt tggtggtaag cacgacaaag    1500
gtatgccaaa tgaagttgta ttaactatgt tgaataagat ggtcctatac taatagatta    1560
cataggccaa cccattagct tgtaggtcac atattccaac ataatgtaga ggtctaagca    1620
caagcagacc catgccatat ggcgtccatg gggtagtcca ggtgatattg acgtaagttc    1680
ttttaagcca catcaacaaa cttcagccgt ccaagcaagg acatgtggcc gcctcaaaag    1740
aaggcctcaa tgcttcctta tccctaaaac aactctagct ttggaaacca gatcagatga    1800
ggatatcccc taagctattt caaaaaatct aggaacctta tctgtagcag actttgttaa    1860
tttttcaaat caagggactc caacagccaa gcgataaccc tcaccaaatt tgtgaaggat    1920
tcgatattat ccaaccagtt gatgatttgc ttataaagtg caatcttccc ccaacaaaaa    1980
agccaattcc aacttttact ttcaaattat agctttaatt tctgacttaa aatttcatat    2040
tataaatttc aatctcttaa gtgtacacaa aatacaagat atttcactct tttgtatttt    2100
tctaattccc ataattttat ctttattttg tattttgatt gaacccgagc acatctttga    2160
cttgcatcaa caatattagc tctaaattaa acatagaatt taatgttaaa atgagaaaag    2220
gaactcatac agatcggact caaaacctta acacctaata aagtatgcat cctaataaaa    2280
agttattacc aaagtgaaat tatgcttaat gaaaatcgaa atcagaagta gttcttaatt    2340
ggagagtttc gagacggcaa gaatattgca actcatcctc acacctaccc atctatttca    2400
tactcttaaa ttataatcta attcaatata cacaacaacc tatcacatta atatacaata    2460
tgaaaggtca ataaaatatt tacgctggca aacctcccca gtagaattcg ggcacatatg    2520
aagtgttaac cattcaaata tggacaaagg aacactagag acacgaagtt tatttcaaag    2580
gaaaattttg tctaaaattg aatttaatta aatttaaatt aattatataa taaatataat    2640
gtattttaca tcatgattga tatataattt taaaaaaaat aattattcca actattaaca    2700
ttaattaata aataactttt acaagaccca ggccaccaac tcccgtccac atgaaagaat    2760
gggtaaccgc taagtctata ttttagtact acgacgtatg caaatacgct ttttccacaa    2820
aaatcaaatt ttaattttta ctttatccaa ggcaagaaaa caaaaaatgc ataaattcac    2880
gttctaattc atcaatactc aagaaatagc atacttgatt tgaactgaga tttgtcactt    2940
tcctacaaat tctgcagact atgaaaacga catcaaccaa ccaatatcca ctctctatat    3000
aaatagcatc acttcactag caatttctca tcaactcata gagtactcaa aaacgctttt    3060
tcagccaac                                                            3069
<210>75
<211>29
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,gSST-FW1(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,gSST-FW1)
<400>75
aatgaaattg acagatgacg tctagtgta                                      29
<210>76
<211>30
<212>DNA
<213>人工序列(Artificial Sequence)
<220>
<223>人工序列的说明:人工合成的引物序列,gSST-RV2(Description of ArtificialSequence:Artificially Synthesized Primer Sequence,gSST-RV2)
<400>76
ctgcgaatta gaaagaattc tgtaaaccat                                     30
<210>77
<211>2815
<212>DNA
<213>非洲芝麻(Sesamum radiatum)
<400>77
tagtgtagtg tgaatgtgtg atatttttgc agtatatata ttgtaaaaga ggattaacca    60
aatctctcta gttcgtgatt atgactattt ttgcagaaaa tttgtattta gtttagggtt    120
ggtaaaatct aatttataga gtaaatatga tgtatttatt ttgtgattga ttacttttat    180
atttattgta taattagtta taatttgata aagtgtgata ttttttataa attagattac    240
atattattat gtactgagtt tttcgttctg atgccattta aaaattggtt aggtcggcga    300
cttgaactga cgagtgaagg gacttgattt aacattttaa ggatatatat atatagtacc    360
agttatcaaa ataaaagttt tctttcaaaa tcatagtttt gtttaagata attttgtgag    420
tatatgttgc accacaattc ccaagcacta taagtgcaac tgtaggtcta attggaccta    480
gtttagttga caaaattgaa gtccaagaat atcttcaaga agccaattcg tgtaatggta    540
cgtcaaaggt gccaccaggg aatcaagtag gaaatttccc ctaaatgtta ggcatgaggt    600
gccactataa agaaaattga cccaaagaga tacaagtatc ttagagtcga gaagaagact    660
acgtagacca ttagggaagt ccacatgcct aagattctgc agctgaagca caggcctagg    720
tacggtcagc ccagggactc gagatcccct agctctcaaa gaattggtat tggcccagga    780
atctaaggct acatagcaaa aacgaaaata aaacaaactt aaatttgaag tcaacgggat    840
tgaatcctat tttctcgggt gttcaaactc aagcatgtaa aataaataaa cgtgtgacta    900
atttacaaaa cactgaaaac taattacaaa ttatacctta aaagcatgtg tagtttttaa    960
cgtttgagct ttcgtcaatc cattcacgta gagataaacg gacgtctcct ctaagggtat    1020
ccacaatacc attggcgagg agatttcttg tctattagag gattcgagat taccatggag    1080
ttagaactat aaacctaaag aagatcgaga aaatactatt agattagtgt tctcaatctc    1140
aattctcaag ccttcaaacc tagttaaaag cttgagaaaa tttgtgcgta gatatgtttt    1200
ggagagagtg tcggagagaa gaggggatcg agcacaaact cttagcccta ttcttttctc    1260
ttctttgccg aaaaatgtct ttgttagagt ccttgtgcat gttttctata tgccaaatat    1320
gtggtggtaa gcacaacaaa gttatgtgaa aagaaattgt attagcacta cgttgaataa    1380
gattgtcttc tactaataga tgatagaggg caaccattgg cttgtcggtt acttattcca    1440
acataatgta gaggcccaag catgataaga cctatgccac aggacgtcct tgggtggtcc    1500
aagtgatatt gacgtaagac cttttaacct acttcggcag gctttagcca taacctccag    1560
cctgtgaaac ccgatcagat gaggatatcc cctcagcccc tccaaaaatc taggaatctc    1620
atccgcagca gatttcggta tcttttccta gaagatcaaa aaactctaac cactaagaga    1680
taaccccccc cacaaaatta atggaaaatt tggccttatc taactggcta ataggttgcc    1740
cataaattgc gagctccccc aacataaaaa gccaatccaa ctttactttt aaattatagg    1800
tttagtttct aacttaaaat ttcatattat gaatatcaac ctcttatgta tacacaaagt    1860
aacaagatat tttactcatt tgttttctct tagttcctat aattttatct ttcttgcatc    1920
aacaatattt gctctaaatt aaatatagaa tttaatgtta aaatgagaaa acggactcaa    1980
aaccagaaca cctaataaag tatgcatctt aataaaaagt tattacgaag gagaaaaata    2040
tgcttaataa aaatcgaaat cagaagtagt tcttaattgg agagtctgaa aacggcaaga    2100
atattgcaag tcatcctcac tttctcatcc atagacagtc acacctaccc cacatatttc    2160
atacttttaa attattatct aatttaatat acgcatcant tcataatata taatacgaaa    2220
ggttaataaa atatttacgc tagcaaactt cttcagtaga attcatgtac ataagaagtg    2280
ttgaccattc aaatatggaa aaagaaacac tagagataag aaacttagtt gtgaagcaga    2340
aaatatttaa gttggttggt tggatttgaa ctaattaata taataaatat aatatatcgt    2400
gtaaattgaa aaacgactat taacatcaat taataaataa ttttctgtta gtgaagatgg    2460
actacaagac ctaggccacc aacccccatc cacctgaatg aatgggtaac cgctaagtcc    2520
atatttcagt actccggcgt ctgcaaaaac gctttttcca caaaaatcaa attttaagtt    2580
tttactttat cctaggcaag aaaacaaaat atgcatagat tcacgttcaa attcatcaat    2640
gctcaagaaa tagcatactt gatttgaact gagatttgtc actatcctac aaattctgca    2700
cactatgaaa acgacatcaa ccaaccaaaa tccactctct ataaatacca tcacttcact    2760
agcaatttct catcaactca taacgtactc aaataaacac gctttttcag ccaac         2815
<210>78
<211>507
<212>PRT
<213>非洲芝麻(Sesumum alatum)
<400>78
Met Glu Ala Glu Met Leu Tyr Ser Ala Leu Ala Leu Thr Phe Ala Ile
  1               5                  10                  15
Ile Met Val His Arg Ile Leu Ser Asn Ser Gln Asn Lys Arg Ser Leu
             20                  25                  30
Ile Asn Leu Pro Pro Ser Pro Pro Gly Trp Leu Pro Ile Ile Gly His
         35                  40                  45
Leu His Leu Ile Lys Asn Pro Leu His Arg Thr Leu Tyr Asp Cys Ser
     50                  55                  60
Gln Lys Leu Gly Ser Ile Phe Ser Val Trp Phe Gly Ser Arg Leu Val
 65                  70                  75                  80
Val Val Val Ser Ser Ser Ser Leu Val Glu Glu Cys Phe Thr Lys Tyr
                 85                  90                  95
Asp Ile Val Leu Ala Asn Arg Pro Asp Leu His Leu Asp Leu Arg Ser
            100                 105                 110
Leu Gly Ala Ser Thr Ile Ser Val Ile Gly Ala Pro Tyr Gly Asp His
        115                 120                 125
Trp Arg Asn Leu Arg Lys Leu Cys Asp Leu Glu Val Phe Ala Pro Thr
    130                 135                 140
Arg Leu Ala Ser Phe Leu Ser Ile Arg Arg Asp Glu Arg Asp Arg Met
145                 150                 155                 160
Ile Ser Gly Leu Tyr Lys Ile Ser Ser Ala Gly Leu Ala Lys Val Asn
                165                 170                 175
Leu Glu Ala Lys Ile Ala Glu Leu Thr Phe Asn Asn Leu Met Arg Met
            180                 185                 190
Leu Ala Gly Lys Ile Tyr Tyr Gly Glu Glu Ala Glu Asp Glu Glu Glu
        195                 200                 205
Ala Lys Arg Phe Arg Asp Met Thr Lys Glu Ala Leu Glu Leu Met Asn
    210                 215                 220
Thr Phe Asn Leu Ala Glu Ile Phe Pro Ile Leu Arg Trp Ile Gly Cys
225                 230                 235                 240
Asn Gly Phe Glu Lys Gln Leu Pro Val His Ser Arg Lys Thr Asp Glu
                245                 250                 255
Ile Met Gln Gly Leu Leu Asp Glu His Arg Arg Gly Glu Arg Gln Asn
            260                 265                 270
Thr Met Val Gly His Leu Leu Ser Leu Gln Glu Ser Gln Pro Asp Tyr
        275                 280                 285
Tyr Thr Asp Glu Ile Ile Thr Gly Leu Ile Ile Ser Leu Ile Ile Ala
    290                 295                 300
Gly Thr Asp Ala Ser Val Val Thr Thr Glu Trp Ala Met Ser Leu Leu
305                 310                 315                 320
Leu Asn His Pro Lys Val Leu Glu Lys Ala Arg Gln Glu Met Asp Thr
                325                 330                 335
Leu Val Gly His Glu Arg Met Val Glu Glu Asp Asp Leu Pro Lys Leu
            340                 345                 350
Arg Tyr Leu His Tyr Ile Ile Leu Glu Thr Leu Arg Leu Phe Pro Ser
        355                 360                 365
Val Pro Thr Leu Val Pro His Glu Pro Ser Glu Asp Cys Asn Ile Gly
    370                 375                 380
Gly Tyr Asn Val Pro Lys Gly Thr Met Ile Ile Val Asn Ala Trp Ala
385                 390                 395                 400
Ile His Arg Asp Pro Lys Val Trp Asp Asp Pro Met Ser Phe Lys Pro
                405                 410                 415
Asp Arg Phe Glu Thr Leu Glu Val Glu Thr His Lys Leu Leu Pro Phe
            420                 425                 430
Gly Met Gly Arg Arg Gly Cys Pro Gly Ala Gly Leu Ala Lys Lys Phe
        435                 440                 445
Val Gly Leu Ala Leu Ala Ser Leu Ile Gln Cys Phe Asp Trp Glu Arg
    450                 455                 460
Ile Ser Ala Glu Lys Ile Asp Leu Lys Glu Gly Ala Ser Arg Ile Thr
465                 470                 475                 480
Leu Pro Lys Ala Thr Thr Leu Glu Ala Met Cys Lys Pro Arg His Val
                485                 490                 495
Met Glu Lys Val Leu Arg Gln Val Ser Asn Val
            500                 505
<210>79
<211>1524
<212>DNA
<213>非洲芝麻(Sesumum alatum)
<400>79
atggaagctg aaatgctata ttcagctctc gctctcacct tcgccataat catggttcac 60
agaattcttt caaattcaca gaacaagcgc agcctgatca atctgccgcc gagcccgcct 120
ggttggctgc cgattatcgg ccaccttcat ctcataaaaa atccactcca tagaacacta 180
tacgactgct cccagaaact gggatccata ttctccgtct ggttcgggtc ccgcctcgtg 240
gtggtggtgt cctcctcctc cctggtggag gaatgtttca ccaagtacga cattgtcttg 300
gccaaccgcc ctgacctcca tctggacctg cgatcactcg gggccagcac catcagcgta 360
atcggggccc cttacgggga ccactggcgc aacctgcgaa agttgtgcga tcttgaagta 420
ttcgccccga cccgtctcgc ctccttctta tccatcagac gagacgagag ggaccgcatg 480
atttccgggt tatacaaaat ctcgtcggcc ggtttggcga aggtgaattt ggaggcgaag 540
attgcggagc tgacgtttaa taacttaatg aggatgttgg cggggaaaat atactatggg 600
gaggaggcgg aggacgagga ggaggccaag aggttccggg acatgacgaa ggaggctttg 660
gagttgatga acaccttcaa tcttgctgag atatttccga tattgcggtg gattgggtgc 720
aatgggttcg agaagcagct gcccgttcac tcgcggaaga cggatgagat catgcaaggg 780
ctgctggacg aacaccgacg cggcgagcgc cagaacacca tggttggtca tttgctttcc 840
ttgcaggaat ctcaacctga ctactacact gatgaaatca tcactggcct cataatttca 900
ttgataatcg cggggacgga tgcatccgtt gtaactacag aatgggcgat gtctctttta 960
ctaaatcatc ccaaagtact tgaaaaggct agacaagaaa tggacacgct ggtaggacat 1020
gaacgcatgg tcgaagaaga cgatctcccc aaactacgtt accttcacta cataatcttg 1080
gagaccttaa ggttattccc ttctgttcca acgttggtgc cacacgaacc gtcggaggac 1140
tgtaatattg ggggatacaa cgtccccaag ggcacaatga tcatcgtgaa tgcatgggca 1200
atacacagag accccaaggt gtgggacgac cccatgagct ttaagcccga caggtttgag 1260
acattggagg tggagacaca caagttgttg ccatttggga tgggcaggag aggttgtccc 1320
ggagctggat tggcgaagaa gttcgtggga ttggctttgg catcgctgat ccagtgcttc 1380
gactgggaga gaattagtgc cgagaaaatt gacttgaagg aaggtgcttc taggataacc 1440
ttgcctaaag ctacgacgtt ggaagccatg tgcaaacctc gacatgtcat ggaaaaagtt 1500
cttcgtcagg tttcgaacgt ctga                                        1524

Claims (21)

1.基因,其编码催化胡椒醇及/或芝麻素生物合成的蛋白质。
2.基因,其编码催化松脂醇及/或胡椒醇形成甲二氧基氧桥的反应的蛋白质。
3.基因,其编码催化胡椒醇及/或芝麻素生物合成的蛋白质,且含有以下(a)或(b):
(a)序列号1、64或78中所示氨基酸序列;或
(b)在上述氨基酸序列中,1个或大于1个的氨基酸被取代、缺失、插入及/或附加了的氨基酸序列。
4.基因,其编码催化胡椒醇及/或芝麻素生物合成的蛋白质,且含有对于序列号1、64或78中所示氨基酸序列具有50%或大于50%同源性的氨基酸。
5.基因,其是具有把序列号2、65或79中所示碱基序列作为开放阅读框区域的基因。
6.基因,其编码催化胡椒醇及/或芝麻素生物合成的蛋白质,且在以下(a)~(c)的任一严谨条件下杂交:
(a)含有序列号2、65或79中所示碱基序列的多核苷酸;
(b)含有编码序列号1、64或78中所示氨基酸序列的碱基序列的多核苷酸;或
(c)上述多核苷酸的片段。
7.基因,其来源于芝麻、且是权利要求1~6中任一项所述的基因。
8.蛋白质,其由权利要求1~7中任一项所述的基因编码。
9.蛋白质,其催化胡椒醇及/或芝麻素的生物合成,且含有以下(a)或(b):
(a)序列号1、64或78所示的氨基酸序列;或
(b)在上述氨基酸序列中,1个或大于1个的氨基酸被取代、缺失、插入及/或附加了的氨基酸序列。
10.抗体,其识别权利要求8或9中所述的蛋白质。
11.重组表达载体,其含有权利要求1~7中任一项所述的基因。
12.转化体,其含有包含权利要求1~7中任一项所述基因的重组表达载体。
13.蛋白质的生产方法,其包含培养或繁殖权利要求12中所述转化体的过程,及从该转化体中获得催化胡椒醇及/或芝麻素生物合成的蛋白质的过程。
14.植物或该植物的后代或其组织,其中导入了权利要求1~7中任一项所述的基因。
15.胡椒醇及/或芝麻素的生产方法,其包含使用权利要求1~7中任一项所述的基因、或权利要求8或9中所述蛋白质的过程。
16.生产高含量木脂素的转化体的方法,其包含使用权利要求1~7中任一项所述基因的过程。
17.生产高含量胡椒醇及/或芝麻素的植物体的方法,其包含使用权利要求1~7中任一项所述基因的过程。
18.生产低含量木脂素的转化体的方法,其包含使用权利要求1~7中任一项所述基因的过程。
19.生产低含量胡椒醇及/或芝麻素的植物体的方法,其包含使用权利要求1~7中任一项所述基因的过程。
20.培育芝麻的方法,其包含使用权利要求1~7中任一项所述基因的过程。
21.基因检测工具,其是具备以含有权利要求1~7中任一项所述基因中至少一部分碱基序列或其互补序列的多核苷酸为探针的基因检测工具。
CN200480028559XA 2003-09-30 2004-09-29 编码催化木脂素物生合成的酶的基因及其利用 Expired - Fee Related CN1886499B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2003341313 2003-09-30
JP341313/2003 2003-09-30
JP432383/2003 2003-12-26
JP2003432383 2003-12-26
PCT/JP2004/014696 WO2005030944A1 (en) 2003-09-30 2004-09-29 A gene encoding an enzyme for catalyzing biosynthesis of lignan, and use thereof

Publications (2)

Publication Number Publication Date
CN1886499A true CN1886499A (zh) 2006-12-27
CN1886499B CN1886499B (zh) 2011-10-05

Family

ID=34395632

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200480028559XA Expired - Fee Related CN1886499B (zh) 2003-09-30 2004-09-29 编码催化木脂素物生合成的酶的基因及其利用

Country Status (13)

Country Link
US (1) US7811823B2 (zh)
EP (1) EP1670905B1 (zh)
JP (1) JP4590404B2 (zh)
KR (2) KR101235375B1 (zh)
CN (1) CN1886499B (zh)
AT (1) ATE389011T1 (zh)
AU (1) AU2004276685B2 (zh)
CA (1) CA2540367C (zh)
DE (1) DE602004012427T2 (zh)
DK (1) DK1670905T3 (zh)
MY (1) MY142797A (zh)
TW (1) TWI339682B (zh)
WO (1) WO2005030944A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9306952B2 (en) 2006-10-26 2016-04-05 Cfph, Llc System and method for wireless gaming with location determination
JP5638807B2 (ja) * 2007-12-28 2014-12-10 サントリーホールディングス株式会社 リグナン水酸化酵素
JP2009240191A (ja) * 2008-03-31 2009-10-22 Shimizu Shoko Kaigisho 光照射によるリグナン類・リグニン類合成系遺伝子の発現増強
JP6022854B2 (ja) * 2012-08-22 2016-11-09 かどや製油株式会社 脱臭スカム液状部分からセサモリンを分離製造する方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5209826A (en) * 1990-03-27 1993-05-11 Takemoto Yushi Kabushiki Kaisha Method of separating sesamin and episesamin
JP4155607B2 (ja) 1996-04-23 2008-09-24 竹本油脂株式会社 セサミン類の分離方法
AU728116B2 (en) 1996-11-08 2001-01-04 Washington State University Research Foundation Recombinant pinoresinol/lariciresinol reductase, recombinant dirigent protein, and methods of use
TR199902183T2 (xx) * 1997-03-07 1999-12-21 Novartis Ag Sitokrom P450 monoksigenazlar
US6376753B1 (en) * 1997-07-31 2002-04-23 Centre National De La Recherche Scientifique Purified cytochrome p450 polypeptide cyp76b1 from helianthus tuberosus and its applications as biocatalyst in particular for the degradation of environmental pollutants and for altering the resistance of plants sensitive to phenylurea family of herbicides
JP3789699B2 (ja) 1999-11-18 2006-06-28 サントリー株式会社 リグナン系抗酸化剤及びその製造法
CN1382707A (zh) * 2001-04-26 2002-12-04 上海博德基因开发有限公司 一种多肽——细胞色素p-450p-2-48.84和编码这种多肽的多核苷酸

Also Published As

Publication number Publication date
DE602004012427T2 (de) 2009-03-26
DE602004012427D1 (de) 2008-04-24
CA2540367A1 (en) 2005-04-07
AU2004276685B2 (en) 2009-10-08
CN1886499B (zh) 2011-10-05
KR20120029487A (ko) 2012-03-26
KR101235374B1 (ko) 2013-02-20
US7811823B2 (en) 2010-10-12
MY142797A (en) 2010-12-31
AU2004276685A1 (en) 2005-04-07
EP1670905A1 (en) 2006-06-21
JP2007507201A (ja) 2007-03-29
JP4590404B2 (ja) 2010-12-01
TWI339682B (en) 2011-04-01
CA2540367C (en) 2013-09-24
TW200514849A (en) 2005-05-01
KR20060113663A (ko) 2006-11-02
WO2005030944A1 (en) 2005-04-07
KR101235375B1 (ko) 2013-03-07
US20070271624A1 (en) 2007-11-22
ATE389011T1 (de) 2008-03-15
EP1670905B1 (en) 2008-03-12
DK1670905T3 (da) 2008-07-14

Similar Documents

Publication Publication Date Title
CN1252273C (zh) 编码植物脱氧海普赖氨酸合成酶的dna,植物真核起始因子5a,转基因植物和控制植物衰老和程序性细胞死亡的方法
CN1993377A (zh) 丙氨酸2,3氨基变位酶
CN1836039A (zh) 改变了花色的蔷薇的制造方法
CN1505684A (zh) 用于野生生物鉴定的通用引物
CN101052719A (zh) 利用编码花色苷3'位芳香族酰基转移酶的基因的花色苷色素稳定化和蓝化方法
CN101068923A (zh) 改良的丙氨酸2,3-氨基变位酶和相关多核苷酸
CN1267556C (zh) 提高丝状真菌中血红素蛋白产量的方法
CN1926235A (zh) 从烟草克隆细胞色素p450基因
CN1934261A (zh) 过氧化氢驱动的氧化反应
CN1644696A (zh) 编码黄酮合酶的基因
CN1950501A (zh) 放线菌来源的amp脱氨酶及其应用
CN1898383A (zh) 来自地钱的不饱和脂肪酸合成系统酶基因及其利用
CN1639337A (zh) 具有催泪成分合成酶活性的蛋白质或多肽、编码该蛋白质或多肽的 DNA、利用该 DNA制造具有催泪成分合成酶活性的蛋白质或多肽的制造方法以及具有抑制该蛋白质或多肽的mRNA翻译的功能的核酸分子
CN1661015A (zh) 来自产朊假丝酵母的谷胱甘肽合成酶编码基因
CN1195855C (zh) 棉子糖合酶基因及其用途
CN1886499A (zh) 编码催化木脂素物生合成的酶的基因及其利用
CN1894404A (zh) 有机酸存在下的启动子及其用途
CN1183248C (zh) 环状缩肽合成酶及其基因、以及环状缩肽的大规模生产系统
CN1206347C (zh) Cyp79家族的p450单加氧酶
CN101033472A (zh) 产生聚谷氨酸的转基因植物
CN1950505A (zh) 生产多肽的方法
CN1788078A (zh) 细胞增殖、发育分化受到改变的植物细胞和植物
CN1495261A (zh) 咖啡因生物合成体系基因组的联合利用
CN1496401A (zh) 编码细胞分裂素合成相关蛋白质的基因
CN1769436A (zh) 南京椴3-羟基-3-甲基戊二酰辅酶a还原酶蛋白编码序列

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: SUNTORY HOLDINGS CO., LTD.

Free format text: FORMER OWNER: SUNTORY LTD.

Effective date: 20090626

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20090626

Address after: Osaka Japan

Applicant after: Suntory Holdings Limited

Address before: Osaka Japan

Applicant before: Suntory Ltd.

C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20111005

Termination date: 20180929

CF01 Termination of patent right due to non-payment of annual fee