植物来源分子、其编码遗传序列及其用途
发明领域
本发明提供编码植物花防御素样分子的遗传分子及其在产生对植物害虫包括昆虫、微生物、真菌和/或病毒具有抗性、或至少敏感性下降的转基因植物中的用途。本发明另外提供花和种子来源的防御素在产生昆虫抗性植物中的用途。该植物可能是单子叶植物或双子叶植物,特别是作物植物和观赏花卉类植物。该遗传分子还用于产生重组防御素样分子,用于局部施用的组合物,以预防或者防止植物的害虫侵染。本发明的花防御素样分子或其编码遗传分子可单独使用,或与其它物质例如蛋白酶抑制因子前体或其编码核酸分子、或者其它分子或其编码核苷酸序列联合使用。
发明背景
本说明书参考的任何现有技术不是也不应视为认可或任何形式的暗示,该现有技术构成澳大利亚或任何其它国家普通常识的一部分。
重组DNA技术日臻完善,极大促进了农业生产的研究和开发。园艺领域,包括作物研究领域尤其如此。开发除草剂抗性植物和病原体抗性植物尤为重要。
已经采用了许多方法诱导植物的除草剂抗性。例如,在植物中表达失活或中和除草剂活性组分的酶的编码基因。虽然该方法取得了一些成功,但它只是作物和作物产品获得最高产量以及从农艺和园艺产业的其它活动中获得最大回报的多学科、多策略方法的一个部分。
农艺和园艺产业面临的主要困难之一是控制昆虫及其它病原体的植物侵染。昆虫及其它病原体每年造成数百万吨的产量损失。尽管成功使用杀虫剂及其它抗病原性化学试剂,但连续使用化学试剂控制植物害虫存在一系列环境和管理问题。此外,化学农药使用增多正在产生选择性压力,使害虫群体出现抗性。显然需要进一步研究诱导植物对病原体(例如昆虫、微生物、真菌、蜘蛛类和病毒)抗性的选择性机制。
已经采用了许多遗传方法进行试验。虽然取得了一些成功,开发新的、其它的遗传方法,与抗性难题作斗争仍很重要。
已建议的方法使用一组通称为″防御素″(defensins)的蛋白质。防御素以前称为γ-硫素(thionins),其结构上不同于α-和β-硫素家族。迄今分离和研究的大多数防御素来自种子,特别是萝卜(Raphanus sativus)及其它十字花科(Brassicaceae)家族成员的种子。种子防御素是小(~5kDa)骨架、富含半胱氨酸的蛋白质,许多具有抗真菌活性。
前几年从茄科(solanaceous)植物和拟南芥(Arabidopsis)的花器中分离了几种编码种子防御素相关蛋白质的cDNA克隆。与种子防御素不同,花防御素由除防御素结构域之外还有酸性C端结构域的前体蛋白质生成。该酸性结构域的作用未知。
除了高度保守的8个半胱氨酸残基以外,该防御素结构域几乎没有序列与种子来源的防御素相同。尽管分离了几种编码花防御素的cDNA,但尚未分离相应的蛋白质,也未研究其生物学功能。本发明人从观赏性烟草植物花烟草(Nicotiana alata)中分离了cDNA及其对应的花防御素。已经确定该防御素前体经蛋白水解加工,从酸性C端结构域释放成熟的防御素。
根据本发明,本发明人确定,花防御素具有用于防止植物害虫攻击或侵染的有用特性。另外证明花烟草的花防御素控制昆虫攻击特别有效。本发明还提供了种子和已知的花防御素在控制植物害虫侵染中的新用途。
发明概述
贯穿本说明书,除非上下文需要,否则单词包含(comprise)或其变体(例如comprises或comprising)应当理解为,是指包含所述成分或整体、或者成分或整体组,而不排除任何其它的成分或整体、或者成分或整体组。
通过序列识别编号(SEQ ID NO:)提及核苷酸和氨基酸序列。SEQID NOs:以数字对应序列标识符<400>1、<400>2等。于权利要求书之后提供序列表。
本发明一般涉及单独或与其它遗传分子联合的遗传分子,及其在诱导植物或植物部分对病原体侵染(例如但不限于昆虫侵染)的抗性中的用途。更特别而言,本发明提供了编码防御素样分子的遗传分子,单独的或与编码蛋白酶抑制因子或其前体的遗传分子或其它活性分子联合,以防止植物中昆虫、微生物、真菌、蜘蛛类或病毒的攻击或其它形式的侵染。本发明另外包括包含单独的或与蛋白酶抑制因子或其前体或其它活性分子联合的防御素样分子的组合物,用于局部施用给植物或植物部分,以有助于控制植物的昆虫、微生物、真菌、蜘蛛类或病毒的侵染。本发明进一步包含该目的遗传分子在制备对昆虫、微生物、真菌、蜘蛛类或病毒的攻击或其它形式的侵染具有抗性或至少敏感性降低的转基因植物中的用途。该防御素分子也可能用作携带异源氨基酸序列的分子构架,该处的分子折叠改变为更具活跃的形式。本发明进一步包括包含天然结合该防御素样分子编码基因的启动子和/或其它调节序列的遗传构建体。该启动子和/或其它调节序列可能可操作性地连接编码防御素样蛋白质的cDNA分子,或者可操作性连接另一目的基因或核苷酸序列,例如但不限于编码蛋白酶抑制因子前体的基因。本发明还另外涉及对昆虫、微生物、真菌和/或病毒的攻击或其它形式的侵染具有抗性或至少敏感性降低的转基因植物或转基因植物的部分。特别优选的植物是粮食和非粮食作物,例如棉花植物。
因此,本发明一方面提供包含编码多肽的、或与编码多肽的序列互补的核苷酸序列的分离的核酸分子,该多肽的前体形式包含N端信号结构域、成熟结构域以及酸性C端结构域,其中该多肽在花发育期间生成,其成熟结构域具有抗一种或多种植物害虫的活性。
本发明另一方面涉及包含编码多肽的、或与编码多肽的序列互补的核苷酸序列的分离的核酸分子,该多肽的前体形式包含N端信号结构域、成熟结构域以及酸性C端结构域,其中该多肽在花发育期间生成,其成熟结构域包含以下结构:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数字下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字所示位置的半胱氨酸残基,其中该成熟结构域具有对抗一种或多种植物害虫的活性,附带条件是该多肽不是FST或TPP3。
本发明另一方面包括包含编码多肽的、或与编码多肽的序列互补的核苷酸序列的分离的核酸分子,该多肽的前体形式包含N端信号结构域、成熟结构域以及酸性C端结构域,其中该多肽在花瓣和萼片的表皮层、花柱的皮层细胞以及花药的结缔组织中生成,其成熟结构域包含以下结构:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数字下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字所示位置的半胱氨酸残基,其中该成熟结构域具有对抗一种或多种植物害虫的活性,附带条件是该多肽不是FST或TPP3。
本发明另一方面提供了包含编码多肽的、或与编码多肽的序列互补的核苷酸序列的分离的核酸分子,该多肽的前体形式包含N端信号结构域、成熟结构域以及酸性C端结构域,其中该成熟结构域包含SEQ ID NO:8所示氨基酸序列、或与其具有至少约70%相似性的氨基酸序列,或者由SEQ ID NO:7所示核苷酸序列、或与其具有至少约70%相似性的核苷酸序列、或在42℃低严谨性条件下能够与SEQ IDNO:7杂交的核苷酸序列编码。
本发明另一方面提供了包含与编码来源于花的防御素样分子的核苷酸序列可操作性连接的启动子或其功能等价物的遗传构建体,该防御素样分子具有包含以下氨基酸序列的成熟结构域:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数字下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字所示位置的半胱氨酸残基,其中该成熟结构域显示出对植物害虫(例如昆虫害虫)的抑制性活性,附带条件是该防御素样分子不是FST或TPP3。
本发明另一方面涉及该成熟结构域的氨基酸序列,其包含以下氨基酸序列[SEQ ID NO:58]:
X30X31CX32X33X34SX35X36FX37GX38CX39X40X41X42X43CX44X45X46CX47X48EX49FX50X51GX52CX53X54X55X56X57X58CX59CTX60X61C
其中X30=R或Q
X31=E,I或T
X32=K或E
X33=T,A或S
X34=E,P或Q
X35=N,Q或H
X36=T或R
X37=P,K或H
X38=I,L,P或T
X39=I,F,S或V
X40=T,M,R或S
X41=K,D,E或A
X42=P或S
X43=P,S或N
X44=R或A
X45=K,T,S或N
X46=A,Y或V
X47=I,L,Q或H
X48=S,K,T或N
X49=K或G
X50=T,S,I,或V
X51=D或G
X52=H,R,或N
X53=S,P或R
X54=K,W,A或G
X55=I,L或F
X56=L,Q,P或R
X57=R或P
X58=R或K
X59=L或F
X60=K,S或R
X61=P,N或H
本发明另一方面涉及可操作性连接包含以下氨基酸序列[SEQ IDNO:59]的信号结构域的成熟结构域编码序列:
MX1X2SX3X4X5X6X7X8X9X10X11X12X13X14X15X16X17X18X19X20X21X22X23X24X25X26X27X28AX29
其中X1=A,G或K
X2=R,N或L
X3=L,I或M
X4=C,F或R
X5=F或L
X6=M,F或I
X7=A或S
X8=F,T或A
X9=A,L,V或F
X10=I,V,L或F
X11=L或I
X12=A,I或M
X13=M,A或F
X14=M或L
X15=L或I
X16=F或V
X17=V,T或L
X18=A,T或S
X19=Y或T
X20=E或G
X21=V或M
X22=无氨基酸或G
X23=无氨基酸或P
X24=无氨基酸,M或V
X25=无氨基酸或T
X26=无氨基酸,I或S
X27=无氨基酸,A或V
X28=Q或E
X29=无氨基酸或Q
本发明另一方面涉及可操作性连接包含以下氨基酸序列[SEQ IDNO:60]的酸性C端结构域的成熟结构域编码序列:
X62X63X64X65X66X67X68X69X70X71X72X73X74X75X76X77X78X80X81X82X83X84X85X86X87X88X89X90X91X92X93X94X95
其中X62=无氨基酸或V
X63=无氨基酸或F
X64=无氨基酸或D
X65=无氨基酸或E或K
X66=无氨基酸或K或I
X67=无氨基酸或M或S
X68=无氨基酸或T,I或S
X69=无氨基酸或K或E
X70=无氨基酸或T或V
X71=无氨基酸或G或K
X72=无氨基酸或A
X73=无氨基酸或E
X74=无氨基酸或I或T
X75=无氨基酸或L
X76=无氨基酸或A,V或G
X77=无氨基酸或E
X78=无氨基酸或E
X79=无氨基酸或A
X80=无氨基酸或K
X81=无氨基酸或T
X82=无氨基酸或L
X83=无氨基酸或A或S
X84=无氨基酸或A或E
X85=无氨基酸或A或V
X86=无氨基酸或L或V
X87=无氨基酸或L
X88=无氨基酸或E
X89=无氨基酸或E
X90=无氨基酸或E
X91=无氨基酸或I
X92=无氨基酸或M
X93=无氨基酸或D或M
X94=无氨基酸或N或E
本发明另一方面涉及包含以下序列[SEQ ID NO:61]的防御素样分子:
MX1X2SX3X4X5X6X7X8X9X10X11X12X13X14X15X16X17X18X19X20X21X22X23X24X25X26X27X28AX29X30X31CX32X33X34SX35X36FX37GX38CX39X40X41X42X43CX44X45X46CX47X48EX49FX50X51GX52CX53X54X55X56X57X58CX59CTX60X61CX62X63X64X65X66X67X68X69X70X71X72X73X74X75X76X77X78X79X80X81X82X83X84X85X86X87X88X89X90X91X92X93X94
其中X1=A,G或K
X2=R,N或L
X3=L,I或M
X4=C,F或R
X5=F或L
X6=M,F或I
X7=A或S
X8=F,T或A
X9=A,L,V或F
X10=I,V,L或F
X11=L或I
X12=A,I或M
X13=M,A或F
X14=M或L
X15=L或I
X16=F或V
X17=V,T或L
X18=A,T或S
X19=Y或T
X20=E或G
X21=V或M
X22=无氨基酸或G
X23=无氨基酸或P
X24=无氨基酸,M或V
X25=无氨基酸或T
X26=无氨基酸,I或S
X27=无氨基酸或A或V
X28=Q或E
X29=无氨基酸或Q
X30=R或Q
X31=E,I或T
X32=K或E
X33=T,A或S
X34=E,P或Q
X35=N,Q或H
X36=T或R
X37=P,K或H
X38=I,L,P或T
X39=I,F,S或V
X40=T,M,R或S
X41=K,D,E或A
X42=P或S
X43=P,S或N
X44=R或A
X45=K,T,S或N
X46=A,Y或V
X47=I,L,Q或H
X48=S,K,T或N
X49=K或G
X50=T,S,I或V
X51=D或G
X52=H,R,或N
X53=S,P或R
X54=K,W,A或G
X55=I,L或F
X56=L,Q,P或R
X57=R或P
X58=R或K
X59=L或F
X60=K,S或R
X61=P,N或H
X62=无氨基酸或V
X63=无氨基酸或F
X64=无氨基酸或D
X65=无氨基酸或E或K
X66=无氨基酸或K或I
X67=无氨基酸或M或S
X68=无氨基酸或T,I或S
X69=无氨基酸或K或E
X70=无氨基酸或T或V
X71=无氨基酸或G或K
X72=无氨基酸或A
X73=无氨基酸或E
X74=无氨基酸或I或T
X75=无氨基酸或L
X76=无氨基酸或A,V或G
X77=无氨基酸或E
X78=无氨基酸或E
X79=无氨基酸或A
X80=无氨基酸或K
X81=无氨基酸或T
X82=无氨基酸或L
X83=无氨基酸或A或S
X84=无氨基酸或A或E
X85=无氨基酸或A或V
X86=无氨基酸或L或V
X87=无氨基酸或L
X88=无氨基酸或E
X89=无氨基酸或E
X90=无氨基酸或E
X91=无氨基酸或I
X92=无氨基酸或M
X93=无氨基酸或D或M
X94=无氨基酸或N或E
本发明另一方面涉及遗传构建体,其包含选自SEQ ID NO:7、SEQID NO:13、SEQ ID NO:15和SEQ ID NO:17的核苷酸序列,或与SEQID NO:8、SEQ ID NO:14、SEQ ID NO:16和SEQ ID NO:18中的一个或多个具有至少约70%相似性的核苷酸序列,或能够与SEQ IDNO:7、SEQ ID NO:13、SEQ ID NO:15和SEQ ID NO:17或其互补形式杂交的核苷酸序列。
本发明另一方面涉及用于产生昆虫抗性转基因植物的遗传构建体,该转基因植物生成防御素或防御素样分子,其选自SEQ IDNO:8、SEQ ID NO:14、SEQ ID NO:16和SEQ ID NO:18以及SEQ IDNO:20到SEQ ID NO:49、或者与SEQ ID NO:8、SEQ ID NO:14、SEQID NO:16和SEQ ID NO:18中任何一个具有至少约70%相似性的氨基酸序列。
本发明另一方面还包含产生对植物害虫抗性提高或增强的植物的方法,该方法包含将遗传构建体引入一个或一群植物细胞的基因组中,该遗传构建体包含与来源于花的防御素样分子的编码核苷酸序列可操作性连接的启动子或其功能等价物,该防御素样分子具有包含以下氨基酸序列的成熟结构域:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数字下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字所示位置的半胱氨酸残基,其中该成熟结构域显示出对植物害虫(例如昆虫害虫)的抑制性活性,并从该细胞或细胞群再生出植物。
本发明另一方面涉及包含具有以下氨基酸序列[SEQ ID NO:58]的成熟结构域的防御素样分子:
X30X31CX32X33X34SX35X36FX37GX38CX39X40X41X42X43CX44X45X46CX47X48EX49FX50X51GX52CX53X54X55X56RX57CX59CTX60X61C
其中X30=R或Q
X31=E,I或T
X32=K或E
X33=T,A或S
X34=E,P或Q
X35=N,Q或H
X36=T或R
X37=P,K或H
X38=I,L,P或T
X39=I,F,S或V
X40=T,M,R或S
X41=K,D,E或A
X42=P或S
X43=P,S或N
X44=R或A
X45=K,T,S或N
X46=A,Y或V
X47=I,L,Q或H
X48=S,K,T或N
X49=K或G
X50=T,S,I,或V
X51=D或G
X52=H,R,或N
X53=S,P或R
X54=K,W,A或G
X55=I,L或F
X56=L,Q,P或R
X57=R或P
X58=R或K
X59=L或F
X60=K,S或R
X61=P,N或H
本发明另一方面提供了产生对昆虫抗性提高或增强的植物的方法,该方法包含将遗传构建体引入一个或一群植物细胞的基因组中,该遗传构建体包含与防御素样分子的编码核苷酸序列可操作性连接的启动子或其功能等价物,该防御素样分子具有包含以下氨基酸序列的成熟结构域:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数字下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字所示位置的半胱氨酸残基,其中该成熟结构域显示出对植物害虫(例如昆虫害虫)的抑制性活性,并从该细胞或细胞群再生出植物。
本发明另一方面提供了来自植物或转化的微生物细胞的转染或转化的细胞、组织或器官,该细胞、组织或器官包含含编码多肽的、或与编码多肽的序列互补的核苷酸序列的核酸分子,该多肽的前体形式包含N端信号结构域、成熟结构域以及酸性C端结构域,其中该多肽在花发育期间生成,其成熟结构域具有抗一种或多种植物害虫的活性。
本发明另一方面涉及包含编码多肽的、或与编码多肽的序列互补的核苷酸序列的核酸分子,该多肽的前体形式包含N端信号结构域、成熟结构域以及酸性C端结构域,其中该多肽在花发育期间生成,其成熟结构域包含以下结构:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数字下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字所示位置的半胱氨酸残基,其中该成熟结构域具有抗一种或多种植物害虫的活性。
本发明另一方面在其范围内涉及改造为表达防御素样分子或其变体或同系物的编码核酸分子的植物,进一步延伸到该植物的子代,以及该植物的营养、繁殖和再生部分,例如花(包括切或割的花)、植物部分、植物的纤维物质(例如棉)以及再生部分,包括插枝、花粉、种子和愈伤组织。
本发明另一方面提供能够生成此处所述异源防御素样分子的遗传修饰的植物细胞、或多细胞植物或其子代、或遗传修饰植物的部分,其中该转基因植物对植物害虫例如昆虫具有抗性或敏感性降低。
本发明另一方面包含一种或多种单独或联合的包含与第一核苷酸序列可操作性连接的第一启动子的遗传构建体,其中该第一核苷酸序列编码能够防止植物害虫例如昆虫的防御素样分子,该构建体进一步包含与第二核苷酸序列可操作性连接的第二启动子,其中该第二核苷酸序列编码蛋白酶抑制因子或其前体。
附图简述
图1代表花烟草花防御素的编码cDNA NaPdf1(花烟草植物防御素1)的核苷酸序列(SEQ ID NO:17)和预测的氨基酸序列(SEQ IDNO:18)。只显示了具有mRNA极性的一条链,核苷酸在上方编号。核苷酸序列下方给出了单字母编码的氨基酸序列,从成熟蛋白质的第一个氨基酸开始编号为1。推定的信号肽由负数表示,并加下划线。成熟蛋白质加亮表示,箭头所指为预测的信号肽断裂位点以及成熟蛋白质的末端。第一个终止密码子标记为星号(*),两个多聚腺苷酸化位点为粗体。详情参看实施例7。
图2为图解表示各种花烟草组织中NaPdf1表达的RNA凝胶印迹分析。从花烟草(自交不亲和性基因型S2S2)发育I期(5-10mm花蕾)、II期(20-30mm花蕾)和III期(50-70mm花蕾)的花药、花粉粒以及成熟雌蕊、子房、花瓣、叶和根组织中分离总RNA,如图A所示。图B显示经溴化乙锭染色的相同RNA样品。
图3放射自显影图,显示NaPdf1 RNA的原位定位。(A)1cm长花蕾的横切面,与35S标记的NaPdf1反义RNA探针杂交。检测到花瓣(Pe)和萼片(Se)的表皮细胞、雌蕊(Pi)的皮质细胞以及花药(A)的结缔组织为重标记。(B)与A相同的切面,较高放大倍数。(C)与B类似的切面,与35S标记的NaPdf1有义RNA探针杂交。观察到雌蕊(Pi)、花药(A)、花瓣(Pe)或萼片(Se)的任何细胞均未标记。
图4A显示细菌性表达N端六聚组氨酸标签的NaPdf1 cDNA编码的前防御素(6H.NaproPdf1)。泳道1:1mM IPTG诱导6小时后提取的总蛋白,处于1xSDS载样缓冲液中。泳道2:处于8M尿素溶解物中的可溶性蛋白质。泳道3:IMAC纯化的诱导蛋白质。利用15%w/vSDS聚丙烯酰胺凝胶分离蛋白质,考马斯蓝染色。分子大小标志为Bio-Rad的宽范围标准。诱导的~12kDa蛋白质(箭头所示)经固化金属亲合层析(IMAC),基本纯净。
图4B显示金属亲合纯化的6H.NaproPdf1蛋白质(A的IMAC)样品的反相HPLC层析,如实施例5所示洗脱。
图5显示利用针对细菌表达NaPdf1 cDNA克隆编码的前防御素(6H.NaproPdf1)产生的抗体,对植物提取物的免疫印迹分析。(A)图示花烟草花发育的5个期。(B)来自(A)中所示花发育期的花的缓冲液可溶性蛋白质(60μg)的免疫印迹图。利用15%w/v SDS-聚丙烯酰胺凝胶分离蛋白质,然后转到硝酸纤维素(0.22μm),利用针对细菌表达的6H.NaproPdf1(参见图4)产生的抗体(1∶2500)进行免疫印迹。该抗体特异性结合三种蛋白质。最小的是预计的成熟防御素大小(~5kDa),两个较大的可能是前体和加工中间体。详情参见实施例4和5。
图6显示纯化来自花蕾的成熟的花烟草防御素。(A)AquaporeRP-300 C8柱(4.6mmx100mm,Brownlee)的反相HPLC。从花蕾提取蛋白质,RP-HPLC之前经凝胶过滤层析(参见实施例5)部分纯化。蛋白质处于0.1%v/v TFA中,用60%v/v乙腈的0.089%v/v TFA(缓冲液B)洗脱,梯度为40分钟内0-100%缓冲液B,流速1mL/分钟。利用215nm吸光值检测洗脱的蛋白质。通过15%w/v SDS PAGE分离峰A中(插入的)蛋白质,利用抗6H.NaproPdf1抗体进行免疫印迹(实施例4)。(B)N端测序和质谱分析术证实峰A为NaPdf1 cDNA克隆编码的成熟防御素结构域。″x″对应于未确定的氨基酸,从cDNA序列预测可能为半胱氨酸。
图7是显示花烟草防御素在10mm花蕾的花药和子房中定位的一系列电子显微照片。(A)观察花药显示液泡内电子致密沉积区的结缔组织细胞(箭头所示)。(B)防御素于花药的结缔组织细胞的免疫金定位。抗体与液泡的电子致密沉积区(v)相结合,而不结合细胞质(ct)或细胞壁(cw)。(C)防御素于子房的皮质细胞的免疫金定位。抗体特异性结合液泡中的电子致密沉积区,未观察到结合细胞质或细胞壁。
图8为从编码花和种子防御素的cDNA克隆预测的前体蛋白质的示意图。(A)某些花防御素生成为具有三个不同结构域的前体蛋白质:ER信号序列(图示左部)、主要的基本结构域(图示中部)以及富含酸性氨基酸的C端结构域(图示右部)。图下所示花烟草防御素每个结构域的预计大小。成熟的花防御素在蛋白水解断裂(箭头所示)之后释放。(B)种子来源的防御素cDNAs编码的蛋白质具有ER信号序列以及基本的防御素结构域,但无C端酸性结构域。
图9为NaPdf1的氨基酸序列与其它五个来源于花的cDNA克隆编码的预计氨基酸序列的比对,如下所述:
FST Gu等人,Mol.Gen.Genet.234:89-96,
(花特异性硫素):1992;
TPP3: Milligan和Gasser,Plant Mol.Biol.28:
691-711,1995;
NTS 13:Li和Gray,Plant Physiology 120:633,
1999;
PPT: Karunanandaa等人,Plant Mol.Biol.,26:
459-464,1994;
ATPIIIa:Yu等人,直接提交,登录号S30578,1999.
某些而非所有的花防御素具有32-33个氨基酸的C端酸性结构域。
图10为NaPdf1成熟结构域的氨基酸序列与植物防御素家族其它成员的成熟结构域的氨基酸序列的比对。″pQ″代表的Rs-AFP1、Rs-AFP2、M1、M2A和M2B序列中的N端氨基酸为焦谷氨酸。序列来自下列来源:
FST: Gu等人,(1992;同上)(SEQ ID NO:25);
TPP3:Milligan和Gasser(1995;同上)(SEQ ID
NO:26);
p322:Steikema等人,Plant Mol.Biol.11:255-
269,1988(SEQ ID NO:27);
PPT: Karunanandaa等人,(1994;同上)(SEQ ID
NO:28);
SE60:Choi等人,Plant Physiology 101:699-700,
1993;Choi等人,Mol.Gen.Genet.246:266-
268,1995(SEQ ID NO:29);
γ1-H:Mendez等人,Eur.J.Biochem.194:533-539,
1990(SEQ ID NO:30);
M2A,M1和Neumann等人,Int.J.Protein & Peptide
M2B: Research 47:437-446,1996(分别为SEQ ID
NO:31,SEQ ID NO:35和SEQ ID NO:36);
Pth-Stl:Moreno等人,Eur.J.Biochem.223:135-139,
1995(SEQ ID NO:32);
Rs-AFP1和Terras等人,J.Biological Chemistry 267:
Rs-AFP2:15301-15309,1992;Terras等人,FEBS
Letters 316:233-240,1993;Terras等人,
Plant Cell 7:573-588,1995;以及Fant等
人,The solution structure by 1H-NMR of Rs-
AFP1,a plant antifungal protein from
radish seeds.In:LP Ingman,J Jokissaari,
J Lounila(eds),Abstracts of the 12th
European Experimental NMR Conference,p
247,1994(分别为SEQ ID NO:33和SEQ ID
NO:34);
γ1-P:Collila等人,FEBS Letters 270:191-194,
1990(SEQ ID NO:37);
γ2-P:Collila等人,(1990;同上)(SEQ ID NO:38);
10kDa:Ishibashi等人,Plant Mol.Biol.15:59-64,
1990(SEQ ID NO:39);
SIα2,SIα3 Bloch和Richardson,FEBS Letters 279:101-
和SIα1:104,1991以及Nitti等人,Eur.J.Biochem.
228:250-256,1995(分别为SEQ ID NO:40,
SEQ ID NO:41和SEQ ID NO:43);
Dm-AMP2,
Ah-AMP1,
Hs-AFP1,
Dm-AMP1和
Ct-AMP1:Osborn等人,FEBS Letters 368:257-262,
1995(分别为SEQ ID NO:42,SEQ ID NO:45,
SEQ ID NO:46,SEQ ID NO:47和SEQ ID
NO:49);
pI230和P Chiang and Hagwiger,Mol.Plant-Microbe
139: Interact.4:324-331,1991(分别为SEQ ID
NO:44和SEQ ID NO:48);
NeThio1和Yamada等人,Plant Physiology 115:314,
NeThio2:1997;(SEQ ID NO:50和SEQ ID NO:51);以及
NpThio1:Komori等人,Plant Physiology 115:314,
1997(SEQ ID NO:52).
图11显示通过监控595nm吸光值得到的各种试剂抗灰色葡萄孢(Botrytis cinerea)的生长抑制曲线。每种处理按一式四份进行。测定20μg/ml的纯化NaPdf1蛋白质。水和卵清蛋白(20μg/ml)作为阴性对照,抗真菌蛋白质α-和β-嘌呤硫素(purothionin)的混合物(20μg/ml)用作阳性对照。
图12显示通过监控595nm吸光值得到的各种试剂抗尖孢镰孢(Fusarium oxysporum)f.sp.dianthi(A)和f.sp.vasinfectum(B和C)的生长抑制曲线。每种处理按一式四份进行。测定20μg/ml(A和B)以及10μg/ml(C)的纯化NaPdf1蛋白质。水和卵清蛋白(20μg/ml,A和B;10μg/ml,C)作为阴性对照,抗真菌蛋白质α-和β-嘌呤硫素的混合物(20μg/ml,A和B;10μg/ml,C)用作阳性对照。
图13图示用于转化烟草和棉花的植物转化构建体pFL1和pHEX3。两个构建体均包含位于CaMV35S启动子/终止子控制下的花烟草防御素NaPdf1。命名为″surB″的区域编码除草剂glean抗性,名为″nptII″的区域编码抗生素卡那霉素抗性。
图14显示蛋白质印迹图,表明在转基因烟草植物中表达(A)花烟草蛋白酶抑制因子(NaPI)蛋白质和(B)NaPdf1蛋白质。在A中,泳道1:25ng NaPI;泳道2:100ng NaPI;泳道3:pHEX3.4;泳道4:未转化的W38以及泳道5:pFL1/W19。在B中,泳道1:pHEX3.4;泳道2:pFL1/W19;泳道3:未转化的W38以及泳道4:花烟草花蕾提取物。(C)表明在转基因棉株中表达NaPdf1蛋白质。泳道1:25ng纯化的NaPdf1;泳道2:植物CT28.14.1(利用无关质粒转化)以及泳道3:植物CT35.9.1(利用pHEX3转化)。
图15显示饲喂NaPdf1基因转化的转基因烟草(N.tabacum)叶(pHEX3.4和pFL1/W19系)以及未转化的W38亲本植物的澳洲棉铃虫(H.punctigera)和棉铃虫(H.armigera)的生长曲线。(A)第2-18天测定的澳洲棉铃虫幼虫的存活率,(B)第7-18天测定的澳洲棉铃虫幼虫的平均重量,(C)第3-23天测定的棉铃虫幼虫的存活率,(D)第6-23天测定的棉铃虫幼虫的平均重量。
图16显示饲喂包含0.03%NaPdf1、0.3%NaPdf1、0.3%NaPI或酪蛋白(对照)而非待测蛋白质的人工食物的棉铃虫幼虫平均重量。饲喂6、9、12和14天以后测定幼虫重量。
图17显示饲喂NaPdf1转化的转基因棉(CT35.9.4和CT35.125.1系)以及未转化的亲本Coker 315的棉铃虫幼虫在第8天的平均重量。
表1概述了氨基酸和核苷酸序列的标识符。
表2用于棉铃虫饲喂试验的人工食物成分
表1
序列ID NO: |
描述 |
SEQ ID NO:1 |
引物FST1 |
SEQ ID NO:2 |
引物FST2 |
SEQ ID NO:3 |
引物PDF1 |
SEQ ID NO:4 |
引物PDF2 |
SEQ ID NO:5 |
引物FLOR1 |
SEQ ID NO:6 |
引物FLOR2 |
SEQ ID NO:7 |
编码成熟结构域的cDNA(NaPdf1) |
SEQ ID NO:8 |
对应SEQ ID NO:7的氨基酸序列 |
SEQ ID NO:9 |
编码N端结构域的cDNA(NaPdf1) |
SEQ ID NO:10 |
对应SEQ ID NO:9的氨基酸序列 |
SEQ ID NO:11 |
编码C端酸性尾部的cDNA(NaPdf1) |
SEQ ID NO.12 |
对应SEQ ID NO:11的氨基酸序列 |
SEQ ID NO:13 |
编码N端+成熟结构域的cDNA(NaPdf1) |
SEQ ID NO:14 |
对应SEQ ID NO:13的氨基酸序列 |
SEQ ID NO:15 |
编码成熟+酸性C端结构域的cDNA(NaPdf1) |
SEQ ID NO:16 |
对应SEQ ID NO:15的氨基酸序列 |
SEQ ID NO:17 |
编码NaPdf1的cDNA |
SEQ ID NO:18 |
对应SEQ ID NO:17的氨基酸序列 |
SEQ ID NO:19 |
对应NaPdf13’端的cDNA |
SEQ ID NO:20 |
完整FST的氨基酸序列 |
SEQ ID NO:21 |
完整TPP3的氨基酸序列 |
SEQ ID NO:22 |
完整NTS13的氨基酸序列 |
SEQ ID NO:23 |
完整PPT的氨基酸序列 |
SEQ ID NO:24 |
完整ATPIIIa的氨基酸序列 |
SEQ ID NO:25 |
FST成熟结构域的氨基酸序列 |
SEQ ID NO:26 |
TPP3成熟结构域的氨基酸序列 |
SEQ ID NO:27 |
P322成熟结构域的氨基酸序列 |
序列ID NO: |
描述 |
SEQ ID NO:28 |
PPT成熟结构域的氨基酸序列 |
SEQ ID NO:29 |
SE60成熟结构域的氨基酸序列 |
SEQ ID NO:30 |
γ1-H成熟结构域的氨基酸序列 |
SEQ ID NO:31 |
M2A成熟结构域的氨基酸序列 |
SEQ ID NO:32 |
PTH-St1成熟结构域的氨基酸序列 |
SEQ ID NO:33 |
Rs-AFP1成熟结构域的氨基酸序列 |
SEQ ID NO:34 |
Rs-AFP2成熟结构域的氨基酸序列 |
SEQ ID NO:35 |
M1成熟结构域的氨基酸序列 |
SEQ ID NO:36 |
M2B成熟结构域的氨基酸序列 |
SEQ ID NO:37 |
γ1-P成熟结构域的氨基酸序列 |
SEQ ID NO:38 |
γ2-P成熟结构域的氨基酸序列 |
SEQ ID NO:39 |
10kDa成熟结构域的氨基酸序列 |
SEQ ID NO:40 |
SIα2成熟结构域的氨基酸序列 |
SEQ ID NO:41 |
SIα3成熟结构域的氨基酸序列 |
SEQ ID NO:42 |
Dm-AMP2成熟结构域的氨基酸序列 |
SEQ ID NO:43 |
SIα1成熟结构域的氨基酸序列 |
SEQ ID NO:44 |
P1230成熟结构域的氨基酸序列 |
SEQ ID NO:45 |
Ah-AMP1成熟结构域的氨基酸序列 |
SEQ ID NO:46 |
Hs-AFP1成熟结构域的氨基酸序列 |
SEQ ID NO:47 |
Dm-AMP1成熟结构域的氨基酸序列 |
SEQ ID NO:48 |
P139成熟结构域的氨基酸序列 |
SEQ ID NO:49 |
Ct-AMP1成熟结构域的氨基酸序列 |
SEQ ID NO:50 |
NeThio1成熟结构域的氨基酸序列 |
SEQ ID NO:51 |
NeThio2成熟结构域的氨基酸序列 |
SEQ ID NO:52 |
NpThio1成熟结构域的氨基酸序列 |
SEQ ID NO:53 |
NTS13成熟结构域的氨基酸序列 |
SEQ ID NO:54 |
PPT成熟结构域的氨基酸序列 |
SEQ ID NO:55 |
ATPIIIa成熟结构域的氨基酸序列 |
SEQ ID NO:56 |
编码NaPI成熟结构域的cDNA |
序列ID NO: |
描述 |
SEQ ID NO:57 |
对应SEQ ID NO:56的氨基酸序列 |
SEQ ID NO:58 |
防御素成熟结构域的共有序列 |
SEQ 1D NO:59 |
防御素内部结构域的共有序列 |
SEQ ID NO:60 |
防御素C端结构域的共有序列 |
SEQ ID NO:61 |
防御素的共有氨基酸序列 |
表2
优选实施方案详述
本发明部分基于花来源的植物防御素样分子的生物学特性的确定,以及阐明种子来源的防御素和先前已知的花来源的防御素的新特性。重要的是描述显示抗植物病原体、特别是植物害虫例如昆虫和真菌活性的新的花来源的防御素样分子。也描述了预期显示抗昆虫活性的其它防御素分子。
因此,本发明一方面提供包含编码多肽的、或与编码多肽的序列互补的核苷酸序列的分离的核酸分子,该多肽的前体形式包含N端信号结构域、成熟结构域以及酸性C端结构域,其中该多肽在花发育期间生成,其成熟结构域具有抗一种或多种植物害虫的活性。
本发明这一方面不涉及防御素FST[花特异性硫素](Gu等人,{1992;同上})或TPP3(Milligan和Gasser,{1995;同上})。
此处涉及到的″多肽″包括肽或蛋白质。多肽一般包含半胱氨酸残基,其在花及非花来源的防御素分子中的位置是保守的。可如下确定八个半胱氨酸残基的位置:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数字下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字所示位置的半胱氨酸残基。
因此,本发明另一方面涉及包含编码多肽的、或与编码多肽的序列互补的核苷酸序列的分离的核酸分子,该多肽的前体形式包含N端信号结构域、成熟结构域以及酸性C端结构域,其中该多肽在花发育期间生成,其成熟结构域包含以下结构:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数字下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字表示的位置的半胱氨酸残基,其中该成熟结构域具有抗一种或多种植物害虫的活性,条件是该多肽不是FST或TPP3。
术语″分离″是指核酸分子经受至少一个从更复杂的溶液或来源中分离、或浓缩、或富集的步骤。例如,术语″分离″包括核酸分子通过沉淀、离心、电泳、微滤、电穿孔或层析从生物学或化学样品中浓缩或富集。然而术语″分离″决不意在将核酸分子限制于特定位置或状态,本发明涉及引入细胞基因组中的核酸分子、或者其基因组中已经引入核酸分子的细胞子代中存在的核酸分子。
此处涉及的″核酸分子″包括涉及的DNA或RNA(例如mRNA)或DNA/RNA杂合体。核酸分子可特别视为遗传分子、核苷酸序列或多核苷酸序列。优选地,尽管本发明涉及基因组形式的核酸分子,核酸分子是cDNA分子。本发明的核酸分子也可能分别编码N端信号结构域、成熟结构域和/或酸性C端结构域或其组合。例如,核酸分子可能编码可操作性连接成熟结构域的N端信号结构域。另外,它可能编码可操作性连接酸性C端结构域的成熟结构域。核酸分子也可能编码所有三个结构域或包含来自其它防御素或防御素样分子的异源结构域。本发明包括异源防御素样分子的开发,并提供拓宽抗昆虫或抗害虫谱的方法。异源分子也可能包含多个成熟结构域和随机重复的成熟结构域、或者活性所需的其它结构域。
此处涉及到″花发育″期间的多肽生成包括涉及在花部分的生成,例如但不限于在花区的雌蕊、花药、子房、萼片和花瓣的生成。优选地,在花瓣和萼片表皮层、花柱皮层细胞以及花药的结缔组织生成多肽。
因此,本发明另一方面包括包含编码多肽的、或与编码多肽的序列互补的核苷酸序列的分离的核酸分子,该多肽的前体形式包含N端信号结构域、成熟结构域以及酸性C端结构域,其中该多肽在花瓣和萼片的表皮层、花柱的皮层细胞以及花药的结缔组织中生成,其成熟结构域包含以下结构:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数字下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字表示的位置的半胱氨酸残基,其中该成熟结构域具有抗一种或多种植物害虫的活性,附带条件是该多肽不是FST或TPP3。
在另一实施方案中,本发明提供包含编码多肽的、或与编码多肽的序列互补的核苷酸序列的分离的核酸分子,该多肽包含两个或多个具有抗一种或多种植物害虫活性的成熟结构域以及可选的N端信号结构域和可选的酸性C端结构域。后一实施方案的多肽应视为融合多肽。
本发明多肽的生成部位可能依据表达该核酸分子所用的遗传构建体而变化。例如,可能使用发育调节和/或组织特异性启动子,在任何组织种直接表达该核酸分子。然而,天然存在的多肽在花发育期间生成,更特别地,在花的上述组织中生成。
术语″植物害虫″对于本发明防御素样分子针对的生物体类型没有任何限制。植物害虫包括昆虫、蜘蛛类、微生物、真菌或病毒。在特别优选的实施方案中,植物害虫是昆虫。
在最优选的实施方案中,从花烟草及相关物种、或其变种或种株中分离该防御素样分子或其编码核酸分子。花烟草防御素成熟结构域的氨基酸序列如下(单字母编码):
RECKTESNTF PGICITKPPC RKACISEKFT DGHCSKILRR CLCTKPC
[SEQ ID NO:8].
SEQ ID NO:8的编码核苷酸序列如SEQ ID NO:7所述。
本发明涉及SEQ ID NO:8的新变体,例如氨基酸序列与SEQ IDNO:8所示序列具有至少约70%相似性的变体,或者由能够在42℃、低严谨性条件下与SEQ ID NO:8的编码核苷酸序列(即SEQ ID NO:7)杂交的核苷酸序列编码的变体。
因此,本发明另一方面提供了包含编码多肽的、或与编码多肽的序列互补的核苷酸序列的分离的核酸分子,该多肽的前体形式包含N端信号结构域、成熟结构域以及酸性C端结构域,其中该成熟结构域包含SEQ ID NO:8所示序列、或与其具有至少约70%相似性的氨基酸序列,或SEQ ID NO:7所示核苷酸序列、或与其具有至少约70%相似性的核苷酸序列、或能够在42℃、低严谨性条件下与SEQ ID NO:7或其互补形式杂交的核苷酸序列编码的氨基酸序列。
此处所用术语″相似性″包括所比较的序列之间在核苷酸或氨基酸水平上完全一致。如果在核苷酸水平上不一致,″相似性″包括导致氨基酸不同、但不过在结构、功能、生物化学和/或构象水平上彼此相关的序列间的差异。如果在氨基酸水平上不一致,″相似性″包括仍然在结构、功能、生物化学和/或构象水平上彼此相关的氨基酸。在特别优选的实施方案中,在一致性而非相似性水平上进行核苷酸及序列比较。
用于描述两个或多个多核苷酸或多肽之间序列关系的术语包括″参考序列″、″比较窗口″、″序列相似性″、″序列一致性″、″序列相似性百分比″、″序列一致性百分比″、″基本相似″和″基本一致″。″参考序列″长度为至少12个、但往往15-18个、通常至少25个或以上,例如30个单体单位,包括核苷酸和氨基酸残基。由于两个多核苷酸可能各包含(1)两个多核苷酸之间的相似序列(即只是完整多核苷酸序列的一部分),以及(2)两个多核苷酸之间的差异序列,一般通过在″比较窗口″比较两个多核苷酸序列,鉴别和比较局部区域的序列相似性,进行两个(或多个)多核苷酸之间的序列比较。″比较窗口″是指一般12个连续残基的与参考序列比较的概念性片段。为了两个序列的最佳比对,比较窗口可能包含与参考序列(不包含添加或缺失)相比大约20%或更少的添加或缺失(即空位)。排列比较窗口,进行序列的最佳比对,可通过计算机执行算法(Wisconsin Genetics SoftwarePackage Release 7.0中的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575 Science Drive Madison,WI,USA),或者通过所选任何方法得到的校验和最佳比对(即在比较窗口产生最高同源性百分比)来进行。也可以参考BLAST程序家族,例如Altschul等人(Nucl.Acids Res.25:3389,1997)公开的程序。可以在Ausubel等人的19.3单元找到序列分析的详细论述(″CurrentProtocols in Molecular Biology″John Wiley & Sons Inc,1994-1998,第15章)。
此处所用术语″序列相似性″和″序列一致性″是指序列比较窗口内,基于核苷酸比核苷酸、或氨基酸比氨基酸的一致或者功能或结构上相似的程度。因此,例如″序列一致性百分比″是通过比较窗口比较中两个最佳比对的序列,确定两个序列中存在的相同的核酸碱基(例如A、T、C、G、I)或相同的氨基酸残基(例如Ala、Pro、Ser、Thr、Gly、Val、Leu、Ile、Phe、Tyr、Trp、Lys、Arg、His、Asp、Glu、Asn、Gln、Cys和Met)的位置数,得到匹配的位置数,将匹配的位置数除以比较窗口中的位置总数(即窗口大小),结果乘以100,得到序列一致性百分比。为了本发明目的,″序列一致性″应当理解为是指通过DNASIS计算机程序(windows版本2.5;得自Hitachi Softwareengineering Co.,Ltd.,South San Francisco,California,USA),采用软件所附参考手册中使用的标准缺省值计算的″匹配百分比″。类似说明适用于有关序列相似性。
此处提及的″低严谨性″包括并包含至少大约0-15%v/v甲酰胺和至少大约1-2M盐用于杂交,以及至少大约1M-2M盐用于洗涤条件。低严谨性一般为大约25-30℃到大约42℃。温度可能变化,较高温度用于替换甲酰胺和/或给出另一个严谨性条件。必要时可应用另一个严谨性条件,例如中等严谨性,其包括并包含至少大约16%-30%v/v甲酰胺和至少大约0.5M-0.9M盐用于杂交,以及至少大约0.5M-0.9M盐用于洗涤条件,或者高严谨性,其包括并包含至少大约31%-50%v/v甲酰胺和至少大约0.01M-0.15M盐用于杂交,以及至少大约0.01M-0.15M盐用于洗涤条件。一般在Tm=69.3+0.41(G+C)%进行洗涤(Marmur和Doty,J.Mol.Biol.5:109,1962)。但双链DNA错配碱基对的数目每增加1%,其Tm降低1℃(Bonner和Laskey,Eur.J.Biochem.46:83,1974)。在这些杂交条件中,甲酰胺是可选的。因此,如下确定特别优选的严谨性水平:低严谨性为6x SSC缓冲液、0.1%w/v SDS、25-42℃;中度严谨性为2x SSC缓冲液、0.1%w/v SDS、温度20℃-65℃;高严谨性为0.1x SSC缓冲液、0.1%w/v SDS、温度至少65℃。
本发明此处举例说明有关花烟草的防御素样分子。然而,应当理解本发明涉及任何植物的任何新的花来源的防御素样分子,只要该分子具有抗植物害虫、特别是昆虫的活性。本发明涉及防御素样分子的衍生物,包括异源分子,以及已知的防御素作为抗昆虫分子的用途。
提及″防御素样分子″是为了强调本发明涉及防御素分子同系物的事实。
本发明进一步提供遗传构建体,用于在植物中表达防御素样分子的编码核苷酸序列,以保护植物免受植物害虫。
因此,本发明另一方面提供了包含与来源于花的防御素样分子的编码核苷酸序列可操作性连接的启动子或其功能等价物的遗传构建体,该防御素样分子的成熟结构域包含以下氨基酸序列:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数字下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字表示的位置的半胱氨酸残基,其中该成熟结构域显示出对植物害虫(例如昆虫害虫)的抑制性活性,附带条件是该防御素样分子不是FST或TPP3。
在优选实施方案中,该成熟结构域的氨基酸序列包含以下氨基酸序列[SEQ ID NO:58]:
X30X31CX32X33X34SX35X36FX37GX38CX39X40X41X42X43CX44X45X46CX47X48EX49FX50X51GX52CX53X54X55X56X57X58CX59CTX60X61C
其中X30=R或Q
X31=E,I或T
X32=K或E
X33=T,A或S
X34=E,P或Q
X35=N,Q或H
X36=T或R
X37=P,K或H
X38=I,L,P或T
X39=I,F,S或V
X40=T,M,R或S
X41=K,D,E或A
X42=P或S
X43=P,S或N
X44=R或A
X45=K,T,S或N
X46=A,Y或V
X47=I,L,Q或H
X48=S,K,T或N
X49=K或G
X50=T,S,I,或V
X51=D或G
X52=H,R,或N
X53=S,P或R
X54=K,W,A或G
X55=I,L或F
X56=L,Q,P或R
X57=R或P
X58=R或K
X59=L或F
X60=K,S或R
X61=P,N或H
该成熟结构域编码序列可能可操作性地连接包含以下氨基酸序列[SEQ ID NO:59]的信号结构域:
MX1X2SX3X4X5X6X7X8X9X10X11X12X13X14X15X16X17X18X19X20X21X22X23X24X25X26X27X28AX29
其中X1=A,G或K
X2=R,N或L
X3=L,I或M
X4=C,F或R
X5=F或L
X6=M,F或I
X7=A或S
X8=F,T或A
X9=A,L,V或F
X10=I,V,L或F
X11=L或I
X12=A,I或M
X13=M,A或F
X14=M或L
X15=L或I
X16=F或V
X17=V,T或L
X18=A,T或S
X19=Y或T
X20=E或G
X21=V或M
X22=无氨基酸或G
X23=无氨基酸或P
X24=无氨基酸,M或V
X25=无氨基酸或T
X26=无氨基酸或S
X27=无氨基酸,A或V
X28=Q或E
X29=无氨基酸或Q
有时该成熟结构域编码序列可能可操作性连接包含以下序列[SEQID NO:60]的酸性C端结构域:
X62X63X64X65X66X67X68X69X70X71X72X73X74X75X76X77X78X79X80X81X82X83X84X85X86X87X88X89X90X91X92X93X94
其中X62=无氨基酸或V
X63=无氨基酸或F
X64=无氨基酸或D
X65=无氨基酸或E或K
X66=无氨基酸或K或I
X67=无氨基酸或M或S
X68=无氨基酸或T,I或S
X69=无氨基酸或K或E
X70=无氨基酸或T或V
X71=无氨基酸或G或K
X72=无氨基酸或A
X73=无氨基酸或E
X74=无氨基酸或I或T
X75=无氨基酸或L
X76=无氨基酸或A,V或G
X77=无氨基酸或E
X78=无氨基酸或E
X79=无氨基酸或A
X80=无氨基酸或K
X81=无氨基酸或T
X82=无氨基酸或L
X83=无氨基酸或A或S
X84=无氨基酸或A或E
X85=无氨基酸或A或V
X86=无氨基酸或L或V
X87=无氨基酸或L
X88=无氨基酸或E
X89=无氨基酸或E
X90=无氨基酸或E
X91=无氨基酸或I
X92=无氨基酸或M
X93=无氨基酸或D或M
X94=无氨基酸或N或E
在另一实施方案中,该防御素样分子包含以下序列[SEQ IDNO:61]:
MX1X2SX3X4X5X6X7X8X9X10X11X12X13X14X15X16X17X18X19X20X21X22X23X24X25X26X2X28AX29X30X31CX32X33X34SX35X36FX37GX38CX39X40X41X42X43CX44X45X46CX47X48EX49FX50X51GX52CX53X54X55X56X57X58X59CTX60X61CX62X63X64X65X66X67X68X69X70X71X72X73X74X75X76X77X78X79X80X82X83X84X85X86X87X88X89X90X91X92X93X94
其中X1=A,G或K
X2=R,N或L
X3=L,I或M
X4=C,F或R
X5=F或L
X6=M,F或I
X7=A或S
X8=F,T或A
X9=A,L,V或F
X10=I,V,L或F
X11=L或I
X12=A,I或M
X13=M,A或F
X14=M或L
X15=L或I
X16=F或V
X17=V,T或L
X18=A,T或S
X19=Y或T
X20=E或G
X21=V或M
X22=无氨基酸或G
X23=无氨基酸或P
X24=无氨基酸,M或V
X25=无氨基酸或T
X26=无氨基酸,I或S
X27=无氨基酸或A或V
X28=Q或E
X29=无氨基酸或Q
X30=R或Q
X31=E,I或T
X32=K或E
X33=T,A或S
X34=E,P或Q
X35=N,Q或H
X36=T或R
X37=P,K或H
X38=I,L,P或T
X39=I,F,S或V
X40=T,M,R或S
X41=K,D,E或A
X42=P或S
X43=P,S或N
X44=R或A
X45=K,T,S或N
X46=A,Y或V
X47=I,L,Q或H
X48=S,K,T或N
X49=K或G
X50=T,S,I或V
X51=D或G
X52=H,R,或N
X53=S,P或R
X54=K,W,A或G
X55=I,L或F
X56=L,Q,P或R
X57=R或P
X58=R或K
X59=L或F
X60=K,S或R
X61=P,N或H
X62=无氨基酸或V
X63=无氨基酸或F
X64=无氨基酸或D
X65=无氨基酸或E或K
X66=无氨基酸或K或I
X67=无氨基酸或M或S
X68=无氨基酸或T,I或S
X69=无氨基酸或K或E
X70=无氨基酸或T或V
X71=无氨基酸或G或K
X72=无氨基酸或A
X73=无氨基酸或E
X74=无氨基酸或I或T
X75=无氨基酸或L
X76=无氨基酸或A,V或G
X77=无氨基酸或E
X78=无氨基酸或E
X79=无氨基酸或A
X80=无氨基酸或K
X81=无氨基酸或T
X82=无氨基酸或L
X83=无氨基酸或A或S
X84=无氨基酸或A或E
X85=无氨基酸或A或V
X86=无氨基酸或L或V
X87=无氨基酸或L
X88=无氨基酸或E
X89=无氨基酸或E
X90=无氨基酸或E
X91=无氨基酸或I
X92=无氨基酸或M
X93=无氨基酸或D或M
X94=无氨基酸或N或E
在优选实施方案中,该遗传构建体包含选自SEQ ID NO:8、SEQID NO:14、SEQ ID NO:16和SEQ ID NO:18的氨基酸序列的编码核苷酸序列。
在特别优选的实施方案中,该遗传构建体包含选自SEQ IDNO:7、SEQ ID NO:13、SEQ ID NO:15和SEQ ID NO:17的核苷酸序列,或与SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:16和SEQ IDNO:18中的一个或多个具有至少约70%相似性的核苷酸序列,或能够与SEQ ID NO:7、SEQ ID NO:13、SEQ ID NO:15和SEQ ID NO:17或其互补形式杂交的核苷酸序列。
最优选地,该氨基酸序列相应于成熟结构域,并包含SEQ IDNO:8所示氨基酸序列。
提及的SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:16和SEQ IDNO:18包括与SEQ ID NO:8、SEQ ID NO:14、SEQ ID NO:16和SEQID NO:18中任何一个具有至少约70%相似性的新变体。这些序列也可能用于产生多聚或异源分子。
根据本发明这一方面,该构建体用于产生对植物害虫(例如昆虫)、攻击或侵染的抗性提高或增强的转基因植物。优选地,该构建体单独用于此目的。但该构建体可能用于在微生物(例如细菌)中产生重组防御素样分子。本发明涉及编码用于对抗昆虫侵染的任何防御素或防御素样分子的遗传构建体。例如,该构建体可能用来产生对抗昆虫的转基因植物。
因此,本发明提供用于产生昆虫抗性的转基因植物的遗传构建体,该转基因植物产生防御素或防御素样分子,其选自SEQ IDNO:8、SEQ ID NO:14、SEQ ID NO:16和SEQ ID NO:18以及SEQ IDNO:20到SEQ ID NO:49、或者与SEQ ID NO:8、SEQ ID NO:14、SEQID NO:16和SEQ ID NO:18中任何一个具有至少约70%相似性的氨基酸序列。
如上所述,植物包括单子叶植物或双子叶植物。特别地,有用的植物为食物作物,例如小麦、稻、大麦、大豆和甘蔗。特别有用的非食物普通作物包括棉花。花和观赏性作物包括玫瑰、康乃馨、矮牵牛、洋桔梗(lisianthus)、百合、鸢尾、郁金香、小苍兰、飞燕草、补血草和天竺葵。
本发明进一步包括产生对植物害虫抗性提高或增强的植物的方法,该方法包含将遗传构建体引入一个或一群植物细胞的基因组中,该遗传构建体包含与花来源的防御素样分子的编码核苷酸序列可操作性连接的启动子或其功能等价物,该防御素样分子的成熟结构域包含以下氨基酸序列:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数手下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字表示的位置的半胱氨酸残基,其中该成熟结构域显示出对植物害虫(例如昆虫害虫)的抑制性活性,并从该细胞或细胞群再生出植物。在一方面,该实施方案不涉及防御素样分子FST和TPP3。
优选的植物害虫是昆虫。
优选地,该防御素样分子包含具有以下氨基酸序列[SEQ IDNO:58]的成熟结构域:
X30X31CX32X33X34SX35X36FX37GX38CX39X40X41X42X43CX44X45X46CX47X48EX49FX50X51GX52CX53X54X55X56X57X58CX59CTX60X61C
其中X30=R或Q
X31=E,I或T
X32=K或E
X33=T,A或S
X34=E,P或Q
X35=N,Q或H
X36=T或R
X37=P,K或H
X38=I,L,P或T
X39=I,F,S或V
X40=T,M,R或S
X41=K,D,E或A
X42=P或S
X43=P,S或N
X44=R或A
X45=K,T,S或N
X46=A,Y或V
X47=I,L,Q或H
X48=S,K,T或N
X49=K或G
X50=T,S,I,或V
X51=D或G
X52=H,R,或N
X53=S,P或R
X54=K,W,A或G
X55=I,L或F
X56=L,Q,P或R
X57=R或P
X58=R或K
X59=L或F
X60=K,S或R
X61=P,N或H
更优选地,该成熟结构域选自SEQ ID NO:2、SEQ ID NO:3、SEQID NO:4、SEQ ID NO:5、SEQ ID NO:6和SEQ ID NO:8所示氨基酸序列。
最优选地,该成熟结构域包含SEQ ID NO:8所示氨基酸序列。
本发明另一方面提供了产生对昆虫抗性提高或增强的植物的方法,该方法包含将遗传构建体引入一个或一群植物细胞的基因组中,该遗传构建体包含与防御素样分子的编码核苷酸序列可操作性连接的启动子或其功能等价物,该防御素样分子的成熟结构域包含以下氨基酸序列:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数字下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字表示的位置的半胱氨酸残基,其中该成熟结构域显示出对植物害虫(例如昆虫害虫)的抑制性活性,并从该细胞或细胞群再生出植物。
优选的防御素选自SEQ ID NO:8、SEQ ID NO:18和SEQ IDNO:20至SEQ ID NO:49。
上述成熟结构域包括这些结构域的片段和衍生物。
此处所用术语″片段″是指该成熟结构域亲本的一段或一部分,其优选保持亲本成熟结构域的活性。术语″片段″包括包含上述抗植物害虫活性的、例如至少5个、优选至少约10个、更优选至少约20个连续氨基酸的缺失体、突变体和小肽。此类肽可能采用标准的重组核酸技术获得,或者利用所述传统的液相或固相合成方法合成,例如Blackwell Scientific Publications出版的Nicholson所编出版物″Synthetic Vaccines″中收入的第九章,Atherton和Shephard″Peptide Synthesis″。另外,可以利用蛋白酶消化本发明的氨基酸序列制备肽,例如endoLys-C、endoArg-C、endoGlu-C和葡萄球菌V8-蛋白酶。例如通过高效液相层析(HPLC)技术,可以纯化消化片段。
″衍生物″是指通过修饰,例如与其它化学部分缀合或复合,或者本领域应当理解的翻译后修饰技术,从基本序列得到的多肽。术语″衍生物″的范围内也包括对亲本序列所做的改变,包括添加或缺失,得到功能等价的分子。因此,术语″衍生物″包括以其所来源的亲本氨基酸序列相同的方式影响植物表现型的分子。也包括其中一个或多个氨基酸被不同氨基酸取代的多肽。本领域相当理解,如下文所述,某些氨基酸可能改变为其它具有大致相似特性的氨基酸,而不改变该多肽的天然活性(保守性置换)。这些术语也包括其中一个或多个氨基酸添加、或删除、或替换为不同氨基酸的多肽。
此处可互换使用术语″蛋白质″、″多肽″、″肽″和″氨基酸序列″,是指氨基酸残基的多聚体及其变体和合成的类似物。因此,这些术语适用于其中一个或多个氨基酸残基是合成的非天然存在氨基酸的氨基酸的多聚体,例如相应天然存在的氨基酸的化学类似物,还适用于天然存在的氨基酸多聚体。
术语″变体″和″同系物″是指显示与参考核苷酸序列具有基本序列一致性的核苷酸序列、或在此处定义的低严谨性条件下与参考序列杂交的多核苷酸。术语″核酸分子″、″核苷酸序列″、″多核苷酸″和″核酸分子″此处可互换使用,并包括其中一个或多个核苷酸已经添加、或删除或替换为不同核苷酸的多核苷酸。在这方面,本领域相当理解,可以对参考核苷酸序列进行某些改变,包括突变、添加、缺失和置换,该改变的多核苷酸保持参考多核苷酸的生物功能或活性。该变体多肽序列可能编码其氨基酸组成包含某些差异的多肽,但编码具有相同或相似活性的蛋白质。此处包括产生的变体多肽序列。术语″变体″也包括天然存在的核苷酸等位变体。
术语″表达″用其广义,包括瞬时性、半永久性和稳定性表达,以及可诱导性、组织特异性、组成性和/或发育调节性表达。优选稳定的组织特异性表达。
为了有效表达本发明的核苷酸序列,可能方便地引入特别包含以下一种或多种序列的嵌合遗传构建体:启动子序列、5’非编码区、顺式调节区例如转录调节蛋白或翻译调节蛋白的功能性结合位点、上游活化子序列、增强子元件、沉默子元件、TATA盒基序、CCAAT盒基序、上游开放阅读框架、转录起始位点、翻译起始位点和/或编码前导序列的核苷酸序列、终止密码子、翻译终止位点和3’非翻译区。该嵌合遗传构建体优选设计为转化下述植物。
术语″5’非编码区″此处使用其最广的范围,包括除编码包含该基因的多肽产物的氨基酸残基的序列以外的所有来自可表达基因上游区的核苷酸序列,其中5’非编码区引起、或活化、或至少部分促进该基因的表达。
术语″基因″使用其最广的范围,包括对应于该基因的基因组DNA区域以及对应于外显子的cDNA序列、或者改造为编码功能形式产物的重组分子。
此处所用术语″顺式作用序列″或″顺式调节区″或类似术语应当认为是指来自可表达性遗传序列的任何核苷酸序列,其中该核苷酸序列至少部分调节第一个遗传序列的表达。本领域技术人员应当了解,顺式调节区也许能够活化、沉默、增强、抑制或改变任何结构基因序列的表达水平和/或细胞类型特异性和/或发育特异性。
此处提及的″启动子″利用其最广的范围,并包括典型基因组基因的转录调节序列,包括准确转录起始所需的TATA盒、有或无CCAAT盒序列以及响应发育和/或环境刺激、或以组织特异性或细胞特异性方式改变基因表达的其它调节元件(即上游活化序列、增强子和沉默子)。启动子一般但不必须位于其所调节表达的结构基因的上游或5’。此外,包含启动子的调节元件一般位于基因转录起始位点的2kb以内。
在此上下文中,术语″启动子″也用于描述在植物细胞中引起、活化或增强结构基因或其它核酸分子表达的合成的或融合分子或衍生物。本发明的优选启动子可能包含一个或多个特异性调节元件的另外拷贝,以进一步增强在细胞中的表达、和/或改变其可操作性连接的结构基因的表达时间。
此上下文中术语″可操作性相连″或″可操作性连接″是指将结构基因置于启动子的调节控制之下,从而控制基因的转录以及可选的翻译。在构建异源启动子/结构基因的组合中,一般优选将遗传序列或启动子置于远离基因转录起始位点,大约与其天然设置(即该遗传序列或启动子所来源的基因)中该遗传序列或启动子及其控制的基因之间的距离相同。据本领域已知,可以调节该距离的某些变化,而不损失功能。类似地,调节性序列元关于置于其控制之下的异源基因件的优选定位,按该元件在其天然设置(即其来源于的基因)中的定位而定。
本发明包含的启动子序列可能是待转化的宿主植物天生的,或者可能来自其它来源,其中该区域在宿主植物中具有功能性。其它来源包括土壤杆菌T-DNA基因,例如胭脂碱、octapine、mannopine生物合成启动子或其它op ine的启动子;植物启动子,例如泛素启动子;组织特异性启动子(参见例如Conkling等人美国专利号5,459,252;Advanced Technologies的WO 91/13992);病毒启动子(包括宿主特异性病毒),或者部分或全部合成的启动子。本领域熟知在单和双子叶植物中具有功能性的众多启动子(参见,例如Greve,J.Mol.Appl.Genet.1:499-511,1983;Salomon等人,EMBO J.3:1984;Garfinkel等人,Cell 27:143-513,1983;Barker等人,PlantMol.Biol.2:235-350,1983),包括从植物(例如来自玉米ubi-1基因的Ubi启动子)(参见,例如美国专利号4,962,028)和病毒(例如花椰菜花叶病毒启动子,CaMV 35S)中分离的各种启动子。
启动子序列可能包括调节转录的区域,其中该调节包括,例如化学或物理性抑制或诱导(例如基于代谢物、光或其它物理化学因素进行的调节;参见,例如WO 93/06710公开的线虫反应性启动子),或者基于细胞分化进行的调节(例如与植物中叶子、根、种子等有关;参见,例如美国专利号5,459,252公开的根特异性启动子)。因此,从受如此调节的合适基因获得启动子区或该区的调节性部分。例如,核酮糖1,5-二磷酸羧化酶基因受光诱导,可能用于转录起始。已知其它基因受压力、温度、创伤、病原体作用等诱导。
本发明的嵌合遗传构建体也可能包含3’非翻译序列。3’非翻译序列是指包含含有多聚腺苷酸化信号以及能够影响mRNA加工或基因表达的任何其它调节信号的DNA片段的基因部分。多聚腺苷酸化信号的特征在于将多聚腺苷酸片段添加到mRNA前体的3’端。一般通过与5’-AATAAA-3’的典型形式同源性的存在而识别多聚腺苷酸化信号,尽管变异并不少见。
3’非翻译的调节性DNA序列优选包括约50-1,000个核苷酸碱基对,除多聚腺苷酸信号以及能够影响mRNA加工或基因表达的任何其它调节信号之外,可能包含植物转录和翻译的终止序列。合适的3’非翻译序列的例子有,包含根瘤土壤杆菌(Agrobacteriumtumefaciens)胭脂碱合酶(nos)基因多聚腺苷酸信号的3’转录非翻译区(Bevan等人,Nucl.Acid Res.11:369,1983)以及根瘤土壤杆菌章鱼碱合酶基因T7转录本的终止子。另外,合适的3’非翻译序列可能来源于植物基因,例如马铃著或番茄蛋白酶抑制因子I或II基因、大豆贮存蛋白基因以及豌豆E9核酮糖-1,5-二磷酸羧化酶小亚基(ssRUBISCO)基因的3’端,尽管还可以使用本领域技术人员已知的其它3’元件。另外,可以从头获得3’非翻译调节性序列,例如An所述(Methods in Enzymology 153:292,1987),此处引入供参考。
嵌合遗传构建体还可以引入载体例如质粒中。质粒载体包括供表达盒在原核和真核细胞中易于选择、扩增和转化的其它DNA序列,例如pUC来源的载体、pSK来源的载体、pGEM来源的载体、pSP来源的载体、或pBS来源的载体。其它DNA序列包括,供载体自主复制的复制起点、选择性标志基因(优选编码抗生素或除草剂抗性)、提供多个位点以供插入嵌合遗传构建体中编码的DNA序列或基因的唯一多克隆位点、以及增强原核和真核细胞转化的序列。
载体优选包含使载体或其中包含的嵌合遗传构建体稳定整合进宿主细胞基因组、或使载体在细胞中独立于细胞基因组进行自主复制的元件。载体或其中包含的构建体引入宿主细胞时,可能整合进宿主细胞基因组中。为了整合,载体可能依靠其中存在的外源或内源性DNA序列或载体的任何其它元件,以供载体通过同源重组稳定整合进基因组中。另外,载体可能包含其它核酸序列,以通过同源重组直接整合进宿主细胞基因组中。其它核酸序列能够使载体或其中包含的构建体在染色体的精确位点整合进宿主细胞基因组中。为提高在精确位点整合的可能性,整合元件应优选包含与对应的目标序列高度同源的足够数目核酸,例如100-1,500碱基对、优选400-1,500碱基对、最优选800-1,500碱基对,以增加同源重组的可能性。
整合元件可能是与宿主细胞基因组中的目标序列同源的任何序列。此外,整合元件可能是非编码或编码核酸序列。
为克隆和亚克隆之目的,载体可能进一步包含能够使载体在宿主细胞例如细菌细胞中自主复制的复制起点。细菌性复制起点的例子有,容许在大肠杆菌(E.coli)中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点以及容许在芽胞杆菌(Bacillus)中复制的pUB110、pE194、pTA1060和pAM/β1的复制起点。复制起点可能带有突变,使其在芽胞杆菌细胞中的功能具有温度敏感性(参见,例如Ehrlich,Proc.Natl.Acad.Sci.USA 75:1433,1978)。
为便于鉴定转化细胞,载体理想包含含有可选择或筛选标志基因的另一遗传构建体。只要与所选植物细胞在一起具有功能性(即选择性),标志的实际选择并不重要。标志基因和目的核苷酸序列不必相连,因为未连接的基因共转化也是植物转化的有效方法,例如美国专利号4,399,216所述。
术语可选择性或可筛选性标志基因包括编码″可选择性标志″的基因,可以检测该标志的分泌,用以鉴定或选择转化细胞。例子包括编码能够经抗体相互作用而识别的可分泌性抗原、或者能够通过其催化活性而检测的可分泌性酶的标志。可筛选性蛋白质包括但不限于,插入或陷入细胞壁的蛋白质(例如包括前导序列的蛋白质,如伸展蛋白或烟草PR-S的表达单元中存在的序列);可以通过诸如ELISA检测的小的可扩散性蛋白质;可以在细胞外溶液中检测的小的活性酶,例如α-淀粉酶、β-内酰胺酶、膦丝菌素乙酰转移酶。
细菌性可选择性标志的例子有,枯草芽胞杆菌(Bacillussubtilis)或地衣芽胞杆菌(Bacillus licheniformis)的dal基因,或者赋予抗生素抗性的标志,例如氨苄青霉素、卡那霉素、红霉素、氯霉素或四环素抗性。选择植物转化体的代表性可选择标志包括但不限于,编码潮霉素B抗性的hyg基因;赋予卡那霉素、巴龙霉素、G418等抗性的新霉素磷酸转移酶(neo)基因,例如Potrykus等人所述(Mol.Gen.Genet,199:183,1985);赋予谷胱甘肽衍生的除草剂抗性的大鼠肝谷胱甘肽-S-转移酶基因,例如EP-A 256 223所述;过表达时赋予谷氨酰胺合成酶抑制因子例如膦丝菌素抗性的谷氨酰胺合成酶基因,例如WO 87/05327所述;赋予选择性试剂膦丝菌素抗性的产绿色链霉菌(Streptomyces viridochromogenes)乙酰转移酶基因,例如EP-A 275 957所述;赋予N-磷酸甲基甘氨酸耐受的5-enolshikimate-3-磷酸合酶(EPSPS)的编码基因,例如Hinchee等人所述(Biotech.6:915,1988);赋予抗bialaphos抗性的bar基因,例如WO 91/02071所述;赋予溴苯腈(bromoxynil)抗性的臭鼻克雷白氏杆菌(Klebsiella ozaenae)腈水解酶基因,例如bxn(Stalker等人,Science 242:419,1988);赋予氨甲蝶呤抗性的二氢叶酸还原酶(DHFR)基因(Thillet等人,J.Biol.Chem.263:12500,1988);赋予咪唑啉酮、磺酰脲或其它ALS抑制性化学剂抗性的突变型乙酰乳酸合酶基因(ALS)(EP-A-154 204);赋予5-甲基色氨酸抗性的突变的邻氨基苯甲酸合酶基因;或赋予除草剂抗性的茅草枯(dalapon)脱卤素酶基因。
优选的可筛选性标志包括但不限于,uidA基因,编码其各种生色底物已知的β-葡糖醛酸酶(GUS);β-半乳糖苷酶基因,编码其各种生色底物已知的酶;水母发光蛋白基因,可用于钙敏感性生物发光检测(Prasher等人,Biochem.Biophys.Res.Comm.126:1259,1985);绿色荧光蛋白质基因(Niedz等人,Plant Cell Reports 14:403,1995);萤光素酶(luc)基因,可检测生物发光(Ow等人,Science 234:856,1986);β-内酰胺酶基因,编码其各种生色底物(例如PADAC,生色的头孢菌素)已知的酶(Sutcliffe,Proc.Natl.Acad.Sci.USA 75:3737,1978);R-座位基因,编码调节植物组织生成花青苷色素(红色)的产物(Dellaporta等人,ChromosomeStructure and Function,pp.263-282,1988);α-淀粉酶基因(Ikuta等人,Biotech.8:241,1990);酪氨酸酶(yrosinase)基因,编码能够氧化酪氨酸为多巴和多巴醌的酶,并依次凝结成易于检测的化合物黑色素(Katz等人,J Gen.Microbiol.129:2703,1983);或xylE基因,其编码儿茶酚双加氧酶,能够转换生色的儿茶酚(Zukowsky等人,Proc.Natl.Acad.Sci.USA 80:1101,1983)。
可选择性标志遗传构建体也可能包含上述任何一种或多种5’和3’非编码区、顺式调节区、增强子、活化子等。
本发明一方面提供了来自植物或转化的微生物细胞的转染或转化的细胞、组织或器官,该细胞、组织或器官包含含有编码多肽的、或与编码多肽的序列互补的核苷酸序列的核酸分子,该多肽的前体形式包含N端信号结构域、成熟结构域以及酸性C端结构域,其中该多肽在花发育期间生成,其成熟结构域具有抗一种或多种植物害虫的活性。
优选地,该核酸分子包含编码多肽的、或与编码多肽的序列互补的核苷酸序列,该多肽的前体形式包含N端信号结构域、成熟结构域以及酸性C端结构域,其中该多肽在花发育期间生成,其成熟结构域包含以下结构:
a1a2CIa3a4a5a6a7a8a9a10a11a12CIIa13a14a15a16a17CIIIa18a19a20CIVa21a22a23a24a25a26a27a28a29CVa30a31a32a33a34a35CVIa36CVIIa37a38a39CVIII
其中″a″可能相同或不同,并代表任何氨基酸残基,每个″a″的数字下标代表其在氨基酸序列中的位置,″C″代表处于罗马数字所示位置的半胱氨酸残基,其中该成熟结构域具有抗一种或多种植物害虫的活性。
本发明的载体和嵌合遗传构建体可利用本领域技术人员已知的各种技术引入细胞中。该技术可能根据特定生物体已知的成功技术而改变。
将载体、嵌合遗传构建体等引入细胞的技术包括但不限于,使用CaCl2进行转化及其变化、原生质体直接摄取DNA、PEG介导的原生质体摄取、微粒轰击、电穿孔、DNA显微注射、组织外植体或细胞的微粒轰击、核酸真空渗入组织以及T-DNA介导从土壤杆菌转入植物组织。
关于细胞的微粒轰击,驱动微粒进入细胞,产生转化细胞。任何合适的冲击(ballistic)细胞转化方法和仪器可用于实现本发明。Sanford和Wolf公开了典型方法(美国专利4,945,050,5,036,006,5,100,792,5,371,015)。使用冲击转化方法时,可将遗传构建体引入能够在待转化细胞中复制的质粒中。
适用于该系统的微粒例子包括0.1-10μm、更特别是10.5-5μm的钨或金球。可利用任何适当技术,例如沉淀,将DNA构建体沉积在微粒上面。
可利用本发明的嵌合遗传构建体,转化其后能够通过器官发生抑或胚胎发生进行无性繁殖的植物组织,并由此产生整株植物。根据可获得的并最适合待转化的特定品种的无性繁殖系统,选择的特定组织会有所不同。典型的靶组织包括叶片、花粉、胚、子叶、下胚轴、大配子体、愈伤组织、现有分生组织(例如顶端分生组织、腋芽和根分生组织)以及诱导分生组织(例如子叶分生组织和下胚轴分生组织)。
再生的转化植物可利用各种方法繁殖,例如无性繁殖或传统的育种技术。例如,第一代(或T1)转化植物可自交产生纯合的第二代(或T2)转化子,进一步利用传统育种技术繁殖T2植物。
因此,本发明这一方面涉及改造为表达防御素样分子或其变体或同系物的编码核酸分子的植物,进一步延伸到该植物的子代,以及该植物的营养、繁殖和再生部分,例如花(包括切或割的花)、植物部分、植物的纤维物质(例如棉)以及再生部分,包括插枝、花粉、种子和愈伤组织。
本发明另一方面提供遗传修饰的植物细胞、或多细胞植物或其子代、或能够生成此处所述异源防御素样分子的遗传修饰植物的部分,其中该转基因植物对植物害虫例如昆虫具有抗性或敏感性降低。
更特别地,本发明提供遗传修饰的植物细胞、或多细胞植物、或其子代或部分,其包含SEQ ID NO:8所示氨基酸序列或片段或衍生物。
术语″遗传修饰″使用其广义,包括将基因引入细胞、在细胞中突变基因以及改变或控制细胞中的基因调节。
该遗传构建体可能是单个分子或多个分子,例如一组分子,其组合可能包含能够编码其它抗植物病原体的分子的核苷酸序列,例如但不限于蛋白酶抑制因子或其前体。在储存器官和叶子中,往往对创伤作出反应而积累蛋白酶抑制因子,例如丝氨酸蛋白酶抑制因子。蛋白质抑制活性针对微生物和动物来源的多种蛋白酶类。
因此,本发明另一方面包含一种或多种包含与第一核苷酸序列可操作性连接的第一启动子的单独或联合的遗传构建体,其中该第一核苷酸序列编码能够抑制植物害虫例如昆虫的防御素样分子或其部分,该构建体进一步包含与第二核苷酸序列可操作性连接的第二启动子,其中该第二核苷酸序列编码蛋白酶抑制因子或其前体。
在一个实施方案中,该防御素样分子和/或其编码DNA序列选自SEQ ID NO:7至SEQ ID NO:18。在另一实施方案中,该防御素样分子和/或其编码DNA序列选自SEQ ID NO:7至SEQ ID NO:18、或SEQID NO:20至SEQ ID NO:24。特别优选SEQ ID NO:7或SEQ ID NO:8所确定的防御素样分子和/或其编码DNA序列。在另一实施方案中,该防御素样分子和/或其编码DNA序列选自SEQ ID NO:7或SEQ IDNO:8、SEQ ID NO:17或SEQ ID NO:18、或SEQ ID NO:20至SEQID NO:55。
在另一实施方案中,该蛋白酶抑制因子是I或II型丝氨酸蛋白酶抑制因子。特别有用的蛋白酶抑制因子包含SEQ ID NO:57和SEQID NO:56分别所示核苷酸序列编码的氨基酸序列。国际专利申请PCT/AU93/00659(WO 94/13810)也描述了该分子。
本发明涉及携带全部或部分使植物或植物部分对植物害虫包括昆虫具有抗性或敏感性降低的遗传构建体及任选上述第二遗传构建体的植物和植物部分,包括植物再生部分。
本发明进一步包括组合物,其包含单独或联合另一试剂例如蛋白酶抑制因子的防御素或防御素样分子。该组合物特别用于植物、例如棉花植物的局部施用,有助于控制昆虫侵染。
本发明进一步包括与SEQ ID NO:7所示核苷酸序列的基因组形式结合的启动子。本发明这一方面提供了具有启动子活性并对应于植物基因组中该基因组区域的分离的核酸分子,其可操作性连接对应于全部或部分SEQ ID NO:7的核苷酸序列、或与其具有70%相似性的核苷酸序列、或能够与SEQ ID NO:7或其互补形式杂交的核苷酸序列。
本发明通过以下非限制性实施例进一步描述。
实施例1
制备植物材料
如Anderson等人所述(Plant Cell 1:483-491,1989),于温室条件下培养自交不亲和性混合基因型的花烟草(Link et Otto)植物。采集花和花蕾,两小时内用镊子和解剖刀片分离雌蕊、子房和花药,花瓣则用手分离。也采集开裂花药的花粉粒以及不同发育期的整花。所述组织组织于液氮中冷冻,-70℃保存,直至使用。
实施例2
克隆花烟草cDNA
(a)分离RNA
利用无菌研钵和研杵,在液氮中将处于花瓣呈色发育阶段的花烟草花的70个雌蕊(1.3g)研磨成细粉,制备总RNA。利用TRIzol(trademark)Reagent(Gibco BRL),根据厂家说明书提取RNA(参见Gibco BRL表格#3796,TRIzol(trademark)ReagentTotal RNA isolation reagent)。
(b)利用PCR进行花防御素序列的cDNA合成及扩增
利用Superscript Preamplification System(Gibco BRL)从雌蕊总RNA制备第一链cDNA。用于PCR的寡核苷酸引物特异性针对发表的烟草花特异型硫素(FST,Gu等人[1992;同上])的DNA序列。
引物FST1:5’GGAATTCCATATGGCTCGCTCCTTGTGC 3’[SEQ IDNO:1]
引物FST2 5’GCGGATCCTCAGTTATCCATTATCTCTTC 3’[SEQ IDNO:2]
引物FST1和FST2分别匹配FST序列的核苷酸49-66和346-363。利用单链cDNA为模板,通过PCR扩增获得编码花烟草花防御素前体的cDNA克隆(NaPdf1)。将NaPdf1产物克隆入pBluescript SK+II(Stratagene)载体(pBS-NaPdf1),供测序。该产物长318bp,编码无5’和3’非翻译区的完整编码序列。
然后使用NaPdf1 PCR产物筛选先前构建的花烟草雌蕊cDNA文库(Schultz等人,Plant Mol Biol 35:833-845,1997)。使用随机九聚体引物(Megaprime(trademark)DNA labelling kit,Amersham Life Technologies),以[α32P]dCTP标记的NaPdf1 cDNA探测薄膜。利用Bio-Rad Bio-Spin column 30,按厂家说明书所述去除未掺入的[α32P]dCTP。用探针在50%v/v甲酰胺、5x SSPE、5x Denhardt’s液以及200μg/ml鲱鱼精DNA的溶液中,与印迹42℃杂交16小时,然后用2x SSPE和0.1%w/v SDS于室温洗涤两次,每次10分钟,去除未结合的探针。将印迹对X光胶片曝光,显现杂交的探针。切下筛选阳性克隆,测序。
实施例3
NaPdf1基因表达
(a)RNA凝胶印迹分析
从花烟草(自交不亲和性基因型,S2S2)发育I期(5-10mm花蕾)、II期(20-30mm花蕾)和III期(50-70mm花蕾)的花药、花粉粒以及成熟雌蕊、子房、花瓣、叶和根组织中分离总RNA。利用1%w/v琼脂糖甲醛变性凝胶分离RNA样品(12.5μg),转移到Hybond-N(Amersham Life Sciences)膜。放射性标记的NaPdf1 cDNA探针的制备以及杂交条件与上文实施例2(b)所述cDNA文库筛选相同。在0.2x SSPE、0.1%SDS中,分别于45℃和55℃进行严谨性洗涤30分钟。结果如图2所示。将印迹对储磷光屏(storage phosphorscreen)曝光24小时,显现杂交探针。在Molecular Dynamics 400B磷光成像仪中,利用ImageQuant软件读取结果。
(b)原位杂交
基本上按Drews等人(Cell 65:991-1002,1991)以及Cox和Goldberg(Analysis of plant genes expression In PlantMolecular Biology:A Practical Approach.C.H.Shaw(ed)1-34页,IRL Press,Oxford,United Kingdom,1988)所述,进行原位杂交。利用EcoRI和BamHI线性化pBS-NaPdf1 DNA,分别经T7和T3 RNA聚合酶转录,制备35S标记的有义和反义RNA探针(Ausubel等人[1994;同上];Drews等人[1991;同上])。从植物切取10mm花蕾,在50%v/v乙醇、5%v/v乙酸和3.7%v/v甲醛中固定。将固定的组织脱水,石蜡包埋(Sigma)。然后将组织切成10μm切片,附于Superfrost*/plus玻片上(Menzel-Glaser,Germany)。用二甲苯处理切片,然后水化、蛋白酶K处理、乙酰化并脱水。将35S标记的有义和反义核探针水解为长度约100个核苷酸,与切片在42℃杂交17小时。然后用RNA酶A处理切片、洗涤,然后玻片包被胶片乳胶。切片曝光一周后显色。
结果表明,NaPdf1转录物在花药结缔组织、花柱皮层细胞以及花瓣和萼片的表皮细胞中积累(参见图3)。该积累方式与所编码蛋白质在繁殖器官的防卫中所起作用一致。
实施例4
为制备抗体的蛋白质表达
(a)分子克隆和细菌性蛋白质表达
pBS-NaPdf1(参见实施例2(b))用于PCR扩增前蛋白质结构域(NaproPdf1,前体去除N端ER信号结构域)的编码DNA片段。结构示意图参见图8。利用寡核苷酸引物PDF1和PDF2获得NaproPdf1 DNA片段,引物分别引入BamHI和SacI限制酶切位点,用于随后克隆。
引物PDF1 5’CCGGATCCAGAGAATGCAAAACAG 3’[SEQ ID NO:3]
引物PDF2 5’GGGAGCTCTTAGTTATCCATTATCTC 3’[SEQ ID NO:4]
根据厂家说明书,将NaproPdf1 DNA片段直接从PCR克隆到pGEM-T载体(Promega),然后亚克隆到pQE30(Qiagen)载体,在大肠杆菌菌株M15细菌(Qiagen)中进行蛋白质表达。
在细菌中表达NaproPdf1蛋白质,为带有N端六聚组氨酸标志的融合蛋白。转化的大肠杆菌细胞生长于包含氨苄青霉素(100μg/ml)和卡那霉素(12.5μg/ml)的LB液体培养基中,至595nm处读取的吸光度为~0.8,然后用异丙基-β-D-硫代半乳糖苷(IPTG,1mM)诱导6小时。离心沉淀细胞,重悬于裂解缓冲液中(10mM Tris-HCl pH8.0、100mM磷酸钠缓冲液pH 8.0,8M脲;30ml裂解缓冲液/升培养物),然后冰上温育30分钟。然后裂解物通过18号针头,离心收集上清(25,000g,15分钟,4℃)。利用Clontech TALON(trademark)Metal Affinity Resin User Manual(PT1320-1)概述的变性蛋白质纯化方案,从裂解的细菌细胞中纯化六聚组氨酸标志的蛋白质(6H.NaproPdf1)。在100mM EDTA,pH 8.0中从树脂上洗脱结合的蛋白质。冷冻干燥洗脱的蛋白质。利用SDS-PAGE(15%w/v聚丙烯酰胺)分析纯化过程各个步骤对应的蛋白质提取物,通过考马斯蓝染色观察(参见图4A)。利用Waters 510型泵和Waters 481型UV检测器,将金属亲合纯化的6H.NaproPdf1蛋白质样品上样AquaporeRP300反相C8分析柱(4.6x100mm,Brownlee)。利用30分钟内0-100%缓冲液B(60%v/v乙腈的0.089%v/v三氟乙酸溶液)的梯度洗脱蛋白质。蛋白质洗脱为单个峰(图4B),N端序列和质谱分析证实它是6H.NaproPdf1。
(b)制备多克隆抗血清
如Harlow和Lane所述(Antibodies:A Laboratory Manual.Cold Springs Harbor Laboratory Press,Cold Springs Harbor,New York,1988),利用戊二醛将细菌性表达的6H.NaproPdf1蛋白质(1.3mg)与匙孔血蓝蛋白(KLH,0.3mg,Sigma)缀合,然后注射家兔。然后将缀合的蛋白质对PBS透析过夜。蛋白质缀合物(100μg,在1mL PBS中)与等体积弗氏完全佐剂(Sigma)混合。初级免疫包括4x400μL皮下注射。加强免疫于5和9周后给予,包含混合弗氏不完全佐剂(Sigma)的蛋白质缀合物(100μg,在1mL PBS中)。在注射之前采集免疫前血清,第二次免疫9天后采集免疫血清。
(c)蛋白质A纯化全血清中IgGs
利用蛋白质A Sepharose CL-4B柱(2.5mL,Pharmacia),按照厂家说明书,纯化免疫前血清和免疫血清中的IgG组分。免疫前血清(2mL)在等体积0.1M Tris-HCl中(pH 7.5)稀释,上样用0.1MTris-HCl(pH 7.5)平衡过的柱子。收集洗脱液,再上样三次。用80mL 0.1M Tris-HCl(pH 7.5)洗柱,再用80mL 0.01M Tris-HCl(pH 7.5)去除任何未结合物。用100mM甘氨酸(pH 2.5)洗脱IgGs,在包含50μl 1M Tris-HCl(pH 8.8)的微离心管中收集500μl组分。混合包含IgGs的组分,在4℃用PBS广泛透析。通过用0.1MTris-HCl(pH 7.5)洗涤,再生蛋白质-A Sepharose柱。当pH达到7.5时,上样免疫血清(3mL,第二次取血),如免疫前血清所述进行纯化。
(d)SDS聚丙烯酰胺凝胶电泳
使用Mini Protean II电泳装置(Bio-Rad),将来自图5(A)所示花烟草花发育阶段的缓冲液(50mM Tris-HCl pH 8.0,10mM EDTA,0.5M NaCl)可溶性蛋白质样品(60μg)进行SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE,4%w/v堆积胶及15%w/v分离聚丙烯酰胺凝胶)(Laemmli,Nature 227:680-685,1970)。蛋白质通过考马斯染色观察,并与Bio-Rad宽范围分子量标志(6.5-200kDa)比较。
(e)免疫印迹分析
使用Mini-Protean II Trans-Blot装置(Bio-Rad),在转移缓冲液中(48mM Tris(羟甲基)氨基甲烷,192mM甘氨酸,20%v/v甲醇),将SDS-PAGE分离的蛋白质转到硝酸纤维膜(MicronSeparations Inc.,0.22μm孔径)。在100V转移1小时以后,将膜用异丙醇固定1分钟,然后TBS(20mM Tris-HCl,150mM NaCl,pH 8.0)洗涤5分钟。通过氨基黑染色(0.1%w/v氨基黑的40%v/v甲醇和10%v/v乙酸溶液,按1∶50稀释),观察分子量标志。
用5%w/v脱脂奶封闭膜1小时,然后与抗6H.NaproPdf1抗体温育1.5小时(用TBS按1∶2500稀释)。将膜用TBST(0.1%v/v Tween20的TBS)洗涤3x10分钟,然后与缀合辣根过氧化物酶的驴抗兔IgG温育1.5小时(Amersham Pharmacia Biotech;用TBS按1∶5000稀释)。再洗涤3x10分钟,然后利用Enhanced Chemi-Luminescence(ECL)检测试剂(Amersham Pharmacia Biotech),按照厂家说明书处理该免疫印迹。免疫印迹对ECL Hyperfilm(Amersham Pharmacia Biotech)曝光。三种蛋白质特异性与抗体反应,发育早期的蛋白质水平最为丰富(参见图5B)。
质谱分析和N端氨基酸测序证实,较低分子量物质为成熟防御素(5.3kDa);参见下文实施例5(c)。
实施例5
从花蕾纯化
(a)蛋白质提取
利用从大麦粉中提取硫素的改进方法,从花中提取成熟的NaPdf1蛋白质(Ozaki等人,J.Biochem.87:549-555,1980)。使用研钵和研杵,用液氮将直至花发育的花瓣呈色阶段的所有花烟草花(5-50mm,650g湿重)研磨成细粉,在Ultra-Turrax匀浆器(Janke和Kunkel,Germany)中用50mM硫酸(3mL/g重量)再加工。在4℃搅拌1小时以后,用Miracloth(Calbiochem)过滤然后离心(25,000xg,15分钟,4℃),去除不溶物。浆液中缓慢加入10M NaOH,调节pH至7.8,4℃搅拌1小时,然后离心去除沉淀物(25,000xg,15分钟,4℃)。加入固体硫酸铵,至80%(w/v)饱和度,混合物于4℃搅拌4小时或过夜,以沉淀防御素蛋白质。离心收集沉淀,溶于50mL凝胶过滤缓冲液(150mM KCl,10mM Tris-HCl,pH 8.0),然后90℃加热10分钟。离心以后,上清上样Sephadex G-50凝胶过滤柱(85x2.54cm,Pharmacia)。收集组分(50mL),用抗6H.NaproPdf1抗体通过免疫印迹进行分析。混合包含NaPdf1的组分,通过45℃旋转蒸发浓缩,0.22μm针筒过滤器(Millipore)过滤,再用RP-HPLC纯化。
(b)反相高效液相层析
利用连接Beckmann 166检测器的Beckman System Gold HPLC进行RP-HPLC。分析型RP-HPLC利用Aquapore RP300反相C8柱(4.6x100mm,Brownlee)进行,而制备型使用Vydac C8反相柱(22x250mm)。利用流速分别为1mL/分钟或10mL/分钟、40分钟内的0-100%缓冲液B(60%v/v乙腈的0.089%v/v三氟乙酸溶液)的线性梯度洗脱蛋白质。分析柱的结果如图6A所示。下述N端测序和质谱分析证实主峰的同一性。
(c)电喷射离子化质谱分析
电喷射离子化质谱分析(ESI-MS)之前,RP-HPLC的蛋白质组分在冷冻干燥机中真空浓缩,重溶于milli-Q水中。使用2-4μL包含0.1%w/v甲酸的50%v/v乙腈中的1-100pmol蛋白质,进行ESI-MS。以0.2μL/分钟的流速,将样品注入配备微离子喷射离子源的三联四联Perkin-Elmer Sciex API-300。利用单电荷聚(丙二醇)离子校准质量标度,使质量精确度等于±1%。使用每单位电荷0.6daltons的恒定峰宽(峰最大值一半处的全宽),在质量范围为每个电荷m/z 200-3000 daltons的第一个四联(Q1)扫描模式中记录质谱。使用Perkin-Elmer Sciex Bio Multiview软件,进行30-100次扫描的信号平均、手工质量确定以及将质荷比谱转化为真实的质量标度。利用小样本统计并算入校准不确定性,计算95%置信界限的不确定性。
结果表明,图6A中峰A的蛋白质以及图5B所示较低分子量物质(~5kDa)对应于由NaPdf1 cDNA克隆编码的成熟防御素结构域(参见图6B)。
(d)氨基酸测序
利用Applied Biosystems 470A气相肽测序仪连接供自动在线PTH氨基酸分析的Applied Biosystems 130A分离系统,通过Edman降解,进行氨基酸测序。峰A中蛋白质所得N端序列的八个氨基酸与由NaPdf1 cDNA克隆预测的序列匹配(参见图6B)。
实施例6
免疫金定位
用于电子显微术的固定和免疫金标记
从处于不成熟花蕾阶段(10mm)的花烟草花中分离花药和子房,在4%(w/v)甲醛和0.5%(w/v)戊二醛的60mM PIPES/KOH溶液,pH7.2中室温固定2小时,然后4℃过夜。组织固定后,用60mMPIPES/KOH,pH 7.2洗涤,在酸化的二甲氧基丙烷中(浓盐酸∶二甲氧基丙烷,1∶2000[v/v]))室温脱水3小时。脱水的部分浸入含Benzil(London Resin Co.Ltd.)的LR Gold中,利用PhillipsTUV 15-W UV灯,在10cm远处25℃聚合12小时。如Anderson等人所述(Planta 171:438-442,1987),进行超薄切片的免疫金标记。蛋白质A纯化的抗6H.NaproPdf1抗体分别在64μg/mL IgG和21μg/mL IgG的终浓度下,与花药和子房切片温育。用相同浓度的纯化自免疫前血清的抗体替换第一抗体,检测标记的特异性。为观察超微结构,切片用3%(w/v)醋酸双氧铀水溶液染色15分钟,Sato三铅(Sato,J.Electron Microsc.17:158-159,1968)染色2分钟,然后用Joel 1200电子显微镜观察。
实施例7
序列及序列比较
花烟草防御素核苷酸和预测的氨基酸序列如图1所示。该cDNA克隆代表的基因命名为NaPdf1(花烟草植物防御素1)。所示DNA序列是重叠的cDNA克隆与下列引物延伸产物的复合序列:1-49,引物延伸产物克隆;50-541,cDNA克隆NaPdf1。核苷酸序列下方显示由该复合cDNA序列预测的蛋白质。该cDNA克隆包含318个核苷酸的单个开放阅读框架,编码105个氨基酸。原始的pBS-NaPdf1克隆(参见实施例2)中的PCR扩增序列对应于图1所示NaPdf1克隆的1-318核苷酸。
图9显示NaPdf1的105-氨基酸序列(SEQ ID NO:18),与从其它五个花来源的cDNA克隆编码的预测的氨基酸序列比对。序列依次如下:花特异性硫素(FST),来自Gu等人[1992;同上](SEQ ID NO:20),来源于烟草花;TPP3,来自Milligan和Gasser[1995;同上](SEQ ID NO:21),来源于番茄雌蕊;NTS13,来自Li和Gray[1999;同上](SEQ ID NO:22),来源于烟草花柱;PPT,来自Karunanandaa等人[1994;同上](SEQ ID NO:23),来源于矮牵牛雌蕊;以及ATPIIIa,来自Yu等人[1999;同上],直接提交,登录号S30578(SEQ ID NO:24),来源于拟南芥(Arabidopsis)。
组成NaPdf1蛋白质成熟中央结构域的47个氨基酸(SEQ IDNO:8),也与植物防御素家族其它成员的成熟结构域对应氨基酸序列(SEQ ID NO:25-SEQ ID NO:49)进行比对。利用ClustalW计算机算法进行比对(http://pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page=/NPSA/npsa_clustalw.html)。结果如图10所示。获得每个序列的相关参考文献及其各自的序列标识符细节,参见附图说明。
实施例8
真菌生长抑制分析
使用Broekaert等人的96孔微滴定板分析(EMS MicrobiologyLetters 69:55-60,1990),测定纯化的NaPdf1蛋白质对灰色葡萄孢(Botrytis cinerea)(分离自迷迭香,Brunswick,Victoria)、尖孢镰孢(Fusarium oxysporum)(f.sp.dianthi,Race 2;Florigene Limited,Collingwood,Victoria分离自康乃馨)以及尖孢镰孢(f.sp.vasinfectum,棉花分离株VCG 01111;Departmentof Primary Industries,Queensland提供)生长的影响。通过加入无菌水并使用涂布器,从半强度马铃薯葡萄糖琼脂(PDA,Difco)、或γ照射的水琼脂中的康乃馨叶子上生长的成孢子培养物中,分离真菌孢子。悬浮液用双层灭菌过的细棉布过滤,利用血细胞计数器确定滤液中的孢子浓度。孢子直接使用,或于无菌的20%v/v甘油溶液中-20℃保存后使用。
在无菌条件下,于96孔平底微孔板(Greiner)中进行真菌分析。将孢子浓度用PDB调节为约2x104孢子/mL,在加有20μl过滤消毒(0.22μm针筒过滤器,Millipore)的待测蛋白质(10、50或100μg/mL)或水的每个孔中,加入80μl该悬浮液。使用之前,通过RP-HPLC分析确定每个蛋白质的纯度和浓度。在其它孔中加入无菌水和卵清蛋白(Sigma),作为阴性对照,抗真菌蛋白质α-和β-嘌呤硫素(Sigma)的混合物作为阳性对照。将平板在轨道振荡器上振摇几秒钟,混合孢子和待测蛋白质。让平板静置30分钟,使孢子沉积,然后利用Spectra Max Pro 250微板阅读仪(Molecular Devices),在595nm吸光度处测定平板的光密度。平板于暗处22℃温育,在100小时过程中进行测定。吸光度相对于初始读数的增加与真菌菌丝的生长有关,将其对时间作图。所有分析按一式四份进行。
图11和12所示生长抑制曲线,显示纯化的NaPdf1防御素蛋白质分别对灰色葡萄孢(图11)、尖孢镰孢(f.sp.dianthi,图12A)以及尖孢镰孢(f.sp.vasinfectum,图12B和12C)的作用。结果清楚表明,20μg/mL NaPdf1有效对抗所有三种真菌微生物
实施例9
产生转基因烟草植物
(a)构建二元质粒(binary plasmid)
以下所示引物FLOR1和FLOR2,用于通过常规PCR扩增NaPdf1的完整DNA编码序列,以引入5’EcoRI和3’XbaI限制酶位点,用于后续克隆步骤。
引物FLOR1(EcoRI-间隔-ATG-序列,31聚体)
5’GGAATTCTAAACAATGGCTCGCTCCTTGTGC 3’[SEQ ID NO:5]
引物FLOR2(XbaI-终止-序列,29聚体)
5’GCTCTAGATCAGTTATCCATTATCTCTTC 3’[SEQ ID NO:6]
得到的PCR产物直接亚克隆到TA载体(pCR2.1-TOPO,Invitrogen),通过核酸测序确证该序列。用EcoR1和XbaI限制酶从TA载体切下NaPdf1 DNA,凝胶纯化并亚克隆到预先用适当的限制酶处理的pFB98/06载体(得自Florigene Limited,Collingwood,Australia),产生p35-PDF1。该构建体(p35-PDF1)包含侧接35S花椰菜花叶病毒启动子(CaMV35S)和终止子序列的防御素cDNA。构建体p35-PDF1再用SphI限制酶消化,去除启动子-基因-终止子盒,并凝胶纯化。用T4 DNA聚合酶将SphI产生的3’突出端平端化,并凝胶纯化。此时将表达盒插入预先经平端切具SmaI限制酶处理的二元载体pGCP1988(Florigene)或pBIN19(Bevan等人[1983;同上])。得到的构建体命名为(i)pFL1(包含于pCGP1988),其具有位于CaMV35S启动子/终止子控制下的glean(surB)可选择性标志基因,以及(ii)pHEX3(包含于pBIN19),其具有位于nos启动子/终止子控制下的卡那霉素(nptII)可选择性标志基因。构建体pFL1和pHEX3在分别相对于可选择性标志基因的相对(convergent)或串联方向上具有防御素基因盒。构建体pFL1和pHEX3的示意图如图13所示。
(b)转化根瘤土壤杆菌LBA4404
制备电感受态的根瘤土壤杆菌(LBA4404),利用Gene Pulser(注册商标)/0.2cm电极间距的大肠杆菌小槽(Bio-Rad)以及GenePulser(Bio-Rad)中1.8kV、25μFD电容和600Ω电阻,通过常规电穿孔转化pFL1或pHEX3。电穿孔细胞与1mL SOC培养基混合,28℃振荡温育3小时,然后取出150μl,涂布于LB琼脂,对于pFL1转化子,在琼脂中补充有20μg/mL利福平,而pHEX3转化子则补充有20μg/mL利福平和50μg/mL卡那霉素。平板于28℃温育过夜。
从随机挑选克隆中制备质粒DNA,进行分析性限制性消化,琼脂糖凝胶电泳分析插入序列,选择转化子。
(c)土壤杆菌介导的烟草转化
烟草栽培品种Wisconscin 38(W38)的种子用1%v/v次氯酸钠表面灭菌60分钟,然后用无菌水洗涤几次。将灭菌的种子播种于MS培养基(MS;0.44%w/v Murashige和Skoog培养基(ICNBiomedicals)[Plant Physiology 15:73-97,1962]、3%w/v蔗糖和0.8%w/v Bacto琼脂、pH 5.8),在温控箱中温育5周。用pFL1或pHEX3构建体转化的根瘤土壤杆菌(LBA4404)在分别补充有抗生素利福平(20μg/mL)或者卡那霉素(50μg/mL)和利福平的10ml LB培养基中,于28℃生长2-3天。离心(5分钟,3,500x g)收集细胞,重悬于20ml MS中,与新切的叶片(1cm2方形)短暂温育。将叶片吸附在无菌3MM纸上,然后转移到SIM琼脂(0.44%w/v Murashige和Skoog培养基(ICN Biomedicals)[1962;同上]、3%w/v蔗糖、1.0mg/L BAP、0.5mg/L吲哚乙酸(IAA)和0.8%w/v Bacto琼脂,pH5.8),在亮处25℃温育3天。对照叶片只用MS同样处理。共培养以后,将愈伤组织转移到选择性培养基,诱导新芽形成。将pFL1转化的愈伤组织转移到补充有1.5mg/L glean和250mg/L头孢噻肟(cefotaxamine)的SIM琼脂,而pHEX3转化的愈伤组织用100mg/L卡那霉素和250mg/L头孢噻肟进行选择。从愈伤组织切下再生的新芽,在IBA(1mg/mL)溶液中短暂浸泡,转移到根诱导培养基(RIM;0.44%w/v Murashige和Skoog培养基[1962;同上]、3%w/v蔗糖、150mg/L timentin和0.8%w/v Bacto琼脂),其中对于pFL1或pHEX3分别补充有1.5mg/L glean或100mg/L卡那霉素,如前所述温育。生根足够多时,将小植株栽入土中,于标准温室条件下生长。
(d)检测转基因烟叶中的NaPdf1
在温室生长植物的叶柄切下叶子(第四或第五位)。将组织在液氮中冷冻,用研钵和研杵研磨成细粉。将组织加入提取缓冲液中:50mM Tris-HCl pH 8.0、10mM EDTA和0.5M NaCl(1mL/g新鲜湿重)。将混合物置于冰上15分钟,然后13,500x g、4℃离心15分钟,使其澄清。利用Bradford方法(1976)估计蛋白质浓度,试剂来自Bio-Rad,使用BSA作为标准。利用15%w/v或预制的4-12%w/v聚丙烯酰胺梯度凝胶(Novex),如以上实施例4(d)所述,通过SDS-PAGE分离总可溶性叶蛋白(100μg)。电泳以后,蛋白质用考马斯蓝色,或者转移到硝酸纤维素,如以上实施例4(e)所述,进行NaPdf1的免疫检测。比较结果如图14A和B所示。
实施例10
昆虫饲养试验
(a)昆虫来源
澳洲棉铃虫幼虫(Helicoverpa punctigera)来自在Victoria,Australia采集的群体,在La Trobe University,Melbourne维持培养,棉铃虫得自La Trobe University,Melbourne或位于Narrabri,NSW的Australian Cotton Research Institute,Entomology Department of the Commonwealth Scientific andIndustrial Research Organisation保存的群体。
(b)转基因烟草叶的生物学分析
利用转基因植物pFL1/W19(由pFL1构建体转化)和转基因植物pHEX3.4(由pHEX3构建体转化)的无性系材料进行三个实验。利用未转化的W38植物作为阴性对照。
在实验1和2中,每次处理分别选择31和40个新孵化的澳洲棉铃虫幼虫。在各个包含1.5%w/v Bacto琼脂的带盖塑料杯(Solo(注册商标)塑料杯,28mL)中饲养幼虫,饲喂叶子碎片,每2-3天或消耗75%以上时更换。幼虫达到第五龄时,增加叶子材料的数量。全部生物学分析采用未开花植物的新叶。为了避免创伤反应,新近用干净的解剖刀片从叶柄切下叶子,在主叶脉之间小心切开,分成碎片(2x2cm),以使叶子碎片中的任何创伤反应减到最小。幼虫在24±1℃的控温房间内,于光下饲养。每2-3天测定幼虫的重量,直至第23天,计算平均重量。实验3在与澳洲棉铃虫生物学分析所述相同的条件下,使用40只棉铃虫幼虫。结果如图15所示。
(c)利用人工饲料的生物学分析
为了证实该杀虫活性应归于防御素、而非其它内源性防卫分子的上调,利用包含从花蕾纯化的防御素的人造棉叶饲料进行饲养试验。使用富含半胱氨酸的6kDa花烟草蛋白酶抑制因子(NaPI)(Atkinson等人,Plant Cell 5:203-213,1993)作为阳性对照,酪蛋白用作阴性对照。除人工饲料基于棉叶以外,如Heath等人所述(J.InsectPhysiology 43:833-842,1997)进行饲养试验(表2)。从花烟草的花蕾中纯化30mg防御素,用于两个浓度的人工饲料。饲喂0.3%(w/v)防御素的棉铃虫幼虫比对照小40%(图16),而饲喂相同浓度NaPI的幼虫比对照小约60%。
实施例11
产生转基因棉花植物
(a)土壤杆菌介导的棉花转化
陆地棉(Gossypium hirsutum)栽培品种Coker 315的种子在2%v/v次氯酸钠中表面灭菌60分钟,然后用无菌水洗涤几次。将灭菌的种子播种在半强度的MS培养基中(MS;0.22%w/v Murashige和Skoog盐混合物(Gibco BRL)[1962;同上]、0.2%Gelrite(PhytoTechnology Laboratories),pH 5.8),在暗处30℃温育7天。用pHEX3构建体转化的根瘤土壤杆菌(LBA4404),在补充有抗生素卡那霉素(50μg/mL)的25ml LB培养基中,于28℃生长过夜。测定550nm处吸光度,细胞在MS液体培养基(0.43%w/v Murashige和Skoog盐[1962;同上],pH 5.8)中稀释到2X 108细胞/ml。将棉花下胚轴切成1.5-2cm小块,在稀释的土壤杆菌培养物中短暂混合(0.5-3分钟)。将外植体干贴在无菌3MM纸上,转移到培养液1中(0.43%w/vMurashige和Skoog盐混合物(GibcoBRL)[1962;同上]、0.1%v/vGamborg’s维生素B5溶液(Sigma)、0.1g/L肌醇、0.9g/L MgCl2(六水合物)、1.9g/L硝酸钾、0.2%w/v Gelrite、3%w/v葡萄糖,pH 5.8),用无菌滤纸覆盖,于光下26℃温育3天。
共培养以后,将外植体转移到培养基2中(培养基1加上0.1mg/L激动素、0.1mg/L 2,4-D、500mg/L羧苄青霉素、35mg/L卡那霉素),于弱光下30℃培养。4周以后,将外植体转移到培养基3中(培养基1加上500mg/L羧苄青霉素、35mg/L卡那霉素),于弱光下30℃培养。每4周在培养基3中继代培养外植体和愈伤组织,于弱光下30℃培养。从组织中切下胚,在培养基4中萌发(1.2mMCaC122H2O、5.0mM KNO3、2.0mM MgSO47H2O、3.0mm NH4NO3、0.2mMKH2PO4、4μM烟酸、4μM盐酸吡哆醇、4μM盐酸硫胺素、30μMH3BO3、30μM MnSO4H2O、9μM ZnSO47H2O、1.5μM KI、0.9μMNa2MoO42H2O、0.03μM CuSO45H2O、0.03μM CoCl26H2O、0.5%w/v葡萄糖、0.3%w/v Gelrite,pH 5.5),于强光下30℃培养。
然后将萌发的胚转移到包含培养基5(1.2mM CaCl22H2O、40.0mM KNO3、2.0mM MgSO47H2O、15mM NH4Cl、0.2mM KH2PO4、4μm烟酸、4μm盐酸吡哆醇、4μm盐酸硫胺素、30μm H3BO3、30μmMnSO4H2O、9μm ZnSO47H2O、1.5μm KI、0.9μm Na2MoO42H2O、0.03μm CuSO45H2O、0.03μm CoCl26H2O、2.0%w/v蔗糖、0.2%w/vGelrite,pH 5.5)的Magenta箱中,于强光下30℃培养。一旦植物形成良好的根系并长出几片新叶,便将其转移到盆土中,在生长室中于28℃适应,然后在温室中于(白天27-29℃、夜晚20-24℃)生长。
(b)检测转基因棉的NaPdf1
从生长室或温室中生长的植物上切下叶子(第一位,直径为3-4cm)。将组织(100mg)在液氮中冷冻,用研钵和研杵研磨成细粉。粉末中加入2x样品缓冲液(300μl,Novex NuPAGE LDS样品缓冲液,10%v/v β-巯基乙醇),涡旋30秒,煮沸5分钟,然后14,000转/分离心10分钟,留取上清。在Novex X Cell II微型细胞电泳装置中,利用预制的4-12%w/v聚丙烯酰胺梯度凝胶(Novex,NuPAGEbis-tris,MES缓冲液),200V 35分钟,通过SDS-PAGE分离总可溶性叶提取物。包括预染的分子量标志(Novex SeeBlue)作为标准。利用Novex X Cell II微型细胞电泳装置,在含10%v/v甲醇的NuPAGE转移缓冲液中,于30V 60分钟,将蛋白质转移到硝酸纤维膜(Micron Separations Inc.0.22μm孔径)。转移后将膜在异丙醇中温育1分钟,然后TBS洗涤5分钟。
将膜用3%w/v BSA室温封闭1小时,然后与初级抗体室温温育过夜(用TBS按1∶2500稀释)。将膜用TBST洗涤5x10分钟,然后与缀合辣根过氧化物酶的山羊抗兔IgG室温温育60分钟(Pierce,用TBS按1∶100,000稀释)。再次TBST洗涤5x10分钟,然后按照厂家说明书,将膜与SuperSignal West Pico化学发光底物(Pierce)温育。将膜用ECL Hyperfilm(Amersham Pharmacia Biotech)曝光。结果如图14C所示。
实施例12
转基因棉的昆虫饲养试验
利用两个独立转化的转基因棉系的T2代进行实验。该植物通过初级转基因系CT35.9.4和CT35.125.1(均用pHEX3构建体转化)自交产生,由纯合和半合植物的混合物组成。使用未转化的亲本Coker315植物作为阴性对照。
选择20只新孵化的棉铃虫幼虫。在各个包含1.5%w/v Bacto琼脂的带盖塑料杯(Solo(注册商标)塑料杯,28mL)中饲养幼虫,饲喂叶子碎片,每2-3天或消耗75%以上时更换。采用未开花植物的新叶进行生物学分析。幼虫在25±1℃温控房间于光下饲养。第4、6和8天记录死幼虫的数目。第8天测定每个成活幼虫的重量,计算平均重量。结果如图17所示。
实施例13
产生昆虫抗性植物
(a)多个物种基因的分子克隆
使用图10所示序列中的任何一个氨基酸序列(SEQ ID NO:25-SEQ ID NO:49)设计合适的寡核苷酸引物,用于酌情筛选cDNA或基因组DNA文库。例如以上实施例4(a)和9(a)所述,利用例如PCR克隆对应的完整核苷酸编码序列。然后将表达盒插入目的载体,例如pBIN19或pCGP1988,如实施例9(a)所述使用。
(b)昆虫性植物的转化和再生
利用已知的、本领域技术人员可用的标准技术,利用包含带有相应品种抗昆虫序列的表达盒的一种或多种载体,转化所选目标植物品种的植物材料。合适的转化方法包括但不限于实施例9(b)、9(c)和9(d)所示土壤杆菌介导的转化方法,针对特定植物品种进行必要的修改。特定植物品种的其它转化方法广为人知,并包括例如生物弹(biolistic)转化方法。
植物再生以后,分析其对常见植物害虫、包括昆虫侵袭的抗性。
本领域技术人员应当理解,此处所述本发明容许除明确描述之外的变化和修改。应当理解,本发明包括所有这类变化和修改。本发明也包括本说明书涉及或表明的全部方法、特征、组合物和复合物,不论单个或全体,以及任何两个或多个所述方法或特征的任一及全部组合。
序列表
<110>Hexima Ltd
<120>植物来源分子、其编码遗传序列及其用途
<130>2497993/EJH
<140>国际上尚未得到的
<141>2002-02-08
<150>USSN 60/267,271
<151>2001-02-08
<160>61
<170>PatentIn version 3.0
<210>1
<211>28
<212>DNA
<213>引物
<400>1
ggaattccat atggctcgct ccttgtgc 28
<210>2
<211>29
<212>DNA
<213>引物
<400>2
gcggatcctc agttatccat tatctcttc 29
<210>3
<211>24
<212>DNA
<213>引物
<400>3
ccggatccag agaatgcaaa acag 24
<210>4
<211>26
<212>DNA
<213>引物
<400>4
gggagctctt agttatccat tatctc 26
<210>5
<211>31
<212>DNA
<213>引物
<400>5
ggaattctaa acaatggctc gctccttgtg c 31
<210>6
<211>29
<212>DNA
<213>引物
<400>6
gctctagatc agttatccat tatctcttc 29
<210>7
<211>141
<212>DNA
<213>花烟草
<220>
<221>CDS
<222>(1)..(141)
<400>7
aga gaa tgc aaa aca gaa agc aac aca ttt cct gga ata tgc att acc 48
Arg Glu Cys Lys Thr Glu Ser Asn Thr Phe Pro Gly Ile Cys Ile Thr
1 5 10 15
aaa cca cca tgc aga aaa gct tgt atc agt gag aaa ttt act gat ggt 96
Lys Pro Pro Cys Arg Lys Ala Cys Ile Ser Glu Lys Phe Thr Asp Gly
20 25 30
cat tgt agc aaa atc ctc aga agg tgc cta tgt act aag cca tgt 141
His Cys Ser Lys Ile Leu Arg Arg Cys Leu Cys Thr Lys Pro Cys
35 40 45
<210>8
<211>47
<212>PRT
<213>花烟草
<400>8
Arg Glu Cys Lys Thr Glu Ser Asn Thr Phe Pro Gly Ile Cys Ile Thr
1 5 10 15
Lys Pro Pro Cys Arg Lys Ala Cys Ile Ser Glu Lys Phe Thr Asp Gly
20 25 30
His Cys Ser Lys Ile Leu Arg Arg Cys Leu Cys Thr Lys Pro Cys
35 40 45
<210>9
<211>75
<212>DNA
<213>花烟草
<220>
<221>CDS
<222>(1)..(75)
<400>9
atg gct cgc tcc ttg tgc ttc atg gca ttt gct atc ttg gca agg atg 48
Met Ala Arg Ser Leu Cys Phe Met Ala Phe Ala Ile Leu Ala Arg Met
1 5 10 15
ctc ttt gtt gcc tat gag gtg caa gct 75
Leu Phe Val Ala Tyr Glu Val Gln Ala
20 25
<210>10
<211>25
<212>PRT
<213>花烟草
<400>10
Met Ala Arg Ser Leu Cys Phe Met Ala Phe Ala Ile Leu Ala Arg Met
1 5 10 15
Leu Phe Val Ala Tyr Glu Val Gln Ala
20 25
<210>11
<211>99
<212>DNA
<213>花烟草
<220>
<221>CDS
<222>(1)..(99)
<400>11
gtg ttt gat gag aag atg act aaa aca gga gct gaa att ttg gct gag 48
Val Phe Asp Glu Lys Met Thr Lys Thr Gly Ala Glu Ile Leu Ala Glu
1 5 10 15
gaa gca aaa act ttg gct gca gct ttg ctt gaa gaa gag ata atg gat 96
Glu Ala Lys Thr Leu Ala Ala Ala Leu Leu Glu Glu Glu Ile Met Asp
20 25 30
aac 99
Asn
<210>12
<211>33
<212>PRT
<213>花烟草
<400>12
Val Phe Asp Glu Lys Met Thr Lys Thr Gly Ala Glu Ile Leu Ala Glu
1 5 10 15
Glu Ala Lys Thr Leu Ala Ala Ala Leu Leu Glu Glu Glu Ile Met Asp
20 25 30
Asn
<210>13
<211>216
<212>DNA
<213>花烟草
<220>
<221>CDS
<222>(1)..(216)
<400>13
atg gct cgc tcc ttg tgc ttc atg gca ttt gct atc ttg gca agg atg 48
Met Ala Arg Ser Leu Cys Phe Met Ala Phe Ala Ile Leu Ala Arg Met
1 5 10 15
ctc ttt gtt gcc tat gag gtg caa gct aga gaa tgc aaa aca gaa agc 96
Leu Phe Val Ala Tyr Glu Val Gln Ala Arg Glu Cys Lys Thr Glu Ser
20 25 30
aac aca ttt cct gga ata tgc att acc aaa cca cca tgc aga aaa gct 144
Asn Thr Phe Pro Gly Ile Cys Ile Thr Lys Pro Pro Cys Arg Lys Ala
35 40 45
tgt atc agt gag aaa ttt act gat ggt cat tgt agc aaa atc ctc aga 192
Cys Ile Ser Glu Lys Phe Thr Asp Gly His Cys Ser Lys Ile Leu Arg
50 55 60
agg tgc cta tgt act aag cca tgt 216
Arg Cys Leu Cys Thr Lys Pro Cys
65 70
<210>14
<211>72
<212>PRT
<213>花烟草
<400>14
Met Ala Arg Ser Leu Cys Phe Met Ala Phe Ala Ile Leu Ala Arg Met
1 5 10 15
Leu Phe Val Ala Tyr Glu Val Gln Ala Arg Glu Cys Lys Thr Glu Ser
20 25 30
Asn Thr Phe Pro Gly Ile Cys Ile Thr Lys Pro Pro Cys Arg Lys Ala
35 40 45
Cys Ile Ser Glu Lys Phe Thr Asp Gly His Cys Ser Lys Ile Leu Arg
50 55 60
Arg Cys Leu Cys Thr Lys Pro Cys
65 70
<210>15
<211>240
<212>DNA
<213>花烟草
<220>
<221>CDS
<222>(1)..(240)
<400>15
aga gaa tgc aaa aca gaa agc aac aca ttt cct gga ata tgc att acc 48
Arg Glu Cys Lys Thr Glu Ser Asn Thr Phe Pro Gly Ile Cys Ile Thr
1 5 10 15
aaa cca cca tgc aga aaa gct tgt atc agt gag aaa ttt act gat ggt 96
Lys Pro Pro Cys Arg Lys Ala Cys Ile Ser Glu Lys Phe Thr Asp Gly
20 25 30
cat tgt agc aaa atc ctc aga agg tgc cta tgt act aag cca tgt gtg 144
His Cys Ser Lys Ile Leu Arg Arg Cys Leu Cys Thr Lys Pro Cys Val
35 40 45
ttt gat gag aag atg act aaa aca gga gct gaa att ttg gct gag gaa 192
Phe Asp Glu Lys Met Thr Lys Thr Gly Ala Glu Ile Leu Ala Glu Glu
50 55 60
gca aaa act ttg gct gca gct ttg ctt gaa gaa gag ata atg gat aac 240
Ala Lys Thr Leu Ala Ala Ala Leu Leu Glu Glu Glu Ile Met Asp Asn
65 70 75 80
<210>16
<211>80
<212>PRT
<213>花烟草
<400>16
Arg Glu Cys Lys Thr Glu Ser Asn Thr Phe Pro Gly Ile Cys Ile Thr
1 5 10 15
Lys Pro Pro Cys Arg Lys Ala Cys Ile Ser Glu Lys Phe Thr Asp Gly
20 25 30
His Cys Ser Lys Ile Leu Arg Arg Cys Leu Cys Thr Lys Pro Cys Val
35 40 45
Phe Asp Glu Lys Met Thr Lys Thr Gly Ala Glu Ile Leu Ala Glu Glu
50 55 60
Ala Lys Thr Leu Ala Ala Ala Leu Leu Glu Glu Glu Ile Met Asp Asn
65 70 75 80
<210>17
<211>541
<212>DNA
<213>花烟草
<220>
<221>CDS
<222>(1)..(318)
<400>17
atg gct cgc tcc ttg tgc ttc atg gca ttt gct atc ttg gca agg atg 48
Met Ala Arg Ser Leu Cys Phe Met Ala Phe Ala Ile Leu Ala Arg Met
1 5 10 15
ctc ttt gtt gcc tat gag gtg caa gct aga gaa tgc aaa aca gaa agc 96
Leu Phe Val Ala Tyr Glu Val Gln Ala Arg Glu Cys Lys Thr Glu Ser
20 25 30
aac aca ttt cct gga ata tgc att acc aaa cca cca tgc aga aaa gct 144
Asn Thr Phe Pro Gly Ile Cys Ile Thr Lys Pro Pro Cys Arg Lys Ala
35 40 45
tgt atc agt gag aaa ttt act gat ggt cat tgt agc aaa atc ctc aga 192
Cys Ile Ser Glu Lys Phe Thr Asp Gly His Cys Ser Lys Ile Leu Arg
50 55 60
agg tgc cta tgt act aag cca tgt gtg ttt gat gag aag atg act aaa 240
Arg Cys Leu Cys Thr Lys Pro Cys Val Phe Asp Glu Lys Met Thr Lys
65 70 75 80
aca gga gct gaa att ttg gct gag gaa gca aaa act ttg gct gca gct 288
Thr Gly AIa Glu Ile Leu Ala Glu Glu Ala Lys Thr Leu Ala Ala Ala
85 90 95
ttg ctt gaa gaa gag ata atg gat aac taa ttagagatta gaagaaatta 338
Leu Leu Glu Glu Glu Ile Met Asp Asn
100 105
aggatgcagt atcacacata ataaagtttc tacctttctt aaaagtgtag ctaatgttgt 398
gttttaattg gcttttagta gccttttatt acactttaaa taagtgtggc acttcaatcc 458
tttgtgcaat cttgcactaa gtttatttgt gtacttttaa tgaaaatgac cttctatggt 518
ctttggttaa aaaaaaaaaa aaa 541
<210>18
<211>105
<212>PRT
<213>花烟草
<400>18
Met Ala Arg Ser Leu Cys Phe Met Ala Phe Ala Ile Leu Ala Arg Met
1 5 10 15
Leu Phe Val Ala Tyr Glu Val Gln Ala Arg Glu Cys Lys Thr Glu Ser
20 25 30
Asn Thr Phe Pro Gly Ile Cys Ile Thr Lys Pro Pro Cys Arg Lys Ala
35 40 45
Cys Ile Ser Glu Lys Phe Thr Asp Gly His Cys Ser Lys Ile Leu Arg
50 55 60
Arg Cys Leu Cys Thr Lys Pro Cys Val Phe Asp Glu Lys Met Thr Lys
65 70 75 80
Thr Gly Ala Glu Ile Leu Ala Glu Glu Ala Lys Thr Leu Ala Ala Ala
85 90 95
Leu Leu Glu Glu Glu Ile Met Asp Asn
100 105
<210>19
<211>223
<212>DNA
<213>花烟草
<400>19
ttagagatta gaagaaatta aggatgcagt atcacacata ataaagtttc tacctttctt 60
aaaagtgtag ctaatgttgt gttttaattg gcttttagta gccttttatt acactttaaa 120
taagtgtggc acttcaatcc tttgtgcaat cttgcactaa gtttatttgt gtacttttaa 180
tgaaaatgac cttctatggt ctttggttaa aaaaaaaaaa aaa 223
<210>20
<211>105
<212>PRT
<213>肽
<400>20
Met Ala Arg Ser Leu Cys Phe Met Ala Phe Ala Ile Leu Ala Met Met
1 5 10 15
Leu Phe Val Ala Tyr Glu Val Gln Ala Arg Glu Cys Lys Thr Glu Ser
20 25 30
Asn Thr Phe Pro Gly Ile Cys Ile Thr Lys Pro Pro Cys Arg Lys Ala
35 40 45
Cys Ile Ser Glu Lys Phe Thr Asp Gly His Cys Ser Lys Leu Leu Arg
50 55 60
Cys Leu Cys Thr Lys Pro Cys Val Phe Asp Glu Lys Met Ile Lys
65 70 75 80
Thr Gly Ala Glu Thr Leu Val Glu Glu Ala Lys Thr Leu Ala Ala Ala
85 90 95
Leu Leu Glu Glu Glu Ile Met Asp Asn
100 105
<210>21
<211>105
<212>PRT
<213>肽
<400>21
Met Ala Arg Ser Ile Phe Phe Met Ala Phe Leu Val Leu Ala Met Met
1 5 10 15
Leu Phe Val Thr Tyr Glu Val Glu Ala Gln Gln Ile Cys Lys Ala Pro
20 25 30
Ser Gln Thr Phe Pro Gly Leu Cys Phe Met Asp Ser Ser Cys Arg Lys
35 40 45
Tyr Cys Ile Lys Glu Lys Phe Thr Gly Gly His Cys Ser Lys Leu Gln
50 55 60
Arg Lys Cys Leu Cys Thr Lys Pro Cys Val Phe Asp Lys Ile Ser Ser
65 70 75 80
Glu Val Lys Ala Thr Leu Gly Glu Glu Ala Lys Thr Leu Ser Glu Val
85 90 95
Val Leu Glu Glu Glu Ile Met Met Glu
100 105
<210>22
<211>78
<212>PRT
<213>肽
<400>22
Met Ala Asn Ser Met Arg Phe Phe Ala Thr Val Leu Leu Ile Ala Leu
1 5 10 15
Leu Val Thr Ala Thr Glu Met Gly Pro Met Thr Ile Ala Glu Ala Arg
20 25 30
Thr Cys Glu Ser Gln Ser His Arg Phe Lys Gly Pro Cys Ser Arg Asp
35 40 45
Ser Asn Cys Ala Thr Val Cys Leu Thr Glu Gly Phe Ser Gly Gly Arg
50 55 60
Cys Pro Trp Ile Pro Pro Arg Cys Phe Cys Thr Ser Pro Cys
65 70 75
<210>23
<211>78
<212>PRT
<213>肽
<400>23
Met Gly Arg Ser Ile Arg Leu Phe Ala Thr Phe Phe Leu Ile Ala Met
1 5 10 15
Leu Phe Leu Ser Thr Glu Met Gly Pro Met Thr Ser Ala Glu Ala Arg
20 25 30
Thr Cys Glu Ser Gln Ser His Arg Phe His Gly Thr Cys Val Arg Glu
35 40 45
Ser Asn Cys Ala Ser Val Cys Gln Thr Glu Gly Phe Ile Gly Gly Asn
50 55 60
Cys Arg Ala Phe Arg Arg Arg Cys Phe Cys Thr Arg Asn Cys
65 70 75
<210>24
<211>77
<212>PRT
<213>肽
<400>24
Met Lys Leu Ser Met Arg Leu Ile Ser Ala Val Leu Ile Met Phe Met
1 5 10 15
Ile Phe Val Ala Thr Gly Met Gly Pro Val Thr Val Glu Ala Arg Thr
20 25 30
Cys Glu Ser Gln Ser His Arg Phe Lys Gly Thr Cys Val Ser Ala Ser
35 40 45
Asn Cys Ala Asn Val Cys His Asn Glu Gly Phe Val Gly Gly Asn Cys
50 55 60
Arg Gly Phe Arg Arg Arg Cys Phe Cys Thr Arg His Cys
65 70 75
<210>25
<211>47
<212>PRT
<213>肽
<400>25
Arg Glu Cys Lys Thr Glu Ser Asn Thr Phe Pro Gly Ile Cys Ile Thr
1 5 10 15
Lys Pro Pro Cys Arg Lys Ala Cys Ile Ser Glu Lys Phe Thr Asp Gly
20 25 30
His Cys Ser Lys Leu Leu Arg Arg Cys Leu Cys Thr Lys Pro Cys
35 40 45
<210>26
<211>47
<212>PRT
<213>肽
<400>26
Gln Ile Cys Lys Ala Pro Ser Gln Thr Phe Pro Gly Leu Cys Phe Met
1 5 10 15
Asp Ser Ser Cys Arg Lys Tyr Cys Ile Lys Glu Lys Phe Thr Gly Gly
20 25 30
His Cys Ser Lys Leu Gln Arg Lys Cys Leu Cys Thr Lys Pro Cys
35 40 45
<210>27
<211>47
<212>PRT
<213>肽
<400>27
Arg His Cys Glu Ser Leu Ser His Arg Phe Lys Gly Pro Cys Thr Arg
1 5 10 15
Asp Ser Asn Cys Ala Ser Val Cys Glu Thr Glu Arg Phe Ser Gly Gly
20 25 30
Asn Cys His Gly Phe Arg Arg Arg Cys Phe Cys Thr Lys Pro Cys
35 40 45
<210>28
<211>47
<212>PRT
<213>肽
<400>28
Arg Val Cys Glu Ser Gln Ser His Gly Phe His Gly Leu Cys Asn Arg
1 5 10 15
Asp His Asn Cys Ala Leu Val Cys Arg Asn Glu Gly Phe Ser Gly Gly
20 25 30
Arg Cys Lys Gly Phe Arg Arg Arg Cys Phe Cys Thr Arg Ile Cys
35 40 45
<210>29
<211>47
<212>PRT
<213>肽
<400>29
Arg Thr Cys Glu Ser Gln Ser His Arg Phe His Gly Thr Cys Val Arg
1 5 10 15
Glu Ser Asn Cys Ala Ser Val Cys Gln Thr Glu Gly Phe Ile Gly Gly
20 25 30
Asn Cys Arg Ala Phe Arg Arg Arg Cys Phe Cys Thr Arg Asn Cys
35 40 45
<210>30
<211>47
<212>PRT
<213>肽
<400>30
Arg Ile Cys Arg Arg Arg Ser Ala Gly Phe Lys Gly Pro Cys Val Ser
1 5 10 15
Asn Lys Asn Cys Ala Gln Val Cys Met Gln Glu Trp Gly Glu Gly Gly
20 25 30
Asn Cys Asp Gly Pro Leu Arg Arg Cys Lys Cys Met Arg Arg Cys
35 40 45
<210>31
<211>51
<212>PRT
<213>肽
<400>31
Gln Lys Leu Cys Gln Arg Pro Ser Gly Thr Trp Ser Gly Val Cys Gly
1 5 10 15
Asn Asn Asn Ala Cys Arg Asn Gln Cys Ile Asn Leu Glu Lys Ala Arg
20 25 30
His Gly Ser Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile Cys Tyr
35 40 45
Phe Pro Cys
50
<210>32
<211>20
<212>PRT
<213>肽
<400>32
Arg Asn Cys Glu Ser Leu Ser His Arg Phe Lys Gly Pro Cys Thr Arg
1 5 10 15
Asp Ser Asn Cys
20
<210>33
<211>51
<212>PRT
<213>肽
<400>33
Gln Lys Leu Cys Glu Arg Pro Ser Gly Thr Trp Ser Gly Val Cys Gly
1 5 10 15
Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile Asn Leu Glu Lys Ala Arg
20 25 30
His Gly Ser Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile Cys Tyr
35 40 45
Phe Pro Cys
50
<210>34
<211>51
<212>PRT
<213>肽
<400>34
Gln Lys Leu Cys Gln Arg Pro Ser Gly Thr Trp Ser Gly Val Cys Gly
1 5 10 15
Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile Arg Leu Glu Lys Ala Arg
20 25 30
His Gly Ser Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile Cys Tyr
35 40 45
Phe Pro Cys
50
<210>35
<211>51
<212>PRT
<213>肽
<400>35
Gln Lys Leu Cys Glu Arg Pro Ser Gly Thr Trp Ser Gly Val Cys Gly
1 5 10 15
Asn Asn Asn Ala Cys Lys Asn Gln Cys Ile Asn Leu Glu Lys Ala Arg
20 25 30
His Gly Ser Cys Asn Tyr Val Phe Pro Ala His Lys Cys Ile Cys Tyr
35 40 45
Phe Pro Cys
50
<210>36
<211>52
<212>PRT
<213>肽
<400>36
Gln Lys Leu Cys Ala Arg Pro Ser Gly Thr Trp Ser Ser Gly Asn Cys
1 5 10 15
Arg Asn Asn Asn Ala Cys Arg Asn Phe Cys Ile Lys Leu Glu Lys Ser
20 25 30
Arg His Gly Ser Cys Asn Ile Pro Phe Pro Ser Asn Lys Cys Ile Cys
35 40 45
Tyr Phe Pro Cys
50
<210>37
<211>47
<212>PRT
<213>肽
<400>37
Lys Ile Cys Arg Arg Arg Ser Ala Gly Phe Lys Gly Pro Cys Met Ser
1 5 10 15
Asn Lys Asn Cys Ala Gln Val Cys Gln Gln Glu Gly Trp Gly Gly Gly
20 25 30
Asn Cys Asp Gly Pro Phe Arg Arg Cys Lys Cys Ile Arg Gln Cys
35 40 45
<210>38
<211>47
<212>PRT
<213>肽
<400>38
Lys Val Cys Arg Gln Arg Ser Ala Gly Phe Lys Gly Pro Cys Val Ser
1 5 10 15
Asp Lys Asn Cys Ala Gln Val Cys Leu Gln Glu Gly Trp Gly Gly Gly
20 25 30
Asn Cys Asp Gly Pro Phe Arg Arg Cys Lys Cys Ile Arg Gln Cys
35 40 45
<210>39
<211>47
<212>PRT
<213>肽
<400>39
Lys Thr Cys Glu Asn Leu Val Asp Thr Tyr Arg Gly Pro Cys Phe Thr
1 5 10 15
Thr Gly Ser Cys Asp Asp His Cys Lys Asn Lys Glu His Leu Leu Ser
20 25 30
Gly Arg Cys Arg Asp Asp Val Arg Cys Trp Cys Thr Arg Asn Cys
35 40 45
<210>40
<211>48
<212>PRT
<213>肽
<400>40
Arg Val Cys Met Gly Lys Ser Ala Gly Phe Lys Gly Leu Cys Met Arg
1 5 10 15
Asp Gln Asn Cys Ala Gln Val Cys Leu Gln Glu Gly Trp Gly Gly Gly
20 25 30
Asn Cys Asp Gly Val Met Arg Gln Cys Lys Cys Ile Arg Gln Cys Trp
35 40 45
<210>41
<211>48
<212>PRT
<213>肽
<400>41
Arg Val Cys Arg Arg Arg Ser Ala Gly Phe Lys Gly Leu Cys Met Ser
1 5 10 15
Asp His Asn Cys Ala Gln Val Cys Leu Gln Glu Gly Trp Gly Gly Gly
20 25 30
Asn Cys Asp Gly Val Ile Arg Gln Cys Lys Cys Ile Arg Gln Cys Trp
35 40 45
<210>42
<211>20
<212>PRT
<213>肽
<400>42
Glu Val Cys Glu Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn
1 5 10 15
Thr Gly His Cys
20
<210>43
<211>47
<212>PRT
<213>肽
<400>43
Arg Val Cys Met Lys Gly Ser Gln His His Ser Phe Pro Cys Ile Ser
1 5 10 15
Asp Arg Leu Cys Ser Asn Glu Cys Val Lys Glu Glu Gly Gly Trp Thr
20 25 30
Ala Gly Tyr Cys His Leu Arg Tyr Cys Arg Cys Gln Lys Ala Cys
35 40 45
<210>44
<211>45
<212>PRT
<213>肽
<400>44
Asn Thr Cys Glu Asn Leu Ala Gly Ser Tyr Lys Gly Val Cys Phe Gly
1 5 10 15
Gly Cys Asp Arg His Cys Arg Thr Gln Glu Gly Ala Ile Ser Gly Arg
20 25 30
Cys Arg Asp Asp Phe Arg Cys Trp Cys Thr Lys Asn Cys
35 40 45
<210>45
<211>50
<212>PRT
<213>肽
<400>45
Leu Cys Asn Glu Arg Pro Ser Gln Thr Trp Ser Gly Asn Cys Gly Asn
1 5 10 15
Thr Ala His Cys Asp Lys Gln Cys Gln Asp Trp Glu Lys Ala Ser His
20 25 30
Gly Ala Cys His Lys Arg Glu Asn His Trp Lys Cys Phe Cys Tyr Phe
35 40 45
Asn Cys
50
<210>46
<211>51
<212>PRT
<213>肽
<400>46
Lys Leu Cys Asp Val Pro Ser Gly Thr Trp Ser Gly His Cys Gly Ser
1 5 10 15
Ser Ser Lys Cys Ser Gln Gln Cys Lys Asp Arg Glu His Phe Ala Tyr
20 25 30
Gly Gly Ala Cys His Tyr Gln Phe Pro Ser Val Lys Cys Phe Cys Lys
35 40 45
Arg Gln Cys
50
<210>47
<211>50
<212>PRT
<213>肽
<400>47
Glu Leu Cys Glu Lys Ala Ser Lys Thr Trp Ser Gly Asn Cys Gly Asn
1 5 10 15
Thr Gly His Cys Asp Asn Gln Cys Lys Ser Trp Glu Gly Ala Ala His
20 25 30
Gly Ala Cys His Val Arg Asn Gly Lys His Met Cys Phe Cys Tyr Phe
35 40 45
Asn Cys
50
<210>48
<211>46
<212>PRT
<213>肽
<400>48
Asn Thr Cys Glu His Leu Ala Asp Thr Tyr Arg Gly Val Cys Phe Thr
1 5 10 15
Asn Ala Ser Cys Asp Asp His Cys Lys Asn Lys Ala His Leu Ile Ser
20 25 30
Gly Thr Cys His Asp Trp Lys Cys Phe Cys Thr Gln Asn Cys
35 40 45
<210>49
<211>49
<212>PRT
<213>肽
<400>49
Asn Leu Cys Glu Arg Ala Ser Leu Thr Trp Thr Gly Asn Cys Gly Asn
1 5 10 15
Thr Gly His Cys Asp Thr Gln Cys Arg Asn Trp Glu Ser Ala Lys His
20 25 30
Gly Ala Cys His Lys Arg Gly Asn Trp Lys Cys Phe Cys Tyr Phe Asn
35 40 45
Cys
<210>50
<211>79
<212>PRT
<213>肽
<400>50
Leu Phe Val Ala Tyr Glu Val Gln Ala Arg Glu Cys Ala Arg Glu Ile
1 5 10 15
Phe Thr Gly Leu Cys Ile Thr Asn Pro Gln Cys Arg Lys Ala Cys Ile
20 25 30
Lys Glu Lys Phe Thr Asp Gly His Cys Ser Lys Ile Leu Arg Arg Cys
35 40 45
Leu Cys Thr Lys ProCysThr Gly Ala Glu Thr Leu Ala Glu Glu Ala
50 55 60
Thr Thr Leu Ala Ala Ala Leu Leu Glu Glu Glu Ile Met Asp Asn
65 70 75
<210>51
<211>105
<212>PRT
<213>肽
<400>51
Met Ala Arg Ser Val Cys Phe Met Ala Phe Ala Ile Leu Ala Val Met
1 5 10 15
Leu Phe Val Ala Tyr Asp Val Glu Ala Lys Asp Cys Lys Thr Glu Ser
20 25 30
Asn Thr Phe Pro Gly Ile Cys Ile Thr Lys Pro Pro Cys Arg Lys Ala
35 40 45
Cys Ile Lys Glu Lys Phe Thr Asp Gly His Cys Ser Lys Ile Leu Arg
50 55 60
Arg Cys Leu Cys Thr Lys Pro Cys Val Phe Asp Glu Lys Met Ile Lys
65 70 75 80
Thr Gly Ala Glu Thr Leu Ala Glu Glu Ala Thr Thr Leu Ala Ala Ala
85 90 95
Leu Leu Glu Glu Glu Ile Met Asp Asn
100 105
<210>52
<211>106
<212>PRT
<213>肽
<400>52
Met Ala Arg Ser Leu Cys Phe Met Ala Phe Ala Val Leu Ala Met Met
1 5 10 15
Leu Phe Val Ala Tyr Glu Val Gln Ala Lys Ser Thr Cys Lys Ala Glu
20 25 30
Ser Asn Thr Phe Pro Gly Leu Cys Ile Thr Lys Pro Pro Cys Arg Lys
35 40 45
Ala Cys Leu Ser Glu Lys Phe Thr Asp Gly Lys Cys Ser Lys Ile Leu
50 55 60
Arg Arg Cys Ile Cys Tyr Lys Pro Cys Val Phe Asp Gly Lys Met Ile
65 70 75 80
Gln Thr Gly Ala Glu Asn Leu Ala Glu Glu Ala Glu Thr Leu Ala Ala
85 90 95
Ala Leu Leu Glu Glu Glu Met Met Asp Asn
100 105
<210>53
<211>47
<212>PRT
<213>肽
<400>53
Arg Thr Cys Glu Ser Gln Ser His Arg Phe Lys Gly Pro Cys Ser Arg
1 5 10 15
Asp Ser Asn Cys Ala Thr Val Cys Leu Thr Glu Gly Phe Ser Gly Gly
20 25 30
Arg Cys Pro Trp Ile Pro Pro Arg Cys Phe Cys Thr Ser Pro Cys
35 40 45
<210>54
<211>19
<212>PRT
<213>肽
<400>54
Arg Thr Cys Glu Ser Gln Ser His Arg Phe His Gly Thr Cys Val Arg
1 5 10 15
Glu Ser Asn
<210>55
<211>47
<212>PRT
<213>肽
<400>55
Arg Thr Cys Glu Ser Gln Ser His Arg Phe Lys Gly Thr Cys Val Ser
1 5 10 15
Ala Ser Asn Cys Ala Asn Val Cys His Asn Glu Gly Phe Val Gly Gly
20 25 30
Asn Cys Arg Gly Phe Arg Arg Arg Cys Phe Cys Thr Arg His Cys
35 40 45
<210>56
<211>1104
<212>DNA
<213>花烟草
<220>
<221>CDS
<222>(1)..(1104)
<400>56
aag gct tgt acc tta aac tgt gat cca aga att gcc tat gga gtt tgc 48
Lys Ala Cys Thr Leu Asn Cys Asp Pro Arg Ile Ala Tyr Gly Val Cys
1 5 10 15
ccg cgt tca gaa gaa aag aag aat gat cgg ata tgc acc aac tgt tgc 96
Pro Arg Ser Glu Glu Lys Lys Asn Asp Arg Ile Cys Thr Asn Cys Cys
20 25 30
gca ggc acg aag ggt tgt aag tac ttc agt gat gat gga act ttt gtt 144
Ala Gly Thr Lys Gly Cys Lys Tyr Phe Ser Asp Asp Gly Thr Phe Val
35 40 45
tgt gaa gga gag tct gat cct aga aat cca aag gct tgt acc tta aac 192
Cys Glu Gly Glu Ser Asp Pro Arg Asn Pro Lys Ala Cys Thr Leu Asn
50 55 60
tgt gat cca aga att gcc tat gga gtt tgc ccg cgt tca gaa gaa aag 240
Cys Asp Pro Arg Ile Ala Tyr Gly Val Cys Pro Arg Ser Glu Glu Lys
65 70 75 80
aag aat gat cgg ata tgc acc aac tgt tgc gca ggc acg aag ggt tgt 288
Lys Asn Asp Arg Ile Cys Thr Asn Cys Cys Ala Gly Thr Lys Gly Cys
85 90 95
aag tac ttc agt gat gat gga act ttt gtt tgt gaa gga gag tct gat 336
Lys Tyr Phe Ser Asp Asp Gly Thr Phe Val Cys Glu Gly Glu Ser Asp
100 105 110
cct aga aat cca aag gct tgt cct cgg aat tgc gat cca aga att gcc 384
Pro Arg Asn Pro Lys Ala Cys Pro Arg Asn Cys Asp Pro Arg Ile Ala
115 120 125
tat ggg att tgc cca ctt gca gaa gaa aag aag aat gat cgg ata tgc 432
Tyr GlyIle Cys Pro Leu Ala Glu Glu Lys Lys Asn Asp Arg Ile Cys
130 135 140
acc aac tgt tgc gca ggc aaa aag ggt tgt aag tac ttt agt gat gat 480
Thr Asn Cys Cys Ala Gly Lys Lys Gly Cys Lys Tyr Phe Ser Asp Asp
145 150 155 160
gga act ttt gtt tgt gaa gga gag tct gat cct aaa aat cca aag gcc 528
Gly Thr Phe Val Cys Glu Gly Glu Ser Asp Pro Lys Asn Pro Lys Ala
165 170 175
tgt cct cgg aat tgt gat gga aga att gcc tat ggg att tgc cca ctt 576
Cys Pro Arg Asn Cys Asp Gly Arg Ile Ala Tyr Gly Ile Cys Pro Leu
180 185 190
tca gaa gaa aag aag aat gat cgg ata tgc acc aac tgc tgc gca ggc 624
Ser Glu Glu Lys Lys Asn Asp Arg Ile Cys Thr Asn Cys Cys Ala Gly
195 200 205
aaa aag ggt tgt aag tac ttt agt gat gat gga act ttt gtt tgt gaa 672
Lys Lys Gly Cys Lys Tyr Phe Ser Asp Asp Gly Thr Phe Val Cys Glu
210 215 220
gga gag tct gat cct aaa aat cca aag gct tgt cct cgg aat tgt gat 720
Gly Glu Ser Asp Pro Lys Asn Pro Lys Ala Cys Pro Arg Asn Cys Asp
225 230 235 240
gga aga att gcc tat ggg att tgc cca ctt tca gaa gaa aag aag aat 768
Gly Arg Ile Ala Tyr Gly Ile Cys Pro Leu Ser Glu Glu Lys Lys Asn
245 250 255
gat cgg ata tgc aca aac tgt tgc gca ggc aaa aag ggc tgt aag tac 816
Asp Arg Ile Cys Thr Asn Cys Cys Ala Gly Lys Lys Gly Cys Lys Tyr
260 265 270
ttt agt gat gat gga act ttt gtt tgt gaa gga gag tct gat cct aga 864
Phe Ser Asp Asp Gly Thr Phe Val Cys Glu Gly Glu Ser Asp Pro Arg
275 280 285
aat cca aag gcc tgt cct cgg aat tgt gat gga aga att gcc tat gga 912
Asn Pro Lys Ala Cys Pro Arg Asn Cys Asp Gly Arg Ile Ala Tyr Gly
290 295 300
att tgc cca ctt tca gaa gaa aag aag aat gat cgg ata tgc acc aat 960
Ile Cys Pro Leu Ser Glu Glu Lys Lys Asn Asp Arg Ile Cys Thr Asn
305 310 315 320
tgt tgc gca ggc aag aag ggc tgt aag tac ttt agt gat gat gga act 1008
Cys Cys Ala Gly Lys Lys Gly Cys Lys Tyr Phe Ser Asp Asp Gly Thr
325 330 335
ttt att tgt gaa gga gaa tct gaa tat gcc agc aaa gtg gat gaa tat 1056
Phe Ile Cys Glu Gly Glu Ser Glu Tyr Ala Ser Lys Val Asp Glu Tyr
340 345 350
gtt ggt gaa gtg gag aat gat ctc cag aag tct aag gtt gct gtt tcc 1104
Val Gly Glu Val Glu Asn Asp Leu Gln Lys Ser Lys Val Ala Val Ser
355 360 365
<210>57
<211>368
<212>PRT
<213>花烟草
<400>57
Lys Ala Cys Thr Leu Asn Cys Asp Pro Arg Ile Ala Tyr Gly Val Cys
1 5 10 15
Pro Arg Ser Glu Glu Lys Lys Asn Asp Arg Ile Cys Thr Asn Cys Cys
20 25 30
Ala Gly Thr Lys Gly Cys Lys Tyr Phe Ser Asp Asp Gly Thr Phe Val
35 40 45
Cys Glu Gly Glu Ser Asp Pro Arg Asn Pro Lys Ala Cys Thr Leu Asn
50 55 60
Cys Asp Pro Arg Ile Ala Tyr Gly Val Cys Pro Arg Ser Glu Glu Lys
65 70 75 80
Lys Asn Asp Arg Ile Cys Thr Asn Cys Cys Ala Gly Thr Lys Gly Cys
85 90 95
Lys Tyr Phe Ser Asp Asp Gly Thr Phe Val Cys Glu Gly Glu Ser Asp
100 105 110
Pro Arg Asn Pro Lys Ala Cys Pro Arg Asn Cys Asp Pro Arg Ile Ala
115 120 125
Tyr Gly Ile Cys Pro Leu Ala Glu Glu Lys Lys Asn Asp Arg Ile Cys
130 135 140
Thr Asn Cys Cys Ala Gly Lys Lys Gly Cys Lys Tyr Phe Ser Asp Asp
145 150 155 160
Gly Thr Phe Val Cys Glu Gly Glu Ser Asp Pro Lys Asn Pro Lys Ala
165 170 175
Cys Pro Arg Asn Cys Asp Gly Arg Ile Ala Tyr Gly Ile Cys Pro Leu
180 185 190
Ser Glu Glu Lys Lys Asn Asp Arg Ile Cys Thr Asn Cys Cys Ala Gly
195 200 205
Lys Lys Gly Cys Lys Tyr Phe Ser Asp Asp Gly Thr Phe Val Cys Glu
210 215 220
Gly Glu Ser Asp Pro Lys Asn Pro Lys Ala Cys Pro Arg Asn Cys Asp
225 230 235 240
Gly Arg Ile Ala Tyr Gly Ile Cys Pro Leu Ser Glu Glu Lys Lys Asn
245 250 255
Asp Arg Ile Cys Thr Asn Cys Cys Ala Gly Lys Lys Gly Cys Lys Tyr
260 265 270
Phe Ser Asp Asp Gly Thr Phe Val Cys Glu Gly Glu Ser Asp Pro Arg
275 280 285
Asn Pro Lys Ala Cys Pro Arg Asn Cys Asp Gly Arg Ile Ala Tyr Gly
290 295 300
Ile Cys Pro Leu Ser Glu Glu Lys Lys Asn Asp Arg Ile Cys Thr Asn
305 310 315 320
Cys Cys Ala Gly Lys Lys Gly Cys Lys Tyr Phe Ser Asp Asp Gly Thr
325 330 335
Phe Ile Cys Glu Gly Glu Ser Glu Tyr Ala Ser Lys Val Asp Glu Tyr
340 345 350
Val Gly Glu Val Glu Asn Asp Leu Gln Lys Ser Lys Val Ala Val Ser
355 360 365
<210>58
<211>47
<212>PRT
<213>花烟草
<220>
<221>misc_特征
<222>(1)..(1)
<223>X=R或Q
<220>
<221>misc_特征
<222>(2)..(2)
<223>X=E或I或T
<220>
<221>misc_特征
<222>(2)..(2)
<223>X=E或I或T
<220>
<221>misc_特征
<222>(4)..(4)
<223>X=K或E
<220>
<221>misc_特征
<222>(5)..(5)
<223>X=T或A或S
<220>
<221>misc_特征
<222>(6)..(6)
<223>X=E或P或Q
<220>
<221>misc_特征
<222>(8)..(8)
<223>X=N或Q或H
<220>
<221>misc_特征
<222>(9)..(9)
<223>X=T或R
<220>
<221>misc_特征
<222>(11)..(11)
<223>X=P或K或H
<220>
<221>misc_特征
<222>(13)..(13)
<223>X=I或L或P或T
<220>
<221>misc_特征
<222>(15)..(15)
<223>X=I或F或S或V
<220>
<221>misc_特征
<222>(16)..(16)
<223>X=T或M或R或S
<220>
<221>misc_特征
<222>(17)..(17)
<223>X=K或D或E或A
<220>
<221>misc_特征
<222>(18)..(18)
<223>X=P或S
<220>
<221>misc_特征
<222>(19)..(19)
<223>X=P或S或N
<220>
<221>misc_特征
<222>(21)..(21)
<223>X=R或A
<220>
<221>misc_特征
<222>(22)..(22)
<223>X=K或T或S或N
<220>
<221misc_特征
<222>(23)..(23)
<223>X=A或Y或V
<220>
<221>misc_特征
<222>(25)..(25)
<223>X=I或L或Q或H
<220>
<221>misc_特征
<222>(26)..(26)
<223>X=S或K或T或N
<220>
<221>misc_特征
<222>(28)..(28)
<223>X=K或G
<220>
<221>misc_特征
<222>(30)..(30)
<223>X=T或S或I或V
<220>
<221>misc_特征
<222>(31)..(31)
<223>X=D或G
<220>
<221>misc_特征
<222>(33)..(33)
<223>X=H或R或N
<220>
<221>misc_特征
<222>(35)..(35)
<223>X=S或P或R
<220>
<221>misc_特征
<222>(36)..(36)
<223>X=K或W或A或G
<220>
<221>misc_特征
<222>(37)..(37)
<223>X=I或L或F
<220>
<221>misc_特征
<222>(38)..(38)
<223>X=L或Q或P或R
<220>
<221>misc_特征
<222>(39)..(39)
<223>X=R或P
<220>
<221>misc_特征
<222>(40)..(40)
<223>X=R或K
<220>
<221>misc_特征
<222>(42)..(42)
<223>X=L或F
<220>
<221>misc_特征
<222>(45)..(45)
<223>X=K或S或R
<400>58
Xaa Xaa Cys Xaa Xaa Xaa Ser Xaa Xaa Phe Xaa Gly Xaa Cys Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Cys Xaa Xaa Xaa Cys Xaa Xaa Glu Xaa Phe Xaa Xaa Gly
20 25 30
Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Cys Xaa Cys Thr Xaa Xaa Cys
35 40 45
<210>59
<211>32
<212>PRT
<213>花烟草
<220>
<221>misc_特征
<222>(2)..(2)
<223>X=A或G或K
<220>
<221>misc_特征
<222>(3)..(3)
<223>X=R或N或L
<220>
<221>misc_特征
<222>(5)..(5)
<223>X=L或I或M
<220>
<221>misc_特征
<222>(6)..(6)
<223>X=C或F或R
<220>
<221>misc_特征
<222>(7)..(7)
<223>X=F或L
<220>
<221>misc_特征
<222>(8)..(8)
<223>X=M或F或I
<220>
<221>misc_特征
<222>(9)..(9)
<223>X=A或S
<220>
<221>misc_特征
<222>(10)..(10)
<223>X=F或T或A
<220>
<221>misc_特征
<222>(11)..(11)
<223>X=A或L或V或F
<220>
<221>misc_特征
<222>(12)..(12)
<223>X=I或V或L或F
<220>
<221>misc_特征
<222>(13)..(13)
<223>X=L或I
<220>
<221>misc_特征
<222>(14)..(14)
<223>X=A或I或M
<220>
<221>misc_特征
<222>(15)..(15)
<223>X=M或A或F
<220>
<221>misc_特征
<222>(16)..(16)
<223>X=M或L
<220>
<221>misc_特征
<222>(17)..(17)
<223>X=L或I
<220>
<221>misc_特征
<222>(18)..(18)
<223>X=F或V
<220>
<221>misc_特征
<222>(19)..(19)
<223>X=V或T或L
<220>
<221>misc_特征
<222>(20)..(20)
<223>X=A或T或S
<220>
<221>misc_特征
<222>(21)..(21)
<223>X=Y或T
<220>
<221>misc_特征
<222>(22)..(22)
<223>X=E或G
<220>
<221>misc_特征
<222>(23)..(23)
<223>X=V或M
<220>
<221>misc_特征
<222>(24)..(24)
<223>X=无氨基酸或G
<220>
<221>misc_特征
<222>(25)..(25)
<223>X=无氨基酸或P
<220>
<221>misc_特征
<222>(26)..(26)
<223>X=无氨基酸或M或V
<220>
<221>misc_特征
<222>(27)..(27)
<223>X=无氨基酸或T
<220>
<221>misc_特征
<222>(28)..(28)
<223>X=无氨基酸或I或S
<220>
<221>misc_特征
<222>(29)..(29)
<223>X=无氨基酸或A或V
<220>
<221>misc_特征
<222>(30)..(30)
<223>X=Q或E
<220>
<221>misc_特征
<222>(32)..(32)
<223>X=无氨基酸或Q
<400>59
Met Xaa Xaa Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala Xaa
20 25 30
<210>60
<211>33
<212>PRT
<213>花烟草
<220>
<221>misc_特征
<222>(1)..(1)
<223>X=无氨基酸或V
<220>
<221>misc_特征
<222>(2)..(2)
<223>X=无氨基酸或F
<220>
<221>misc_特征
<222>(3)..(3)
<223>X=无氨基酸或D
<220>
<221>misc_特征
<222>(4)..(4)
<223>X=无氨基酸或E或K
<220>
<221>misc_特征
<222>(5)..(5)
<223>X=无氨基酸或K或I
<220>
<221>misc_特征
<222>(6)..(6)
<223>X=无氨基酸或M或S
<220>
<221>misc_特征
<222>(7)..(7)
<223>X=无氨基酸或T或I或S
<220>
<221>misc_特征
<222>(8)..(8)
<223>X=无氨基酸或K或E
<220>
<221>misc_特征
<222>(9)..(9)
<223>X=无氨基酸或T或V
<220>
<221>misc_特征
<222>(10)..(10)
<223>X=无氨基酸或G或K
<220>
<221>misc_特征
<222>(11)..(11)
<223>X=无氨基酸或A
<220>
<221>misc_特征
<222>(12)..(12)
<223>X=无氨基酸或E
<220>
<221>misc_特征
<222>(13)..(13)
<223>X=无氨基酸或I或T
<220>
<221>misc_特征
<222>(14)..(14)
<223>X=无氨基酸或L
<220>
<221>misc_特征
<222>(15)..(15)
<223>X=无氨基酸或A或V或G
<220>
<221>misc_特征
<222>(16)..(16)
<223>X=无氨基酸或E
<220>
<221>misc_特征
<222>(17)..(17)
<223>X=无氨基酸或E
<220>
<221>misc_特征
<222>(18)..(18)
<223>X=无氨基酸或A
<220>
<221>misc_特征
<222>(19)..(19)
<223>X=无氨基酸或K
<220>
<221>misc_特征
<222>(20)..(20)
<223>X=无氨基酸或T
<220>
<221>misc_特征
<222>(21)..(21)
<223>X=无氨基酸或L
<220>
<221>misc_特征
<222>(22)..(22)
<223>X=无氨基酸或A或S
<220>
<221>misc_特征
<222>(23)..(23)
<223>X=无氨基酸或A或E
<220>
<221>misc_特征
<222>(24)..(24)
<223>X=无氨基酸或A或V
<220>
<221>misc_特征
<222>(25)..(25)
<223>X=无氨基酸或L或V
<220>
<221>misc_特征
<222>(26)..(26)
<223>X=无氨基酸或L
<220>
<221>misc_特征
<222>(27)..(27)
<223>X=无氨基酸或E
<220>
<221>misc_特征
<222>(28)..(28)
<223>X=无氨基酸或E
<220>
<221>misc_特征
<222>(29)..(29)
<223>X=无氨基酸或E
<220>
<221>misc_特征
<222>(30)..(30)
<223>X=无氨基酸或I
<220>
<221>misc_特征
<222>(31)..(31)
<223>X=无氨基酸或M
<220>
<221>misc_特征
<222>(32)..(32)
<223>X=无氨基酸或D或M
<220>
<221>misc_特征
<222>(33)..(33)
<223>X=无氨基酸或N或E
<400>60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa
<210>61
<211>112
<212>PRT
<213>花烟草
<220>
<221>misc_特征
<222>(2)..(2)
<223>X=A或G或K
<220>
<221>misc_特征
<222>(3)..(3)
<223>X=R或N或L
<220>
<221>misc_特征
<222>(5)..(5)
<223>X=L或I或M
<220>
<221>misc_特征
<222>(6)..(6)
<223>X=C或F或R
<220>
<221>misc_特征
<222>(7)..(7)
<223>X=F或L
<220>
<221>misc_特征
<222>(8)..(8)
<223>X=M或F或I
<220>
<221>misc_特征
<222>(9)..(9)
<223>X=A或S
<220>
<221>misc_特征
<222>(10)..(10)
<223>X=F或T或A
<220>
<221>misc_特征
<222>(11)..(11)
<223>X=A或L或V或F
<220>
<221>misc_特征
<222>(12)..(12)
<223>X=I或V或L或F
<220>
<221>misc_特征
<222>(13)..(13)
<223>X=L或I
<220>
<221>misc_特征
<222>(14)..(14)
<223>X=A或I或M
<220>
<221>misc_特征
<222>(15)..(15)
<223>X=M或A或F
<220>
<221>misc_特征
<222>(16)..(16)
<223>X=M或L
<220>
<221>misc_特征
<222>(17)..(17)
<223>X=L或I
<220>
<221>misc_特征
<222>(18)..(18)
<223>X=F或V
<220>
<221>misc_特征
<222>(19)..(19)
<223>X=V或T或L
<220>
<221>misc_特征
<222>(20)..(20)
<223>X=A或T或S
<220>
<221>misc_特征
<222>(21)..(21)
<223>X=Y或T
<220>
<221>misc_特征
<222>(22)..(22)
<223>X=E或G
<220>
<221>misc_特征
<222>(23)..(23)
<223>X=V或M
<220>
<221>misc_特征
<222>(24)..(24)
<223>X=无氨基酸或G
<220>
<221>misc_特征
<222>(25)..(25)
<223>X=无氨基酸或P
<220>
<221>misc_特征
<222>(26)..(26)
<223>X=无氨基酸或M或V
<220>
<221>misc_特征
<222>(27)..(27)
<223>X=无氨基酸或T
<220>
<221>misc_特征
<222>(28)..(28)
<223>X=无氨基酸或I或S
<220>
<221>misc_特征
<222>(29)..(29)
<223>X=无氨基酸或A或V
<220>
<221>misc_特征
<222>(30)..(30)
<223>X=Q或E
<220>
<221>misc_特征
<222>(32)..(32)
<223>X=无氨基酸或Q
<220>
<221>misc_特征
<222>(33)..(33)
<223>X=R或Q
<220>
<221>misc_特征
<222>(34)..(34)
<223>X=E或I或T
<220>
<221>misc_特征
<222>(36)..(36)
<223>X=K或E
<220>
<221>misc_特征
<222>(37)..(37)
<223>X=T或A或S
<220>
<221>misc_特征
<222>(38)..(38)
<223>X=E或P或Q
<220>
<221>misc_特征
<222>(40)..(40)
<223>X=N或Q或H
<220>
<221>misc_特征
<222>(41)..(41)
<223>X=T或R
<220>
<221>misc_特征
<222>(43)..(43)
<223>X=P或K或H
<220>
<221>misc_特征
<222>(45)..(45)
<223>X=I或L或P或T
<220>
<221>misc_特征
<222>(47)..(47)
<223>X=I或F或S或V
<220>
<221>misc_特征
<222>(48)..(48)
<223>X=T或M或R或S
<220>
<221>misc_特征
<222>(49)..(49)
<223>X=K或D或E或A
<220>
<221>misc_特征
<222>(50)..(50)
<223>X=P或S
<220>
<221>misc_特征
<222>(51)..(51)
<223>X=P或S或N
<220>
<221>misc_特征
<222>(53)..(53)
<223>X=R或A
<220>
<221>misc_特征
<222>(54)..(54)
<223>X=K或T或S或N
<220>
<221>misc_特征
<222>(55)..(55)
<223>X=A或Y或V
<220>
<221>misc_特征
<222>(57)..(57)
<223>X=I或L或Q或H
<220>
<221>misc_特征
<222>(58)..(58)
<223>X=S或K或T或N
<220>
<221>misc_特征
<222>(60)..(60)
<223>X=K或G
<220>
<221>misc_特征
<222>(62)..(62)
<223>X=T或S或I或V
<220>
<221>misc_特征
<222>(63)..(63)
<223>X=D或G
<220>
<221>misc_特征
<222>(65)..(65)
<223>X=H或R或N
<220>
<221>misc_特征
<222>(67)..(67)
<223>X=S或P或R
<220>
<221>misc_特征
<222>(68)..(68)
<223>X=K或W或A或G
<220>
<221>misc_特征
<222>(69)..(69)
<223>X=I或L或F
<220>
<221>misc_特征
<222>(70)..(70)
<223>X=L或Q或P或R
<220>
<221>misc_特征
<222>(71)..(71)
<223>X=R或P
<220>
<221>misc_特征
<222>(72)..(72)
<223>X=R或K
<220>
<221>misc_特征
<222>(74)..(74)
<223>X=L或F
<220>
<221>misc_特征
<222>(77)..(77)
<223>X=K或S或R
<220>
<221>misc_特征
<222>(78)..(78)
<223>X=P或N或H
<220>
<221>misc_特征
<222>(80)..(80)
<223>X=无氨基酸或V
<220>
<221>misc_特征
<222>(81)..(81)
<223>X=无氨基酸或F
<220>
<221>misc_特征
<222>(82)..(82)
<223>X=无氨基酸或D
<220>
<221>misc_特征
<222>(83)..(83)
<223>X=无氨基酸或E或K
<220>
<221>misc_特征
<222>(84)..(84)
<223>X=无氨基酸或K或I
<220>
<221>misc_特征
<222>(85)..(85)
<223>X=无氨基酸或M或S
<220>
<221>misc_特征
<222>(86)..(86)
<223>X=无氨基酸或T或I或S
<220>
<221>misc_特征
<222>(87)..(87)
<223>X=无氨基酸或K或E
<220>
<221>misc_特征
<222>(88)..(88)
<223>X=无氨基酸或T或V
<220>
<221>misc_特征
<222>(89)..(89)
<223>X=无氨基酸或G或K
<220>
<221>misc_特征
<222>(90)..(90)
<223>X=无氨基酸或A
<220>
<221>misc_特征
<222>(91)..(91)
<223>X=无氨基酸或E
<220>
<221>misc_特征
<222>(92)..(92)
<223>X=无氨基酸或I或T
<220>
<221>misc_特征
<222>(93)..(93)
<223>X=无氨基酸或L
<220>
<221>misc_特征
<222>(94)..(94)
<223>X=无氨基酸或A或V或G
<220>
<221>misc_特征
<222>(95)..(95)
<223>X=无氨基酸或E
<220>
<221>misc_特征
<222>(96)..(96)
<223>X=无氨基酸或E
<220>
<221>misc_特征
<222>(97)..(97)
<223>X=无氨基酸或A
<220>
<221>misc_特征
<222>(98)..(98)
<223>X=无氨基酸或K
<220>
<221>misc_特征
<222>(99)..(99)
<223>X=无氨基酸或T
<220>
<221>misc_特征
<222>(100)..(100)
<223>X=无氨基酸或L
<220>
<221>misc_特征
<222>(101)..(101)
<223>X=无氨基酸或A或S
<220>
<221>misc_特征
<222>(102)..(102)
<223>X=无氨基酸或A或E
<220>
<221>misc_特征
<222>(103)..(103)
<223>X=无氨基酸或A或V
<220>
<221>misc_特征
<222>(104)..(104)
<223>X=无氨基酸或L或V
<220>
<221>misc_特征
<222>(105)..(105)
<223>X=无氨基酸或L
<220>
<221>misc_特征
<222>(106)..(106)
<223>X=无氨基酸或E
<220>
<221>misc_特征
<222>(107)..(107)
<223>X=无氨基酸或E
<220>
<221>misc_特征
<222>(108)..(108)
<223>X=无氨基酸或E
<220>
<221>misc_特征
<222>(109)..(109)
<223>X=无氨基酸或I
<220>
<221>misc_特征
<222>(110)..(110)
<223>X=无氨基酸或M
<220>
<221>misc_特征
<222>(111)..(111)
<223>X=无氨基酸或D或M
<220>
<221>misc_特征
<222>(112)..(112)
<223>X=无氨基酸或N或E
<400>61
Met Xaa Xaa Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
1 5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala Xaa
20 25 30
Xaa Xaa Cys Xaa Xaa Xaa Ser Xaa Xaa Phe Xaa Gly Xaa Cys Xaa Xaa
35 40 45
Xaa Xaa Xaa Cys Xaa Xaa Xaa Cys Xaa Xaa Glu Xaa Phe Xaa Xaa Gly
50 55 60
Xaa Cys Xaa Xaa Xaa Xaa Xaa Xaa Cys Xaa Cys Thr Xaa Xaa Cys Xaa
65 70 75 80
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
85 90 95
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110