赋予除草剂抗性的GRG23和GRG51基因
发明领域
本发明提供了编码除草剂抗性的新型基因,其可用于植物生物学、农作物育种和植物细胞培养。
发明背景
N-膦酰甲基甘氨酸,通常称为草甘膦,是重要的农艺学化合物。草甘膦抑制将磷酸烯醇丙酮酸(PEP)和3-磷酸莽草酸(S3P)转化成5-烯醇丙酮酰-3-磷酸莽草酸的酶。这种酶(5-烯醇丙酮酸莽草酸-3-磷酸合酶(5-enolpyruvylshikimate-3-phosphate synthase);在本文中称为“EPSPS”)的抑制通过关闭莽草酸途径从而抑制芳香族酸的生物合成而杀死植物细胞。
因为草甘膦类除草剂抑制芳香族氨基酸的生物合成,所以它们不仅杀死植物细胞,而且对于细菌细胞也有毒性。草甘膦抑制许多细菌的EPSP合酶,因此对这些细菌有毒。然而,某些细菌的EPSP合酶对草甘膦具有高耐受性。
对草甘膦毒性有抵抗力的植物细胞可以通过转化植物细胞以表达草甘膦抗性细菌EPSP合酶来产生。值得注意的是,来自根瘤土壤杆菌(Agrobacterium tumefaciens)菌株CP4的细菌基因已用于在植物中在表达后赋予植物细胞以除草剂抗性。来自鼠伤寒沙门氏菌(Salmonella typhimurium)菌株CT7的突变的EPSP合酶在细菌细胞中赋予草甘膦抗性,并且将草甘膦抗性赋予植物细胞(美国专利号4,535,060;4,769,061;和5,094,945)。然而,需要其他除草剂抗性基因。
EPSPS动力学活性可以通过测量磷酸的释放来进行测定。如本领域已知的(Vazquez等人(2003)Analytical Biochemistry 320:292-298),通过使用偶联测定法来检测磷酸释放,所述偶联测定法用于基于N-乙酰基-3,7-二羟基吩噁嗪(N-acetyl-3,7-dihydroxyphenoxacine)(
Red)的产生来进行磷酸的荧光检测。公开的测定条件在其中磷酸非常快速释放的实验中可以导致测定法的饱和。需要用于测量EPSPS动力学活性的另外方法。
发明概述
提供了用于将除草剂抗性或耐受性赋予细菌、植物、植物细胞、组织和种子的组合物和方法。所述组合物包括编码除草剂抗性或耐受性多肽的核酸分子,包含那些核酸分子的载体,和包含所述载体的宿主细胞。所述组合物还包括针对除草剂抗性或耐受性多肽的抗体。如所描述的,本发明的核苷酸序列可以在DNA构建体或表达盒中使用以用于转化生物体并在其中表达,所述生物体包括微生物和植物。所述组合物还包括转化的细菌、植物、植物细胞、组织和种子。另外,提供了用于产生由本发明的合成核苷酸编码的多肽的方法。
提供了编码除草剂抗性或耐受性多肽的分离的核酸分子及其变体。此外,包括了由赋予除草剂抗性或耐受性的多核苷酸编码的氨基酸序列及其变体。本发明提供了分离的核酸分子,其包含SEQ ID NO:1、3或5中所示的核苷酸序列,编码SEQ ID NO:2、4或6中所示的氨基酸序列的核苷酸序列,以登记号NRRL B-30888或NRRL B-30949保藏在细菌宿主中的除草剂抗性核苷酸序列,以及其变体和片段。还包括了与本发明的核苷酸序列互补的核苷酸序列,或与本发明的序列杂交的核苷酸序列。
还提供了使用荧光底物来测量酶动力学活性的方法。
附图描述
图1显示了GRG23 ORF1氨基酸序列(SEQ ID NO:2)和GRG51(SEQID NO:6)与克劳氏芽孢杆菌(Bacillus clausii)(SEQ ID NO:7)、嗜木聚糖红色杆菌(Rubrobacter xylanophilus)(SEQ ID NO:8)、大肠杆菌(Escherichia coli)(SEQ ID NO:11)、土壤杆菌属(Agrobacterium)物种菌株CP4(SEQ ID NO:10)和玉蜀黍(Zea mays)(SEQ ID NO:9)的比对。
图2显示了在0、3、5和10mM的草甘膦浓度时,作为PEP浓度(x轴)的函数的GRG23酶活性(y轴)的散点图。
图3显示了作为草甘膦浓度(x轴)的函数的Km(app)(y轴)的散点图。-X截距表示关于草甘膦的Ki。
发明详述
现在将参考附图在下文中对本发明进行更充分的描述,其中显示了本发明的某些但并非所有的实施方案。实际上,本发明可以以许多不同的形式实现,并且不应解释为限制于本文所阐述的实施方案;相反,提供这些实施方案以便本公开内容可以满足可应用的法定要求。相同的数字自始至终指相同的要素。
得益于前面的描述和附图中所呈现的教导,本文阐述的本发明的许多修饰和其他实施方案对于本发明所属领域技术人员将是显而易见的。因此,应当理解,本发明并不限于所公开的具体实施方案,并且希望将修饰和其他实施方案包括在所附权利要求书的范围内。尽管本文使用了特定的术语,但它们仅以一般和描述性的意义进行使用而不是为了限制目的。
本发明涉及用于调节生物体特别是植物或植物细胞中的除草剂抗性的组合物和方法。所述方法包括用编码本发明的草甘膦抗性基因的核苷酸序列来转化生物体。本发明的核苷酸序列可用于制备对除草剂草甘膦显示出增加的耐受性的植物。因此,提供了转化的细菌、植物、植物细胞、植物组织和种子。组合物包括涉及微生物和植物中的除草剂耐受性的核酸和蛋白质以及转化的细菌、植物、植物组织和种子。公开了草甘膦抗性基因(grg23和grg51)的核苷酸序列和由其编码的蛋白质的氨基酸序列。所述序列可用于构建用于随后转化到目的植物内的表达载体,用作用于分离其他草甘膦抗性基因的探针,用作选择标记等。因此,“本发明的草甘膦抗性基因”意指SEQ ID NO:1或3中所示的核苷酸序列,及其变体和片段(SEQ ID NO:5、12、14、16、18、20、22、24、26、28、30和32),它们编码草甘膦抗性或耐受性多肽。同样地,“本发明的草甘膦抗性多肽”是具有SEQ ID NO:2或4中所示氨基酸序列的多肽,及其变体和片段(SEQ ID NO:6、15、17、19、21、23、25、27、29、31和33),它们赋予宿主细胞以草甘膦抗性或耐受性。
包含本发明的除草剂抗性核苷酸序列的质粒于2005年11月18日保藏于农业研究机构保藏中心(Agricuitural Research ServiceCulture Collection,Northern Regional Research Laboratory)(NRRL)的永久收藏中,登记号为NRRL B-30888(grg23),并且于2006年6月26日再次进行了保藏,登记号为NRRL B-30949(grg51)。这种保藏将根据国际承认用于专利程序的微生物保藏布达佩斯条约的条款进行维持。这种保藏仅仅为了本领域技术人员方便而进行,并非承认保藏是根据35 U.S.C.§112所要求的。
“草甘膦”意指N-膦酰甲基甘氨酸(包括其任何盐)的任何除草剂形式和导致在植物中产生草甘膦阴离子的其他形式。“除草剂抗性蛋白质”或由于“编码除草剂抗性的核酸分子”的表达而产生的蛋白质包括将下述能力赋予细胞的蛋白质:比不表达该蛋白质的细胞耐受更高浓度的除草剂,或比不表达该蛋白质的细胞更长时间地耐受某一除草剂浓度。“草甘膦抗性蛋白质”包括将下述能力赋予细胞的蛋白质:比不表达该蛋白质的细胞耐受更高浓度的草甘膦,或比不表达该蛋白质的细胞更长时间地耐受某一草甘膦浓度。“耐受”或“耐受性”意指存活或者以不容易与未经处理的细胞相区分的方式执行基本的细胞功能例如蛋白质合成和呼吸。
分离的核酸分子,及其变体和片段
本发明的一个方面涉及分离的核酸分子,其包含编码除草剂抗性蛋白质和多肽或其生物学活性部分的核苷酸序列;以及足以用作杂交探针以鉴定编码除草剂抗性的核酸的核酸分子。如本文所使用的,术语“核酸分子”意欲包括DNA分子(例如,cDNA或基因组DNA)和RNA分子(例如,mRNA)以及通过使用核苷酸类似物而产生的DNA或RNA的类似物。核酸分子可以是单链或双链的。
编码本发明的蛋白质的核苷酸序列包括以登记号NRRL B-30888和NRRL B-30949保藏在细菌宿主中的除草剂抗性核苷酸序列即SEQ IDNO:1、3和5中所示的序列,及其变体、片段和互补物。“互补物”意指这样的核苷酸序列,与给定的核苷酸序列充分互补,如此使得它可以与给定的核苷酸序列杂交从而形成稳定的双链体。关于由这些核苷酸序列编码的除草剂抗性蛋白质的相应氨基酸序列显示于SEQ IDNO:2、4或6中。本发明还包括包含编码部分长度的除草剂抗性蛋白质的核苷酸序列的核酸分子,及其互补物。
“分离的”或“纯化的”核酸分子或者蛋白质或其生物学活性部分,基本上不含其他细胞材料或培养基(当通过重组技术生产时),或者基本上不含化学前体或其他化学制品(当以化学方法合成时)。优选地,“分离的”核酸不含在该核酸所源自的生物体的基因组DNA中天然地位于该核酸侧翼的序列(即,位于该核酸的5′和3′末端处的序列)(优选蛋白质编码序列)。对本发明而言,当用于指核酸分子时,“分离的”不包括分离的染色体。例如,在各种实施方案中,分离的编码草甘膦抗性的核酸分子可以包含少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在该核酸所源自的细胞的基因组DNA中天然地位于该核酸分子侧翼的核苷酸序列。基本上不含细胞材料的除草剂抗性蛋白质包括具有少于约30%、20%、10%或5%(干重)的非除草剂抗性蛋白质(在本文中也称为“污染蛋白质”)的蛋白质制剂。
本发明还包括这样的核酸分子,其为这些编码除草剂抗性的核苷酸序列的片段。“片段”意指编码除草剂抗性蛋白质的核苷酸序列的部分。核苷酸序列的片段可以编码除草剂抗性蛋白质的生物学活性部分,或者它可以是使用下文公开的方法而可以用作杂交探针或PCR引物的片段。作为除草剂抗性核苷酸序列的片段的核酸分子包含至少约15、20、50、75、100、200、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950个邻接核苷酸,或高至在本文公开的全长的编码除草剂抗性的核苷酸序列中存在的核苷酸的数目(例如,对于SEQ ID NO:1为1892个核苷酸,对于SEQ ID NO:3为1259个核苷酸,和对于SEQ ID NO:5为1242个核苷酸)。“邻接”核苷酸意指彼此紧邻的核苷酸残基。
本发明的核苷酸序列的片段一般将编码保留全长草甘膦抗性蛋白质的生物活性即除草剂抗性活性的蛋白质片段。“保留除草剂抗性活性”意指该片段将具有本文公开为SEQ ID NO:2、4或6的全长草甘膦抗性蛋白质的至少约30%、至少约50%、至少约70%或至少约80%的除草剂抗性活性。用于测量除草剂抗性活性的方法是本领域众所周知的。参见,例如,美国专利号4,535,060和5,188,642,所述专利各自通过提及而整体合并入本文。
编码除草剂抗性的核苷酸序列的片段(其编码本发明蛋白质的生物学活性部分)将编码至少约15、25、30、50、75、100、125、150、175、200、250、300、350、400个邻接核苷酸,或高至在本发明的全长除草剂抗性蛋白质中存在的氨基酸的总数目(例如,对于SEQ ID NO:2为436个氨基酸,对于SEQ ID NO:4为413个氨基酸,和对于SEQ IDNO:6为413个氨基酸)。
本发明的除草剂抗性蛋白质由与SEQ ID NO:1、3或5的核苷酸序列具有足够同一性的核苷酸序列编码。术语“具有足够同一性”意指这样的氨基酸或核苷酸序列,即通过使用本文描述的比对程序之一并采用标准参数,其与参照序列相比较具有至少约60%或65%序列同一性,约70%或75%序列同一性,约80%或85%序列同一性,约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性。本领域技术人员将会认识到,这些值可以适当地进行调整以通过考虑密码子简并性、氨基酸相似性、读码框定位等来确定由2个核苷酸序列所编码的蛋白质的相应同一性。
为了确定2个氨基酸序列或2个核酸的同一性百分比,就最佳比较目的来对序列进行比对。2个序列之间的同一性百分比是由所述序列共有的相同位置的数目的函数(即,同一性百分比=相同位置的数目/位置(例如,重叠位置)的总数目x100)。在一个实施方案中,2个序列具有相同的长度。2个序列之间的同一性百分比可以使用与下文描述的那些类似的技术来进行确定,其中允许或不允许缺口。在计算同一性百分比中,通常计数准确的匹配。
2个序列之间的同一性百分比的确定可以使用数学算法来完成。用于2个序列比较的数学算法的非限制性例子是Karlin和Altschul(1990)Proc.Natl Acad.Sci.USA 87:2264-2268的算法,其在Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877中进行了修改的。将此类算法整合入Altschul等人(1990)J.Mol.Biol.215:403-410的BLASTN和BLASTX程序中。BLAST核苷酸搜索可以用BLASTN程序(得分=100、字长=12)来进行,以获得与本发明的GDC样核酸分子同源的核苷酸序列。BLAST蛋白质搜索可以用BLASTX程序(得分=50、字长=3)来进行,以获得与本发明的除草剂抗性蛋白质分子同源的氨基酸序列。为了获得用于比较目的的有缺口的比对,可以使用如Altschul等人(1997)Nucleic Acids Res.25:3389-3402中所描述的Gapped BLAST。备选地,PSI-Blast可以用于执行检测分子间的远距离关系的迭代搜索。参见Altschul等人(1997)(同上)。当利用BLAST、Gapped BLAST和PSI-Blast程序时,可以使用各个程序(例如,BLASTX和BLASTN)的缺省参数。参见www.ncbi.nlm.nih.gov。用于序列比较的数学算法的另一个非限制性例子是ClustalW算法(Higgins等人(1994)Nucleic Acids Res.22:4673-4680)。ClustalW比较序列并比对氨基酸或DNA序列的整体,因此可以提供关于整个氨基酸序列的序列保守性的数据。ClustalW算法在几个商购可得的DNA/氨基酸分析软件包中使用,例如Vector NTI Program Suite(Invitrogen Corporation,Carlsbad,CA)的ALIGNX模块。在用ClustalW比对氨基酸序列后,可以评估氨基酸同一性百分比。可用于ClustalW比对分析的软件程序的非限制性例子是GeneDocTM。GeneDocTM(Karl Nicholas)允许评估多个蛋白质之间的氨基酸(或DNA)相似性和同一性。用于序列比较的数学算法的另一个非限制性例子是Myers和Miller(1988)CABIOS4:11-17的算法。此类算法被整合入ALIGN程序(版本2.0)中,所述ALIGN程序是GCG序列比对软件包(可从Accelrys,Inc.,San Diego,CA获得)的一部分。当利用ALIGN程序来比较氨基酸序列时,可以使用PAM120权重残基表、12的缺口长度罚分和4的缺口罚分。
除非另有说明,采用Needleman和Wunsch(1970)J.Mol.Biol.48(3):443-453的算法的GAP Version 10将被用于测定序列同一性或相似性,其中使用下述参数:关于核苷酸序列的同一性%和相似性%,使用50的GAP权重和3的长度权重,以及nwsgapdna.cmp评分矩阵;关于氨基酸序列的同一性%或相似性%,使用8的GAP权重和2的长度权重,以及BLOSUM62评分矩阵。还可以使用等价的程序。“等价的程序”意指任何这样的序列比较程序,即对于所研究的任何2个序列,当与由GAP Version 10产生的相应比对相比较时,产生具有相同的核苷酸残基匹配和相同的序列同一性百分比的比对。
本发明还包括变体核酸分子。编码除草剂抗性的核苷酸序列的“变体”包括编码本文公开的除草剂抗性蛋白质但由于遗传密码的简并性而保守性地不同的那些序列,以及如上所述具有足够同一性的那些序列(例如,SEQ ID NO:5、12、14、16、18、20、22、24、26、28、30和32是SEQ ID NO:1的变体)。天然存在的等位基因变体可以使用众所周知的分子生物学技术来鉴定,例如如下所述的聚合酶链式反应(PCR)和杂交技术。变体核苷酸序列还包括合成衍生的核苷酸序列,其例如通过使用定点诱变产生但仍编码本发明中公开的除草剂抗性蛋白质,如下所述。本发明所包括的变体蛋白质是在生物学上有活性的,即它们保留了所需的天然蛋白质的生物活性,即除草剂抗性活性。“保留除草剂抗性活性”意指该变体将具有至少约30%、至少约50%、至少约70%或至少约80%的天然蛋白质的除草剂抗性活性。用于测量除草剂抗性活性的方法是本领域众所周知的。参见,例如,美国专利号4,535,060和5,188,642,所述专利各通过提及而整体合并入本文。
技术人员将会进一步意识到,可以通过突变将改变引入本发明的核苷酸序列内,从而导致编码的除草剂抗性蛋白质的氨基酸序列中的改变,而不改变该蛋白质的生物活性。因此,分离的核酸分子变体可以通过下述方式来制备:将一个或多个核苷酸置换、添加或删除引入本文公开的相应的核苷酸序列中,从而使得将一个或多个氨基酸置换、添加或删除引入所编码的蛋白质中。可以通过标准技术来引入突变,例如通过定点诱变和PCR介导的诱变。此类变体核苷酸序列也包括在本发明内。
例如,保守氨基酸置换可以在一个或多个预测的非必需氨基酸残基处进行。“非必需”氨基酸残基是可以从除草剂抗性蛋白质的野生型序列中进行改变而不改变生物活性的残基,而“必需”氨基酸残基是生物活性所需的。“保守氨基酸置换”是其中氨基酸残基被具有类似侧链的氨基酸残基替代的置换。在本领域中已定义了具有相似侧链的氨基酸残基家族。这些家族包括具有碱性侧链的氨基酸(例如,赖氨酸、精氨酸、组氨酸),具有酸性侧链的氨基酸(例如,天冬氨酸、谷氨酸),具有不带电荷的极性侧链的氨基酸(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸),具有非极性侧链的氨基酸(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸),具有β-分枝的侧链的氨基酸(例如,苏氨酸、缬氨酸、异亮氨酸)和具有芳香族侧链的氨基酸(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸)。氨基酸置换可以在保留功能的非保守区域中进行。一般而言,此类置换不对保守的氨基酸残基,或者不对位于保守基序内的氨基酸残基进行,其中此类残基是蛋白质活性所需的。然而,本领域技术人员应当理解,功能变体可以具有较少的在保守残基中的保守或非保守改变。
Lys-22、Arg-124、Asp-313、Arg-344、Arg-386和Lys-411是来自大肠杆菌的EPSP合酶的保守残基(
等人(2001)Proc.Natl.Acad.Sci.USA 98:1376-1380)。对于EPSP合酶活性重要的保守残基还包括Arg-100、Asp-242和Asp-384(Selvapandiyan等人(1995)FEBS Letters 374:253-256)。Arg-27与S3P结合(Shuttleworth等人(1999)Biochemistry 38:296-302)。
备选地,可以通过沿着全部或部分编码序列随机引入突变,例如通过饱和诱变,来制备变体核苷酸序列,并且可以就赋予除草剂抗性活性的能力来筛选所得到的突变体,以鉴定保留活性的突变体。在诱变后,编码的蛋白质可以重组地表达,并且蛋白质的活性可以通过使用标准测定法技术来测定。
使用诸如PCR、杂交等的方法可以鉴定出相应的除草剂抗性序列,此类序列与本发明的序列具有实质的同一性。参见,例如,Sambrook和Russell(2001)Molecular Cloning:A Laboratory Manual(ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY)和Innis等人(1990)PCR Protocols:A Guide to Methods and Applications(Academic Press,St.Louis,MO)。
在杂交方法中,全部或部分除草剂抗性核苷酸序列可以用于筛选cDNA或基因组文库。用于构建此类cDNA和基因组文库的方法是本领域通常已知的,并且在Sambrook和Russell(2001)(同上)中公开。所谓的杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其他寡核苷酸,并且可以用可检测基团例如32P或任何其他可检测标记例如其他放射性同位素、荧光化合物、酶或酶辅因子进行标记。可以基于本文公开的已知的编码除草剂抗性的核苷酸序列,通过对合成的寡核苷酸进行标记来制备用于杂交的探针。可以另外使用基于在所述核苷酸序列或编码的氨基酸序列中的保守核苷酸或氨基酸残基而设计的简并引物。探针通常包含这样的核苷酸序列区域,所述核苷酸序列区域在严格条件下与本发明的编码除草剂抗性的核苷酸序列或其片段或变体的至少约12个,至少约25个,至少约50、75、100、125、150、175、200、250、300、350、400、500、600、700、800、900、1000、1200、1400、1600或1800个连续核苷酸杂交。用于制备用于杂交的探针的方法是本领域通常已知的,并且公开于Sambrook和Russell(2001)(同上)以及Sambrook等人(1989)Molecular Cloning:A Laboratory Manual(第二版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY)中,所述2个参考文献通过提及而合并入本文。
例如,本文公开的完整除草剂抗性序列,或者其一个或多个部分,可以用作能够与相应的除草剂抗性序列和信使RNAs特异性地杂交的探针。为了达到在各种条件下的特异性杂交,此类探针包括独特的并且长度为至少约10个核苷酸和长度为至少约20个核苷酸的序列。此类探针可以用于通过PCR从所选择的生物体中扩增出相应的除草剂抗性序列。这种技术可以用于从所需生物体中分离另外的编码序列,或用作诊断测定法以测定生物体中编码序列的存在。杂交技术包括铺板的DNA文库的杂交筛选(噬斑或菌落;参见,例如,Sambrook等人(1989)Molecular Cloning:A Laboratory Manual(第二版,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY)。
此类序列的杂交可以在严格条件下进行。“严格条件”或“严格杂交条件”意指这样的条件,即在所述条件下探针将与其靶序列杂交,达到相比与其他序列来说可检测地更大的程度(例如,为背景的至少2倍)。严格条件是序列依赖性的并且在不同情况下是不同的。通过控制杂交和/或洗涤条件的严格性,可以鉴定出与探针100%互补的靶序列(同源探测)。备选地,可以调整严格条件以允许序列中的一些错配,从而使得检测出较低程度的相似性(异源探测)。一般地,探针长度为小于约1000个核苷酸,或长度为小于约500个核苷酸。
通常,严格条件是这样的条件,其中在pH7.0-8.3下盐浓度小于约1.5M Na离子,通常约0.01-1.0M Na离子浓度(或其他盐),以及温度对于短探针(例如,10-50个核苷酸)为至少约30℃,和对于长探针(例如,超过50个核苷酸)为至少约60℃。严格条件还可以用添加去稳定剂如甲酰胺来达到。示例性的低严格性条件包括于37℃用30-35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液进行杂交,和于50-55℃在1X-2X SSC(20X SSC=3.0MNaCl/0.3M柠檬酸三钠)中进行洗涤。示例性的中等严格性条件包括于37℃在40-45%甲酰胺、1.0M NaCl、1%SDS中进行杂交,和于55-60℃在0.5X-1X SSC中进行洗涤。示例性的高严格性条件包括于37℃在50%甲酰胺、1M NaCl、1%SDS中进行杂交,和于60-65℃在0.1X SSC中进行洗涤。任选地,洗涤缓冲液可以包含约0.1%-约1%SDS。杂交的持续时间一般少于约24小时,通常为约4-约12小时。
特异性通常是杂交后洗涤的函数,关键因素是离子强度和最终洗涤溶液的温度。对于DNA-DNA杂交物,Tm可以从Meinkoth和Wahl(1984)Anal.Biochem.138:267-284的等式中进行估计:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L;其中M是一价阳离子的摩尔浓度,%GC是DNA中鸟苷和胞嘧啶核苷酸的百分比,%form是杂交溶液中甲酰胺的百分比,和L是以碱基对计的杂交物的长度。Tm是这样的温度,在该温度下50%的互补靶序列与完全匹配的探针杂交(在限定的离子强度和pH下)。对于每1%的错配,Tm减少约1℃;因此,可以调整Tm、杂交和/或洗涤条件,以与所需同一性的序列杂交。例如,如果寻求具有≥90%同一性的序列,那么Tm可以减少10℃。一般地,严格条件被选择为在限定的离子强度和pH下比关于特定序列和其互补物的热解链点(Tm)低约5℃。然而,极端严格条件可以利用在比热解链点(Tm)低1、2、3或4℃下的杂交和/或洗涤;中等严格条件可以利用在比热解链点(Tm)低6、7、8、9或10℃下的杂交和/或洗涤;低严格条件可以利用在比热解链点(Tm)低11、12、13、14、15或20℃下的杂交和/或洗涤。使用该等式、杂交和洗涤组成以及所需Tm,普通技术人员应当理解,内在地描述了杂交和/或洗涤溶液的严格性中的改变。如果所希望的错配程度导致低于45℃(水性溶液)或32℃(甲酰胺溶液)的Tm,那么优选增加SSC浓度,从而使得可以使用更高的温度。关于核酸杂交的详细指导可见下述参考文献:Tijssen(1993)Laboratory Techniques in Biochemistry andMolecular Biology-Hybridization with Nucleic Acid Probes,第I部分,第2章(Elsevier,New York);和Ausubel等人,编辑,(1995)Current Protocols in Molecular Biology,第2章(GreenePublishing and Wiley-Interscience,New York)。参见Sambrook等人(1989)Molecular Cloning:A Laboratory Manual(第二版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,NY)。
分离的蛋白质及其变体和片段
除草剂抗性蛋白质也包括在本发明中。“除草剂抗性蛋白质”或“除草剂耐受性蛋白质”意指具有SEQ ID NO:2、4或6中所示的氨基酸序列的蛋白质。还提供了其片段、生物学活性部分和变体,并且它们可以用于实践本发明的方法。
“片段”或“生物学活性部分”包括这样的多肽片段,所述多肽片段包含SEQ ID NO:2、4或6中所示的编码除草剂抗性蛋白质的氨基酸序列的部分,并保留除草剂抗性活性。除草剂抗性蛋白质的生物学活性部分可以是例如长度为10、25、50、100或更多个氨基酸的多肽。此类生物学活性部分可以通过重组技术来制备,并且就除草剂抗性活性来进行评估。用于测量除草剂抗性活性的方法是本领域众所周知的。参见,例如,美国专利号4,535,060和5,188,642,所述专利各自通过提及而整体合并入本文。如本文所使用的,片段包含SEQ IDNO:2、4或6的至少8个邻接氨基酸。然而,本发明包括其他片段,例如该蛋白质中超过约10、20、30、50、100、150、200、250、300、350或400个氨基酸的任何片段。
“变体”意指这样的蛋白质或多肽,其具有与SEQ ID NO:2、4或6的氨基酸序列至少约60%、65%,至少约70%、75%,至少约80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一的氨基酸序列(例如,SEQ ID NO:6、15、17、19、21、23、25、27、29、31和33是SEQ ID NO:2的变体)。变体还包括由这样的核酸分子编码的多肽,所述核酸分子在严格条件下与SEQID NO:1、3或5的核酸分子或其互补物杂交。变体包括由于诱变而在氨基酸序列方面不同的多肽。本发明所包括的变体蛋白质是生物学上有活性的,即它们继续拥有所希望的该天然蛋白质的生物活性,即保留了除草剂抗性活性。用于测量除草剂抗性活性的方法是本领域众所周知的。参见,例如美国专利号4,535,060和5,188,642,所述专利各自通过提及而整体合并入本文。
细菌基因,例如本发明的grg23或grg51基因,在开放读码框的起始附近十分经常具有多个甲硫氨酸起始密码子。通常,在这些起始密码子中的一个或多个处的翻译起始将导致功能蛋白质的产生。这些起始密码子可以包括ATG密码子。然而,诸如芽孢杆菌属物种(Bacillus sp.)的细菌还将密码子GTG识别为起始密码子,并且在GTG密码子处起始翻译的蛋白质在第一个氨基酸处包含甲硫氨酸。此外,常常事先不确定这些密码子中的哪一些天然地在细菌中使用。因此,应当理解,备选的甲硫氨酸密码子之一的使用可能导致产生赋予除草剂抗性的grg23或grg51的变体。这些除草剂抗性蛋白质包括在本发明中,并且可以在本发明的方法中使用。
还包括了针对本发明的多肽或者其变体或片段的抗体。用于产生抗体的方法是本领域众所周知的(参见,例如Harlow和Lane(1988)Antibodies:A Laboratory Manual(Cold Spring Harbor Laboratory,Cold Spring Harbor,NY);美国专利号4,196,265)。
改变或改善的变体
应认识到,可以通过各种方法来改变grg23或grg51的DNA序列,并且这些改变可以导致编码蛋白质的DNA序列,所述蛋白质具有与由grg23或grg51所编码的氨基酸序列不同的氨基酸序列。这种蛋白质可以以各种方式进行改变,包括氨基酸置换、删除、截短和插入。用于此类操作的方法是本领域通常已知的。例如,可以通过DNA中的突变来制备GRG23或GRG51蛋白的氨基酸序列变体。这还可以通过几种诱变形式之一和/或通过定向进化来完成。在某些方面,氨基酸序列中所编码的改变将基本上不影响蛋白质的功能。此类变体将具有所希望的除草剂抗性活性。然而,应当理解,GRG23或GRG51赋予除草剂抗性的能力可以通过对本发明的组合物使用此类技术来进行改善。例如,GRG23或GRG51可以在这样的宿主细胞中进行表达,所述宿主细胞显示出高比率的在DNA复制期间的碱基错掺入,例如XL-1 Red(Stratagene,La Jolla,CA)。在此类菌株中进行繁殖后,可以分离出grg23或grg51 DNA(例如通过制备质粒DNA,或者通过经由PCR进行扩增并将所得到的PCR片段克隆到载体中)并在非诱变菌株中进行培养。在grg23或grg51中包含突变的克隆可以通过测量改善的对于除草剂例如草甘膦的抗性来鉴定,例如通过在浓度渐增的草甘膦中培养细胞,并对于赋予针对浓度渐增的草甘膦的耐受性的克隆进行测试。
备选地,可以在氨基或羧基末端处对许多蛋白质的蛋白质序列进行改变而基本上不影响活性。这些改变可以包括通过现代分子方法例如PCR而引入的插入、删除或改变,所述方法包括借助于在PCR扩增中使用的寡核苷酸之中包含氨基酸编码序列而改变或延长蛋白质编码序列的PCR扩增。备选地,所添加的蛋白质序列可以包括完整的蛋白质编码序列,例如本领域通常用于产生蛋白质融合物的那些序列。此类融合蛋白常常用于(1)增加目的蛋白质的表达;(2)引入结合结构域、酶活性或表位以有助于蛋白质纯化、蛋白质检测或本领域已知的其他实验用途;或(3)将蛋白质的分泌或翻译靶向至亚细胞器,例如革兰氏阴性菌的壁膜间隙,或真核细胞的内质网,后者常常导致蛋白质的糖基化。
本发明的变体核苷酸和氨基酸序列还包括衍生自诱变和重组操作程序例如DNA改组的序列。使用此类操作程序,可以将一个或多个不同的除草剂抗性蛋白质编码区用于制备具有所需性质的新的除草剂抗性蛋白质。以这种方式,从包含这样的序列区域的相关序列多核苷酸群体中产生重组多核苷酸的文库,所述序列区域具有充分的序列同一性并可以在体外或体内进行同源重组。例如,使用这种方法,可以在本发明的除草剂抗性基因和其他已知的除草剂抗性基因之间改组编码目的结构域的序列基序,以获得编码具有改善的目的性质例如增加的草甘膦抗性活性的蛋白质的新基因。用于此类DNA改组的策略是本领域已知的。参见,例如,Stemmer(1994)Proc.Natl.Acad.Sci.USA91:10747-10751;Stemmer(1994)Nature 370:389-391;Crameri等人(1997)Nature Biotech.15:436-438;Moore等人(1997)J.Mol.Biol.272:336-347;Zhang等人(1997)Proc.Natl.Acad.Sci.USA 94:4504-4509;Crameri等人(1998)Nature 391:288-291;以及美国专利号5,605,793和5,837,458。
细菌或植物细胞的转化
本文提供了新型的分离的基因,其赋予针对除草剂的抗性。还提供了GRG23和GRG51蛋白质的氨基酸序列。由这种基因的翻译产生的蛋白质允许细胞在存在一定浓度的除草剂的情况下运转,所述除草剂的浓度在其他情况下对于细胞(包括植物细胞和细菌细胞)有毒。
在本发明的一个方面,grg23或grg51基因可用作标记来评估细菌或植物细胞的转化。
通过改造grg23或grg51以(1)从已知在待测试的生物体中刺激转录的细菌启动子进行表达,(2)正确地翻译从而产生完整的GRG23或GRG51肽,和(3)将细胞置于在其他情况下有毒的除草剂浓度中,可以借助于其对除草剂的抗性而鉴定出已用DNA转化的细胞。“启动子”意指发挥功能以指导下游编码序列转录的核酸序列。启动子连同其他转录和翻译调节核酸序列(也称为“控制序列”)一起是目的DNA序列表达所必需的。
细菌细胞的转化通过本领域已知的几种技术之一来完成,包括但不限于,电穿孔或化学转化(参见,例如Ausubel(编辑)(1994)Current Protocols in Molecular Biology(John Wiley and Sons,Inc.,Indianapolis,IN))。赋予针对有毒物质的抗性的标记可用于从未转化的细胞(不包含或不表达测试DNA的那些细胞)中鉴定出转化的细胞(已摄取并表达测试DNA)。在本发明的一个方面中,grg23或grg51基因可用作标记以评估细菌或植物细胞的转化。
植物细胞的转化可以以类似方式来完成。“植物”意指整个植株、植物器官(例如,叶、茎、根等)、种子、植物细胞、繁殖体、胚胎及其后代。植物细胞可以是分化的或未分化的(例如,愈伤组织、悬浮培养细胞、原生质体、叶细胞、根细胞、韧皮部细胞、花粉)。“转基因植物”或“转化的植物”或“稳定转化的”植物、细胞或组织指已将外源核酸序列或DNA片段引入或整合到植物细胞内的植物。“稳定的转化”意指,引入植物内的核苷酸构建体整合到植物的基因组中并能够由其后代遗传。
可以修饰本发明的grg23或grg51基因以获得或增强在植物细胞中的表达。本发明的除草剂抗性序列可以在用于在目的植物中表达的表达盒中提供。“植物表达盒”包括能够导致在植物细胞中从开放读码框表达蛋白质的DNA构建体。所述盒以5′-3′的转录方向包含与本发明的DNA序列可操作地连接的转录起始区(即,启动子),以及在植物中具有功能的翻译和转录终止区(即,终止区)。所述盒可以另外还包含至少一种待共转化到生物体中的另外的基因,例如选择标记基因。备选地,所述另外的基因可以在多个表达盒上提供。此类表达盒以具有多个限制位点的形式提供,所述限制位点用于插入除草剂抗性序列以处于调节区的转录调节之下。
启动子对于植物宿主和/或本发明的DNA序列来说可以是天然的或类似的,或者外源的或异源的。此外,启动子可以是天然序列或者备选地是合成序列。当启动子对于植物宿主是“天然的”或“同源的”时,意指所述启动子在该启动子所引入的天然植物内存在。当启动子对于本发明的DNA序列是“外源的”或“异源的”时,意指所述启动子对于可操作地连接的本发明DNA序列来说不是天然的或天然存在的启动子。“异源的”一般指这样的核酸序列,所述核酸序列对于它们所存在于其中的细胞来说不是内源的或者不是天然基因组的一部分,并且已通过感染、转染、显微注射、电穿孔、微粒轰击等加入细胞中。
“可操作地连接”意指启动子和第二序列之间的功能连接,其中启动子序列起始并介导相应于第二序列的DNA序列的转录。一般地,可操作地连接意指,被连接的核酸序列是邻接的,并且在必需使2个蛋白质编码区联合在一起时是邻接的并在同一读码框中。
通常,此类构建体还将包含5′和3′非翻译区。此类构建体可以包含“信号序列”或“前导序列”,以有助于目的肽的共翻译或翻译后运输至某些细胞内结构,例如叶绿体(或其他质体)、内质网或高尔基体,或者被分泌。例如,基因可以经改造以包含信号肽从而有助于将肽转移至内质网。“信号序列”意指已知或怀疑导致穿过细胞膜的共翻译或翻译后肽运输的序列。在真核生物中,这种运输通常涉及分泌到高尔基体内,其中具有某些发生的糖基化。“前导序列”意指当被翻译时导致足以引发肽链共翻译运输至亚细胞器的氨基酸序列的任何序列。因此,这包括通过进入内质网内,进入液泡、质体(包括叶绿体、线粒体)等中来对运输和/或糖基化实施靶向的前导序列。还可以改造植物表达盒以包含内含子,从而使得内含子的mRNA加工是表达所需的。
“3′非翻译区”意指位于编码序列下游的核苷酸序列。多腺苷酸化信号序列和编码能够影响向mRNA前体的3′末端添加多腺苷酸束的调节信号的其他序列是3′非翻译区。“5′非翻译区”意指位于编码序列上游的核苷酸序列。
其他上游或下游非翻译元件包括增强子。增强子是用于增加启动子区的表达的核苷酸序列。增强子是本领域众所周知的,并且包括但不限于,SV40增强子区和35S增强子元件。
终止区可以对于转录起始区来说是天然的,可以对于本发明的除草剂抗性序列来说是天然的,或可以衍生自另一种来源。方便的终止区可从根瘤土壤杆菌的Ti质粒中获得,例如章鱼碱合酶和胭脂碱合酶的终止区。还可参见Guerineau等人(1991)Mol.Gen.Genet.262:141-144;Proudfoot(1991)Cell 64:671-674;Sanfacon等人(1991)Genes Dev.5:141-149;Mogen等人(1990)Plant Cell 2:1261-1272;Munroe等人(1990)Gene 91:151-158;Ballas等人(1989)NucleicAcids Res.17:7891-7903;和Joshi等人(1987)Nucleic Acid Res.15:9627-9639。
在适当时,可以就在转化的宿主细胞中的表达增加来优化所述基因。即,可以使用宿主细胞偏爱的密码子来合成所述基因以获得改善的表达,或者可以通过以宿主偏爱的密码子使用频率使用密码子来合成所述基因。一般地,将增加基因的GC含量。关于宿主偏爱的密码子使用的讨论,可参见例如Campbell和Gowri(1990)Plant Physiol.92:1-11。用于合成宿主偏爱的基因的方法是本领域已知的。参见,例如,美国专利号6,320,100;6,075,185;5,380,831;和5,436,391,美国公开申请号20040005600和20010003849,和Murray等人(1989)Nucleic Acids Res.17:477-498,其通过提及而合并入本文。
在一个实施方案中,目的核酸被靶向叶绿体以进行表达。以这种方式,当目的核酸不直接插入叶绿体内时,表达盒将另外包含编码转运肽的核酸以将目的基因产物导向叶绿体。此类转运肽是本领域已知的。参见,例如Von Heijne等人(1991)Plant Mol.Biol.Rep.9:104-126;Clark等人(1989)J.Biol.Chem.264:17544-17550;Della-Cioppa等人(1987)Plant Physiol.84:965-968;Romer等人(1993)Biochem.Biophys.Res.Commun.196:1414-1421;和Shah等人(1986)Science 233:478-481。
可以就在叶绿体中的表达来优化被靶向叶绿体的目的核酸,以解决植物细胞核和这种细胞器之间的在密码子使用方面的差异。以这种方式,可以使用叶绿体偏爱的密码子来合成目的核酸。参见,例如,美国专利号5,380,831,通过提及而合并入本文。
通常,这种“植物表达盒”将被插入“植物转化载体”中。“转化载体”意指对于细胞的有效转化来说所必需的DNA分子。此类分子可以由一个或多个表达盒组成,或可以组织入超过一个的“载体”DNA分子中。例如,二元载体是植物转化载体,其利用2个非邻接DNA载体来编码用于植物细胞转化的所有必需的顺式和反式作用功能(Hellens和Mullineaux(2000)Trends in Plant Science 5:446-451)。“载体”指设计用于在不同宿主细胞之间进行转移的核酸构建体。“表达载体”指具有将异源DNA序列或片段引入、整合入外源细胞中并在其中表达该异源DNA序列或片段的能力的载体。
这种植物转化载体可以由对于实现植物转化所需的一个或多个DNA载体构成。例如,利用由超过一种邻接DNA区段构成的植物转化载体是本领域中常见的实践。这些载体在本领域中通常称为“二元载体”。二元载体以及具有辅助质粒的载体最常用于土壤杆菌介导的转化,其中对于实现有效转化所需的DNA区段的大小和复杂性相当大,并且将功能分散到分开的DNA分子上是有利的。二元载体通常包括质粒载体,所述质粒载体包含对于T-DNA转移所需的顺式作用序列(例如左边界和右边界)、经改造从而能够在植物细胞中表达的选择标记、和“目的基因”(经改造从而能够在对于其希望产生转基因植物的植物细胞中表达的基因)。在这种质粒载体上还存在有细菌复制所需的序列。顺式作用序列以允许有效转移到植物细胞内并在其中表达的方式排列。例如,选择标记基因和目的基因位于左和右边界之间。通常,第二质粒载体包含介导T-DNA从土壤杆菌转移到植物细胞的反式作用因子。这种质粒通常包含毒力功能(Vir基因),其允许用土壤杆菌感染植物细胞,并通过在边界序列处进行切割和vir介导的DNA转移来转移DNA,如本领域中所了解的(Hellens和Mullineaux(2000)Trends in Plant Science,5:446-451)。几类土壤杆菌属菌株(例如,LBA4404、GV3101、EHA101、EHA105等)可以用于植物转化。第二质粒载体不是通过其他方法例如微粒轰击、显微注射、电穿孔、聚乙二醇等转化植物所必需的。
植物转化
本发明的方法涉及将核苷酸构建体引入植物内。“引入”意指以使得该构建体进入植物细胞内部的方式将核苷酸构建体呈递给植物。本发明的方法不要求使用用于将核苷酸构建体引入植物的具体方法,只要求使该核苷酸构建体进入植物的至少一个细胞的内部。用于将核苷酸构建体引入植物内的方法是本领域已知的,包括但不限于,稳定转化法、瞬时转化法和病毒介导的方法。
一般而言,植物转化法涉及将异源DNA转移到靶植物细胞(例如,未成熟或成熟的胚胎、悬浮培养物、未分化的愈伤组织、原生质体等)中,随后应用最大阈值水平的合适选择(取决于选择标记基因,在这种情况下为“草甘膦”),以从未转化的细胞群体中回收转化的植物细胞。通常将外植体转移到新鲜供应的相同培养基中并进行常规培养。随后,在置于补充有最大阈值水平的选择试剂(例如,“草甘膦”)的再生培养基上后,使转化的细胞分化成幼芽。然后将幼芽转移至选择性生根培养基中以用于回收生根的幼芽或小植物。然后,转基因小植物生长为成熟植物并产生能育的种子(例如,Hiei等人(1994)ThePlant Journal 6:271-282;Ishida等人(1996)Nature Biotechnology14:745-750)。通常将外植体转移到新鲜供应的相同培养基中并进行常规培养。用于产生转基因植物的技术和方法的概括性描述可以在Ayres和Park(1994)Critical Reviews in Plant Science 13:219-239以及Bommineni和Jauhar(1997)Maydica 42:107-120中找到。因为转化的材料包含许多细胞;所以转化的和未转化的细胞存在于受试靶愈伤组织或组织或细胞群的任何部分中。杀死未转化的细胞并允许转化的细胞增殖的能力导致产生转化的植物培养物。通常,去除未转化的细胞的能力是快速回收转化的植物细胞和成功产生转基因植物的限制条件。分子和生物化学法可以用于证实转基因植物的基因组中存在整合的异源目的基因。
转基因植物的产生可以通过几种方法之一来进行,包括但不限于,通过土壤杆菌将异源DNA引入植物细胞内(土壤杆菌介导的转化),用与粒子附着的异源外源DNA轰击植物细胞,和用于转移DNA的各种其他非粒子直接介导的方法(例如,Hiei等人(1994)The PlantJournal 6:271-282;Ishida等人(1996)Nature Biotechnology 14:745-750;Ayres和Park(1994)Critical Reviews in Plant Science13:219-239;Bommineni和Jauhar(1997)Maydica 42:107-120)。
用于转化叶绿体的方法是本领域已知的。参见,例如,Svab等人(1990)Proc.Natl.Acad.Sci.USA 87:8526-8530;Svab和Maliga(1993)Proc.Natl.Acad.Sci.USA 90:913-917;Svab和Maliga(1993)EMBO J.12:601-606。该方法依赖于包含选择标记的DNA的基因枪递送并通过同源重组将该DNA靶向质体基因组。此外,质体转化可以通过核编码且质体指导的RNA聚合酶的组织偏爱的表达,经由沉默的质体携带的转基因的反式激活来完成。此类系统已在McBride等人(1994)Proc.Natl.Acad.Sci.USA 91:7301-7305中得到报道。
已转化的细胞可以依照常规方法生长为植物。参见,例如,McCormick等人(1986)Plant Cell Reports 5:81-84。然后,可以让这些植物进行生长,并用相同的转化株或不同株进行授粉,并且鉴定出具有所需表型特征的组成型表达的所得到的杂种。可以生长两代或更多代以确保所需表型特征的表达被稳定地维持和遗传,并随后收获种子以确保已获得了所需表型特征的表达。以这种方式,本发明提供了经转化的种子(也称为“转基因种子”),其具有本发明的核苷酸构建体,例如稳定地整合入其基因组内的本发明的表达盒。
EPSPS活性的测量
在本发明的一个实施方案中,草甘膦抗性EPSPS酶具有约1-约150uM的的关于磷酸烯醇丙酮酸(PEP)的Km,包括约2uM,约3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、110、120、130或约140uM,以及约500-约1000、约550、约600、650、700、750、800、850、900、950或高达约1000的Ki(草甘膦)/Km(PEP)。如本文所使用的,在大约pH7,在酶服从米-曼动力学的条件下测量Km和Ki。一种非限制性测量技术在pH7和室温下在氯化钾和HEPES缓冲液中使用纯化形式的酶,并使用0-10mM的草甘膦浓度。
EPSPS动力学活性可以例如通过测量磷酸的释放来进行测定,所述磷酸的释放在EPSPS的底物(例如,PEP和S3P)被催化成其后续反应产物(例如,5-烯醇丙酮酰-3-磷酸莽草酸)期间产生,其中使用由Vazquez等人(2003)Anal.Biochem.320(2):292-298描述的荧光测定法。这种测定法基于非荧光化合物N-乙酰基-3,7-二羟基吩噁嗪(
Red,Invitrogen,Carlsbad,CA)被过氧化氢氧化成荧光化合物试卤灵(Zhou和Panchuk-Voloshina(1997)Anal.Biochem.253:169-174)。该反应依赖于嘌呤核苷磷酸化酶(PNP)、黄嘌呤氧化酶(XOD)和辣根过氧化物酶(HRP)对于磷酸的利用。磷酸释放与由于
Red转化成试卤灵而产生的荧光水平相关。可以例如使用滤波荧光计、平板阅读器、分光荧光计、分光光度计等,通过使用本领域众所周知的方法来测量荧光。由该反应产生的荧光可以使用设定为约530-约560nm范围中的激发和约590nm的发射的荧光计来检测。可以在约565nm处检测吸光度(例如,使用分光光度计或平板阅读器)。
在一个实施方案中,本发明包括对先前报道的测定条件的改变,以扩大该测定法的动态范围以适应更广泛范围的底物浓度。所述改变包括至少1U/ml,约1-约1.25U/ml,约1.25-约1.5U/ml,约1.5-约2U/ml,或大于2U/ml的XOD浓度;大于0.1U/ml,约0.1-约0.5U/ml,约0.5-约1U/ml,约1-约1.5U/ml,约1.5-约2U/ml,或大于2U/ml的PNP浓度;和大于100μM,约100-约200μM,约200-约300μM,约300-约400μM,约400-约500μM,约500-约600μM,约700-约800μM,约800-约900μM,约900-约1000μM,或大于约1000μM的
Red浓度。这种修饰可以应用于测量任何酶的动力学活性的测定法,其中在由该酶催化的反应期间释放出磷酸。
植物
本发明可以用于转化任何植物种类,包括但不限于,单子叶植物和双子叶植物。目的植物的例子包括但不限于,玉米(玉蜀黍)、高粱、小麦、向日葵、番茄、十字花科植物、胡椒属植物、马铃薯、棉花、稻、大豆、甜菜、甘蔗、烟草、大麦和油籽油菜、芸苔属物种(Brassicasp.)、苜蓿、黑麦、粟、红花、花生、甘薯、木薯、咖啡、椰子、菠萝、柑橘类树、可可、茶、香蕉、鳄梨、无花果、番石榴、芒果、橄榄、番木瓜、腰果、澳洲坚果、杏树、燕麦、蔬菜、观赏植物和针叶树。
蔬菜包括但不限于,番茄、莴苣、青豆、利马豆、豌豆,以及甜瓜属(Cucumis)的成员,例如黄瓜、罗马甜瓜和香瓜。观赏植物包括但不限于,杜鹃花、绣球、木槿、玫瑰花、郁金香、水仙花、矮牵牛、康乃馨、一品红和菊花。优选地,本发明的植物是农作物植物(例如,玉蜀黍、高粱、小麦、向日葵、番茄、十字花科植物、胡椒属植物、马铃薯、棉花、稻、大豆、甜菜、甘蔗、烟草、大麦、油籽油菜等)。
本发明特别适合于单子叶植物家族的任何成员,包括但不限于,玉蜀黍、稻、大麦、燕麦、小麦、高粱、黑麦、甘蔗、菠萝、薯蓣、洋葱、香蕉、椰子和枣椰子。
植物转化的评估
在将异源外源DNA引入植物细胞内后,通过各种方法来证实异源基因已转化或整合入植物基因组中,所述方法例如为分析与整合的基因相关的核酸、蛋白质和代谢产物。
PCR分析是在移植到土壤中之前的较早阶段时就整合的基因的存在来筛选转化的细胞、组织或幼芽的快速方法(Sambrook和Russell(2001)Molecular Cloning:A Laboratory Manual(Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY))。PCR使用对目的基因或土壤杆菌载体背景等特异的寡核苷酸引物来进行。
可以通过基因组DNA的Southern印迹分析来证实植物转化(Sambrook和Russell(2001),同上)。一般而言,从转化体中提取总DNA,用合适的限制酶消化,在琼脂糖凝胶中进行分级,并转移至硝酸纤维素或尼龙膜上。随后,可以用例如放射标记的32P靶DNA片段来探测膜或“印迹”,以根据标准技术(Sambrook和Russell,2001,同上)来证实引入的基因整合到植物基因组中。
在Northern分析中,从转化体的特定组织中分离RNA,在甲醛琼脂糖凝胶中进行分级,并根据本领域常规使用的标准操作程序印迹到尼龙滤纸上(Sambrook和Russell(2001),同上)。随后,通过采用本领域已知的方法将滤纸与衍生自GDC的放射性探针杂交来测试由grg23或grg51编码的RNA的表达(Sambrook和Russell(2001),同上)。
可以对转基因植物进行Wastern印迹法和生物化学测定法等,以通过标准操作程序来确定由除草剂抗性基因编码的蛋白质的存在(Sambrook和Russell(2001),同上),其中使用与除草剂抗性蛋白质上存在的一种或多种表位结合的抗体。
提供了下述实施例,这是为了举例说明而不是为了限制。
实施例
实施例1:ATX21308的分离
通过将土壤样品铺板在包含磷酸盐和50mM草甘膦的富集基本培养基3(Enriched Minimal Media 3,EMM3)上来分离ATX21308。因为EMM3不包含芳香族氨基酸,所以菌株必须对草甘膦有抗性以便在这种培养基上生长。
将约1克土壤悬浮于约10ml水中,并在涡旋混合器中混合5秒。将100μl这种悬浮液加入含磷酸盐但不含草甘膦的1ml EMM3中。EMM3包含(每升,pH7.0):10g蔗糖、1g NH4Cl、0.2g MgSO4·7H2O、0.01g FeSO4·7H2O、0.007g MnSO4·H2O以及10ml含(每升,pH7.0)210g Na2HPO4和90g NaH2PO4的磷酸盐溶液。在组织培养辊筒(rollerdrum)上于21℃振荡过夜,并随后在包含50mM草甘膦的EMM3琼脂上进行铺板。3天后,将分离物在Luria Bertani(LB)琼脂上进行铺板,以证实单一形态学。6天后,将单个菌落在包含50mM草甘膦的EMM3琼脂上进行划线培养。分离物在50mM草甘膦平板上生长过夜。由于其在高草甘膦浓度存在下生长的能力而选择出一个特定菌株,并命名为ATX21308。就其在液体培养中在草甘膦存在下生长的能力对该菌株进行测试,并且该菌株能够在受试条件下生长直至高达约300mM草甘膦。
实施例2:粘粒文库的制备和筛选
使用本领域通常已知的方法从ATX21308的培养物中提取总DNA。用限制酶Sau3A1部分消化该DNA,并且根据制造商的说明书将其与SuperCos(Stratagene)载体片段进行连接。使用GigaPack III XL包装提取物(Stratagene)将连接产物包装到噬菌体颗粒中,转染到大肠杆菌细胞内,并且在包含50μg/ml卡那霉素的LB琼脂上进行铺板以选择包含粘粒的菌落。
将独个菌落挑取到包含LB液体培养基和50μg/ml卡那霉素的384孔平板内,并且生长至饱和。将来自这些培养物的细胞以1∶10进行稀释,随后点样到包含50μg/ml卡那霉素和0mM、10mM、20mM或50mM的草甘膦的M63琼脂平板上。[M63琼脂培养基,100mM KH2PO4、15mM(NH4)2SO4、50μM CaCl2、1μM FeSO4、50μM MgCl2、55mM葡萄糖、25mg/L L-脯氨酸、10mg/L硫胺素HCl、足够的NaOH(以将pH调整至7.0)和15g/L琼脂]。分离出在更高的草甘膦浓度下更快速地生长的转化体,并用限制酶EcoR I进行消化,以鉴定具有共享的限制模式的粘粒。鉴定出在草甘膦存在下生长并且共享相似的EcoRI限制模式的几个克隆。这些粘粒克隆之一,pAX1924,被选择用于进一步的实验。
实施例3:鉴定粘粒pAX1924中的grg23
为了鉴定负责由粘粒pAX1924所显示的草甘膦抗性的基因,用转座元件诱变处理来自该克隆的DNA。在这种方法中,鉴定出已经历转座子插入并已丧失赋予草甘膦抗性的能力的克隆。转座子插入的定位鉴定出了负责草甘膦抗性表型的开放读码框。
根据制造商的方案,使用EZ::TN Insertion Kit(Epicentre,Madison,WI)对粘粒pAX1924实施体外转座子诱变。这种方法将转座子片段随机插入粘粒DNA中并因此随机破坏粘粒中的基因的功能。这种特定的转座子包含编码针对三甲氧苄二氨嘧啶的抗性的基因,因此通过在那种抗生素存在下生长的能力可以选择出转座子插入克隆。可以通过限制性片段作图或者通过用在转座子中退火的引物进行测序来测定转座子插入的位置。将pAX1924的转座子插入克隆在包含草甘膦的M63培养基上进行铺板。鉴定多个含转座子的克隆,其已丧失在草甘膦存在下生长的能力,这表明转座子已破坏了负责抗性的基因。
对于包含转座子插入的pAX1924的区域,使用本领域众所周知的测序方法来测定DNA序列。使用这种序列信息,合成DNA引物并用于测定在包含转座子插入的区域中的pAX1924的DNA序列。对所得到的DNA序列进行的分析显示,这个区域包含单基因。该基因在本文中命名为grg23。grg23的分析显示,由于有效的备选翻译起始位点的存在,它能够在细菌细胞中产生2种可能的蛋白质。第一个ORF(ORF1)从SEQ ID NO:1的第109-111位上的GTG起始密码子开始,并且在SEQID NO:1的核苷酸1417-1419上的TAG终止密码子处结束。第二个ORF(ORF2)在SEQ ID NO:1的核苷酸178-180上的ATG起始密码子处开始,并且在SEQ ID NO:1的核苷酸1417-1419上的TAG终止密码子处结束。ORF1的翻译产生SEQ ID NO:2中所示的氨基酸序列。ORF2的翻译产生SEQ ID NO:4中所示的氨基酸序列。
对grg23周围的DNA区域的分析暗示,ORF2之前为核糖体结合位点,而在ORF1翻译起始点前没有明显的核糖体结合位点。此外,这两个开放读码框与代表性的EPSPS酶的比对显示,少数EPSPS酶包含有在ORF1内编码的这种N-末端延长部分。因此,在细菌中由grg23编码的功能ORF是ORF2。因此,如本文所使用的,GRG23指由ORF2(SEQID NO:1的核苷酸178-1419)编码的那种。然而,本领域众所周知的是,EPSPS酶对于在其N-末端处的额外氨基酸是非常耐受的。因此,ORF1(SEQ ID NO:1的核苷酸109-1419)的表达也应当产生赋予草甘膦抗性的EPSPS。
为了测试ORF2充当EPSPS并将草甘膦抗性赋予细胞的能力,可以将这个开放读码框亚克隆到大肠杆菌内并在其中表达。
实施例4:将grg23亚克隆到载体中以用于在大肠杆菌中进行表达
使用与上文概述相同的克隆策略将编码GRG23 ORF2(从ATG(SEQID NO:1的第178-180位)开始,表达413个氨基酸的蛋白质)的基因亚克隆到pUC18和pRSF1b中。合成PCR引物[5′CAGGGATCCGGCATGGAAACTGATCGACTAGTG 3′],其在紧挨起始位点的5′处添BamHI位点及随后的GGC(5′-GGATCCGGC-3′)。合成第二种引物[5′ATTGGCGCGCCCTAGCCGGGGAGCGTAAG 3′],其在紧挨终止序列的3′处添加AscI位点(5′-GGCGCGCC-3′)。使用PFUULTRATM DNA聚合酶(Stratagene)通过PCR扩增grg23编码区。在使用这些引物PCR扩增grg23并用BamHI/AscI限制性消化后,将PCR产物连接到pUC19(用BamHI和AscI消化)和pRSF1b(用BamHI和AscI消化)中,并且获得包含插入片段的菌落。通过限制性消化和通过DNA测序来证实pUC18-grg23克隆(在本文中命名为pAX1927)。
类似地,用BamHI和AscI消化表达载体pAX1909,并且将包含该片段的载体通过本领域众所周知的方法进行凝胶纯化。pAX1909是PRSF-1b(Novagen,San Diego,CA)的衍生物,其经修饰以包含在编码富含组氨酸的“His-Tag”的区域的3′处紧接的BamHI位点。因此,克隆到pAX1909中的蛋白质是包含额外的氨基酸MAHHHHHHGSG的框内融合蛋白质。通常开发载体例如pAX1909用于蛋白质的表达和纯化,并且这些方法是本领域众所周知的。
将上文产生的经消化的PCR产物连接到经消化的pAX1909载体中,并且获得包含插入片段的菌落。通过限制性消化和通过DNA测序来证实pAX1909-grg23克隆(在本文中命名为pAX1926)。pAX1926的构建方式是这样的,即使得预测的GRG23翻译产物包含由MAHHHHHH组成的氨基末端延长部分。该N-末端延长部分包含可用于促进GRG23蛋白纯化的“组氨酸标签”或“6-His标签”,如本领域众所周知。
包含grg23 ORF2的质粒pAX1926已于2005年11月18日保藏于农业研究机构保藏中心(NRRL),并且分配有登记号NRRL B-30888。
实施例5:grg23赋予针对高水平的草甘膦的抗性
将pUC18-Grg23构建体(pAX1927)转化到大肠杆菌菌株DH5α内,并在补充有羧苄青霉素(0.1mg/mL)的LB琼脂平板上进行铺板。选择2个菌落,重悬浮于无菌水中,并且在包含0mM、25mM、50mM或100mM的草甘膦的M63平板上进行划线培养。还向平板中添加异丙基-B-D-硫代吡喃型半乳糖苷(IPTG;0.1mM)。作为对照,转化包含单独的pUC18载体的细胞并且在草甘膦平板上进行划线培养。生长2天后,检查这些平板的生长(表1)。
表1
构建体 |
0mM草甘膦 |
25mM草甘膦 |
50mM草甘膦 |
100mM草甘膦 |
pUC18 |
+ |
- |
- |
- |
pUC18-Grg23(pAX1927) |
+ |
++ |
++ |
++ |
这个结果证实,表达grg23以产生GRG23-ORF2在大肠杆菌中赋予了针对至少100mM的草甘膦抗性。此外,包含pAX1927的大肠杆菌的生长在草甘膦存在下强于在草甘膦不存在的情况下。
实施例6:GRG23与其他蛋白质的同源性
GRG23的推导的氨基酸序列与EPSPS酶具有同源性,这表明grg23编码EPSPS。
对GRG-ORF2的推导的氨基酸序列(SEQ ID NO:4)的检查揭示出,它不包含II类EPSPS酶典型的4个结构域。因此,它是新型的、非II类的、草甘膦抗性的EPSPS。
对公众可获得的蛋白质数据库例如SWISSPROT进行的搜索揭示出,GRG23与广泛类别的EPSPS酶具有氨基酸相似性。然而,任何数据库中均没有蛋白质与GRG23氨基酸序列具有超过50%的同一性。GRG23与其他EPSPS酶的代表性比对显示于图1中。
实施例7:GRG23的纯化
在用IPTG诱导后,在大肠杆菌中表达pRSF1b-grg23构建体(pAX1926),并使用钴层析柱进行单步纯化,如本领域中已知的。在柱洗脱后,使纯化的GRG23针对50mM HEPES/100mM KCl(pH7.0)进行透析。如通过PAGE所评估的,该蛋白质的纯度超过95%。使用Bradford法来定量GRG23的量,如本领域中众所周知的(Bradford(1976)Anal.Biochem.72:248-254)。
实施例8:GRG23活性的动力学测定
使用涉及于pH7.0在包含氯化钾和HEPES的缓冲液中温育PEP(Sigma,St.Louis,MO)和S3P的动力学测定法,就EPSPS活性来测定纯化的蛋白质的样品。如本领域众所周知的(Vazquez等人(2003)Anal.Biochem.320:292-298),使用偶联测定法来检测磷酸释放,所述偶联测定法用于基于Amplex Red的产生来进行磷酸的荧光检测。
公开的测定条件在其中磷酸非常快速释放的实验中可以导致测定法的饱和。这种饱和在一定程度上限制了该测定法的动态范围,并且要求限定的酶浓度范围。已确定,对荧光磷酸测定法的动力学限制显然是由于因素的组合,包括肌苷和PNP的限制。在本发明中,已开发出了测定法条件,其产生本质上改善的动态范围并允许使用更广泛范围的酶和底物浓度。已明显改变的测定法条件包括嘌呤核苷磷酸化酶(PNP)、黄嘌呤氧化酶(XOD)、
Red和肌苷的浓度,这些中的每一个在该测定法中在浓度方面增加以适应更高速率的磷酸周转。将这种测定法调整适合于用于测量96孔形式中的EPSPS活性,其具有下述改善:
表2.改善的荧光测定法
|
改善的测定法 |
Vazquez等人,2003 |
单位 |
XOD |
1 |
.4 |
IU/ml |
PNP |
2 |
.02 |
IU/ml |
肌苷 |
2.25 |
1.5 |
mM |
HRP |
1 |
1 |
IU/ml |
Amp Red |
1,100 |
50 |
uM |
Hepes |
26.25 |
-- |
mM |
KCl |
26.25 |
-- |
mM |
pH |
7 |
7.4 |
|
Tris |
-- |
50 |
mM |
酶促测定法在96孔平板中以50uL的总体积来进行。反应在室温下于pH7.0进行。将除PEP、EPSPS和S3P外的所有测定法组分合并到Master Mix中,并使用多道移液器等分到96孔平板中。然后,向每个孔中加入合适的PEP浓度。制备EPSPS的新鲜稀释物并加入合适的孔中。通过添加S3P来起始每种测定法。
将速率数据进行绘图,并且通过应用米-曼等式并使用非线性曲线拟合程序(
Synergy Sofware)来测定K
m和K
cat动力学参数。K
i数据通过下述方式来进行测定:测量在多个草甘膦浓度下的K
m(app),并且作为抑制剂浓度的函数来对K
m(app)进行绘图。
表3.草甘膦对于GRG23的Km(app)的影响
草甘膦浓度(uM) |
Km(app) |
0 |
10.95 |
3000 |
18.89 |
5000 |
20.67 |
1000 |
25.23 |
通过作为草甘膦浓度的函数对Km(app)进行绘图,可以获得GRG23的草甘膦抗性的线性表示。所得到的直线的X截距表示-Ki。用表3中所示的数据绘制这条线产生了下述数据:
表4.GRG23的动力学值
GRG23对于草甘膦是具有高度抗性的,其具有超过9mM的Ki和超过800的Ki/Km比。
实施例9:ATX21313的分离
对于菌株ATX21313,将约1克土壤悬浮于10ml水中,并且将100μl用于接种1ml具有矿物盐培养基A(MSMA)但不含草甘膦的培养物。MSMA包含(每1升,pH7.0)1g NH4Cl、10g蔗糖、0.2g MgSO4·7H2O、0.01g FeSO4·7H2O、0.007g MnSO4·H2O,并补充有磷酸盐。在过夜温育后,将该培养物在包含MSMA和50mM草甘膦的固体培养基上进行铺板,温育数天,并接种到Luria Bertani琼脂平板上,以证实单一菌落类型。在50mM草甘膦存在下的生长通过在MSMA,50mM琼脂平板上再生长来再次证实。这种分离方法产生菌株ATX21313,它能够在这些条件下良好生长。
实施例10:草甘膦抗性EPSP合酶的克隆
从菌株ATX21313中提取基因组DNA,并且将所得到的DNA用限制酶Sau3A 1进行部分消化,从而产生大小约5千碱基的DNA片段。在琼脂糖凝胶上按大小选择这些DNA分子,纯化,并连接到用BamHI预消化的LAMBDA
载体臂中。然后,将连接的臂包装到噬菌体颗粒中,并且如本领域已知的测定噬菌体滴度。通过本领域已知的方法来扩增所得到的文库,从而产生3×10
7-3×10
8PFU/mL的文库滴度。对于每个独立的文库,随后用来自经扩增的文库的噬菌体以及M13辅助噬菌体一起共转染大肠杆菌(XL1 Blue MRF′),以允许将该文库大量切出为感染性环状ssDNA的形式,如本领域已知的(Short等人(1988)Nucleic Acids Research 16:7583-7600)。在共转染的细胞离心后,将包含噬菌体的上清液加热至65-70℃并持续15-20分钟,以使任何残留的λ噬菌体颗粒丧失能力。将所得到的ssDNA质粒文库的稀释物转染到感受态大肠杆菌XL1 Blue MRF′细胞以及XL-BlueMRF′(ΔaroA)细胞(XL1 Blue MRF′)的新鲜培养物中。将所得到的经转染的细胞铺板在包含卡那霉素、0.1mM IPTG和0mM、20mM或50mM的草甘膦的M63平板上。这种筛选法允许鉴定包含草甘膦耐受性EPSP合酶的克隆,以及携带针对草甘膦的耐受性的克隆。在ΔaroA菌株或XL-Blue MRF′中挑取在20mM或50mM草甘膦上生长的菌落,并且通过限制性消化来分析它们的质粒以鉴定具有共享的限制模式的质粒。通过本领域已知的方法对独个质粒进行测序,优先考虑赋予针对50mM草甘膦的抗性的质粒。
使用本领域已知且理解的这种方法,并有时关于每个文库对该方法进行修饰,鉴定了包含EPSP合酶基因的文库克隆。
在EPSP合酶的区域中测定所得到的克隆的区域的序列。
实施例11:EPSP合酶的DNA和蛋白质序列
对于pAX1967,通过本领域众所周知的方法测定草甘膦抗性EPSP合酶的DNA序列。grg51的DNA序列在本文中以SEQ ID NO:5提供。grg51的预测的翻译产物(GRG51)在本文中以SEQ ID NO:6提供。GRG51显示出与GRG23(SEQ ID NO:2)的97%的氨基酸同一性。
包含grg51的质粒pAX1967已于2006年6月26日保藏于农业研究机构保藏中心(NRRL),并且分配有登记号NRRL B-30949。
表5概括了GRG23和GRG51与其他EPSP合酶的同源性。
表5.GRG23-ORF1和GRG51与代表性EPSPS酶的氨基酸同一性
EPSPS |
与GRG23的同一性% |
与GRG51的同一性% |
GRG23 |
- |
92% |
GRG51 |
92% |
- |
克劳氏芽孢杆菌 |
36% |
35% |
嗜木聚糖红色杆菌 |
39% |
38% |
大肠杆菌 |
32% |
32% |
CP4 |
20% |
21% |
玉蜀黍 |
32% |
32% |
实施例12:将新型草甘膦抗性EPSP合酶克隆到大肠杆菌表达载体中
将包含在pAX1967中的grg51基因亚克隆到大肠杆菌表达载体pRSF1b(Invitrogen)中。所得到的克隆通过DNA测序来证实,并且用于在大肠杆菌中诱导grg51的表达。然后,如本领域已知的,纯化表达的具有His标签的蛋白质。
实施例13:EPSP合酶的草甘膦抗性
将包含pAX1967的细胞铺板在包含抗生素和0mM或20mM草甘膦的M63+平板上。于37℃生长2天后对生长进行评分。观察到GRG51在大肠杆菌细胞中赋予针对20mM草甘膦的抗性(表6)。
表6.草甘膦筛选
EPSPS |
质粒克隆 |
在20mM草甘膦上的生长 |
载体 |
- |
- |
GRG51 |
pAX1967 |
++ |
实施例14:syngrg23的设计和表达
设计并合成编码GRG23蛋白(SEQ ID NO:2;于2005年12月1日提交的美国专利申请号60/741,166)的新型基因序列。这种序列以SEQ ID NO:12提供。通过本领域已知的方法将在本文中命名为“syngrg23”的这个开放读码框克隆到表达载体pRSF1b(Invitrogen)中。
将编码GRG23的syngrg23基因克隆到pUC19载体中以产生pAX748。将在这个载体中位于syngrg23侧翼的PCR引物用于从pAX748中扩增syngrg23,其中使用
II系统(Stratagene)以将随机突变引入syngrg23编码区中。该模板在易错PCR反应体系中以1∶50稀释,并且扩增进行30个循环。将所得到的PCR产物用限制酶BamHI和SgsI进行消化,凝胶纯化,并连接到载体pRSF1b中,以产生经诱变的syngrg23文库。
将经诱变的syngrg23文库转化到大肠杆菌菌株BL21*DE3 star(Invitrogen)中。在转化后,将独个的菌落铺板在包含150mM草甘膦的1xM63培养基上,以选择已保留酶活性和生长耐受性的克隆。
实施例15:在平板上就草甘膦抗性进行筛选
将文库连接产物转化到BL21*DE3感受态大肠杆菌细胞(Invitrogen)中。转化根据制造商的说明来进行,并具有下述修饰。于37℃在SOC培养基中温育1小时后,细胞通过离心(5分钟,1000xg,4℃)进行沉淀。细胞用1ml M63+进行洗涤,再次离心,并倾析出上清液。细胞用1ml M63+进行第二次洗涤,并重悬浮于200ul M63+中。
对于选择在大肠杆菌中赋予草甘膦抗性的突变型GRG23酶,将细胞铺板在包含150mM草甘膦、0.05mM IPTG(异丙基-β-D-硫代吡喃半乳糖苷)和50ug/ml卡那霉素的M63+琼脂培养基平板上。M63+培养基包含100mM KH2PO4、15mM(NH4)2SO4、50μM CaCl2、1μM FeSO4、50μM MgCl2、55mM葡萄糖、25mg/L L-脯氨酸、10mg/L硫胺素HCl、足够的NaOH(以将pH调整至7.0)和15g/L琼脂。平板于37℃温育36小时。
挑取独个菌落并且排列在384孔平板上。以这种方式制备2块384孔平板。从在缺乏草甘膦的平板上生长的菌落中挑取具有384个克隆的第3块平板。
实施例16:草甘膦抗性GRG23变体的分离和分析
通过在草甘膦平板上生长来鉴定用经诱变的syngrg23和/或grg23变体转化的BL21*DE3细胞。制备经诱变的syngrg23和/或grg23变体的提取物并且就改善的酶活性进行测定。将在草甘膦平板上鉴定的菌落点样到包含LB培养基的96孔模块中,并且生长至约0.6的O.D.。然后添加IPTG(0.5mM)并且使模块于20℃温育过夜以诱导蛋白质表达。使用POP培养试剂(Novagen)和Lysonase(Novagen)从细胞粒状沉淀中制备蛋白质提取物,并且在使提取物于37℃加热30分钟后测量粗制裂解物中的酶活性。选择其活性比包含合适的对照蛋白质(例如GRG23)的一组提取物的平均值高2个标准差的提取物以用于进一步的分析。
将在作为粗提取物进行温育后显示出增加的活性的克隆在250mLLB培养基中进行生长,并且用IPTG诱导蛋白质表达。在温育后,使用钴树脂(Novagen),通过亲和层析法从每种培养物中纯化突变型GRG23蛋白。然后,于37℃加热0、2、4和约16小时后,就酶活性来测试纯化的蛋白质。
实施例17:改善的GRG23变体
从经诱变的syngrg23的DNA文库中鉴定了具有改善的活性的几个克隆。测定了相应于这些提取物的克隆的DNA序列。表7显示了在保留草甘膦抗性的6个GRG23变体中鉴定的氨基酸变化:编码氨基酸序列GRG23(L3P1.B20)(SEQ ID NO:27)的grg23(L3P1.B20)(SEQID NO:26);编码氨基酸序列GRG23(L3P1.B3)(SEQ ID NO:29)的grg23(L3P1.B3)(SEQ ID NO:28);编码氨基酸序列GRG23(L3P1.F18)(SEQ ID NO:31)的grg23(L3P1.F18)(SEQ ID NO:30);和编码氨基酸序列GRG23(L3P1.O23)(SEQ ID NO:32)的grg23(L3P1.O23)(SEQ ID NO:31)。
表7.在草甘膦抗性GRG23变体中鉴定的突变
克隆 |
GRG23中的氨基酸(AA) |
L3P1B20 |
V206→I |
L3P1B3 |
D75→H,E217→K |
L3P1F18 |
T274→I |
L3P1O23 |
R5→H |
将克隆在250mL LB培养基中进行生长,并且蛋白质表达如上所述进行诱导和分离。然后,于37℃加热0、2、4和约16小时后,就酶活性来测试纯化的蛋白质。发现称为“M5”的一个克隆于37℃进行延长的温育后保留了比例增加的其酶活性(表8)。测定这个克隆的DNA序列,并且该基因在本文中命名为grg23(ace1)(SEQ ID NO:14)。从grg23(ace1)表达的蛋白质被命名为GRG23(ACE1)(SEQ IDNO:15)。
表8.在升高的温度时GRG23(ACE1)对GRG23的半衰期
蛋白质 |
于37℃的半衰期(小时) |
GRG23 |
7 |
GRG23(ACE1) |
15.5 |
GRG23(ACE1)相对于野生型GRG23蛋白来说包含2个氨基酸置换:A49→T和S276→T。包含这种基因的pRSF1b载体被命名为pAX3801。图1显示了在升高的温度时GRG23(ACE1)对GRG23的相对稳定性。
实例18:GRG-23变体的EPSPS活性的测定
如于2005年12月1日提交的美国专利申请号60/741,166中所描述的,就EPSP合酶活性来测定包含GRG23变体蛋白质的提取物,所述专利通过提及而整体合并入本文。根据制造商的说明,在50ul总体积中进行测定法,所述总体积包含0.5mM莽草酸-3-磷酸、200uM磷酸烯醇丙酮酸(PEP)、1U/ml黄嘌呤氧化酶、2U/ml核苷磷酸化酶、2.25mM肌苷、1U/ml辣根过氧化物酶、0-2mM草甘膦、50mMHEPES/KOH pH7.0、100mM KCl和
Red(Invitrogen)。将提取物与除莽草酸-3-磷酸外的所有测定法组分一起在室温下温育5分钟,并且通过添加莽草酸-3-磷酸来开始测定法。使用SpectramaxGemini XPS荧光分光计(Molecular Dynamics,激发:555nm;发射:590nm)来测量EPSP合酶活性。
在如前所述(于2005年12月1日提交的美国专利申请号60/741,166)对纯化的蛋白质进行动力学参数的完全测定后,对于通过本领域已知的Bradford测定法测定的蛋白质的量进行调整。对于任何一种草甘膦浓度,作为广泛范围的PEP浓度的函数,测量EPSP合酶活性。使用KALEID
软件(Synergy Software)将所述数据拟合至米-曼等式,并用于测定在那种草甘膦浓度下EPSP合酶的K
m(表观K
m)。表观K
m值在不少于4个草甘膦浓度下进行测定,并且由表观K
m对草甘膦浓度的图来计算关于草甘膦的EPSPS的K
i,使用本领域已知的等式(m1*x/(m2+x);m1=1;m2=1)。
表9.GRG23(ACE1)对GRG23的动力学
|
Km(uM) |
Ki(uM) |
V最大(nmol/分钟/ug) |
GRG23 |
12.2 |
13,800 |
14.77 |
GRG23(ACE1) |
9.7 |
14,620 |
13.73 |
实施例19:grg23(ace2)的鉴定
GRG23(ACE1)相对于GRG23而言包含2个氨基酸变化。为了确定这些位置上的另外置换是否能够进一步改善活性,产生了导致获得表达蛋白质的克隆的DNA文库,所述蛋白质在GRG23的第49和276位上本质上进行了突变。赋予草甘膦抗性的克隆通过在草甘膦平板上的生长进行选择,并且如所描述的进行生长和就动力学性质进行测定。
令人惊讶的是,编码GRG23(ACE2)蛋白质(SEQ ID NO:17)的在本文中命名为grg23(ace2)(SEQ ID NO:16)的1个克隆被鉴定为具有改善的热稳定性。grg23(ace2)的DNA序列显示,GRG23(ACE2)包含单个氨基酸变化(GRG23的残基276变成精氨酸)。
实施例20:GRG23和GRG51的比较,和不同残基的诱变
产生2个文库以评估来自GRG23和GRG51的氨基酸序列比较的可能的氨基酸序列的变换。第一个文库将来自GRG51氨基酸序列的变异引入grg23(ace2)编码区中。第二个文库将来自GRG23(ACE2)的氨基酸序列的变异引入grg51编码区中。
就下述方面来评估所得到的文库的克隆:(1)将草甘膦抗性赋予细胞的能力,和(2)于37℃进行延长的温育后的活性。对总共10个克隆进行测序并更详细地进行分析。相对于GRG23(ACE2)和GRG51,编码蛋白质GRG51.4(SEQ ID NO:19)的在本文中命名为grg51.4(SEQID NO:18)的1个特定克隆包含几个氨基酸变化。随后将相对于GRG23(ACE2)而言在GRG51.4中存在的氨基酸变化引入grg23(ace2)基因中,以产生grg23(ace3)(SEQ ID NO:20),其编码GRG23(ACE3)蛋白(SEQ ID NO:21)。相对于GRG23和GRG23(ACE2)而言,GRG23(ACE3)显示出更优的活性和热稳定性。
对GRG23(ace1)进行诱变,并且测试克隆以鉴定表达具有改善的热稳定性和/或活性的变体的克隆。借助于其改善的动力学性质来鉴定出1个克隆,即编码GRG23(L5P2.J2)(SEQ ID NO:23)的grg23(L5P2.J2)(SEQ ID NO:22)。GRG23(L5P2.J2)相对于GRG23(ACE1)而言包含3个氨基酸变化,如下表10中所示。
表10.GRG23(L5P2.J2)中的氨基酸变化
|
相对于GRG23(ACE1)而言的在GRG23(L5P2.J2)中的氨基酸(AA) |
|
V101→F |
寡核苷酸诱变用于制备这样的克隆,所述克隆在grg23(ace3)编码区中包含每一个在GRG23(L5P2.J2)中鉴定的氨基酸变化。1个克隆被鉴定为编码具有超过GRG23(ACE3)的改善的动力学性质的蛋白质,并命名为grg23(ace4)(SEQ ID NO:24)。由grg23(ace4)编码的蛋白质被命名为GRG23(ACE4)(SEQ ID NO.25),其相对于GRG23(ACE3)而言包含单个氨基酸变化(缬氨酸101至苯丙氨酸)。基于这个结果,进行分开的寡核苷酸诱变以测试第101位处的每个可能的氨基酸置换的动力学。与GRG23(ACE4)相比较,没有一种氨基酸变化导致动力学性质的进一步的改善。
表11.改善的变体的动力学
|
Km(uM) |
Ki(uM) |
V最大(nmol/分钟/ug) |
GRG23 |
14 |
10,800 |
13 |
GRG51 |
15 |
21,048 |
13 |
GRG23(ACE1) |
10 |
14,620 |
14 |
GRG23(ACE2) |
11 |
18,104 |
15 |
GRG51.4 |
19 |
26,610 |
17 |
GRG23(ACE3) |
15 |
20,000 |
17 |
GRG23(L5P2.J2) |
15 |
2,500 |
23 |
GRG23(ACE4) |
14 |
5,010 |
24 |
实施例21:改造grg23或grg51以用于植物转化
通过PCR从全长cDNA模板扩增grg23或grg51开放读码框(ORF)。在PCR过程中给ORF的每个末端添加Hind III限制位点。此外,紧挨该基因的起始密码子的5′处添加核苷酸序列ACC,以增加翻译效率(Kozak(1987)Nucleic Acids Research 15:8125-8148;Joshi(1987)Nucleic Acids Research 15:6643-6653)。克隆PCR产物并使用本领域众所周知的技术进行测序,以确保在PCR期间没有引入突变。
用Hind III消化包含grg23或grg51PCR产物的质粒,并且分离包含完整ORF的片段。将这个片段克隆到质粒pAX200的Hind III位点内,所述质粒pAX200是包含稻肌动蛋白启动子(McElroy等人(1991)Molec.Gen.Genet.231:150-160)和PinII终止子(An等人(1989)The Plant Cell 1:115-122)的植物表达载体。将来自这种中间质粒的启动子-基因-终止子片段亚克隆到质粒pSB11(Japan Tobacco,Inc.)中,以形成最终质粒例如pSB11GRG23。如此地组织pSB11GRG23,即使得包含启动子-grg23-终止子构建体的3.91kb DNA片段可以通过用Kpn I和Pme I双消化而切出,并用于通过气溶胶束注射(aerosolbeam injection)转化到植物中。通过限制性消化和凝胶电泳,并通过在各种克隆接头间进行测序来验证pSB11GRG23的结构。
通过使用本领域众所周知的三亲株交配操作程序并且在包含壮观霉素的培养基上铺板,来使该质粒移动到根瘤土壤杆菌菌株LBA4404内,所述菌株LBA4404还具有质粒pSB1(Japan Tobacco,Inc.)。质粒pSB11GRG23携带壮观霉素抗性但却是窄宿主范围质粒,并且在土壤杆菌中不能复制。当pSB11GRG23通过同源重组而整合到广宿主范围质粒pSB1中时,产生壮观霉素抗性菌落。pSB1和pSB11GRG23的共整合产物通过Southern杂交来进行验证。具有共整合物的土壤杆菌菌株用于通过PureIntro方法(Japan Tobacco)来转化玉蜀黍。
实施例22:将grg23或grg51转化到植物细胞中
在授粉后8-12天收集玉蜀黍穗。从穗中分离胚胎,并且将大小0.8-1.5mm的那些胚胎用于转化。将胚胎以盾盖侧向上的方式放置在合适的温育培养基上,例如DN62A5S培养基(3.98g/L N6盐;1mL/L(1000x母液)N6维生素;800mg/L L-天冬酰胺;100mg/L肌醇;1.4g/L L-脯氨酸;100mg/L酪蛋白氨基酸;50g/L蔗糖;1mL/L(1mg/mL母液)2,4-D)。然而,除DN62A5S外的培养基和盐也是合适的并且是本领域已知的。将胚胎在黑暗中于25℃温育过夜。
将所得到的外植体转移至网眼方阵(30-40个/平板),转移至渗透培养基上并保持30-45分钟,随后转移至束射平板(beamingplate)(参见,例如,PCT公开号WO/0138514和美国专利号5,240,842)。
使用气溶胶束加速器,将被设计为在植物细胞中表达GRG23的DNA构建体加速进入植物组织中,其中使用基本上如PCT公开号WO/0138514中描述的条件。在束射(beaming)后,将胚胎在渗透培养基上温育30分钟,并置于温育培养基上于25℃在黑暗中过夜。为了避免不适当地破坏经束射的外植体,在转移至恢复培养基前使它们温育至少24小时。然后,胚胎在恢复期培养基上于25℃在黑暗中扩散5天,随后转移至选择培养基。取决于所利用的特定选择的性质和特征,使外植体在选择培养基中温育高达8周。在选择期后,将所得到的愈伤组织转移至胚胎成熟培养基,直至观察到成熟的体细胞胚的形成。然后,将所得到的成熟的体细胞胚置于低光照下,并且通过本领域已知的方法起始再生过程。允许所得到的幼芽在生根培养基上生根,并且将所得到的植物转移至苗盆(nursery pot)中并繁殖成转基因植物。
材料
DN62A5S培养基
组分 |
每升 |
来源 |
Chu′s N6基本盐混合物(Prod.No.C 416) |
3.98g/L |
Phytotechnology Labs |
Chu′s N6维生素溶液(Prod.No.C149) |
1mL/L(1000x母液) |
Phytotechnology Labs |
L-天冬酰胺 |
800mg/L |
Phytotechnology Labs |
肌醇 |
100mg/L |
Sigma |
L-脯氨酸 |
1.4g/L |
Phytotechnology Labs |
酪蛋白氨基酸 |
100mg/L |
Fisher Scientific |
蔗糖 |
50g/L |
Phytotechnology Labs |
2.4-D(Prod.No.D-7299) |
1mL/L(1mg/mL母液) |
Sigma |
用1N KOH/1N KCl将该溶液的pH调整至pH5.8,添加Gelrite(Sigma)至3g/L,并进行高压灭菌。在冷却至50℃后,添加2ml/L的5mg/ml硝酸银母液(Phytotechnology Labs)。按此配方产生约20个平板。
实施例23:通过土壤杆菌介导的转化将grg23或grg51转化到玉蜀黍
植物细胞中
在授粉后8-12天收集穗。从穗中分离胚胎,并且将大小0.8-1.5mm的那些胚胎用于转化。将胚胎以盾盖侧向上的方式放置在合适的温育培养基上,并在黑暗中于25℃温育过夜。然而,本身无需将该胚胎温育过夜。使胚胎与包含合适载体(用于Ti质粒介导的转移)的土壤杆菌菌株接触5-10分钟,并随后铺板在共培养培养基上3天(25℃,在黑暗中)。在共培养后,将外植体转移至恢复期培养基5天(于25℃,在黑暗中)。取决于所利用的特定选择的性质和特征,使外植体在选择培养基中温育高达8周。在选择期后,将所得到的愈伤组织转移至胚胎成熟培养基,直至观察到成熟的体细胞胚的形成。然后,将所得到的成熟的体细胞胚置于低光照下,并且如本领域已知的来起始再生过程。允许所得到的幼芽在生根培养基上生根,并且将所得到的植物转移至苗盆中并繁殖成转基因植物。
说明书中提及的所有出版物和专利申请表明本发明所属领域的技术人员的技术水平。所有出版物和专利申请通过提及而合并入本文,其程度就好像具体且独个地指出每一独个出版物或专利申请通过提及而合并。
尽管为了清楚地理解,已通过举例说明和实施例相当详细地描述了上述发明,但显而易见的是,可以在所附权利要求书的范围内实践某些变化和修饰。
序列表
<110>Cheryl Peters
Jill Burdette
Philip E.Hammer
Brian Vande Berg
Laura Cooper Schouten
Brian Carr
<120>赋予除草剂抗性的GRG23和GRG51基因
<130>45600/320129
<150>60/741,166
<151>2005-12-01
<150>60/817,799
<151>2006-06-30
<160>33
<170>FastSEQ for Windows Version 4.0
<210>1
<211>1892
<212>DNA
<213>球形节杆菌
<220>
<221>misc_feature
<222>(0)...(0)
<223>菌株ATX21308
<221>CDS
<222>(109)...(1419)
<221>misc_feature
<222>1801
<223>n=A,T,C或G
<221>misc_feature
<222>1801
<223>n=A,T,C或G
<400>1
gggaccacat gctgctcctg atttcagggc tgctgccggt atggaccagg gtttagagag 60
ggacggcacg catccgggcc cttatcggac caacgccaac agcggtcg gtg gcc ttg 117
Met Ala Leu
1
gag cgg ggc cag cac ggc cga tca cgt aga ctc ttt gga gct tcg ctc 165
Glu Arg Gly Gln His Gly Arg Ser Arg Arg Leu Phe Gly Ala Ser Leu
5 10 15
gaa agg atc acc atg gaa act gat cga cta gtg atc cca gga tcg aaa 213
Glu Arg Ile Thr Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys
20 25 30 35
agc atc acc aac cgg gct ttg ctt ttg gct gcc gca gcg aag ggc acg 261
Ser Ile Thr Asn Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr
40 45 50
tcg gtc ctg gtg aga cca ttg gtc agc gcc gat acc tca gca ttc aaa 309
Ser Val Leu Val Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys
55 60 65
act gca att cag gcc ctc ggt gcc aac gtc tca gcc gac ggt gac aat 357
Thr Ala Ile Gln Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn
70 75 80
tgg gtc gtt gaa ggc ctg ggt cag gca ccc cac ctc gac gcc gac atc 405
Trp Val Val Glu Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile
85 90 95
tgg tgc gag gat gca ggt acc gtg gcc cgg ttc ctc cct cca ttc gtc 453
Trp Cys Glu Asp Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val
100 105 110 115
gcc gca gga cag ggg aag ttc acc gtc gac gga agc gag cag ctg cgg 501
Ala Ala Gly Gln Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg
120 125 130
cgg cgc ccg ctt cgg ccc ctg gtc gac ggc atc cgc cac ctg ggc gcc 549
Arg Arg Pro Leu Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala
135 140 145
cgc gtc tcc tcc gag cag ctg ccc cta aca att gaa gcg agc ggg ctg 597
Arg Val Ser Ser Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu
150 155 160
gca ggc ggg gag tac gaa att gaa gcc cat cag agc agc cag ttc gcc 645
Ala Gly Gly Glu Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala
165 170 175
tcc ggc ctg atc atg gcc gcc ccg tac gcg cga caa ggc ctg cgt gtg 693
Ser Gly Leu Ile Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val
180 185 190 195
cgg ata cca aat ccc gtg agc cag ccc tac ctc acg atg aca ctg cgg 741
Arg Ile Pro Asn Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg
200 205 210
atg atg agg gac ttc ggc ctt gag acc agc acc gac gga gcc acc gtc 789
Met Met Arg Asp Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val
215 220 225
agc gtc cct ccc ggg cgc tac aca gcc cgg cgg tat gaa att gaa ccg 837
Ser Val Pro Pro Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro
230 235 240
gac gcg tca act gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc 885
Asp Ala Ser Thr Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly
245 250 255
cga agc ttc gaa ttc cag ggc ctt ggc aca gac agc atc caa ggc gac 933
Arg Ser Phe Glu Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp
260 265 270 275
acg tca ttc ttc aat gta ctt ggg cgg ctc ggt gca gag gtc cac tgg 981
Thr Ser Phe Phe Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp
280 285 290
gca ccc aac tcg gtc acc ata tcc gga ccg gaa agg ctg aac ggc gac 1029
Ala Pro Asn Ser Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp
295 300 305
att gaa gtg gat atg ggc gag ata tcg gac acc ttc atg aca ctc gcg 1077
Ile Glu Val Asp Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala
310 315 320
gcg att gcc cct cta gcc gat gga ccc atc acg ata acc aac att ggc 1125
Ala Ile Ala Pro Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly
325 330 335
cat gca cgg ttg aag gaa tcc gac cgc atc tcg gcg atg gaa acc aac 1173
His Ala Arg Leu Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn
340 345 350 355
ctg cga acg ctc ggt gta caa acc gac gtc gga cac gac tgg atg cga 1221
Leu Arg Thr Leu Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg
360 365 370
atc tac ccc tct acc ccg cac ggc ggc aga gtc aat tgc cac cgg gac 1269
Ile Tyr Pro Ser Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp
375 380 385
cac agg atc gcc atg gcg ttt tca atc ctg gga ctg cga gtg gac ggg 1317
His Arg Ile Ala Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly
390 395 400
att acc ctc gac gac cct caa tgt gtc ggg aag acc ttt cct ggc ttc 1365
Ile Thr Leu Asp Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe
405 410 415
ttc gac tac ctt gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc 1413
Phe Asp Tyr Leu Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro
420 425 430 435
ggc tag tgacttcctc tccggcggac gctaggcatc ggaaaacgaa tcctgacatg 1469
Gly *
accgacctcc tcgcgtcacg gcgtgtctgc cggtacccaa gcattctgcc ttagccgctt 1529
ccgcggcccc ttatgctttc tggttgtcca gattttcatc cgggatgttg cctgaccttg 1589
agcagggcaa tcagctgttc agcactgtca atggtgtggg ccctgaaggc ggcttcgatg 1649
gctgccacgt cggcggctct catcgctgtc acgacacgca gatgcgcttc ataggcacgt 1709
tcaggatccg ccctcgtcgc ctgatcctga gccaaggcaa tagttagatg tgcctccgtt 1769
ggcggccaga gccgaagcaa taaggagttt tncgaggcca cccagattcc ccgggtggaa 1829
ggcgatatgg gcttcatgct gaactatggg gtccggatgg aagtgacttt tcaactctgc 1889
cca 1892
<210>2
<211>436
<212>PRT
<213>球形节杆菌
<400>2
Met Ala Leu Glu Arg Gly Gln His Gly Arg Ser Arg Arg Leu Phe Gly
1 5 10 15
Ala Ser Leu Glu Arg Ile Thr Met Glu Thr Asp Arg Leu Val Ile Pro
20 25 30
Gly Ser Lys Ser Ile Thr Asn Arg Ala Leu Leu Leu Ala Ala Ala Ala
35 40 45
Lys Gly Thr Ser Val Leu Val Arg Pro Leu Val Ser Ala Asp Thr Ser
50 55 60
Ala Phe Lys Thr Ala Ile Gln Ala Leu Gly Ala Asn Val Ser Ala Asp
65 70 75 80
Gly Asp Asn Trp Val Val Glu Gly Leu Gly Gln Ala Pro His Leu Asp
85 90 95
Ala Asp Ile Trp Cys Glu Asp Ala Gly Thr Val Ala Arg Phe Leu Pro
100 105 110
Pro Phe Val Ala Ala Gly Gln Gly Lys Phe Thr Val Asp Gly Ser Glu
115 120 125
Gln Leu Arg Arg Arg Pro Leu Arg Pro Leu Val Asp Gly Ile Arg His
130 135 140
Leu Gly Ala Arg Val Ser Ser Glu Gln Leu Pro Leu Thr Ile Glu Ala
145 150 155 160
Ser Gly Leu Ala Gly Gly Glu Tyr Glu Ile Glu Ala His Gln Ser Ser
165 170 175
Gln Phe Ala Ser Gly Leu Ile Met Ala Ala Pro Tyr Ala Arg Gln Gly
180 185 190
Leu Arg Val Arg Ile Pro Asn Pro Val Ser Gln Pro Tyr Leu Thr Met
195 200 205
Thr Leu Arg Met Met Arg Asp Phe Gly Leu Glu Thr Ser Thr Asp Gly
210 215 220
Ala Thr Val Ser Val Pro Pro Gly Arg Tyr Thr Ala Arg Arg Tyr Glu
225 230 235 240
Ile Glu Pro Asp Ala Ser Thr Ala Ser Tyr Phe Ala Ala Ala Ser Ala
245 250 255
Val Ser Gly Arg Ser Phe Glu Phe Gln Gly Leu Gly Thr Asp Ser Ile
260 265 270
Gln Gly Asp Thr Ser Phe Phe Asn Val Leu Gly Arg Leu Gly Ala Glu
275 280 285
Val His Trp Ala Pro Asn Ser Val Thr Ile Ser Gly Pro Glu Arg Leu
290 295 300
Asn Gly Asp Ile Glu Val Asp Met Gly Glu Ile Ser Asp Thr Phe Met
305 310 315 320
Thr Leu Ala Ala Ile Ala Pro Leu Ala Asp Gly Pro Ile Thr Ile Thr
325 330 335
Asn Ile Gly His Ala Arg Leu Lys Glu Ser Asp Arg Ile Ser Ala Met
340 345 350
Glu Thr Asn Leu Arg Thr Leu Gly Val Gln Thr Asp Val Gly His Asp
355 360 365
Trp Met Arg Ile Tyr Pro Ser Thr Pro His Gly Gly Arg Val Asn Cys
370 375 380
His Arg Asp His Arg Ile Ala Met Ala Phe Ser Ile Leu Gly Leu Arg
385 390 395 400
Val Asp Gly Ile Thr Leu Asp Asp Pro Gln Cys Val Gly Lys Thr Phe
405 410 415
Pro Gly Phe Phe Asp Tyr Leu Gly Arg Leu Phe Pro Glu Lys Ala Leu
420 425 430
Thr Leu Pro Gly
435
<210>3
<211>1892
<212>DNA
<213>球形节杆菌
<220>
<221>CDS
<222>(178)...(1419)
<221>misc_feature
<222>1801
<223>n=A,T,C或G
<400>3
gggaccacat gctgctcctg atttcagggc tgctgccggt atggaccagg gtttagagag 60
ggacggcacg catccgggcc cttatcggac caacgccaac agcggtcggt ggccttggag 120
cggggccagc acggccgatc acgtagactc tttggagctt cgctcgaaag gatcacc atg 180
Met
1
gaa act gat cga cta gtg atc cca gga tcg aaa agc atc acc aac cgg 228
Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn Arg
5 10 15
gct ttg ctt ttg gct gcc gca gcg aag ggc acg tcg gtc ctg gtg aga 276
Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val Arg
20 25 30
cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca att cag gcc 324
Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln Ala
35 40 45
ctc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa ggc 372
Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu Gly
50 55 60 65
ctg ggt cag gca ccc cac ctc gac gcc gac atc tgg tgc gag gat gca 420
Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp Ala
70 75 80
ggt acc gtg gcc cgg ttc ctc cct cca ttc gtc gcc gca gga cag ggg 468
Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln Gly
85 90 95
aag ttc acc gtc gac gga agc gag cag ctg cgg cgg cgc ccg ctt cgg 516
Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu Arg
100 105 110
ccc ctg gtc gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc gag 564
Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser Glu
115 120 125
cag ctg ccc cta aca att gaa gcg agc ggg ctg gca ggc ggg gag tac 612
Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu Tyr
130 135 140 145
gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggc ctg atc atg 660
Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile Met
150 155 160
gcc gcc ccg tac gcg cga caa ggc ctg cgt gtg cgg ata cca aat ccc 708
Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn Pro
165 170 175
gtg agc cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac ttc 756
Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp Phe
180 185 190
ggc ctt gag acc agc acc gac gga gcc acc gtc agc gtc cct ccc ggg 804
Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro Gly
195 200 205
cgc tac aca gcc cgg cgg tat gaa att gaa ccg gac gcg tca act gcg 852
Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr Ala
210 215 220 225
tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc cga agc ttc gaa ttc 900
Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu Phe
230 235 240
cag ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttc ttc aat 948
Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe Asn
245 250 255
gta ctt ggg cgg ctc ggt gca gag gtc cac tgg gca ccc aac tcg gtc 996
Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser Val
260 265 270
acc ata tcc gga ccg gaa agg ctg aac ggc gac att gaa gtg gat atg 1044
Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp Met
275 280 285
ggc gag ata tcg gac acc ttc atg aca ctc gcg gcg att gcc cct cta 1092
Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro Leu
290 295 300 305
gcc gat gga ccc atc acg ata acc aac att ggc cat gca cgg ttg aag 1140
Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu Lys
310 315 320
gaa tcc gac cgc atc tcg gcg atg gaa acc aac ctg cga acg ctc ggt 1188
Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu Gly
325 330 335
gta caa acc gac gtc gga cac gac tgg atg cga atc tac ccc tct acc 1236
Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser Thr
340 345 350
ccg cac ggc ggc aga gtc aat tgc cac cgg gac cac agg atc gcc atg 1284
Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala Met
355 360 365
gcg ttt tca atc ctg gga ctg cga gtg gac ggg att acc ctc gac gac 1332
Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp Asp
370 375 380 385
cct caa tgt gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt gga 1380
Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu Gly
390 395 400
cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag tgacttcctc 1429
Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly*
405 410
tccggcggac gctaggcatc ggaaaacgaa tcctgacatg accgacctcc tcgcgtcacg 1489
gcgtgtctgc cggtacccaa gcattctgcc ttagccgctt ccgcggcccc ttatgctttc 1549
tggttgtcca gattttcatc cgggatgttg cctgaccttg agcagggcaa tcagctgttc 1609
agcactgtca atggtgtggg ccctgaaggc ggcttcgatg gctgccacgt cggcggctct 1669
catcgctgtc acgacacgca gatgcgcttc ataggcacgt tcaggatccg ccctcgtcgc 1729
ctgatcctga gccaaggcaa tagttagatg tgcctccgtt ggcggccaga gccgaagcaa 1789
taaggagttt tncgaggcca cccagattcc ccgggtggaa ggcgatatgg gcttcatgct 1849
gaactatggg gtccggatgg aagtgacttt tcaactctgc cca 1892
<210>4
<211>413
<212>PRT
<213>球形节杆菌
<400>4
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410
<210>5
<211>1242
<212>DNA
<213>未知
<220>
<223>从土壤样品中分离的
<221>CDS
<222>(1)...(1242)
<400>5
atg gaa act gat cga cta gtg atc cca gga tcg aaa agc atc acc aac 48
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
cgg gct ttg ctt ttg gct gcc gca gcg aag ggc gcg tcg gtc ctg gtg 96
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Ala Ser Val Leu Val
20 25 30
aga cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca att cag 144
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
gcc ctc ggt gcc aac gtc tca gcg gac ggt gat gat tgg gtc gtt gaa 192
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu
50 55 60
ggc ctg ggc cag gca ccc aac ctc gac gcc gac atc tgg tgc gag gat 240
Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
gcc ggt acc gtg gcc cgg ttc ctc cct cca ttc gtc gcc gca gga cag 288
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
ggg aag ttc acc gtc gac gga agc gag cag ctg cgg cgg cgc ccg ctt 336
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
cgg ccc gtg gtc gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc 384
Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
gag cag ctg ccc cta acg att gaa gcg agc ggg ctg gca ggc ggg gag 432
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
tac gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggt ctg atc 480
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
atg gcc gcc ccg tac gcg cga caa ggc ctg cgt gtt cgg ata cca aat 528
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
ccc gtg agc cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
ttc ggc att gag acc agc acc gac gga gcg acc gtc agc gtt cct ccc 624
Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
ggg cgc tac aca gcg cgg cgg tat gag att gaa ccg gac gcg tca act 672
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc cgg cgc ttc gaa 720
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu
225 230 235 240
ttc cag ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttc ttc 768
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
aat gta ctt ggg cgg ctc ggc gca gag gtc cac tgg gca tcc aac tcg 816
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser
260 265 270
gtc acc ata tcc gga ccg gaa agg ctg acc ggc gac att gaa gtg gat 864
Val Thr Ile Ser Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp
275 280 285
atg ggc gag ata tcg gac acc ttc atg aca ctg gcg gcg att gcc cct 912
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
cta gcc gat gga ccc atc acg ata aca aac att ggc cat gca cgg ttg 960
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
aag gaa tcc gac cgc atc tcg gcg atg gaa agc aac ctt cga atg ctc 1008
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Met Leu
325 330 335
ggt gta caa acc gac gtc gga cac gac tgg atg cga atc tac ccc tct 1056
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
acc ccg cac ggc ggc aga gtc aat tgc cac cgg gac cac agg atc gcc 1104
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
atg gcg ttt tca atc ctg gga ctg cga gtg gac ggg att acc ctc gac 1152
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
gac cct caa tgt gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
gga cgc ctt ttc ccg gaa aag gcg ctt acg ctc ccc ggc tag 1242
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly*
405 410
<210>6
<211>413
<212>PRT
<213>未知
<220>
<223>从土壤样品中分离的
<400>6
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Ala Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser
260 265 270
Val Thr Ile Ser Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Met Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410
<210>7
<211>446
<212>PRT
<213>克劳氏芽孢杆菌
<400>7
Met Val Gln Phe Asp Ser Gln Ala Arg Ser Pro Trp Thr Pro Leu Ala
1 5 10 15
Gly Val Glu Arg Leu Arg Leu Thr Pro Ser Gln Lys Arg Ile Asn Ala
20 25 30
Thr Leu Glu Val Pro Gly Ser Lys Ser Ala Thr Asn Arg Ala Leu Leu
35 40 45
Leu Ala Ala Val Ala Ser Gly Thr Ser Thr Leu Arg Asn Ala Leu Lys
50 55 60
Ser Asp Asp Thr Tyr Trp Cys Ile Glu Ala Leu Lys Lys Thr Gly Val
65 70 75 80
Glu Ile Ala Val Asp Gly Ser Asn Val Thr Val Tyr Gly Arg Gly Gly
85 90 95
Val Phe His Ser Gly Ser Leu Tyr Ile Gly Ser Ala Gly Thr Ala Gly
100 105 110
Arg Phe Leu Pro Gly Met Leu Ala Ala Ala Thr Gly Asn Trp His Val
115 120 125
Glu Ala Ser His Ser Met Asn Lys Arg Pro Ile Ala Pro Leu Val Lys
130 135 140
Thr Leu Gln Ala Leu Gly Ala Asn Ile Gln Tyr Gly Ser Arg Arg Gly
145 150 155 160
His Tyr Pro Leu Ser Ile Ser Gly Glu Gly Leu Asn Gly Gly Lys Val
165 170 175
Asn Met Ser Gly Gln Leu Ser Ser Gln Phe Ile Ser Gly Cys Leu Leu
180 185 190
Ala Ala Pro Leu Ala Lys Asn Pro Val Ser Ile Thr Val Lys Asp Gly
195 200 205
Ile Val Gln Gln Ala Tyr Val Arg Ile Thr Ile Asp Leu Met Ala Ala
210 215 220
Phe Gly Val Glu Val Lys Ala Ala Pro Asp Trp Ser Leu Leu Glu Val
225 230 235 240
Asn Pro Ser Pro Tyr Val Ala Asn Asp Ile Ala Ile Glu Ala Asp Ala
245 250 255
Ser Thr Ala Cys Tyr Phe Leu Ala Leu Ala Ala Ile Thr Ala Gly Lys
260 265 270
Ile Arg Ile Arg His Phe Ser Thr Lys Thr Ser Gln Pro Asp Ile Leu
275 280 285
Phe Val Ser Ile Leu Lys Arg Met Gly Cys Asn Phe Glu Ile Gly Pro
290 295 300
Ser Phe Val Glu Gly Glu Gly Pro Thr Arg Leu Arg Gly Gly Phe Thr
305 310 315 320
Val Asn Met Asn Glu Leu Ser Asp Gln Ala Leu Thr Leu Ala Ala Ile
325 330 335
Ser Pro Phe Ala Asp Gly Pro Ile Ala Ile Glu Gly Val Gly His Ile
340 345 350
Arg His His Glu Cys Asp Arg Ile Arg Ala Ile Cys Thr Glu Leu Ser
355 360 365
Arg Leu Gly Ile Arg Val Glu Glu Arg His Asp Gly Leu Thr Val Tyr
370 375 380
Pro Gly Gln Pro Lys Pro Thr Val Val Asn Thr Tyr Asp Asp His Arg
385 390 395 400
Met Ala Met Ala Leu Ala Leu Ile Gly Ala Lys Val Asp Gly Ile Glu
405 410 415
Leu Asp Asp Pro Gly Cys Val Ala Lys Thr Cys Pro Ser Tyr Phe Ser
420 425 430
Met Leu Ala Gln Thr Gly Ile Gly Val Lys Ala Val Ser Pro
435 440 445
<210>8
<211>447
<212>PRT
<213>嗜木聚糖红色杆菌
<400>8
Met Ser Gly Val Ser Gly Val Pro Gly Val Asp Phe Gly Ile Glu Glu
1 5 10 15
Val Arg Gly Ser Phe Pro Glu Glu Met Glu Val Ala Pro Leu Glu Arg
20 25 30
Pro Pro Asp Ala Thr Val Arg Leu Pro Gly Ser Lys Ser Ile Thr Asn
35 40 45
Arg Ala Leu Leu Val Ala Ala Leu Ala Gly Gly Thr Ser Arg Ile Glu
50 55 60
Asn Pro Leu Leu Ala Asp Asp Pro Phe Trp Leu Met Asn Ala Leu Val
65 70 75 80
Gly Leu Gly Phe Gly Val Arg Val Gly Glu Glu Gly Ala Val Glu Val
85 90 95
Ala Gly Gly Gly Gly Gly Ile Pro Ala Pro Ser Ala Asp Val Phe Val
100 105 110
Gly Asn Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Ala Leu Ala Leu
115 120 125
Gly Ser Gly Pro Tyr Arg Val Asp Gly Thr Pro Arg Met Arg Glu Arg
130 135 140
Pro Val Ala Glu Leu Val Glu Ala Leu Arg Ala Leu Gly Ala Arg Val
145 150 155 160
Glu Cys Glu Glu Arg Glu Gly His Leu Pro Leu Val Val Arg Gly Gly
165 170 175
Ala Arg Gly Gly Gly Glu Ile Ser Val Ser Gly Glu Arg Ser Ser Gln
180 185 190
Phe Leu Ser Gly Leu Leu Ile Ser Ala Pro Cys Leu Pro Gly Gly Leu
195 200 205
Thr Val Arg Pro Arg Gly Ala Leu Val Ser Arg Pro Tyr Val Asp Ile
210 215 220
Thr Val Arg Val Met Arg Ser Phe Gly Ala Ser Val Glu Glu Glu Pro
225 230 235 240
Ser Gly Ala Ala Phe Arg Val Ala Pro Gly Ala Tyr Arg Ala Thr Ala
245 250 255
Tyr Arg Val Glu Pro Asp Ala Ser Ala Ala Ser Tyr Phe Leu Ala Ala
260 265 270
Ala Ala Leu Thr Ala Gly Arg Val Val Ile Pro Gly Leu Gly Arg Ser
275 280 285
Ser Leu Gln Gly Asp Val Ala Phe Ala Gly Ile Leu Arg Arg Met Gly
290 295 300
Cys Arg Val Ser Leu Ser Glu Asp Arg Ile Glu Leu Ala Gly Pro Pro
305 310 315 320
Arg Leu Arg Gly Val Glu Ala Asp Met Asn Ala Ile Ser Asp Thr Met
325 330 335
Met Thr Leu Ala Ala Ile Ala Pro Phe Ala Ser Ser Pro Thr Leu Ile
340 345 350
Lys Asn Val Ala His Thr Arg Leu Gln Glu Thr Asp Arg Leu Ala Ala
355 360 365
Val Ala Ala Glu Leu Ser Arg Leu Gly Val Arg Val His Glu Thr Pro
370 375 380
Asp Ser Leu Arg Ile Ile Pro Gly Lys Val Arg Pro Ala Ala Ile Arg
385 390 395 400
Thr Tyr Gly Asp His Arg Met Ala Met Ala Phe Ser Leu Val Gly Leu
405 410 415
Arg Val Arg Gly Val Arg Ile Leu Asp Pro Gly Cys Val Thr Lys Thr
420 425 430
Leu Pro Gly Tyr Phe Arg Leu Leu Glu Gly Leu Arg Arg Gly Gly
435 440 445
<210>9
<211>444
<212>PRT
<213>玉蜀黍
<400>9
Ala GlyAla Glu Glu Ile Val Leu Gln Pro Ile Lys Glu Ile Ser Gly
1 5 10 15
Thr Val Lys Leu Pro Gly Ser Lys Ser Leu Ser Asn Arg Ile Leu Leu
20 25 30
Leu Ala Ala Leu Ser Glu Gly Thr Thr Val Val Asp Asn Leu Leu Asn
35 40 45
Ser Glu Asp Val His Tyr Met Leu Gly Ala Leu Arg Thr Leu Gly Leu
50 55 60
Ser Val Glu Ala Asp Lys Ala Ala Lys Arg Ala Val Val Val Gly Cys
65 70 75 80
Gly Gly Lys Phe Pro Val Glu Asp Ala Lys Glu Glu Val Gln Leu Phe
85 90 95
Leu Gly Asn Ala Gly Thr Ala Met Arg Pro Leu Thr Ala Ala Val Thr
100 105 110
Ala Ala Gly Gly Asn Ala Thr Tyr yal Leu Asp Gly Val Pro Arg Met
115 120 125
Arg Glu Arg Pro Ile Gly Asp Leu Val Val Gly Leu Lys Gln Leu Gly
130 135 140
Ala Asp Val Asp Cys Phe Leu Gly Thr Asp Cys Pro Pro Val Arg Val
145 150 155 160
Asn Gly Ile Gly Gly Leu Pro Gly Gly Lys Val Lys Leu Ser Gly Ser
165 170 175
Ile Ser Ser Gln Tyr Leu Ser Ala Leu Leu Met Ala Ala Pro Leu Ala
180 185 190
Leu Gly Asp Val Glu Ile Glu Ile Ile Asp Lys Leu Ile Ser Ile Pro
195 200 205
Tyr Val Glu Met Thr Leu Arg Leu Met Glu Arg Phe Gly Val Lys Ala
210 215 220
Glu His Ser Asp Ser Trp Asp Arg Phe Tyr Ile Lys Gly Gly Gln Lys
225 230 235 240
Tyr Lys Ser Pro Lys Asn Ala Tyr Val Glu Gly Asp Ala Ser Ser Ala
245 250 255
Ser Tyr Phe Leu Ala Gly Ala Ala Ile Thr Gly Gly Thr Val Thr Val
260 265 270
Glu Gly Cys Gly Thr Thr Ser Leu Gln Gly Asp Val Lys Phe Ala Glu
275 280 285
Val Leu Glu Met Met Gly Ala Lys Val Thr Trp Thr Glu Thr Ser Val
290 295 300
Thr Val Thr Gly Pro Pro Arg Glu Pro Phe Gly Arg Lys His Leu Lys
305 310 315 320
Ala Ile Asp Val Asn Met Asn Lys Met Pro Asp Val Ala Met Thr Leu
325 330 335
Ala Val Val Ala Leu Phe Ala Asp Gly Pro Thr Ala Ile Arg Asp Val
340 345 350
Ala Ser Trp Arg Val Lys Glu Thr Glu Arg Met Val Ala Ile Arg Thr
355 360 365
Glu Leu Thr Lys Leu Gly Ala Ser Val Glu Glu Gly Pro Asp Tyr Cys
370 375 380
Ile Ile Thr Pro Pro Glu Lys Leu Asn Val Thr Ala Ile Asp Thr Tyr
385 390 395 400
Asp Asp His Arg Met Ala Met Ala Phe Ser Leu Ala Ala Cys Ala Glu
405 410 415
Val Pro Val Thr Ile Arg Asp Pro Gly Cys Thr Arg Lys Thr Phe Pro
420 425 430
Asp Tyr Phe Asp Val Leu Ser Thr Phe Val Lys Asn
435 440
<210>10
<211>455
<212>PRT
<213>土壤杆菌属物种
<400>10
Met Ser His Gly Ala Ser Ser Arg Pro Ala Thr Ala Arg Lys Ser Ser
1 5 10 15
Gly Leu Ser Gly Thr Val Arg Ile Pro Gly Asp Lys Ser Ile Ser His
20 25 30
Arg Ser Phe Met Phe Gly Gly Leu Ala Ser Gly Glu Thr Arg Ile Thr
35 40 45
Gly Leu Leu Glu Gly Glu Asp Val Ile Asn Thr Gly Lys Ala Met Gln
50 55 60
Ala Met Gly Ala Arg Ile Arg Lys Glu Gly Asp Thr Trp Ile Ile Asp
65 70 75 80
Gly Val Gly Asn Gly Gly Leu Leu Ala Pro Glu Ala Pro Leu Asp Phe
85 90 95
Gly Asn Ala Ala Thr Gly Cys Arg Leu Thr Met Gly Leu Val Gly Val
100 105 110
Tyr Asp Phe Asp Ser Thr Phe Ile Gly Asp Ala Ser Leu Thr Lys Arg
115 120 125
Pro Met Gly Arg Val Leu Asn Pro Leu Arg Glu Met Gly Val Gln Val
130 135 140
Lys Ser Glu Asp Gly Asp Arg Leu Pro Val Thr Leu Arg Gly Pro Lys
145 150 155 160
Thr Pro Thr Pro Ile Thr Tyr Arg Val Pro Met Ala Ser Ala Gln Val
165 170 175
Lys Ser Ala Val Leu Leu Ala Gly Leu Asn Thr Pro Gly Ile Thr Thr
180 185 190
Val Ile Glu Pro Ile Met Thr Arg Asp His Thr Glu Lys Met Leu Gln
195 200 205
Gly Phe Gly Ala Asn Leu Thr Val Glu Thr Asp Ala Asp Gly Val Arg
210 215 220
Thr Ile Arg Leu Glu Gly Arg Gly Lys Leu Thr Gly Gln Val Ile Asp
225 230 235 240
Val Pro Gly Asp Pro Ser Ser Thr Ala Phe Pro Leu Val Ala Ala Leu
245 250 255
Leu Val Pro Gly Ser Asp Val Thr Ile Leu Asn Val Leu Met Asn Pro
260 265 270
Thr Arg Thr Gly Leu Ile Leu Thr Leu Gln Glu Met Gly Ala Asp Ile
275 280 285
Glu Val Ile Asn Pro Arg Leu Ala Gly Gly Glu Asp Val Ala Asp Leu
290 295 300
Arg Val Arg Ser Ser Thr Leu Lys Gly Val Thr Val Pro Glu Asp Arg
305 310 315 320
Ala Pro Ser Met Ile Asp Glu Tyr Pro Ile Leu Ala Val Ala Ala Ala
325 330 335
Phe Ala Glu Gly Ala Thr Val Met Asn Gly Leu Glu Glu Leu Arg Val
340 345 350
Lys Glu Ser Asp Arg Leu Ser Ala Val Ala Asn Gly Leu Lys Leu Asn
355 360 365
Gly Val Asp Cys Asp Glu Gly Glu Thr Ser Leu Val Val Arg Gly Arg
370 375 380
Pro Asp Gly Lys Gly Leu Gly Asn Ala Ser Gly Ala Ala Val Ala Thr
385 390 395 400
His Leu Asp His Arg Ile Ala Met Ser Phe Leu Val Met Gly Leu Val
405 410 415
Ser Glu Asn Pro Val Thr Val Asp Asp Ala Thr Met Ile Ala Thr Ser
420 425 430
Phe Pro Glu Phe Met Asp Leu Met Ala Gly Leu Gly Ala Lys Ile Glu
435 440 445
Leu Ser Asp Thr Lys Ala Ala
450 455
<210>11
<211>427
<212>PRT
<213>大肠杆菌
<400>11
Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile
1 5 10 15
Asn Leu Pro Gly Ser Lys Thr Val Ser Asn Arg Ala Leu Leu Leu Ala
20 25 30
Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp
35 40 45
Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr
50 55 60
Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly
65 70 75 80
Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly
85 90 95
Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp
100 105 110
Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His
115 120 125
Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu
130 135 140
Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly
145 150 155 160
Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu
165 170 175
Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys
180 185 190
Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met
195 200 205
Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val
210 215 220
Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu
225 230 235 240
Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys
245 250 255
Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly
260 265 270
Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys
275 280 285
Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile
290 295 300
Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr
305 310 315 320
Ala Ala Leu Phe Ala Lys Gly Thr Thr Arg Leu Arg Asn Ile Tyr Asn
325 330 335
Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu
340 345 350
Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile
355 360 365
Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp
370 375 380
His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro
385 390 395 400
Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr
405 410 415
Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala
420 425
<210>12
<211>1242
<212>DNA
<213>人工序列
<220>
<223>合成的grg23
<221>CDS
<222>(1)...(1242)
<400>12
atg gaa act gat cgc ctt gtg atc cca gga tcg aaa agc atc acc aac 48
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
cgg gct ttg ctt ttg gct gcc gca gcg aag ggc acg tcg gtc ctg gtg 96
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
aga cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca atc cag 144
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
gcc ctc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa 192
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
ggc ctg ggt cag gca ccc cac ctc gac gcc gac atc tgg tgc gag gac 240
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
gca ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gca ggt cag 288
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
ggg aag ttc acc gtc gac gga tca gag cag ctg cgg cgg cgc ccg ctt 336
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
cgg ccc ctg gtc gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc 384
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
gag cag ctg ccc ctt aca att gaa gcg agc ggg ctg gca ggc ggg gag 432
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
tac gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggc ctg atc 480
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
ccc gtg tca cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
ttc ggc ctt gag acc agc acc gac gga gcc acc gtc agc gtc cct cca 624
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
ggg cgc tac aca gcc cgg cgg tat gaa ata gaa ccg gat gcg tca act 672
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc agg agc ttc gaa 720
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
ttt caa ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttc ttc 768
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
aat gta ctt ggg cgg ctc ggt gcg gag gtc cac tgg gca ccc aac tcg 816
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
gtc acc ata tct gga ccg gaa agg ctg aac ggc gac att gaa gtg gat 864
Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
atg ggc gag att tcg gac acc ttc atg aca ctc gcg gcg att gcc cct 912
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
ttg gcc gat gga ccc atc acg ata acc aac att ggt cat gca cgg ttg 960
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
aag gaa tcc gac cgc atc tca gcg atg gaa acc aac ctg cgc acg ctc 1008
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
ggt gta caa acc gac gtc gga cac gac tgg atg aga atc tac ccc tct 1056
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
acc ccg cac ggc ggt aga gtg aat tgc cac cgg gac cac agg atc gct 1104
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
atg gcg ttt tca atc ctg gga ctg aga gtg gac ggg att acc ctc gac 1152
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly*
405 410
<210>13
<211>413
<212>PRT
<213>人工序列
<220>
<223>合成的grg23
<400>13
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr yal Ser Val Pro Pro
195 200 205
Gly Arg Tyr Thr Ala Arg Arg Tyr GluIle Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410
<210>14
<211>1242
<212>DNA
<213>人工序列
<220>
<223>grg23(ace1)
<221>CDS
<222>(1)...(1242)
<400>14
atg gaa act gat cgc ctt gtg atc cca gga tcg aaa agc atc acc aac 48
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
cgg gct ttg ctt ttg gct gcc gca gcg aag ggc acg tcg gtc ctg gtg 96
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
aga cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca atc cag 144
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
acc ctc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa 192
Thr Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
ggc ctg ggt cag gca ccc cac ctc gac gcc gac atc tgg tgc gag gac 240
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
gca ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gca ggt cag 288
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
ggg aag ttc acc gtc gac gga tca gag cag ctg cgg cgg cgc ccg ctt 336
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
cgg ccc ctg gtc gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc 384
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
gag cag ctg ccc ctt aca att gaa gcg agc ggg ctg gca ggc ggg gag 432
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
tac gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggc ctg atc 480
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
ccc gtg tca cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
ttc ggc ctt gag acc agc acc gac gga gcc acc gtc agc gtc cct cca 624
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
ggg cgc tac aca gcc cgg cgg tat gaa ata gaa ccg gat gcg tca act 672
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc agg agc ttc gaa 720
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
ttt caa ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttc ttc 768
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
aat gta ctt ggg cgg ctc ggt gcg gag gtc cac tgg gca ccc aac tcg 816
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
gtc acc ata act gga ccg gaa agg ctg aac ggc gac att gaa gtg gat 864
Val Thr Ile Thr Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
atg ggc gag att tcg gac acc ttc atg aca ctc gcg gcg att gcc cct 912
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
ttg gcc gat gga ccc atc acg ata acc aac att ggt cat gca cgg ttg 960
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
aag gaa tcc gac cgc atc tca gcg atg gaa acc aac ctg cgc acg ctc 1008
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
ggt gta caa acc gac gtc gga cac gac tgg atg aga atc tac ccc tct 1056
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
acc ccg cac ggc ggt aga gtg aat tgc cac cgg gac cac agg atc gct 1104
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
atg gcg ttt tca atc ctg gga ctg aga gtg gac ggg att acc ctc gac 1152
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly *
405 410
<210>15
<211>413
<212>PRT
<213>人工序列
<220>
<223>grg23(ace1)
<400>15
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Thr Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
Val Thr Ile Thr Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410
<210>16
<211>1242
<212>DNA
<213>人工序列
<220>
<223>grg23(ace2)
<221>CDS
<222>(1)...(1242)
<400>16
atg gaa act gat cgc ctt gtg atc cca gga tcg aaa agc atc acc aac 48
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
cgg gct ttg ctt ttg gct gcc gca gcg aag ggc acg tcg gtc ctg gtg 96
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
aga cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca atc cag 144
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
gcc ctc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa 192
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
ggc ctg ggt cag gca ccc cac ctc gac gcc gac atc tgg tgc gag gac 240
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
gca ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gca ggt cag 288
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
ggg aag ttc acc gtc gac gga tca gag cag ctg cgg cgg cgc ccg ctt 336
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
cgg ccc ctg gtc gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc 384
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
gag cag ctg ccc ctt aca att gaa gcg agc ggg ctg gca ggc ggg gag 432
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
tac gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggc ctg atc 480
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
ccc gtg tca cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
ttc ggc ctt gag acc agc acc gac gga gcc acc gtc agc gtc cct cca 624
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
ggg cgc tac aca gcc cgg cgg tat gaa ata gaa ccg gat gcg tca act 672
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc agg agc ttc gaa 720
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
ttt caa ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttc ttc 768
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
aat gta ctt ggg cgg ctc ggt gcg gag gtc cac tgg gca ccc aac tcg 816
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
gtc acc ata cgg gga ccg gaa agg ctg aac ggc gac att gaa gtg gat 864
Val Thr Ile Arg Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
atg ggc gag att tcg gac acc ttc atg aca ctc gcg gcg att gcc cct 912
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
ttg gcc gat gga ccc atc acg ata acc aac att ggt cat gca cgg ttg 960
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
aag gaa tcc gac cgc atc tca gcg atg gaa acc aac ctg cgc acg ctc 1008
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
ggt gta caa acc gac gtc gga cac gac tgg atg aga atc tac ccc tct 1056
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
acc ccg cac ggc ggt aga gtg aat tgc cac cgg gac cac agg atc gct 1104
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
atg gcg ttt tca atc ctg gga ctg aga gtg gac ggg att acc ctc gac 1152
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly *
405 410
<210>17
<211>413
<212>PRT
<213>人工序列
<220>
<223>grg23(ace2)
<400>17
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
Val Thr Ile Arg Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410
<210>18
<211>1242
<212>DNA
<213>人工序列
<220>
<223>grg51.4
<221>CDS
<222>(1)...(1242)
<400>18
atg gaa act gat cga cta gtg atc cca gga tcg aaa agc atc acc aac 48
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
cgg gct ttg ctt ttg gct gcc gca gcg aag ggc acg tcg gtc ctg gtg 96
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
aga cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca att cag 144
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
gcc ctc ggt gcc aac gtc tca gcg gac ggt gat gat tgg gtc gtt gaa 192
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu
50 55 60
ggc ctg ggc cag gca ccc aac ctc gac gcc gac atc tgg tgc gag gat 240
Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
gcc ggt acc gtg gcc cgg ttc ctc cct cca ttc gtc gcc gca gga cag 288
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
ggg aag ttc acc gtc gac gga agc gag cag ctg cgg cgg cgc ccg ctt 336
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
cgg ccc gtg gtc gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc 384
Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
gag cag ctg ccc cta acg att gaa gcg agc ggg ctg gca ggc ggg gag 432
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
tac gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggt ctg atc 480
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
atg gcc gcc ccg tac gcg cga caa ggc ctg cgt gtt cgg ata cca aat 528
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
ccc gtg agc cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
ttc ggc att gag acc agc acc gac gga gcg acc gtc agc gtt cct ccc 624
Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
ggg cgc tac aca gcg cgg cgg tat gag att gaa ccg gac gcg tca act 672
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc cgg cgc ttc gaa 720
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu
225 230 235 240
ttc cag ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttc ttc 768
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
aat gta ctt ggg cgg ctc ggc gca gag gtc cac tgg gca tcc aac tcg 816
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser
260 265 270
gtc acc ata cgc gga ccg gaa agg ctg acc ggc gac att gaa gtg gat 864
Val Thr Ile Arg Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp
275 280 285
atg ggc gag ata tcg gac acc ttc atg aca ctg gcg gcg att gcc cct 912
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
cta gcc gat gga ccc atc acg ata aca aac att ggc cat gca cgg ttg 960
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
aag gaa tcc gac cgc atc tcg gcg atg gaa agc aac ctt cga acg ctc 1008
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Thr Leu
325 330 335
ggt gta caa acc gac gtc gga cac gac tgg atg cga atc tac ccc tct 1056
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
acc ccg cac ggc ggc aga gtc aat tgc cac cgg gac cac agg atc gcc 1104
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
atg gcg ttt tca atc ctg gga ctg cga gtg gac ggg att acc ctc gac 1152
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
gac cct caa tgt gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
gga cgc ctt ttc ccg gaa aag gcg ctt acg ctc ccc ggc tag 1242
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly *
405 410
<210>19
<211>413
<212>PRT
<213>人工序列
<220>
<223>grg51.4
<400>19
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser
260 265 270
Val Thr Ile Arg Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Thr Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410
<210>20
<211>1242
<212>DNA
<213>人工序列
<220>
<223>grg23(ace3)
<221>CDS
<222>(1)...(1242)
<400>20
atg gaa act gat cgc ctt gtg atc cca gga tcg aaa agc atc acc aac 48
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
cgg gct ttg ctt ttg gct gcc gca gcg aag ggc acg tcg gtc ctg gtg 96
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
aga cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca atc cag 144
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
gcc ctc ggt gcc aac gtc tca gcc gac ggt gac gat tgg gtc gtt gaa 192
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu
50 55 60
ggc ctg ggt cag gca ccc aac ctc gac gcc gac atc tgg tgc gag gac 240
Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
gca ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gca ggt cag 288
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
ggg aag ttc acc gtc gac gga tca gag cag ctg cgg cgg cgc ccg ctt 336
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
cgg ccc gtg gtc gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc 384
Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
gag cag ctg ccc ctt aca att gaa gcg agc ggg ctg gca ggc ggg gag 432
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
tac gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggc ctg atc 480
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
ccc gtg tca cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
ttc ggc att gag acc agc acc gac gga gcc acc gtc agc gtc cct cca 624
Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
ggg cgc tac aca gcc cgg cgg tat gaa ata gaa ccg gat gcg tca act 672
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc agg cgc ttc gaa 720
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu
225 230 235 240
ttt caa ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttc ttc 768
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
aat gta ctt ggg cgg ctc ggt gcg gag gtc cac tgg gca tcc aac tcg 816
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser
260 265 270
gtc acc ata cgt gga ccg gaa agg ctg acc ggc gac att gaa gtg gat 864
Val Thr Ile Arg Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp
275 280 285
atg ggc gag att tcg gac acc ttc atg aca ctc gcg gcg att gcc cct 912
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
ttg gcc gat gga ccc atc acg ata acc aac att ggt cat gca cgg ttg 960
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
aag gaa tcc gac cgc atc tca gcg atg gaa agc aac ctg cgc acg ctc 1008
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Thr Leu
325 330 335
ggt gta caa acc gac gtc gga cac gac tgg atg aga atc tac ccc tct 1056
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
acc ccg cac ggc ggt aga gtg aat tgc cac cgg gac cac agg atc gct 1104
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
atg gcg ttt tca atc ctg gga ctg aga gtg gac ggg att acc ctc gac 1152
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly *
405 410
<210>21
<211>413
<212>PRT
<213>人工序列
<220>
<223>grg23(ace3)
<400>21
Met Glu Thr Asp Arg Leu ValIle Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser
260 265 270
Val Thr Ile Arg Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Thr Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410
<210>22
<211>1242
<212>DNA
<213>人工序列
<220>
<223>grg23(L5P2.J2)
<221>CDS
<222>(1)...(1242)
<400>22
atg gaa act gat cgc ctt gtg atc cca gga tcg aaa agc atc acc aac 48
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
cgg gct ttg ctt ttg gct gcc gca gcg aag ggc acg tcg gtc ctg gtg 96
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
aga cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca atc cag 144
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
acc ctc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa 192
Thr Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
ggc ctg ggt cag gca ccc cac ctc gac gcc gac atc tgg tgc gag gac 240
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
gca ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gca ggt cag 288
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
ggg aag ttc acc ttc gac gga tca gag cag ctg cgg cgg cgc ccg ctt 336
Gly Lys Phe Thr Phe Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
cgg ccc ctg gtc gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc 384
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
gag cag ctg ccc ctt aca att gaa gcg agt ggg ctg gca ggc ggg gag 432
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
tac gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggc ctg atc 480
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
ccc gtg tca cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
ttc ggc ctt gag acc agc acc gac gga gcc acc gtc agc gtc cct cca 624
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
ggg cgc tac aca tcc cgg cgg tat gaa ata gaa ccg gat gcg tca act 672
Gly Arg Tyr Thr Ser Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc agg agc ttc gaa 720
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
ttt caa ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttc ttc 768
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
aat gta ctt ggg cgg ctc ggt gcg gag gtc cac tgg gca ccc aac tcg 816
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
gtc acc ata act gga ccg gaa agg ctg aac ggc aac att gaa gtg gat 864
Val Thr Ile Thr Gly Pro Glu Arg Leu Asn Gly Asn Ile Glu Val Asp
275 280 285
atg ggc gag att tcg gac acc ttc atg aca ctc gcg gcg att gcc cct 912
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
ttg gcc gat gga ccc atc acg ata acc aac att ggt cat gca cgg ttg 960
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
aag gaa tcc gac cgc atc tca gcg atg gaa acc aac ctg cgc acg ctc 1008
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
ggt gta caa acc gac gtc gga cac gac tgg atg aga atc tac ccc tct 1056
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
acc ccg cac ggc ggt aga gtg aat tgc cac cgg gac cac agg atc gct 1104
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
atg gcg ttt tca atc ctg gga ctg aga gtg gac ggg att acc ctc gac 1152
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly *
405 410
<210>23
<211>413
<212>PRT
<213>人工序列
<220>
<223>grg23(L5P2.J2)
<400>23
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Thr Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Phe Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
Gly Arg Tyr Thr Ser Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
Val Thr Ile Thr Gly Pro Glu Arg Leu Asn Gly Asn Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410
<210>24
<211>1242
<212>DNA
<213>人工序列
<220>
<223>grg23(ace4)
<221>CDS
<222>(1)...(1242)
<400>24
atg gaa act gat cgc ctt gtg atc cca gga tcg aaa agc atc acc aac 48
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
cgg gct ttg ctt ttg gct gcc gca gcg aag ggc acg tcg gtc ctg gtg 96
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
aga cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca atc cag 144
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
gcc ctc ggt gcc aac gtc tca gcc gac ggt gac gat tgg gtc gtt gaa 192
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu
50 55 60
ggc ctg ggt cag gca ccc aac ctc gac gcc gac atc tgg tgc gag gac 240
Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
gca ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gca ggt cag 288
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
ggg aag ttc acc ttc gac gga tca gag cag ctg cgg cgg cgc ccg ctt 336
Gly Lys Phe Thr Phe Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
cgg ccc gtg gtc gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc 384
Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
gag cag ctg ccc ctt aca att gaa gcg agc ggg ctg gca ggc ggg gag 432
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
tac gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggc ctg atc 480
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
ccc gtg tca cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
ttc ggc att gag acc agc acc gac gga gcc acc gtc agc gtc cct cca 624
Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
ggg cgc tac aca gcc cgg cgg tat gaa ata gaa ccg gat gcg tca act 672
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc agg cgc ttc gaa 720
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu
225 230 235 240
ttt caa ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttc ttc 768
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
aat gta ctt ggg cgg ctc ggt gcg gag gtc cac tgg gca tcc aac tcg 816
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser
260 265 270
gtc acc ata cgg gga ccg gaa agg ctg acc ggc gac att gaa gtg gat 864
Val Thr Ile Arg Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp
275 280 285
atg ggc gag att tcg gac acc ttc atg aca ctc gcg gcg att gcc cct 912
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
ttg gcc gat gga ccc atc acg ata acc aac att ggt cat gca cgg ttg 960
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
aag gaa tcc gac cgc atc tca gcg atg gaa agc aac ctg cgc acg ctc 1008
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Thr Leu
325 330 335
ggt gta caa acc gac gtc gga cac gac tgg atg aga atc tac ccc tct 1056
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
acc ccg cac ggc ggt aga gtg aat tgc cac cgg gac cac agg atc gct 1104
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
atg gcg ttt tca atc ctg gga ctg aga gtg gac ggg att acc ctc gac 1152
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly*
405 410
<210>25
<211>413
<212>PRT
<213>人工序列
<220>
<223>grg23(ace4)
<400>25
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asp Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro Asn Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Phe Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Val Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Ile Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Arg Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Ser Asn Ser
260 265 270
Val Thr Ile Arg Gly Pro Glu Arg Leu Thr Gly Asp Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Ser Asn Leu Arg Thr Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410
<210>26
<211>1244
<212>DNA
<213>人工序列
<220>
<223>grg23(L3P1.B20)
<221>CDS
<222>(1)...(1242)
<400>26
atg gaa act gat cgc ctt gtg atc cca gga tcg aaa agc atc acc aac 48
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
cgg gct ttg ctt ttg gct gcc gca gcg aag ggc acg tcg gtc ctg gtg 96
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
aga cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca atc cag 144
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
gcc ctc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa 192
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
ggc ctg ggt cag gca ccc cac ctc gac gcc gac atc tgg tgc gag gac 240
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
gca ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gca ggt cag 288
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
ggg aag ttc acc gtc gac gga tca gag cag ttg cgg cgg cgc ccg ctt 336
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
cgg ccc ctg gtt gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc 384
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
gag cag ctg ccc ctt aca att gaa gcg agc ggg ctg gca ggc ggg gag 432
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
tac gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggc ctg atc 480
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
ccc gtg tca cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
ttc ggc ctt gag acc agc acc gac gga gcc acc gtc agc atc cct cca 624
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Ile Pro Pro
195 200 205
ggg cgc tac aca gcc cgg cgg tat gaa ata gaa ccg gat gcg tca act 672
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc agg agc ttc gaa 720
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
ttt caa ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttc ttc 768
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
aat gta ctt ggg cgg ctc ggt gcg gag gtc cac tgg gca ccc aac tcg 816
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
gtc acc ata tct gga ccg gaa agg ctg aac ggc gac att gaa gtg gat 864
Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
atg ggc gag att tcg gac acc ttc atg aca ctc gcg gcg att gcc cct 912
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
ttg gcc gat gga ccc atc acg ata acc aac att ggt cat gca cgg ttg 960
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
aag gaa tcc gac cgc atc tca gcg atg gaa acc aac ctg cgc acg ctc 1008
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
ggt gta caa acc gac gtc gga cac gac tgg atg aga atc tac ccc tct 1056
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
acc ccg cac ggc ggt aga gtg aat tgc cac cgg gac cac agg atc gct 1104
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
atg gcg ttt tca atc ctg gga ctg aga gtg gac ggg att acc ctc gac 1152
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly*
405 410
gg 1244
<210>27
<211>413
<212>PRT
<213>人工序列
<220>
<223>grg23(L3P1.B20)
<400>27
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Ile Pro Pro
195 200 205
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410
<210>28
<211>1244
<212>DNA
<213>人工序列
<220>
<223>grg23(L3P1.B3)
<221>CDS
<222>(1)...(1242)
<400>28
atg gaa act gat cgc ctt gtg atc cca gga tcg aaa agc atc acc aac 48
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
cgg gct ttg ctt ttg gct gcc gca gcg aag ggc acg tcg gtc ctg gtg 96
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
aga cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca atc cag 144
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
gcc ctc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa 192
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
ggc ctg ggt cag gca ccc cac ctc gac gcc cac atc tgg tgc gag gac 240
Gly Leu Gly Gln Ala Pro His Leu Asp Ala His Ile Trp Cys Glu Asp
65 70 75 80
gca ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gca ggt cag 288
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
ggg aag ttc acc gtc gac gga tca gag cag ctg cgg cgg cgc ccg ctt 336
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
cgg ccc ctg gtc gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc 384
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
gag cag ctg ccc ctt aca att gaa gcg agc ggg ctg gca ggc ggg gag 432
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
tac gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggc ctg atc 480
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
ccc gtg tca cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
ttc ggc ctt gag acc agc acc gac gga gcc acc gtc agc gtc cct cca 624
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
ggg cgc tac aca gcc cgg cgg tat aaa ata gaa ccg gat gcg tca act 672
Gly Arg Tyr Thr Ala Arg Arg Tyr Lys Ile Glu Pro Asp Ala Ser Thr
210 215 220
gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc agg agc ttc gaa 720
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
ttt caa ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttc ttc 768
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
aat gta ctt ggg cgg ctc ggt gcg gag gtc cac tgg gca ccc aac tcg 816
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
gtc acc ata tct gga ccg gaa agg ctg aac ggc gac att gaa gtg gat 864
Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
atg ggc gag att tcg gac acc ttc atg aca ctc gcg gcg att gcc cct 912
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
ttg gcc gat gga ccc atc acg ata acc aac att ggt cat gca cgg ttg 960
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
aag gaa tcc gac cgc atc tca gcg atg gaa acc aac ctg cgc acg ctc 1008
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
ggt gta caa acc gac gtc gga cac gac tgg atg aga atc tac ccc tct 1056
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
acc ccg cac ggc ggt aga gtg aat tgc cac cga gac cac agg atc gct 1104
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
atg gcg ttt tca atc ctg gga ctg aga gtg gac ggg att acc ctc gac 1152
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly *
405 410
gg 1244
<210>29
<211>413
<212>PRT
<213>人工序列
<220>
<223>grg23(L3P1.B3)
<400>29
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro His Leu Asp Ala His Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
Gly Arg Tyr Thr Ala Arg Arg Tyr Lys Ile Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410
<210>30
<211>1244
<212>DNA
<213>人工序列
<220>
<223>grg23(L3P1.F18)
<221>CDS
<222>(1)...(1242)
<400>30
atg gaa act gat cgc ctt gtg atc cca gga tcg aaa agc atc acc aac 48
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
cgg gct ttg ctt ttg gct gcc gca gcg aag ggc acg tcg gtc ctg gtg 96
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
aga cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca atc cag 144
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
gcc ctc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa 192
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
ggc ctg ggt cag gca ccc cac ctc gac gcc gac atc tgg tgc gag gac 240
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
gca ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gca ggt cag 288
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
ggg aag ttc acc gtc gac gga tca gag cag ctg cgg cgg cgc ccg ctt 336
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
cgg ccc ctg gtc gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc 384
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
gag cag ctg ccc ctt aca att gaa gcg agc ggg ctg gca ggc ggg gag 432
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
tac gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggc ctg atc 480
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
ccc gtg tca cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
ttc ggc ctt gag acc agc acc gac gga gcc acc gtc agc gtc cct cca 624
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
ggg cgc tac aca gcc cgg cgg tat gaa ata gaa ccg gat gcg tca act 672
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc agg agc ttc gaa 720
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
ttt caa ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttc ttc 768
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
aat gta ctt ggg cgg ctc ggt gcg gag gtc cac tgg gca ccc aac tcg 816
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
gtc atc ata tct gga ccg gaa agg ctg aac ggc gac att gaa gtg gat 864
Val Ile Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
atg ggc gag att tcg gac acc ttc atg aca ctc gcg gcg att gcc cct 912
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
ttg gcc gat gga ccc atc acg ata acc aac att ggt cat gca cgg ttg 960
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
aag gaa tcc gac cgc atc tca gcg atg gaa acc aac ctg cgc acg ctc 1008
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
ggt gta caa acc gac gtc gga cac gac tgg atg aga atc tac ccc tct 1056
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
acc ccg cac ggc ggt aga gtg aat tgc cac cgg gac cac agg atc gct 1104
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
atg gcg ttt tca atc ctg gga ctg aga gtg gac ggg att acc ctc gac 1152
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
gga cgc ctt ttc ccc gaa aag gcg ctt acg ctc ccc ggc tag 1242
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly*
405 410
gg 1244
<210>31
<211>413
<212>PRT
<213>人工序列
<220>
<223>grg23(L3P1.F18)
<400>31
Met Glu Thr Asp Arg Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
Val Ile Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410
<210>32
<211>1244
<212>DNA
<213>人工序列
<220>
<223>grg23(L3P1.O23)
<221>CDS
<222>(1)...(1242)
<400>32
atg gaa act gat cac ctt gtg atc cca gga tcg aaa agc atc acc aac 48
Met Glu Thr Asp His Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
cgg gcg ttg ctt ttg gct gcc gca gcg aag ggc acg tcg gtc ctg gtg 96
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
aga cca ttg gtc agc gcc gat acc tca gca ttc aaa act gca atc cag 144
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
gcc ctc ggt gcc aac gtc tca gcc gac ggt gac aat tgg gtc gtt gaa 192
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
ggc ttg ggt cag gca ccc cac ctc gac gcc gac atc tgg tgc gag gac 240
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
gca ggt act gtg gcc cgg ttc ctc cct cca ttc gta gcc gca ggt cag 288
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
ggg aag ttc acc gtc gac gga tca gag cag ctg cgg cgg cgc ccg ctt 336
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
cgg ccc ctg gtc gac ggc atc cgc cac ctg ggc gcc cgc gtc tcc tcc 384
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
gag cag ctg ccc ctt aca att gaa gcg agc ggg ctg gca ggc ggg gag 432
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
tac gaa att gaa gcc cat cag agc agc cag ttc gcc tcc ggc ctg atc 480
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
atg gcc gcc ccg tac gcg aga caa ggc ctg cgt gtg cgg ata cca aat 528
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val ArgIle Pro Asn
165 170 175
ccc gtg tca cag ccc tac ctc acg atg aca ctg cgg atg atg agg gac 576
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
ttc ggc ctt gag acc agc acc gac gga gcc acc gtc agc gtc cct cca 624
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
ggg cgc tac aca gcc cgg cgg tat gaa ata gaa ccg gat gcg tca act 672
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
gcg tcg tac ttc gcc gcc gct tcc gcc gtc tct ggc agg agc ttc gaa 720
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
ttt caa ggc ctt ggc aca gac agc atc caa ggc gac acg tca ttt ttc 768
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
aat gta ctt ggg cgg ctc ggt gcg gag gtc cac tgg gca ccc aac tcg 816
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
gtc acc ata tct gga ccg gaa agg ctg aac ggc gac att gaa gtg gat 864
Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
atg ggc gag att tcg gac acc ttc atg aca ctc gcg gcg att gcc cct 912
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
ttg gcc gat gga ccc atc acg ata acc aac att ggt cat gca cgg ttg 960
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
aag gaa tcc gac cgc atc tca gcg atg gaa acc aac ctg cgc acg ctc 1008
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
ggt gta caa acc gac gtc gga cac gac tgg atg aga atc tac ccc tct 1056
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
acc ccg cac ggc ggt aga gtg aat tgc cac cgg gac cac agg atc gct 1104
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
atg gcg ttt tca atc ctg gga ctg aga gtg gac ggg att acc ctc gac 1152
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
gac cct caa tgc gtc ggg aag acc ttt cct ggc ttc ttc gac tac ctt 1200
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
gga cgc ctt ttc ccc gaa aag gcg ctt acg ctt ccc ggc tag 1242
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly *
405 410
gg 1244
<210>33
<211>413
<212>PRT
<213>人工序列
<220>
<223>grg23(L3P1.O23)
<400>33
Met Glu Thr Asp His Leu Val Ile Pro Gly Ser Lys Ser Ile Thr Asn
1 5 10 15
Arg Ala Leu Leu Leu Ala Ala Ala Ala Lys Gly Thr Ser Val Leu Val
20 25 30
Arg Pro Leu Val Ser Ala Asp Thr Ser Ala Phe Lys Thr Ala Ile Gln
35 40 45
Ala Leu Gly Ala Asn Val Ser Ala Asp Gly Asp Asn Trp Val Val Glu
50 55 60
Gly Leu Gly Gln Ala Pro His Leu Asp Ala Asp Ile Trp Cys Glu Asp
65 70 75 80
Ala Gly Thr Val Ala Arg Phe Leu Pro Pro Phe Val Ala Ala Gly Gln
85 90 95
Gly Lys Phe Thr Val Asp Gly Ser Glu Gln Leu Arg Arg Arg Pro Leu
100 105 110
Arg Pro Leu Val Asp Gly Ile Arg His Leu Gly Ala Arg Val Ser Ser
115 120 125
Glu Gln Leu Pro Leu Thr Ile Glu Ala Ser Gly Leu Ala Gly Gly Glu
130 135 140
Tyr Glu Ile Glu Ala His Gln Ser Ser Gln Phe Ala Ser Gly Leu Ile
145 150 155 160
Met Ala Ala Pro Tyr Ala Arg Gln Gly Leu Arg Val Arg Ile Pro Asn
165 170 175
Pro Val Ser Gln Pro Tyr Leu Thr Met Thr Leu Arg Met Met Arg Asp
180 185 190
Phe Gly Leu Glu Thr Ser Thr Asp Gly Ala Thr Val Ser Val Pro Pro
195 200 205
Gly Arg Tyr Thr Ala Arg Arg Tyr Glu Ile Glu Pro Asp Ala Ser Thr
210 215 220
Ala Ser Tyr Phe Ala Ala Ala Ser Ala Val Ser Gly Arg Ser Phe Glu
225 230 235 240
Phe Gln Gly Leu Gly Thr Asp Ser Ile Gln Gly Asp Thr Ser Phe Phe
245 250 255
Asn Val Leu Gly Arg Leu Gly Ala Glu Val His Trp Ala Pro Asn Ser
260 265 270
Val Thr Ile Ser Gly Pro Glu Arg Leu Asn Gly Asp Ile Glu Val Asp
275 280 285
Met Gly Glu Ile Ser Asp Thr Phe Met Thr Leu Ala Ala Ile Ala Pro
290 295 300
Leu Ala Asp Gly Pro Ile Thr Ile Thr Asn Ile Gly His Ala Arg Leu
305 310 315 320
Lys Glu Ser Asp Arg Ile Ser Ala Met Glu Thr Asn Leu Arg Thr Leu
325 330 335
Gly Val Gln Thr Asp Val Gly His Asp Trp Met Arg Ile Tyr Pro Ser
340 345 350
Thr Pro His Gly Gly Arg Val Asn Cys His Arg Asp His Arg Ile Ala
355 360 365
Met Ala Phe Ser Ile Leu Gly Leu Arg Val Asp Gly Ile Thr Leu Asp
370 375 380
Asp Pro Gln Cys Val Gly Lys Thr Phe Pro Gly Phe Phe Asp Tyr Leu
385 390 395 400
Gly Arg Leu Phe Pro Glu Lys Ala Leu Thr Leu Pro Gly
405 410