CN106795504A - 木葡聚糖内糖基转移酶变体以及编码其的多核苷酸 - Google Patents

木葡聚糖内糖基转移酶变体以及编码其的多核苷酸 Download PDF

Info

Publication number
CN106795504A
CN106795504A CN201580054541.5A CN201580054541A CN106795504A CN 106795504 A CN106795504 A CN 106795504A CN 201580054541 A CN201580054541 A CN 201580054541A CN 106795504 A CN106795504 A CN 106795504A
Authority
CN
China
Prior art keywords
variant
gly
ala
ser
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580054541.5A
Other languages
English (en)
Inventor
D·赫尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN106795504A publication Critical patent/CN106795504A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • C12N9/1051Hexosyltransferases (2.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y204/00Glycosyltransferases (2.4)
    • C12Y204/01Hexosyltransferases (2.4.1)
    • C12Y204/01207Xyloglucan:xyloglucosyl transferase (2.4.1.207)

Abstract

本发明涉及木葡聚糖内糖基转移酶变体。本发明还涉及编码这些变体的多核苷酸,包含这些多核苷酸的核酸构建体、载体和宿主细胞;以及使用这些变体的方法。

Description

木葡聚糖内糖基转移酶变体以及编码其的多核苷酸
参照序列表
本申请包含计算机可读形式的序列表,将其通过引用结合在此。
发明背景
发明领域
本发明涉及木葡聚糖内糖基转移酶变体、编码这些变体的多核苷酸、产生这些变体的方法以及使用这些变体的方法。
相关领域描述
木葡聚糖内糖基转移酶(XET)是一种催化木葡聚糖(植物细胞壁的结构多糖)的内切-转糖基作用的酶。该酶存在于大多数植物中,并且具体地是陆生植物。已经从双子叶植物和单子叶植物中提取出XET。
还没有在工业微生物中实现商业相关水平的木葡聚糖内糖基转移酶的异源表达。在本领域中,对改进木葡聚糖内糖基转移酶在工业重要微生物中的表达存在需要。
本发明提供了与其亲本相比具有增加的表达产量的木葡聚糖内糖基转移酶变体。
发明概述
本发明涉及分离的木葡聚糖内糖基转移酶变体,这些变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个(例如,若干个)位置处的取代,其中这些变体具有木葡聚糖内糖基转移酶活性。
本发明还涉及编码这些变体的分离的多核苷酸,包含这些多核苷酸的核酸构建体、载体和宿主细胞,以及产生这些变体的方法。
本发明还涉及用于获得这些变体的方法和增加木葡聚糖内糖基转移酶的表达产量的方法。
本发明进一步涉及包括这些变体的组合物。
附图简要说明
图1示出了pMMar27的限制性图谱。
图2示出了pEvFz1的限制性图谱。
图3示出了pDLHD0006的限制性图谱。
图4示出了pDLHD0044的限制性图谱。
图5示出了pDau571的限制性图谱。
图6示出了pDLHD0075的限制性图谱。
图7示出了pDLHD0095的限制性图谱。
定义
等位基因变体:术语“等位基因变体”意指占用同一染色体位点的一种基因的两个或更多个替代形式中的任一者。等位基因变异由突变天然产生,并且可以导致群体内多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
cDNA:术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录本是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工,包括剪接。
编码序列:术语“编码序列”意指直接指明变体的氨基酸序列的多核苷酸。编码序列的边界一般由一个开放阅读框架决定,该开放阅读框架从一个起始密码子(如ATG、GTG或TTG)开始并且以一个终止密码子(如TAA、TAG或TGA)结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指对于表达编码本发明的变体的多核苷酸所必需的核酸序列。每个控制序列对于编码该变体的多核苷酸来说可以是原生的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是原生的或外源的。这些调控序列包括但不局限于前导子、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码变体的多核苷酸的编码区连接的特异性限制酶切位点的目的,这些控制序列可以提供有多个接头。
表达:术语“表达”包括涉及变体产生的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰以及分泌。
表达载体:术语“表达载体”意指线性或环状DNA分子,该分子包括编码变体的多核苷酸并且该多核苷酸可操作地与提供用于其表达的控制序列相连接。
片段:术语“片段”意指具有从成熟多肽的氨基和/或羧基末端缺失一个或多个(例如,数个)的氨基酸的多肽;其中该片段具有木葡聚糖内糖基转移酶活性。在一个方面中,片段包含成熟多肽的至少85%、至少90%、或至少95%的氨基酸残基。
宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。
改进的特性:术语“改进的特性”意指与变体相关的与亲本相比得到改进的特征。在本发明中,改进的特性是相对于亲本,变体的增加的表达产量。
增加的表达产量:术语“增加的表达产量”意指相对于在相同的培养条件下,培养每升表达亲本基因的相同的宿主细胞产生的分泌的活性酶的量(g),来自培养每升表达变体基因的宿主细胞的培养基的分泌的活性酶的更高量(g)。在一个方面中,与亲本酶相比,该变体具有至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加的表达产量。
分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)包括但不限于任何酶、变体、核酸、蛋白、肽或辅因子的任何物质,该物质至少部分地从与其本质相关的一种或多种或所有天然存在的成分中去除;(3)相对于天然发现的物质通过人工修饰的任何物质;或(4)通过增加该物质相对于与其天然相关的其他组分的量而修饰的任何物质(例如,宿主细胞中的重组体产生;编码该物质的基因的多个拷贝;以及使用比编码该物质的基因天然相关的启动子强的启动子)。
成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。在一个方面中,基于预测SEQID NO:2的氨基酸1至20是信号肽的SignalP 3.0程序(本特森(Bendtsen)等人,2004,分子生物学杂志(J.Mol.Biol.)340:783-795),该成熟多肽是SEQ ID NO:2的氨基酸21至292。在另一个方面中,基于预测SEQ ID NO:4的氨基酸1至27是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:4的氨基酸28至287。在另一个方面中,基于预测SEQ ID NO:6的氨基酸1至22是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:6的氨基酸23至294。在另一个方面中,基于预测SEQ ID NO:8的氨基酸1至24是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:8的氨基酸25至297。在另一个方面中,基于预测SEQ ID NO:10的氨基酸1至22是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:10的氨基酸23至294。在另一个方面中,基于预测SEQ ID NO:12的氨基酸1至26是信号肽的SignalP 3.0程序,该成熟多肽是SEQID NO:12的氨基酸27至285。在另一个方面中,基于预测SEQ ID NO:14的氨基酸1至22是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:14的氨基酸23至323。在另一个方面中,基于预测SEQ ID NO:16的氨基酸1至28是信号肽的SignalP 3.0程序,该成熟多肽是SEQ IDNO:16的氨基酸29至299。在另一个方面中,基于预测SEQ ID NO:18的氨基酸1至24是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:18的氨基酸25至275。在另一个方面中,基于预测SEQ ID NO:20的氨基酸1至18是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:20的氨基酸19至330。在另一个方面中,基于预测SEQ ID NO:22的氨基酸1至24是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:22的氨基酸25至297。在另一个方面中,基于预测SEQ ID NO:24的氨基酸1至24是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:24的氨基酸25至288。在另一个方面中,基于预测SEQ ID NO:26的氨基酸1至24是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:26的氨基酸25至311。在另一个方面中,基于预测SEQ ID NO:28的氨基酸1至28是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:28的氨基酸29至291。在另一个方面中,基于预测SEQ ID NO:30的氨基酸1至25是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:30的氨基酸26至280。在另一个方面中,基于预测SEQ ID NO:32的氨基酸1至21是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:32的氨基酸22至290。在另一个方面中,基于预测SEQ ID NO:34的氨基酸1至30是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:34的氨基酸31至302。在另一个方面中,基于预测SEQ ID NO:36的氨基酸1至27是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:36的氨基酸28至291。在另一个方面中,基于预测SEQ ID NO:38的氨基酸1至29是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:38的氨基酸30至299。在另一个方面中,基于预测SEQ ID NO:40的氨基酸1至26是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:40的氨基酸27至290。在另一个方面中,基于预测SEQ ID NO:42的氨基酸1至28是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:42的氨基酸29至304。在另一个方面中,基于预测SEQ ID NO:44的氨基酸1至21是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:44的氨基酸22至292。在另一个方面中,基于预测SEQ ID NO:46的氨基酸1至30是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:46的氨基酸31至283。在另一个方面中,基于预测SEQ ID NO:48的氨基酸1至22是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:48的氨基酸23至283。在另一个方面中,基于预测SEQ ID NO:50的氨基酸1至28是信号肽的SignalP 3.0程序,该成熟多肽是SEQ ID NO:50的氨基酸29至290。
本领域已知,宿主细胞可以产生由同一多核苷酸表达的两种或更多种不同成熟多肽(即,具有不同C-末端和/或N-末端氨基酸)的混合物。本领域还已知,不同的宿主细胞不同地加工多肽,并且因此一个表达多核苷酸的宿主细胞当与另一个表达相同多核苷酸的宿主细胞相比时可以产生不同的成熟多肽(例如,具有不同的C-末端和/或N-末端氨基酸)。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有木葡聚糖内糖基转移酶活性的成熟多肽的多核苷酸。在一个方面中,基于预测SEQ ID NO:1的核苷酸1至60编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:1的核苷酸61至876。在另一个方面中,基于预测SEQ ID NO:3的核苷酸1至81编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:3的核苷酸82至861。在另一个方面中,基于预测SEQ ID NO:5的核苷酸1至66编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:5的核苷酸67至882。在另一个方面中,基于预测SEQ ID NO:7的核苷酸1至72编码信号肽的SignalP3.0程序,该成熟多肽编码序列是SEQ ID NO:7的核苷酸73至891。在另一个方面中,基于预测SEQ ID NO:9的核苷酸1至66编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQID NO:9的核苷酸67至882。在另一个方面中,基于预测SEQ ID NO:11的核苷酸1至78编码信号肽的SignalP3.0程序,该成熟多肽编码序列是SEQ ID NO:11的核苷酸79至855。在另一个方面中,基于预测SEQ ID NO:13的核苷酸1至66编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:13的核苷酸67至969。在另一个方面中,基于预测SEQ ID NO:15的核苷酸1至84编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:15的核苷酸85至897。在另一个方面中,基于预测SEQ ID NO:17的核苷酸1至72编码信号肽的SignalP3.0程序,该成熟多肽编码序列是SEQ ID NO:17的核苷酸73至825。在另一个方面中,基于预测SEQ ID NO:19的核苷酸1至54编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:19的核苷酸55至990。在另一个方面中,基于预测SEQ ID NO:21的核苷酸1至72编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:21的核苷酸73至891。在另一个方面中,基于预测SEQ ID NO:23的核苷酸1至72编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:23的核苷酸73至864。在另一个方面中,基于预测SEQ IDNO:25的核苷酸1至72编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:25的核苷酸73至933。在另一个方面中,基于预测SEQ ID NO:27的核苷酸1至84编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:27的核苷酸85至873。在另一个方面中,基于预测SEQ ID NO:29的核苷酸1至75编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:29的核苷酸76至840。在另一个方面中,基于预测SEQ ID NO:31的核苷酸1至63编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:31的核苷酸64至870。在另一个方面中,基于预测SEQ ID NO:33的核苷酸1至90编码信号肽的SignalP3.0程序,该成熟多肽编码序列是SEQ ID NO:33的核苷酸91至906。在另一个方面中,基于预测SEQ ID NO:35的核苷酸1至81编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:35的核苷酸82至873。在另一个方面中,基于预测SEQ ID NO:37的核苷酸1至87编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:37的核苷酸88至897。在另一个方面中,基于预测SEQ ID NO:39的核苷酸1至78编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:39的核苷酸79至870。在另一个方面中,基于预测SEQ ID NO:41的核苷酸1至84编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQID NO:41的核苷酸85至912。在另一个方面中,基于预测SEQ ID NO:43的核苷酸1至63编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:43的核苷酸64至876。在另一个方面中,基于预测SEQ ID NO:45的核苷酸1至90编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:45的核苷酸91至849。在另一个方面中,基于预测SEQ ID NO:47的核苷酸1至66编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:47的核苷酸67至849。在另一个方面中,基于预测SEQ ID NO:49的核苷酸1至84编码信号肽的SignalP 3.0程序,该成熟多肽编码序列是SEQ ID NO:49的核苷酸85至870。在以上各方面中,术语“成熟多肽编码序列”应理解成包括基因组DNA序列的cDNA序列或cDNA序列的基因组DNA序列。
突变体:术语“突变体”意指编码变体的多核苷酸。
核酸构建体:术语“核酸构建体”意指单-链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成包含核酸的区段,或是合成的,该核酸分子包括一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指如下的构造,其中,控制序列相对于多核苷酸的编码序列安置在适当位置,从而使得该控制序列指导该编码序列的表达。
亲本或亲本木葡聚糖内糖基转移酶:术语“亲本”或“亲本木葡聚糖内糖基转移酶”意指在一个或多个(例如,若干个)位置对木葡聚糖内糖基转移酶进行改变,即取代、插入和/或缺失,以产生本发明的木葡聚糖内糖基转移酶变体。该亲本可以是天然存在的(野生型)多肽或其变体或片段。
序列一致性:用参数“序列一致性”来描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件(The European Molecular Biology Open Software Suite),赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)(优选5.0.0版或更新版本)的尼德尔(Needle)程序中所实施的尼德尔曼-翁施(Needleman-Wunsch)算法(尼德尔曼(Needleman)和翁施(Wunsch),1970,分子生物学杂志(J.Mol.Biol.)48:443-453)来确定两个氨基酸序列之间的序列一致性。使用的参数是空位开放罚分10、空位扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记为“最高同一性(longest identity)”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:
(相同残基x 100)/(比对的长度-在比对中的空位总数)。
出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯等人,2000,同上)(优选5.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼和翁施,1970,同上)来确定两个脱氧核糖核苷酸序列之间的序列一致性。使用的参数是空位开放罚分10、空位扩展罚分0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用Needle标记为“最高同一性(longest identity)”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:
(一致的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)
严格条件:术语“非常低严格条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在45℃下洗涤三次,每次15分钟。
术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在50℃下洗涤三次,每次15分钟。
对于至少100个核苷酸长度的探针,术语“中严格性条件”意指按照标准DNA印迹程序在42℃在5X SSPE、0.3%SDS、200微克/ml剪切和变性的鲑精DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在55℃下洗涤三次,每次15分钟。
术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/毫升剪切并变性的鲑鱼精子DNA以及35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在60℃下洗涤三次,每次15分钟。
术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在65℃下洗涤三次,每次15分钟。
术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在70℃下洗涤三次,每次15分钟。
子序列:术语“子序列”意指缺失成熟多肽编码序列的5'和/或3'端的一个或多个(例如,若干个)核苷酸的多核苷酸;其中该子序列编码具有木葡聚糖内糖基转移酶活性的片段。在一个方面中,子序列包含成熟多肽编码序列的至少85%、至少90%、或至少95%的核苷酸。
变体:术语“变体”意指在一个或多个(例如,若干个)位置包括改变(即,取代、插入和/或缺失)的具有木葡聚糖内糖基转移酶活性的多肽。取代意指占据一个位置的氨基酸由不同的氨基酸代替;缺失意指除去占据一个位置的氨基酸;以及插入意指在占据一个位置的氨基酸的毗邻处和紧邻处添加一个氨基酸。本发明的变体具有亲本的木葡聚糖内糖基转移酶活性的至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%。
野生型木葡聚糖内糖基转移酶:术语“野生型”木葡聚糖内糖基转移酶意指由天然存在的有机体(如在自然界中发现的植物、细菌、酵母或丝状真菌)表达的木葡聚糖内糖基转移酶。
木葡聚糖内糖基转移酶:术语“木葡聚糖内糖基转移酶”意指木葡聚糖:木葡聚糖内糖基转移酶(EC 2.4.1.207),该酶催化木葡聚糖骨架中β-(1→4)键的裂解,并且转移该木葡聚糖基区段到受体非还原末端葡萄糖残基的O-4上,该受体可以是木葡聚糖或木葡聚糖的寡糖。木葡聚糖内糖基转移酶又称木葡聚糖内糖基转移酶/水解酶或内切木葡聚糖转移酶。一些木聚糖内糖基转移酶可以具有不同活性,这些活性包括木葡聚糖和甘露聚糖内糖基转移酶活性。例如,来自成熟的木瓜水果的木聚糖内糖基转移酶可以使用杂木聚糖,如小麦阿拉伯糖基木聚糖、桦木葡糖醛酸木聚糖、及其他作为供体分子。这些木聚糖可能与木葡聚糖发挥类似的作用,同时成本便宜很多,因为它们可以,例如,从纸浆厂废液和/或未来生物质生物炼制中提取。
通过本领域中的那些技术人员,使用任何以下方法,可以评估木葡聚糖内糖基转移酶活性。在木葡聚糖内糖基转移酶的存在下,通过用摩尔过量的木葡聚糖低聚物孵育木葡聚糖聚合物时,木葡聚糖聚合物的平均分子量的减少可以通过液相层析(苏鲁瓦(Sulova)等人,2003,植物生理生化(Plant Physiol.Biochem.)41:431-437)或通过乙醇沉淀(山中(Yaanaka)等人,2000,食品胶体(Food Hydrocolloids)14:125-128),随后通过重量或纤维素结合分析(弗里(Fry)等人,1992,生物化学杂志(Biochem.J.)282:821-828)来确定,或可以在碱性条件下通过与碘结合在比色上来进行评估(苏鲁瓦(Sulova)等人,1995,分析生物化学(Analytical Biochemistry)229:80-85)。
变体命名规则
出于本发明的目的,披露于SEQ ID NO:2中的全长木葡聚糖内糖基转移酶被用来确定在另一个木葡聚糖内糖基转移酶内的相应氨基酸残基。将另一种木葡聚糖内糖基转移酶的氨基酸序列与在SEQ ID NO:2中披露的全长多肽比对,并且基于比对,使用尼德曼-翁施算法(尼德尔曼和翁施,1970,分子生物学杂志48:443-453)如在EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件包,赖斯等人,2000,遗传学趋势16:276-277)的尼德尔程序,优选地5.0.0版或更新版本中所执行的,确定与SEQ ID NO:2的全长多肽中的任何氨基酸残基相应的氨基酸位置编号。使用的参数是空位开放罚分10、空位扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。氨基酸位置的编号是基于SEQ ID NO:2的全长多肽(例如,包括信号肽),其中位置1是信号肽的第一个氨基酸(即,Met)并且位置21(即,Ala)是SEQID NO:2的成熟多肽的第一个位置。
另一种木葡聚糖内糖基转移酶中对应的氨基酸残基的鉴定可以通过使用若干计算机程序使用其对应的缺省参数比对多个多肽序列来确定,这些计算机程序包括但不限于MUSCLE(通过对数期望值的多序列比较;3.5版或更新版本;埃德加(Edgar),2004,核酸研究(Nucleic Acids Research)32:1792-2797);MAFTT(6.857版或更新版本;加藤(Katoh)和库玛(Kuma),2002,核酸研究30:3059-3066;加藤等人,2005,核酸研究33:511-518;加藤和朝都(Toh),2007,生物信息学(Bioinformatics)23:372-374;加藤等人,2009,分子生物学中的方法(Methods in Molecular Biology)537:39-64;加藤和朝都,2010,生物信息学(Bioinformatics)26:1899-1900);以及采用ClustalW的EMBOSS EMMA(1.83版或更新版本;汤普森(Thompson)等人,1994,核酸研究(Nucleic Acids Research)22:4673-4680)。
当另一种木葡聚糖内糖基转移酶与SEQ ID NO:2的全长多肽相背离,这样使得传统的基于序列的比较无法检测它们的相互关系时(林达尔(Lindahl)和埃洛氟松(Elofsson),2000,分子生物学杂志295:613-615),可以使用其他成对序列比较算法。在基于序列的搜索中的更大灵敏度可以使用搜索程序来获得,这些搜索程序利用多肽家族的概率表示(特征曲线)来搜索数据库。例如,PSI-BLAST程序通过迭代数据库搜索过程来产生多个谱,并且能够检测远距离同源物(阿特休尔(Atschul)等人,1997,《核酸研究》25:3389-3402)。如果多肽的家族或超家族在蛋白结构数据库中具有一个或多个代表,则可以实现甚至更大的灵敏度。程序如GenTHREADER(琼斯(Jones),1999,分子生物学杂志(J.Mol.Biol.)287:797-815;麦古芬(McGuffin)和琼斯,2003,生物信息学(Bioinformatics)19:874-881)利用来自不同来源(PSI-BLAST、二级结构预测、结构比对谱以及溶剂化势)的信息作为预测查询序列的结构折叠的神经网络的输入。类似地,高夫(Gough)等人,2000,分子生物学杂志(J.Mol.Biol.)313:903-919的方法可以用于比对未知结构的序列与存在于SCOP数据库中的超家族模型。这些比对进而可以用于产生多肽的同源性模型,并且使用出于该目的而开发的多种工具可以评定此类模型的准确度。
对于已知结构的蛋白,若干工具和资源可用于检索并产生结构比对。例如,蛋白的SCOP超家族已经在结构上进行比对,并且那些比对是可访问的并且可下载的。可以使用多种算法如距离比对矩阵(奥尔姆(Holm)和桑德(Sander),1998,蛋白质(Proteins)33:88-96)或组合延伸(辛迪亚洛夫(Shindyalov)和伯恩(Bourne),1998,蛋白质工程(ProteinEngineering)11:739-747)比对两种或更多种蛋白质结构,并且这些算法的实施可以另外用于查询具有感兴趣结构的结构数据库,以便发现可能的结构同源物(例如,奥尔姆和帕克(Park),2000,生物信息学(Bioinformatics)16:566-567)。
在描述本发明的变体中,以下所述的命名法适于方便参考。采用了已接受的IUPAC单个字母和三字母的氨基酸缩写。
取代。对于氨基酸取代,使用以下命名法:初始氨基酸、位置、取代氨基酸。因此,在位置226处的苏氨酸被丙氨酸取代表示为“Thr226Ala”或者“T226A”。多个突变由加号(“+”)分开,例如“Gly205Arg+Ser411Phe”或“G205R+S411F”代表分别在位置205和位置411处甘氨酸(G)被精氨酸(R)取代,并且丝氨酸(S)被苯丙氨酸(F)取代。
缺失。对于氨基酸缺失,使用以下命名法:初始氨基酸、位置、*。因此,在位置195处的甘氨酸缺失表示为“Gly195*”或“G195*”。多个缺失由加号(“+”)分开,例如“Gly195*+Ser411*”或“G195*+S411*”。
插入。对于氨基酸插入,使用以下命名法:初始氨基酸、位置、初始氨基酸、插入氨基酸。因此,在位置195处的甘氨酸之后插入赖氨酸被表示为“Gly195GlyLys”或“G195GK”。多个氨基酸的插入被表示为[初始氨基酸,位置,初始氨基酸,插入氨基酸#1、插入氨基酸#2;等]。例如,在位置195处的甘氨酸之后插入赖氨酸和丙氨酸被表示为“Gly195GlyLysAla”或“G195GKA”。
在此类情况下,通过将小写字母添加至在所插入的一个或多个氨基酸残基之前的氨基酸残基的位置编号中来对所插入的一个或多个氨基酸残基进行编号。在以上实例中,该序列因此将是:
亲本: 变体:
195 195 195a 195b
G G-K-A
多种改变。包括多种改变的变体由加号(“+”)分开,例如“Arg170Tyr+Gly195Glu”或者“R170Y+G195E”代表在位置170和位置195处的精氨酸和甘氨酸分别被酪氨酸和谷氨酸取代。
不同改变。可以在一个位置上引入不同的改变时,这些不同的改变由逗号分开,例如“Arg170Tyr,Glu”代表在位置170上的精氨酸被酪氨酸或谷氨酸取代。因此,“Tyr167Gly,Ala+Arg170Gly,Ala”表示以下变体:
“Tyr167Gly+Arg170Gly”、“Tyr167Gly+Arg170Ala”、“Tyr167Ala+Arg170Gly”、和“Tyr167Ala+Arg170Ala”。
发明详述
本发明涉及分离的木葡聚糖内糖基转移酶变体,这些变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个(例如,若干个)位置处的取代,其中这些变体具有木葡聚糖内糖基转移酶活性。
变体
在一个实施例中,这些变体与亲本木葡聚糖内糖基转移酶的氨基酸序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:2的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:4的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:6的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:8的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:10的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:12的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:14的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:16的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:18的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:20的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:22的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:24的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:26的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:28的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:30的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:32的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:34的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:36的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:38的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:40的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:42的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:44的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:46的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:48的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在另一个实施例中,这些变体与SEQ ID NO:50的成熟多肽具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在一个方面中,在本发明的变体中的取代数目是1至17个,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、或17个取代。
在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个(例如,若干个)位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的两个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的三个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的四个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的五个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的六个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的七个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的八个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的九个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十一个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十二个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十三个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十四个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十五个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280中的任一个相对应的十六个位置处的取代。在另一个方面中,变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的各个位置处的取代。
在另一个方面中,该变体包括与位置10相对应的位置处的取代或由其组成。在另一个方面中,与位置10相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ala取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代I10A或由其组成。
在另一个方面中,该变体包括与位置30相对应的位置处的取代或由其组成。在另一个方面中,与位置30相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Glu取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代P30E或由其组成。
在另一个方面中,该变体包括与位置40相对应的位置处的取代或由其组成。在另一个方面中,与位置40相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Gly取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代A40G或由其组成。
在另一个方面中,该变体包括与位置51相对应的位置处的取代或由其组成。在另一个方面中,与位置51相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Thr取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代S51T或由其组成。
在另一个方面中,该变体包括与位置53相对应的位置处的取代或由其组成。在另一个方面中,与位置53相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Ala或Val取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代I53A,V或由其组成。
在另一个方面中,该变体包括与位置60相对应的位置处的取代或由其组成。在另一个方面中,与位置60相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Ser取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代Y60S或由其组成。
在另一个方面中,该变体包括与位置99相对应的位置处的取代或由其组成。在另一个方面中,与位置99相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Glu或Asn取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代T99E,N或由其组成。
在另一个方面中,该变体包括与位置102相对应的位置处的取代或由其组成。在另一个方面中,与位置102相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Gly取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代E102G或由其组成。
在另一个方面中,该变体包括与位置117相对应的位置处的取代或由其组成。在另一个方面中,与位置117相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Glu取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代Q117E或由其组成。
在另一个方面中,该变体包括与位置130相对应的位置处的取代或由其组成。在另一个方面中,与位置130相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Arg取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代K130R或由其组成。
在另一个方面中,该变体包括与位置136相对应的位置处的取代或由其组成。在另一个方面中,与位置136相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Trp取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代R136W或由其组成。
在另一个方面中,该变体包括与位置157相对应的位置处的取代或由其组成。在另一个方面中,与位置157相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被His取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代Y157H或由其组成。
在另一个方面中,该变体包括与位置162相对应的位置处的取代或由其组成。在另一个方面中,与位置162相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Cys取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代Y162C或由其组成。
在另一个方面中,该变体包括与位置175相对应的位置处的取代或由其组成。在另一个方面中,与位置175相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ser、Gly、或Gln取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代N175S,G,Q或由其组成。
在另一个方面中,该变体包括与位置183相对应的位置处的取代或由其组成。在另一个方面中,与位置183相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Ile取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代F183I或由其组成。
在另一个方面中,该变体包括与位置254相对应的位置处的取代或由其组成。在另一个方面中,与位置254相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Glu取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代A254E或由其组成。
在另一个方面中,该变体包括与位置280相对应的位置处的取代或由其组成。在另一个方面中,与位置280相对应的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Gly或Glu取代。在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代S280G,E或由其组成。
在以上各方面中,该变体在包括与作为亲本的其他木葡聚糖内糖基转移酶中的SEQ ID NO:2的全长多肽相对应的位置处的上述一个或多个取代或由其组成。
在以下各方面中,该变体包括与其他木葡聚糖内糖基转移酶中的SEQ ID NO:2的全长多肽相对应的位置处的或SEQ ID NO:2的全长多肽的位置处的下述一个或多个取代或由其组成。
在另一个方面中,该变体包括选自下组的一个或多个(例如,若干个)取代或由其组成,该组由以下各项组成:I10A;P30E;A40G;S51T;I53A,V;Y60S;T99E,N;E102G;Q117E;K103R;R136W;Y157H;Y162C;N175S,G,Q;F183I;A254E;以及S280G,E。
在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代A40G+N175S或由其组成。
在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代A40G+F183I或由其组成。
在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代N175G+S280G或由其组成。
在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代A40G+I53A+N175S或由其组成。
在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代A40G+N175S+F183I或由其组成。
在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代I10A+I53A+E102G或由其组成。
在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代A40G+E102G+Q117E或由其组成。
在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代N175Q+A254E+S280E或由其组成。
在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代P30E+S51T+Y60S+T99N或由其组成。
在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代A40G+T99E+E102G+K130R或由其组成。
在另一个方面中,该变体包括SEQ ID NO:2的全长多肽的取代I53V+R136W+Y157H+Y162C+N175S或由其组成。
这些变体可以进一步在一个或多个(例如,若干个)其他位置处包括一个或多个另外的改变,例如,取代、插入或缺失。
氨基酸改变可以具有次要性质,即不显著影响蛋白质的折叠和/或活性的保守氨基酸取代或插入;典型地1-30个氨基酸的小缺失;小的氨基-或羧基末端延伸,如氨基末端蛋氨酸残基;至多20-25个残基的小接头肽;或通过改变净电荷或另一功能来促进纯化的小延伸,如多组氨酸序列、抗原性表位或结合结构域。
保守取代的实例在下组之内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸以及甲硫氨酸)。一般不会改变比活性的氨基酸取代是本领域已知的并且例如由H.诺伊拉特(Neurath)和R.L.希尔(Hill),1979,在蛋白质(The Proteins),学术出版社(Academic Press),纽约中描述。常见取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、以及Asp/Gly。
可替代地,氨基酸变化是这样一种性质,使得多肽的理化性质被改变。例如,氨基酸改变可以改进多肽的热稳定性、改变底物特异性、改变最适pH等。
可以根据本领域已知的方法,如定点诱变或丙氨酸扫描诱变鉴定多肽中的必需氨基酸(康宁汉(Cunningham)和韦尔斯(Wells),1989,科学(Science)244:1081-1085)。在后一项技术中,在该分子中的每个残基处引入单个丙氨酸突变,并且测试所得突变体分子的木葡聚糖内糖基转移酶活性以鉴定对于该分子的活性至关重要的氨基酸残基。还参见希尔顿(Hilton)等人,1996,生物化学杂志(J.Biol.Chem.)271:4699-4708。酶或其他生物学相互作用的活性部位还可通过对结构的物理分析来确定,如由下述技术确定:核磁共振、晶体学(crystallography)、电子衍射、或光亲和标记,连同对推定的接触位点(contract site)氨基酸进行突变。参见,例如德沃斯(de Vos)等人,1992,科学(Science)255:306-312;史密斯(Smith)等人,1992,分子生物学杂志(J.Mol.Biol.)224:899-904;乌乐达维尔(Wlodaver)等人,1992,欧洲生物化学学会联盟通讯(FEBS Lett.)309:59-64。也可以从与相关多肽的比对推断必需氨基酸的身份。在SEQ ID NO:2的氨基酸21至292的序列中的必需活性位点氨基酸位于位置105、107、和109。
本发明还涉及增加木葡聚糖内糖基转移酶的表达产量的方法,该方法包括在与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、和280相对应的一个或多个位置处将取代引入亲本木葡聚糖内糖基转移酶中以产生变体,其中该变体的表达产量相对于亲本是增加的;并任选地回收该变体。
在一个实施例中,与亲本酶相比,该变体具有至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加的表达产量。
亲本木葡聚糖内糖基转移酶
该亲本木葡聚糖内糖基转移酶可以是(a)与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽具有至少60%序列一致性的多肽;(b)由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下与(i)SEQID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列,或(ii)(i)的全长互补体杂交;或(c)由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列具有至少60%序列一致性。
在一个实施例中,该亲本与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,这些成熟多肽具有木葡聚糖内糖基转移酶活性。在另一个实施例中,该亲本的氨基酸序列与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽相差多达10个氨基酸,例如1、2、3、4、6、6、7、8、9或10个。
在另一个实施例中,该亲本包括SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的氨基酸序列或由其组成。在另一个实施例中,该亲本包括SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽或由其组成。
在另一个实施例中,该亲本是SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽的片段,该片段包含该亲本的至少85%,例如至少90%和至少95%的氨基酸残基。
在另一个实施例中,该亲本是SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽的等位基因变体。
在另一个实施例中,该亲本由如下的多核苷酸编码,该多核苷酸在非常低严格条件、低严格条件、中严格条件、中-高严格条件、高严格条件或非常高严格条件下与(i)SEQID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列,或(ii)(i)的全长互补体杂交(萨拉布鲁克(Sambrook)等人,1989,分子克隆实验指南(Molecular Cloning:A Laboratory Manual),第二版,冷泉港(ColdSpring Harbor),纽约)。
SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的多核苷酸或其子序列,连同SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48或50的多肽或其片段可被用于设计核酸探针以根据本领域熟知的方法来鉴定并克隆编码来自不同属或种的亲本的DNA。具体而言,可以根据标准DNA印迹程序,使用这类探针与感兴趣的细胞的基因组DNA或cDNA杂交,以便鉴定和分离其中的对应基因。此类探针可以明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,核酸探针具有至少100个核苷酸长度,例如至少200个核苷酸长度、至少300个核苷酸长度、至少400个核苷酸长度、至少500个核苷酸长度、至少600个核苷酸长度、至少700个核苷酸长度、至少800个核苷酸长度、或至少900个核苷酸长度。DNA和RNA探针二者均可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),以检测相应的基因。本发明涵盖此类探针。
可以针对与上文所述的探针杂交并编码亲本的DNA来筛选由这类其他属或种制备的基因组DNA或cDNA文库。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其他分离技术分离基因组或其他DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素或其他适合的载体材料并且固定于其上。为了鉴定与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49或其子序列杂交的克隆或DNA,将载体材料用于DNA印迹中。
出于本发明的目的,杂交指示该多核苷酸在非常低到非常高严格度条件下和与以下各项相对应的标记的核酸探针杂交:(i)1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49;(ii)其成熟多肽编码序列;(iii)其全长互补体;或(iv)其子序列。可以使用例如X-射线胶片或本领域已知的任何其他检测手段来检测在这些条件下核酸探针杂交的分子。
在一个方面中,该核酸探针是SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列。在另一个方面中,该核酸探针是编码SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的多肽;其成熟多肽;或其片段的多核苷酸。在另一个方面中,该核酸探针是SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49。
在另一个实施例中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
该亲本可以是一种杂合多肽(嵌合体),其中该亲本的一个区域被另一个多肽的区域替换。
该亲本可以是一种融合多肽或可切割的融合多肽,其中另一个多肽融合在该亲本的N-末端或C-末端处。通过将编码另一种多肽的多核苷酸与本发明多核苷酸融合而产生融合多肽。用于产生融合多肽的技术是本领域已知的,并且包括连接编码多肽的编码序列,使得它们在框内,并且融合多肽的表达处于相同的启动子和终止子的控制之下。也可以使用内含肽技术构建融合多肽,其中以翻译后方式产生融合多肽(库珀(Cooper)等人,1993,欧洲分子生物学学会杂志(EMBO J.)12:2575-2583;道森(Dawson)等人,1994,科学(Science)266:776-779)。
融合多肽可以进一步包括两种多肽之间的切割位点。在融合蛋白分泌之时,该位点被切割,从而释放出这两种多肽。切割位点的实例包括但不限于在如下文献中披露的位点:马丁(Martin)等人,2003,工业微生物学生物技术杂志(J.Ind.Microbiol.Biotechnol.)3:568-576;Svetina等人,2000,生物技术杂志(J.Biotechnol.)76:245-251;拉斯马森-威尔逊(Rasmussen-Wilson)等人,1997,应用与环境微生物学(Appl.Environ.Microbiol.)63:3488-3493;沃德(Ward)等人,1995,生物技术(Biotechnology)13:498-503;以及孔特雷拉斯(Contreras)等人,1991,生物技术9:378-381;伊顿(Eaton)等人,1986,生物化学(Biochemistry)25:505-512;Collins-Racie等人,1995,生物技术13:982-987;卡特(Carter)等人,1989,蛋白质:结构、功能和遗传学(Proteins:Structure,Function,and Genetics)6:240-248;和史蒂文斯(Stevens),2003,世界药物发现(Drug Discovery World)4:35-48。
该亲本可以从任何属的植物获得。出于本发明的目的,如在此结合给定的来源使用的术语“从……获得(或获得自)”应意指由多核苷酸编码的亲本是由该来源产生的。在一个方面中,该亲本是胞外分泌的。
该亲本可以是任何植物木葡聚糖内糖基转移酶。在一个实施例中,该亲本是从豆科(同义词:豆科(Leguminosae和Papilionaceae))的子叶中获得,优选地菜豆属,具体地,绿豆。优选的单子叶植物是非禾本科的单子叶植物和百合的单子叶植物。木葡聚糖内糖基转移酶还可以从苔藓和苔类中来提取,如在弗里(Fry)等人,1992,生物化学杂志(Biochem.J.)282:821-828中所描述的。例如,该木葡聚糖内糖基转移酶可以从子叶中获得,即,双子叶植物或单子叶植物,具体地是选自下组的双子叶植物,该组由以下各项组成:花椰菜、大豆、番茄、马铃薯、油菜、向日葵、棉花、以及烟草,或选自下组的单子叶植物,该组由以下各项组成:小麦、水稻、玉米和甘蔗。参见,例如,WO 2003/033813和WO 97/023683。
在另一个实施例中,该亲本从以下种获得:拟南芥属(Arabidopsis)、番木瓜属(Carica)、香瓜属(Cucumis)、胡萝卜属(Daucus)、羊茅属(Festuca)、大豆属(Glycine)、大麦属(Hordeum)、番茄属(Lycopersicon)、苜蓿属(Medicago)、稻属(Oryza)、杨属(Populus)、慈菇属(Sagittaria)、高粱属(Sorghum)、豇豆属(Vigna)、或玉蜀黍属(Zea)。
在另一个实施例中,该亲本从拟南芥、番木瓜、黄瓜、野胡萝卜、草地羊茅、大豆、大麦、番茄、蒺藜状苜蓿、水稻、欧洲山杨、矮慈姑(Sagittaria pygmaea)、双色高粱、红豆(Vigna angularis)、或玉米(Zea mays)获得。
在另一个实施例中,该亲本是拟南芥(GENESEQP:AOE11231、GENESEQP:AOE93420、GENESEQP:BAL03414、GENESEQP:BAL03622、或GENESEQP:AWK95154);番木瓜(GENESEQP:AZR75725);黄瓜(GENESEQP:AZV66490);野胡萝卜(GENESEQP:AZV66139);草地羊茅(GENESEQP:AZR80321);大豆(GENESEQP:AWK95154或GENESEQP:AYF92062);大麦(GENESEQP:AZR85056、GENESEQP:AQY12558、GENESEQP:AQY12559、或GENESEQP:AWK95180);番茄(GENESEQP:ATZ45232);蒺藜状苜蓿(GENESEQP:ATZ48025);水稻(GENESEQP:ATZ42485、GENESEQP:ATZ57524、或GENESEQP:AZR76430);欧洲山杨(GENESEQP:AWK95036);矮慈菇(GENESEQP:AZV66468);双色高粱(GENESEQP:BAO79623或GENESEQP:BAO79007);红豆(GENESEQP:ATZ61320);或玉蜀黍(GENESEQP:AWK94916)木葡聚糖内糖基转移酶,其中将这些登录号以其全部内容结合在此。
可以通过筛选基因组DNA或cDNA文库或混合的DNA样品来获得编码亲本的多核苷酸。一旦已经用一个或多个探针检测到编码亲本的多核苷酸,则可以通过利用对本领域的普通技术人员来说已知的技术来分离或克隆该多核苷酸(参见,例如,萨拉布鲁克(Sambrook)等人,1989,见上文)。
变体的制备
本发明还涉及用于获得木葡聚糖内糖基转移酶变体的方法,该方法包括:(a)将与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个(例如,若干个)位置处的取代引入亲本木葡聚糖内糖基转移酶,其中该变体具有木葡聚糖内糖基转移酶活性,并且任选地(b)回收该变体。
可以使用本领域已知的任何诱变程序来制备这些变体,如定点诱变、位点饱和诱变、合成基因构建、半合成基因构建、随机诱变、改组等。
定点诱变是在编码该亲本的多核苷酸中的一个或多个限定位点处引入一个或多个(例如,若干个)突变的技术。
通过使用涉及包含所希望的突变的寡核苷酸引物的PCR可以体外实现定点诱变。也可以通过盒式诱变进行体外定点诱变,所述盒式诱变涉及由限制酶在包括编码亲本的多核苷酸的质粒中的位点处切割并且随后将包含突变的寡核苷酸连接在多核苷酸中。通常,消化该质粒与该寡核苷酸的限制酶是相同的,以允许该质粒的粘性末端以及插入片段彼此连接。参见,例如谢勒(Scherer)和戴维斯(Davis),1979,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)76:4949-4955;和巴顿(Barton)等人,1990,核酸研究(NucleicAcids Res.)18:7349-4966。
还可以通过本领域已知的方法体内实现定点诱变。参见,例如,美国专利申请公开号2004/0171154;斯托西(Storici)等人,2001,自然生物技术(Nature Biotechnol.)19:773-776;凯伦(Kren)等人,1998,自然医学(Nat.Med.)4:285-290;以及卡里萨诺(Calissano)和曼奇诺(Macino),1996,真菌遗传学通讯(Fungal Genet.Newslett.)43:15-16。
在本发明中可以使用任何定点诱变程序。存在可用于制备变体的很多可商购的试剂盒。
位点饱和诱变在一个或多个(例如,若干个)特定位置处将多肽编码序列系统性地替代为编码全部19个氨基酸的序列(帕里克(Parikh)和松村(Matsumura),2005,分子生物学杂志(J.Mol.Biol.)352:621-628)。
合成基因构建需要体外合成设计的多核苷酸分子以编码感兴趣的多肽。基因合成可以利用多种技术来进行,如由田(Tian)等人(2004,自然(Nature)432:1050-1054)所述的基于多路微芯片的技术、以及其中在光可编程的微流芯片上合成并组装寡核苷酸的类似技术。
通过组合合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的多个方面来实现半合成基因构建。半合成构建典型地是利用合成的多核苷酸片段的过程结合PCR技术。因此,基因的限定的区域可以从头合成,而其他区域可以使用位点特异性诱变引物来扩增,而还有其他区域可以经受易错PCR或非易错PCR扩增。然后可以对多核苷酸子序列进行改组。
可以做出单个或多个氨基酸取代、缺失和/或插入并且使用已知的诱变、重组和/或改组方法进行测试,随后进行有关筛选程序,如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer),1988,科学(Science)241:53-57;博维(Bowie)和萨奥尔,1989,美国科学院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO 95/22625所披露的那些。可以使用的其他方法包括易错PCR、噬菌体展示(例如,罗曼(Lowman)等人,1991,生物化学(Biochemistry)30:10832-10837;美国专利号5,223,409;WO 92/06204)和区域定向诱变(德比舍尔(Derbyshire)等人,1986,基因(Gene)46:145;Ner等人,1988,DNA 7:127)。
诱变/改组方法可以与高通量自动化筛选方法组合以检测由宿主细胞表达的克隆的诱变多肽的活性(奈斯(Ness)等人,1999,自然生物技术(Nature Biotechnology)17:893-896)。编码活性多肽的诱变的DNA分子可以回收自宿主细胞,并且使用本领域的标准方法对其进行迅速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。
多核苷酸
本发明还涉及编码本发明的变体的分离的多核苷酸。
核酸构建体
本发明还涉及包括编码本发明的变体的、可操作地连接至一个或多个控制序列上的多核苷酸的核酸构建体,该一个或多个控制序列在与控制序列相容的条件下指导编码序列在适合的宿主细胞中的表达。
可以按多种方式来操纵该多核苷酸以提供变体的表达。取决于表达载体,在其插入载体以前操纵多核苷酸可以是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
该控制序列可以是一个启动子,即,被宿主细胞识别以对编码本发明的变体的多核苷酸进行表达的一种多核苷酸。启动子包含介导该变体的表达的转录控制序列。启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括突变型、截短型及杂合型启动子,并且可以是由编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的适合启动子的实例是从以下各项的基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖孢镰刀菌胰蛋白酶-样蛋白酶(WO 96/00787)、镶片镰孢菌淀粉葡糖苷酶(WO 00/56900)、镶片镰孢菌Daria(达莉亚)(WO 00/56900)、镶片镰孢菌Quinn(奎恩)(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延伸因子,连同NA2-tpi启动子(来自编码中性α-淀粉酶的曲霉属基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的曲霉属基因的未翻译的前导子替换未翻译的前导子;非限制性实例包括来自编码中性α-淀粉酶的黑曲霉基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的构巢曲霉或米曲霉基因的未翻译的前导子替换未翻译的前导子);及其突变型、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。
在酵母宿主中,从针对以下各项的基因获得有用的启动子:酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。在罗马诺斯(Romanos)等人,1992,酵母(Yeast)8:423-488中描述了酵母宿主细胞的其他有用启动子。
控制序列也可以是由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接至编码该变体的多核苷酸的3'-末端。在宿主细胞中有功能的任何终止子可以用于本发明中。
用于丝状真菌宿主细胞的优选终止子是从以下各项的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。
酵母宿主细胞的优选终止子从针对以下各项的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。在罗马诺斯(Romanos)等人,1992,上文中描述了酵母宿主细胞的其他有用终止子。
该控制序列也可以是前导子,该前导子是对宿主细胞翻译重要的mRNA的非翻译区。该前导子可操作地连接至编码该变体的多核苷酸的5'-末端。可以使用在宿主细胞中有功能的任何前导子。
从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因获得用于丝状真菌宿主细胞的优选前导子用于丝状真菌宿主细胞的优选前导子。
从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母醹-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因获得用于酵母宿主细胞的合适的前导子。
控制序列也可以是多聚腺苷化序列,一种与多核苷酸3’-末端可操作地连接并在转录时由宿主细胞识别为向转录的mRNA添加聚腺苷酸残基的信号序列。可以使用在宿主细胞中起作用的任何聚腺苷酸化序列。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下各项的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞有用的聚腺苷酸化序列在郭(Guo)和谢尔曼(Sherman),1995,分子细胞生物学(Mol.Cellular Biol.)15:5983-5990中得以描述。
该控制序列还可以是信号肽编码区,编码与变体的N-端连接的信号肽,并且引导该变体进入细胞的分泌通路。该多核苷酸的编码序列的5’-端可以固有地包含信号肽编码序列,该信号肽编码序列在翻译阅读框中与编码该变体的编码序列的区段天然地连接在一起。可替代地,编码序列5’-端可以包含对于该编码序列是外源的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以简单地置换天然信号肽编码序列,以便增加变体的分泌。然而,可以使用指导表达的变体进入宿主细胞的分泌通路的任何信号肽编码序列。
用于丝状真菌宿主细胞的有效信号肽编码序列是从黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶的基因获得的信号肽编码序列。
从酿酒酵母α-因子和酿酒酵母转化酶的基因获得用于酵母宿主细胞的有用信号肽。其他的有用的信号肽编码序列由罗曼诺斯(Romanos)等人(1992,上文)描述。
该控制序列还可以是编码位于变体的N-末端处的前肽的前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下各项的基因获得:嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。
在信号肽序列和前肽序列二者都存在的情况下,该前肽序列定位成紧邻该变体的N-末端并且该信号肽序列定位成紧邻该前肽序列的N-末端。
还令人希望的可以是添加相对于宿主细胞的生长来调节该变体的表达的调节序列。调节序列的实例是使得基因的表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的那些序列。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下,编码该变体的多核苷酸将可操作地连接至该调节序列。
表达载体
本发明还涉及包括编码本发明的变体的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。不同的核苷酸和控制序列可以连接在一起以产生重组表达载体,这一重组表达载体可以包括一个或多个便利的限制酶切位点以允许在这些位点处插入或取代编码该变体的多核苷酸。可替代地,可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中而表达该多核苷酸。在产生该表达载体时,该编码序列位于该载体中,这样使得该编码序列与该供表达的适当控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA程序,并且能够引起多核苷酸的表达。典型地,载体的选择将取决于载体与向其中待引入载体的宿主细胞的相容性。该载体可以是线性的或闭合的环状质粒。
该载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体或人工染色体。该载体可以包含任何用以保证自我复制的要素。可替代地,该载体可以是这样载体,当它被引入该宿主细胞中时,被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含待引入到宿主细胞的基因组中的总DNA)或转座子。
该载体优选包含一个或多个允许方便地选择转化细胞、转染细胞、转导细胞等细胞的选择性标记。选择性标记是这样一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。
用于酵母宿主细胞的适合标记包括,但不限于,ADE2、HIS3、LEU2、LYS2、MET3、TRP1、和URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于,adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶)、连同其等效物。优选地用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。在木霉属细胞中优选使用的是adeA、adeB、amdS、hph以及pyrG基因。
选择性标记可以是如在WO 2010/039889中描述的双选择性标记系统。在一个方面中,双选择性标记是hph-tk双选择性标记系统。
载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到该宿主细胞基因组中,该载体可以依靠编码该变体的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可以包含用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置的另外的多核苷酸。为了增加在精确位置整合的可能性,这些整合元件应包含足够数量的核酸,例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外,这些整合元件可以是非编码多核苷酸或编码多核苷酸。在另一个方面,该载体可以通过非同源重组整合到宿主细胞的基因组中。
对于自主复制,该载体可以进一步包括使该载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
用于在酵母宿主细胞中使用的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合、以及ARS4与CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡伦(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:9163-9175;WO 00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可以根据披露于WO00/24883中的方法完成。
可以将本发明的多核苷酸的多于一个的拷贝插入到一个宿主细胞中以增加变体的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或通过包括一个与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。
用于连接以上所描述的元件以构建重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,萨姆布鲁克(Sambrook)等人,1989,见上文)。
宿主细胞
本发明还涉及重组宿主细胞,这些重组宿主细胞包括编码本发明的变体的、可操作地连接至一个或多个控制序列的多核苷酸,该一个或多个控制序列指导本发明的变体的产生。将包括多核苷酸的构建体或载体引入宿主细胞中,这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体,如早前所述。术语“宿主细胞”涵盖由于复制过程中发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上将取决于编码该变体的基因及其来源。
宿主细胞可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
该宿主细胞可以是真菌细胞。如在此所用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如霍克斯沃思(Hawksworth)等人定义,引自:安斯沃斯(Ainsworth)和比斯比(Bisby)的真菌大词典(Dictionary of The Fungi),第8版,1995,国际CAB,大学出版社(University Press),剑桥(Cambridge),英国)。
真菌宿主细胞可以是酵母细胞。如在此使用的“酵母”包括产子嚢酵母(内孢霉目)、产担子酵母和属于半知菌类(芽孢纲)的酵母。由于酵母的分类可能在将来变化,为了本发明的目的,酵母应当如酵母的生物学与活性(Biology and Activities of Yeast)(斯金纳(Skinner),帕斯莫尔(Passmore)和达文波特(Davenport)编著,应用细菌学学会专题论文集系列9(Soc.App.Bacteriol.Symposium Series No.9),1980)所描述那样定义。
酵母宿主细胞可以是假丝酵母属细胞、汉逊酵母属细胞、克鲁维酵母属细胞、毕赤酵母属细胞、酵母菌属细胞、裂殖酵母或耶罗维亚酵母属细胞、如乳酸克鲁维酵母细胞、卡氏酵母细胞、酿酒酵母细胞、糖化酵母细胞、道格拉斯酵母(Saccharomyces douglasii)细胞、克鲁弗酵母细胞、诺地酵母细胞、卵形酵母细胞或解脂耶罗维亚酵母细胞。
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)亚类的所有丝状形式(如霍克斯沃思等人,1995,上文定义)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),而碳分解代谢可以是发酵的。
丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属(Magnaporthe)、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、埃默森篮状菌、土生梭孢霉、长域毛栓菌(Trametesvillosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的适合程序在EP 238023和约尔顿(Yelton)等人,1984,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474以及科里蒂森(Christensen)等人,1988,生物/技术(Bio/Technology)6:1419-1422中描述。用于转化镰刀菌属物种的适合方法在马拉迪耶(Malardier)等人,1989,基因(Gene)78:147-156和WO 96/00787中描述。可以使用由如以下文献描述的程序转化酵母:贝克尔(Becker)和瓜伦特(Guarente),在阿贝尔森(Abelson),J.N.和西蒙(Simon),M.I.编,酵母遗传学与分子生物学指南,酶学方法(Guide to Yeast Genetics and Molecular Biology,Methodsin Enzymology),第194卷,第182-187页,学术出版社有限公司(Academic Press,Inc.),纽约;伊藤(Ito)等人,1983,细菌学杂志(J.Bacteriol.)153:163;以及哈尼恩(Hinnen)等人,1978,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)75:1920。
产生方法
本发明还涉及产生变体的方法,这些方法包括(a)在有助于该变体的产生的条件下培养本发明的重组宿主细胞;并且任选地(b)回收该变体。
使用本领域已知的方法在适合于产生该变体的一种营养培养基中培养这些宿主细胞。例如,可以通过摇瓶培养,或者在适合的培养基中并在允许该变体表达和/或分离的条件下在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批给料发酵或固态发酵)来培养该细胞。该培养是使用本领域中已知的程序,在适合的营养培养基中发生,该培养基包括碳和氮来源及无机盐。适合的培养基从商业供应商可获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果该变体被分泌到该营养培养基中,则该变体可直接从该培养基中回收。如果该变体没有分泌,则它可从细胞裂解液中回收。
可以使用本领域已知的对木葡聚糖内糖基转移酶特异的方法检测这些变体。这些检测方法包括但不局限于,特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶测定法可用于确定如在此所述的变体的活性。
该变体可以使用本领域已知的方法回收。例如,可以通过多种常规程序从该营养培养基中回收该变体,这些常规程序包括但不局限于收集、离心、过滤、萃取、喷雾干燥、蒸发、或沉淀。在一个方面中,回收整个发酵液。
可以通过本领域中已知的多种程序来纯化变体以获得基本上纯的变体,这些程序包括但不限于色谱法(例如,离子交换色谱、亲和色谱、疏水作用色谱、色谱聚焦、以及尺寸排阻色谱)、电泳程序(例如,制备型等电点聚焦)、差别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(参见,例如,蛋白质纯化(Protein Purification),詹森(Janson)和赖登(Ryden)编辑,VCH出版社(VCH Publishers),纽约,1989)。
发酵液配制品或细胞组合物
本发明还涉及包含本发明的变体的发酵液配制品或细胞组合物。发酵液产物进一步包括在发酵过程中使用的另外的成分,例如像,细胞(包括包含编码本发明的变体的基因的宿主细胞,这些宿主细胞被用于产生感兴趣的变体)、细胞碎片、生物质、发酵介质和/或发酵产物。在一些实施例中,该组合物是包含一种或多种有机酸、杀灭的细胞和/或细胞碎片以及培养基的细胞杀灭的全培养液。
如在此使用的术语“发酵液”是指由细胞发酵产生、不经历或经历最低限的回收和/或纯化的制剂。例如,当微生物培养物生长至饱和,在碳限制条件下孵育以允许蛋白质合成(例如,由宿主细胞进行酶的表达)并且分泌到细胞培养基中时,产生发酵液。发酵液可以包含在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地,发酵液是未分级的并且包括用过的培养基以及例如通过离心去除微生物细胞(例如,丝状真菌细胞)之后存在的细胞碎片。在一些实施例中,发酵液包含用过的细胞培养基、胞外酶以及有活力的和/或无活力的微生物细胞。
在一个实施例中,该发酵液配制品和细胞组合物包括第一有机酸组分(包括至少一种1-5碳的有机酸和/或其盐)以及第二有机酸组分(包括至少一种6碳或更多碳的有机酸和/或其盐)。在具体实施例中,该第一有机酸组分是乙酸、甲酸、丙酸、其盐,或前述两种或更多种的混合物;并且该第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐,或前述两种或更多种的混合物。
在另一个实施例中,该组合物包含一种或多种有机酸,并且任选地进一步包含杀灭的细胞和/或细胞碎片。在一个实施例中,从细胞杀灭的全培养液中去除这些杀灭的细胞和/或细胞碎片,以提供不含这些组分的组合物。
这些发酵液配制品或细胞组合物可以进一步包括防腐剂和/或抗微生物(例如,抑菌)剂,包括但不限于山梨醇、氯化钠、山梨酸钾、以及本领域中已知的其他试剂。
这些发酵液配制品或细胞组合物可以进一步包括多种酶活性,如选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶以及转移酶。
该细胞杀灭的全培养液或组合物可以包含在发酵结束时得到的发酵材料的未分级的内容物。典型地,该细胞杀灭的全培养液或组合物包含用过的培养基以及在微生物细胞(例如,丝状真菌细胞)生长至饱和、在碳限制条件下孵育以允许蛋白合成之后存在的细胞碎片。在一些实施例中,该细胞杀灭的全培养液或组合物包含用过的细胞培养基、胞外酶和杀灭的丝状真菌细胞。在一些实施例中,可以使用本领域已知的方法来使细胞杀灭的全培养液或组合物中存在的微生物细胞透性化和/或裂解。
如在此描述的全培养液或细胞组合物典型地是液体,但是可以包含不溶性组分,例如杀灭的细胞、细胞碎片、培养基组分和/或一种或多种不溶性酶。在一些实施例中,可以去除不溶性组分以提供澄清的液体组合物。
本发明的全液配制品和细胞组合物可以通过WO 90/15861或WO2010/096673中所描述的方法来产生。
酶组合物
本发明还涉及包括本发明的一种变体的组合物。优选地,这些组合物富含这种变体。术语“富含”指示该组合物的木葡聚糖内糖基转移酶活性已经增加,例如,富集因子为至少1.1。
这些组合物可以包括本发明的一种变体作为主要酶组分,例如一种单组分组合物。可替代地,这些组合物可以包括多种酶活性,如选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、以及转移酶。
这些组合物可以根据本领域已知的方法制备,并可以是液体或干燥组合物的形式。可以根据本领域中已知的方法稳定这些组合物。
下文中给出本发明的组合物的优选用途的实例。组合物的剂量以及组合物使用的其他条件可以根据本领域已知的方法来确定。
用途
本发明的这些变体可以用于根据WO 97/23683为纤维素材料(如织物或纸和纸浆产品)提供改进的强度和/或形状保持和/或抗皱特性的工艺中。
本发明的这些变体还可以用于洗衣和/或织物和/或颜色护理组合物中,以根据WO2001/07556针对纤维素纤维刷新和/或恢复改进的拉伸强度,增强的抗皱、抗起球和抗缩水特性。
通过以下实例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实例
培养基和溶液
LB板由以下各项构成:10g的胰蛋白胨、5g的酵母提取物、5g的NaCl、15g的细菌琼脂(bacteriological agar)、以及加至1升的去离子水。
LB培养基由以下各项构成:10g的胰蛋白胨、5g的酵母提取物、5g的NaCl、以及加至1升的去离子水。
基本培养基琼脂板由以下各项构成:342.3g的蔗糖、10g的葡萄糖、4g的MgSO4·7H20、6g的NaNO3、0.52g的KCl、1.52g的KH2PO4、0.04mg的Na2B4O7·10H2O、0.4mg的CuSO4·5H2O、1.2mg的FeSO4·7H2O、0.7mg的MnSO4·2H2O、0.8mg的Na2MoO4·2H2O、10mg的ZnSO4·7H2O、500mg的柠檬酸、4mg的D-生物素、20g的纯净琼脂、以及加至1升的去离子水。
合成的、缺少尿苷的确定成分培养基由以下各项构成:18mg的腺嘌呤半硫酸盐、76mg的丙氨酸、76mg的精氨酸盐酸盐、76mg的天冬酰胺一水合物、76mg的天门冬氨酸、76mg的半胱氨酸盐酸盐一水合物、76mg的谷氨酸单钠盐、76mg的谷氨酰胺、76mg的甘氨酸、76mg的组氨酸、myo-76mg的肌醇、76mg的异亮氨酸、380mg的亮氨酸、76mg的赖氨酸单盐酸盐、76mg的蛋氨酸、8mg的对-氨基苯甲酸钾盐、76mg的苯丙氨酸、76mg的脯氨酸、76mg的丝氨酸、76mg的苏氨酸、76mg的色氨酸、76mg的酪氨酸二钠盐、76mg的缬氨酸、以及加至1升的去离子水。
YP+2%葡萄糖培养基由以下各项构成:10g的酵母提取物、20g的蛋白胨、20g的葡萄糖、以及加至1升的去离子水。
YP+2%麦芽糊精培养基由以下各项构成:10g的酵母提取物、20g的蛋白胨、20g的麦芽糊精、以及加至1升的去离子水。
2X YT+氨比西林平板由16g的胰蛋白胨,10g的酵母提取物,5g的氯化钠,15g的细菌琼脂,和加至1升的去离子水组成。在高压蒸汽处理的培养基回火到55℃后,添加1ml的100mg/ml的氨比西林。
TAE缓冲液由以下各项构成:4.84g的Tris碱、1.14ml的冰醋酸、2ml的0.5M EDTA(pH 8.0)、并且去离子水补足至1升。
TBE缓冲液由以下各项构成:10.8g的Tris碱、5.5g硼酸、4ml的0.5M EDTA(pH8.0)、以及加至1升的去离子水。
实例1:碘比色法测定来确定木葡聚糖内糖基转移酶活性
木葡聚糖内糖基转移酶活性使用由布洛瓦(Sulova)等人,1995,分析生物化学(Analytical Biochemistry)229:80-85中描述的碘比色测定的修改版本进行测定。对于每个反应,5μl的罗望子木葡聚糖(麦格酶国际公司,布雷,英国)(5mg/ml在水中)与20μl的木葡聚糖低聚物(麦格酶国际公司,布雷,英国)(5mg/ml在水中)和10μl的400mM柠檬酸钠pH5.5合并,并且分散到96孔板中。反应通过添加5μl的液体培养液至每个孔中启动,并且在37℃孵育板10分钟。反应通过添加200μl的由14%(w/v)Na2SO4、0.2%KI、0.1M HCl和0.5%I2构成的溶液猝灭,并且在黑暗中孵育30分钟,然后在M5分光光度计(Molecular Devices公司,桑尼维尔,加利福尼亚州,美国)中在620nm测量吸光度。
实例2:荧光素异硫氰酸酯标记的木葡聚糖的产生
根据由周(Zhou)等人,2006,生物催化与生物转化(Biocatalysis andBiotransformation)24:107-120所描述的程序,通过木葡聚糖低聚物的还原端的还原氨化,随后在100mM碳酸氢钠(pH 9.0)中在室温下将XGO的氨基基团结合到荧光素异硫氰酸酯异构体I(西格玛奥德里奇(Sigma Aldrich),圣路易斯,密苏里州,美国)24小时,来产生荧光素异硫氰酸酯标记的木葡聚糖低聚物(FITC-XGO)。将结合反应产物在真空中浓缩干燥,溶解于0.5ml的去离子水,并且通过硅胶层析进行纯化,该硅胶层析用从100:0:0.04至70:30:1梯度的乙腈:水:乙酸作为流动相进行洗脱。通过蒸发该缓冲液、溶解于D2O(西格玛奥德里奇,圣路易斯,密苏里州,美国),并且使用Varian400MHz MercuryVx(安捷伦(Agilent),圣克拉拉,加利福尼亚州,美国)通过1H NMR分析来确认纯度和产物同一性。在-20℃下在黑暗中,储存干燥的FITC-XGO,并且在解冻过程中干燥。
一mg的FITC-XGOs与在200μl反应中的每ml的20mM柠檬酸钠pH 5.0的1mg的罗望子木葡聚糖(麦格酶公司,布雷,英国)和18mg的VaXET16一起孵育至少30分钟。合并样品混合物并且通过添加冰冷的乙醇至80%(v/v)的终浓度进行沉淀,并且在4℃下孵育过夜。沉淀的荧光素异硫氰酸标记木葡聚糖(FITC-XG)通过使用LEGENDTMRT加离心机(赛默飞世尔科技公司(Thermo Scientific),沃尔瑟姆,马萨诸塞州,美国)在3000rpm离心,倾析掉乙醇进行回收,并且在室温下干燥24小时。将FITC-XG溶解在最小体积的去离子水中直到溶解并储存在-20℃。将冷冻的FITC-XG解冻并且冻干过夜。将冻干粉末溶解在5000μl的去离子水中并且通过在488nm的吸光度定量。
按以下方式制备大规模批次的FITC-XG。在去离子水中制备每ml溶液7.9mg的FITC-XGO。彻底混合四十ml的10mg的罗望子木葡聚糖(麦格酶公司,布雷,英国)/ml的去离子水、452ml的7.9mg的FITC-XGO/ml的去离子水、2ml的400mM柠檬酸钠(pH 5.5)、和1.2ml的1.4mg的VaXET16/ml的20mM柠檬酸钠(pH 5.5),并且在室温下孵育过夜。在过夜孵育后,通过添加冰冷的乙醇至终体积110ml来沉淀FITC-XG,彻底混合,并且在4℃下整夜孵育。用水洗涤沉淀的FITC-XG,并且然后转移到圆底烧瓶(Erlenmeyer bulb)中。通过使用EZ-2Elite蒸发器(SP Scientific/Genevac公司,斯通里奇,纽约,美国)蒸发4小时来去除残余的水和乙醇。将干燥的样品溶解于水中,并且用去离子水将体积调整到48ml,以产生,在所希望的100kDa的平均分子量下,5mg/ml的最终FITC-XG浓度。
实例3:荧光偏振测定以确定木葡聚糖内糖基转移活性
使用以下测定来确定木葡聚糖内糖基转移活性。如在实例2中所描述的制备200μl的反应,该反应包含1mg的罗望子木葡聚糖/ml、0.01mg/ml FITC-XGO,并且将10μl的适当稀释的XET在25℃下在不透明96孔微量滴定板中的20mM柠檬酸钠(pH 5.5)中孵育10分钟。在这个时间段,以顶级阅读方向,用490nm的激发波长、520nm的发射波长、激发路径中495截止滤波器、高精度(100次读取)、和中光电倍增管的灵敏度,使用M5酶标仪(分子器件公司(Molecular Devices),森尼维耳市,加利福尼亚州,美国)连续监测荧光偏振。将荧光XGO以XET依赖性掺入非荧光XG中导致随着时间增加荧光偏振。使用偏振时间进程曲线的线性区域的斜率来确定该活性。
实例4:质粒pMMar27的构建
构建质粒pMMar27,用于表达酵母中的土生梭孢壳霉Cel6A纤维二糖水解酶II。该质粒产生自酵母表达载体的谱系:质粒pMMar27构建自质粒pBM175b;质粒pBM175b构建自质粒pBM143b(WO 2008/008950)和质粒pJLin201;并且质粒pJLin201构建自pBM143b。
除紧邻pBM143b中疏棉状嗜热丝孢菌脂肪酶变体基因的下游的Xba I位点突变为独特的NheI位点以外,质粒pJLin201与pBM143b相同。使用II XL定点诱变试剂盒(Stratagenee公司,拉荷亚,加利福尼亚州,美国)将pBM143b中的Xba I序列(TCTAGA)变为Nhe I序列(gCTAGc)。以下示出了用来突变该位点的引物。
引物999551(正义):
5’-ACATGTCTTTGATAAgCTAGcGGGCCGCATCATGTA-3’(SEQ ID NO:52)
引物999552(反义):
5’-TACATGATGCGGCCCgCTAGcTTATCAAAGACATGT-3’(SEQ ID NO:53)
小写代表突变的核苷酸。
最终体积为50μl的PCR由以下各项构成:125ng的以上每种引物、20ng的pBM143b、1X反应缓冲液(Stratagene公司,拉荷亚,加利福尼亚州,美国)、3μl的(Stratagene公司,拉荷亚,加利福尼亚州,美国)、1μl的dNTP混合物、以及1μl的2.5单元/ml Pfu Ultra HF DNA聚合酶(Stratagene公司,拉荷亚,加利福尼亚州,美国)。使用 热循环仪(Eppendorf AG公司,汉堡,德国)仪进行该反应,程序为1个循环,在95℃下,持续1分钟;18个循环,每个循环在95℃下持续50秒,60℃持续50秒,和68℃持续6分钟6秒;以及1个循环,在68℃下,持续7分钟。在PCR反应后,将该管置于冰上2分钟。向PCR中直接添加一微升的Dpn I(普洛麦格公司(Promega),菲奇堡,威斯康辛州,美国),并且在37℃下孵育1小时。根据制造商的说明,使用2μl体积的DpnI消化的反应来转化大肠杆菌XL10高效感受态细胞(Stratagene公司,拉荷亚,加利福尼亚州,美国)。在2X YT加氨比西林板上对大肠杆菌转化体进行选择。使用9600(凯杰公司,巴伦西亚,加利福尼亚州,美国)将质粒DNA从转化体中的若干种分离。通过限制性酶切和测序分析来确认具有所希望的Nhe I变化的一个质粒,并且指定为质粒pJLin201。为了消除由定点突变引入的可能的PCR错误,通过将包含Nhe I位点的片段克隆回质粒pBM143b中来构建质粒pBM175b。简言之,将质粒pJLin201用Nde I和MluI进行消化,并且将得到的片段克隆到之前用相同的酶使用快速连接试剂盒(罗氏诊断公司(Roche Diagnostics Corporation),印第安纳波利斯,印第安纳州,美国)消化的pBM143b中。简言之,将7μl的Nde I/Mlu I消化的pJLin201片段和1μl的消化的pBM143b与2μl的5XDNA稀释液(罗氏诊断公司,印第安纳波利斯,印第安纳州,美国)、10μl的2X T4DNA连接缓冲液(罗氏诊断公司,印第安纳波利斯,印第安纳州,美国)、和1μl的T4DNA连接酶(罗氏诊断公司,印第安纳波利斯,印第安纳州,美国)进行混合,并且在室温下孵育15分钟。将2微升的连接转化到XL1-蓝亚克隆-级感受态细胞(Stratagene公司,拉荷亚,加利福尼亚州,美国)细胞并且散布于2X YT加氨比西林板上。使用9600从若干转化体中纯化质粒DNA,并使用3130XL遗传分析仪(应用生物系统公司(Applied Biosystems),福斯特城,加利福尼亚州,美国)通过DNA测序进行分析,以鉴定包含所希望的构巢曲菌pyrG插入物的质粒。将一个具有预期的DNA序列的质粒指定为pBM175b。
质粒pMMar27构建自pBM175b和具有设计用于插入所消化pBM175b的突出端的土生梭孢壳霉Cel6A纤维二糖水解酶II的扩增的基因。在CUP I启动子的控制下包含疏棉状嗜热丝孢菌脂肪酶变体基因的质粒pBM175b包含独特的Hind III和Nhe I位点,来去除脂肪酶基因。将质粒pBM175b用这些限制性内切酶进行消化,以去除脂肪酶基因。在消化后,将空载体通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将大约5,215bp的片段从凝胶切离,并且使用凝胶提取试剂盒(凯杰公司,巴伦西亚,加利福尼亚州,美国)进行提取。连接反应(20μl)由1X缓冲液(BD生物科学公司(BDBiosciences),帕洛阿尔托(Palo Alto),加利福尼亚州,美国),1X BSA(BD生物科学公司,帕洛阿尔托(Palo Alto),加利福尼亚州,美国),1μl酶(1:10稀释)(BD生物科学公司,帕洛阿尔托(Palo Alto),加利福尼亚州,美国),用Hind III和Nhe I消化的99ngpBM175b,和36ng的纯化的土生梭孢壳霉Cel6A纤维二糖水解酶II PCR产物。将该反应在室温下孵育30分钟。将2μl体积的反应转化到大肠杆菌高效感受态细胞(Stratagene公司,拉荷亚,加利福尼亚州,美国)中。在每ml补充有100μg的氨比西林的LB平板上选择转化体。挑选一种菌落,其包含插入pBM175b载体替代脂肪酶基因产生pMMar27的土生梭孢壳霉Cel6A(图1)。所选择的质粒在从起始密码子的位置228处包含PCR错误,TCT代替TCC,但是导致中的土生梭孢壳霉Cel6A纤维二糖水解酶II的沉默变化。
实例5:pEvFz1表达载体的构建
表达载体pEvFz1是通过修饰pBM120a(美国专利8,263,824)来进行构建,以包括NA2/NA2-tpi启动子、黑曲霉淀粉葡糖苷酶终止子序列(AMG终止子)、和作为选择性标志物的构巢曲霉乳清酸核苷-5’磷酸脱羧酶基因(pyrG)。
通过该将构巢曲霉pyrG基因从pAlLo2(WO 2004/099228)克隆到pBM120a中来产生质粒pEvFz1。将质粒pBM120a和pAlLo2用Nsi I在37℃下消化过夜。将所得4176bp线性pBM120a载体片段和来自pAlLo2的1479bp pyrG基因插入片段各自使用TAE缓冲液通过0.7%琼脂糖凝胶电泳纯化,从凝胶切离,并使用凝胶提取试剂盒进行提取。
使用QUICK LIGATIONTM试剂盒(新英格兰生物实验室,贝弗利,马萨诸塞州,美国)将1479bp pyrG基因插入片段连接至Nsi I消化的pBM120a片段。连接反应由以下构成:1XQUICK LIGATIONTM反应缓冲液(新英格兰生物实验室,贝弗利,马萨诸塞州,美国)、50ng的Nsi I消化的pBM120a载体、54ng的1479bp Nsi I消化的pyrG基因插入物、以及1μl的T4DNA连接酶,总体积为20μl。将连接混合物在37℃下孵育15分钟,随后在50℃下孵育15分钟,并且然后放置在冰上。
将1μl的连接混合物转化到ONETOP10化学感受大肠杆菌细胞(英杰公司,卡尔斯巴德,加利福尼亚州,美国)中。在2X YT加氨比西林板上对转化体进行选择。使用9600从若干转化体中纯化质粒DNA,并使用3130XL遗传分析仪通过DNA测序进行分析,以鉴定包含所希望的构巢曲菌pyrG插入物的质粒。将一个具有预期的DNA序列的质粒指定为pEvFz1(图2)。
实例6:构建作为酵母/大肠杆菌/米曲霉穿梭载体的质粒pDLHD0006
使用酵母重组克隆,将质粒pDLHD0006构建为基本载体,以使得米曲霉表达盒文库建立。通过使用酵母重组克隆(表1)合并三种DNA片段来产生质粒pDLHD0006:包含大肠杆菌pUC复制起点、大肠杆菌β-内酰胺酶(ampR)选择性标志物、URA3酵母选择性标志物、和来自pMMar27(实例4)的酵母2微米复制起点的片段1;包含NA2-tpi启动子(来自编码黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构酶的基因的启动子的杂合体)、疏棉状嗜热丝孢菌脂肪酶开放阅读框(ORF)、和来自pJaL1262(WO 2013/178674)的黑曲霉葡糖糖化酶终止子的片段2;和来自pEvFz1(实例3)的包含构巢曲霉pyrG选择标志物的片段5。
表I.
pDLHD0006 PCR含量 PCR模板
片段1 大肠杆菌ori/AmpR/URA/2微米(4.1kb) pMMar27
片段2 NA2-tpi PR/脂肪酶/Tamg(4.5kb) pJaL1262
片段3 来自pEvFz1的pyrG基因(1.7kb) pEvFz1
使用以下所示的引物613017(正义)和613018(反义)扩增片段1。设计引物613017包含与片段3(小写)具有序列同源性的侧翼区,并且设计引物613018包含与片段2(小写)具有序列同源性的侧翼区以使得酵母在这三个PCR片段之间重组克隆。
引物613017(正义):
ttaatcgccttgcagcacaCCGCTTCCTCGCTCACTGACTC(SEQ ID NO:54)
引物613018(反义):
acaataaccctgataaatgcGGAACAACACTCAACCCTATCTCGGTC(SEQ ID NO:55)
片段1在反应中通过PCR来扩增,该反应由10ng的质粒pMMar27、0.5μl的DNA聚合酶(新英格兰生物实验室公司,伊普斯威奇,马萨诸塞州,美国)、20pmol的引物613017、20pmol的引物613018、1μl的10mM dNTP、10μl的5XHF缓冲液(新英格兰生物实验室公司,伊普斯威奇,马萨诸塞州,美国)、和35.5μl的水构成。该反应在 热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续1.5分钟。将得到的4.1kb PCR产物(片段1)直接使用用于与以下片段2和3的酵母重组。
使用以下所示的引物613019(正义)和613020(反义)扩增片段2。设计引物613019包含与片段1(小写)具有序列同源性的侧翼区,并且设计引物613020包含与片段3(小写)具有序列同源性的侧翼区以使得酵母在这三个PCR片段之间重组克隆。
613019(正义):
agatagggttgagtgttgttccGCATTTATCAGGGTTATTGTCTCATGAGCGG(SEQ ID NO:56)
613020(反义):
ttctacacgaaggaaagagGAGGAGAGAGTTGAACCTGGACG(SEQ ID NO:57)
片段2在反应中通过PCR来扩增,该反应由10ng的质粒pJaL1262、0.5μl的DNA聚合酶、20pmol的引物613019、20pmol的引物613020、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。在 热循环仪中孵育该反应,程序为1个循环,在98℃下,持续30秒;30个循环,每个循环在98℃持续10秒,60℃持续10秒,以及72℃持续2分钟;以及20℃保持。将得到的4.5kb PCR产物(片段2)直接使用用于与以上片段1和以下片段3的酵母重组。
使用以下所示的引物613022(正义)和613021(反义)扩增片段3。设计引物613021包含与片段2(小写)具有序列同源性的侧翼区,并且设计引物613022包含与片段1(小写)具有序列同源性的侧翼区以使得酵母在这三个PCR片段之间重组克隆。
引物613022(正义):
aggttcaactctctcctcCTCTTTCCTTCGTGTAGAAGACCAGACAG(SEQ ID NO:58)
引物613021(反义):
tcagtgagcgaggaagcggTGTGCTGCAAGGCGATTAAGTTGG(SEQ ID NO:59)
片段3在反应中通过PCR来扩增,该反应由10ng的质粒pEvFz1(实例5)、0.5μl的DNA聚合酶、20pmol的引物613021、20pmol的引物613022、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。在热循环仪中孵育该反应,程序为1个循环,在98℃下,持续30秒;30个循环,每个循环在98℃持续10秒,60℃持续10秒,以及72℃持续2分钟;以及20℃保持。将得到的1.7kb PCR产物(片段3)直接使用用于与以上片段1和2的酵母重组。
使用基于酵母同源性的重组克隆,使用以下程序来合并三个PCR片段。将三种PCR片段的每种的20μl等分试样与来自鲑鱼睾丸的100μg的单链脱氧核糖核酸(西格玛奥德里奇,圣路易斯,密苏里州,美国)、100μl的菌株YNG318的感受态酵母细胞(酿酒酵母ATCC208973)、和600μl的PLATE缓冲液(西格玛奥德里奇,圣路易斯,密苏里州,美国)合并,并且混合。将反应在30℃下以200rpm振荡孵育30分钟。然后将该反应在42℃下在没有振荡的情况下继续15分钟。将这些细胞通过在5,000x g下离心1分钟进行沉淀,并且弃去上清液。将细胞球粒悬浮于200μl的高压蒸汽处理的水中,并且分在两个包含合成的所定义的培养基缺少尿苷的琼脂平板,并且在30℃下孵育3天。将这些酵母菌落使用1ml的高压蒸汽处理的水从平板中分离。将这些细胞通过在13,000x g下离心30秒进行沉淀,并且将100μl等分试样的玻璃珠添加到该管中。将细胞和珠混合物悬浮在250μl的P1缓冲液(凯杰公司,巴伦西亚,加利福尼亚州,美国)中,并且然后涡旋1分钟来裂解这些细胞。使用旋转迷你制备型试剂盒(凯杰公司(QIAGEN Inc.),巴伦西亚,加利福尼亚州,美国),将质粒DNA进行纯化。根据制造商的说明书,然后将3μl等分试样的质粒DNA转化到大肠杆菌ONE TOP10电转化感受态细胞(英杰公司,卡尔斯巴德,加利福尼亚州,美国)中。将50μl的转化细胞散布于每ml补充有100μg氨比西林的LB板上,并且在37℃下孵育过夜。将转化体各自挑入每ml补充有100μg的氨比西林的3ml的LB培养基中,并且在37℃下在250rpm的振荡下生长过夜。使用旋转迷你制备型试剂盒从菌落中纯化质粒DNA。将使用3130XL遗传分析仪的DNA测序用来确认指定为pDLHD0006的最终质粒中三种片段中的每种的存在(图3)。
实例7:用于野生型红豆木葡聚糖内糖基转移酶16(VaXET16)在米曲霉中表达的pDLH0044的构建
野生型VaXET16cDNA经密码子优化并合成用于在米曲霉中表达。构建质粒pDLHD0044以在米曲霉中多拷贝表达密码子优化的VaXET16基因。使用无缝克隆和装配试剂盒(英杰公司,卡尔斯巴德,加利福尼亚州,美国)合并这两种DNA片段来生成质粒pDLHD0044:包含载体pMA中提供的来自的VaXET16合成基因和与片段2同源的侧翼序列的片段1,以及由载体pDLHD0006的反向PCR产物组成的片段2,该载体pDLHD0006包含大肠杆菌pUC复制起点、大肠杆菌β-内酰胺酶(ampR)选择性标记、URA3酵母选择性标记、酵母2微米复制起点、NA2-tpi启动子、黑曲霉淀粉葡糖苷酶终止子序列(AMG终止子)和构巢曲霉乳清苷-5'-磷酸脱羧酶基因(pyrG)作为选择性标记。
使用以下所示的引物614603(正义)和引物614605(反义)扩增片段1。这些引物被设计成包含与片段2同源的序列的侧翼区(小写),用于无连接克隆。
引物614603(正义):
ttcctcaatcctctatatacacaactggccATGGGCTCGTCCCTCTGGAC(SEQ ID NO:60)
引物614605(反义):
agctcgctagagtcgacctaGATGTCCCTATCGCGTGTACACTCG(SEQ ID NO:61)
片段1在反应中通过PCR来扩增,该反应由10ng的pMA-VaXET16、0.5μl的DNA聚合酶、20pmol的引物614603、20pmol的引物614605、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续60秒。将所得0.9kb PCR产物(片段1)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR管中,充分混合,并且在37℃下孵育60分钟。
使用以下所示的引物614604(正义)和引物613247(反义)扩增片段2。
引物614604(正义):
taggtcgactctagcgagctcgagatc(SEQ ID NO:62)
引物613247(反义):
catggccagttgtgtatatagaggattgaggaaggaagag(SEQ ID NO:63)
片段2在反应中通过PCR来扩增,该反应由10ng的pDLHD0006、0.5μl的DNA聚合酶、20pmol的引物614604、20pmol的引物613247、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续4分钟。将所得7.3kb PCR产物(片段2)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR管中,充分混合,并且在37℃下孵育60分钟。
使用无缝克隆和装配试剂盒,将以下程序用于合并两个PCR片段。将PCR片段中的每一种的5μl等分试样添加至微量离心管中,然后添加4μl的水、4μl的5X反应缓冲液(英杰公司,卡尔斯巴德,加利福尼亚州,美国)、和2μl的10X酶混合物(英杰公司,卡尔斯巴德,加利福尼亚州,美国)。将该反应在室温下孵育30分钟。根据制造商的说明书,然后将3μl等分试样的该反应混合物转化到大肠杆菌ONETOP10电转化感受态细胞中。将50μl的转化细胞散布于每ml补充有100μg氨比西林的2X YT板上,并且在37℃下孵育过夜。将转化体各自挑入每ml补充有100μg的氨比西林的3ml的LB培养基中,并且在37℃下在250rpm的振荡下生长过夜。使用旋转迷你制备型试剂盒从菌落中纯化质粒DNA。将使用3130XL遗传分析仪的DNA测序用来确认指定为质粒pDLHD0044的最终质粒中三个片段中的每个的存在(图4)。
实例8:野生型红豆木葡聚糖内糖基转移酶16(VaXET16)的克隆,用于在米曲霉中表达
将密码子优化的野生型VaXET16cDNA(实例7)通过酵母重组克隆克隆,克隆到酿酒酵母/米曲霉Flp/FRT穿梭载体中,生成载体pDLHD0075。
表达载体pDLHD0075被构建为包含大肠杆菌pUC复制起点、大肠杆菌β-内酰胺酶(ampR)可选择标记、URA3酵母可选择标记、酵母2微米复制起点、NA2-tpi启动子、密码子优化飞VaXET16开放阅读框(ORF;DNA序列为SEQ ID NO:51并且推导的氨基酸序列为SEQ IDNO:2)、黑曲霉葡糖淀粉酶终止子、构巢曲霉pyrG选择标记、米曲霉TEF1启动子和米曲霉NIAD终止子之间的酿酒酵母2μm翻转酶ORF、和酿酒酵母2μm翻转酶识别目标FRT-F和FRT-F3。
质粒pDLHD0075通过使用酵母重组克隆合并四个DNA片段而生成:片段1包含翻转酶表达盒、FRT-F3、和来自pDau571(图5;SEQ ID NO:64)的AMG终止子、以及与片段4和2同源的侧翼序列。片段2包含大肠杆菌pUC复制起点、大肠杆菌β-内酰胺酶(ampR)选择标记、URA3酵母选择标记、来自pDLHD0044的酵母2微米复制原点、和与片段1和3同源的侧翼序列。片段3包含所述NA2-tpi启动子、来自pDLHD0044的VaXET16密码子优化基因、和与片段2和4同源的侧翼序列。片段4包含黑曲霉淀粉葡萄糖苷酶终止子序列(AMG终止子)和作为来自pDau571的可选择标记的构巢曲霉乳清苷-5’-磷酸脱羧酶基因(pyrG),以及与片段3和1同源的侧翼序列。
使用以下所示的引物615726(正义)和引物615728(反义)扩增片段1。这些引物被设计成包含分别与片段4和2同源的序列的侧翼区(小写),用于PCR片段之间的无连接克隆。
引物615726(正义):
accgggaggaaggctggaaaGCTTACGAGAAAAGAGTTGGACTTTGAGGG(SEQ ID NO:65)
引物615728(反义):
tgagcgaggaagcggAAGAGCGCCCAATACGCAAACCGCC(SEQ ID NO:66)
片段1在反应中通过PCR来扩增,该反应由10ng的pDau571、0.5μl的DNA聚合酶、20pmol的引物615726、20pmol的引物615728、1μl的10mM dNTPs、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续120秒。将所得3.3kb PCR产物(片段1)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR管中,充分混合,并且在37℃下孵育60分钟。
使用以下所示的引物615729(正义)和引物615731(反义)扩增片段2。这些引物被设计成包含分别与片段1和3同源的序列的侧翼区(小写),用于PCR片段之间的无连接克隆。
引物615729(正义):
tgcgtattgggcgctcttCCGCTTCCTCGCTCACTGACTC(SEQ ID NO:67)
引物615731(反义):
tatactttctagagaataggaactcggaataggaacttcaaGGAACAACACTCAACCCTATCTCGGTC(SEQ ID NO:68)
片段2在反应中通过PCR来扩增,该反应由10ng的pDLHD0044、0.5μl的DNA聚合酶、20pmol的引物615729、20pmol的引物615731、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续120秒。将所得4.2kb PCR产物(片段2)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR管中,充分混合,并且在37℃下孵育60分钟。
使用以下所示的引物615730(正义)和引物615611(反义)扩增片段3。这些引物被设计成包含分别与片段2和4同源的序列的侧翼区(小写),用于PCR片段之间的无连接克隆。
引物615730(正义):
tccgagttcctattctctagaaagtataggaacttcGCATTTATCAGGGTTATTGTCTCATGAGCGG(SEQ ID NO:69)
引物615611(反义):
tctagatctcgagtcaGATGTCCCTATCGCGTGTACACTCG(SEQ ID NO:70)
片段3在反应中通过PCR来扩增,该反应由10ng的pDLHD0044、0.5μl的DNA聚合酶、20pmol的引物615730、20pmol的引物615611、1μl的10mM dNTP、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续120秒。将所得1.7kb PCR产物(片段3)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR管中,充分混合,并且在37℃下孵育60分钟。
使用以下所示的引物615610(正义)和引物615727(反义)扩增片段4。这些引物被设计成包含分别与片段3和1同源的序列的侧翼区(小写),用于PCR片段之间的无连接克隆。
引物615610(正义):
acacgcgatagggacatcTGACTCGAGATCTAGAGGGTGACTGAC(SEQ ID NO:71)
引物615727(反义):
aactcttttctcgtaagcTTTCCAGCCTTCCTCCCGGTAC(SEQ ID NO:72)
片段4在反应中通过PCR来扩增,该反应由10ng的pDau571、0.5μl的DNA聚合酶、20pmol的引物615610、20pmol的引物615727、1μl的10mM dNTPs、10μl的5XHF缓冲液、和35.5μl的水构成。该反应在热循环仪中孵育,程序为1个循环,在98℃下持续30秒;以及30个循环,每个循环在98℃下持续10秒,在60℃下持续10秒,以及在72℃下持续120秒。将所得1.9kb PCR产物(片段4)用1μl的Dpn I进行处理,以去除质粒模板DNA。直接添加Dpn I至PCR管中,充分混合,并且在37℃下孵育60分钟。
使用基于酵母同源性的重组克隆,使用以下程序来合并四个PCR片段。将PCR片段的每种的10μl等分试样与来自鲑鱼睾丸的100μg的单链脱氧核糖核酸(西格玛奥德里奇,圣路易斯,密苏里州,美国)、100μl的菌株YNG318的感受态酵母细胞(酿酒酵母ATCC 208973)、和600μl的PLATE缓冲液(西格玛奥德里奇,圣路易斯,密苏里州,美国)合并,并且混合。将反应在30℃下以200rpm振荡孵育30分钟。然后将该反应在42℃下在没有振荡的情况下继续15分钟。将这些细胞通过在5,000x g下离心1分钟进行沉淀,并且弃去上清液。将细胞球粒悬浮于200μl的高压蒸汽处理的水中,并且分在两个包含合成的所定义的培养基缺少尿苷的琼脂平板,并且在30℃下孵育3天。将这些酵母菌落使用1ml的高压蒸汽处理的水从平板中分离。将这些细胞通过在13,000x g下离心30秒进行沉淀,并且将100μl等分试样的玻璃珠添加到该管中。将细胞和珠混合物悬浮在250μl的P1缓冲液(凯杰公司,巴伦西亚,加利福尼亚州,美国)中,并且然后涡旋1分钟来裂解这些细胞。使用旋转迷你制备型试剂盒纯化质粒DNA。根据制造商的说明,然后将3μl等分试样的质粒DNA转化到大肠杆菌ONETOP10电转化感受态细胞中。将50μl的转化细胞散布于每ml补充有100μg氨比西林的2X YT板上,并且在37℃下孵育过夜。将转化体各自挑入每ml补充有100μg的氨比西林的3ml的LB培养基中,并且在37℃下在250rpm的振荡下生长过夜。使用旋转迷你制备型试剂盒从菌落中纯化质粒DNA。将使用3130XL遗传分析仪的DNA测序用来确认指定为质粒pDLHD0075的最终质粒中三个片段中的每个的存在(图6)。
实例9:在米曲霉菌株JaL1394中野生型红豆木葡聚糖内糖基转移酶16(VaXET16)以单拷贝表达的确认
使用利用酿酒酵母2μm质粒翻转酶识别靶标(FRT)和重组酶(Flp)系统以产生高效率单拷贝靶向转化系统的米曲霉菌株JaL1394(WO2012/160093)用于筛选基因变体文库。酿酒酵母的Flp-FRT系统是位点特异性重组系统,其可用于将感兴趣的DNA插入感兴趣的宿主有机体的基因组中的已知位置。米曲霉菌株JaL1394先前已被工程化为在AmyB基因座中拥有FRT-F和FRT-F3翻转酶识别靶序列,其中AmyB ORF已经缺失。
用包含密码子优化的VaXET16基因的质粒pDLHD0075转化米曲霉JaL1394。将来自米曲霉JaL1394的大约107个孢子接种于500ml摇瓶中的补充有10mM尿苷的100ml的YP+2%葡萄糖培养基中,并且在28℃和110rpm下孵育过夜。将10ml的过夜培养物在125ml无菌真空过滤器中过滤,并且将菌丝用50ml的0.7M KCl-20mM CaCl2洗涤两次。将剩余液体通过真空过滤去除,留下垫在滤器上。将菌丝体再悬浮于10ml的0.7M KCl-20mM CaCl2中,并且转移到无菌125ml摇瓶中,该摇瓶包含20mg的200G(诺维信瑞士股份公司(Novozymes Switzerland AG),Neumatt,瑞士)/ml和0.2mg的几丁质酶(西格玛奥德里奇,圣路易斯,密苏里州,美国)/ml(在10ml的0.7M KCl-20mM CaCl2中)。将该混合物在37℃和100rpm下孵育30-90分钟,直到从菌丝体中产生原生质体。将该原生质体混合物通过衬有(Calbiochem公司,圣迭哥,加利福尼亚州,美国)的无菌漏斗进行过滤,到无菌50ml塑料离心管中,以除去菌丝体碎片。将在上的碎片彻底地用0.7MKCl-20mM CaCl2进行洗涤并且在2500rpm下,在20℃-23℃下,离心10分钟。去除该上清液,并且将原生质体球粒再悬浮于20ml的1M山梨醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)中。将该步骤重复两次,并且将最终的原生质体球粒再悬浮于1M山梨醇-10mM CaCl2-10mMTris-HCl(pH 6.5)中,以获得2x 107/ml的最终原生质体浓度。
通过添加两μg的pDLHD0075至无菌12ml塑料离心管的底部来转化原生质体。将一百μl的原生质体添加至管中,随后添加在10mM CaCl2-10mM Tris-HCl(pH 6.5)中的300μl的60%PEG-4000。将该管用手轻轻混合,并且在37℃下孵育30分钟。将添加五ml的1M山梨糖醇-10mM CaCl2-10mM Tris-HCl(pH 6.5)添加到该转化中,并且将该混合物转移到150mm基本培养基琼脂平板上。将转化板在37℃下孵育直到转化体出现。
挑出单个转化体到新基本培养基琼脂平板,并且在37℃下培养4天,直到转化体形成孢子。新鲜孢子转移到48孔深孔板,这些板包含2ml的YP+2%麦芽糊精培养基,覆盖有可透气密封件,并且在没有振荡下在28℃下生长4天。在4天生长后,将每个转化体的培养基针对根据实例1的木葡聚糖内糖基转移酶活性并且针对木葡聚糖内糖基转移酶表达通过SDS-PAGE来测定。
活性测定展示,这些转化体产生活性木葡聚糖内糖基转移酶。
使用8%-16%无染色SDS-PAGE凝胶(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)进行SDS-PAGE,并且用无染色成像仪(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)进行凝胶成像。SDS-PAGE揭示了大约32kDa的野生型VaXET16带。
实例10:红豆木葡聚糖内糖基转移酶16(VaXET16)的改进的表达变体的构建和鉴定
VaXET16基因突变体文库通过位点饱和诱变构建。将VaXET16基因的突变体文库(文库的每个片段包括突变体VaXET16基因+构巢曲霉乳清苷-5’-磷酸脱羧酶pyrG选择标记与FRT-F和FRT-F3翻转酶识别靶序列)与一μg的编码米曲霉TEF1启动子和米曲霉niaD基因终止子之间的酿酒酵母2μm翻转酶ORF的载体pDLHD0095(图7)一起转化到如实例9中所述的米曲霉JaL1394的原生质体中。37℃下在基本培养基琼脂平板上原生质体恢复4天后,挑出单个菌落至包含2ml的YP+2%麦芽糖糊精培养基的48孔深孔板中,覆盖有透气密封,并且在没有振荡下在28℃下生长4天。在液体培养基生长4天后,如在实例1中所述测定木葡聚糖内糖基转移酶活性,并且更高活性变体被打分为表达命中。
孢子纯化单个突变体菌株,并且如上所述再次培养以产生新鲜培养液,用于使用密码子优化基因,相对于表达野生型VaXET16的米曲霉JaL1394菌株进行再次测试。如在实例9中所述,通过SDS-PAGE分析培养液,用于增加木葡聚糖内糖基转移酶蛋白产物的生产。
十一个表征的变体在来自48孔深孔板培养的4天培养液中,优于亲本基因的表达产量的相对改进在下表II中示出。相同的培养液的SDS-PAGE分析展示所有变体的优于野生型VaXET的增加强度的VaXET带,这与在活性测定中观察到的相对改进很好地相关。野生型VaXET及其变体的SDS-PAGE带为32kDa,除包含N175S突变的变体由于另外的糖基化具有大约37kDa的带。
表II.
实例11:米曲霉中红豆木葡聚糖内糖基转移酶16变体(VaXET16)基因的改进的表达的发酵规模确认
发酵工艺被用来相对于野生型VaXET16,表达VaXET16变体、A40G+I53A+N175S和A40G+F183I。
摇瓶培养基由以下构成:50g的蔗糖、10g的KH2PO4、0.5g的CaCl2、2g的MgSO4·7H2O、2g的K2SO4、2g的尿素、10g的酵母提取物、2g的柠檬酸、0.5ml的痕量金属溶液、以及去离子水补足至1升。痕量金属溶液由以下构成:13.8g的FeSO4·7H2O、14.3g的ZnSO4·7H2O、8.5g的MnSO4·H2O、2.5g的CuSO4·5H2O、3g的柠檬酸、以及去离子水补足至1升。
将一百ml的摇瓶培养基添加至500ml摇瓶。用7ml的0.01%80与从固体平板培养刮下的孢子与一起接种摇瓶,并且在轨道摇床上以200rpm在34℃下孵育24小时。将50ml的烧瓶培养液用于接种3升发酵容器。
每升分批发酵培养基(Fermentation batch medium)由以下构成:10g的酵母提取物、24g的蔗糖、5g的(NH4)2SO4、2g的KH2PO4、0.5g的CaCl2·2H2O、2g的MgSO4.7H2O、1g的柠檬酸、2g的K2SO4、0.5ml的止泡剂、和0.5ml的痕量金属溶液。每升痕量金属溶液由以下构成:13.8g的FeSO4·7H2O、14.3g的ZnSO4·7H2O、8.5g的MnSO4·H2O、2.5g的CuSO4·5H2O,和3g的柠檬酸。发酵补料培养基(fermentation feed medium)由麦芽糖构成。
将总计1.8升的发酵分批培养基添加到三升玻璃套发酵器中。发酵补料培养基以0到8.0g/l/hr的速度给予。将发酵容器维持在34℃的温度,pH控制在6.1+/-0.1的设定点。将空气以1vvm的速率添加到容器中,并用以1100rpm旋转的Rushton叶轮搅拌培养液。在发酵运行的第2、3、4、5、6和7天取样,并且在3000x g离心以去除生物质。将上清液过滤灭菌,并且在-20℃下储存。
通过荧光偏振测定(实例3)并且通过SDS-PAGE分析(实例9),相对于野生型密码子优化基因,确定VaXET16变体表达水平。
相对于野生型VaXET16,对于两个变体的7天培养液,优于亲本基因,产量相对改进在下表III中示出。按比野生型VaXET16 3.1X更大的量产生变体A40G+I53A+N175S,而按比野生型VaXET16 1.2X更大的量产生变体A40G+F183I。相同的培养液的SDS-PAGE分析示出两个变体的优于野生型VaXET的增加强度的VaXET带这与在活性测定中观察到的相对改进很好地相关。在第2、3、4、5、6、和7天所取的样品的SDS-PAGE分析示出VaXET的增加的生产,并且各变体日益增强,其中在第7天最强。
表III.
本发明通过以下编号的段落来进一步说明:
[1]一种木葡聚糖内糖基转移酶变体,该变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个位置处的取代,其中该变体具有木葡聚糖内糖基转移酶活性,并且其中该变体与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%、但小于100%序列一致性。
[2]如段落1所述的变体,该变体是亲本木葡聚糖内糖基转移酶的变体,其中该亲本选自下组,该组由以下各项组成:
(a)一种多肽,该多肽与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽具有至少60%序列一致性;
(b)由一种多核苷酸编码的多肽,该多核苷酸在至少低严格条件下与(i)SEQ IDNO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列,或(ii)(i)的全长互补体杂交;
(c)由一种多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列具有至少60%一致性;以及
(d)SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽的片段,该片段具有木葡聚糖内糖基转移酶活性。
[3]如段落2所述的变体,其中该亲本木葡聚糖内糖基转移酶与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽具有至少60%,例如,至少65%、至少70%、至少60%、至少80%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
[4]如段落2或3所述的变体,其中该亲本木葡聚糖内糖基转移酶由以下多核苷酸编码,该多核苷酸在低严格条件下、中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与(i)SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列或者(ii)(i)的全长互补体杂交。
[5]如段落2-4中任一项所述的变体,其中该亲本木葡聚糖内糖基转移酶由以下多核苷酸编码,该多核苷酸与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列具有至少60%,例如,至少65%、至少70%、至少60%、至少80%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[6]如段落2-5中任一项所述的变体,其中该亲本木葡聚糖内糖基转移酶包括SEQID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽或由其组成。
[7]如段落2-6中任一项所述的变体,其中该亲本木葡聚糖内糖基转移酶是SEQ IDNO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽的一个片段,其中该片段具有木葡聚糖内糖基转移酶活性。
[8]如段落2-7中任一项所述的变体,该变体与该亲本木葡聚糖内糖基转移酶的氨基酸序列具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[9]如段落1-8中任一项所述的变体,其中该变体由亲本的至少85%、至少90%、或至少95%的氨基酸组成。
[10]如段落1-9中任一项所述的变体,其中取代的数目是1-17个,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个取代。
[11]如段落1-10中任一项所述的变体,该变体包括与位置10相对应的位置处的一个取代。
[12]如段落11所述的变体,其中该取代是用Ala进行的。
[13]如段落1-12中任一项所述的变体,该变体包括与位置30相对应的位置处的一个取代。
[14]如段落13所述的变体,其中该取代是用Glu进行的。
[15]如段落1-14中任一项所述的变体,该变体包括与位置40相对应的位置处的一个取代。
[16]如段落15所述的变体,其中该取代是用Gly进行的。
[17]如段落1-16中任一项所述的变体,该变体包括与位置51相对应的位置处的一个取代。
[18]如段落17所述的变体,其中该取代是用Thr进行的。
[19]如段落1-18中任一项所述的变体,该变体包括与位置53相对应的位置处的一个取代。
[20]如段落19所述的变体,其中该取代是用Ala或Val进行的。
[21]如段落1-20中任一项所述的变体,该变体包括与位置60相对应的位置处的一个取代。
[22]如段落21所述的变体,其中该取代是用Ser进行的。
[23]如段落1-22中任一项所述的变体,该变体包括与位置99相对应的位置处的一个取代。
[24]如段落23所述的变体,其中该取代是用Glu或Asn进行的。
[25]如段落1-24中任一项所述的变体,该变体包括与位置102相对应的位置处的一个取代。
[26]如段落25所述的变体,其中该取代是用Gly进行的。
[27]如段落1-26中任一项所述的变体,该变体包括与位置117相对应的位置处的一个取代。
[28]如段落27所述的变体,其中该取代是用Glu进行的。
[29]如段落1-28中任一项所述的变体,该变体包括与位置130相对应的位置处的一个取代。
[30]如段落29所述的变体,其中该取代是用Arg进行的。
[31]如段落1-30中任一项所述的变体,该变体包括与位置136相对应的位置处的一个取代。
[32]如段落31所述的变体,其中该取代是用Trp进行的。
[33]如段落1-32中任一项所述的变体,该变体包括与位置157相对应的位置处的一个取代。
[34]如段落33所述的变体,其中该取代是用His进行的。
[35]如段落1-34中任一项所述的变体,该变体包括与位置162相对应的位置处的一个取代。
[36]如段落35所述的变体,其中该取代是用Cys进行的。
[37]如段落1-36中任一项所述的变体,该变体包括与位置175相对应的位置处的一个取代。
[38]如段落37所述的变体,其中该取代是用Ser、Gly或Gln进行的。
[39]如段落1-38中任一项所述的变体,该变体包括与位置183相对应的位置处的一个取代。
[40]如段落39所述的变体,其中该取代是用Ile进行的。
[41]如段落1-40中任一项所述的变体,该变体包括与位置254相对应的位置处的一个取代。
[42]如段落41所述的变体,其中该取代是用Glu进行的。
[43]如段落1-42中任一项所述的变体,该变体包括与位置280相对应的位置处的一个取代。
[44]如段落43所述的变体,其中该取代是用Gly或Glu进行的。
[45]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的两个位置处的取代。
[46]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的三个位置处的取代。
[47]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的四个位置处的取代。
[48]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的五个位置处的取代。
[49]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的六个位置处的取代。
[50]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的七个位置处的取代。
[51]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的八个位置处的取代。
[52]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的九个位置处的取代。
[53]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的十个位置处的取代。
[54]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280的中的任一个相对应十一个位置处的取代。
[55]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的十二个位置处的取代。
[56]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的十三个位置处的取代。
[57]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的十四个位置处的取代。
[58]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280中的任一个相对应的十五个位置处的取代。
[59]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280相对应的十六个位置处的取代。
[60]如段落1-44中任一项所述的变体,该变体包括与位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254和280相对应的各个位置处的取代。
[61]如段落1-60中任一项所述的变体,该变体包括选自下组的一个或多个取代,该组由以下各项组成:I10A;P30E;A40G;S51T;I53A,V;Y60S;T99E,N;E102G;Q117E;K130R;R136W;Y157H;Y162C;N175S,G,Q;F183I;A254E;以及S280G,E。
[62]如段落61所述的变体,该变体包括A40G+N175S或由其组成。
[63]如段落61所述的变体,该变体包括A40G+F183I或由其组成。
[64]如段落61所述的变体,该变体包括N175G+S280G或由其组成。
[65]如段落61所述的变体,该变体包括A40G+I53A+N175S或由其组成。
[66]如段落61所述的变体,该变体包括A40G+N175S+F183I或由其组成。
[67]如段落61所述的变体,该变体包括取代I10A+I53A+E102G或由其组成。
[68]如段落61所述的变体,该变体包括A40G+E102G+Q117E或由其组成。
[69]如段落61所述的变体,该变体包括N175Q+A254E+S280E或由其组成。
[70]如段落61所述的变体,该变体包括P30E+S51T+Y60S+T99N或由其组成。
[71]如段落61所述的变体,该变体包括A40G+T99E+E102G+K130R或由其组成。
[72]如段落61所述的变体,该变体包括I53V+R136W+Y157H+Y162C+N175S或由其组成。
[73]如段落1-72中任一项所述的变体,该变体相对于该亲本具有增加的表达产量。
[74]如段落1-73中任一项所述的变体,其中相对于该亲本,该变体的表达产量是至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加。
[75]一种编码如段落1-74中任一项所述的变体的分离的多核苷酸。
[76]一种核酸构建体,其包含如段落75所述的多核苷酸。
[77]一种表达载体,其包括如段落75所述的多核苷酸。
[78]一种重组宿主细胞,其包含如段落75所述的多核苷酸。
[79]一种产生木葡聚糖内糖基转移酶变体的方法,该方法包括:在适合于该变体表达的条件下培养如段落78所述的重组宿主细胞;以及
[80]如段落79所述的方法,该方法进一步包括回收该变体。
[81]一种用于获得木葡聚糖内糖基转移酶变体的方法,该方法包括将与SEQ IDNO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个位置处的取代引入亲本木葡聚糖内糖基转移酶,其中该变体具有木葡聚糖内糖基转移酶活性。
[82]如段落81所述的方法,该方法进一步包括回收该变体。
[83]一种增加木葡聚糖内糖基转移酶的表达产量的方法,该方法包括将与SEQ IDNO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个位置处的取代引入亲本木葡聚糖内糖基转移酶,其中该变体的表达产量相对于亲本是增加的。
[84]如段落83所述的方法,其中相对于该亲本,该变体的表达产量是至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加。
[85]如段落84或85所述的方法,该方法进一步包括回收该变体。
[86]一种酶组合物,包括如段落1-74中任一项所述的变体。
[87]一种全培养液配制品或细胞培养组合物,包括如段落1-74中任一项所述的变体。
[88]如段落1-74中任一项所述的变体的用途。
在此描述并且要求保护的本发明不局限于在此披露的特定方面的范围,因为这些方面旨在作为本发明若干方面的说明。预期任何等效方面都处于本发明的范围内。实际上,除在此所示和描述的那些之外,本发明的不同修改对于本领域普通技术人员而言从前述描述将变得清楚。这样的修改也旨在落入所附权利要求的范围内。在有冲突的情况下,以包括定义的本披露为准。
序列表
<110> 诺维信公司(Novozymes A/S)
赫尔德(Held), 丹尼尔(Daniel)
<120> 木葡聚糖内糖基转移酶变体以及编码其的多核苷酸
<130> 12915-WO-PCT
<150> US 62/039,744
<151> 2014-08-20
<160> 72
<170> PatentIn版本3.5
<210> 1
<211> 876
<212> DNA
<213> 红豆(Vigna angularis)
<400> 1
atgggttctt ctttgtggac ttgtctgatt ctgttatcac tggcttctgc ttctttcgct 60
gccaacccaa gaactccaat tgatgtacca tttggcagaa actatgtgcc tacttgggcc 120
tttgatcata tcaaatatct caatggaggt tctgagattc agcttcatct cgataagtac 180
actggtactg gattccagtc caaagggtca tacttgtttg gtcacttcag catgtacata 240
aaattggttc ctggtgattc agctggcaca gtcactgctt tctatttatc gtccacaaac 300
gcagaacatg atgaaataga cttcgagttc ttgggaaaca gaactgggca accatacatt 360
ttacaaacaa atgtgttcac cggaggcaaa ggtgacagag agcagagaat ctacctctgg 420
tttgacccta cgactcaata ccacagatat tcagtgctat ggaacatgta ccagattgta 480
ttctatgtgg atgactaccc aataagggtg ttcaagaaca gcaatgactt gggagtgaag 540
ttccccttca atcaaccaat gaaaatatac aacagtttgt ggaatgcaga tgactgggct 600
acaaggggtg gtttggagaa aacagattgg tccaaagccc ccttcatagc ctcttacaag 660
ggcttccaca ttgatgggtg tgaggcctca gtgaatgcca agttctgtga cacacaaggc 720
aagaggtggt gggatcaacc agagtttcgt gaccttgatg ctgctcagtg gcaaaaactg 780
gcttgggtac gcaacaaata caccatctac aactactgca ctgatcgcaa acgctactct 840
caagtccctc cagagtgcac cagagaccgt gacatt 876
<210> 2
<211> 292
<212> PRT
<213> 红豆(Vigna angularis)
<400> 2
Met Gly Ser Ser Leu Trp Thr Cys Leu Ile Leu Leu Ser Leu Ala Ser
1 5 10 15
Ala Ser Phe Ala Ala Asn Pro Arg Thr Pro Ile Asp Val Pro Phe Gly
20 25 30
Arg Asn Tyr Val Pro Thr Trp Ala Phe Asp His Ile Lys Tyr Leu Asn
35 40 45
Gly Gly Ser Glu Ile Gln Leu His Leu Asp Lys Tyr Thr Gly Thr Gly
50 55 60
Phe Gln Ser Lys Gly Ser Tyr Leu Phe Gly His Phe Ser Met Tyr Ile
65 70 75 80
Lys Leu Val Pro Gly Asp Ser Ala Gly Thr Val Thr Ala Phe Tyr Leu
85 90 95
Ser Ser Thr Asn Ala Glu His Asp Glu Ile Asp Phe Glu Phe Leu Gly
100 105 110
Asn Arg Thr Gly Gln Pro Tyr Ile Leu Gln Thr Asn Val Phe Thr Gly
115 120 125
Gly Lys Gly Asp Arg Glu Gln Arg Ile Tyr Leu Trp Phe Asp Pro Thr
130 135 140
Thr Gln Tyr His Arg Tyr Ser Val Leu Trp Asn Met Tyr Gln Ile Val
145 150 155 160
Phe Tyr Val Asp Asp Tyr Pro Ile Arg Val Phe Lys Asn Ser Asn Asp
165 170 175
Leu Gly Val Lys Phe Pro Phe Asn Gln Pro Met Lys Ile Tyr Asn Ser
180 185 190
Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly Leu Glu Lys Thr
195 200 205
Asp Trp Ser Lys Ala Pro Phe Ile Ala Ser Tyr Lys Gly Phe His Ile
210 215 220
Asp Gly Cys Glu Ala Ser Val Asn Ala Lys Phe Cys Asp Thr Gln Gly
225 230 235 240
Lys Arg Trp Trp Asp Gln Pro Glu Phe Arg Asp Leu Asp Ala Ala Gln
245 250 255
Trp Gln Lys Leu Ala Trp Val Arg Asn Lys Tyr Thr Ile Tyr Asn Tyr
260 265 270
Cys Thr Asp Arg Lys Arg Tyr Ser Gln Val Pro Pro Glu Cys Thr Arg
275 280 285
Asp Arg Asp Ile
290
<210> 3
<211> 861
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 3
atggcgtgtt tcgcaaccaa acagcctctg ttgttgtctc tcctccttgc cattggcttc 60
tttgtggtgg ctgcatctgc cggaaacttc tatgagagct ttgatatcac ttggggtaat 120
ggtcgtgcca acatattcga gaatggacag cttctcactt gtactcttga caaggtctcc 180
ggctcaggtt ttcaatccaa gaaggagtac ttgtttggta agatcgacat gaagctcaag 240
cttgtcgctg gaaactctgc tggcaccgtc accgcctact acctatcgtc aaaaggcacg 300
gcatgggatg agattgactt cgagtttttg ggaaatcgca caggacatcc ttacactatc 360
cacaccaatg tgttcaccgg aggtaaaggc gaccgtgaga tgcagttccg tctctggttc 420
gatcccactg cggatttcca cacctacacc gtccactgga accctgttaa catcatcttc 480
cttgtggatg ggatcccaat tcgggtgttc aagaacaacg agaaaaatgg ggtggcttac 540
cctaagaacc agccgatgag gatatactca agcctttggg aagccgatga ctgggctaca 600
gaaggcggtc gcgtgaagat cgactggagc aacgcaccat tcaaggcctc ttacagaaac 660
ttcaacgacc aaagctcatg cagcaggaca tcaagctcaa aatgggtgac ttgcgagcca 720
aacagcaact cgtggatgtg gacgactctc aatcctgccc agtacggaaa aatgatgtgg 780
gtgcaacgag acttcatgat ctacaactat tgtaccgatt ttaagagatt ccctcaaggc 840
ctccccaagg agtgtaaact t 861
<210> 4
<211> 287
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 4
Met Ala Cys Phe Ala Thr Lys Gln Pro Leu Leu Leu Ser Leu Leu Leu
1 5 10 15
Ala Ile Gly Phe Phe Val Val Ala Ala Ser Ala Gly Asn Phe Tyr Glu
20 25 30
Ser Phe Asp Ile Thr Trp Gly Asn Gly Arg Ala Asn Ile Phe Glu Asn
35 40 45
Gly Gln Leu Leu Thr Cys Thr Leu Asp Lys Val Ser Gly Ser Gly Phe
50 55 60
Gln Ser Lys Lys Glu Tyr Leu Phe Gly Lys Ile Asp Met Lys Leu Lys
65 70 75 80
Leu Val Ala Gly Asn Ser Ala Gly Thr Val Thr Ala Tyr Tyr Leu Ser
85 90 95
Ser Lys Gly Thr Ala Trp Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn
100 105 110
Arg Thr Gly His Pro Tyr Thr Ile His Thr Asn Val Phe Thr Gly Gly
115 120 125
Lys Gly Asp Arg Glu Met Gln Phe Arg Leu Trp Phe Asp Pro Thr Ala
130 135 140
Asp Phe His Thr Tyr Thr Val His Trp Asn Pro Val Asn Ile Ile Phe
145 150 155 160
Leu Val Asp Gly Ile Pro Ile Arg Val Phe Lys Asn Asn Glu Lys Asn
165 170 175
Gly Val Ala Tyr Pro Lys Asn Gln Pro Met Arg Ile Tyr Ser Ser Leu
180 185 190
Trp Glu Ala Asp Asp Trp Ala Thr Glu Gly Gly Arg Val Lys Ile Asp
195 200 205
Trp Ser Asn Ala Pro Phe Lys Ala Ser Tyr Arg Asn Phe Asn Asp Gln
210 215 220
Ser Ser Cys Ser Arg Thr Ser Ser Ser Lys Trp Val Thr Cys Glu Pro
225 230 235 240
Asn Ser Asn Ser Trp Met Trp Thr Thr Leu Asn Pro Ala Gln Tyr Gly
245 250 255
Lys Met Met Trp Val Gln Arg Asp Phe Met Ile Tyr Asn Tyr Cys Thr
260 265 270
Asp Phe Lys Arg Phe Pro Gln Gly Leu Pro Lys Glu Cys Lys Leu
275 280 285
<210> 5
<211> 882
<212> DNA
<213> 欧洲山杨(Populus tremula) x 美洲山杨(Populus tremuloides)
<400> 5
atggctgctg cttatccgtg gactttgttt cttggcatgc tggttatggt atctggaaca 60
atgggagctg ccctgaggaa gccagtggat gtggcgttcg gtaggaacta tgttcctaca 120
tgggcttttg accacattaa gtacttcaat ggaggcaatg agattcagct gcacttggat 180
aaatacacag gtactggttt ccaatcaaaa ggttcatact tatttggcca tttcagtatg 240
caaatgaagt tggttcctgg tgactcagct ggaacagtca ctgctttcta tctatcctca 300
caaaactcgg agcatgacga gatagacttt gagttcttag gaaacaggac tggccagccc 360
tacattttgc agacaaatgt tttcacagga ggcaaggggg atagagaaca gaggatttac 420
ctctggtttg acccaaccaa ggaattccac tactattctg tcctctggaa catgtacatg 480
atagtgttcc tcgtggatga cgtgccaatc agagtgttca agaactgcaa agatttggga 540
gttaagtttc cattcaacca gccaatgaag atctactcaa gcctatggaa tgccgatgat 600
tgggctacca ggggtggact cgagaagaca gactggtcca aggcaccgtt cattgcctcc 660
tacaggagct tccacataga tgggtgcgag gcctccgtgg aagccaagtt ctgcgccaca 720
cagggtgcta gatggtggga ccagaaggag ttccaagatc tggatgcctt ccagtacagg 780
aggctcagct gggtccgcca gaaatatacc atctacaatt actgcactga tagatcaaga 840
tacccttcaa tgcccccaga atgcaagaga gacagagaca ta 882
<210> 6
<211> 294
<212> PRT
<213> 欧洲山杨(Populus tremula) x 美洲山杨(Populus tremuloides)
<400> 6
Met Ala Ala Ala Tyr Pro Trp Thr Leu Phe Leu Gly Met Leu Val Met
1 5 10 15
Val Ser Gly Thr Met Gly Ala Ala Leu Arg Lys Pro Val Asp Val Ala
20 25 30
Phe Gly Arg Asn Tyr Val Pro Thr Trp Ala Phe Asp His Ile Lys Tyr
35 40 45
Phe Asn Gly Gly Asn Glu Ile Gln Leu His Leu Asp Lys Tyr Thr Gly
50 55 60
Thr Gly Phe Gln Ser Lys Gly Ser Tyr Leu Phe Gly His Phe Ser Met
65 70 75 80
Gln Met Lys Leu Val Pro Gly Asp Ser Ala Gly Thr Val Thr Ala Phe
85 90 95
Tyr Leu Ser Ser Gln Asn Ser Glu His Asp Glu Ile Asp Phe Glu Phe
100 105 110
Leu Gly Asn Arg Thr Gly Gln Pro Tyr Ile Leu Gln Thr Asn Val Phe
115 120 125
Thr Gly Gly Lys Gly Asp Arg Glu Gln Arg Ile Tyr Leu Trp Phe Asp
130 135 140
Pro Thr Lys Glu Phe His Tyr Tyr Ser Val Leu Trp Asn Met Tyr Met
145 150 155 160
Ile Val Phe Leu Val Asp Asp Val Pro Ile Arg Val Phe Lys Asn Cys
165 170 175
Lys Asp Leu Gly Val Lys Phe Pro Phe Asn Gln Pro Met Lys Ile Tyr
180 185 190
Ser Ser Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly Leu Glu
195 200 205
Lys Thr Asp Trp Ser Lys Ala Pro Phe Ile Ala Ser Tyr Arg Ser Phe
210 215 220
His Ile Asp Gly Cys Glu Ala Ser Val Glu Ala Lys Phe Cys Ala Thr
225 230 235 240
Gln Gly Ala Arg Trp Trp Asp Gln Lys Glu Phe Gln Asp Leu Asp Ala
245 250 255
Phe Gln Tyr Arg Arg Leu Ser Trp Val Arg Gln Lys Tyr Thr Ile Tyr
260 265 270
Asn Tyr Cys Thr Asp Arg Ser Arg Tyr Pro Ser Met Pro Pro Glu Cys
275 280 285
Lys Arg Asp Arg Asp Ile
290
<210> 7
<211> 891
<212> DNA
<213> 玉蜀黍(Zea mays)
<400> 7
atggcgacgg cgcggtggct gcaggttgcc gccatggcgg tggcgctgct ggcggagtgg 60
gcgacggcgg cggcgcctcg gaagcccgtg gacgtgccgt tccagaagaa ctacgtgccg 120
acgtgggcgc aggaccacat ccactacatc gacggcgggc gggaggtgca gctgtacctg 180
gacaagtcca ccggcacggg cttccagacg cggggctcct acctcttcgg ccacttcagc 240
atgcacatga agctcgtcgg cggcgactcc gcgggcaccg tcacggcctt ctacctgtcg 300
tcgcagaact cggagcacga cgagatcgac ttcgagttcc tgggcaaccg gacggggcag 360
ccctacatcc tgcagaccaa cgtgttcacc ggcggcaagg gcgaccgcga gcagcggatc 420
tacctctggt tcgaccccac caaggagtac cactcctact ccgtcctctg gaacctctac 480
atgatcgcgt tcttcgtgga cgacgtgccg atccgggtgt tcaagaacac gagcgccgac 540
ctgggcgtgc ggtacccgtt cagccagccg atgaagctct actccagcct gtggaacgcc 600
gacgactggg cgacccgcgg cgggcgcgag aagacggact ggtccaacgc gcccttcgtc 660
gcctcctacc gcggcttcca cgtcgacggc tgcgaggcct ccgcggaggc gcgcttctgc 720
gccacccagg gcgcgcgctg gtgggaccag ccggagttca gggacctcga cgccgcgcag 780
taccgccgcc tggccgaggt caggcgccgc tacaccatct acaactactg caccgatcgc 840
gaccgctacg gcgccgccgt gccgcccgag tgcgcccgcg accgcgacgt c 891
<210> 8
<211> 297
<212> PRT
<213> 玉蜀黍(Zea mays)
<400> 8
Met Ala Thr Ala Arg Trp Leu Gln Val Ala Ala Met Ala Val Ala Leu
1 5 10 15
Leu Ala Glu Trp Ala Thr Ala Ala Ala Pro Arg Lys Pro Val Asp Val
20 25 30
Pro Phe Gln Lys Asn Tyr Val Pro Thr Trp Ala Gln Asp His Ile His
35 40 45
Tyr Ile Asp Gly Gly Arg Glu Val Gln Leu Tyr Leu Asp Lys Ser Thr
50 55 60
Gly Thr Gly Phe Gln Thr Arg Gly Ser Tyr Leu Phe Gly His Phe Ser
65 70 75 80
Met His Met Lys Leu Val Gly Gly Asp Ser Ala Gly Thr Val Thr Ala
85 90 95
Phe Tyr Leu Ser Ser Gln Asn Ser Glu His Asp Glu Ile Asp Phe Glu
100 105 110
Phe Leu Gly Asn Arg Thr Gly Gln Pro Tyr Ile Leu Gln Thr Asn Val
115 120 125
Phe Thr Gly Gly Lys Gly Asp Arg Glu Gln Arg Ile Tyr Leu Trp Phe
130 135 140
Asp Pro Thr Lys Glu Tyr His Ser Tyr Ser Val Leu Trp Asn Leu Tyr
145 150 155 160
Met Ile Ala Phe Phe Val Asp Asp Val Pro Ile Arg Val Phe Lys Asn
165 170 175
Thr Ser Ala Asp Leu Gly Val Arg Tyr Pro Phe Ser Gln Pro Met Lys
180 185 190
Leu Tyr Ser Ser Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly
195 200 205
Arg Glu Lys Thr Asp Trp Ser Asn Ala Pro Phe Val Ala Ser Tyr Arg
210 215 220
Gly Phe His Val Asp Gly Cys Glu Ala Ser Ala Glu Ala Arg Phe Cys
225 230 235 240
Ala Thr Gln Gly Ala Arg Trp Trp Asp Gln Pro Glu Phe Arg Asp Leu
245 250 255
Asp Ala Ala Gln Tyr Arg Arg Leu Ala Glu Val Arg Arg Arg Tyr Thr
260 265 270
Ile Tyr Asn Tyr Cys Thr Asp Arg Asp Arg Tyr Gly Ala Ala Val Pro
275 280 285
Pro Glu Cys Ala Arg Asp Arg Asp Val
290 295
<210> 9
<211> 882
<212> DNA
<213> 大麦(Hordeum vulgare)
<400> 9
atgaaggcta ccgcgggggc cctcctcgcc gtggtggcca cggtgctact gcgaggcatc 60
gcggcagcgc cgccccggaa gccggtggac gtgccattcg agaagaacta cgtcccgaca 120
tgggcggagg accacatcca ctacgtgaac ggcggacggg aggtgcagct gtccctcgac 180
aagaccaccg gcactggctt ccagacccgg ggctcctacc tcttcggcca cttcagcatg 240
cacatcaagc tcgtcggcgg cgactccgcc ggcacagtca ccgccttcta cctgtcgtcg 300
cagaactcgg agcacgacga gatcgacttc gagttcttgg ggaacaggac ggggcagccg 360
tacatcctgc agacgaacgt gttctccggc gggaagggcg accgggaaca gaggatctac 420
ctctggttcg acccaaccaa ggactaccac tcctactccg tcctctggaa cctctacatg 480
atcgcgttct ttgtggacga cacgccgatc cgggtgttca agaacagcaa ggacctcggc 540
gtgcggtacc ccttcgacca gcctatgaag ctctactcga gcctgtggaa cgcggacgac 600
tgggcgactc ggggagggcg ggagaagacg gactggtcca aggcgccctt cgtcgcctcc 660
taccggggct tccacgtcga cggctgcgag gcgtcggcgg aggccaagtt gtgcgccacc 720
cagggcgccc gctggtggga tcagcccgag ttccaggacc tggacgccgc gcagtaccgc 780
cgcctcgcct gggtcaggaa ggagcacacc atctacaact actgcacaga ccgcgaacga 840
tacgccgcca tgtcgcccga gtgcaaacgc gaccgcgacg tc 882
<210> 10
<211> 294
<212> PRT
<213> 大麦(Hordeum vulgare)
<400> 10
Met Lys Ala Thr Ala Gly Ala Leu Leu Ala Val Val Ala Thr Val Leu
1 5 10 15
Leu Arg Gly Ile Ala Ala Ala Pro Pro Arg Lys Pro Val Asp Val Pro
20 25 30
Phe Glu Lys Asn Tyr Val Pro Thr Trp Ala Glu Asp His Ile His Tyr
35 40 45
Val Asn Gly Gly Arg Glu Val Gln Leu Ser Leu Asp Lys Thr Thr Gly
50 55 60
Thr Gly Phe Gln Thr Arg Gly Ser Tyr Leu Phe Gly His Phe Ser Met
65 70 75 80
His Ile Lys Leu Val Gly Gly Asp Ser Ala Gly Thr Val Thr Ala Phe
85 90 95
Tyr Leu Ser Ser Gln Asn Ser Glu His Asp Glu Ile Asp Phe Glu Phe
100 105 110
Leu Gly Asn Arg Thr Gly Gln Pro Tyr Ile Leu Gln Thr Asn Val Phe
115 120 125
Ser Gly Gly Lys Gly Asp Arg Glu Gln Arg Ile Tyr Leu Trp Phe Asp
130 135 140
Pro Thr Lys Asp Tyr His Ser Tyr Ser Val Leu Trp Asn Leu Tyr Met
145 150 155 160
Ile Ala Phe Phe Val Asp Asp Thr Pro Ile Arg Val Phe Lys Asn Ser
165 170 175
Lys Asp Leu Gly Val Arg Tyr Pro Phe Asp Gln Pro Met Lys Leu Tyr
180 185 190
Ser Ser Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly Arg Glu
195 200 205
Lys Thr Asp Trp Ser Lys Ala Pro Phe Val Ala Ser Tyr Arg Gly Phe
210 215 220
His Val Asp Gly Cys Glu Ala Ser Ala Glu Ala Lys Leu Cys Ala Thr
225 230 235 240
Gln Gly Ala Arg Trp Trp Asp Gln Pro Glu Phe Gln Asp Leu Asp Ala
245 250 255
Ala Gln Tyr Arg Arg Leu Ala Trp Val Arg Lys Glu His Thr Ile Tyr
260 265 270
Asn Tyr Cys Thr Asp Arg Glu Arg Tyr Ala Ala Met Ser Pro Glu Cys
275 280 285
Lys Arg Asp Arg Asp Val
290
<210> 11
<211> 855
<212> DNA
<213> 大麦(Hordeum vulgare)
<400> 11
atggcgtccg gtcccagtag aacagtcccg tgctctgtgc tgccactgct gctgctgctc 60
gccggcgtgg cccgcgcggc cggcaacttc taccaggacg tggacatcac gtggggcgac 120
gggcgcggca agatcctcgg cggcggcgac ctcctcacgc tgtcgctcga cagggcctcc 180
ggctccgggt tccagtccaa gaaccagtac ctgtacggcc gcttcgacat gcagatcaag 240
ctcgtccccg gcgactccgc cggcaccgtc gccactttct acctgtcgtc gcaggggtcg 300
gcgcacgacg agatcgactt cgagttcctg ggcaacgcga gcgggcagcc ctacacggtg 360
cacaccaacg tgtacagcca gggcaagggc ggccgggagc agcagttccg catgtggttc 420
gaccccaccg ccgacttcca cacctactcc gtcctctgga accccacaca catcctgttc 480
tacgtggacg ggacgccgat acgggagcac cgcaaccggg aggcggcgac gggggttccc 540
tacctgcgga gccaggcgat gagggtgtac gcgagcgtgt gggacgcgga agagtgggcg 600
acgcagggcg ggcgggtgag gacggactgg tcgcgggcgc cgttcgtggc gtcgtacaag 660
gggctcgccg cgagcgggtg cgcgtcgcag gacgcggcgg cgtgcgccaa ctccaacggc 720
gcgtggatgt accaggagct ggacgccacg gcgttggacc gcctccagtg ggtgcagaag 780
aactacatga tctacaacta ctgcacggac acgtggaggt tcaaggacgg cgccccgccc 840
gagtgcgcca gcaag 855
<210> 12
<211> 285
<212> PRT
<213> 大麦(Hordeum vulgare)
<400> 12
Met Ala Ser Gly Pro Ser Arg Thr Val Pro Cys Ser Val Leu Pro Leu
1 5 10 15
Leu Leu Leu Leu Ala Gly Val Ala Arg Ala Ala Gly Asn Phe Tyr Gln
20 25 30
Asp Val Asp Ile Thr Trp Gly Asp Gly Arg Gly Lys Ile Leu Gly Gly
35 40 45
Gly Asp Leu Leu Thr Leu Ser Leu Asp Arg Ala Ser Gly Ser Gly Phe
50 55 60
Gln Ser Lys Asn Gln Tyr Leu Tyr Gly Arg Phe Asp Met Gln Ile Lys
65 70 75 80
Leu Val Pro Gly Asp Ser Ala Gly Thr Val Ala Thr Phe Tyr Leu Ser
85 90 95
Ser Gln Gly Ser Ala His Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn
100 105 110
Ala Ser Gly Gln Pro Tyr Thr Val His Thr Asn Val Tyr Ser Gln Gly
115 120 125
Lys Gly Gly Arg Glu Gln Gln Phe Arg Met Trp Phe Asp Pro Thr Ala
130 135 140
Asp Phe His Thr Tyr Ser Val Leu Trp Asn Pro Thr His Ile Leu Phe
145 150 155 160
Tyr Val Asp Gly Thr Pro Ile Arg Glu His Arg Asn Arg Glu Ala Ala
165 170 175
Thr Gly Val Pro Tyr Leu Arg Ser Gln Ala Met Arg Val Tyr Ala Ser
180 185 190
Val Trp Asp Ala Glu Glu Trp Ala Thr Gln Gly Gly Arg Val Arg Thr
195 200 205
Asp Trp Ser Arg Ala Pro Phe Val Ala Ser Tyr Lys Gly Leu Ala Ala
210 215 220
Ser Gly Cys Ala Ser Gln Asp Ala Ala Ala Cys Ala Asn Ser Asn Gly
225 230 235 240
Ala Trp Met Tyr Gln Glu Leu Asp Ala Thr Ala Leu Asp Arg Leu Gln
245 250 255
Trp Val Gln Lys Asn Tyr Met Ile Tyr Asn Tyr Cys Thr Asp Thr Trp
260 265 270
Arg Phe Lys Asp Gly Ala Pro Pro Glu Cys Ala Ser Lys
275 280 285
<210> 13
<211> 969
<212> DNA
<213> 大麦(Hordeum vulgare)
<400> 13
atggcagcag ccagcgctct tctcatggct gctctcgcgg tcttcgccgt ggccgccgcc 60
gcggcgctgg acacgtcgcc ggtgccgttc gacgccgggt acgcgcctct cttcggcggc 120
gacaacctcg tccggtcggc ggacggccgg agcgtcacgc tcaagctgga ccgatacacc 180
gggtctgggt tcgtgtcaaa gtcggcctac cgccatggct tcttcggcgc ttccattaag 240
ctgcccggcg actataccgc cggcgtcgtc gtcgccttct acctatcgaa ctgggacgag 300
taccccaaga accacgacga gctggacttc gagctgctgg gcaaccggcg cggccacggc 360
tggcgtgtcc agaccaacat gtacggcaac ggcagcaccg cccgcggccg agaggagcgt 420
taccatctcc ccgtcgaacc taccgtcacc ggcgtccacc gctatgccat tgcctggacc 480
cccaacaaca tcgtcttcta cctcgacggc gttcccatcc gtgaggttgt ccgcgttccc 540
tccatgggcg gcgacttccc ctccaagccc atgtccgtgt acgccaccat ctgggacggc 600
tccgcctggg cgaccgacgg cggcaagtac aaggtcgact acgcctacgc gcccttcgct 660
gccgagtttt ccgacctcgt cctgagcggc tgcggcgcgg gcaacgtcgc cgaccccgag 720
gggtgccagg tcgacctgct cacgcacgac gtcgcagtca tggcaccggc caagcgcgcc 780
gccatgagag ggttccgcga gcagcaccta acctacacgg cgtgccgcga cagggtgcga 840
tacaagacca ccgtcttccc cgagtgtgac gacctcgccg acggcgactc cagcttccac 900
ctctgggggg agtccaagaa gaggcgccgc cggtcgtcct cgccgctgca gtactcttcc 960
agcatgcag 969
<210> 14
<211> 323
<212> PRT
<213> 大麦(Hordeum vulgare)
<400> 14
Met Ala Ala Ala Ser Ala Leu Leu Met Ala Ala Leu Ala Val Phe Ala
1 5 10 15
Val Ala Ala Ala Ala Ala Leu Asp Thr Ser Pro Val Pro Phe Asp Ala
20 25 30
Gly Tyr Ala Pro Leu Phe Gly Gly Asp Asn Leu Val Arg Ser Ala Asp
35 40 45
Gly Arg Ser Val Thr Leu Lys Leu Asp Arg Tyr Thr Gly Ser Gly Phe
50 55 60
Val Ser Lys Ser Ala Tyr Arg His Gly Phe Phe Gly Ala Ser Ile Lys
65 70 75 80
Leu Pro Gly Asp Tyr Thr Ala Gly Val Val Val Ala Phe Tyr Leu Ser
85 90 95
Asn Trp Asp Glu Tyr Pro Lys Asn His Asp Glu Leu Asp Phe Glu Leu
100 105 110
Leu Gly Asn Arg Arg Gly His Gly Trp Arg Val Gln Thr Asn Met Tyr
115 120 125
Gly Asn Gly Ser Thr Ala Arg Gly Arg Glu Glu Arg Tyr His Leu Pro
130 135 140
Val Glu Pro Thr Val Thr Gly Val His Arg Tyr Ala Ile Ala Trp Thr
145 150 155 160
Pro Asn Asn Ile Val Phe Tyr Leu Asp Gly Val Pro Ile Arg Glu Val
165 170 175
Val Arg Val Pro Ser Met Gly Gly Asp Phe Pro Ser Lys Pro Met Ser
180 185 190
Val Tyr Ala Thr Ile Trp Asp Gly Ser Ala Trp Ala Thr Asp Gly Gly
195 200 205
Lys Tyr Lys Val Asp Tyr Ala Tyr Ala Pro Phe Ala Ala Glu Phe Ser
210 215 220
Asp Leu Val Leu Ser Gly Cys Gly Ala Gly Asn Val Ala Asp Pro Glu
225 230 235 240
Gly Cys Gln Val Asp Leu Leu Thr His Asp Val Ala Val Met Ala Pro
245 250 255
Ala Lys Arg Ala Ala Met Arg Gly Phe Arg Glu Gln His Leu Thr Tyr
260 265 270
Thr Ala Cys Arg Asp Arg Val Arg Tyr Lys Thr Thr Val Phe Pro Glu
275 280 285
Cys Asp Asp Leu Ala Asp Gly Asp Ser Ser Phe His Leu Trp Gly Glu
290 295 300
Ser Lys Lys Arg Arg Arg Arg Ser Ser Ser Pro Leu Gln Tyr Ser Ser
305 310 315 320
Ser Met Gln
<210> 15
<211> 897
<212> DNA
<213> 水稻(Oryza sativa)
<400> 15
atgcgtggtg gcgcctctct ccggttgagg tggccggcgg ctctcgtcgc cgtcgtagct 60
gcggcagtga cggcggcggc ggcggcgggg catggcgacc acaatttcca ccgggacttt 120
gacgccgtgt gggggaaggg caatgcgagg ttccgggacg gcgggcggat ggtggagctg 180
acgctggacg agcagacggg ggcgcggctg cagtccaagg agcggttctt gtttgggagg 240
ttcgatctcg agatcaagct cgtcagggga gagtctgcag ggaccatcac ttccttctat 300
atctgcagcg gcggcgcgcg gcacgacgag gtggacttcg agttcctggg caacgtgagc 360
ggcgagccgt acctgctgca caccaacatc ttcagcgacg gcaagggcga gcgtgagcag 420
cagttcgtgc tctggttcga ccccaccgcc gacttccaca cctactccat cctctggaac 480
ccacacaaca tcatactgta cattgacggg acgccgatca gggtgttcaa gaacaacgag 540
gcgtacgggg tgccattccc gacgcggcag ccagtgcacg tgttcgccag catctggaac 600
gcggaggagt gggcgacgca gggcggccgc gtcaagacgg actggtcgcg cgcgccgttc 660
gtcgccacgt accgccgcta caacgtctcc aacgcctgcg tctgggacgc cgccggcgcc 720
ggcgcctccc ggtgcgccgg cggcggcggc gggtggatga ggcggaggat ggactggtgg 780
agctggatga cgctcaactg ggtgcggatg aactacatgg cctacgacta ctgcgccgac 840
aggaagcgat tcccgcaccg tttccccgcc gagtgcatca tccccatcgg tagaacg 897
<210> 16
<211> 299
<212> PRT
<213> 水稻(Oryza sativa)
<400> 16
Met Arg Gly Gly Ala Ser Leu Arg Leu Arg Trp Pro Ala Ala Leu Val
1 5 10 15
Ala Val Val Ala Ala Ala Val Thr Ala Ala Ala Ala Ala Gly His Gly
20 25 30
Asp His Asn Phe His Arg Asp Phe Asp Ala Val Trp Gly Lys Gly Asn
35 40 45
Ala Arg Phe Arg Asp Gly Gly Arg Met Val Glu Leu Thr Leu Asp Glu
50 55 60
Gln Thr Gly Ala Arg Leu Gln Ser Lys Glu Arg Phe Leu Phe Gly Arg
65 70 75 80
Phe Asp Leu Glu Ile Lys Leu Val Arg Gly Glu Ser Ala Gly Thr Ile
85 90 95
Thr Ser Phe Tyr Ile Cys Ser Gly Gly Ala Arg His Asp Glu Val Asp
100 105 110
Phe Glu Phe Leu Gly Asn Val Ser Gly Glu Pro Tyr Leu Leu His Thr
115 120 125
Asn Ile Phe Ser Asp Gly Lys Gly Glu Arg Glu Gln Gln Phe Val Leu
130 135 140
Trp Phe Asp Pro Thr Ala Asp Phe His Thr Tyr Ser Ile Leu Trp Asn
145 150 155 160
Pro His Asn Ile Ile Leu Tyr Ile Asp Gly Thr Pro Ile Arg Val Phe
165 170 175
Lys Asn Asn Glu Ala Tyr Gly Val Pro Phe Pro Thr Arg Gln Pro Val
180 185 190
His Val Phe Ala Ser Ile Trp Asn Ala Glu Glu Trp Ala Thr Gln Gly
195 200 205
Gly Arg Val Lys Thr Asp Trp Ser Arg Ala Pro Phe Val Ala Thr Tyr
210 215 220
Arg Arg Tyr Asn Val Ser Asn Ala Cys Val Trp Asp Ala Ala Gly Ala
225 230 235 240
Gly Ala Ser Arg Cys Ala Gly Gly Gly Gly Gly Trp Met Arg Arg Arg
245 250 255
Met Asp Trp Trp Ser Trp Met Thr Leu Asn Trp Val Arg Met Asn Tyr
260 265 270
Met Ala Tyr Asp Tyr Cys Ala Asp Arg Lys Arg Phe Pro His Arg Phe
275 280 285
Pro Ala Glu Cys Ile Ile Pro Ile Gly Arg Thr
290 295
<210> 17
<211> 825
<212> DNA
<213> 番茄(Lycopersicon esculentum)
<400> 17
atgatcaaaa catcaagttg tatatttact ttctttcttc taatatgttt cttcgtagtg 60
gtggcttttg gtggtacttt cgaccaagaa tttgatgtta catggggtta tgggagggtg 120
aaaatactcg aaaacgggca acttcttact ctttccctcg atagaagttc tggctctgga 180
tttaagtcta aacaacaata tatgtttgca aagattgaca tgaagatcaa acttgtccct 240
ggtaattctg ctggcaccgc tactacatac tatttatctt cggtggggtc agctcatgat 300
gagattgact ttgagtttct tgggaatgta agtggagaac catatactct tcatacaaat 360
gtgtatgcac aaggcaaggg agatagagag caacaatttc atctttggtt tgaccctact 420
aaggatttcc acacctactc tattctttgg aatcctcgaa atatcatatt tttggtagat 480
gggacaccaa taagacaata caagaatctt gaagcaacaa atggaatacc ttacccaaag 540
aaccaaccaa tgtggttata ctcaagttta tggaatgctg aggaatgggc aacaagaggt 600
ggccttgtaa ggactgattg gagtaaagcc ccttttattg cttcttatag aaacttcaat 660
gcccaaactt ccaagaatcc cacagccaat tcttggttaa ctcaatcatt ggacaatgtt 720
gggttaacaa ggatgaaatg ggtgcaaaag aactatatga tatacaatta ttgcactgat 780
actaaacgtt tccctcaagg gttccctcat gaatgcactc taaat 825
<210> 18
<211> 275
<212> PRT
<213> 番茄(Lycopersicon esculentum)
<400> 18
Met Ile Lys Thr Ser Ser Cys Ile Phe Thr Phe Phe Leu Leu Ile Cys
1 5 10 15
Phe Phe Val Val Val Ala Phe Gly Gly Thr Phe Asp Gln Glu Phe Asp
20 25 30
Val Thr Trp Gly Tyr Gly Arg Val Lys Ile Leu Glu Asn Gly Gln Leu
35 40 45
Leu Thr Leu Ser Leu Asp Arg Ser Ser Gly Ser Gly Phe Lys Ser Lys
50 55 60
Gln Gln Tyr Met Phe Ala Lys Ile Asp Met Lys Ile Lys Leu Val Pro
65 70 75 80
Gly Asn Ser Ala Gly Thr Ala Thr Thr Tyr Tyr Leu Ser Ser Val Gly
85 90 95
Ser Ala His Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn Val Ser Gly
100 105 110
Glu Pro Tyr Thr Leu His Thr Asn Val Tyr Ala Gln Gly Lys Gly Asp
115 120 125
Arg Glu Gln Gln Phe His Leu Trp Phe Asp Pro Thr Lys Asp Phe His
130 135 140
Thr Tyr Ser Ile Leu Trp Asn Pro Arg Asn Ile Ile Phe Leu Val Asp
145 150 155 160
Gly Thr Pro Ile Arg Gln Tyr Lys Asn Leu Glu Ala Thr Asn Gly Ile
165 170 175
Pro Tyr Pro Lys Asn Gln Pro Met Trp Leu Tyr Ser Ser Leu Trp Asn
180 185 190
Ala Glu Glu Trp Ala Thr Arg Gly Gly Leu Val Arg Thr Asp Trp Ser
195 200 205
Lys Ala Pro Phe Ile Ala Ser Tyr Arg Asn Phe Asn Ala Gln Thr Ser
210 215 220
Lys Asn Pro Thr Ala Asn Ser Trp Leu Thr Gln Ser Leu Asp Asn Val
225 230 235 240
Gly Leu Thr Arg Met Lys Trp Val Gln Lys Asn Tyr Met Ile Tyr Asn
245 250 255
Tyr Cys Thr Asp Thr Lys Arg Phe Pro Gln Gly Phe Pro His Glu Cys
260 265 270
Thr Leu Asn
275
<210> 19
<211> 990
<212> DNA
<213> 胡萝卜(Daucus carota)
<400> 19
atggtgaact tgtatgtgaa tttgtttgta atgtgttctg ttgttgtttt ggctcatggg 60
tcatcaagaa atcttccaat tgtttcattt gaagaagggt actcacagct ctttggtgat 120
agtaatctca tgattcttca agatggaaaa tcagctcacc tttctcttga tgaaagaaca 180
ggctctggat ttgtatctca tgacctctat aaacatggat tctttagtgc ttcaattaag 240
ttaccagcag attacacagc tggggtggtt gttgcattct atatgtcgaa tgtagacatg 300
tttgcaaaga accatgatga gattgatttt gagtttttgg ggaatattag aggcaaagag 360
tggagacttc agaccaatgt ttatggaaat ggaagcacag gtgcaggcag agaagaaaga 420
tacggtctct ggtttgaccc ttctgatgat tttcatcagt acagtatatt gtggagcaaa 480
gatagaatta tcttttacat agacaatgtt cctataagag aggtcaagaa gacagaagca 540
atgggtgggg acttcccttc caagccaatg agcttgtatg ctactatttg ggatggatct 600
aattgggcta caaatggagg taaatacaag gtcaattata aatattcccc ttacattgcc 660
gagttctccg atttcgtgct tcacggttgt gccgttgatc ccatcgagat gtcgacctca 720
tgtgatactg cgcccaagtc tcaatctgtt cctacaggta caacaaaaga aagtagaact 780
aaaatgcaga acctgaggaa aaaatacatg cagtactcct attgttatga tacaactcga 840
taccaggttc caccttctga gtgtgtaatc gatccacttg agtccgagag acttagagga 900
ttcgacccgg taacatttgg tacaagccac cgcgggcatg gtaaaagaca tcacaaccgc 960
cgatcatacc gtcatggaat aaactctgtt 990
<210> 20
<211> 330
<212> PRT
<213> 胡萝卜(Daucus carota)
<400> 20
Met Val Asn Leu Tyr Val Asn Leu Phe Val Met Cys Ser Val Val Val
1 5 10 15
Leu Ala His Gly Ser Ser Arg Asn Leu Pro Ile Val Ser Phe Glu Glu
20 25 30
Gly Tyr Ser Gln Leu Phe Gly Asp Ser Asn Leu Met Ile Leu Gln Asp
35 40 45
Gly Lys Ser Ala His Leu Ser Leu Asp Glu Arg Thr Gly Ser Gly Phe
50 55 60
Val Ser His Asp Leu Tyr Lys His Gly Phe Phe Ser Ala Ser Ile Lys
65 70 75 80
Leu Pro Ala Asp Tyr Thr Ala Gly Val Val Val Ala Phe Tyr Met Ser
85 90 95
Asn Val Asp Met Phe Ala Lys Asn His Asp Glu Ile Asp Phe Glu Phe
100 105 110
Leu Gly Asn Ile Arg Gly Lys Glu Trp Arg Leu Gln Thr Asn Val Tyr
115 120 125
Gly Asn Gly Ser Thr Gly Ala Gly Arg Glu Glu Arg Tyr Gly Leu Trp
130 135 140
Phe Asp Pro Ser Asp Asp Phe His Gln Tyr Ser Ile Leu Trp Ser Lys
145 150 155 160
Asp Arg Ile Ile Phe Tyr Ile Asp Asn Val Pro Ile Arg Glu Val Lys
165 170 175
Lys Thr Glu Ala Met Gly Gly Asp Phe Pro Ser Lys Pro Met Ser Leu
180 185 190
Tyr Ala Thr Ile Trp Asp Gly Ser Asn Trp Ala Thr Asn Gly Gly Lys
195 200 205
Tyr Lys Val Asn Tyr Lys Tyr Ser Pro Tyr Ile Ala Glu Phe Ser Asp
210 215 220
Phe Val Leu His Gly Cys Ala Val Asp Pro Ile Glu Met Ser Thr Ser
225 230 235 240
Cys Asp Thr Ala Pro Lys Ser Gln Ser Val Pro Thr Gly Thr Thr Lys
245 250 255
Glu Ser Arg Thr Lys Met Gln Asn Leu Arg Lys Lys Tyr Met Gln Tyr
260 265 270
Ser Tyr Cys Tyr Asp Thr Thr Arg Tyr Gln Val Pro Pro Ser Glu Cys
275 280 285
Val Ile Asp Pro Leu Glu Ser Glu Arg Leu Arg Gly Phe Asp Pro Val
290 295 300
Thr Phe Gly Thr Ser His Arg Gly His Gly Lys Arg His His Asn Arg
305 310 315 320
Arg Ser Tyr Arg His Gly Ile Asn Ser Val
325 330
<210> 21
<211> 891
<212> DNA
<213> 番木瓜(Carica papaya)
<400> 21
atggcaaagc ttagttgtgt gttaatggct ccactactat tctcttttct gctcattctc 60
atggtttctt ctcagggtcc tccctcacca gggtactatc ctacatccag attcccgtct 120
ttaggttttg atcaaggatt cagaaatcgt tggggtcctc agcaccagag agtagaacag 180
ggtgtcctaa caatctggct tgattctacc tcaggaagtg ggttcaaatc acttcataca 240
tatcaatctg gttattttgg agctgccatt aaacttcaac ccggttatac tgctggagta 300
attacatctt tctatctttc aaataatgaa gattatccag gaaatcatga tgaaattgac 360
attgaatttc tgggtacaac tccaggggaa ccctacactt tgcagacaaa tgttttcata 420
agaggaagtg gagatagaaa tatcgtcggc agggaagtca aatttcatct ctggtttgat 480
ccaacacaag acttccataa ctatgctatt ctctggaccc caagtgagat cgtatttttt 540
gtggatgatg tgcctattcg gaggtatcca aggaagagtg atgccacatt tcccttaaga 600
accatgtggg tttatgggtc aatttgggat gcttcatctt gggctactga cgatggaaaa 660
tacaaagctg actaccaata ccaacccttt gttggtaggt ataagaattt caaaatagcc 720
gcgtgcagag ccgacgggca agcttcctgt aggccccctt ctgtgtctcc atctggcttt 780
ggcgtgttga gcccacaaca agaatcggcc atggaatggg cacagagaaa ttctttggtt 840
tataactatt gtttagaccc taagagagat cataccccaa cgcccgagtg t 891
<210> 22
<211> 297
<212> PRT
<213> 番木瓜(Carica papaya)
<400> 22
Met Ala Lys Leu Ser Cys Val Leu Met Ala Pro Leu Leu Phe Ser Phe
1 5 10 15
Leu Leu Ile Leu Met Val Ser Ser Gln Gly Pro Pro Ser Pro Gly Tyr
20 25 30
Tyr Pro Thr Ser Arg Phe Pro Ser Leu Gly Phe Asp Gln Gly Phe Arg
35 40 45
Asn Arg Trp Gly Pro Gln His Gln Arg Val Glu Gln Gly Val Leu Thr
50 55 60
Ile Trp Leu Asp Ser Thr Ser Gly Ser Gly Phe Lys Ser Leu His Thr
65 70 75 80
Tyr Gln Ser Gly Tyr Phe Gly Ala Ala Ile Lys Leu Gln Pro Gly Tyr
85 90 95
Thr Ala Gly Val Ile Thr Ser Phe Tyr Leu Ser Asn Asn Glu Asp Tyr
100 105 110
Pro Gly Asn His Asp Glu Ile Asp Ile Glu Phe Leu Gly Thr Thr Pro
115 120 125
Gly Glu Pro Tyr Thr Leu Gln Thr Asn Val Phe Ile Arg Gly Ser Gly
130 135 140
Asp Arg Asn Ile Val Gly Arg Glu Val Lys Phe His Leu Trp Phe Asp
145 150 155 160
Pro Thr Gln Asp Phe His Asn Tyr Ala Ile Leu Trp Thr Pro Ser Glu
165 170 175
Ile Val Phe Phe Val Asp Asp Val Pro Ile Arg Arg Tyr Pro Arg Lys
180 185 190
Ser Asp Ala Thr Phe Pro Leu Arg Thr Met Trp Val Tyr Gly Ser Ile
195 200 205
Trp Asp Ala Ser Ser Trp Ala Thr Asp Asp Gly Lys Tyr Lys Ala Asp
210 215 220
Tyr Gln Tyr Gln Pro Phe Val Gly Arg Tyr Lys Asn Phe Lys Ile Ala
225 230 235 240
Ala Cys Arg Ala Asp Gly Gln Ala Ser Cys Arg Pro Pro Ser Val Ser
245 250 255
Pro Ser Gly Phe Gly Val Leu Ser Pro Gln Gln Glu Ser Ala Met Glu
260 265 270
Trp Ala Gln Arg Asn Ser Leu Val Tyr Asn Tyr Cys Leu Asp Pro Lys
275 280 285
Arg Asp His Thr Pro Thr Pro Glu Cys
290 295
<210> 23
<211> 864
<212> DNA
<213> 草地羊茅(Festuca pratensis)
<400> 23
atggggaagc ctgcagcgtt gattccggtg ctagctcttc ttgcctgctt ggcttttggg 60
cttgtgtccg gcggcaactt caacgacgat tgcgacgcga cctgggagcc ccagaactgc 120
tgggtttatg atgctggcaa tagcctctcc ctcgccctcg tcagcaactc ctcaggctcg 180
atgatccggt ccaagaggca gttcatcttt gggaccgtct ccacatggat ccaagcttcg 240
tcaagggcaa ctcttgcccg gcaccgtcac aacatattac ctatcctcgg cggagacaat 300
catgacgaaa tcgacttcga gttcctgggg aacgagaccg gacagcccta caccctgcac 360
accaacgtct acgccgacgg cgtcggcaac aaggagatgc agttcgtgcc ctggttcgac 420
cccaccggcg gttaccacaa gtacaccatc tcctggacgc cctgcatgat cgtctggtac 480
gtcgacgacc tccccatccg ggtcttccgc aattaccgcc agagcaacgg cgtggccttc 540
ccgacgagcc gccccatgta cgcctactcc agcatctggt ccgccgacga ctgggccacg 600
cagggcggcc gcgtcaagac cgactggacc cacgcgccct tcgtcgccaa ctaccacggc 660
atcgacctcg acatctgcga gtgctacggc ggcgactgca tctacggctg cgccggcgcc 720
tacggccagc cctactgcgg cgggctcacc gacgagcagc gctggaagat gcagtgggta 780
caggagagat acaggatcta cgactactgc gtggactaca aggacggcaa ggtgcccggc 840
gtcgagtgca gcctgcccca gtac 864
<210> 24
<211> 288
<212> PRT
<213> 草地羊茅(Festuca pratensis)
<400> 24
Met Gly Lys Pro Ala Ala Leu Ile Pro Val Leu Ala Leu Leu Ala Cys
1 5 10 15
Leu Ala Phe Gly Leu Val Ser Gly Gly Asn Phe Asn Asp Asp Cys Asp
20 25 30
Ala Thr Trp Glu Pro Gln Asn Cys Trp Val Tyr Asp Ala Gly Asn Ser
35 40 45
Leu Ser Leu Ala Leu Val Ser Asn Ser Ser Gly Ser Met Ile Arg Ser
50 55 60
Lys Arg Gln Phe Ile Phe Gly Thr Val Ser Thr Trp Ile Gln Ala Ser
65 70 75 80
Ser Arg Ala Thr Leu Ala Arg His Arg His Asn Ile Leu Pro Ile Leu
85 90 95
Gly Gly Asp Asn His Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn Glu
100 105 110
Thr Gly Gln Pro Tyr Thr Leu His Thr Asn Val Tyr Ala Asp Gly Val
115 120 125
Gly Asn Lys Glu Met Gln Phe Val Pro Trp Phe Asp Pro Thr Gly Gly
130 135 140
Tyr His Lys Tyr Thr Ile Ser Trp Thr Pro Cys Met Ile Val Trp Tyr
145 150 155 160
Val Asp Asp Leu Pro Ile Arg Val Phe Arg Asn Tyr Arg Gln Ser Asn
165 170 175
Gly Val Ala Phe Pro Thr Ser Arg Pro Met Tyr Ala Tyr Ser Ser Ile
180 185 190
Trp Ser Ala Asp Asp Trp Ala Thr Gln Gly Gly Arg Val Lys Thr Asp
195 200 205
Trp Thr His Ala Pro Phe Val Ala Asn Tyr His Gly Ile Asp Leu Asp
210 215 220
Ile Cys Glu Cys Tyr Gly Gly Asp Cys Ile Tyr Gly Cys Ala Gly Ala
225 230 235 240
Tyr Gly Gln Pro Tyr Cys Gly Gly Leu Thr Asp Glu Gln Arg Trp Lys
245 250 255
Met Gln Trp Val Gln Glu Arg Tyr Arg Ile Tyr Asp Tyr Cys Val Asp
260 265 270
Tyr Lys Asp Gly Lys Val Pro Gly Val Glu Cys Ser Leu Pro Gln Tyr
275 280 285
<210> 25
<211> 933
<212> DNA
<213> 水稻(Oryza sativa)
<400> 25
atggcgaagg ctctcctcgc cgtcgtcgtc gtcgccgtgg cggcggtgct cgagctgggg 60
ctcgtcggag ccaacttcca ggatcagtgt gacatcacgt gggagccaca gaacgccaag 120
atgacggagg gaggagacca cctcacgctc tcccttgtca gcaactcctc tggttgtatg 180
ctccggacca agaagcagtt catctacggc agcgtgtcga ctcgcatcca gcttgtgaag 240
ggcaactcgg ccggcaccgt caccacctac tacacatcgt ccatcggcga caaacacgac 300
gagatcgact tcgagttcct gggcaactcc agcggcctcc cctacacctt ccacaccaac 360
gtcttcgccg acggcgtcgg cagccgcgag atgcagttcc gcccctggtt cgaccccacc 420
gacggctacc acaactacac catcttctgg aacccctgca tgatcgtgtg gttcgtggac 480
agcatcccaa tcagggtgtt ccggaaccac gagaaggaag gggtgccgtt cccgacaaag 540
cggccgatgt acgccttctc cagcatctgg gcggcggagg attgggccac gcagggtggc 600
cgcgtcaaga cggactggac caaggcccct ttcgtcgccg agtaccgtga catcggcctc 660
aacatctgtg agtgccccgg ctcaggctct ggctccagct ccagcttcag ctccagctcc 720
agctctacct ccggcgatgc cgaggaccca gcgtgcgcgc agcggtgcgc gacgtcggac 780
cactggtacg cggcggaggg gctgtgccag ctgagcgaca agcagctgcg gcagatgaag 840
gcggtgcagc tgggctacac catctacgac tactgcgccg acgcccaggc caagggacgc 900
cccgtgccgc cggagtgcag catgccgcag tac 933
<210> 26
<211> 311
<212> PRT
<213> 水稻(Oryza sativa)
<400> 26
Met Ala Lys Ala Leu Leu Ala Val Val Val Val Ala Val Ala Ala Val
1 5 10 15
Leu Glu Leu Gly Leu Val Gly Ala Asn Phe Gln Asp Gln Cys Asp Ile
20 25 30
Thr Trp Glu Pro Gln Asn Ala Lys Met Thr Glu Gly Gly Asp His Leu
35 40 45
Thr Leu Ser Leu Val Ser Asn Ser Ser Gly Cys Met Leu Arg Thr Lys
50 55 60
Lys Gln Phe Ile Tyr Gly Ser Val Ser Thr Arg Ile Gln Leu Val Lys
65 70 75 80
Gly Asn Ser Ala Gly Thr Val Thr Thr Tyr Tyr Thr Ser Ser Ile Gly
85 90 95
Asp Lys His Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn Ser Ser Gly
100 105 110
Leu Pro Tyr Thr Phe His Thr Asn Val Phe Ala Asp Gly Val Gly Ser
115 120 125
Arg Glu Met Gln Phe Arg Pro Trp Phe Asp Pro Thr Asp Gly Tyr His
130 135 140
Asn Tyr Thr Ile Phe Trp Asn Pro Cys Met Ile Val Trp Phe Val Asp
145 150 155 160
Ser Ile Pro Ile Arg Val Phe Arg Asn His Glu Lys Glu Gly Val Pro
165 170 175
Phe Pro Thr Lys Arg Pro Met Tyr Ala Phe Ser Ser Ile Trp Ala Ala
180 185 190
Glu Asp Trp Ala Thr Gln Gly Gly Arg Val Lys Thr Asp Trp Thr Lys
195 200 205
Ala Pro Phe Val Ala Glu Tyr Arg Asp Ile Gly Leu Asn Ile Cys Glu
210 215 220
Cys Pro Gly Ser Gly Ser Gly Ser Ser Ser Ser Phe Ser Ser Ser Ser
225 230 235 240
Ser Ser Thr Ser Gly Asp Ala Glu Asp Pro Ala Cys Ala Gln Arg Cys
245 250 255
Ala Thr Ser Asp His Trp Tyr Ala Ala Glu Gly Leu Cys Gln Leu Ser
260 265 270
Asp Lys Gln Leu Arg Gln Met Lys Ala Val Gln Leu Gly Tyr Thr Ile
275 280 285
Tyr Asp Tyr Cys Ala Asp Ala Gln Ala Lys Gly Arg Pro Val Pro Pro
290 295 300
Glu Cys Ser Met Pro Gln Tyr
305 310
<210> 27
<211> 873
<212> DNA
<213> 高粱(Sorghum bicolor)
<400> 27
atggcgcggc cggcggcgtg gactccgcct gctctgtcgc tcgcggtcgc cgtcctctgc 60
ctcgtcggcc ggtccacctc cgcggagttc tggctcgacg agttcaccac ggacggcgac 120
gtccgcaaag actacgacgg ttctggccgg caggtggcgt cgctggtcct cgaccagagt 180
tctggcgctg gcttcaactc cacccgcaag tacctcttcg gcgagttcag cgtcgagatg 240
aagctcgtcg ccggcaactc cgccggcact gtcacctcct tctacctgac gtccggcgag 300
ggcgacgagc acgacgagat cgacatggag ttcatgggca actccagcgg gtcgccgacg 360
gtgctcaaca ccaacgtgtg ggccagcggc gacggcaaga aggagcacca gttctacctg 420
tggttcgacc cggccgccga cttccacaag tacaagatca cctggaacga caagaacatc 480
atcttccagg tggacgacgt gacggtgcgc gtcttcaagc gctacgccga cctgccgtac 540
ccgagctcca agcccatggc ggtgcacgcc acgctgtggg acggcagcta ctgggccacc 600
gagaagggca aggtgcccat cgactggtcc cgcgcgccct tcgtcgtctc ctaccgagca 660
tacacggcca acgcctgcgc cgtcggcggc ggcggcgggg gctcgtcgtc gtcgtgcccc 720
gacgccgccg gtgggaacga gtggatggac aggcagcccg acgacaccga ccggctcacc 780
gtggagtggg cgcgccggaa ctgcttgcag tacaactact gcgaggacgg gtggcgcttc 840
ccgcaggggt tccccggcga gtgcgcccgc aac 873
<210> 28
<211> 291
<212> PRT
<213> 高粱(Sorghum bicolor)
<400> 28
Met Ala Arg Pro Ala Ala Trp Thr Pro Pro Ala Leu Ser Leu Ala Val
1 5 10 15
Ala Val Leu Cys Leu Val Gly Arg Ser Thr Ser Ala Glu Phe Trp Leu
20 25 30
Asp Glu Phe Thr Thr Asp Gly Asp Val Arg Lys Asp Tyr Asp Gly Ser
35 40 45
Gly Arg Gln Val Ala Ser Leu Val Leu Asp Gln Ser Ser Gly Ala Gly
50 55 60
Phe Asn Ser Thr Arg Lys Tyr Leu Phe Gly Glu Phe Ser Val Glu Met
65 70 75 80
Lys Leu Val Ala Gly Asn Ser Ala Gly Thr Val Thr Ser Phe Tyr Leu
85 90 95
Thr Ser Gly Glu Gly Asp Glu His Asp Glu Ile Asp Met Glu Phe Met
100 105 110
Gly Asn Ser Ser Gly Ser Pro Thr Val Leu Asn Thr Asn Val Trp Ala
115 120 125
Ser Gly Asp Gly Lys Lys Glu His Gln Phe Tyr Leu Trp Phe Asp Pro
130 135 140
Ala Ala Asp Phe His Lys Tyr Lys Ile Thr Trp Asn Asp Lys Asn Ile
145 150 155 160
Ile Phe Gln Val Asp Asp Val Thr Val Arg Val Phe Lys Arg Tyr Ala
165 170 175
Asp Leu Pro Tyr Pro Ser Ser Lys Pro Met Ala Val His Ala Thr Leu
180 185 190
Trp Asp Gly Ser Tyr Trp Ala Thr Glu Lys Gly Lys Val Pro Ile Asp
195 200 205
Trp Ser Arg Ala Pro Phe Val Val Ser Tyr Arg Ala Tyr Thr Ala Asn
210 215 220
Ala Cys Ala Val Gly Gly Gly Gly Gly Gly Ser Ser Ser Ser Cys Pro
225 230 235 240
Asp Ala Ala Gly Gly Asn Glu Trp Met Asp Arg Gln Pro Asp Asp Thr
245 250 255
Asp Arg Leu Thr Val Glu Trp Ala Arg Arg Asn Cys Leu Gln Tyr Asn
260 265 270
Tyr Cys Glu Asp Gly Trp Arg Phe Pro Gln Gly Phe Pro Gly Glu Cys
275 280 285
Ala Arg Asn
290
<210> 29
<211> 840
<212> DNA
<213> 高粱(Sorghum bicolor)
<400> 29
atggcgcggc ggtctctggc ccttctgctc gcgtcgtcgc tggccctcgt gatgatggcg 60
gccgtcgcgt cggcggactc gtggctctac gagaagttca gcacggacgg caccgtccgc 120
accaactacg acgagtccgg cgcgcaggtg gcgatgctca acctcgaccg cagctccggc 180
gccggcttca actccaagga gcagtacctc tacggccagt tcagcgtcca gatgaagctc 240
atccccggca actccgccgg caccgtctcc tgcttctacc tttcttctgg cgacggcgac 300
gggcatgacg agatcgacat ggagttcatg ggcaacgcca cggggcagcc ggtggtgctc 360
aacacaaacg tgtgggccaa cggcgacggc aagaaggagc accagttcga cctgtggttc 420
gacccggccg ccgactacca cacctacacc atcatctgga acccgaccaa catcctcttc 480
aaggtggacg acaacgtgat ccgcgtcttc aagcgctacg ccgacctggc ctacccgagc 540
tccaagccca tgacgctgca cgccacgctg tgggacggca gctactgggc caccgagaag 600
ggcaaggtgc ccatcgactg gtccggcgcg cccttcgtcg tctcctacaa aggctactcc 660
gccgacgcct gcgtcagcgg cggcgcctgc gccgccggca gcggcgcgtg gatgaacaag 720
cagcctgaca gcgccgagtg gggcaccgtc aagtgggccg agagcaacta catgcgctac 780
aactactgcg acgacggctg gaggttcccg caggggctgc cggcggagtg cagccgcagc 840
<210> 30
<211> 280
<212> PRT
<213> 高粱(Sorghum bicolor)
<400> 30
Met Ala Arg Arg Ser Leu Ala Leu Leu Leu Ala Ser Ser Leu Ala Leu
1 5 10 15
Val Met Met Ala Ala Val Ala Ser Ala Asp Ser Trp Leu Tyr Glu Lys
20 25 30
Phe Ser Thr Asp Gly Thr Val Arg Thr Asn Tyr Asp Glu Ser Gly Ala
35 40 45
Gln Val Ala Met Leu Asn Leu Asp Arg Ser Ser Gly Ala Gly Phe Asn
50 55 60
Ser Lys Glu Gln Tyr Leu Tyr Gly Gln Phe Ser Val Gln Met Lys Leu
65 70 75 80
Ile Pro Gly Asn Ser Ala Gly Thr Val Ser Cys Phe Tyr Leu Ser Ser
85 90 95
Gly Asp Gly Asp Gly His Asp Glu Ile Asp Met Glu Phe Met Gly Asn
100 105 110
Ala Thr Gly Gln Pro Val Val Leu Asn Thr Asn Val Trp Ala Asn Gly
115 120 125
Asp Gly Lys Lys Glu His Gln Phe Asp Leu Trp Phe Asp Pro Ala Ala
130 135 140
Asp Tyr His Thr Tyr Thr Ile Ile Trp Asn Pro Thr Asn Ile Leu Phe
145 150 155 160
Lys Val Asp Asp Asn Val Ile Arg Val Phe Lys Arg Tyr Ala Asp Leu
165 170 175
Ala Tyr Pro Ser Ser Lys Pro Met Thr Leu His Ala Thr Leu Trp Asp
180 185 190
Gly Ser Tyr Trp Ala Thr Glu Lys Gly Lys Val Pro Ile Asp Trp Ser
195 200 205
Gly Ala Pro Phe Val Val Ser Tyr Lys Gly Tyr Ser Ala Asp Ala Cys
210 215 220
Val Ser Gly Gly Ala Cys Ala Ala Gly Ser Gly Ala Trp Met Asn Lys
225 230 235 240
Gln Pro Asp Ser Ala Glu Trp Gly Thr Val Lys Trp Ala Glu Ser Asn
245 250 255
Tyr Met Arg Tyr Asn Tyr Cys Asp Asp Gly Trp Arg Phe Pro Gln Gly
260 265 270
Leu Pro Ala Glu Cys Ser Arg Ser
275 280
<210> 31
<211> 870
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 31
atggactata tgagaatctt tagtgttttt gtagtaacgt tatggatcat aagggttgat 60
gctagggttt tcggaggacg aggaatcgaa aaatttgtaa ctttcggtca gaattatatt 120
gttacgtggg gacaaagtca tgtttctaca ctccattctg gcgaagaagt tgatctttac 180
atggatcaat cttcaggtgg tgggttcgaa tccaaggacg cctacggatc aggtctcttt 240
gaaatgagaa tcaaagtgcc ttcaggaaat actggcggca tcgtcaccgc tttttacttg 300
acgtcgaaag gaggtggtca cgacgagatt gacttcgagt ttctagggaa caacaacgga 360
aaaccggtaa cgttacagac aaatctgttt ctaaatggag aaggaaacag agaagagagg 420
tttttgcttt ggttcaatcc aaccaaacac taccacactt atgggcttct ttggaaccct 480
taccaaattg tgttttacgt ggacaacatc ccaataagag tatacaaaaa cgaaaacggc 540
gtaagttatc catcaaagcc tatgcaagtc gaggctagtc tctggaacgg tgacgattgg 600
gcgactgatg gtggtcggac taaggttaac tggtcatact ctcctttcat tgcacatttc 660
cgagacttcg ccttatccgg ctgcaacata gatggtcgga gtaataatgt cggcgcttgt 720
gaatcctcca actactggtg gaatgcaggc aactatcaaa gattaagcgg aaacgaacag 780
aaactttatg aacatgtgag gagcaagtac atgaactatg actattgtac tgatcgctct 840
aagtaccaaa ctcctcctag agaatgttat 870
<210> 32
<211> 290
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 32
Met Asp Tyr Met Arg Ile Phe Ser Val Phe Val Val Thr Leu Trp Ile
1 5 10 15
Ile Arg Val Asp Ala Arg Val Phe Gly Gly Arg Gly Ile Glu Lys Phe
20 25 30
Val Thr Phe Gly Gln Asn Tyr Ile Val Thr Trp Gly Gln Ser His Val
35 40 45
Ser Thr Leu His Ser Gly Glu Glu Val Asp Leu Tyr Met Asp Gln Ser
50 55 60
Ser Gly Gly Gly Phe Glu Ser Lys Asp Ala Tyr Gly Ser Gly Leu Phe
65 70 75 80
Glu Met Arg Ile Lys Val Pro Ser Gly Asn Thr Gly Gly Ile Val Thr
85 90 95
Ala Phe Tyr Leu Thr Ser Lys Gly Gly Gly His Asp Glu Ile Asp Phe
100 105 110
Glu Phe Leu Gly Asn Asn Asn Gly Lys Pro Val Thr Leu Gln Thr Asn
115 120 125
Leu Phe Leu Asn Gly Glu Gly Asn Arg Glu Glu Arg Phe Leu Leu Trp
130 135 140
Phe Asn Pro Thr Lys His Tyr His Thr Tyr Gly Leu Leu Trp Asn Pro
145 150 155 160
Tyr Gln Ile Val Phe Tyr Val Asp Asn Ile Pro Ile Arg Val Tyr Lys
165 170 175
Asn Glu Asn Gly Val Ser Tyr Pro Ser Lys Pro Met Gln Val Glu Ala
180 185 190
Ser Leu Trp Asn Gly Asp Asp Trp Ala Thr Asp Gly Gly Arg Thr Lys
195 200 205
Val Asn Trp Ser Tyr Ser Pro Phe Ile Ala His Phe Arg Asp Phe Ala
210 215 220
Leu Ser Gly Cys Asn Ile Asp Gly Arg Ser Asn Asn Val Gly Ala Cys
225 230 235 240
Glu Ser Ser Asn Tyr Trp Trp Asn Ala Gly Asn Tyr Gln Arg Leu Ser
245 250 255
Gly Asn Glu Gln Lys Leu Tyr Glu His Val Arg Ser Lys Tyr Met Asn
260 265 270
Tyr Asp Tyr Cys Thr Asp Arg Ser Lys Tyr Gln Thr Pro Pro Arg Glu
275 280 285
Cys Tyr
290
<210> 33
<211> 906
<212> DNA
<213> 大豆(Glycine max)
<400> 33
atggatgcaa gggcatcatc ttcttcaatg tccatgattc ttttcattac agctattgtg 60
gctgcagctt attttcattc atcagaagca gctgtgtcaa aaggatcttt tgaggacaat 120
ttcagcataa tgtggtctga ggaccatttt actacctcta aagatggaca gatctggtat 180
ctctcactag acaaagacac aggatgtggg tttcaaacaa aacaacgcta cagattcggg 240
tggttcagta tgaagctgaa gttggtagca ggtgactctg caggtgttgt gacagcttat 300
tatatgtgct cagaaaatgg tgcagggccg gagagggatg agcttgattt tgagtttttg 360
ggaaacagaa ctggggagcc ttatttgatt cagactaatg tgtacaagaa tgggactgga 420
gggcgtgaga tgaggcatat gctatggttt gaccccacag aggactacca cacttattcc 480
attctctgga acaaccacca gatagtgttt tttgtggata gagttccagt gagggtgttc 540
aagaacaatg gggaaccaaa caacttcttc ccgaatgaga agcccatgta cttgttctcc 600
agcatatgga atgcagatga gtgggccaca agaggtgggc ttgagaagac aaactggaaa 660
ttagccccat ttgtgtcatc ctacaaagac ttcagtgtgg atggttgcca gtgggaagac 720
ccataccctg cctgtgtctc aaccacaacc aaaaattggt gggatcagta tgatgcttgg 780
cacctttctg atgatcagaa aaaggattat gcttgggttc agaggaacct tgttatctat 840
gactactgcc aggattctgc acgttatcca actaccccag aggagtgttc attgagtcca 900
tgggat 906
<210> 34
<211> 302
<212> PRT
<213> 大豆(Glycine max)
<400> 34
Met Asp Ala Arg Ala Ser Ser Ser Ser Met Ser Met Ile Leu Phe Ile
1 5 10 15
Thr Ala Ile Val Ala Ala Ala Tyr Phe His Ser Ser Glu Ala Ala Val
20 25 30
Ser Lys Gly Ser Phe Glu Asp Asn Phe Ser Ile Met Trp Ser Glu Asp
35 40 45
His Phe Thr Thr Ser Lys Asp Gly Gln Ile Trp Tyr Leu Ser Leu Asp
50 55 60
Lys Asp Thr Gly Cys Gly Phe Gln Thr Lys Gln Arg Tyr Arg Phe Gly
65 70 75 80
Trp Phe Ser Met Lys Leu Lys Leu Val Ala Gly Asp Ser Ala Gly Val
85 90 95
Val Thr Ala Tyr Tyr Met Cys Ser Glu Asn Gly Ala Gly Pro Glu Arg
100 105 110
Asp Glu Leu Asp Phe Glu Phe Leu Gly Asn Arg Thr Gly Glu Pro Tyr
115 120 125
Leu Ile Gln Thr Asn Val Tyr Lys Asn Gly Thr Gly Gly Arg Glu Met
130 135 140
Arg His Met Leu Trp Phe Asp Pro Thr Glu Asp Tyr His Thr Tyr Ser
145 150 155 160
Ile Leu Trp Asn Asn His Gln Ile Val Phe Phe Val Asp Arg Val Pro
165 170 175
Val Arg Val Phe Lys Asn Asn Gly Glu Pro Asn Asn Phe Phe Pro Asn
180 185 190
Glu Lys Pro Met Tyr Leu Phe Ser Ser Ile Trp Asn Ala Asp Glu Trp
195 200 205
Ala Thr Arg Gly Gly Leu Glu Lys Thr Asn Trp Lys Leu Ala Pro Phe
210 215 220
Val Ser Ser Tyr Lys Asp Phe Ser Val Asp Gly Cys Gln Trp Glu Asp
225 230 235 240
Pro Tyr Pro Ala Cys Val Ser Thr Thr Thr Lys Asn Trp Trp Asp Gln
245 250 255
Tyr Asp Ala Trp His Leu Ser Asp Asp Gln Lys Lys Asp Tyr Ala Trp
260 265 270
Val Gln Arg Asn Leu Val Ile Tyr Asp Tyr Cys Gln Asp Ser Ala Arg
275 280 285
Tyr Pro Thr Thr Pro Glu Glu Cys Ser Leu Ser Pro Trp Asp
290 295 300
<210> 35
<211> 873
<212> DNA
<213> 蒺藜状苜蓿(Medicago truncatula)
<400> 35
atggccatat tttacccctt taaaaacaat ggtgtctttt ttatgttgtt attgtggatt 60
gtcgtatcat ctgtttgggg aagaccagca acttttaatc aagattttca tgtcacgtgg 120
tcagaacccc atatcaagca aattgatcaa ggcagaacta tccaacttac cctagaccaa 180
ggctctggtt gcgggtttgc atcaaaggtg aagtatttgt ttggtcgtgt aagcatgaag 240
atcaaacttg tccctggaga ttctgctggt actgttactg cattttatat gaactctgac 300
actgacagtg tacgtgatga gttggatttt gagttcttgg gaaaccgtac tggacaacct 360
tacacagttc aaacaaacat ttatgctcat ggaaagggtg atagagaaca aagagttaat 420
ctttggtttg atccttctgc tgatttccac acttactcca ttctttggaa tcatcaccat 480
attgtgttct acgttgatga agttcccatt agagtataca agaacaatga agcaaaaggg 540
ataccatacc ccaaaatgca agccatggga gtattttcaa cattatggga agctgataat 600
tgggcaacaa gaggtggatt agagaaaatt aattggagta aagcaccttt ttatgcttat 660
tacaaggatt ttgatattga aggatgtgca atttcaggac ccaatacatg ttccactaac 720
cccaaaaatt ggtggggagg ggttgaatat caagctttta gtgccattga agctagaagg 780
tataggtggg tttgtatgaa ccatgtgatc tatgattatt gtcaagataa atcaaggtac 840
ccaatgaccc cacatgagtg tctttcaggc att 873
<210> 36
<211> 291
<212> PRT
<213> 蒺藜状苜蓿(Medicago truncatula)
<400> 36
Met Ala Ile Phe Tyr Pro Phe Lys Asn Asn Gly Val Phe Phe Met Leu
1 5 10 15
Leu Leu Trp Ile Val Val Ser Ser Val Trp Gly Arg Pro Ala Thr Phe
20 25 30
Asn Gln Asp Phe His Val Thr Trp Ser Glu Pro His Ile Lys Gln Ile
35 40 45
Asp Gln Gly Arg Thr Ile Gln Leu Thr Leu Asp Gln Gly Ser Gly Cys
50 55 60
Gly Phe Ala Ser Lys Val Lys Tyr Leu Phe Gly Arg Val Ser Met Lys
65 70 75 80
Ile Lys Leu Val Pro Gly Asp Ser Ala Gly Thr Val Thr Ala Phe Tyr
85 90 95
Met Asn Ser Asp Thr Asp Ser Val Arg Asp Glu Leu Asp Phe Glu Phe
100 105 110
Leu Gly Asn Arg Thr Gly Gln Pro Tyr Thr Val Gln Thr Asn Ile Tyr
115 120 125
Ala His Gly Lys Gly Asp Arg Glu Gln Arg Val Asn Leu Trp Phe Asp
130 135 140
Pro Ser Ala Asp Phe His Thr Tyr Ser Ile Leu Trp Asn His His His
145 150 155 160
Ile Val Phe Tyr Val Asp Glu Val Pro Ile Arg Val Tyr Lys Asn Asn
165 170 175
Glu Ala Lys Gly Ile Pro Tyr Pro Lys Met Gln Ala Met Gly Val Phe
180 185 190
Ser Thr Leu Trp Glu Ala Asp Asn Trp Ala Thr Arg Gly Gly Leu Glu
195 200 205
Lys Ile Asn Trp Ser Lys Ala Pro Phe Tyr Ala Tyr Tyr Lys Asp Phe
210 215 220
Asp Ile Glu Gly Cys Ala Ile Ser Gly Pro Asn Thr Cys Ser Thr Asn
225 230 235 240
Pro Lys Asn Trp Trp Gly Gly Val Glu Tyr Gln Ala Phe Ser Ala Ile
245 250 255
Glu Ala Arg Arg Tyr Arg Trp Val Cys Met Asn His Val Ile Tyr Asp
260 265 270
Tyr Cys Gln Asp Lys Ser Arg Tyr Pro Met Thr Pro His Glu Cys Leu
275 280 285
Ser Gly Ile
290
<210> 37
<211> 897
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 37
atgactctaa taaatcgctc aaaaccattt gtacttctcg taggcttctc aattatctca 60
agtttgctat tatgggtctc acaagcttcc gttgtttcat caggagattt taacaaagac 120
ttctttgtga catggtctcc tacccacgtt aacacctcca atgatggtcg atcaagaacc 180
cttaaactcg atcaagaatc tggagcttct ttttcttcca ttcagacgtt cttgttcggc 240
caaatagata tgaagatcaa acttatccgt ggaagttctc aaggaaccgt ggttgcttat 300
tatatgtcct cagatcagcc taaccgggat gagattgact ttgagttcct cggaaacgtt 360
aatgggcagc cttacattct ccagacaaat gtctatgccg agggacttga taaccgcgaa 420
gaaaggatcc atctctggtt cgacccagcc aaggactttc acacttactc tatcttgtgg 480
aacattcacc aaattgtatt tatggtggat cagattccga taaggttgta tagaaaccat 540
ggggagaaag gcgtagccta cccaaggttg caacctatga gtgtacaggc gagtctatgg 600
aacggtgaga gctgggctac gcgcggtgga catgacaaga ttgattggtc aaagggtcca 660
tttgtggctt cctttgggga ttacaagata gacgcttgta tttggatagg caatacaagt 720
ttttgtaatg gagagagcac tgaaaactgg tggaacaaga atgagttcag ttctttgaca 780
agagtgcaaa agagatggtt taaatgggtg agaaaatatc acttgattta tgattattgc 840
caagattatg gaaggttcaa taacaagcta ccgaaggaat gttctcttcc taaatat 897
<210> 38
<211> 299
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 38
Met Thr Leu Ile Asn Arg Ser Lys Pro Phe Val Leu Leu Val Gly Phe
1 5 10 15
Ser Ile Ile Ser Ser Leu Leu Leu Trp Val Ser Gln Ala Ser Val Val
20 25 30
Ser Ser Gly Asp Phe Asn Lys Asp Phe Phe Val Thr Trp Ser Pro Thr
35 40 45
His Val Asn Thr Ser Asn Asp Gly Arg Ser Arg Thr Leu Lys Leu Asp
50 55 60
Gln Glu Ser Gly Ala Ser Phe Ser Ser Ile Gln Thr Phe Leu Phe Gly
65 70 75 80
Gln Ile Asp Met Lys Ile Lys Leu Ile Arg Gly Ser Ser Gln Gly Thr
85 90 95
Val Val Ala Tyr Tyr Met Ser Ser Asp Gln Pro Asn Arg Asp Glu Ile
100 105 110
Asp Phe Glu Phe Leu Gly Asn Val Asn Gly Gln Pro Tyr Ile Leu Gln
115 120 125
Thr Asn Val Tyr Ala Glu Gly Leu Asp Asn Arg Glu Glu Arg Ile His
130 135 140
Leu Trp Phe Asp Pro Ala Lys Asp Phe His Thr Tyr Ser Ile Leu Trp
145 150 155 160
Asn Ile His Gln Ile Val Phe Met Val Asp Gln Ile Pro Ile Arg Leu
165 170 175
Tyr Arg Asn His Gly Glu Lys Gly Val Ala Tyr Pro Arg Leu Gln Pro
180 185 190
Met Ser Val Gln Ala Ser Leu Trp Asn Gly Glu Ser Trp Ala Thr Arg
195 200 205
Gly Gly His Asp Lys Ile Asp Trp Ser Lys Gly Pro Phe Val Ala Ser
210 215 220
Phe Gly Asp Tyr Lys Ile Asp Ala Cys Ile Trp Ile Gly Asn Thr Ser
225 230 235 240
Phe Cys Asn Gly Glu Ser Thr Glu Asn Trp Trp Asn Lys Asn Glu Phe
245 250 255
Ser Ser Leu Thr Arg Val Gln Lys Arg Trp Phe Lys Trp Val Arg Lys
260 265 270
Tyr His Leu Ile Tyr Asp Tyr Cys Gln Asp Tyr Gly Arg Phe Asn Asn
275 280 285
Lys Leu Pro Lys Glu Cys Ser Leu Pro Lys Tyr
290 295
<210> 39
<211> 870
<212> DNA
<213> 拟南芥(Arabidopsis thaliana)
<400> 39
atggtcggta tggatttgtt caaatgtgta atgatgataa tggtgttggt tgtctcttgt 60
ggtgaagctg tttctggagc taagttcgat gagctttatc ggtcaagctg ggctatggat 120
cattgtgtca acgaaggcga agtcacaaaa ctcaagcttg acaattactc tggagctggg 180
tttgaatcaa gaagcaaata cttgtttggt aaagtctcta tccagattaa gcttgttgag 240
ggtgattcag caggaacagt cactgctttc tacatgtctt cagatggtcc gaaccacaac 300
gaattcgatt ttgagttctt agggaacact accggcgagc cttacatagt ccagaccaat 360
atctacgtga acggagttgg aaacagagaa caaagactca acctttggtt cgatcccacc 420
actgagtttc acacttactc aatcctctgg agtaaacgca gtgttgtatt catggtagac 480
gaaacaccga ttcgagttca gaagaatctt gaagagaaag gtatcccatt tgctaaagat 540
caagcaatgg gtgtttacag ctccatttgg aatgcagatg attgggctac acaaggaggt 600
cttgttaaaa ctgattggag tcacgctcct ttcgttgctt cttacaaaga attccaaatc 660
gatgcatgtg agattccaac aactactgat ctaagcaagt gtaatggaga ccagaagttt 720
tggtgggatg aaccaactgt ctctgagctt agccttcatc agaatcatca gcttatttgg 780
gttcgagcta atcatatgat ttatgattat tgttttgatg ctactaggtt tcctgttact 840
cctcttgagt gccaacatca tcgtcatttg 870
<210> 40
<211> 290
<212> PRT
<213> 拟南芥(Arabidopsis thaliana)
<400> 40
Met Val Gly Met Asp Leu Phe Lys Cys Val Met Met Ile Met Val Leu
1 5 10 15
Val Val Ser Cys Gly Glu Ala Val Ser Gly Ala Lys Phe Asp Glu Leu
20 25 30
Tyr Arg Ser Ser Trp Ala Met Asp His Cys Val Asn Glu Gly Glu Val
35 40 45
Thr Lys Leu Lys Leu Asp Asn Tyr Ser Gly Ala Gly Phe Glu Ser Arg
50 55 60
Ser Lys Tyr Leu Phe Gly Lys Val Ser Ile Gln Ile Lys Leu Val Glu
65 70 75 80
Gly Asp Ser Ala Gly Thr Val Thr Ala Phe Tyr Met Ser Ser Asp Gly
85 90 95
Pro Asn His Asn Glu Phe Asp Phe Glu Phe Leu Gly Asn Thr Thr Gly
100 105 110
Glu Pro Tyr Ile Val Gln Thr Asn Ile Tyr Val Asn Gly Val Gly Asn
115 120 125
Arg Glu Gln Arg Leu Asn Leu Trp Phe Asp Pro Thr Thr Glu Phe His
130 135 140
Thr Tyr Ser Ile Leu Trp Ser Lys Arg Ser Val Val Phe Met Val Asp
145 150 155 160
Glu Thr Pro Ile Arg Val Gln Lys Asn Leu Glu Glu Lys Gly Ile Pro
165 170 175
Phe Ala Lys Asp Gln Ala Met Gly Val Tyr Ser Ser Ile Trp Asn Ala
180 185 190
Asp Asp Trp Ala Thr Gln Gly Gly Leu Val Lys Thr Asp Trp Ser His
195 200 205
Ala Pro Phe Val Ala Ser Tyr Lys Glu Phe Gln Ile Asp Ala Cys Glu
210 215 220
Ile Pro Thr Thr Thr Asp Leu Ser Lys Cys Asn Gly Asp Gln Lys Phe
225 230 235 240
Trp Trp Asp Glu Pro Thr Val Ser Glu Leu Ser Leu His Gln Asn His
245 250 255
Gln Leu Ile Trp Val Arg Ala Asn His Met Ile Tyr Asp Tyr Cys Phe
260 265 270
Asp Ala Thr Arg Phe Pro Val Thr Pro Leu Glu Cys Gln His His Arg
275 280 285
His Leu
290
<210> 41
<211> 912
<212> DNA
<213> 矮慈姑(Sagittaria pygmaea)
<400> 41
atggctctcc gaccgtcttt acataaacag ttcgctctcc tagtggcagc gtctgtgctg 60
gccttttgct gctcggcagc aggccgcagc gtcggcctcg ccccggcctc gccctccagc 120
ttcaacaacg atttcgacat cacctggggt gatggccggg ggaagatcct aaacaacggc 180
cagctcctca gcctctccct ggacaaaacc tccggctcag ggtttcaatc taaaaaccag 240
tacctctttg gcaacatcga catgcaactg aagctcgtcc ccggcaactc ggctggaacg 300
gtcaccgcct attacctatc ctcacagggc cctacccacg acgagatcga ctttgagttc 360
ctcgggaacg tctccggcca gccctacacc ctgcacacca acgttttctc ccaggggaaa 420
ggcaacaggg agcaacagtt ccggctttgg ttcgacccca ccaaggactt ccacacctat 480
tcgatcctct ggaaccccag ccacatcgtc ttctacgtcg acggcacccc catcagagac 540
ttccgcaata acgaggccag aggagttccc ttccccaagg cccagccgat gcggatctat 600
tccagtcttt ggaacgccga cgactgggct acccaaggag gccggatcaa gacagactgg 660
acgcaggcgc cattcacggc gtcctacagg ggattcaagg cggacgcatg tgccgttgga 720
tcaactggat cctcctccaa atgcgccgcc ttgcagacca ccgccggcaa caccaactgg 780
tggatccggc aggagctcga tgccaccggc caggagcgca tgcgctgggt gcagcgcaac 840
cacatgatct acaactactg cacagacgtc aaccgcttcc ctcaggggtt acccactgag 900
tgctccgttg cc 912
<210> 42
<211> 304
<212> PRT
<213> 矮慈姑(Sagittaria pygmaea)
<400> 42
Met Ala Leu Arg Pro Ser Leu His Lys Gln Phe Ala Leu Leu Val Ala
1 5 10 15
Ala Ser Val Leu Ala Phe Cys Cys Ser Ala Ala Gly Arg Ser Val Gly
20 25 30
Leu Ala Pro Ala Ser Pro Ser Ser Phe Asn Asn Asp Phe Asp Ile Thr
35 40 45
Trp Gly Asp Gly Arg Gly Lys Ile Leu Asn Asn Gly Gln Leu Leu Ser
50 55 60
Leu Ser Leu Asp Lys Thr Ser Gly Ser Gly Phe Gln Ser Lys Asn Gln
65 70 75 80
Tyr Leu Phe Gly Asn Ile Asp Met Gln Leu Lys Leu Val Pro Gly Asn
85 90 95
Ser Ala Gly Thr Val Thr Ala Tyr Tyr Leu Ser Ser Gln Gly Pro Thr
100 105 110
His Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn Val Ser Gly Gln Pro
115 120 125
Tyr Thr Leu His Thr Asn Val Phe Ser Gln Gly Lys Gly Asn Arg Glu
130 135 140
Gln Gln Phe Arg Leu Trp Phe Asp Pro Thr Lys Asp Phe His Thr Tyr
145 150 155 160
Ser Ile Leu Trp Asn Pro Ser His Ile Val Phe Tyr Val Asp Gly Thr
165 170 175
Pro Ile Arg Asp Phe Arg Asn Asn Glu Ala Arg Gly Val Pro Phe Pro
180 185 190
Lys Ala Gln Pro Met Arg Ile Tyr Ser Ser Leu Trp Asn Ala Asp Asp
195 200 205
Trp Ala Thr Gln Gly Gly Arg Ile Lys Thr Asp Trp Thr Gln Ala Pro
210 215 220
Phe Thr Ala Ser Tyr Arg Gly Phe Lys Ala Asp Ala Cys Ala Val Gly
225 230 235 240
Ser Thr Gly Ser Ser Ser Lys Cys Ala Ala Leu Gln Thr Thr Ala Gly
245 250 255
Asn Thr Asn Trp Trp Ile Arg Gln Glu Leu Asp Ala Thr Gly Gln Glu
260 265 270
Arg Met Arg Trp Val Gln Arg Asn His Met Ile Tyr Asn Tyr Cys Thr
275 280 285
Asp Val Asn Arg Phe Pro Gln Gly Leu Pro Thr Glu Cys Ser Val Ala
290 295 300
<210> 43
<211> 876
<212> DNA
<213> 大麦(Hordeum vulgare)
<400> 43
atggctcgca tgggggcgtc ggtgctggtg atcctgctcg cctcttgtgc cctggcggcg 60
gcgagcttcg acaaggagtt cgacgttacc tggggtgacg ggcgcggcaa gatcctcaac 120
aatggccagc tgctgatgct ggggctggac aaggtctccg gctccgggtt ccagtccaag 180
cgcgagtacc tcttcggcaa gatcgacatg cagctcaagc tcgtccccgg caactccgcc 240
ggcaccgtca ccgcatatta cctgtcgtcg cagggtccga cgcacgacga gatcgacttc 300
gagttcctgg gcaacgtcac cggcgagcca tacacgctgc acaccaacgt gttcacgcag 360
gggcagggcc agcgggagca gcagttccgc ctctggttcg atcctaccaa cgacttccac 420
acctactcca tcctctggaa cccgaagcac atcatcttct tggttgacga catgccgatc 480
agggacttca ggaacatgga gggaaagggg atcgccttcc ccaagaacca gcctatgcgg 540
ctgtactcca gcctctggaa cgccgacgac tgggcgacac agggtggccg cgtcaagacc 600
gactggtccc acgctccgtt ttccgcctcc taccgcggct tcaaggccga cgcgtgcgtg 660
gtgaccgtag gtggccggcc gcgctgcggc gccagcatcg gcacggacgc ggccccaggg 720
accggcggcg cggccgcggt cggcgactgg tacaaccaag agctggatct tacgcggcag 780
cagcgcatgc gttgggtgca gagcaattac atgatctaca actactgcac tgaccccaag 840
cgcgtcgcca agggcgtccc tgccgagtgc tccatg 876
<210> 44
<211> 292
<212> PRT
<213> 大麦(Hordeum vulgare)
<400> 44
Met Ala Arg Met Gly Ala Ser Val Leu Val Ile Leu Leu Ala Ser Cys
1 5 10 15
Ala Leu Ala Ala Ala Ser Phe Asp Lys Glu Phe Asp Val Thr Trp Gly
20 25 30
Asp Gly Arg Gly Lys Ile Leu Asn Asn Gly Gln Leu Leu Met Leu Gly
35 40 45
Leu Asp Lys Val Ser Gly Ser Gly Phe Gln Ser Lys Arg Glu Tyr Leu
50 55 60
Phe Gly Lys Ile Asp Met Gln Leu Lys Leu Val Pro Gly Asn Ser Ala
65 70 75 80
Gly Thr Val Thr Ala Tyr Tyr Leu Ser Ser Gln Gly Pro Thr His Asp
85 90 95
Glu Ile Asp Phe Glu Phe Leu Gly Asn Val Thr Gly Glu Pro Tyr Thr
100 105 110
Leu His Thr Asn Val Phe Thr Gln Gly Gln Gly Gln Arg Glu Gln Gln
115 120 125
Phe Arg Leu Trp Phe Asp Pro Thr Asn Asp Phe His Thr Tyr Ser Ile
130 135 140
Leu Trp Asn Pro Lys His Ile Ile Phe Leu Val Asp Asp Met Pro Ile
145 150 155 160
Arg Asp Phe Arg Asn Met Glu Gly Lys Gly Ile Ala Phe Pro Lys Asn
165 170 175
Gln Pro Met Arg Leu Tyr Ser Ser Leu Trp Asn Ala Asp Asp Trp Ala
180 185 190
Thr Gln Gly Gly Arg Val Lys Thr Asp Trp Ser His Ala Pro Phe Ser
195 200 205
Ala Ser Tyr Arg Gly Phe Lys Ala Asp Ala Cys Val Val Thr Val Gly
210 215 220
Gly Arg Pro Arg Cys Gly Ala Ser Ile Gly Thr Asp Ala Ala Pro Gly
225 230 235 240
Thr Gly Gly Ala Ala Ala Val Gly Asp Trp Tyr Asn Gln Glu Leu Asp
245 250 255
Leu Thr Arg Gln Gln Arg Met Arg Trp Val Gln Ser Asn Tyr Met Ile
260 265 270
Tyr Asn Tyr Cys Thr Asp Pro Lys Arg Val Ala Lys Gly Val Pro Ala
275 280 285
Glu Cys Ser Met
290
<210> 45
<211> 849
<212> DNA
<213> 大豆(Glycine max)
<400> 45
atggctccta gttctgctca caacaatggg ttctatgtgc ttatgctagt tgggatagtg 60
gttagcacta tggttgctac ctgtgctggt agcttctacc aagactttga tctaacatgg 120
ggtggtgacc gtgctaagat attcaatggt ggccagcttc tatcactttc cctagacaaa 180
gtctctggct ctggcttcaa atcaaagaaa gaatacctat ttgggaggat tgatatgcag 240
ctcaagctcg ttgccggcaa ctctgctggc actgtcactg cttactactt gtcatcccaa 300
gggccaacac atgatgagat tgatttcgag tttttgggaa acctaagtgg ggacccttat 360
attctccaca caaacatctt cacccaaggc aaaggcaaca gggagcaaca gttctatctc 420
tggttcgacc ccaccagaaa cttccacact tactctatca tttggaagcc ccagcacatc 480
atattcttgg ttgataacac acccataagg gtattcaaga atgctgaacc tcttggtgtt 540
ccttttccaa agaaccagcc catgagaatc tattctagcc tctggaatgc tgatgactgg 600
gccaccagag gaggattggt gaaaactgat tggtccaaag caccctttac agcatactac 660
cgcaatttca aggccattga gttctcatcc aagtcttcca tttcaaattc tggggctgaa 720
tatgaggcaa atgagcttga tgcttatagc agaagaagac tgagatgggt tcagaagtac 780
ttcatgatct ataactactg cagtgatctc aagcgattcc cacaaggtct tcctgctgaa 840
tgtaaacgt 849
<210> 46
<211> 283
<212> PRT
<213> 大豆(Glycine max)
<400> 46
Met Ala Pro Ser Ser Ala His Asn Asn Gly Phe Tyr Val Leu Met Leu
1 5 10 15
Val Gly Ile Val Val Ser Thr Met Val Ala Thr Cys Ala Gly Ser Phe
20 25 30
Tyr Gln Asp Phe Asp Leu Thr Trp Gly Gly Asp Arg Ala Lys Ile Phe
35 40 45
Asn Gly Gly Gln Leu Leu Ser Leu Ser Leu Asp Lys Val Ser Gly Ser
50 55 60
Gly Phe Lys Ser Lys Lys Glu Tyr Leu Phe Gly Arg Ile Asp Met Gln
65 70 75 80
Leu Lys Leu Val Ala Gly Asn Ser Ala Gly Thr Val Thr Ala Tyr Tyr
85 90 95
Leu Ser Ser Gln Gly Pro Thr His Asp Glu Ile Asp Phe Glu Phe Leu
100 105 110
Gly Asn Leu Ser Gly Asp Pro Tyr Ile Leu His Thr Asn Ile Phe Thr
115 120 125
Gln Gly Lys Gly Asn Arg Glu Gln Gln Phe Tyr Leu Trp Phe Asp Pro
130 135 140
Thr Arg Asn Phe His Thr Tyr Ser Ile Ile Trp Lys Pro Gln His Ile
145 150 155 160
Ile Phe Leu Val Asp Asn Thr Pro Ile Arg Val Phe Lys Asn Ala Glu
165 170 175
Pro Leu Gly Val Pro Phe Pro Lys Asn Gln Pro Met Arg Ile Tyr Ser
180 185 190
Ser Leu Trp Asn Ala Asp Asp Trp Ala Thr Arg Gly Gly Leu Val Lys
195 200 205
Thr Asp Trp Ser Lys Ala Pro Phe Thr Ala Tyr Tyr Arg Asn Phe Lys
210 215 220
Ala Ile Glu Phe Ser Ser Lys Ser Ser Ile Ser Asn Ser Gly Ala Glu
225 230 235 240
Tyr Glu Ala Asn Glu Leu Asp Ala Tyr Ser Arg Arg Arg Leu Arg Trp
245 250 255
Val Gln Lys Tyr Phe Met Ile Tyr Asn Tyr Cys Ser Asp Leu Lys Arg
260 265 270
Phe Pro Gln Gly Leu Pro Ala Glu Cys Lys Arg
275 280
<210> 47
<211> 849
<212> DNA
<213> 黄瓜(Cucumis sativus)
<400> 47
atggcttcca caactctgtt tctcacgctt cttttctctg cttccctaat tgccatctct 60
tcggctaact tcaaccaaga ttttcaaatc acttggggag atggtcgagc aaagattctc 120
aacaatggtg aacttctaac tctgtccctt gacaaggcct ctggctctgg cttccagtct 180
caaaacgagt acttgtttgg aaagattgat atgcaactca agcttgtggc tggcaattct 240
gctggcactg tcactgctta ttatttgtct tcgaaaggat ctacatggga tgagattgac 300
tttgagttct tggggaattt gagtggtgac ccttacactc tccataccaa tgtgtttagc 360
caagggaaag gcaacagaga acaacagttc catctttggt ttgaccccac tgctgatttc 420
cacacctatt ccattctttg gaaccccaat cgtattatat tttcggtgga cggtactccg 480
ataagagaat tcaagaactg ggaatcgaac ggcgtgccat ttccgaagga ccagccaatg 540
agaatatact cgagcttatg gaacgcggac gattgggcaa caagaggagg gctggtgaag 600
acggactgga caaaggctcc tttcactgct tcctacaaaa acttcaaagc cgaagcctgc 660
gtttggtccg gggggaaatc ttcttgcagc ccctcgccgg cggggtcgag caactcatgg 720
ctgtcccaag agatggactc tgcaagtcaa gagagactaa aatgggtgca aaagaattat 780
atgatttaca actattgtac ggacaccaag aggtttcctc aaggcctccc tacagagtgc 840
aacttgcca 849
<210> 48
<211> 283
<212> PRT
<213> 黄瓜(Cucumis sativus)
<400> 48
Met Ala Ser Thr Thr Leu Phe Leu Thr Leu Leu Phe Ser Ala Ser Leu
1 5 10 15
Ile Ala Ile Ser Ser Ala Asn Phe Asn Gln Asp Phe Gln Ile Thr Trp
20 25 30
Gly Asp Gly Arg Ala Lys Ile Leu Asn Asn Gly Glu Leu Leu Thr Leu
35 40 45
Ser Leu Asp Lys Ala Ser Gly Ser Gly Phe Gln Ser Gln Asn Glu Tyr
50 55 60
Leu Phe Gly Lys Ile Asp Met Gln Leu Lys Leu Val Ala Gly Asn Ser
65 70 75 80
Ala Gly Thr Val Thr Ala Tyr Tyr Leu Ser Ser Lys Gly Ser Thr Trp
85 90 95
Asp Glu Ile Asp Phe Glu Phe Leu Gly Asn Leu Ser Gly Asp Pro Tyr
100 105 110
Thr Leu His Thr Asn Val Phe Ser Gln Gly Lys Gly Asn Arg Glu Gln
115 120 125
Gln Phe His Leu Trp Phe Asp Pro Thr Ala Asp Phe His Thr Tyr Ser
130 135 140
Ile Leu Trp Asn Pro Asn Arg Ile Ile Phe Ser Val Asp Gly Thr Pro
145 150 155 160
Ile Arg Glu Phe Lys Asn Trp Glu Ser Asn Gly Val Pro Phe Pro Lys
165 170 175
Asp Gln Pro Met Arg Ile Tyr Ser Ser Leu Trp Asn Ala Asp Asp Trp
180 185 190
Ala Thr Arg Gly Gly Leu Val Lys Thr Asp Trp Thr Lys Ala Pro Phe
195 200 205
Thr Ala Ser Tyr Lys Asn Phe Lys Ala Glu Ala Cys Val Trp Ser Gly
210 215 220
Gly Lys Ser Ser Cys Ser Pro Ser Pro Ala Gly Ser Ser Asn Ser Trp
225 230 235 240
Leu Ser Gln Glu Met Asp Ser Ala Ser Gln Glu Arg Leu Lys Trp Val
245 250 255
Gln Lys Asn Tyr Met Ile Tyr Asn Tyr Cys Thr Asp Thr Lys Arg Phe
260 265 270
Pro Gln Gly Leu Pro Thr Glu Cys Asn Leu Pro
275 280
<210> 49
<211> 870
<212> DNA
<213> 水稻(Oryza sativa)
<400> 49
atggggcaac ctagggctca actcctaccc tccatgtcca tggcagcttt gtatctcatc 60
ctagccacct ccccagtaat cagcgacatg accgacagcc ttgacatgct gtggggcaat 120
acacaggtgc tctatgacag cactggccac caaattgtat cactgtccct tgaccgctgg 180
actacttctg cattccgctc aaagactaag tatctctttg cgaggattga catggacatc 240
aagcttgttg ccaaggactc agccggcact gtcaccacat tatatatgat aactgagggg 300
ctgtgggaca tacatgatga gattgatctc gagttcttgg ggaacaccac cggtgagccc 360
tacaccttgc acactaacat ctatgccaga ggaacaggtg gccgagaaaa gcagtaccgg 420
ctttggtttg atccaacaga agacttccat acctacacca tcatctggaa cccgcagatg 480
atcttaatac ttgttgatgg cacaccaatt cggcagatga agaatcagct aaggaatgat 540
atacccttcc cgctatatca accaatgagg ctgtacgcca gcatctggga tgccgatgac 600
tgggcaacgc agggtgggcg tatcaaaacc gactggtctc aagcaccatt taccgcattc 660
ttccggaact accaagctaa cgcctgcatt ccgtacaaaa ctgcctggat ttgcagccaa 720
gggtctaatg acagcagctg gtttacccag gatttggatg aggaagggaa gcagaaactt 780
aaggacgtag atgataacta caagatttat gattactgca ctgactcaag gaggtaccca 840
aatgggtatc ccccagagtg cgggtcacag 870
<210> 50
<211> 290
<212> PRT
<213> 水稻(Oryza sativa)
<400> 50
Met Gly Gln Pro Arg Ala Gln Leu Leu Pro Ser Met Ser Met Ala Ala
1 5 10 15
Leu Tyr Leu Ile Leu Ala Thr Ser Pro Val Ile Ser Asp Met Thr Asp
20 25 30
Ser Leu Asp Met Leu Trp Gly Asn Thr Gln Val Leu Tyr Asp Ser Thr
35 40 45
Gly His Gln Ile Val Ser Leu Ser Leu Asp Arg Trp Thr Thr Ser Ala
50 55 60
Phe Arg Ser Lys Thr Lys Tyr Leu Phe Ala Arg Ile Asp Met Asp Ile
65 70 75 80
Lys Leu Val Ala Lys Asp Ser Ala Gly Thr Val Thr Thr Leu Tyr Met
85 90 95
Ile Thr Glu Gly Leu Trp Asp Ile His Asp Glu Ile Asp Leu Glu Phe
100 105 110
Leu Gly Asn Thr Thr Gly Glu Pro Tyr Thr Leu His Thr Asn Ile Tyr
115 120 125
Ala Arg Gly Thr Gly Gly Arg Glu Lys Gln Tyr Arg Leu Trp Phe Asp
130 135 140
Pro Thr Glu Asp Phe His Thr Tyr Thr Ile Ile Trp Asn Pro Gln Met
145 150 155 160
Ile Leu Ile Leu Val Asp Gly Thr Pro Ile Arg Gln Met Lys Asn Gln
165 170 175
Leu Arg Asn Asp Ile Pro Phe Pro Leu Tyr Gln Pro Met Arg Leu Tyr
180 185 190
Ala Ser Ile Trp Asp Ala Asp Asp Trp Ala Thr Gln Gly Gly Arg Ile
195 200 205
Lys Thr Asp Trp Ser Gln Ala Pro Phe Thr Ala Phe Phe Arg Asn Tyr
210 215 220
Gln Ala Asn Ala Cys Ile Pro Tyr Lys Thr Ala Trp Ile Cys Ser Gln
225 230 235 240
Gly Ser Asn Asp Ser Ser Trp Phe Thr Gln Asp Leu Asp Glu Glu Gly
245 250 255
Lys Gln Lys Leu Lys Asp Val Asp Asp Asn Tyr Lys Ile Tyr Asp Tyr
260 265 270
Cys Thr Asp Ser Arg Arg Tyr Pro Asn Gly Tyr Pro Pro Glu Cys Gly
275 280 285
Ser Gln
290
<210> 51
<211> 876
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA序列
<400> 51
atgggctcgt ccctctggac ttgtttgatc ctcctctcct tggcatcggc atccttcgca 60
gcgaaccctc gaactccgat cgatgtgcct ttcggacgga actacgtgcc gacatgggca 120
ttcgaccaca ttaagtattt gaacggaggc tcggagatcc agttgcatct cgacaagtac 180
accggcactg gtttccagtc gaagggctcc tacttgttcg gacatttctc catgtacatc 240
aaattggtgc ctggtgactc ggcaggaact gtcaccgcat tctacctctc gtcgacaaac 300
gcagagcatg acgaaatcga cttcgagttc ctcggcaaca ggacaggaca gccgtacatc 360
ctccagacca acgtcttcac aggaggcaaa ggtgatcggg aacagcggat ctacttgtgg 420
ttcgatccca caacccagta ccataggtac tcggtgctct ggaacatgta tcagatcgtc 480
ttctacgtcg acgattatcc gatccgagtg ttcaagaact ccaacgactt gggcgtcaaa 540
ttccccttca accagcccat gaagatttac aactcgttgt ggaacgccga cgattgggca 600
accaggggtg gtctcgagaa gacagattgg tcgaaagcac ctttcatcgc gtcgtacaag 660
ggtttccaca tcgacggatg tgaagcctcc gtgaacgcca agttctgtga cacccagggc 720
aaacgatggt gggatcagcc ggaattccgg gatttggatg cagcccagtg gcagaagctc 780
gcgtgggtca ggaacaagta caccatctat aactactgta ccgatcggaa acgatattcg 840
caggtgcctc ccgagtgtac acgcgatagg gacatc 876
<210> 52
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 52
acatgtcttt gataagctag cgggccgcat catgta 36
<210> 53
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 53
tacatgatgc ggcccgctag cttatcaaag acatgt 36
<210> 54
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 54
ttaatcgcct tgcagcacac cgcttcctcg ctcactgact c 41
<210> 55
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 55
acaataaccc tgataaatgc ggaacaacac tcaaccctat ctcggtc 47
<210> 56
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 56
agatagggtt gagtgttgtt ccgcatttat cagggttatt gtctcatgag cgg 53
<210> 57
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 57
ttctacacga aggaaagagg aggagagagt tgaacctgga cg 42
<210> 58
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 58
aggttcaact ctctcctcct ctttccttcg tgtagaagac cagacag 47
<210> 59
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 59
tcagtgagcg aggaagcggt gtgctgcaag gcgattaagt tgg 43
<210> 60
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 60
ttcctcaatc ctctatatac acaactggcc atgggctcgt ccctctggac 50
<210> 61
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 61
agctcgctag agtcgaccta gatgtcccta tcgcgtgtac actcg 45
<210> 62
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 62
taggtcgact ctagcgagct cgagatc 27
<210> 63
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 63
catggccagt tgtgtatata gaggattgag gaaggaagag 40
<210> 64
<211> 11101
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA序列
<400> 64
ttgaagttcc tattccgagt tcctattctc tagaaagtat aggaacttca gtacccgggt 60
ataagctagc ttccgttaaa ttgccgtcgt cagccgttaa attaccgatt aatcccgata 120
aatttccgag atctccgtta aattgccgtt cgcagccgtt aaattaccgg ggacgaccga 180
taaatttccg cgatgaattc atggtgtttt gatcatttta aatttttata tggcgggtgg 240
tgggcaactc gcttgcgcgg gcaactcgct taccgattac gttagggctg atatttacgt 300
aaaaatcgtc aagggatgca agaccaaacc gttaaatttc cggagtcaac agcatccaag 360
cccaagtcct tcacggagaa accccagcgt ccacatcacg agcgaaggac cacctctagg 420
catcggacgc accatccaat tagaagcagc aaagcgaaac agcccaagaa aaaggtcggc 480
ccgtcggcct tttctgcaac gctgatcacg ggcagcgatc caaccaacac cctccagagt 540
gactaggggc ggaaatttat cgggattaat ttccactcaa ccacaaatca cagtcgtccc 600
cggtaattta acggctgcag acggcaattt aacggcttct gcgaatcgct tggattcccc 660
gcccctggcc gtagagctta aagtatgtcc cttgtcgatg cgatgtatca caacatataa 720
atactggcaa gggatgccat gcttggagtt tccaactcaa tttacctcta tccacacttc 780
tcttccttcc tcaatcctct atatacacaa ctggggatcc accatgttct cggcaggcca 840
caagattaag ggtacagtcg tcctcatgcc taaaaacgag ttggaagtga accccgatgg 900
ctccgcagtc gataacctca acgcattcct cggacgttcg gtgtcgctcc agctcatctc 960
cgcgaccaaa gccgacgccc acggtaaggg aaaggtgggc aaggacacgt tcttggaagg 1020
tatcaacact tcgctcccta ccttgggagc aggagagtcc gcattcaaca ttcacttcga 1080
gtgggacggt tcgatgggca ttcccggagc gttctatatc aagaactata tgcaggtgga 1140
gttcttcttg aagtccttga ccttggaggc aatctcgaac cagggtacca tccgtttcgt 1200
gtgtaactcg tgggtctaca acaccaagct ctacaaatcc gtgcggatct tcttcgcgaa 1260
ccacacttac gtcccttcgg agacacctgc ccctttggtg tcgtaccgcg aggaggaatt 1320
gaagtccctc cgtggtaacg gtactggaga aaggaaggag tatgatagga tctacgacta 1380
cgacgtctat aacgatttgg gtaaccccga caaatcggaa aagttggcac gtcctgtgtt 1440
gggaggctcc tccaccttcc cctaccctcg acgcggccgc acgggacgcg gtcccactgt 1500
caccgatccg aacacagaga agcagggcga agtcttctac gtgcccaggg acgaaaacct 1560
cggccacttg aagtcgaagg atgcattgga gattggaacc aagtccctct cccagatcgt 1620
ccagcctgca ttcgaatcgg cgttcgattt gaaatcgacg cccatcgagt tccactcgtt 1680
ccaggacgtc catgacttgt atgaaggtgg tatcaaattg cctcgggacg tcatctccac 1740
cattatcccc ctccccgtga tcaaggaatt gtaccgcacc gacggccagc atattctcaa 1800
attcccccag ccgcacgtcg tccaggtctc gcagtccgca tggatgacag atgaggaatt 1860
cgcgagggaa atgattgcag gtgtcaaccc gtgtgtcatc cgaggcttgg aggagttccc 1920
tcctaagtcc aacctcgatc ctgccatcta tggagaccag tcctccaaga ttacagccga 1980
ttccctcgat ctcgacggtt atactatgga tgaagcactc ggttccaggc gattgttcat 2040
gctcgattat catgatatct tcatgcccta tgtgcgccag atcaaccagt tgaactcggc 2100
aaaaacatat gcaacgagga cgatcctctt cctccgagaa gacggcacac tcaagcctgt 2160
ggcaatcgag ctctcgctcc cccattccgc aggcgatctc tccgcagccg tgtcgcaggt 2220
ggtgttgcct gcaaaagaag gagtggagtc gaccatctgg ctcttggcca aagcatatgt 2280
gattgtgaac gattcctgtt atcaccagct catgtcgcat tggctcaaca ctcacgcggc 2340
aatggaaccc ttcgtgatcg ccacgcaccg gcacctctcg gtgctccacc cgatctacaa 2400
gctcctcact ccccactacc gtaacaacat gaacattaac gccttggcac ggcagtcgtt 2460
gatcaacgcg aacggcatca ttgagacaac gttcctcccc tccaagtact ccgtcgaaat 2520
gtcgtccgca gtctacaaaa actgggtctt caccgaccag gcgttgcctg ccgacttgat 2580
caaacgaggc gtcgcaatca aagatccctc cactcctcat ggcgtccgcc tcttgatcga 2640
ggactacccc tacgcagcgg acggattgga aatctgggca gccatcaaga cctgggtgca 2700
ggaatacgtc cctttgtact atgcgaggga cgatgatgtc aaaaacgact cggaactcca 2760
gcattggtgg aaggaggcag tggaaaaggg ccatggagat ctcaaggata aaccctggtg 2820
gcctaagctc cagaccttgg aggacctcgt cgaagtgtgt ttgatcatta tctggatcgc 2880
atccgcgttg catgcagccg tgaacttcgg acagtatccc tatggaggcc tcatcatgaa 2940
ccgtcccacc gcatccagga ggctcctccc cgaaaaagga acacccgaat acgaagaaat 3000
gatcaacaac cacgaaaagg catacctccg gaccatcact tccaaactcc cgaccttgat 3060
ctcgctctcc gtgatcgaga ttttgtcgac acatgcgtcg gacgaggtct atttgggtca 3120
gcgggataac ccgcactgga catccgattc caaggccctc caggcgttcc agaagttcgg 3180
caacaagctc aaggagatcg aggagaaact cgtgaggcgg aacaacgacc cttccctcca 3240
gggaaaccgg ttgggacctg tccagctccc gtatacgttg ctctacccct cctcggaaga 3300
aggcctcact ttcaggggta tccccaactc gatttccatc tgactcgaga tctagagggt 3360
gactgacacc tggcggtaga caatcaatcc atttcgctat agttaaagga tggggatgag 3420
ggcaattggt tatatgatca tgtatgtagt gggtgtgcat aatagtagtg aaatggaagc 3480
caagtcatgt gattgtaatc gaccgacgga attgaggata tccggaaata cagacaccgt 3540
gaaagccatg gtctttcctt cgtgtagaag accagacaga cagtccctga tttacccttg 3600
cacaaagcac tagaaaatta gcattccatc cttctctgct tgctctgctg atatcactgt 3660
cattcaatgc atagccatga gctcatctta gatccaagca cgtaattcca tagccgaggt 3720
ccacagtgga gcagcaacat tccccatcat tgctttcccc aggggcctcc caacgactaa 3780
atcaagagta tatctctacc gtccaataga tcgtcttcgc ttcaaaatct ttgacaattc 3840
caagagggtc cccatccatc aaacccagtt caataatagc cgagatgcat ggtggagtca 3900
attaggcagt attgctggaa tgtcggggcc agttggccgg gtggtcattg gccgcctgtg 3960
atgccatctg ccactaaatc cgatcattga tccaccgccc acgaggcgcg tctttgcttt 4020
ttgcgcggcg tccaggttca actctctctt aattaaatag cgacaagccg aacggcaccg 4080
gcaggtacaa tggttcgctg tacttgcttg cgcaagcggg tctttgggga ttgagcgcat 4140
ttggtgttgc aaaggatttg atgtaaatgt agtcgacatc ttagcacaga ggggagagtt 4200
gataaaatgt ggtctgtttg aatgatagtc gggttcgtga cctatattcg tgatagtgga 4260
gataggtctg cgcctatctt atcgggccgg agcaaaaatt ccaccgcagc ggggtgagtt 4320
ttcgttatac agccatccca cttccagctt caaattgtca gtttaatcca gcccaattca 4380
atcattggag aaccggtttt atgtcttcga agtcccacct cccctacgca attcgcgcaa 4440
ccaaccatcc caacccttta acatctaaac tcttctccat cgccgaggag aagaaaacca 4500
acgtcaccgt ctccgcagac gttactactt ccgccgagct cctcgatctt gctgaccgcc 4560
taggccccta tatcgcagtt ctgaaaaccc acatcgacat cctcaccgat ctcaccccgt 4620
cgaccctttc ctcgctccaa tccctcgcga caaagcacaa cttcctcatc tttgaggacc 4680
gcaagttcat cgacatcggc aacaccgtgc aaaagcagta ccacggtggc gctctccgca 4740
tctccgaatg ggcacacatc atcaactgcg ccatcctgcc gggcgaaggg atcgtcgagg 4800
ccctcgcaca gacaaccaag tctcctgact ttaaagacgc gaatcaacga ggtctcctga 4860
ttcttgccga gatgacgagt aagggatctc ttgcgacagg ggagtacacg gcacgctcgg 4920
ttgagtacgc gcggaagtat aaggggtttg tgatgggatt cgtgagtaca agggcgttga 4980
gtgaggtgct gcccgaacag aaagaggaga gcgaggattt tgtcgtcttt acgactgggg 5040
tgaatctgtc ggataagggg gataagctgg ggcagcagta tcagacacct gggtcggcgg 5100
ttgggcgagg tgcggacttt atcattgcgg gtaggggcat ctataaggcg gacgatccag 5160
tcgaggcggt tcagaggtac cgggaggaag gctggaaagc ttacgagaaa agagttggac 5220
tttgagggtg actgacacct ggcggtagac aatcaatcca tttcgctata gttaaaggat 5280
ggggatgagg gcaattggtt atatgatcat gtatgtagtg ggtgtgcata atagtagtga 5340
aatggaagcc aagtcatgtg attgtaatcg accgacggaa ttgaggatat ccggaaatac 5400
agacaccgtg aaagccatgg tctttccttc gtgtagaaga ccagacagac agtccctgat 5460
ttacccttgc acaaagcact agaaaattag cattccatcc ttctctgctt gctctgctga 5520
tatcactgtc attcaatgca tagccatgag ctcatcttag atccaagcac gtaattccat 5580
agccgaggtc cacagtggag cagcaacatt ccccatcatt gctttcccca ggggcctccc 5640
aacgactaaa tcaagagtat atctctaccg tccaatagat cgtcttcgct tcaaaatctt 5700
tgacaattcc aagagggtcc ccatccatca aacccagttc aataatagcc gagatgcatg 5760
gtggagtcaa ttaggcagta ttgctggaat gtcggggcca gttggccggg tggtcattgg 5820
ccgcctgtga tgccatctgc cactaaatcc gatcattgat ccaccgccca cgaggcgcgt 5880
ctttgctttt tgcgcggcgt ccaggttcaa ctctctcctc taggttgaag ttcctattcc 5940
gagttcctat tcttcaaata gtataggaac ttcaactagc tagtgcatgc gtacgatttt 6000
gacatttgct ccattgtcga ggatggatgg aacgagcggc gtgcgccacg aaagtgaggc 6060
tattgcctat cagctctttg ctacattccg gaaacaaaca tccctttttg tgaattatct 6120
acgcaactta gatggcgtga acgcatcttc aaagtctttc ggcaggtccg gcacgacttt 6180
tgcatccaga gaagcgccta catgtgtatt cgaccacctc ctagcgcgct tggatatgag 6240
gaaatattac tgagagtcga aaacaagctc caccgcacca gctcttcttg gagttttata 6300
ttaaagaata ttcccagctc gttgtattat tctttttcta ccgtgctaat gtatcaagga 6360
ctttggtacc tattaacgtt attattcgtg tgctattccc aaacataacc ctgtatatgt 6420
ttcgaacgcc gttatgaccc atgtcttaca tactcattaa gtcattccct tggataatct 6480
cgactcagat gcggcggttg atgtaggagg agaggtaatc gaggacctcc tgggagatga 6540
tgccgttcca ggcggggtag cggatggagc cctcggcgga gcccttgagc tgctcgatat 6600
gctgccactc ctcgatgggg ttggtctcat ccttgagggc gatcatctcc ttggagatgg 6660
gatcgtaggc gtagtagcgg gagactagtg cgaagtaatg atcggggatg gcggtgatct 6720
gatgggtgta ggtggtgcgg gcgacggcgg aggcgcgctt atcggaccag ttgccgacga 6780
cgttggtgag ctcggtgagg cccttcatgg agaggaagga ggtcatgaga tggcggccga 6840
tatgggactt ggggccgttc ttgatggcga agatggagta gggggcgttc ttcttgaggg 6900
ccttgttgta ggagcggacg aggttatcct tgaggagctg gtactcctgc ttgttggagg 6960
aggagttgcc ggtgcggttg acgcgcttga ggacgggctc ggagttgcgg aggaactcat 7020
cgaggtagac gaggggatcg atgcggccgc gggcggagaa gaagtagata tggcgggaga 7080
cggaggtctt ggtctcggtg acgaggcact ggatgatgac gccgaggtac ttgttctgga 7140
cgagcttgaa ggacttggga tcgacgttct tgatatcgga gaagcggccg cagttgatga 7200
aggtggcgag gaagaggaac tggtagaggg tcttggtctt ggtgaagcgg gaggtgtact 7260
cgaaggagtt gaggatcttc tcggtgatct cccagatgga ctcgccctcg gagaggaggg 7320
ccttgagcat cttcttggaa tgggagttgc ccttatcggc ctcctcggag gactcgaact 7380
ggagctggag ggaggagacg atatcggtga tatcggactg atgcttctgg ccgtagtagg 7440
ggatgatggt gaactcccag gcggggatga gcttcttgag ggaggcctcc aggatggtgg 7500
ccttctgggt cttgtacttg aactggaggg acttgttgac gatatcgaag gagagggagt 7560
tggagatgat ggtgttgtag gacatgaagg tggcgcgctt gatggcggtg ccgttatggg 7620
tgatcatcca gcagaggtag gtgagctcgg cggcgcagag ggcgatcttc tcgccggagg 7680
ggcgctcgaa gcgctcgacg aactggcgga cgaggacctt ggggggggtc ttgcagagga 7740
tatcgaactg gggcatggtg ctcagatact acggctgatc gcgtagaggt actgagcaaa 7800
acagatgtca gtaaggagaa gagttgaatg aatggaagaa gagtaggaaa ggaggtatgg 7860
gggaaagata tacgtactga tgcggacgaa gagagaaaga aggaaaaaag ttgtgggagg 7920
ggaaggaggg ggaatcctta tatggagggg caagcgagaa ggcgaattag tgggcgggct 7980
taagccctcg accgccgccc ttatcattgg acatggaggg gtaatgcccc caccacgcat 8040
gtgcgggacc gacgcagaat ctgcacggcg gagtctcttc cagactgttg acttttgggc 8100
gatgactctt gttgctgcgg ccttttgggt acaccaacct cgttgatctt gtttccttgg 8160
ttctctttcg ctcggagacc cgaccatgac cccaccatca gtcactatcc tgcctcgtcg 8220
ataaaaattt tttcttccct ctgattgtta catagtatgt ttccaccttt ccggtggatt 8280
tcggacagtc aaactgggca tcaacgcagt ggtgggctgc ttcgtttgct gcgtgttgta 8340
cttgtttgca tttgaacccc gcggtcgttc gagtccttaa ttggtccgct cccggtcaac 8400
acccaagcag ctgtggcccg gccgagtggc gcctgtctgg tccacagtaa gcttggcgta 8460
atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat 8520
acgagccgga agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt 8580
aattgcgttg cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta 8640
atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc 8700
gctcactgac tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa 8760
ggcggtaata cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa 8820
aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct 8880
ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac 8940
aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc 9000
gaccctgccg cttaccggat acctgtccgc ctttttccct tcgggaagcg tggcgctttc 9060
tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg 9120
tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga 9180
gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta acaggattag 9240
cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta 9300
cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag 9360
agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg 9420
caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac 9480
ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc 9540
aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag 9600
tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc 9660
agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac 9720
gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc 9780
accggctcca gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg 9840
tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag 9900
tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc 9960
acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac 10020
atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag 10080
aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac 10140
tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg 10200
agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc 10260
gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact 10320
ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg 10380
atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa 10440
tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt 10500
tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg 10560
tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga 10620
cgtctaagaa accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc 10680
ctttcgtctc gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga 10740
gacggtcaca gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc 10800
agcgggtgtt ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact 10860
gagagtgcac catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat 10920
caggcgccat tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc 10980
ttcgctatta cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac 11040
gccagggttt tcccagtcac gacgttgtaa aacgacggcc agtgaattcg agctcggtac 11100
c 11101
<210> 65
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 65
accgggagga aggctggaaa gcttacgaga aaagagttgg actttgaggg 50
<210> 66
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 66
tgagcgagga agcggaagag cgcccaatac gcaaaccgcc 40
<210> 67
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 67
tgcgtattgg gcgctcttcc gcttcctcgc tcactgactc 40
<210> 68
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 68
tatactttct agagaatagg aactcggaat aggaacttca aggaacaaca ctcaacccta 60
tctcggtc 68
<210> 69
<211> 67
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 69
tccgagttcc tattctctag aaagtatagg aacttcgcat ttatcagggt tattgtctca 60
tgagcgg 67
<210> 70
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 70
tctagatctc gagtcagatg tccctatcgc gtgtacactc g 41
<210> 71
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 71
acacgcgata gggacatctg actcgagatc tagagggtga ctgac 45
<210> 72
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 72
aactcttttc tcgtaagctt tccagccttc ctcccggtac 40

Claims (20)

1.一种木葡聚糖内糖基转移酶变体,该变体包括与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个位置处的取代,其中该变体具有木葡聚糖内糖基转移酶活性,并且其中该变体与SEQ IDNO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%、但小于100%序列一致性。
2.如权利要求1所述的变体,该变体是亲本木葡聚糖内糖基转移酶的变体,其中该亲本选自下组,该组由以下各项组成:
(a)一种多肽,该多肽与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽具有至少60%,例如,至少65%、至少70%、至少60%、至少80%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;
(b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严格条件下、中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与(i)SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列或者(ii)(i)的全长互补体杂交;
(c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、或49的成熟多肽编码序列具有至少60%,例如,至少65%、至少70%、至少60%、至少80%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;以及
(d)SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、或50的成熟多肽的片段,该片段具有木葡聚糖内糖基转移酶活性。
3.如权利要求2所述的变体,该变体与该亲本木葡聚糖内糖基转移酶的氨基酸序列具有至少60%,例如,至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
4.如权利要求1-3中任一项所述的变体,其中取代的数目是1-17个,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个取代。
5.如权利要求1-4中任一项所述的变体,该变体包括选自下组的一个或多个取代,该组由以下各项组成:I10A;P30E;A40G;S51T;I53A,V;Y60S;T99E,N;E102G;Q117E;K130R;R136W;Y157H;Y162C;N175S,G,Q;F183I;A254E;以及S280G,E。
6.如权利要求5所述的变体,该变体包括A40G+N175S;A40G+F183I;N175G+S280G;A40G+I53A+N175S;A40G+N175S+F183I;I10A+I53A+E102G;A40G+E102G+Q117E;N175Q+A254E+S280E;P30E+S51T+Y60S+T99N;A40G+T99E+E102G+K130R;或I53V+R136W+Y157H+Y162C+N175S或由其组成。
7.如权利要求1-6中任一项所述的变体,该变体相对于该亲本具有增加的表达产量,其中相对于该亲本,该变体的表达产量是至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加。
8.一种编码如权利要求1-7中任一项所述的变体的分离的多核苷酸。
9.一种核酸构建体或表达载体,包含如权利要求8所述的多核苷酸。
10.一种重组宿主细胞,其包含如权利要求8所述的多核苷酸。
11.一种产生木葡聚糖内糖基转移酶变体的方法,该方法包括:
(a)在适合于表达该变体的条件下培养如权利要求10所述的重组宿主细胞;并且任选地
(b)回收该变体。
12.一种用于获得木葡聚糖内糖基转移酶变体的方法,该方法包括将与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个位置处的取代引入亲本木葡聚糖内糖基转移酶,其中该变体具有木葡聚糖内糖基转移酶活性;并且任选地回收该变体。
13.一种增加木葡聚糖内糖基转移酶的表达产量的方法,该方法包括将与SEQ ID NO:2的全长多肽的位置10、30、40、51、53、60、99、102、117、130、136、157、162、175、183、254、以及280相对应的一个或多个位置处的取代引入亲本木葡聚糖内糖基转移酶以产生变体,其中该变体的表达产量相对于亲本是增加的;并且任选地回收该变体。
14.如权利要求12或13所述的方法,其中取代的数目是1-17个,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或17个取代。
15.如权利要求12-14中任一项所述的方法,其中该变体包括选自下组的一个或多个取代,该组由以下各项组成:I10A;P30E;A40G;S51T;I53A,V;Y60S;T99E,N;E102G;Q117E;K130R;R136W;Y157H;Y162C;N175S,G,Q;F183I;A254E;以及S280G,E。
16.如权利要求12-15中任一项所述的方法,其中该变体包括A40G+N175S;A40G+F183I;N175G+S280G;A40G+I53A+N175S;A40G+N175S+F183I;I10A+I53A+E102G;A40G+E102G+Q117E;N175Q+A254E+S280E;P30E+S51T+Y60S+T99N;A40G+T99E+E102G+K130R;或I53V+R136W+Y157H+Y162C+N175S或由其组成。
17.如权利要求13-16中任一项所述的方法,其中相对于该亲本,该变体的表达产量是至少1.05、至少1.10、至少1.20、至少1.30、至少1.40、至少1.50、至少1.60、至少1.70、至少1.80、至少1.90、至少2、至少2.25、至少2.50、至少2.75、至少3.00、至少3.25、至少3.50、至少3.75、至少4、至少4.25、至少4.50、至少4.75、至少5、至少6、至少7、至少8、至少9、或至少10倍的增加。
18.一种酶组合物,包括如权利要求1-7中任一项所述的变体。
19.一种全培养液配制品或细胞培养组合物,包括如权利要求1-7中任一项所述的变体。
20.如权利要求1-7中任一项所述的变体的用途。
CN201580054541.5A 2014-08-20 2015-08-20 木葡聚糖内糖基转移酶变体以及编码其的多核苷酸 Pending CN106795504A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462039744P 2014-08-20 2014-08-20
US62/039,744 2014-08-20
PCT/US2015/046083 WO2016028999A1 (en) 2014-08-20 2015-08-20 Xyloglucan endotransglycosylase variants and polynucleotides encoding same

Publications (1)

Publication Number Publication Date
CN106795504A true CN106795504A (zh) 2017-05-31

Family

ID=54035316

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580054541.5A Pending CN106795504A (zh) 2014-08-20 2015-08-20 木葡聚糖内糖基转移酶变体以及编码其的多核苷酸

Country Status (4)

Country Link
US (1) US20170267980A1 (zh)
EP (1) EP3183339A1 (zh)
CN (1) CN106795504A (zh)
WO (1) WO2016028999A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110004172A (zh) * 2019-01-07 2019-07-12 湖南农业大学 一种利用苎麻BnXTH5基因提高植物镉敏感性的方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110157714B (zh) * 2019-04-18 2021-07-16 中国人民解放军第二军医大学 红花CtXTH1基因、其编码蛋白质及应用

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5989870A (en) 1986-04-30 1999-11-23 Rohm Enzyme Finland Oy Method for cloning active promoters
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
CA2058633C (en) 1989-06-13 2000-03-21 Virgil B. Lawlis, Jr. A method for killing cells without lysis
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
ES2165420T3 (es) 1994-06-03 2002-03-16 Novozymes Biotech Inc Lacasas myceliophthora purificadas y acidos nucleicos que las codifican.
CN101659926A (zh) 1994-06-30 2010-03-03 诺沃奇梅兹有限公司 非毒性、非产毒性、非致病性镰孢属表达系统及所用启动子和终止子
CN1105211C (zh) 1995-12-21 2003-04-09 诺沃奇梅兹有限公司 提供具有改进的强度和/或形状保持性能和/或抗皱性能的纤维质原料的方法及由此得到的纤维质原料
ATE282086T1 (de) * 1997-02-26 2004-11-15 Novozymes As Mikrobielle xyloglukanendotransglykosilase (xet)
DE69932345T2 (de) 1998-10-26 2007-07-19 Novozymes A/S Erstellung und durchmusterung von interessierenden dna-banken in zellen von filamentösen pilzen
CN100482801C (zh) 1999-03-22 2009-04-29 诺沃奇梅兹有限公司 用于在真菌细胞中表达基因的启动子
WO2001007556A1 (en) 1999-07-27 2001-02-01 The Procter & Gamble Company Compositions comprising xet and a polysaccharide and/or oligosaccharide
EP1421187B1 (en) 2001-07-27 2007-10-10 THE GOVERNMENT OF THE UNITED STATES OF AMERICA, as represented by THE SECRETARY, DEPARTMENT OF HEALTH AND HUMAN SERVICES Systems for in vivo site-directed mutagenesis using oligonucleotides
JP4058412B2 (ja) 2001-10-16 2008-03-12 スウェツリー・テクノロジーズ・アクチボラゲット 高分子炭水化物材料の修飾方法
EP1622921B1 (en) 2003-05-02 2010-06-16 Novozymes Inc. Variants of beta-glucosidases
US7662602B2 (en) 2004-10-21 2010-02-16 Debbie Yaver Polypeptides having lipase activity and polynucleotides encoding same
CN103451164A (zh) 2006-07-14 2013-12-18 诺维信股份有限公司 用于产生具有生物学活性的分泌型多肽的方法
CN102224245B (zh) 2008-09-30 2016-01-13 诺维信股份有限公司 在丝状真菌细胞中使用阳性和阴性选择性基因的方法
RU2560424C2 (ru) 2009-02-20 2015-08-20 ДАНИСКО ЮЭс ИНК. Способ получения состава ферментационного бульона
EP2527448A1 (en) 2011-05-23 2012-11-28 Novozymes A/S Simultaneous site-specific integrations of multiple gene-copies in filamentous fungi
WO2013178674A1 (en) 2012-05-31 2013-12-05 Novozymes A/S Improved selection in fungi

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110004172A (zh) * 2019-01-07 2019-07-12 湖南农业大学 一种利用苎麻BnXTH5基因提高植物镉敏感性的方法
CN110004172B (zh) * 2019-01-07 2021-12-21 湖南农业大学 一种利用苎麻BnXTH5基因提高植物镉敏感性的方法

Also Published As

Publication number Publication date
EP3183339A1 (en) 2017-06-28
WO2016028999A1 (en) 2016-02-25
US20170267980A1 (en) 2017-09-21

Similar Documents

Publication Publication Date Title
CN108271384B (zh) 用于特异性转变靶向dna序列的核酸碱基的革兰氏阳性菌的基因组序列的转变方法、及其使用的分子复合体
KR102218930B1 (ko) 조작된 페닐알라닌 암모니아 리아제 폴리펩티드
KR20220076467A (ko) 신규 핵염기 편집기 및 이의 사용 방법
TW201040276A (en) Protein production in microorganisms of the phylum labyrinthulomycota
KR20120034652A (ko) 유전적으로 변형된 미생물을 발생시키는 방법
CN109706185A (zh) 基于碱基编辑系统突变起始密码子实现基因敲除的方法及应用
CN114702597B (zh) 表达植物抗菌肽Ct-AMP1的工程菌构建与应用
CN106795504A (zh) 木葡聚糖内糖基转移酶变体以及编码其的多核苷酸
US9701970B2 (en) Promoters for expressing genes in a fungal cell
US20110003333A1 (en) Method for Increasing Expression Yield of a Protein of Interest
RU2710731C1 (ru) Система редактирования генома дрожжей debaryomyces hansenii на основе crispr/cas9
US20120094338A1 (en) Continuous production and excretion of waxy products from photosynthetic organisms
US20130302878A1 (en) Expression of plant peroxidases in filamentous fungi
CN108779155A (zh) RlmA灭活的丝状真菌宿主细胞
KR102009273B1 (ko) 구제역 taw97 주의 방어 항원이 발현되는 재조합 바이러스
CA2368113A1 (en) Protozoan expression system
CN114736308B (zh) 球虫抗原肽/il5的融合蛋白基因工程菌的制备及用途
KR100721140B1 (ko) 류코노스톡과 대장균에서 상호복제가 가능한 셔틀벡터
CN114853901A (zh) 表达抗菌肽afp1融合蛋白的工程菌构建与应用
Miller et al. Role of cis-acting sites NorL, a TATA box, and AflR1 in nor-1 transcriptional activation in Aspergillus parasiticus
CN113293155A (zh) 一种几丁二糖脱乙酰酶突变体及应用
CN112852651B (zh) 一种提高酿酒酵母生物转化生产氢化可的松产量的方法
CN109852589A (zh) 一种建兰花叶病毒株系的克隆及其转录载体构建
CN113846116B (zh) 一种提高酿酒酵母中花青素合成效率的方法
KR102009265B1 (ko) 구제역 sat1형 bot의 방어항원이 발현되는 재조합 바이러스

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170531

WD01 Invention patent application deemed withdrawn after publication