CN102086455B - 絮凝酵母絮凝基因、其表达产物及其用途 - Google Patents

絮凝酵母絮凝基因、其表达产物及其用途 Download PDF

Info

Publication number
CN102086455B
CN102086455B CN 200910200097 CN200910200097A CN102086455B CN 102086455 B CN102086455 B CN 102086455B CN 200910200097 CN200910200097 CN 200910200097 CN 200910200097 A CN200910200097 A CN 200910200097A CN 102086455 B CN102086455 B CN 102086455B
Authority
CN
China
Prior art keywords
thr
ser
gly
val
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN 200910200097
Other languages
English (en)
Other versions
CN102086455A (zh
Inventor
白凤武
赵心清
贺雷雨
李倩
李凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University of Technology
Original Assignee
Dalian University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University of Technology filed Critical Dalian University of Technology
Priority to CN 200910200097 priority Critical patent/CN102086455B/zh
Publication of CN102086455A publication Critical patent/CN102086455A/zh
Application granted granted Critical
Publication of CN102086455B publication Critical patent/CN102086455B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供一种获得絮凝酵母的絮凝基因的方法,由此获得的絮凝基因、其编码蛋白,含有该絮凝基因的表达载体、含有该表达载体的菌株,以及用不同启动子利用此絮凝基因构建的新生产菌株。

Description

絮凝酵母絮凝基因、其表达产物及其用途
技术领域
本发明涉及一种自絮凝酵母的絮凝基因FLOsc、其产物、及其应用。 
背景技术
自絮凝酵母是大连理工大学白凤武教授实验室自行选育的具有良好絮凝性状而且发酵性能优良的酵母菌株Saccharomyces cerevisiae flo(驯化选育的自絮凝酵母变异株及应用,中国发明专利200610025259.7)。利用自絮凝酵母进行乙醇发酵,可提高发酵罐中细胞密度,缩短发酵时间,提高生产强度,同时降低乙醇分离过程的能源动力消耗,降低乙醇生产成本,而该菌株为原生质体融合菌株,获得其絮凝基因,并对其功能进行研究,进一步构建新的具有自絮凝特征的生产菌株具有重要的意义。 
现有的获得自絮凝酵母的方法包括自然分离、原生质体融合,以及利用导入絮凝基因的遗传工程方法等。其中自然分离方法带有一定随机性,而且分离得到的酵母存在遗传背景不清楚,发酵性状难以预知等缺点,原生质体融合手段需要筛选大量的融合子,而且在亲本酵母不存在选择标记的情况下难以进行。而利用絮凝基因进行絮凝酵母的转基因育种则可选择发酵性能优良的亲本酵母,实现定向选育优良絮凝酵母。 
现有获得絮凝基因的方法是通过PCR获得(Agric.Biol.Chem.1991,55:1547-1552),或者将絮凝酵母基因组酶切后连接4-6kb左右片段通过功能验证方法获得(微生物学报,2002,42:110-113)。传统PCR扩增存在保真性问题,而且扩增3kb以上的片段时就难以实现,即使可以获得,得到的基因也可能存在点突变,不能保证代表原始菌株的序列,而且山于絮凝基因存在非常长的重复序列,在PCR过程中很难扩增。此外,由于该基因较大,FLO1的启动子区存在大约5kb的多种抑制蛋白的结合区(EMBO J.2001,20(18):5219-31),因此构建表达载体进行功能互补的时候难以包装完整的片段,从而影响功能鉴定。而且功能筛选需要进行大量重组子的培养和性状观察,工作量很大,因此也难以通过功能互补获得。 
因此,本领域仍需要一种获得絮凝酵母絮凝基因的方法,该方法具有保真性好、筛选快速的优点。 
发明内容
本发明人首次采用建立Fosmid基因组文库的方法,利用絮凝基因的保守探针进行文库的PCR筛选,获得了新的絮凝基因。与传统的SuperCos载体相比,Fosmid文库构建时不采用限制性酶切,避免了酶切位点的偏好性,而且其拷贝数低,更具有稳定性。利用PCR快速筛选,成功获得了絮凝基因的全长,该基因长达8kb,如此长的基因很难通过传统PCR手段获得,也难以通过连接4-6kb片段进行功能互补获得。由此完成本发明。 
本申请一个目的是提供一种分离的核酸,选自:(a)含有SEQ ID NO:1或3所示核苷 酸序列的核酸;和(b)与(a)所述核酸具有至少75%序列相同性、同时保留了SEQ ID NO:1或SEQ ID NO:3的絮凝功能的核酸。所述核酸可选自SEQ ID NO:1或SEQ ID NO:3。 
本申请的另一目的是提供一种蛋白质,选自:(i)含有SEQ ID NO:2或SEQ ID NO:4所示的氨基酸序列的蛋白质;和(ii)在(i)的蛋白质的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸且具有絮凝功能的由(i)衍生的蛋白质。所述蛋白质可以选自SEQ ID NO:2或SEQ ID NO:4所示的蛋白质。 
本申请也包括编码本申请所述的蛋白质的核酸。 
本申请再一目的是提供一种表达载体,其含有本申请所述的核酸序列,例如,含有前述(a)或(b)项的核酸序列,或者含有编码前述(i)项或(ii)项所述的蛋白质的核酸序列。 
本申请的表达载体可含有TPS1启动子或者含有PGK1启动子。当含有TPS1启动子时,转化了此表达载体的絮凝酵母诱导型表达絮凝基因;当含有PGK1启动子时,转化了此表达载体的絮凝酵母组成型表达絮凝基因。诱导型表达絮凝基因意指在一定的诱导条件下(例如存在一定的乙醇)表达絮凝基因;而组成型表达絮凝基因则意指不需要任何诱导条件,细胞从开始生长即表达絮凝基因。 
本申请再一目的是提供一种絮凝酵母,其含有本申请所述的表达载体。 
本申请的絮凝酵母包括保藏号为CGMCC NO:3408或CGMCC NO:3409的酿酒酵母(Saccharomyces cerevisiae),两种酿酒酵母已于2009年11月5日保藏于中国微生物菌种保藏管理委员会普通微生物中心(CGMCC,中国北京市朝阳区北辰西路1号院3号,邮编100101)。 
本申请再一目的是提供一种获得絮凝酵母全长絮凝基因的方法,该方法包括以下步骤:(1)用Fosmid载体构建插入片段约为35-40kb的絮凝酵母基因组文库;(2)将所获得的文库转染细菌,平板涂布,经鉴定文库合格后挑取平板上的单克隆于培养基中培养;(3)提取培养的单克隆的DNA,PGR扩增,并对PCR扩增产物进行检测,获得含有絮凝基因的阳性克隆;和(4)对该阳性克隆进行测序,获得该絮凝酵母的絮凝基因。所用细菌可以是大肠杆菌等。 
本申请又一目的是提供一种生产絮凝蛋白的方法,该方法包括:构建本申请的表达载体,用该表达载体转化絮凝酵母,和在使转化的絮凝酵母表达絮凝蛋白的条件下培育该絮凝酵母,从而生产絮凝蛋白。 
附图说明
图1显示絮凝蛋白C-端与模式菌株蛋白的比较。 
图2显示絮凝酵母(左)和破坏子(右)的絮凝性状。 
图3显示S288C的PGK1启动子电泳图。 
图4显示S288C的TPS1启动子电泳图。 
图5显示絮凝基因表达载体的构建。 
图6显示转基因絮凝酵母的絮凝形态。a,组成型絮凝酵母BHL01;b,诱导型絮凝酵母ZLH01;c,含有空载体的游离宿主酵母;d,野生型絮凝酵母S.cerevisiae flo。 
图7显示诱导型絮凝酵母ZLH01在不同乙醇添加浓度下的絮凝性状比较。图下标注的浓度为乙醇浓度(0-8%),上部为整体培养物图像,下部为试管底图像,显示沉降的细胞。 
具体实施方式
本申请提供一种获得絮凝酵母的絮凝基因的方法,该方法包括以下步骤:(1)用Fosmid载体构建插入片段约为35-40kb的絮凝酵母基因组文库;(2)将所获得的文库转染细菌,例如大肠杆菌,平板涂布,经鉴定文库合格后挑取平板上的单克隆于培养基中培养;(3)提取培养的单克隆的DNA,PCR扩增,并对PCR扩增产物进行检测,获得含有絮凝基因的阳性克隆;和(4)对该阳性克隆进行测序,获得该絮凝酵母的絮凝基因。 
絮凝酵母基因组文库的构建可包括提取絮凝酵母基因组DNA、制备所述长约35-40kb的插入片段,以及将该插入片段与Fosmid载体连接等步骤。Fosmid载体可从各种市售途径获得,例如,可使用Copycontrol Fosmid Library Production Kit(Epicentre,USA)提供的Fosmid载体。基因组DNA的提取以及插入片段的制备可采用常规的方法实施。在将插入片段与Fosmid载体连接前,可先将该插入片段用Klenow片段进行末端补平。进一步地,还可通过酚氯仿抽提乙醇沉淀精制该补平的DNA片断。精制后的DNA片段可经过脉冲场电泳确认。 
可将所获得的文库包装、转染和平板涂布,并鉴定该文库是否合格。包装可使用市售获得的噬菌体包装蛋白,如Copycontrol Fosmid Library Production Kit,Epicentre体外包装。然后可转染大肠杆菌,涂布于含有氯霉素的LB平板中。随机挑取单克隆接种,过夜培养,用碱裂解法提取DNA,再用NotI作酶切鉴定,脉冲场电泳检测插入片断的长度。根据涂平板的结果和插入片断的长度,判断文库是否合格。 
PCR扩增优选使用如SEQ ID NOS:5-8所示的引物。扩增所得产物可采用转座子Tn5随机插入目的载体的基因操作方法,利用转座子两端的引物位点进行测序。值得提出的是,由于絮凝基因内部存在很长的重复区,因此常规测序技术很难测序,通过转座方法可以克服这一难点,获得精确的含有较长重复区的基因序列。 
可采用以下方法对所获得的絮凝基因进行功能分析:通过PCR技术获得一段带有筛选标记和酵母同源区域的目的基因,通过电转化法,将目的基因导入自絮凝酵母,使筛选标记与酵母FLOsc基因发生同源重组,破坏该基因的功能,得到一株非絮凝的菌株;由于FLOsc基因破坏后絮凝功能丧失,可以说明该基因负责细胞的絮凝性状。 
本申请也涉及絮凝基因的外源组成型表达,即利用3-磷酸甘油酸激酶(PGK1)的启动子启动絮凝基因的表达,构建整合表达载体整合入无絮凝性状的酵母的HO位点,获得发酵性能提高的新一代絮凝酵母,从而实现絮凝基因的外源组成型表达。由于使用整合载体,该重组酵母培养时不需要抗生素选择,而且克服了复制型载体容易丢失的缺点,遗传稳定,传代十次以上均能稳定絮凝。 
本申请也涉及絮凝基因的外源条件性表达,即利用海藻糖合成酶(TPS1)的启动子启动絮凝基因的表达,构建表达载体整合入无絮凝性状的酵母的HO位点,所获得的酵母转化子在乙醇生成达到3%左右开始絮凝,避免了过早过强絮凝导致的对生长和乙醇发酵的抑制。 
本申请得到了自絮凝酵母Saccharomyces cerevisiae变种的絮凝基因,并构建了组成型絮凝和诱导型絮凝的新一代絮凝酵母,提高了菌株的耐温性和发酵效率。 
本申请的絮凝基因可用于构建应用于其它领域的酵母菌株,如重金属离子吸附,医药蛋白表达,单细胞蛋白的生产等。 
本申请的絮凝基因如SEQ ID NO:1和3所示。本申请包括含有SEQ ID NO:1或SEQ ID NO:3所示DNA序列的分离的核酸。术语“分离的”指其所修饰的物质至少缺乏某些其它成分的制品,这些成分也可存在于这些物质或类似物质天然状况或最初从其制备时。 
术语“多肽”和“蛋白质”指氨基酸残基的聚合物,并不限于产物的最小长度。因此,肽、寡肽、二聚物、多聚物等都包括在该定义中。全长的蛋白质及其片段包括在该定义中。该术语还包括多肽的表达后修饰,例如糖基化、乙酰化、磷酸化等。另外,为了本发明的目的,“多肽”指包括天然序列的修饰,例如缺失、添加和取代(通常性质保守),只要蛋白质维持所需活性。这些修饰可以通过定点诱变设计,或可以是偶然的,例如通过产生蛋白质的宿主突变,或由于PCR扩增引起的错误。 
术语“类似物”指具有天然多肽序列和结构,以及相对于天然分子的一个或多个氨基酸添加、取代(通常性质保守)和/或缺失的化合物,只要修饰不破坏衍生该类似物的原始多肽的活性。制备多肽类似物和突变蛋白的方法是本领域已知的,如下进一步所述。 
特别优选的类似物包括性质上保守的取代,即这些取代发生在与它们的侧链有关的一类氨基酸中。具体而言,氨基酸一般被分成四类:(1)酸性——天冬氨酸和谷氨酸;(2)碱性——赖氨酸、精氨酸、组氨酸;(3)非极性——丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸;(4)无电荷的极性——甘氨酸、天冬酰胺、谷氨酰胺、半胱氨酸、丝氨酸、苏氨酸、酪氨酸。有时将苯丙氨酸、色氨酸和酪氨酸归为芳族氨基酸。例如,有理由预测:单独用异亮氨酸或缬氨酸取代亮氨酸、用谷氨酸取代天冬氨酸、用丝氨酸取代苏氨酸,或者用结构上相关的氨基酸取代类似的保守的氨基酸,这样的取代将不会对生物活性有重要影响。例如,感兴趣的多肽可包括多达约2-6个保守的或不保守的氨基酸取代,甚至多达约5-10个保守的或不保守的氨基酸取代,或2-10之间任何整数,只要该分子的所需功能仍维持完整。本领域的熟练技术人员可结合本领域熟知的Hopp/Woods和Kyte-Doolittle曲线图,容易地测定感兴趣的分子中可耐受改变的区域。 
可用“相同性”或“同源性”来限定本发明的多肽或核苷酸序列。“相同性”或“同源性”指两条多核苷酸或多肽序列上准确的核苷酸对核苷酸或者氨基酸对氨基酸对应。通过排列两个分子的序列直接比较它们的序列信息,计算两条排列的序列间匹配的准确数量,将其除以最短序列的长度,然后乘以100,从而可得到相同性百分数。 
在同源性和相同性分析中可辅助使用易于获得的计算机程序,如ALIGH、Dayhoff、M.O.(Atlas of Protein Sequence and Structure、M.O.Dayhoff编辑,5 Suppl.,3:353-358,National Biomedical Research Foundation,Washington,DC),它适用于Smith和Waterman分析肽用的局部同源性算法(Advances in Appl.Math.,2:482-489,1981)。可从WisconsinSequence Analysis Package(第8版,从Genetics Computer Group,Madison,WI获得)获得测定核苷酸序列同源性的程序,例如,BESTFIT、FASTA和GAP程序,这些程序也依赖于Smith和Waterman算法。使用制造者建议的和上述Wisconsin Sequence Analysis Package所述的默认参数可容易地使用这些程序。例如,可使用Smith和Warerman的同源性算法的默认计分表和6个核苷酸位置的间隔罚分(gap penalty)测定的核苷酸序列与参比序列的同源性百分数。 
本发明建立同源性百分数的另一方法是使用版权属于爱丁堡大学、由John F.Collins和Shane S.Sturrok开发、由IntelliGenetics,Inc.(Mountain View,CA)发行的MPSRCH 程序包。Smith-Waterman算法可在这套程序包中使用,其中,在计分表中使用默认参数(例如,间隔开放罚分=12,间隔延伸罚分=1,间隔=6)。从这批数据产生的“匹配”值反映出“序列同源性”。计算序列间的相同性百分数或相似性百分数的其它合适的程序在本领域中一般都是已知的,例如,另一种排列程序是BLAST,使用默认参数。例如,可使用下述默认参数的BLASTN和BLASTP:基因编码=标准;过滤=无;链=两;截留=60;期望值=10;矩阵=BLOSUM62;描述=50个序列;排序=HIGH SCORE;数据库=无冗余,GenBank+EMBL+DDBJ+PDB+GenBankCDS翻译+Swiss蛋白+Spupdate+PIR。在http://www.ncbi.nim.gov/cgi-bin/BLAST网址上可查到这些程序的详细描述。 
或者,在同源区域之间形成稳定的双链的条件下进行多核苷酸杂交,接着用单链特异性核酸酶消化,然后测定消化的片段的大小,从而测出同源性。在如(对具体的体系所定义的)严格条件下进行的Southern杂交试验中,可鉴别基本同源的DNA序列。确定适当的杂交条件在本领域熟练技术人员所掌握的知识之内。例如,参见Sambrook等,同上;DNA Cloning,同上;Nucleic Acid Hybridization,同上。 
因此,本申请包括与SEQ ID NO:1或SEQ ID NO:3具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%的序列相同性的核酸。本申请也包括包含与SEQ ID NO:1或SEQ ID NO:3具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%的序列相同性的核酸的核酸。 
本申请包括SEQ ID NO:2和4所示的氨基酸序列,以及包含所示氨基酸序列的蛋白质。本申请也包括与SEQ ID NO:2或SEQ ID NO:4具有至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少98%、至少99%的序列相同性的氨基酸序列。 
另一方面,本申请包括编码在SEQ ID NO:2或4限定的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸其具有絮凝蛋白活性的由SEQ ID NO:2或4衍生的蛋白质的核酸。 
在本申请的蛋白质中,也包括在SEQ I D NO:2或4限定的氨基酸序列中经过取代、缺失或添加一个或几个氨基酸其具有絮凝蛋白活性的由SEQ ID NO:2或4衍生的蛋白质。 
本申请也包括本申请蛋白质的编码序列。 
本申请包括含有本申请核苷酸序列的表达载体。本申请的表达载体可含有SEQ ID NO:1或SEQ ID NO:3所示核苷酸序列。在本申请的表达载体中可包含TPS1启动子或PGK1启动子。本申请也包括含有本申请表达载体的细胞或真菌。在优选实施例中,所述真菌是酵母,在更优选的实施方式中,所述酵母是酿酒酵母。 
本申请包括一种生产絮凝蛋白的方法,该方法包括:构建本申请的表达载体,用该表达载体转化絮凝酵母,和在使转化的絮凝酵母表达絮凝蛋白的条件下培育该絮凝酵母,从而生产絮凝蛋白。 
在一个具体身上发生中,本申请包括利用TPS1启动子诱导表达絮凝蛋白的方法,该方法包括构建含有TPS1启动子的絮凝基因表达载体,用该表达载体转染絮凝酵母,和在使该启动子诱导表达絮凝蛋白的条件下培育该絮凝酵母,诱导絮凝蛋白的表达。 
下文将结合具体实施例对本申请作出进一步的描述。应理解,所述实施例仅仅是阐述性的,而非限制性的。实验中所使用的试剂,除非另有说明,都是可从市场上购得常规的试剂。 
实施例 
实施例1:自絮凝酵母基因组中的絮凝基因的获得 
1.提取自絮凝酵母基因组DNA 
用YPD培养基(以g/L计,葡萄糖20,酵母粉10,蛋白胨20)在30℃,150rpm过夜培养自絮凝酵母S.cerevisiae flo(中国普通微生物菌种保藏管理中心保藏号CGMCC0587),取菌体适量,用低熔点琼脂糖包埋,然后用细胞裂解液(1M 山梨醇,0.1M 乙二胺四乙酸钠盐缓冲液pH7.5,蜗牛酶5.5mg/ml)过夜处理,得到自絮凝酵母的全基因组DNA。 
2.制备基因组文库插入片段 
取适量自絮凝酵母的基因组DNA,用DNA破碎仪(Hydro-Shear 0703,美国GeneMachine)将基因组DNA打断,然后将片断化的基因组DNA通过脉冲场电泳分离,在避免紫外照射的条件下切胶回收35~40kb的片断。 
3.DNA片断末端补平与Fosmid载体连接 
将回收后的DNA片断用Klenow片段进行末端补平,并通过酚氯仿抽提乙醇沉淀精制DNA片断,精制后的DNA片段经过脉冲场电泳确认,连入Copycontrol Fosmid Library ProductionKit(Epicentre,USA)提供的Fosmid载体。 
4.文库的包装、转染、平板涂布、鉴定 
用噬菌体包装蛋白(Copycontrol Fosmid Library Production Kit,Epicentre)体外包装,转染大肠杆菌EPI300,然后涂布于含有氯霉素的LB平板中。随机挑取24个单克隆接种,过夜培养,用碱裂解法提取DNA,再用NotI作酶切鉴定,脉冲场电泳检测插入片断的长度。根据涂平板的结果和插入片断的长度,判断文库是否合格。 
5.自絮凝酵母基因组文库的筛选 
用无菌牙签挑取单克隆,加入1.5mL含有氯霉素12.5μg/mL的LB培养基37℃振荡过夜培养。每个样品取适量,加入终浓度为20%的甘油,在-70℃保存。然后每个样品再取150μL,30个一组混合,99℃煮沸10min破菌,取适量做模板进行PCR检测。 
由于絮凝酵母的絮凝基因序列未知,所以尝试根据模式菌株的FLO1序列分别设计两对PCR筛选引物(CF/CR和NF/NR,其中F代表正向引物,R代表反向引物),用于在基因组文库中筛选自絮凝酵母的絮凝基因,其中CF/CR扩增的是絮凝基因C端约1kb的序列,NF/NR扩增的是絮凝基因N端约500bp的序列。 
CF:5’-GCGGAATTCCCTCTGGTTCTTCTGAGAGC-3’(SEQ ID NO:5) 
CR:5’-GCGAAGCTTGTAAGCTGTTGGCACTGC-3’(SEQ ID NO:6) 
NF:5’-GGCGAATTCCTTGAAATTAGCTCGGT -3’(SEQ ID NO:7) 
NR:5’-GCGAAGCTTGCATATCCATAAGCCAT-3’(SEQ ID NO:8) 
PCR扩增体系: 
模板                                        2μL 
正向引物(CF或NF)(10pmol/μL)                1μL 
反向引物(CR或NR)(10pmol/μL)                1μL 
10x缓冲液                                   2.5μL 
dNTP(dATP、dGTP、dCTP、dTTP各2.5mM)         2.0μL 
Ex Taq DNA聚合酶(TaKaRa)(5U/μL)            0.1μL 
蒸馏水                                      16.4μL 
PCR反应条件: 
Figure G200910200097XD00071
PCR产物凝胶电泳检测 
在160个分组样品中,检测出19个能够扩增出PCR产物的样品组,进一步将阳性样品的30个单克隆分别做PCR检测,最后得到5个阳性单克隆,选择其中一个进行全测序。 
6.自絮凝酵母絮凝基因的序列测定 
PCR筛选得到的阳性单克隆由大连宝生物公司进行序列测定。采用转座子Tn5随机插入目的载体的基因操作方法,利用转座子两端的引物位点进行测序,成功获得了一个阳性克隆载体上絮凝基因的全长,将絮凝基因命名为FLO1sc,得其全长8049bp,其中2403A(30%)、2245C(28%)、1397G(17%)、2004 T(25%)。絮凝基因的全长序列见SEQ ID NO:1;其编码的蛋白产物序列如SEQ ID NO:2所示。其中,所编码的蛋白内部45个氨基酸的重复区有43个,比模式酵母的FLO1基因(YAR050W)多25个,絮凝基因内部的重复区据报道和絮凝基因的强度有关,重复区长的絮凝基因絮凝性强(Cell 2008,135:726-37)。通过对比该絮凝基因与模式酵母的FLO1基因,发现其C-端也有部分氨基酸的突变,而且含有序列的插入(图1)。 
实施例2:自絮凝酵母絮凝基因破坏 
为了进一步验证絮凝基因的功能,对其进行了破坏,方法如下: 
1.PCR扩增转化片段 
自絮凝酵母SPSC01絮凝基因破坏引物: 
DF:5’ 
Figure G200910200097XD00072
ACATGGAGGCCCAGAATACC-3’(SEQ ID NO:9) 
DR:5’ 
Figure G200910200097XD00073
CAGTATAGCGACCAGCATTCA-3’(SEQ ID NO:10) 
其中每条引物的方框内序列为FLO1sc的互补序列,位置分别为核苷酸3-47,和1330-1374;其余为卡那霉素抗性基因序列。以DF和DR为引物,以质粒pFA6a-kanMX4(GenBank登陆号AJ002680,参考文献:Wach,A.1996.Yeast 12:259-265)为模板进行PCR扩增。PCR反应条件: 
Figure G200910200097XD00074
Figure G200910200097XD00081
2.电转化法转化酵母细胞 
将活化后的自絮凝酵母,用YPD培养基在30℃,250rpm过夜培养,离心收集酵母细胞,用0.1M柠檬酸钠解絮三次,去离子水漂洗两次,1M山梨醇洗一次,制备电感受态细胞,然后进行电转化。 
3.筛选抗性酵母菌株 
转化后的酵母菌液涂布到含有抗生素G418300μg/mL的YPD平板上,30℃培养48h后,生长出的酵母菌落为阳性克隆。用无菌牙签挑取单克隆,加入含有G418 100μg/mL的YPD培养基30℃ 150rpm过夜培养,非絮凝的单克隆为絮凝基因被破坏的菌株。 
经观察,絮凝基因FLOsc被破坏后,酵母菌的絮凝性状消失(图2),证明该絮凝基因是负责自絮凝酵母的絮凝性状的基因。 
实施例3:絮凝基因的组成型表达 
为了进一步证明絮凝基因的功能,将絮凝基因转化入不具有絮凝性状的游离酵母,并观察絮凝性状的获得。 
将PCR扩增得到的絮凝基因全长插入HO整合载体(NCBI:#AF324728,美国Utah大学David J.Stillman惠赠),并在基因上游插入3-磷酸甘油酸激酶PGK1启动子,线性化后电转入游离工业酒精酿酒酵母宿主4126观察是否有絮凝现象产生。 
具体实施方式: 
1.PCR方法克隆自絮凝酵母的絮凝基因 
用玻璃珠法小量制备自絮凝酵母基因组模板(Burke D,Dawson D,S tearns T.Methodsin Yeast Genetics:A Cold Spring Harbor Laboratory Course Manual,第1版,北京:清华大学出版社,2002),使用Roche公司PCR扩增试剂盒Expand Long Range dNTPack扩增FLOsc全长。 
使用引物(下划线代表的酶切位点见后面括号中): 
FLO F:5’-ggcttaattaaATGACAATGCCTCATCGCTATAT-3’(PacI)(SEQ ID NO:11) 
FLO R:5’-taccatgtcgctggTTAAATAATTGCCAGCAATAAG-3’(BstXI)(SEQ ID NO:12) 
退火温度:58.5℃。 
反应体系及PCR操作参照Roche公司Expand Long Range dNTPack试剂盒说明书进行。 
2.酿酒酵母S288C的PGK1启动子的克隆 
同上制备S288C基因组模板,PCR扩增启动子。 
PGK1启动子扩增使用引物(下划线处的酶切位点在括号中): 
PF:5’-ttggatccACTGTAATTGCTTTTAGTTG-3’(BamHI)(SEQ ID NO:13) 
PR:5’-ggcttaattaaTGTTTTATATTTGTTGTAAAAAG-3’(PacI)(SEQ ID NO:14) 
退火温度:56.5℃。 
S288C的PGK1启动子电泳图见图3。 
纯化PCR产物,将产物连入Promega的pGEM-T Easy Vector,转化大肠杆菌DH5α,纯化质粒后送Takara测序,所获得的序列见SEQ ID NO:3。 
所扩增的产物全长5.2kb,经分析,野性型基因的重复区只有一半被扩增,其编码的氨基酸序列如SEQ ID NO:4所示。 
3.整合载体的构建 
HO基因编码核酸内切酶,负责完成酵母a型和α型之间的转换,普遍存在于出芽繁殖的酵母中,并且该基因是生长非必须的,破坏HO基因不会影响酵母的生长(遗传,1990,12(4),37-39;Yeast,1997,13:1563-1573)。Warren等构建了以HO基因的启动子(起始密码-2720至-1814)906bp为左边界,起始密码后+1199至+1699的500bp为右边界的整合载体,实现了外源基因在酵母中的高效率表达(Nucleic Acids Res.2001,29:55-59)。 
由于HO基因的启动子受若干调节因子调节,构建表达载体时在FLOsc上游插入组成型表达强启动子PGK1(3-phosphoglycerate kinase,3-磷酸甘油激酶)启动子。线性化整合载体后可利用同源重组电转入宿主菌株。 
含有PGK1启动子的组成型表达载体的构建步骤见图5,含有TPS1的启动子的诱导型表达载体的构建采取相似的方法,只是扩增和连接的启动子不同。各限制性内切酶与T4 Ligase购自NEB公司,反应体系与条件按说明书进行。PCR产物纯化与凝胶回收试剂盒使用IllustraGFXTM PCR DNA and Gel Band Purification Kit(GE,USA)操作按说明书进行;大肠杆菌感受态细胞制备及转化、质粒提取参照标准方法进行(J.莎姆布鲁克,分子克隆实验指南,第三版,科学出版社,2002)。具体步骤如下: 
(1)pQL01载体构建: 
酶切、连接和连接产物转化大肠杆菌:纯化FLOsc PCR扩增产物,用PacI、BstXI分步酶切FLOsc纯化产物及HO载体(NCBI:#AF324728),凝胶回收后用T4连接酶过夜连接,获得pQL01,并转化大肠杆菌。随机选取平板菌落接入含Amp(终浓度为50mg/L)的LB液体培养基中37℃过夜培养。菌液明显变混浊说明重组质粒可能转入细胞。 
质粒的提取与验证:吸取3ml菌液提取质粒。BamHI与EcoRI双切后电泳验证条带大小。 
(2)含PGK1启动子的表达载体pQL02的构建: 
用BamHI、PacI双切连入 
Figure G200910200097XD00091
-T载体(Promega公司产品)的PGK1启动子及pQL01整合载体,将PGK1启动子连接入pQL01,得到表达载体pQL02。挑取大小正确的质粒送Takara测序。 
(3)含TPS1启动子的表达载体pQL03的构建: 
构建方法同上,含有TPS1启动子的表达载体命名为pQL03。 
4.线性片段转化宿主酵母4126 
(1)NotI酶切质粒pQL02使其线性化。电泳,凝胶回收其大片段条带。 
(2)线性片段电转化游离工业酒精宿主酵母4126。 
取过夜培养的4126酿酒酵母菌液2mL于新鲜的200ml YPD中30℃,250rpm培养16h。6000rpm离心2min,倾去上清,预冷的超纯水洗涤2次;25mL冰预冷的1mol/L山梨醇洗涤细胞后,用0.5ml 1mol/L山梨醇悬浮细胞,制成感受态。取回收的目的片段5μl加入80μl感受态细胞于1.5mL离心管中,混匀后,冰浴5min,加入电转杯中,采用电击法转化后加1mL 1mol/L山梨醇,30℃培养1h。取200μL涂选择培养基平板(YPD+终浓度300μg/mL G418)。30℃培养至转化子出现。电转仪使用BIO-RAD公司Mi croPulserElectroporator。 
5.转化子的絮凝性状 
含有质粒pQL02的酵母转化子含有PGK1启动子,能够组成型絮凝,命名为BHL01,转化子的验证方法为:提取基因组DNA,利用PCR进行验证,所使用的引物: 
BHL01F:5’-ATGCTATGATGCCCACTG-3’(SEQ ID NO:15); 
BHL01R:5’-AATACACGTATCCCTCGA-3’(SEQ ID NO:16) 
通过如上引物扩增启动子区域和絮凝基因的区域,获得了预期大小的片段,证实了外源片段的整合。挑取平板上长出的较大的菌落,接入YPD液体培养基,30℃培养60h,组成型絮凝酵母转化子可以看到明显的絮凝颗粒(见图6a)。转化子传代10次,絮凝性状保持稳定。 
该组成型絮凝酵母BHL01已于2009年11月5日保藏于中国微生物菌种保藏管理委员会普通微生物中心(CGMCC,中国北京市朝阳区北辰西路1号院3号,邮编100101),保藏号为CGMCC NO:3408。 
实施例4:絮凝基因的诱导表达 
由于组成型絮凝在细胞开始生长时就聚集成团,限制了营养物质的运输,因此存在影响生长和发酵速率的缺点。我们进一步设计了诱导型絮凝酵母的构建。目前文献报道的诱导型絮凝使用的是热激蛋白HSP30的启动子(Appl.Environ.Microbiol.2008,74:6041-6052),该启动子在葡萄糖枯竭的时候受诱导,因此能在生长末期诱导絮凝,但所构建的絮凝酵母絮凝特性不强,而且在乙醇浓度提高时受到强烈抑制(絮凝在6%乙醇存在下只有10%),因此无法用于高浓度乙醇发酵。在我们研究絮凝酵母乙醇耐性的过程中,克隆了絮凝酵母的6-磷酸海藻糖合成酶基因启动子,该启动子比模式酵母多了一个胁迫响应元件,如图7所示,是一个新的启动子,GenBank登陆号FJ536256。由于海藻糖在葡萄糖存在时受到抑制,而在葡萄糖耗尽时受到诱导,因此也是一个可以选用的诱导型启动子。根据以上思路,我们构建了诱导型絮凝表达载体pQL03,方法参照图5,此表达载体所含的絮凝基因是PCR扩增的5.2kb基因(SEQ ID NO:3),不同的是,将pQL02中PGK1启动子替换成海藻糖合成酶启动子TPS1。 
构建方法如下: 
1.酿酒酵母TPS1启动子的克隆 
TPS1启动子使用引物(下划线处的酶切位点在括号中): 
TF:5’-aaggatccGAGGACGGTTGCTGAAGAA-3’(BamHI)(SEQ ID NO:17) 
TR:5’-gcgttaattaaAGTTCTATGTCTTAATAAGTC-3’(PacI)(SEQ ID NO:18) 
退火温度56.5℃。 
S288C的TPS1启动子PCR产物的电泳图见图4。 
2.诱导型絮凝酵母转化子的获得 
表达载体pQL03利用前述方法转化工业酿酒酵母4126,获得了诱导型絮凝的酵母菌株,酵母转化子的验证引物: 
ZLH01F:5’-TCTTCGTGCTCTTGTTGC-3’(SEQ ID NO:19) 
ZLH01R:5’-TTTCCAGGGTTACGTTTG-3’(SEQ ID NO:20) 
通过如上引物扩增启动子区域和絮凝基因的区域,获得了预期大小的片段,证实了外源片段的整合。挑取平板上长出的较大的菌落,接入YPD液体培养基,30℃培养60h,诱导型絮凝酵母转化子可以看到较细的絮凝颗粒(见图6b)。转化子传代10次,絮凝性状保持稳定。同样条件培养含有空载体的对照酵母和野生型絮凝酵母,对照酵母始终呈现游离状态(见图6c),而野生型絮凝酵母(见图6d)的颗粒大小与组成型絮凝酵母(见图6a)的相当。 
此含有质粒pQL03的酵母转化子含有TPS1启动子,絮凝性状为诱导型絮凝,命名为ZLH01。该酵母已于2009年11月5日保藏于中国微生物菌种保藏管理委员会普通微生物中心(CGMCC,中国北京市朝阳区北辰西路1号院3号,邮编100101),保藏号为CGMCC NO:3409。 
将该酵母菌从斜面接入YPD生长培养基过夜培养,用0.1M柠檬酸钠(pH5.0)解絮,取解絮后的菌液各0.3ml接入新鲜YPD生长培养基,加入不同体积乙醇(总体积5ml),30℃,150rpm试管培养16h后,将培养物沉降10min,拍照。如图7所示,ZLH01菌株在添加3%乙醇后出现明显的絮凝,乙醇浓度添加为4%-10%时絮凝更加明显,而且当乙醇浓度添加至10%时絮凝仍然没有出现被抑制的现象。通过分析乙醇与ZLH01絮凝的关系,发现该絮凝酵母即使在大量葡萄糖存在的情况下,在低浓度乙醇时仍然不絮凝,而在乙醇浓度为3%时开始出现肉眼可见的絮凝,当使用高浓度糖产生乙醇浓度高达118.5g/L时,该诱导型酵母的絮凝特性仍然没有被抑制的现象,而文献中报道的诱导型絮凝在高浓度乙醇乙醇中出现抑制,而且絮凝强度较低(Appl.Environ.Microbiol.2008,74:6041-6052)。 
乙醇发酵实验结果表明,摇瓶发酵和发酵罐批式发酵中重组酵母的乙醇发酵效率明显好于野性型絮凝酵母S.cerevisiae flo,尤其在高温条件下。表2和表3分为37℃絮凝酵母转化子发酵残糖和乙醇水平与S.cerevisiae flo的比较。与组成型絮凝酵母相比,诱导型絮凝的酵母乙醇发酵效率更高,降糖速率明显加快,比对照快12小时(表2)。组成型絮凝酵母BHL01发酵摇瓶发酵性能不好与其发酵后期颗粒太大影响生长可能有关,但进一步的研究表明,该组成型絮凝的酵母在高浓度乙醇发酵过程中呈现了良好的性能,详见下文。 
表2高温发酵条件下(37℃)转化子发酵残糖水平的比较*
Figure G200910200097XD00111
Figure G200910200097XD00121
表3高温发酵条件下(37℃)转化子发酵酒精浓度的比较 
Figure G200910200097XD00122
*BHL01酵母为组成型絮凝酵母,ZLH01为诱导型絮凝酵母;发酵初始糖浓度274g/L,摇床转速150rpm。 
利用BHL01菌株,按文献(生物工程学报,2009,25(9):13299-37)中的改进的重复批次发酵方法,采用超高浓度(255g/L)葡萄糖培养基,在2.5L发酵罐中进行重复批式发酵,结果如表4。在发酵时间为10-11小时/批,重复20批次后,利用激光粒度仪(Biotechnol Bioeng,2005,90(5):523-531)在线监测颗粒粒度,可以发现BHL01的絮凝特性不受高浓度乙醇的抑制,能保持良好生长活性和发酵能力,经过20批次发酵后菌体絮凝特性和沉降性能保持良好;而野生型絮凝酵母在相同条件的重复批次发酵下,经过20余批次后,絮凝出现明显退化,沉降分离效率严重受影响,因此BHL01比S.cerevisiae flo更适合高浓度乙醇发酵,显示了良好的工业应用前景。 
表4组成型絮凝酵母BHL01高浓度乙醇重复批次发酵结果*
Figure G200910200097XD00123
*本表显示20次重复批次发酵后结果 
本发明提出的絮凝基因构建絮凝酵母除了可以用于进行燃料乙醇发酵,还可用于其它工业用途,如,重金属废水的吸附;转基因药物蛋白的生产等。条件型诱导启动子还可用于毒物蛋白的生产,可通过调控培养基中的含糖量或者乙醇浓度,调控下游基因的转录和表达。 
序列表 
<110>大连理工大学 
<120>絮凝酵母絮凝基因、其表达产物及其用途 
<130>095484 
<160>20 
<170>PatentIn version 3.3 
<210>1 
<211>8049 
<212>DNA 
<213>絮凝酵母 
<400>1 
atgacaatgc ctcatcgcta tatgtttttg gcagtcttta cacttctggc actaattaat     60 
gtggcctcag gagccacaga ggcgtgctta ccagcaggcc agaggaaaag tgggatgaat    120 
ataaattttt accagtattc attgaaagat tcctccacat attcgaatgc agcatatatg    180 
gcttatggat atgcctcaaa aactaaacta ggttctgtcg gaggacaaac tgatatctcg    240 
attgattata atattccttg tgttagttca tcaggcacat ttccttgtcc tcaagaagat    300 
tcctatggaa actggggatg caaaggaatg ggtgcttgtt ctaatagtca aggaattgca    360 
tactggagta ctgatttatt tggtttctat actaccccaa caaacgtaac cctagaaatg    420 
acaggttatt ttttaccacc acagacgggt tcttacacgt tttcttttgc aacagtggat    480 
gattctgcaa ttttatcagt cggtggtagc attgcgttcg aatgttgtgc acaagaacaa    540 
cctcccatca cgtcgactaa cttcaccatc aatggtatca agccatggca tggaagtctc    600 
cctgataata tcgcagggac tgtctacatg tatgctggtt tctattatcc aatgaagatt    660 
gtttactcaa atgccgtttc ctggggtaca cttccaatta gtgtgacact accagatggc    720 
actaccgtta gtgatgactt tgaagggtac gtatatacct ttgacaacaa tctcagccag    780 
tcgaattgta ctattccaga cccttcaaat tatactgcca gtactacaat aactacaacc    840 
gagccatgga ccggtacttt cacctctaca tccacagaaa tgactactgt cactggtacc    900 
aacggtcaac caactgacga aactgtcatt gttgtcaaaa cacctacaac tgctaacacc    960 
atcataacta cgaccgaacc atggaccggc actttcacct ctacatccac tgaaatgacc   1020 
acagtcaccg gtactaatgg cttgccaact gacgaaactg tcattgttgt caaaacacct   1080 
acaactgcta acaccatcat aactacaact gagccatgga ctggtacttt cacctctaca   1140 
tccacagaaa tgactactgt cactggtacc aacggtcaac caactgacga aactgtcatt   1200 
gttgttaaaa cacctacaac tgctaacacc atcataacta cgaccgaacc atggactggt   1260 
actttcacct ctacatccac agaaatgact actgtcactg gtaccaacgg tcaaccaact   1320 
gatgaaactg tcattgttgt caaaacacct acaactgcta acaccgtcat aactacgacc   1380 
gaaccatgga ctggtacttt cacctctaca tccacagaaa tgactactgt caccggtacc   1440 
aacggtcaac cgaccgatga aaccgttatt gtcattaaaa ctccaaccag tgaaggtcca   1500 
atcagcacca ccactgaacc atggaccggt actttcacat ctacatccac tgaaatgacc   1560 
acagtcactg gtactaatgg tttaccaacc gatgaaactg tcattattat caaaacacct   1620 
acaacagcta gcaccatcat aactacaact gagccatgga acggcacttt cacatctaca   1680 
tccacagaaa tgactactgt cactggtacc aacggtcaac caactgacga aactgtcatt   1740 
gttgttaaaa cacctacaac tgctaacacc atcataacta cgaccgaacc atggaccggt   1800 
atttccactt ctacttctac cgaattgacc acagtcaccg gtactaatgg cttgccaacc   1860 
gatgaaactg tcattgttgt caaaacacct acaactgcta acaccatcat aactacaact   1920 
gagccatgga ctggtacttt cacatctaca tccacagaaa tgactactgt cactggtacc   1980 
aacggtcaac caactgatga aaccatcatt gtcatcagaa caccaacaac tgctagcacc   2040 
atcataacta caactgagcc atggaccggt acttccactt ctacatccac agaaatgact   2100 
actgtcaccg gtaccaacgg tcaaccgacc gatgaaaccg ttattgtcat taaaactcca   2160 
accagtgaag gtccaatcag caccaccact gagccatgga acggcacttt cacatctaca   2220 
tccacagaaa tgactactgt cactggtacc aacggtcaac caactgacga aactgtcatt   2280 
gttgttaaaa cacctacaac tgctaacacc atcataacta cgaccgaacc atggaccggc   2340 
actttcacct ctacatccac tgaaatgacc acagtcaccg gtactaatgg cttgccaact   2400 
gacgaaactg tcattgttgt taaaacacct acaactgcta acaccgtcat aactacgacc   2460 
gaaccatgga ctggtacttt cacctctaca tccacagaaa tgaccaccgt caccggtacc   2520 
aacggtcaac caactgacga aactgtcatt gttgttaaaa cacctacaac tgctaacacc   2580 
atcataacta cgaccgaacc atggaccggc actttcacct ctacatccac agaaatgact   2640 
actgtcactg gtaccaacgg tcaaccaact gacgaaactg tcattgttgt taaaacacct   2700 
acaactgcta acaccatcat aactacgacc gaaccatgga ccggcacttt cacctctaca   2760 
tccacagaaa tgactactgt cactggtacc aacggtcaac caactgatga aactgtcatt   2820 
gttatcagaa ctccaactag tgagggtttg attacaacca ccactgaacc atggaatggc   2880 
actttcacct ctacatccac agaaatgact actgtcactg gtaccaacgg tcaaccaact   2940 
gatgaaactg tcattgttat cagaactcca actagtgagg gtttgattac aaccaccact   3000 
gaaccatgga ctggtacttt cacttctaca tctactgaga tgaccaccat cactggtact   3060 
aatggtcaac caactgacga aaccgtgatt gttatcagaa ctccaaccag tgaaggtttg   3120 
gttgcaacca ccactgaacc atggactggc actttcactt ctacatctac tgagatgacc   3180 
accgtcaccg gtaccaacgg tcaaccaact gacgaaaccg tgattgttat cagaactcca   3240 
actagtgagg gtttgattac aaccaccact gaaccatgga ctggtacttt cacttctaca   3300 
tctactgaga tgaccaccgt caccggtacc aacggtcaac caactgacga aaccgtgatt   3360 
gttatcagaa ctccaaccag tgaaggtttg attacaacca ccactgaacc atggaatggc    3420 
actttcactt cgacttccac tgaggttacc accatcactg gaaccaacgg tcaaccaact    3480 
gacgaaactg tgattgttat cagaactcca actagtgagg gtttgattac aaccaccact    3540 
gaaccatgga ctggtacttt cacttctaca tctactgaga tgaccaccat cactggtact    3600 
aatggtcaac caactgacga aaccgtgatt gttatcagaa ctccaaccag tgaaggtttg    3660 
gttgcaacca ccactgaacc atggactggc actttcactt ctacatctac tgagatgacc    3720 
accgtcaccg gtaccaacgg tcaaccaact gacgaaaccg tgattgttat cagaactcca    3780 
actagtgagg gtttgattac aaccaccact gaaccatgga ctggtacttt cacttctaca    3840 
tctactgaga tgaccaccgt caccggtacc aacggtcaac caactgacga aaccgttatt    3900 
gttatcagaa ctccaactag tgagggtttg attacaacca ccactgaacc atggactggc    3960 
actttcactt ctacatctac tgagatgacc accgtcaccg gtaccaacgg tcaaccaact    4020 
gacgaaaccg tgattgttat cagaactcca accagtgaag gtctaatcag caccaccact    4080 
gaaccatgga ctggtacttt cacctctacg tctactgaga tgaccaccgt caccggtacc    4140 
aacggtcaac caactgacga aaccgtgatt gttatcagaa ctccaaccag tgaaggtcta    4200 
atcagcacca ccactgaacc atggactggt actttcacct ctacgtctac tgagatgacc    4260 
accgtcaccg gtactaacgg tcaaccaact gatgaaaccg ttattgttat cagaactcca    4320 
accagtgaag gtctaatcag caccaccact gaaccatgga ctggcacttt cacctctaca    4380 
tccactgaga tgaccaccat caccggtact aatggtcaac caactgacga aaccgttatt    4440 
gttatcagaa ctccaactag tgagggtttg attacaacca ccactgaacc atggactggt    4500 
actttcactt ctacatctac tgagatgacc accatcactg gtactaatgg tcaaccaact    4560 
gacgaaaccg tgattgttat cagaactcca accagtgaag gtttggttgc aaccaccact    4620 
gaaccatgga ctggcacttt cacttctaca tctactgaga tgaccaccgt caccggtacc    4680 
aacggtcaac caactgatga aaccgtgatt gttatcagaa ctccaaccag tgaaggtttg    4740 
attacaacca ccactgaacc atggaatggc actttcactt cgacttccac tgaggttacc    4800 
accatcactg gaaccaacgg tcaaccaact gacgaaactg tgattgtcat tagaactcca    4860 
actagtgagg gtttgattac tacaactacc gaaccatgga ctggtacttt cacttctaca    4920 
tctactgagg ttaccaccgt caccggtact aatggtcaac caactgacga aaccgttatt    4980 
gttatcagaa ctccaactag tgagggtttg attacaacca ccactgaacc atggactggt    5040 
actttcactt ctacatctac tgagatgacc accgtcaccg gtactaacgg tcaaccaact    5100 
gatgaaaccg ttattgttat cagaactcca accagtgaag gtttgattac aaccaccact    5160 
gaaccatgga atggcacttt cacttcgact tccactgagg ttaccaccat cactggaacc    5220 
aacggtcaac caactgacga aactgtgatt gtcattagaa ctccaactag tgagggtttg    5280 
attactacaa ctaccgaacc atggactggt actttcactt ctacatctac tgaggttacc    5340 
accgtcaccg gtaccaacgg tcaaccaact gacgaaaccg ttattgttat cagaactcca    5400 
actagtgagg gtttgattac aaccaccact gaaccatgga ctggcacttt cacttctaca    5460 
tctactgaga tgaccaccgt caccggtact aacggtcaac caactgacga aactgtgatt    5520 
gtcattagaa ctccaactag tgagggtttg attacaacca ccactgaacc atggactggt    5580 
actttcactt ctacatctac tgaggttacc accgtcaccg gtaccaacgg tcaaccaact    5640 
gacgaaaccg ttattgttat cagaactcca actagtgagg gtttgattac aaccaccact    5700 
gaaccatgga ctggcacttt cacttctaca tctactgaga tgaccaccgt caccggtact    5760 
aacggtcaac caactgatga aactgtgatt gttatcagaa ctccaaccag tgaaggtttg    5820 
gttgcaacca ccactgaacc atggactggc actttcacct ctacatccac tgagatgacc    5880 
accgtcaccg gtactaacgg tcaaccaact gacgaaaccg tgattgttat cagaactcca    5940 
accagtgaag gtttggttgc aaccaccact gaaccatgga ctggcacttt cacctctaca    6000 
tccactgaga tgaccaccgt caccggtact aacggtcaac caactgacga aaccgtgatt    6060 
gttatcagaa ctccaaccag tgaaggtttg gttgcaacca ccactgaacc atggactggc    6120 
actttcacct ctacatccac tgagatgacc accatcaccg gtactaatgg tcaaccaact    6180 
gacgaaaccg ttattgttat cagaactcca actagtgagg gtttgattac aaccaccacc    6240 
gaaccatgga ctggcacttt cacttcgact tccactgaga tgaccaccat caccggtacc    6300 
aacggtcaac caactgacga agctgtgatt gtcattagaa ctccaactag tgagggtttg    6360 
gttactacaa ctaccgaacc atggactggt actttcactt cgacttccac tgggatgacc    6420 
accgtcaccg gtactaacgg tcaaccaact gacgaaaccg tgattgttat cagaactcca    6480 
accagtgaag gtttggttac aaccaccact gaaccatgga ctggtacttt tacttcgact    6540 
tccactgaaa tgtctactgt cactggaacc aatggcttgc caactgatga aactgtcatt    6600 
gttgtcaaaa ctccaactac tgccatctca tccagtttgt catcatcatc ttcaggacaa    6660 
atcaccagct ctatcacgtc ttcgcgtcca attattaccc cattctatcc tagcaatgga    6720 
acttctgtga tttcttcctc agtaatttct tcctcagtca cttcttctct agtcacttca    6780 
tctccagtca tttcttcttc attcatttct tcctctgtca tttcttcttc tacaacaacc    6840 
tccgcttcta tattctctga atcatctaaa tcatccgtca ttccaaccag tagttccacc    6900 
tctggttctt ctgagagcga aacgagttca gctagttctg cctcttcttc ctcttctatc    6960 
tcttctgaat caccaaagtc tacatattcg tcttcatcat taccacctgt taccagtgca    7020 
acaacaagtc aggaaattac ttcttcctta ccacctgtta ccagtgcgac agcaagccag    7080 
gaaactgctt cttcattacc acctgctacc actacaaaaa cgagcgaaca aaccactttg    7140 
gttaccgtga catcctgcga atctcatgtg tgcactgaat ccatctcctc tgcgattgtt    7200 
tccacggcca ccgttactgt tagcggcgtc acaacagagt ataccacatg gtgccctatt    7260 
tctaccacag agacaacaag acaaaccaaa gggacaacag agcaaaccac agaaacaaca    7320 
aaacaaacca cggtagttac aatttcttct tgtgaatctg acatatgctc taaaactgct    7380 
tctccagcca ttgtgtctac aagcactgct actattaacg gcgttaccac ggaatacaca    7440 
acatggtgtc ctatttccac cacagaatcg aagcaacaaa ctacgctagt tactgttact    7500 
tcctgcgaat ctggtgtgtg ttccgaaact gcttcacctg ccattgtttc gacggccacg  7560 
gctactgtga atgatgttgt tacggtctat cctacatgga gaccacagac tacgaatgaa  7620 
gagtctgtca gctctaaaat gaacagtgct accagtgaga caacaaccaa tactgtagct  7680 
gctgaaacga ctaccaatac tggagctgct gagacaacta ccagtactgg agctgctgag  7740 
acgaaaacag tagtcacctc ttcgctttca agatctaatc acgctgaaac acagacggct  7800 
tccgcgaccg atgtgattgg tcacagcagt agtgttgttt ctgtatccga aactggcaac  7860 
accaagagtc taacaagttc cgggttgagt actatgtcgc aacagcctcg tagcacacca  7920 
gcaagtagca tggtaggatc tagtacagct tctttagaaa tttcaacgta tgctggcagt  7980 
gccaacagct tactggccgg tagtggttta agtgtcttca ttgcgtcctt attgctggca  8040 
attatttaa                                                          8049 
<210>2 
<211>2682 
<212>PRT 
<213>絮凝酵母 
<400>2 
Met Thr Met Pro His Arg Tyr Met Phe Leu Ala Val Phe Thr Leu Leu 
1               5                   10                  15 
Ala Leu Ile Asn Val Ala Ser Gly Ala Thr Glu Ala Cys Leu Pro Ala 
            20                  25                  30 
Gly Gln Arg Lys Ser Gly Met Asn Ile Asn Phe Tyr Gln Tyr Ser Leu 
        35                  40                  45 
Lys Asp Ser Ser Thr Tyr Ser Asn Ala Ala Tyr Met Ala Tyr Gly Tyr 
    50                  55                  60 
Ala Ser Lys Thr Lys Leu Gly Ser Val Gly Gly Gln Thr Asp Ile Ser 
65                  70                  75                  80 
Ile Asp Tyr Asn Ile Pro Cys Val Ser Ser Ser Gly Thr Phe Pro Cys 
                85                  90                  95 
Pro Gln Glu Asp Ser Tyr Gly Asn Trp Gly Cys Lys Gly Met Gly Ala 
            100                 105                 110 
Cys Ser Asn Ser Gln Gly Ile Ala Tyr Trp Ser Thr Asp Leu Phe Gly 
        115                 120                 125 
Phe Tyr Thr Thr Pro Thr Asn Val Thr Leu Glu Met Thr Gly Tyr Phe 
    130                 135                 140 
Leu Pro Pro Gln Thr Gly Ser Tyr Thr Phe Ser Phe Ala Thr Val Asp 
145                 150                 155                 160 
Asp Ser Ala Ile Leu Ser Val Gly Gly Ser Ile Ala Phe Glu Cys Cys 
                165                 170                 175 
Ala Gln Glu Gln Pro Pro Ile Thr Ser Thr Asn Phe Thr Ile Asn Gly 
             180                 185                 190 
Ile Lys Pro Trp His Gly Ser Leu Pro Asp Asn Ile Ala Gly Thr Val 
        195                 200                 205 
Tyr Met Tyr Ala Gly Phe Tyr Tyr Pro Met Lys Ile Val Tyr Ser Asn 
    210                 215                 220 
Ala Val Ser Trp Gly Thr Leu Pro Ile Ser Val Thr Leu Pro Asp Gly 
225                 230                 235                 240 
Thr Thr Val Ser Asp Asp Phe Glu Gly Tyr Val Tyr Thr Phe Asp Asn 
                245                 250                 255 
Asn Leu Ser Gln Ser Asn Cys Thr Ile Pro Asp Pro Ser Asn Tyr Thr 
            260                 265                 270 
Ala Ser Thr Thu Ile Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
         275                 280                 285 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln Pro 
    290                 295                 300 
Thr Asp Glu Thr Val Ile Val Val Lys Thr Pro Thr Thr Ala Asn Thr 
305                 310                 315                 320 
Ile Ile Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr Ser Thr Ser 
                325                 330                 335 
Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Leu Pro Thr Asp Glu 
            340                 345                 350 
Thr Val Ile Val Val Lys Thr Pro Thr Thr Ala Asn Thr Ile Ile Thr 
        355                 360                 365 
Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr Ser Thr Ser Thr Glu Met 
    370                 375                 380 
Thr Thr Val Thr Gly Thr Asn Gly Gln Pro Thr Asp Glu Thr Val Ile 
385                 390                 395                 400 
Val Val Lys Thr Pro Thr Thr Ala Asn Thr Ile Ile Thr Thr Thr Glu 
                405                 410                 415 
Pro Trp Thr Gly Thr Phe Thr Ser Thr Ser Thr Glu Met Thr Thr Val 
            420                 425                 430 
Thr Gly Thr Asn Gly Gln Pro Thr Asp Glu Thr Val Ile Val Val Lys 
        435                 440                 445 
Thr Pro Thr Thr Ala Asn Thr Val Ile Thr Thr Thr Glu Pro Trp Thr 
    450                 455                 460 
Gly Thr Phe Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr 
465                 470                 475                 480 
Asn Gly Gln Pro Thr Asp Glu Thr Val Ile Val Ile Lys Thr Pro Thr 
                485                 490                 495 
Ser Glu Gly Pro Ile Ser Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe 
            500                 505                 510 
Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Leu 
        515                 520                 525 
Pro Thr Asp Glu Thr Val Ile Ile Ile Lys Thr Pro Thr Thr Ala Ser 
    530                 535                 540 
Thr Ile Ile Thr Thr Thr Glu Pro Trp Asn Gly Thr Phe Thr Ser Thr 
545                 550                 555                 560 
Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln Pro Thr Asp 
                565                 570                 575 
Glu Thr Val Ile Val Val Lys Thr Pro Thr Thr Ala Asn Thr Ile Ile 
             580                 585                 590 
Thr Thr Thr Glu Pro Trp Thr Gly Ile Ser Thr Ser Thr Ser Thr Glu 
        595                 600                 605 
Leu Thr Thr Val Thr Gly Thr Asn Gly Leu Pro Thr Asp Glu Thr Val 
    610                 615                 620 
Ile Val Val Lys Thr Pro Thr Thr Ala Asn Thr Ile Ile Thr Thr Thr 
625                 630                 635                 640 
Glu Pro Trp Thr Gly Thr Phe Thr Ser Thr Ser Thr Glu Met Thr Thr 
                 645                 650                 655 
Val Thr Gly Thr Asn Gly Gln Pro Thr Asp Glu Thr Ile Ile Val Ile 
            660                 665                 670 
Arg Thr Pro Thr Thr Ala Ser Thr Ile Ile Thr Thr Thr Glu Pro Trp 
        675                 680                 685 
Thr Gly Thr Ser Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly 
    690                 695                 700 
Thr Asn Gly Gln Pro Thr Asp Glu Thr Val Ile Val Ile Lys Thr Pro 
705                 710                 715                 720 
Thr Ser Glu Gly Pro Ile Ser Thr Thr Thr Glu Pro Trp Asn Gly Thr 
                725                 730                 735 
Phe Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly 
            740                 745                 750 
Gln Pro Thr Asp Glu Thr Val Ile Val Val Lys Thr Pro Thr Thr Ala 
        755                 760                 765 
Asn Thr Ile Ile Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr Ser 
    770                 775                 780 
Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Leu Pro Thr 
785                 790                 795                 800 
Asp Glu Thr Val Ile Val Val Lys Thr Pro Thr Thr Ala Asn Thr Val 
                805                 810                 815 
Ile Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr Ser Thr Ser Thr 
            820                 825                 830 
Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln Pro Thr Asp Glu Thr 
        835                 840                 845 
Val Ile Val Val Lys Thr Pro Thr Thr Ala Asn Thr Ile Ile Thr Thr 
    850                 855                 860 
Thr Glu Pro Trp Thr Gly Thr Phe Thr Ser Thr Ser Thr Glu Met Thr 
865                 870                 875                 880 
Thr Val Thr Gly Thr Asn Gly Gln Pro Thr Asp Glu Thr Val Ile Val 
                885                 890                 895 
Val Lys Thr Pro Thr Thr Ala Asn Thr Ile Ile Thr Thr Thr Glu Pro 
            900                 905                 910 
Trp Thr Gly Thr Phe Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr 
        915                 920                 925 
Gly Thr Asn Gly Gln Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr 
    930                 935                 940 
Pro Thr Ser Glu Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Asn Gly 
945                 950                 955                 960 
Thr Phe Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn 
                965                 970                 975 
Gly Gln Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser 
            980                 985                 990 
Glu Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
        995                 1000                1005 
Ser Thr Ser Thr Glu Met Thr Thr Ile Thr Gly Thr Asn Gly Gln 
    1010                1015                1020 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1025                1030                1035 
Gly Leu Val Ala Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1040                1045                1050 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1055                1060                1065 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1070                1075                1080 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1085                1090                1095 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1100                1105                1110 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1115                1120                1125 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Asn Gly Thr Phe Thr 
    1130                1135                1140 
Ser Thr Ser Thr Glu Val Thr Thr Ile Thr Gly Thr Asn Gly Gln 
    1145                1150                1155 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1160                1165                1170 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1175                1180                1185 
Ser Thr Ser Thr Glu Met Thr Thr Ile Thr Gly Thr Asn Gly Gln 
    1190                1195                1200 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1205                1210                1215 
Gly Leu Val Ala Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1220                1225                1230 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1235                1240                1245 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1250                1255                1260 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1265                1270                1275 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1280                1285                1290 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1295                1300                1305 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1310                1315                1320 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1325                1330                1335 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1340                1345                1350 
Gly Leu Ile Ser Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1355                1360                1365 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1370                1375                1380 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1385                1390                1395 
Gly Leu Ile Ser Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1400                1405                1410 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1415                1420                1425 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1430                1435                1440 
Gly Leu Ile Ser Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1445                1450                1455 
Ser Thr Ser Thr Glu Met Thr Thr Ile Thr Gly Thr Asn Gly Gln 
    1460                1465                1470 
Pro Thr Asp Glu Thr Val IIe Val Ile Arg Thr Pro Thr Ser Glu 
    1475                1480                1485 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1490                1495                1500 
Ser Thr Ser Thr Glu Met Thr Thr Ile Thr Gly Thr Asn Gly Gln 
    1505                1510                1515 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1520                1525                1530 
Gly Leu Val Ala Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1535                1540                1545 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1550                1555                1560 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1565                1570                1575 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Asn Gly Thr Phe Thr 
    1580                1585                1590 
Ser Thr Ser Thr Glu Val Thr Thr Ile Thr Gly Thr Asn Gly Gln 
    1595                1600                1605 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1610                1615                1620 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1625                1630                1635 
Ser Thr Ser Thr Glu Val Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1640                1645                1650 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1655                1660                1665 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1670                1675                1680 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1685                1690                1695 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1700                1705                1710 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Asn Gly Thr Phe Thr 
    1715                1720                1725 
Ser Thr Ser Thr Glu Val Thr Thr Ile Thr Gly Thr Asn Gly Gln 
    1730                1735                1740 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1745                1750                1755 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1760                1765                1770 
Ser Thr Ser Thr Glu Val Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1775                1780                1785 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1790                1795                1800 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1805                1810                1815 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1820                1825                1830 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1835                1840                1845 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1850                1855                1860 
Ser Thr Ser Thr Glu Val Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1865                1870                1875 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1880                1885                1890 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1895                1900                1905 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1910                1915                1920 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1925                1930                1935 
Gly Leu Val Ala Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1940                1945                1950 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    1955                1960                1965 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    1970                1975                1980 
Gly Leu Val Ala Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    1985                1990                1995 
Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    2000                2005                2010 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    2015                2020                2025 
Gly Leu Val Ala Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    2030                2035                2040 
Ser Thr Ser Thr Glu Met Thr Thr Ile Thr Gly Thr Asn Gly Gln 
    2045                2050                2055 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    2060                2065                2070 
Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    2075                2080                2085 
Ser Thr Ser Thr Glu Met Thr Thr Ile Thr Gly Thr Asn Gly Gln 
    2090                2095                2100 
Pro Thr Asp Glu Ala Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    2105                2110                2115 
Gly Leu Val Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    2120                2125                2130 
Ser Thr Ser Thr Gly Met Thr Thr Val Thr Gly Thr Asn Gly Gln 
    2135                2140                2145 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    2150                2155                2160 
Gly Leu Val Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    2165                2170                2175 
Ser Thr Ser Thr Glu Met Ser Thr Val Thr Gly Thr Asn Gly Leu 
    2180                2185                2190 
Pro Thr Asp Glu Thr Val Ile Val Val Lys Thr Pro Thr Thr Ala 
    2195                2200                2205 
Ile Ser Ser Ser Leu Ser Ser Ser Ser Ser Gly Gln Ile Thr Ser 
    2210                2215                2220 
Ser Ile Thr Ser Ser Arg Pro Ile Ile Thr Pro Phe Tyr Pro Ser 
    2225                2230                2235 
Asn Gly Thr Ser Val Ile Ser Ser Ser Val Ile Ser Ser Ser Val 
    2240                2245                2250 
Thr Ser Ser Leu Val Thr Ser Ser Pro Val Ile Ser Ser Ser Phe 
    2255                2260                2265 
Ile Ser Ser Ser Val Ile Ser Ser Ser Thr Thr Thr Ser Ala Ser 
    2270                2275                2280 
Ile Phe Ser Glu Ser Ser Lys Ser Ser Val Ile Pro Thr Ser Ser 
    2285                2290                2295 
Ser Thr Ser Gly Ser Ser Glu Ser Glu Thr Ser Ser Ala Ser Ser 
    2300                2305                2310 
Ala Ser Ser Ser Ser Ser Ile Ser Ser Glu Ser Pro Lys Ser Thr 
    2315                2320                2325 
Tyr Ser Ser Ser Ser Leu Pro Pro Val Thr Ser Ala Thr Thr Ser 
    2330                2335                2340 
Gln Glu Ile Thr Ser Ser Leu Pro Pro Val Thr Ser Ala Thr Ala 
    2345                2350                2355 
Ser Gln Glu Thr Ala Ser Ser Leu Pro Pro Ala Thr Thr Thr Lys 
    2360                2365                2370 
Thr Ser Glu Gln Thr Thr Leu Val Thr Val Thr Ser Cys Glu Ser 
    2375                2380                2385 
His Val Cys Thr Glu Ser Ile Ser Ser Ala Ile Val Ser Thr Ala 
    2390                2395                2400 
Thr Val Thr Val Ser Gly Val Thr Thr Glu Tyr Thr Thr Trp Cys 
    2405                2410                2415 
Pro Ile Ser Thr Thr Glu Thr Thr Arg Gln Thr Lys Gly Thr Thr 
    2420                2425                2430 
Glu Gln Thr Thr Glu Thr Thr Lys Gln Thr Thr Val Val Thr Ile 
    2435                2440                2445 
Ser Ser Cys Glu Ser Asp Ile Cys Ser Lys Thr Ala Ser Pro Ala 
    2450                2455                2460 
Ile Val Ser Thr Ser Thr Ala Thr Ile Ash Gly Val Thr Thr Glu 
    2465                2470                2475 
Tyr Thr Thr Trp Cys Pro Ile Ser Thr Thr Glu Ser Lys Gln Gln 
    2480                2485                2490 
Thr Thr Leu Val Thr Val Thr Ser Cys Glu Ser Gly Val Cys Ser 
    2495                2500                2505 
Glu Thr Ala Ser Pro Ala Ile Val Ser Thr Ala Thr Ala Thr Val 
    2510                2515                2520 
Asn Asp Val Val Thr Val Tyr Pro Thr Trp Arg Pro Gln Thr Thr 
    2525                2530                2535 
Asn Glu Glu Ser Val Ser Ser Lys Met Asn Ser Ala Thr Ser Glu 
    2540                2545                2550 
Thr Thr Thr Asn Thr Val Ala Ala Glu Thr Thr Thr Asn Thr Gly 
    2555                2560                2565 
Ala Ala Glu Thr Thr Thr Ser Thr Gly Ala Ala Glu Thr Lys Thr 
    2570                2575                2580 
Val Val Thr Ser Ser Leu Ser Arg Ser Asn His Ala Glu Thr Gln 
    2585                2590                2595 
Thr Ala Ser Ala Thr Asp Val Ile Gly His Ser Ser Ser Val Val 
    2600                2605                2610 
Ser Val Ser Glu Thr Gly Asn Thr Lys Ser Leu Thr Ser Ser Gly 
    2615                2620                2625 
Leu Ser Thr Met Ser Gln Gln Pro Arg Ser Thr Pro Ala Ser Ser 
    2630                2635                2640 
Met Val Gly Ser Ser Thr Ala Ser Leu Glu Ile Ser Thr Tyr Ala 
    2645                2650                2655 
Gly Ser Ala Asn Ser Leu Leu Ala Gly Ser Gly Leu Sea Val Phe 
    2660                2665                2670 
Ile Ala Ser Leu Leu Leu Ala Ile Ile 
    2675                2680 
<210>3 
<211>5217 
<212>DNA 
<213>絮凝酵母 
<400>3 
atgacaatgc ctcatcgcta tatgtttttg gcagtcttta cacttctggc actaattaat    60 
gtggcctcag gagccacaga ggcgtgctta ccagcaggcc agaggaaaag tgggatgaat   120 
ataaattttt accagtattc attgaaagat tcctccacat attcgaatgc agcatatatg   180 
gcttatggat atgcctcaaa aactaaacta ggttctgtcg gaggacaaac tgatatctcg   240 
attgattata atattccttg tgttagttca tcaggcacat ttccttgtcc tcaagaagat   300 
tcctatggaa actggggatg caaaggaatg ggtgcttgtt ctaatagtca aggaattgca   360 
tactggagta ctgatttatt tggtttctat actaccccaa caaacgtaac cctggaaatg   420 
acaggttatt ttttaccacc acagacgggt tcttacacat tcaagtttgc tacagttgac   480 
gactctgcaa ttctatcagt aggtggtgct accgcgttcg actgttgtgc tcaacagcaa   540 
ccgccgatca catccacaaa ctttacgatt aacggtatca aaccatgggg tggaagtttg   600 
ccacctaatg ttgaaggaac agtctacatg tatgctggat tctactaccc aatgaaggtt   660 
gtttactcaa atgctgtttc ttggggtaca cttccaatta gtgtgacact gcctgatggt   720 
acagctgtca gtgatgactt cgagggatac gtgtattcct ttgatgatga tttgactcaa   780 
tctgattgta ccattccaga tccttcaaac tatactatag caggcctaat caccaccacc   840 
actgaaccat ggactggtac tttcacttct acatccactg agatgactac tgtcactggt   900 
accaacagtc aaccaactga tgaaaccgtt attgttatca gaactccaac tagtgagggt   960 
ttgattacaa ccaccactga accatggact ggcactttca cttctacatc tactgagatg  1020 
accaccgtca ccggtaccaa cggtcaacca actgacgaaa ccgtgattgt tatcagaact  1080 
ccaactagtg agggtttgat tacaaccacc actgaaccat ggactggtac tttcacttct  1140 
acatctactg agatgaccac cgtcaccggt actaacagtc aaccaactga tgaaaccgtt  1200 
attgttatca gaactccaac tagtgagggt ttgattacaa ccaccactga accatggact  1260 
ggcactttca cttctacatc tactgagatg accaccgtca ccggtactaa cggtcaacca  1320 
actgacgaaa ccgtgattgt tatcagaact ccaaccagtg aaggtttgat tacaaccacc    1380 
actgaagcat ggactggtac tttcacttct acatctactg agatgaccac cgtcaccggt    1440 
accaacggtc aaccaactga cgaaaccgtt attgttatca gaactccaac tagtgagggt    1500 
ttgattacaa ccaccactga accatggact ggtactttca cctctacgtc tactgagatg    1560 
accaccgtca ccggtactaa cggtcaacca actgatgaaa ccgttattgt tatcagaact    1620 
ccaaccagtg aaggtctaat cagcaccacc actgaaccat ggactggcac tttcacttct    1680 
acatctactg agatgaccac cgtcaccggt accaacggtc aaccaactga tgaaaccgtg    1740 
attgttatca gaactccaac cagtgaaggt ttgattacaa ccaccactga accatggaat    1800 
ggcactttca cttcgacttc cactgaggtt accaccatca ctggaaccaa cggtcaacca    1860 
actgacgaaa ctgtgattgt cattagaact ccaactagtg agggtttgat tactacaact    1920 
accgaaccat ggactggtac tttcacttct acatctactg aggttaccac cgtcaccggt    1980 
actaatggtc aaccaactga cgaaaccgtt attgttatca gaactccaac tagtgagggt    2040 
ttgattacaa ccgccactga accatggact ggtactttca cttctacatc tactgagatg    2100 
accaccgtca ccggtactaa cggtcaacca actgatgaaa ccgttattgt tatcagaact    2160 
ccaaccagtg aaggtttgat tacaaccacc actgaaccat ggaatggcac tttcacttcg    2220 
acttccactg aggttaccac catcactgga accaacggtc aaccaactga cgaaactgtg    2280 
attgtcatta gaactccaac tagtgagggt ttgattacta caactaccga accatggact    2340 
ggtactttca cttctacatc tactgaggtt accaccgtca ccggtaccaa cggtcaacca    2400 
actgacgaaa ccgttattgt tatcagaact ccaactagtg agggtttgat tacaaccacc    2460 
accgaaccat ggactggcac tttcacttcg acttccactg agatgaccac catcaccggt    2520 
accaacggtc aaccaactga cgaaactgtg attgtcatta gaactccaac tagtgagggt    2580 
ttgattacaa ccaccactga accatggact ggtactttca cttctacatc tactgaggtt    2640 
accaccgtca ccggtaccaa cggtcaacca actgacgaaa ccgttattgt tatcagaact    2700 
ccaactagtg agggtttgat tacaaccacc actgaaccat ggactggcac tttcacttct    2760 
acatctactg agatgaccac cgtcaccggt actaacggtc aaccaactga tgaaactgtg    2820 
attgttatca gaactccaac cagtgaaggt ttggttacaa ccaccactga accatggaat    2880 
ggtactttca cttctacatc tactgagatg accaccgtca ccggtaccaa cggtcaacca    2940 
actgacgaaa ccgtgattgt tatcagaact ccaaccagtg aaggtttggt tgcaaccacc    3000 
actgaaccat gggctggcac tttcacctct acatccactg agatgaccac cgtcaccggt    3060 
actaacggtc aaccaactga cgaaaccgtg attgttatca gaactccaac cagtgaaggt    3120 
ttggttgcaa ccaccactga accatggact ggcactttca cctctacatc cactgagatg    3180 
accaccgtca ccggtactaa cggtcaacca actgacgaaa ccgtgattgt tatcagaact    3240 
ccaaccagtg aaggtttggt tgcaaccacc actgaaccat ggactggcac tttcacctct    3300 
acatccactg agatgaccac catcaccggt actaatggtc aaccaactga cgaaaccgtt    3360 
attgttatca gaactccaac tagtgagggt ttgattacaa ccaccaccga accatggact    3420 
ggcactttca cttcgacttc cactgagatg accaccatca ccggtaccaa cggtcaacca    3480 
actgacgaag ctgtgattgt cattagaact ccaactagtg agggtttggt tactacaact    3540 
accgaaccat ggactggtac tttcacttcg acttccactg ggatgaccac cgtcaccggt    3600 
actaacggtc aaccaactga cgaaaccgtg attgttatca gaactccaac cagtgaaggt    3660 
ttggttacaa ccaccactga accatggact ggtactttta cttcgacttc cactgaaatg    3720 
tctactgtca ctggaaccaa tggcttgcca actgatgaaa ctgtcattgt tgtcaaaact    3780 
ccaactactg ccatctcatc cagtttgtca tcatcatctt caggacaaat caccagctct    3840 
atcacgtctt cgcgtccaat tattacccca ttctatccta gcaatggaac ttctgtgatt    3900 
tcttcctcag taatttcttc ctcagtcact tcttctctag tcacttcatc tccagtcatt    3960 
tcttcttcat tcatttcttc ctctgtcatt tcttcctcta caacaacctc cgcttctata    4020 
ttctctgaat catctaaatc atccgtcatt ccaaccagta gttccacctc tggttcttct    4080 
gagagcgaaa cgagttcagc tagttctgcc tcttcttcct cttctatctc ttctgaatca    4140 
ccaaagtcta catattcgtc ttcatcatta ccacctgtta ccagtgcaac aacaagtcag    4200 
gaaattactt cttccttacc acctgttacc agtgcgacag caagccagga aactgcttct    4260 
tcattaccac ctgctaccac tacaaaaacg agcgaacaaa ccactttggt taccgtgaca    4320 
tcctgcgaat ctcatgtgtg cactgaatcc atctcctctg cgattgtttc cacggccacc    4380 
gttactgtta gcggcgtcac aacagagtat accacatggt gccctatttc taccacagag    4440 
acaacaagac aaaccaaagg gacaacagag caaaccacag aaacaacaaa acaaaccacg    4500 
gtagttacaa tttcttcttg tgaatctgac atatgctcta aaactgcttc tccagccatt    4560 
gtgtctacaa gcactgctac tattaacggc gttaccacgg aatacacaac atggtgtcct    4620 
atttccacca cagaatcgaa gcaacaaact acgctagtta ctgttacttc ctgcgaatct    4680 
ggtgtgtgtt ccgaaactgc ttcacctgcc attgtttcga cggccacggc tactgtgaat    4740 
gatgttgtta cggtctatcc tacatggaga ccacagacta cgaatgaaga gtctgtcagc    4800 
tctaaaatga acagtgctac cagtgagaca acaaccaata ctgtagctgc tgaaacgact    4860 
accaatactg gagctgctga gacaactacc agtactggag ctgctgagac gaaaacagta    4920 
gtcacctctt cgctttcaag atctaatcac gctgaaacac agacggcttc cgcgaccgat    4980 
gtgattggtc acagcagtag tgttgtttct gtatccgaaa ctggcaacac caagagtcta    5040 
acaagttccg ggttgagtac tatgtcgcaa cagcctcgta gcacaccagc aagtagcatg    5100 
gtaggatcta gtacagcttc tttagaaatt tcaacgtatg ctggcagtgc caacagctta    5160 
ctggccggta gtggtttaag tgtcttcatt gcgtccttat tgctggcaat tatttaa       5217 
<210>4 
<211>1738 
<212>PRT 
<213>絮凝酵母 
<400>4 
Met Thr Met Pro His Arg Tyr Met Phe Leu Ala Val Phe Thr Leu Leu 
1               5                   10                  15 
Ala Leu Ile Asn Val Ala Ser Gly Ala Thr Glu Ala Cys Leu Pro Ala 
            20                  25                  30 
Gly Gln Arg Lys Ser Gly Met Asn Ile Asn Phe Tyr Gln Tyr Ser Leu 
        35                  40                  45 
Lys Asp Ser Ser Thr Tyr Ser Asn Ala Ala Tyr Met Ala Tyr Gly Tyr 
    50                  55                  60 
Ala Ser Lys Thr Lys Leu Gly Ser Val Gly Gly Gln Thr Asp Ile Ser 
65                  70                  75                  80 
Ile Asp Tyr Asn Ile Pro Cys Val Ser Ser Ser Gly Thr Phe Pro Cys 
                85                  90                  95 
Pro Gln Glu Asp Ser Tyr Gly Asn Trp Gly Cys Lys Gly Met Gly Ala 
            100                 105                 110 
Cys Ser Asn Ser Gln Gly Ile Ala Tyr Trp Ser Thr Asp Leu Phe Gly 
        115                 120                 125 
Phe Tyr Thr Thr Pro Thr Asn Val Thr Leu Glu Met Thr Gly Tyr Phe 
    130                 135                 140 
Leu Pro Pro Gln Thr Gly Ser Tyr Thr Phe Lys Phe Ala Thr Val Asp 
145                 150                 155                 160 
Asp Ser Ala Ile Leu Ser Val Gly Gly Ala Thr Ala Phe Asp Cys Cys 
                165                 170                 175 
Ala Gln Gln Gln Pro Pro Ile Thr Ser Thr Asn Phe Thr Ile Asn Gly 
            180                 185                 190 
Ile Lys Pro Trp Gly Gly Ser Leu Pro Pro Asn Val Glu Gly Thr Val 
        195                 200                 205 
Tyr Met Tyr Ala Gly Phe Tyr Tyr Pro Met Lys Val Val Tyr Ser Asn 
    210                 215                 220 
Ala Val Ser Trp Gly Thr Leu Pro Ile Ser Val Th rLeu Pro Asp Gly 
225                 230                 235                 240 
Thr Ala Val Ser Asp Asp Phe Glu Gly Tyr Val Tyr Ser Phe Asp Asp 
                245                 250                 255 
Asp Leu Thr Gln Ser Asp Cys Thr Ile Pro Asp Pro Ser Asn Tyr Thr 
            260                 265                 270 
lle Ala Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe 
        275                 280                 285 
Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Ser Gln 
    290                 295                 300 
Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu Gly 
305                 310                 315                 320 
Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr Ser Thr 
                 325                 330                 335 
Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln Pro Thr Asp 
            340                 345                 350 
Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu Gly Leu Ile Thr 
        355                 360                 365 
Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr Ser Thr Ser Thr Glu 
    370                 375                 380 
Met Thr Thr Val Thr Gly Thr Asn Ser Gln Pro Thr Asp Glu Thr Val 
385                 390                 395                 400 
Ile Val Ile Arg Thr Pro Thr Ser Glu Gly Leu Ile Thr Thr Thr Thr 
                 405                 410                 415 
Glu Pro Trp Thr Gly Thr Phe Thr Ser Thr Ser Thr Glu Met Thr Thr 
            420                 425                 430 
Val Thr Gly Thr Asn Gly Gln Pro Thr Asp Glu Thr Val Ile Val lle 
        435                 440                 445 
Arg Thr Pro Thr Ser Glu Gly Leu Ile Thr Thr Thr Thr Glu Ala Trp 
    450                 455                 460 
Thr Gly Thr Phe Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly 
465                 470                 475                 480 
Thr Asn Gly Gln Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro 
                485                 490                 495 
Thr Ser Glu Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr 
            500                 505                 510 
Phe Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly 
        515                 520                 525 
Gln Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu 
    530                 535                 540 
Gly Leu Ile Ser Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr Ser 
545                 550                 555                 560 
Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly Gln Pro Thr 
                565                 570                 575 
Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu Gly Leu Ile 
            580                 585                 590 
Thr Thr Thr Thr Glu Pro Trp Asn Gly Thr Phe Thr Ser Thr Ser Thr 
        595                 600                 605 
Glu Val Thr Thr Ile Thr Gly Thr Asn Gly Gln Pro Thr Asp Glu Thr 
    610                 615                 620 
Val Ile Val Ile Arg Thr Pro Thr Ser Glu Gly Leu Ile Thr Thr Thr 
625                 630                 635                 640 
Thr Glu Pro Trp Thr Gly Thr Phe Thr Ser Thr Ser Thr Glu Val Thr 
                645                 650                 655 
Thr Val Thr Gly Thr Asn Gly Gln Pro Thr Asp Glu Thr Val Ile Val 
            660                 665                 670 
Ile Arg Thr Pro Thr Ser Glu Gly Leu Ile Thr Thr Ala Thr Glu Pro 
         675                 680                 685 
Trp Thr Gly Thr Phe Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr 
    690                 695                 700 
Gly Thr Asn Gly Gln Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr 
705                 710                 715                 720 
Pro Thr Ser Glu Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Asn Gly 
                725                 730                 735 
Thr Phe Thr Ser Thr Ser Thr Glu Val Thr Thr Ile Thr Gly Thr Asn 
            740                 745                 750 
Gly Gln Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser 
        755                 760                 765 
Glu Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr 
    770                 775                 780 
Ser Thr Ser Thr Glu Val Thr Thr Val Thr Gly Thr Asn Gly Gln Pro 
785                 790                 795                 800 
Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu Gly Leu 
                 805                 810                 815 
Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr Ser Thr Ser 
             820                 825                 830 
Thr Glu Met Thr Thr Ile Thr Gly Thr Asn Gly Gln Pro Thr Asp Glu 
        835                 840                 845 
Thr Val Ile Val Ile Arg Thr Pro Thr Ser Glu Gly Leu Ile Thr Thr 
    850                 855                 860 
Thr Thr Glu Pro Trp Thr Gly Thr Phe Thr Ser Thr Ser Thr Glu Val 
865                 870                 875                 880 
Thr Thr Val Thr Gly Thr Asn Gly Gln Pro Thr Asp Glu Thr Val Ile 
                885                 890                 895 
Val Ile Arg Thr Pro Thr Ser Glu Gly Leu Ile Thr Thr Thr Thr Glu 
            900                 905                 910 
Pro Trp Thr Gly Thr Phe Thr Ser Thr Ser Thr Glu Met Thr Thr Val 
        915                 920                 925 
Thr Gly Thr Asn Gly Gln Pro Thr Asp Glu Thr Val Ile Val Ile Arg 
    930                 935                 940 
Thr Pro Thr Ser Glu Gly Leu Val Thr Thr Thr Thr Glu Pro Trp Asn 
945                 950                 955                 960 
Gly Thr Phe Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr 
                965                 970                 975 
Asn Gly Gln Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr 
            980                 985                 990 
Ser Glu Gly Leu Val Ala Thr Thr Thr Glu Pro Trp Ala Gly Thr Phe 
        995                 1000                1005 
Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly 
    1010                1015                1020 
Gln Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser 
    1025                1030                1035 
Glu Gly Leu Val Ala Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe 
    1040                1045                1050 
Thr Ser Thr Ser Thr Glu Met Thr Thr Val Thr Gly Thr Asn Gly 
    1055                1060                1065 
Gln Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser 
    1070                1075                1080 
Glu Gly Leu Val Ala Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe 
    1085                1090                1095 
Thr Ser Thr Ser Thr Glu Met Thr Thr Ile Thr Gly Thr Asn Gly 
    1100                1105                1110 
Gln Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser 
    1115                1120                1125 
Glu Gly Leu Ile Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe 
    1130                1135                1140 
Thr Ser Thr Ser Thr Glu Met Thr Thr Ile Thr Gly Thr Asn Gly 
    1145                1150                1155 
Gln Pro Thr Asp Glu Ala Val Ile Val Ile Arg Thr Pro Thr Ser 
    1160                1165                1170 
Glu Gly Leu Val Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe 
    1175                1180                1185 
Thr Ser Thr Ser Thr Gly Met Thr Thr Val Thr Gly Thr Asn Gly 
    1190                1195                1200 
Gln Pro Thr Asp Glu Thr Val Ile Val Ile Arg Thr Pro Thr Ser 
    1205                1210                1215 
Glu Gly Leu Val Thr Thr Thr Thr Glu Pro Trp Thr Gly Thr Phe 
    1220                1225                1230 
Thr Ser Thr Ser Thr Glu Met Ser Thr Val Thr Gly Thr Asn Gly 
    1235                1240                1245 
Leu Pro Thr Asp Glu Thr Val Ile Val Val Lys Thr Pro Thr Thr 
    1250                1255                1260 
Ala Ile Ser Ser Ser Leu Ser Ser Ser Ser Ser Gly Gln Ile Thr 
    1265                1270                1275 
Ser Ser Ile Thr Ser Ser Arg Pro Ile Ile Thr Pro Phe Tyr Pro 
    1280                1285                1290 
Ser Asn Gly Thr Ser Val Ile Ser Ser Ser Val Ile Ser Ser Ser 
    1295                1300                1305 
Val Thr Ser Ser Leu Val Thr Ser Ser Pro Val Ile Ser Ser Ser 
    1310                1315                1320 
Phe Ile Ser Ser Ser Val Ile Ser Ser Ser Thr Thr Thr Ser Ala 
    1325                1330                1335 
Ser Ile Phe Ser Glu Ser Ser Lys Ser Ser Val Ile Pro Thr Ser 
    1340                1345                1350 
Ser Ser Thr Ser Gly Ser Ser Glu Ser Glu Thr Ser Ser Ala Ser 
    1355                1360                1365 
Ser Ala Ser Ser Ser Ser Ser Ile Ser Ser Glu Ser Pro Lys Ser 
    1370                1375                1380 
Thr Tyr Ser Ser Ser Ser Leu Pro Pro Val Thr Ser Ala Thr Thr 
    1385                1390                1395 
Ser Gln Glu Ile Thr Ser Ser Leu Pro Pro Val Thr Ser Ala Thr 
    1400                1405                1410 
Ala Ser Gln Glu Thr Ala Ser Ser Leu Pro Pro Ala Thr Thr Thr 
    1415                1420                1425 
Lys Thr Ser Glu Gln Thr Thr Leu Val Thr Val Thr Ser Cys Glu 
    1430                1435                1440 
Ser His Val Cys Thr Glu Ser Ile Ser Ser Ala Ile Val Ser Thr 
    1445                1450                1455 
Ala Thr Val Thr Val Ser Gly Val Thr Thr Glu Tyr Thr Thr Trp 
    1460                1465                1470 
Cys Pro Ile Ser Thr Thr Glu Thr Thr Arg Gln Thr Lys Gly Thr 
    1475                1480                1485 
Thr Glu Gln Thr Thr Glu Thr Thr Lys Gln Thr Thr Val Val Thr 
    1490                1495                1500 
Ile Ser Ser Cys Glu Ser Asp Ile Cys Ser Lys Thr Ala Ser Pro 
    1505                1510                1515v 
Ala Ile Val Ser Thr Ser Thr Ala Thr Ile Ash Gly Val Thr Thr 
    1520                1525                1530 
Glu Tyr Thr Thr Trp Cys Pro Ile Ser Thr Thr Glu Ser Lys Gln 
    1535                1540                1545 
Gln Thr Thr Leu Val Thr Val Thr Ser Cys Glu Ser Gly Val Cys 
    1550                1555                1560 
Ser Glu Thr Ala Ser Pro Ala Ile Val Ser Thr Ala Thr Ala Thr 
    1565                1570                1575 
Val Asn Asp Val Val Thr Val Tyr Pro Thr Trp Arg Pro Gln Thr 
    1580                1585                1590 
Thr Asn Glu Glu Ser Val Ser Ser Lys Met Asn Ser Ala Thr Ser 
    1595                1600                1605 
Glu Thr Thr Thr Asn Thr Val Ala Ala Glu Thr Thr Thr Ash Thr 
    1610                1615                1620 
Gly Ala Ala Glu Thr Thr Thr Ser Thr Gly Ala Ala Glu Thr Lys 
    1625                1630                1635 
Thr Val Val Thr Ser Ser Leu Ser Arg Ser Asn His Ala Glu Thr 
    1640                1645                1650 
Gln Thr Ala Ser Ala Thr Asp Val Ile Gly His Ser Ser Ser Val 
    1655                1660                1665 
Val Ser Val Ser Glu Thr Gly Asn Thr Lys Ser Leu Thr Ser Ser 
    1670                1675                1680 
Gly Leu Ser Thr Met Ser Gln Gln Pro Arg Ser Thr Pro Ala Ser 
    1685                1690                1695 
Ser Met Val Gly Ser Ser Thr Ala Ser Leu Glu Ile Ser Thr Tyr 
    1700                1705                1710 
Ala Gly Ser Ala Asn Ser Leu Leu Ala Gly Ser Gly Leu Ser Val 
    1715                1720                1725 
Phe Ile Ala Ser Leu Leu Leu Ala Ile Ile 
    1730                1735 
<210>5 
<211>29 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>5 
gcggaattcc ctctggttct tctgagagc                                             29 
<210>6 
<211>27 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>6 
gcgaagcttg taagctgttg gcactgc                                                27 
<210>7 
<211>26 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>7 
ggcgaattcc ttgaaattag ctcggt                                                 26 
<210>8 
<211>26 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>8 
gcgaagcttg catatccata agccat                                         26 
<210>9 
<211>66 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>9 
gacaatgcct catcgctata tgtttttggc agtctttaca cttctgacat ggaggcccag    60 
aatacc                                                               66 
<210>10 
<211>66 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>10 
agttatgacg gtgttagcag ttgtaggtgt tttgacaaca atgaccagta tagcgaccag    60 
cattca                                                               66 
<210>11 
<211>34 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>11 
ggcttaatta aatgacaatg cctcatcgct atat                                34 
<210>12 
<211>36 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>12 
taccatgtcg ctggttaaat aattgccagc aataag                              36 
<210>13 
<211>28 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>13 
ttggatccac tgtaattgct tttagttg                                       28 
<210>14 
<211>34 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>14 
ggcttaatta atgttttata tttgttgtaa aaag                                    34 
<210>15 
<211>27 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>15 
aaggatccga ggacggttgc tgaagaa                                            27 
<210>16 
<211>32 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>16 
gcgttaatta aagttctatg tcttaataag tc                                      32 
<210>17 
<211>18 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>17 
atgctatgat gcccactg                                                       18 
<210>18 
<211>18 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>18 
aatacacgta tccctcga                                                       18 
<210>19 
<211>18 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>19 
tcttcgtgct cttgttgc                                                        18 
<210>20 
<211>18 
<212>DNA 
<213>人工序列 
<220> 
<223>引物 
<400>20 
tttccagggt tacgtttg                                                        18 

Claims (9)

1.一种分离的核酸,其特征在于,其序列如SEQ ID NO:1或SEQ ID NO:3所示。
2.一种蛋白质,其特征在于,所述蛋白质的氨基酸序列如SEQ ID NO:2或SEQ ID NO:4所示。
3.编码权利要求2所述的氨基酸序列的核酸。
4.一种表达载体,其含有权利要求1或3所述的核酸。
5.如权利要求4所述的表达载体,其特征在于,所述表达载体含有TPS1启动子或者含有PGK1启动子。
6.一种絮凝酵母(Saccharomyces cerevisiae),其含有权利要求4或5所述的表达载体。
7.一种获得权利要求1所述的核酸的方法,所述核酸为絮凝酵母全长絮凝基因,该方法包括以下步骤:
(1)用Fosmid载体构建插入片段约为35-40kb的絮凝酵母基因组文库;
(2)将所获得的文库转染细菌,平板涂布,经鉴定文库合格后挑取平板上的单克隆于培养基中培养;
(3)提取培养的单克隆的DNA,PCR扩增,并对PCR扩增产物进行检测,获得含有絮凝基因的阳性克隆;和
(4)对该阳性克隆进行测序,获得该絮凝酵母的所述絮凝基因。
8.一种生产絮凝蛋白的方法,该方法包括:
构建权利要求4或5所述的表达载体,
用该表达载体转化絮凝酵母,和
在使转化的絮凝酵母表达絮凝蛋白的条件下培育该絮凝酵母,从而生产絮凝蛋白。
9.选自保藏号为CGMCC NO:3408或CGMCC NO:3409的酿酒酵母(Saccharomyces cerevisiae)。
CN 200910200097 2009-12-08 2009-12-08 絮凝酵母絮凝基因、其表达产物及其用途 Expired - Fee Related CN102086455B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200910200097 CN102086455B (zh) 2009-12-08 2009-12-08 絮凝酵母絮凝基因、其表达产物及其用途

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200910200097 CN102086455B (zh) 2009-12-08 2009-12-08 絮凝酵母絮凝基因、其表达产物及其用途

Publications (2)

Publication Number Publication Date
CN102086455A CN102086455A (zh) 2011-06-08
CN102086455B true CN102086455B (zh) 2013-04-17

Family

ID=44098460

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200910200097 Expired - Fee Related CN102086455B (zh) 2009-12-08 2009-12-08 絮凝酵母絮凝基因、其表达产物及其用途

Country Status (1)

Country Link
CN (1) CN102086455B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102690836B (zh) * 2012-06-12 2014-05-07 大连理工大学 转基因絮凝微藻的构建及其在微藻采收中的应用
JP5694426B2 (ja) * 2013-05-09 2015-04-01 アサヒグループホールディングス株式会社 新規ショ糖非資化性凝集性酵母
CN104974945B (zh) * 2015-06-26 2018-05-04 中国石油天然气股份有限公司 一种过表达mig1基因的酿酒酵母及其制备方法与应用
CN110643515A (zh) * 2019-01-02 2020-01-03 沈阳化工大学 转基因絮凝微藻的构建及其制备方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1352241A (zh) * 2001-12-04 2002-06-05 大连理工大学 一种用于酒精发酵的自絮凝酵母菌株
CN101045905A (zh) * 2006-03-30 2007-10-03 大连理工大学 驯化选育的自絮凝酵母变异株及其应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1352241A (zh) * 2001-12-04 2002-06-05 大连理工大学 一种用于酒精发酵的自絮凝酵母菌株
CN101045905A (zh) * 2006-03-30 2007-10-03 大连理工大学 驯化选育的自絮凝酵母变异株及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
VERSTREPEN, K.J.等.INTRAGENIC TANDEM REPEATS GENERATE FUNCTIONAL VARIABILITY.《NAT. GENET.》.2005,第37卷(第9期),986-990. *
WATARI,J.等.MOLECULAR CLONING AND ANALYSIS OF THE YEAST FLOCULATION GENE FLO1.《YEAST》.1994,第10卷(第2期),211-225. *

Also Published As

Publication number Publication date
CN102086455A (zh) 2011-06-08

Similar Documents

Publication Publication Date Title
CN103571762B (zh) 一种高山被孢霉重组基因表达系统及其构建方法和应用
CN109477115A (zh) 用于真核生物的表达系统
CN101993482A (zh) 与水稻长粒卷叶相关的蛋白及其编码基因与应用
CN102086455B (zh) 絮凝酵母絮凝基因、其表达产物及其用途
CN110028566A (zh) GhPRXR1蛋白及其编码基因在调控棉籽含油量中的应用
CN103014053A (zh) 集胞藻高效双同源重组载体及其构建方法与应用
CN101748069B (zh) 一种重组蓝藻
US20240124858A1 (en) Recombinant algae having high lipid productivity
CN105238797B (zh) 一种无乳链球菌的gshF基因的突变基因及其应用
CN109266566A (zh) 一种调节光滑球拟酵母渗透压胁迫的方法
CN101469325A (zh) 一种马克斯克鲁维酵母外切菊粉酶的分泌表达方法
CN109134662A (zh) 一种可视化抗菌肽融合蛋白及其制备方法和其应用
CN102234620A (zh) Dna序列、重组载体、单和双营养缺陷型多形汉逊酵母菌、及其制备方法
CN113736806B (zh) 提高海洋微拟球藻油脂合成的基因及其用途
CN102690836B (zh) 转基因絮凝微藻的构建及其在微藻采收中的应用
CN109022452A (zh) 苔藓lrr1基因在提高苔藓抗盐和抗衰老性能中的应用
CN107988290A (zh) 一种提高谷胱甘肽累积量的生物方法
CN103642831A (zh) 海洋球石藻真核表达载体的构建方法
CN102373189B (zh) 与脂肪酸合成相关的蛋白及其编码基因与应用
CN104672314B (zh) 一种重组古紫质4蛋白及其制备方法和应用
CN103649318B (zh) 通过改变激酶和磷酸酶的表达水平加快植物生长并提高产量的方法
CN101922047A (zh) Gap启动子文库及其用途
CN112481235B (zh) Trdrs2蛋白及其相关生物材料在调控里氏木霉合成和分泌蛋白能力中的应用
CN110003316A (zh) 一种编码糖转运蛋白的氨基酸序列、突变体及应用
CN102146363A (zh) 一种新的葡聚糖酶,其编码基因及应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130417

Termination date: 20141208

EXPY Termination of patent right or utility model