CN103857791B - 脱氢酶变体和编码它们的多核苷酸 - Google Patents

脱氢酶变体和编码它们的多核苷酸 Download PDF

Info

Publication number
CN103857791B
CN103857791B CN201280047868.6A CN201280047868A CN103857791B CN 103857791 B CN103857791 B CN 103857791B CN 201280047868 A CN201280047868 A CN 201280047868A CN 103857791 B CN103857791 B CN 103857791B
Authority
CN
China
Prior art keywords
seq
variant
ala
polynucleotide
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201280047868.6A
Other languages
English (en)
Other versions
CN103857791A (zh
Inventor
M.塔索恩
L.德马里亚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Novozymes Inc
Original Assignee
Novo Nordisk AS
Novozymes Biotech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS, Novozymes Biotech Inc filed Critical Novo Nordisk AS
Publication of CN103857791A publication Critical patent/CN103857791A/zh
Application granted granted Critical
Publication of CN103857791B publication Critical patent/CN103857791B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/52Propionic acid; Butyric acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/010593-Hydroxypropionate dehydrogenase (1.1.1.59)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01276Serine 3-dehydrogenase (1.1.1.276)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/012983-Hydroxypropionate dehydrogenase (NADP+) (1.1.1.298)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Abstract

本发明涉及3‑羟基丙酸脱氢酶变体。本发明还涉及编码这些变体的多核苷酸;包含这些多核苷酸的核酸构建体、载体以及宿主细胞;以及使用这些变体的方法。

Description

脱氢酶变体和编码它们的多核苷酸
对序列表的引用
本申请包含一个计算机可读形式的序列表,将其通过引用结合在此。
背景
3-羟基丙酸(3-HP)是一种由美国能源部鉴定为可以通过发酵制造的排名前12的高潜力结构单元化学品之一的三碳羧酸。作为乳酸(2-羟基丙酸)的异构体的3-HP的替代名称包括乙烯乳酸和3-羟基丙酸化物。3-HP是一种有吸引力的可再生平台化学品,来自葡萄糖的理论产量为100%,具有允许它参与不同种化学反应的多种官能团,以及低的毒性。可以将3-HP用作底物来形成若干日用化学品,例如1,3-丙二醇、丙二酸、丙烯酰胺、以及丙烯酸。丙烯酸是一种用来生产丙烯酸酯和超强吸收能力聚合物的大量化学品(>70亿磅/年),并且目前来源于丙烯的催化氧化。3-HP的发酵性生产将为作为这些商业上有意义的化学品的原料的石油化学产品提供可持续的替代物,从而减少能量消耗、对外国石油供应的依赖以及温室气体的产生。
3-羟基丙酸脱氢酶(3-HPDH)是一种将丙二酸半醛转化为3-HP的酶(图1)。某些3-HPDH酶利用辅因子NADP(H)(EC1.1.1.298)。然而,3-HPDH的一些工程化代谢途径利用辅因子NAD(H)而非NADP(H)是令人希望的(例如,用来改善氧化还原平衡)。因此,在本领域中存在对研发与NADP(H)相比,对辅因子NAD(H)具有增加的特异性的脱氢酶变体的需求。在此描述了满足这一需求的脱氢酶变体。
概述
在此描述了3-羟基丙酸脱氢酶变体,这些变体在对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中的一个或多个(例如,两个,若干个)位置处包括取代,其中这些变体具有3-羟基丙酸脱氢酶活性。在一些方面中,这些变体在对应于SEQ ID NO:2的位置10的位置处包括缺失。在一些方面中,与NADP(H)相比,这些变体对辅因子NAD(H)具有增加的特异性。
还描述了编码这些变体的分离的多核苷酸;包括这些多核苷酸的核酸构建体、载体、以及宿主细胞;使用这些包括多核苷酸的宿主细胞生产3-羟基丙酸(3-HP)的方法;以及生产这些变体的方法。
附图简要说明
图1示出了一种用于产生3-HP的途径。
图2示出了大肠杆菌ydfG、东方伊萨酵母(I.orientalis)YMR226c、以及酿酒酵母YMR226c的天然脱氢酶序列(分别是SEQ ID NO:2、4和6)的比对。在辅因子结合中涉及的残基被加下划线。在催化作用中涉及的残基是粗体的。
图3示出了与天然大肠杆菌脱氢酶(SEQ ID NO:2)相比的变体脱氢酶mut1-mut25(分别是SEQ ID NO:7、8、9、10、11、12、13、14、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、以及33)的N末端区的部分序列比对;以及与天然东方伊萨酵母脱氢酶(SEQ IDNO:4)相比的变体脱氢酶mut26和mut27(分别是SEQ ID NO:80和81)的N末端区的部分序列比对。
图4示出了pTrc99A的质粒图。
图5示出了pMcTs108的质粒图。
图6示出了pMcTs116的质粒图。
图7示出了p1045168的质粒图。
图8示出了pMcTs77的质粒图。
图9示出了p11AAT5WP的质粒图。
图10示出了pMcTs78的质粒图。
图11示出了pMcTs115的质粒图。
图12示出了p11AA2GJP的质粒图。
图13示出了pMcTs102的质粒图。
定义
3-羟基丙酸脱氢酶:术语“3-羟基丙酸脱氢酶”(3-HPDH)意指一种在NAD(H)或NADP(H)辅因子的存在下,催化丙二酸半醛互变至3-羟基丙酸化物(3-HP)的的酶。具有3-HP脱氢酶活性的酶类被分类为EC1.1.1.59(如果它们利用NAD(H)辅因子),和EC1.1.1.298(如果它们利用NADP(H)辅因子)。被分类为EC1.1.1.298的酶类可替代地被称为丙二酸半醛还原酶。本领域普通技术人员将意识到3-羟基丙酸脱氢酶可能对多于一种底物具有特异性。例如,具有SEQ ID NO:2的大肠杆菌3-羟基丙酸脱氢酶可以催化丝氨酸互变至2-氨基丙二酸半醛(即一种“丝氨酸脱氢酶”)和3-HP互变至丙二酸半醛(即,一种3-HPDH)两者。
可以根据在实例中描述的丙二酸半醛还原酶测定来确定3-羟基丙酸脱氢酶活性。在一个方面中,本发明的这些变体具有至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的SEQ ID NO:2、4或6的3-羟基丙酸脱氢酶。
主动3-HP途径:如在此使用,具有“主动3-HP途径(active3-HP pathway)”的宿主细胞产生催化在从可发酵糖至3-HP的代谢途径中的每个反应所必需的活性酶,并且因此当在至少一种可发酵糖的存在下在发酵条件下培养时,能够以可测量的产量产生3-HP。具有主动3-HP途径的宿主细胞包括一个或多个3-HP途径基因。如在此使用,“3-HP途径基因”是指一种编码在主动3-HP途径中涉及的酶的基因。主动3-HP途径以及在该主动3-HP途径中涉及的对应的酶的一个实例示于图1中。
催化主动3-HP途径中的每个反应所必需的活性酶可以来自内源基因表达的活性、异源基因表达的活性、或来自内源基因和异源基因表达的活性的组合。
等位变体:术语“等位变体”是指占据同一染色体基因座的基因的两种或更多种可变形式中的任一种。等位基因变异由突变天然产生,并且可以导致群体内的多态性。基因突变可以是沉默的(编码的多肽中无改变),或可以编码出具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
编码序列:术语“编码序列”意指明确一种多肽的氨基酸序列的多核苷酸序列。编码序列的边界一般由开放阅读框架决定,该开放阅读框架通常以ATG起始密码子或替代性起始密码子(例如GTG和TTG)开始,并且以终止密码子(例如TAA、TAG、和TGA)结束。编码序列可以是基因组DNA、cDNA、合成的多核苷酸、和/或重组多核苷酸的一个序列。
控制序列:术语“控制序列”意指多肽表达所必需的核酸序列。控制序列对于编码多肽的多核苷酸可以是天然的或外源的,并且彼此可以是天然的或外源的。此类控制序列包括但不限于,前导序列、多聚腺苷酸化序列、前肽序列、启动子序列、信号肽序列及转录终止子序列。可以为这些控制序列提供为了引入以特定限制性位点的接头,以促进这些控制序列与编码多肽的多核苷酸的编码区连接。
表达:术语“表达”包括在多肽的产生中涉及的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰、以及分泌。可以对表达进行测量—例如,来检测增加的表达—通过本领域已知的技术,例如测量mRNA和/或翻译的多肽的水平。
表达载体:术语“表达载体”意指一种线性或环形的DNA分子,该分子包括编码一种多肽的多核苷酸并且被可操作地连接至控制序列,其中这些控制序列提供编码该多肽的多核苷酸的表达。最低限度上,该表达载体包括启动子序列,以及转录和翻译终止信号序列。
可发酵的培养基:术语“可发酵的培养基”是指包括一种或多种(例如,两种,若干种)糖的培养基,例如葡萄糖、果糖、蔗糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖、和/或可溶性低聚糖,其中这种培养基能够部分地被具有主动3-HP途径的宿主细胞转化(发酵)为3-HP。在一些情况下,这种发酵培养基来源于天然来源,例如甘蔗、淀粉、或纤维素;并且可以来自这种来源的酶水解(糖化作用)的预处理。
片段:术语“片段”意指一种具有一个或多个(例如,两个,若干个)氨基酸从参照多肽序列的氨基和/或羧基末端缺失的多肽。在一个方面中,该片段具有3-HPDH活性。在另一个方面中,在该片段中的氨基酸残基的数目是在此的任何3-HPDH的至少75%,例如至少80%、85%、90%、或95%,例如,是SEQ ID NO:2、4、或6中的氨基酸残基的数目的至少75%,例如至少80%、85%、90%、或95%。
异源多核苷酸:在此将术语“异源多核苷酸”定义为以下多核苷酸:对该宿主细胞而言不是天然的多核苷酸;已经对编码区做出一种或多种(例如,两种,若干种)结构修饰的天然多核苷酸;由于通过重组DNA技术对DNA的操作而定量改变其表达的天然多核苷酸,例如,将一种不同的(外源的)启动子连接至该多核苷酸;或通过向该宿主细胞中引入该多核苷酸的一个或多个另外的拷贝而定量改变其表达的天然多核苷酸。
宿主细胞:术语“宿主细胞”意指对包括在此描述的多核苷酸(例如,编码3-HPDH的多核苷酸)的核酸构建体或表达载体的转化、转染、转导等敏感的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变与亲本细胞不同的该亲本细胞的任何后代。
增加的特异性:术语“与NADP(H)相比,针对NAD(H)的增加的特异性”意指在其他方面相同的条件下,与NADP(H)相比,在NAD(H)的存在下,参照多肽具有较大的3-HPDH活性。在一些方面中,与NADP(H)相比,参照变体具有大于2倍,例如大于5倍、10倍、20倍、50倍、100倍、200倍、500倍、或1000倍的针对NAD(H)的特异性。
分离的:术语“分离的”意指处于非天然存在的形式或环境中的一种物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质;(2)至少部分地从在自然界与之相关联的一种或多种或者所有天然存在的成分去除的任何物质,包括但不限于,任何酶、变体、核酸、蛋白质、肽或辅因子;(3)相对于自然界中发现的该物质,通过人工修饰的任何物质;或(4)通过使该物质的量相对于与之自然地相关联的其他组分有所增加(例如,编码该物质的基因的多个拷贝;使用比与编码该物质的基因自然地相关联的启动子更强的启动子)而修饰的任何物质。分离的物质可以存在于发酵液样品中。
突变体:术语“突变体”意指编码一种变体的一种多核苷酸。
核酸构建体:术语“核酸构建体”意指一种包括一个或多个(例如,两个、若干个)控制序列的多核苷酸。多核苷酸可以是单链的或双链的,并且可以分离自天然存在的基因、可以被修饰来以另外的不会在自然界中存在的方式包含核酸的区段,或可以是合成的。
可操作地连接:术语“可操作地连接”意指如下构造,其中控制序列相对于多核苷酸的编码序列安置在适当位置处,这样使得控制序列指导编码序列的表达。
亲本或亲本3-HPDH:术语“亲本”或“亲本3-HPDH”意指对其做出改变以产生本发明的酶变体的一种3-HPDH。该亲本可以是天然存在的(野生型)多肽或其变体或片段。
序列一致性:用参数“序列一致性”来描述两个氨基酸序列之间或两个核苷酸序列之间的关联性。
出于本发明的目的,使用尼德曼-翁施(Needleman-Wunsch)算法(尼德曼和翁施,1970,J.Mol.Biol.(《分子生物学杂志》)48:443-453)来确定两个氨基酸序列之间的序列一致性,该算法如EMBOSS软件包(EMBOSS:The European Molecular Biology Open SoftwareSuite(欧洲分子生物学开放软件套件),Rice(赖斯)等人,2000,Trends Genet.(《遗传学趋势》)16:276-277)(优选5.0.0版或更新版本)的Needle程序所实施的。所使用的这些参数是空位开放罚分10、空位延伸罚分0.5,及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。
出于本发明的目的,使用尼德曼-翁施算法(上文的尼德曼和翁施,1970)来确定两个脱氧核苷酸序列之间的序列一致性,该算法如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件,上文的赖斯等人,2000)(优选5.0.0版或更新版本)的Needle程序所实施的。使用的参数是空位开放罚分10,空位延伸罚分0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。
严谨度条件:在此使用严谨度条件来提供在比较两个DNA序列的时候的杂交条件。
术语“非常低严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200毫克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2%SDS,在45℃下洗涤三次,每次15分钟。
术语“低严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200毫克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2%SDS,在50℃下洗涤三次,每次15分钟。
术语“中严谨度条件”意指对于至少100个核苷酸长度的探针而言,遵循标准DNA印迹程序,在42℃在5X SSPE、0.3%SDS、200微克/ml剪切和变性的鲑精DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2%SDS,在55℃下洗涤三次,每次15分钟。
术语“中-高严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200毫克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2%SDS,在60℃下洗涤三次,每次15分钟。
术语“高严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹(Southern blotting)程序,在42℃下在5X SSPE、0.3%SDS、200毫克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2%SDS,在65℃下洗涤三次,每次15分钟。
术语“非常高严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200毫克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2%SDS,在70℃下洗涤三次,每次15分钟。
子序列:术语“子序列”意指一种具有一个或多个(例如,两个,若干个)核苷酸从参照核苷酸序列的5'端和/或3'端缺失的多核苷酸。在一个方面中,该子序列编码一种具有3-HPDH活性的片段。在另一个方面中,在该子序列中的核苷酸残基的数目是编码在此描述的3-HPDH的任何序列中的核苷酸残基的数目的至少75%,例如至少80%、85%、90%、或95%,例如,是SEQ ID NO:1、3、或5中的核苷酸残基的数目的至少75%,例如至少80%、85%、90%、或95%。
变体:术语“变体”意指相对于亲本3-HPDH,在一个或多个(例如,两个、若干个)位置处包括改变(即,取代、插入和/或缺失)的3-HPDH。取代意指占据一个位置的氨基酸被一个不同的氨基酸替代;缺失意指占据一个位置的氨基酸的移除;并且插入意指邻近于并且紧跟着占据一个位置的氨基酸之后添加一个氨基酸。
野生型:术语“野生型”3-HPDH或“天然”3-HPDH意指由天然存在的微生物(例如在自然界中发现的细菌、酵母、或丝状真菌)表达的一种3-HPDH。
用于变体表示的常规
用于在此描述的目的,使用SEQ ID NO:2来确定在其他3-HPDH酶类中的氨基酸编号。将另一种3-HPDH的氨基酸序列与SEQ ID NO:2进行比对,并且基于该比对,使用尼德曼-翁施算法(尼德曼和翁施,1970,分子生物学杂志48:443-453)来确定与SEQ ID NO:2中所披露的多肽的任何氨基酸残基相对应的氨基酸位置编号,该算法如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件,赖斯等人,2000,遗传学趋势16:276-277)(优选5.0.0版或更新版本)的Needle程序所实施的。所使用的这些参数是空位开放罚分10,空位延伸罚分0.5,及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。
可以使用若干计算机程序通过多种多肽序列的比对来确定在另一种3-HPDH中的对应氨基酸残基的鉴定,这些计算机程序包括,但不限于:MUSCLE(multiple sequencecomparison by log‐expectation(基于日志-期望值的多序列比较);版本3.5或更新版本;Edgar(埃德加),2004,Nucleic Acids Research(《核酸研究》)32:1792-1797),MAFFT(版本6.857或更新版本;Katoh(卡托赫)和Kuma(库玛),2002,Nucleic Acids Research(《核酸研究》)30:3059-3066;Katoh(卡托赫)等人,2005,Nucleic Acids Research(《核酸研究》)33:511-518;Katoh(卡托赫)和Toh(都),2007,Bioinformatics(《生物信息学》)23:372-374;Katoh(卡托赫)等人,2009,Methods in Molecular Biology(《分子生物学方法》)537:_39-64;Katoh(卡托赫)和Toh(都),2010,Bioinformatics(《生物信息学》)26:_1899-1900),以及利用ClustalW的EMBOSS EMMA(1.83或更新版本;Thompson(汤普森)等人,1994,NucleicAcids Research(《核酸研究》)22:4673-4680),使用它们各自的缺省参数。
当从SEQ ID NO:2中分叉分出其他酶序列,这样使得传统的基于序列的比较不能检测它们的关系(Lindahl(林达尔)和Elofsson松(埃洛弗),2000,分子生物学杂志295:613-615)时,则可以使用其他配对序列比较算法。在基于序列的搜索中的更大灵敏度可以使用搜索程序来获得,这些搜索程序利用多肽家族的概率表示(谱(profile))来搜索数据库。例如,PSI-BLAST程序通过一个迭代数据库搜索过程来产生多个谱并且能够检测远距离同源物(Atschul(阿特休尔)等人,1997,核酸研究25:3389-3402)。如果多肽的家族或超家族在蛋白结构数据库中具有一个或多个代表,则可以实现甚至更大的灵敏度。程序(例如GenTHREADER)(Jones(琼斯),1999,分子生物学杂志287:797-815;McGuffi(n麦谷芬)和琼斯,2003,生物信息学19:874-881)利用来自多种来源(PSI-BLAST,二级结构预测、结构比对谱、以及溶剂化潜力)的信息作为预测查询序列的结构折叠的神经网络的输入。类似地,Gough(高夫)等人,2000,分子生物学杂志313:903-919的方法可以用于比对未知结构的序列与存在于SCOP数据库中的超家族模型。这些比对进而可以用于产生多肽的同源性模型,并且使用出于该目的而开发的多种工具可以评定这类模型的准确度。
对于已知结构的蛋白,若干工具和资源可用于检索并产生结构比对。例如,蛋白的SCOP超家族已经在结构上进行比对,并且那些比对是可访问的并且可下载的。使用多种算法(例如距离比对矩阵(Holm(赫尔姆)和Sander(桑德尔),1998,Proteins(《蛋白杂志》)33:88-96)或者组合扩展(Shindyalov(辛迪亚洛夫)和Bourne(伯恩),1998,蛋白工程11:739-747))可以比对两个或更多个蛋白结构,并且可以另外地利用这些算法的实施来使用所感兴趣的结构查询结构数据库以便发现可能的结构同源物(例如,赫尔姆和Park(帕克),2000,生物信息学16:566-567)。
在描述在此说明的变体中,以下所述的命名法适于方便参考。采用了已接受的IUPAC单个字母和三字母的氨基酸缩写。
取代。对于氨基酸取代,使用了以下命名法:原始氨基酸、位置、取代的氨基酸。因此,在位置226处的苏氨酸被丙氨酸取代被表示为“Thr226Ala”或者“T226A”。在同一位置处的替代性取代由斜线分开。例如,在位置226处的苏氨酸被丙氨酸或缬氨酸的取代被表示为“Thr226Ala/Val”或“T226A/V”,来表示T226A或T226V取代。多个突变由加号(“+”)分开,例如“Gly205Arg+Ser411Phe/Tyr”或“G205R+S411F/Y”表示分别在位置205和位置411处的甘氨酸(G)被精氨酸(R)并且丝氨酸(S)被苯丙氨酸(F)或酪氨酸(Y)取代。
缺失。对于一个氨基酸缺失,使用了以下命名法。原始氨基酸、位置、*。因此,在位置195上的甘氨酸缺失被表示为“Gly195*”或者“G195*”。多个缺失由加号(“+”)分开,例如“Gly195*+Ser411*”或者“G195*+S411*”。
插入。对于氨基酸插入,使用了以下命名法:原始氨基酸、位置、原始氨基酸、插入的氨基酸。因此,在位置195上的甘氨酸之后插入赖氨酸被表示为“Gly195GlyLys”或者“G195GK”。多个氨基酸的插入被表示为[原始氨基酸、位置、原始氨基酸、插入的氨基酸#1、插入的氨基酸#2;等]。例如,在位置195上的甘氨酸之后插入赖氨酸和丙氨酸被表示为“Gly195GlyLysAla”或者“G195GKA”。
在这类情况下,通过将小写字母添加到在所插入的一个或多个氨基酸残基之前的氨基酸残基的位置编号中来对所插入的一个或多个氨基酸残基进行编号。在以上实例中,该序列因此将是:
亲本: 变体:
195 195 195a 195b
G G -K -A
在此提及“约”一个数值或参数包括指向那个数值或参数本身的方面。例如,提及“约X”的描述包括方面“X”。当与测量值组合使用时,“约”包括涵盖至少与测量该具体数值的方法相关的不确定性的范围,并且可以包括在给定的数值附近正或负两个标准差的范围。
如在此和所附权利要求书中所使用,单数形式“一种/个”、“或”以及“该”包括复数指示物,除非上下文以另外的方式清楚表明。应该理解的是在此描述的这些方面包括“由方面组成”和/或“基本由方面组成”。
除非由上下文以另外的方式定义或清楚表明,在此使用的所有技术术语和科学术语具有如本领域的普通技术人员所通常理解的相同的含义。
详细说明
在此尤其描述了具有3-HPDH活性的多肽。在一些方面中,这些多肽是在对应于SEQID NO:2的位置9、31、32、33、34、35以及36处的一个或多个(例如,两个、若干个)位置处包括取代的变体。在一些方面中,这些变体在对应于SEQ ID NO:2的位置10的位置处进一步包括缺失。在一些方面中,与NADP(H)相比,这些多肽对NAD(H)具有增加的特异性。
具有3-HPDH活性的多肽
在一个方面中,是一种具有3-HPDH活性的多肽,其中该多肽是:
a)一种与SEQ ID NO:2、4、或6具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的多肽;
b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严谨度条件下,例如中严谨度条件下、中-高严谨度条件下、高严谨度条件下、或非常高严谨度条件下与SEQ ID NO:1、3或5的全长互补链杂交;或
c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、3、或5具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性;
其中与NADP(H)相比,该多肽对NAD(H)具有增加的特异性(例如,与NADP(H)相比,针对NAD(H)的大于2倍、5倍、10倍、20倍、50倍、100倍、200倍、500倍、或1000倍的特异性)。
在一个方面中,该多肽a)与SEQ ID NO:2具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性;b)由以下多核苷酸编码,该多核苷酸在至少低严谨度条件下,例如中严谨度条件下、中-高严谨度条件下、高严谨度条件下、或非常高严谨度条件下与SEQ ID NO:1的全长互补链杂交;和/或c)由以下多核苷酸编码,该多核苷酸与SEQ ID NO:1具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。
在与SEQ ID NO:2有关的这些方面的一些中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少一个与SEQ ID NO:2不同。在一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少两个与SEQ ID NO:2不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少三个与SEQ ID NO:2不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少四个与SEQ ID NO:2不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少五个与SEQ ID NO:2不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少六个与SEQ ID NO:2不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中的所有位置与SEQ ID NO:2不同。
在另一个方面中,该多肽a)与SEQ ID NO:4具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性;b)由以下多核苷酸编码,该多核苷酸在至少低严谨度条件下,例如中严谨度条件下、中-高严谨度条件下、高严谨度条件下、或非常高严谨度条件下与SEQ ID NO:3的全长互补链杂交;和/或c)由以下多核苷酸编码,该多核苷酸与SEQ ID NO:3具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。
在与SEQ ID NO:4有关的这些方面的一些中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少一个与SEQ ID NO:4不同。在一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少两个与SEQ ID NO:4不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少三个与SEQ ID NO:4不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少四个与SEQ ID NO:4不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少五个与SEQ ID NO:4不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少六个与SEQ ID NO:4不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中的所有位置与SEQ ID NO:4不同。
在另一个方面中,该多肽a)与SEQ ID NO:6具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性;b)由以下多核苷酸编码,该多核苷酸在至少低严谨度条件下,例如中严谨度条件下、中-高严谨度条件下、高严谨度条件下、或非常高严谨度条件下与SEQ ID NO:5的全长互补链杂交;和/或由以下多核苷酸编码,该多核苷酸与SEQ ID NO:5具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。
在与SEQ ID NO:6有关的这些方面的一些中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少一个与SEQ ID NO:6不同。在一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少两个与SEQ ID NO:6不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少三个与SEQ ID NO:6不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少四个与SEQ ID NO:6不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少五个与SEQ ID NO:6不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少六个与SEQ ID NO:6不同。在另一个实施例中,对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中的所有位置与SEQ ID NO:6不同。
在一个方面中,该多肽在对应于SEQ ID NO:2的位置9的位置处可以包括Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val。在一些实施例中,对应于位置9处的氨基酸是Gly。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在另一个方面中,该多肽在对应于SEQ ID NO:2的位置31的位置处可以包括Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val。在一些实施例中,对应于位置31处的氨基酸是Asp或Glu。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在另一个方面中,该多肽在对应于SEQ ID NO:2的位置32的位置处可以包括Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val。在一些实施例中,对应于位置32处的氨基酸是Leu。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在另一个方面中,该多肽在对应于SEQ ID NO:2的位置33的位置处可以包括Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val。在一些实施例中,对应于位置33处的氨基酸是Ser或Asn。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在另一个方面中,该多肽在对应于SEQ ID NO:2的位置34的位置处可以包括Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val。在一些实施例中,对应于位置34处的氨基酸是Ala或Pro。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在另一个方面中,该多肽在对应于SEQ ID NO:2的位置35的位置处可以包括Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val。在一些实施例中,对应于位置35处的氨基酸是Ala或Asp。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在另一个方面中,该多肽在对应于SEQ ID NO:2的位置36的位置处可以包括Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val。在一些实施例中,对应于位置36处的氨基酸是Ala。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在该多肽的一个方面中,对应以下位置的是:9是Gly并且31是Asp或Glu;9是Gly并且32是Leu;9是Gly并且33是Ser或Asn;9是Gly并且34是Ala或Pro;9是Gly并且35是Ala或Asp;9是Gly并且36是Ala;31是Asp或Glu并且32是Leu;31是Asp或Glu并且33是Ser或Asn;31是Asp或Glu并且34是Ala或Pro;31是Asp或Glu并且35是Ala或Asp;31是Asp或Glu并且36是Ala;32是Leu并且33是Ser或Asn;32是Leu并且34是Ala或Pro;32是Leu并且35是Ala或Asp;32是Leu并且36是Ala;33是Ser或Asn并且34是Ala或Pro;33是Ser或Asn并且35是Ala或Asp;33是Ser或Asn并且36是Ala;34是Ala或Pro并且35是Ala或Asp;34是Ala或Pro并且36是Ala;或35是Ala或Asp并且36是Ala。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在该多肽的另一个方面中,对应以下位置的是:9是Gly,31是Asp或Glu,并且32是Leu;9是Gly,31是Asp或Glu,并且33是Ser或Asn;9是Gly,31是Asp或Glu,并且34是Ala或Pro;9是Gly,31是Asp或Glu,并且35是Ala或Asp;9是Gly,31是Asp或Glu,并且36是Ala;9是Gly,32是Leu,并且33是Ser或Asn;9是Gly,32是Leu,并且34是Ala或Pro;9是Gly,32是Leu,并且35是Ala或Asp;9是Gly,32是Leu,并且36是Ala;9是Gly,33是Ser或Asn,并且34是Ala或Pro;9是Gly,33是Ser或Asn,并且35是Ala或Asp;9是Gly,33是Ser或Asn,并且36是Ala;9是Gly,34是Ala或Pro,并且35是Ala或Asp;9是Gly,34是Ala或Pro,并且36是Ala;9是Gly,35是Ala或Asp,并且36是Ala;31是Asp或Glu,32是Leu,并且33是Ser或Asn;31是Asp或Glu,32是Leu,并且34是Ala或Pro;31是Asp或Glu,32是Leu,并且35是Ala或Asp;31是Asp或Glu,32是Leu,并且36是Ala;31是Asp或Glu,33是Ser或Asn,并且34是Ala或Pro;31是Asp或Glu,33是Ser或Asn,并且35是Ala或Asp;31是Asp或Glu,33是Ser或Asn,并且36是Ala;31是Asp或Glu,34是Ala或Pro,并且35是Ala或Asp;31是Asp或Glu,34是Ala或Pro,并且36是Ala;31是Asp或Glu,35是Ala或Asp,并且36是Ala;32是Leu,33是Ser或Asn,并且34是Ala或Pro;32是Leu,33是Ser或Asn,并且35是Ala或Asp;32是Leu,33是Ser或Asn,并且36是Ala;32是Leu,34是Ala或Pro,并且35是Ala或Asp;32是Leu,34是Ala或Pro,并且36是Ala;32是Leu,35是Ala或Asp,并且36是Ala;33是Ser或Asn,34是Ala或Pro,并且35是Ala或Asp;33是Ser或Asn,34是Ala或Pro,并且36是Ala;33是Ser或Asn,35是Ala或Asp,并且36是Ala;或34是Ala或Pro,35是Ala或Asp,并且36是Ala。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在该多肽的另一个方面中,对应以下位置的是:9是Gly,31是Asp或Glu,32是Leu,并且33是Ser或Asn;9是Gly,31是Asp或Glu,32是Leu,并且34是Ala或Pro;9是Gly,31是Asp或Glu,32是Leu,并且35是Ala或Asp;9是Gly,31是Asp或Glu,32是Leu,并且36是Ala;9是Gly,31是Asp或Glu,33是Ser或Asn,并且34是Ala或Pro;9是Gly,31是Asp或Glu,33是Ser或Asn,并且35是Ala或Asp;9是Gly,31是Asp或Glu,33是Ser或Asn,并且36是Ala;9是Gly,31是Asp或Glu,34是Ala或Pro,并且35是Ala或Asp;9是Gly,31是Asp或Glu,34是Ala或Pro,并且36是Ala;9是Gly,31是Asp或Glu,35是Ala或Asp,并且36是Ala;9是Gly,32是Leu,33是Ser或Asn,并且34是Ala或Pro;9是Gly,32是Leu,33是Ser或Asn,并且35是Ala或Asp;9是Gly,32是Leu,33是Ser或Asn,并且36是Ala;9是Gly,32是Leu,34是Ala或Pro,并且35是Ala或Asp;9是Gly,32是Leu,34是Ala或Pro,并且36是Ala;9是Gly,32是Leu,35是Ala或Asp,并且36是Ala;9是Gly,33是Ser或Asn,34是Ala或Pro,并且35是Ala或Asp;9是Gly,33是Ser或Asn,34是Ala或Pro,并且36是Ala;9是Gly,33是Ser或Asn,35是Ala或Asp,并且36是Ala;9是Gly,34是Ala或Pro,35是Ala或Asp,并且36是Ala;31是Asp或Glu,32是Leu,33是Ser或Asn,并且34是Ala或Pro;31是Asp或Glu,32是Leu,33是Ser或Asn,并且35是Ala或Asp;31是Asp或Glu,32是Leu,33是Ser或Asn,并且36是Ala;31是Asp或Glu,32是Leu,34是Ala或Pro,并且35是Ala或Asp;31是Asp或Glu,32是Leu,34是Ala或Pro,并且36是Ala;31是Asp或Glu,32是Leu,35是Ala或Asp,并且36是Ala;31是Asp或Glu,33是Ser或Asn,34是Ala或Pro,并且35是Ala或Asp;31是Asp或Glu,33是Ser或Asn,34是Ala或Pro,并且36是Ala;31是Asp或Glu,33是Ser或Asn,35是Ala或Asp,并且36是Ala;31是Asp或Glu,34是Ala或Pro,35是Ala或Asp,并且36是Ala;32是Leu,33是Ser或Asn,34是Ala或Pro,并且35是Ala或Asp;32是Leu,33是Ser或Asn,34是Ala或Pro,并且36是Ala;32是Leu,33是Ser或Asn,35是Ala或Asp,并且36是Ala;32是Leu,34是Ala或Pro,35是Ala或Asp,并且36是Ala;或33是Ser或Asn,34是Ala或Pro,35是Ala或Asp,并且36是Ala。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在该多肽的另一个方面中,对应以下位置的是:9是Gly,31是Asp或Glu,32是Leu,33是Ser或Asn,并且34是Ala或Pro;9是Gly,31是Asp或Glu,32是Leu,33是Ser或Asn,并且35是Ala或Asp;9是Gly,31是Asp或Glu,32是Leu,33是Ser或Asn,并且36是Ala;9是Gly,31是Asp或Glu,32是Leu,34是Ala或Pro,并且35是Ala或Asp;9是Gly,31是Asp或Glu,32是Leu,34是Ala或Pro,并且36是Ala;9是Gly,31是Asp或Glu,32是Leu,35是Ala或Asp,并且36是Ala;9是Gly,31是Asp或Glu,33是Ser或Asn,34是Ala或Pro,并且35是Ala或Asp;9是Gly,31是Asp或Glu,33是Ser或Asn,34是Ala或Pro,并且36是Ala;9是Gly,31是Asp或Glu,33是Ser或Asn,35是Ala或Asp,并且36是Ala;9是Gly,31是Asp或Glu,34是Ala或Pro,35是Ala或Asp,并且36是Ala;9是Gly,32是Leu,33是Ser或Asn,34是Ala或Pro,并且35是Ala或Asp;9是Gly,32是Leu,33是Ser或Asn,34是Ala或Pro,并且36是Ala;9是Gly,32是Leu,33是Ser或Asn,35是Ala或Asp,并且36是Ala;9是Gly,32是Leu,34是Ala或Pro,35是Ala或Asp,并且36是Ala;9是Gly,33是Ser或Asn,34是Ala或Pro,35是Ala或Asp,并且36是Ala;31是Asp或Glu,32是Leu,33是Ser或Asn,34是Ala或Pro,并且35是Ala或Asp;31是Asp或Glu,32是Leu,33是Ser或Asn,34是Ala或Pro,并且36是Ala;31是Asp或Glu,32是Leu,33是Ser或Asn,35是Ala或Asp,并且36是Ala;31是Asp或Glu,32是Leu,34是Ala或Pro,35是Ala或Asp,并且36是Ala;31是Asp或Glu,33是Ser或Asn,34是Ala或Pro,35是Ala或Asp,并且36是Ala;或32是Leu,33是Ser或Asn,34是Ala或Pro,35是Ala或Asp,并且36是Ala。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在该多肽的另一个方面中,对应以下位置的是:9是Gly,31是Asp或Glu,32是Leu,33是Ser或Asn,34是Ala或Pro,并且35是Ala或Asp;9是Gly,31是Asp或Glu,32是Leu,33是Ser或Asn,34是Ala或Pro,并且36是Ala;9是Gly,31是Asp或Glu,32是Leu,33是Ser或Asn,35是Ala或Asp,并且36是Ala;9是Gly,31是Asp或Glu,32是Leu,34是Ala或Pro,35是Ala或Asp,并且36是Ala;9是Gly,31是Asp或Glu,33是Ser或Asn,34是Ala或Pro,35是Ala或Asp,并且36是Ala;9是Gly,32是Leu,33是Ser或Asn,34是Ala或Pro,35是Ala或Asp,并且36是Ala;或31是Asp或Glu,32是Leu,33是Ser或Asn,34是Ala或Pro,35是Ala或Asp,并且36是Ala。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在该多肽的另一个方面中,对应于SEQ ID NO:2的以下位置的是:9是Gly,31是Asp或Glu,32是Leu,33是Ser或Asn,34是Ala或Pro,35是Ala或Asp并且36是Ala。在一些实施例中,该多肽在对应于位置10的位置处包括缺失。
在这些方面的任何中,与NADP(H)相比,该多肽对NAD(H)具有增加的特异性。在一些实施例中,与NADP(H)相比,该多肽具有大于2倍,例如大于5倍、10倍、20倍、50倍、100倍、200倍、500倍、或1000倍的针对NAD(H)的特异性。
变体
在一些方面中,这些多肽被描述为在对应于SEQ ID NO:2的任何位置9、31、32、33、34、35以及36中的一个或多个(例如,两个、若干个)位置处包括取代的亲本3-HPDH的3-HPDH变体,其中这些变体具有3-HPDH活性。例如,这些变体可以包括取代T/S9G、G/A31D/E、R32L、R33S/N、L/K/Q34A/P、E35D/A、以及K/R36A中的一种或多种(例如,两种、若干种)。在一些方面中,这些变体在对应于位置10的位置处包括缺失。在一些方面中,分离这些变体。
在一个实施例中,该变体与亲本3-HPDH具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但小于100%的序列一致性。
在一个实施例中,该变体与SEQ ID NO:2具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列一致性。
在另一个实施例中,该变体与SEQ ID NO:4具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列一致性。
在另一个实施例中,该变体与SEQ ID NO:6具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列一致性。
在一个方面中,在此描述的变体中的改变(取代、缺失、和/或插入)的数目是1-20,例如1-10和1-5,如1个、2个、3个、4个、5个、6个、7个、8个、9个或10个改变。
在一个方面中,该变体在对应于SEQ ID NO:2的位置9的位置处包含取代或由其组成。例如,对应于位置9处的氨基酸可以被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代。在一个方面中,对应于位置9处的氨基酸是Gly。在另一个方面中,该变体包括取代T/S9G或由其组成,例如包括SEQ ID NO:2的亲本的取代T9G、或包括SEQ ID NO:4或6的亲本的S9G。
在一个方面中,该变体在对应于SEQ ID NO:2的位置31的位置处包含取代或由其组成。例如,对应于位置31处的氨基酸可以被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代。在一个方面中,对应于位置31处的氨基酸是Asp或Glu。在另一个方面中,该变体包括取代G/A31D/E或由其组成,例如包括SEQ ID NO:2的亲本的取代G31D/E、或包括SEQ ID NO:4或6的亲本的A31D/E。
在一个方面中,该变体在对应于SEQ ID NO:2的位置32的位置处包含取代或由其组成。例如,对应于位置32处的氨基酸可以被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代。在一个方面中,对应于位置32处的氨基酸是Leu。在另一个方面中,该变体包括取代R32L或由其组成,例如包括SEQ ID NO:2、4、或6的亲本的取代R32L。
在一个方面中,该变体在对应于SEQ ID NO:2的位置33的位置处包含取代或由其组成。例如,对应于位置33处的氨基酸可以被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代。在一个方面中,对应于位置33处的氨基酸是Ser或Asn。在另一个方面中,该变体包括取代R33S/N或由其组成,例如包括SEQID NO:2、4、或6的亲本的取代R33S/N。
在一个方面中,该变体在对应于SEQ ID NO:2的位置34的位置处包含取代或由其组成。例如,对应于位置34处的氨基酸可以被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代。在一个方面中,对应于位置34处的氨基酸是Ala或Pro。在另一个方面中,该变体包括取代L/K/Q34A/P或由其组成,例如包括SEQ ID NO:2的亲本的取代Q34A/P、包括SEQ ID NO:2的亲本的KQ34A/P、或包括SEQ ID NO:6的亲本的L34A/P。
在一个方面中,该变体在对应于SEQ ID NO:2的位置35的位置处包含取代或由其组成。例如,对应于位置35处的氨基酸可以被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代。在一个方面中,对应于位置35处的氨基酸是Ala或Asp。在另一个方面中,该变体包括取代E35D/A或由其组成,例如包括SEQID NO:2、4、或6的亲本的取代E35D/A。
在一个方面中,该变体在对应于SEQ ID NO:2的位置36的位置处包含取代或由其组成。例如,对应于位置36处的氨基酸可以被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代。在一个方面中,对应于位置36处的氨基酸是Ala。在另一个方面中,该变体包括取代K/R36A或由其组成,例如包括SEQ IDNO:2的亲本的取代R36A、或包括SEQ ID NO:4或6的亲本的K36A。
在另一个方面中,该变体在对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36的任何两个位置处包括取代或由其组成。例如,该变体可以在对应于以下位置处包括两个取代或由其组成:9和31;9和32;9和33;9和34;9和35;9和36;31和32;31和33;31和34;31和35;31和36;32和33;32和34;32和35;32和36;33和34;33和35;33和36;34和35;34和36;或35和36,例如以上描述的那些。在一个方面中,该变体包括以下取代或由其组成:T/S9G和G/A31D/E;T/S9G和R32L;T/S9G和R33S/N;T/S9G和L/K/Q34A/P;T/S9G和E35D/A;T/S9G和K/R36A;G/A31D/E和R32L;G/A31D/E和R33S/N;G/A31D/E和L/K/Q34A/P;G/A31D/E和E35D/A;G/A31D/E和K/R36A;R32L和R33S/N;R32L和L/K/Q34A/P;R32L和E35D/A;R32L和K/R36A;R33S/N和L/K/Q34A/P;R33S/N和E35D/A;R33S/N和K/R36A;L/K/Q34A/P和E35D/A;L/K/Q34A/P和K/R36A;或E35D/A和K/R36A。在这些方面的任何中,该变体在对应于SEQ ID NO:2的位置10的位置处可以进一步包括缺失。
在另一个方面中,该变体在对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36的任何三个位置处包括取代或由其组成。例如,该变体在对应于以下位置处可以包括三个取代或由其组成:9、31、和32;9、31、和33;9、31、和34;9、31、和35;9、31、和36;9、32、和33;9、32、和34;9、32、和35;9、32、和36;9、33、和34;9、33、和35;9、33、和36;9、34、和35;9、34、和36;9、35、和36;31、32、和33;31、32、和34;31、32、和35;31、32、和36;31、33、和34;31、33、和35;31、33、和36;31、34、和35;31、34、和36;31、35、和36;32、33、和34;32、33、和35;32、33、和36;32、34、和35;32、34、和36;32、35、和36;33、34、和35;33、34、和36;33、35、和36;或34、35、和36,例如以上描述的那些。在一个方面中,该变体包括以下取代或由其组成:T/S9G、G/A31D/E、和R32L;T/S9G、G/A31D/E、和R33S/N;T/S9G、G/A31D/E、和L/K/Q34A/P;T/S9G、G/A31D/E、和E35D/A;T/S9G、G/A31D/E、和K/R36A;T/S9G、R32L、和R33S/N;T/S9G、R32L、和L/K/Q34A/P;T/S9G、R32L、和E35D/A;T/S9G、R32L、和K/R36A;T/S9G、R33S/N、和L/K/Q34A/P;T/S9G、R33S/N、和E35D/A;T/S9G、R33S/N、和K/R36A;T/S9G、L/K/Q34A/P、和E35D/A;T/S9G、L/K/Q34A/P、和K/R36A;T/S9G、E35D/A、和K/R36A;G/A31D/E、R32L、和R33S/N;G/A31D/E、R32L、和L/K/Q34A/P;G/A31D/E、R32L、和E35D/A;G/A31D/E、R32L、和K/R36A;G/A31D/E、R33S/N、和L/K/Q34A/P;G/A31D/E、R33S/N、和E35D/A;G/A31D/E、R33S/N、和K/R36A;G/A31D/E、L/K/Q34A/P、和E35D/A;G/A31D/E、L/K/Q34A/P、和K/R36A;G/A31D/E、E35D/A、和K/R36A;R32L、R33S/N、和L/K/Q34A/P;R32L、R33S/N、和E35D/A;R32L、R33S/N、和K/R36A;R32L、L/K/Q34A/P、和E35D/A;R32L、L/K/Q34A/P、和K/R36A;R32L、E35D/A、和K/R36A;R33S/N、L/K/Q34A/P、和E35D/A;R33S/N、L/K/Q34A/P、和K/R36A;R33S/N、E35D/A、和K/R36A;或L/K/Q34A/P、E35D/A、和K/R36A。在这些方面的任何中,该变体在对应于SEQ ID NO:2的位置10的位置处可以进一步包括缺失。
在另一个方面中,该变体在对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36的任何四个位置处包括取代或由其组成。例如,该变体可以包括对应于以下位置的四个取代或由其组成:9、31、32、以及33;9、31、32、以及34;9、31、32、以及35;9、31、32、以及36;9、31、33、以及34;9、31、33、以及35;9、31、33、以及36;9、31、34、以及35;9、31、34、以及36;9、31、35、以及36;9、32、33、以及34;9、32、33、以及35;9、32、33、以及36;9、32、34、以及35;9、32、34、以及36;9、32、35、以及36;9、33、34、以及35;9、33、34、以及36;9、33、35、以及36;9、34、35、以及36;31、32、33、以及34;31、32、33、以及35;31、32、33、以及36;31、32、34、以及35;31、32、34、以及36;31、32、35、以及36;31、33、34、以及35;31、33、34、以及36;31、33、35、以及36;31、34、35、以及36;32、33、34、以及35;32、33、34、以及36;32、33、35、以及36;32、34、35、以及36;或33、34、35、以及36,例如以上描述的那些。在一个方面中,该变体包括以下取代或由其组成:T/S9G、G/A31D/E、R32L、以及R33S/N;T/S9G、G/A31D/E、R32L、以及L/K/Q34A/P;T/S9G、G/A31D/E、R32L、以及E35D/A;T/S9G、G/A31D/E、R32L、以及K/R36A;T/S9G、G/A31D/E、R33S/N、以及L/K/Q34A/P;T/S9G、G/A31D/E、R33S/N、以及E35D/A;T/S9G、G/A31D/E、R33S/N、以及K/R36A;T/S9G、G/A31D/E、L/K/Q34A/P、以及E35D/A;T/S9G、G/A31D/E、L/K/Q34A/P、以及K/R36A;T/S9G、G/A31D/E、E35D/A、以及K/R36A;T/S9G、R32L、R33S/N、以及L/K/Q34A/P;T/S9G、R32L、R33S/N、以及E35D/A;T/S9G、R32L、R33S/N、以及K/R36A;T/S9G、R32L、L/K/Q34A/P、以及E35D/A;T/S9G、R32L、L/K/Q34A/P、以及K/R36A;T/S9G、R32L、E35D/A、以及K/R36A;T/S9G、R33S/N、L/K/Q34A/P、以及E35D/A;T/S9G、R33S/N、L/K/Q34A/P、以及K/R36A;T/S9G、R33S/N、E35D/A、以及K/R36A;T/S9G、L/K/Q34A/P、E35D/A、以及K/R36A;G/A31D/E、R32L、R33S/N、以及L/K/Q34A/P;G/A31D/E、R32L、R33S/N、以及E35D/A;G/A31D/E、R32L、R33S/N、以及K/R36A;G/A31D/E、R32L、L/K/Q34A/P、以及E35D/A;G/A31D/E、R32L、L/K/Q34A/P、以及K/R36A;G/A31D/E、R32L、E35D/A、以及K/R36A;G/A31D/E、R33S/N、L/K/Q34A/P、以及E35D/A;G/A31D/E、R33S/N、L/K/Q34A/P、以及K/R36A;G/A31D/E、R33S/N、E35D/A、以及K/R36A;G/A31D/E、L/K/Q34A/P、E35D/A、以及K/R36A;R32L、R33S/N、L/K/Q34A/P、以及E35D/A;R32L、R33S/N、L/K/Q34A/P、以及K/R36A;R32L、R33S/N、E35D/A、以及K/R36A;R32L、L/K/Q34A/P、E35D/A、以及K/R36A;或R33S/N、L/K/Q34A/P、E35D/A、以及K/R36A。在这些方面的任何方面中,该变体在对应于SEQ ID NO:2的位置10的位置处可以进一步包括缺失。
在另一个方面中,该变体在对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36的任何五个位置处包括取代或由其组成。例如,该变体可以包括对应于以下位置的五个取代或由其组成:9、31、32、33、以及34;9、31、32、33、以及35;9、31、32、33、以及36;9、31、32、34、以及35;9、31、32、34、以及36;9、31、32、35、以及36;9、31、33、34、以及35;9、31、33、34、以及36;9、31、33、35、以及36;9、31、34、35、以及36;9、32、33、34、以及35;9、32、33、34、以及36;9、32、33、35、以及36;9、32、34、35、以及36;9、33、34、35、以及36;31、32、33、34、以及35;31、32、33、34、以及36;31、32、33、35、以及36;31、32、34、35、以及36;31、33、34、35、以及36;或32、33、34、35、以及36,例如以上描述的那些。在一个方面中,该变体包括以下取代或由其组成:T/S9G、G/A31D/E、R32L、R33S/N、以及L/K/Q34A/P;T/S9G、G/A31D/E、R32L、R33S/N、以及E35D/A;T/S9G、G/A31D/E、R32L、R33S/N、以及K/R36A;T/S9G、G/A31D/E、R32L、L/K/Q34A/P、以及E35D/A;T/S9G、G/A31D/E、R32L、L/K/Q34A/P、以及K/R36A;T/S9G、G/A31D/E、R32L、E35D/A、以及K/R36A;T/S9G、G/A31D/E、R33S/N、L/K/Q34A/P、以及E35D/A;T/S9G、G/A31D/E、R33S/N、L/K/Q34A/P、以及K/R36A;T/S9G、G/A31D/E、R33S/N、E35D/A、以及K/R36A;T/S9G、G/A31D/E、L/K/Q34A/P、E35D/A、以及K/R36A;T/S9G、R32L、R33S/N、L/K/Q34A/P、以及E35D/A;T/S9G、R32L、R33S/N、L/K/Q34A/P、以及K/R36A;T/S9G、R32L、R33S/N、E35D/A、以及K/R36A;T/S9G、R32L、L/K/Q34A/P、E35D/A、以及K/R36A;T/S9G、R33S/N、L/K/Q34A/P、E35D/A、以及K/R36A;G/A31D/E、R32L、R33S/N、L/K/Q34A/P、以及E35D/A;G/A31D/E、R32L、R33S/N、L/K/Q34A/P、以及K/R36A;G/A31D/E、R32L、R33S/N、E35D/A、以及K/R36A;G/A31D/E、R32L、L/K/Q34A/P、E35D/A、以及K/R36A;G/A31D/E、R33S/N、L/K/Q34A/P、E35D/A、以及K/R36A;或R32L、R33S/N、L/K/Q34A/P、E35D/A、以及K/R36A。在这些方面的任何中,该变体在对应于SEQ IDNO:2的位置10的位置处可以进一步包括缺失。
在另一个方面中,该变体在对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36的任何六个位置处包括取代或由其组成。例如,该变体可以包括对应于以下位置的六个取代或由其组成:9、31、32、33、34、以及35;9、31、32、33、34、以及36;9、31、32、33、35、以及36;9、31、32、34、35、以及36;9、31、33、34、35、以及36;9、32、33、34、35、以及36;或31、32、33、34、35、以及36,例如以上描述的那些。在一个方面中,该变体包括以下取代或由其组成:T/S9G、G/A31D/E、R32L、R33S/N、L/K/Q34A/P、以及E35D/A;T/S9G、G/A31D/E、R32L、R33S/N、L/K/Q34A/P、以及K/R36A;T/S9G、G/A31D/E、R32L、R33S/N、E35D/A、以及K/R36A;T/S9G、G/A31D/E、R32L、L/K/Q34A/P、E35D/A、以及K/R36A;T/S9G、G/A31D/E、R33S/N、L/K/Q34A/P、E35D/A、以及K/R36A;T/S9G、R32L、R33S/N、L/K/Q34A/P、E35D/A、以及K/R36A;或G/A31D/E、R32L、R33S/N、L/K/Q34A/P、E35D/A、以及K/R36A。在这些方面的任何中,该变体在对应于SEQ IDNO:2的位置10的位置处可以进一步包括缺失。
在另一个方面中,该变体在对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36的所有七个位置处包括取代或由其组成,例如以上描述的那些。在一个方面中,该变体包括取代T/S9G、G/A31D/E、R32L、R33S/N、L/K/Q34A/P、E35D/A以及K/R36A或由其组成。在这些方面的任一中,该变体在对应于SEQ ID NO:2的位置10的位置处可以进一步包括缺失。
这些氨基酸变化可以具有微小性质,即,不会显著地影响蛋白质的折叠和/或活性的保守氨基酸取代或插入;典型地1-30个氨基酸的较小缺失;较小的氨基或羧基末端延伸,如氨基末端的甲硫氨酸残基;至多20-25个残基的较小连接子肽;或便于通过改变净电荷或另一种功能来纯化的较小延伸,如聚组氨酸序列(tract)、抗原表位或结合结构域。
保守取代的实例是在下组的范围内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。总体上不会改变特异性活性的氨基酸取代是本领域已知的,并且例如由H.Neurath(诺伊拉特)和R.L.Hill(希尔)1979年描述于The Proteins(《蛋白质》)中,Academic Press(学术出版社),纽约。常见取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。
可替代地,如在此所描述,某些氨基酸变化具有这样一种性质使得多肽的物理-化学特性被改变。例如,对应于SEQ ID NO:2的任何位置9、31、32、33、34、35以及36的位置处的氨基酸变化(以及在位置10处的可任选的缺失)可以改变辅因子特异性,例如与NADP(H)相比,增加对NAD(H)的特异性。
可以根据本领域已知程序来鉴定多肽中的必需氨基酸,例如定点诱变或丙氨酸扫描诱变(Cunningham(坎宁安)和Wells(威尔斯),1989,Science(科学)244:1081-1085)。在后一种技术中,在分子中的每个残基处引入单一丙氨酸突变,并且测试所得突变分子的3-HPDH活性以鉴别对该分子的活性关键的氨基酸残基。还参看Hilton(希尔顿)等人,1996,《生物化学杂志》271:4699-4708。活性位点或其他生物学相互作用也可以通过对结构进行物理学分析来进行确定,如通过以下技术例如核磁共振、结晶学、电子衍射、或光亲和标记,与假定接触位点氨基酸的突变向结合。参看例如de Vos(德沃斯)等人,1992,《科学》255:306-312;Smith(史密斯)等人,1992,《分子生物学杂志》224:899-904;Wlodaver(沃尔达韦尔)等人,1992,《欧洲生物化学学会联盟通讯》(FEBS Lett.)309:59-64。还可以从与相关多肽的比对推断鉴别必需氨基酸。
例如,可以通过描述于Yamazawa(山泽)等人,2011,《生物化学杂志》149(6):701-712中的对结晶学数据的分析来鉴别SEQ ID NO:2的必需氨基酸(参见全球蛋白质数据库(Worldwide Protein Data Bank);http://www.wwpdb.org;PDB代码:3ASU和3ASV),其中对活性位点结构进行鉴别,包括在位置106、134、147、以及151处的催化四联体。其中基于定点诱变研究来鉴别其中对酶活性而言重要的另外的氨基酸残基。类似地,通过可获得的结晶学数据对SEQ ID NO:6的必需氨基酸进行鉴别(参见全球蛋白质数据库;http://www.wwpdb.org;PDB代码:3RKU)。如图2所示,可以从与SEQ ID NO:2和SEQ ID NO:6的比对推断出SEQ ID NO:4的对应必需氨基酸的一致性。
在一些方面中,这些变体由至少185个氨基酸,例如至少200个、210个、220个、230个、或240个氨基酸组成。
在一些实施例中,与NADP(H)相比,该变体对NAD(H)具有增加的特异性。在一些实施例中,与NADP(H)相比,该变体具有大于2倍,例如大于5倍、10倍、20倍、50倍、100倍、200倍、500倍、或1000倍的针对NAD(H)的特异性。
在一些实施例中,与亲本相比,该变体具有一种或多种改进的特性,例如改进的催化效率、改进的催化速率、改进的化学稳定性、改进的氧化稳定性、改进的pH活性、改进的pH稳定性、改进的比活性、在存储条件下的改进的稳定性、改进的底物结合、改进的底物裂解、改进的底物特异性、改进的底物稳定性、改进的表面特性、改进的热活性、和/或改进的热稳定性。
亲本3-羟基丙酸脱氢酶
亲本3-HPDH可以是(a)一种与SEQ ID NO:2、4、或6具有至少60%序列一致性的多肽;(b)一种由以下多核苷酸编码的多肽,该多核苷酸在低严谨度条件下与SEQ ID NO:1、3、或5的全长互补链杂交;或(c)一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、3、或5具有至少60%的序列一致性。
在一个方面中,该亲本3-HPDH与SEQ ID NO:2具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性。在一个方面中,该亲本的氨基酸序列与SEQ ID NO:2多达10个氨基酸,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个不同。在另一个方面中,该亲本包括SEQ ID NO:2的氨基酸序列或由其组成。在另一个实施例中,该亲本是SEQ ID NO:2的等位基因变体。在另一个方面中,该亲本是SEQ ID NO:2的一个片段。
在另一个方面中,该亲本3-HPDH与SEQ ID NO:4具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性。在一个方面中,该亲本的氨基酸序列与SEQ ID NO:4多达10个氨基酸,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个不同。在另一个方面中,该亲本包括SEQ ID NO:4的氨基酸序列或由其组成。在另一个实施例中,该亲本是SEQ ID NO:4的等位基因变体。在另一个方面中,该亲本是SEQ ID NO:4的一个片段。
在另一个方面中,该亲本3-HPDH与SEQ ID NO:6具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性。在一个方面中,该亲本的氨基酸序列与SEQ ID NO:6多达10个氨基酸,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个不同。在另一个方面中,该亲本包括SEQ ID NO:6的氨基酸序列或由其组成。在另一个实施例中,该亲本是SEQ ID NO:6的等位基因变体。在另一个方面中,该亲本是SEQ ID NO:6的一个片段。
在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸在至少低严谨度条件下,例如中严谨度条件下、中-高严谨度条件下、高严谨度条件下、或非常高严谨度条件下与SEQ ID NO:1的全长互补链杂交(Sambrook(萨拉布鲁克)等人,1989,Molecular Cloning:ALaboratory Manual(分子克隆实验指南),第二版,Cold Spring Harbor(冷泉港),纽约)。在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸在至少低严谨度条件下,例如中严谨度条件下、中-高严谨度条件下、高严谨度条件下、或非常高严谨度条件下与SEQ IDNO:3的全长互补链杂交。在另一个方面中,该亲本由以下多核苷酸编码,该多核苷酸在至少低严谨度条件下,例如中严谨度条件下、中-高严谨度条件下、高严谨度条件下、或非常高严谨度条件下与SEQ ID NO:5的全长互补链杂交。
可以使用SEQ ID NO:1、3、5的多核苷酸或其子序列、连同SEQ ID NO:2、4、6的多肽或其片段来设计核酸探针以根据本领域熟知的方法来鉴别并克隆编码来自不同属或种类的菌株的亲本的DNA。具体地说,可以使用这类探针,遵循DNA印迹程序,与感兴趣细胞的基因组DNA或cDNA杂交,以便鉴别并分离出其中的相应基因。这类探针可以明显地短于完整序列,但应当为至少15个,例如至少25个、至少35个或至少70个核苷酸长。优选地,该核酸探针是至少100个核苷酸长,例如至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸或至少900个核苷酸长。DNA和RNA探针都可使用。典型地将探针进行标记,用于检测相应的基因(例如,用32P、3H、35S、生物素、或抗生物素蛋白)。
可以针对与上文所述的探针杂交并编码一个亲本的DNA,来筛选由这类其他菌株制备的一个基因组DNA或cDNA库。来自这类其他菌株的基因组或其他DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或其他分离技术来分离。来自文库的DNA或分离的DNA可转移到并固定在硝酸纤维素或其他合适的载体材料上。为了鉴别与SEQ ID NO:1、3、5或其子序列杂交的克隆或DNA,将该载体材料用于DNA印迹中。
在一个方面中,该核酸探针是一种具有SEQ ID NO:1、3、或5的多核苷酸。在另一个方面中,该核酸探针是以下多核苷酸,该多核苷酸编码SEQ ID NO:2、4、6的多肽;或其片段。
在另一个实施例中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:1具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。在另一个实施例中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:3具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。在另一个实施例中,该亲本由以下多核苷酸编码,该多核苷酸与SEQ ID NO:5具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。
多肽可以是杂合多肽,其中一个多肽的区域融合在另一多肽的区域的N末端或C末端。
该亲本可以是融合多肽或可切割的融合多肽,其中另一多肽融合在本发明的多肽的N-末端或C-末端。通过将编码另一多肽的多核苷酸融合到本发明的多核苷酸而产生融合多肽。用于产生融合多肽的技术在本领域是已知的,并包括连接编码多肽的编码序列,这样使得它们在框内并且融合多肽的表达处于相同的一个或多个启动子和终止子的控制下。还可以使用内含肽技术构建融合多肽,其中融合多肽在翻译后生成(Cooper(库珀)等人,1993,EMBO J.(《欧洲分子生物学组织杂志》)12:2575-2583;Dawson(道森)等人,1994,Science(《科学》)266:776-779)。
融合多肽可以进一步包括两个多肽之间的一个切割位点。在融合蛋白分泌之后,该位点被切割,从而释放出这两个多肽。切割位点的实例包括,但不局限于在以下文献中披露的位点:Martin(马丁)等人,2003,J.Ind.Microbiol.Biotechnol.(《工程微生物和生物技术杂志》)3:568-576;Svetina (斯瓦蒂娜)等人,2000,J.Biotechnol.(《生物技术杂志》)76:245-251;Rasmussen-Wilson(托斯马森-威尔逊)等人,1997,Appl.Environ.Microbiol(《应用与环境微生物学》),63:3488-3493;Ward(沃德)等人,1995,Biotechnology(《生物技术》)13:498-503;以及Contreras(孔特雷拉斯)等人,1991,生物技术9:378-381;Eaton(伊顿)等人,1986,Biochemistry(生物化学)25:505-512;Collins-Racie(柯林斯瑞思)等人,1995,生物技术13:982-987;Carter(卡特)等人,1989,Proteins:Structure,Function,andGenetics(蛋白:结构、功能以及遗传学)6:240-248;以及Stevens(史蒂文斯),2003,DrugDiscovery World(《世界药物发现》)4:35-48。
该亲本可以从任何属的微生物中获得。出于本发明的目的,如在此结合一种给定的来源使用的术语“从...中获得”应意指由一种多核苷酸编码的亲本是由该来源或者由其中已经插入来自该来源的多核苷酸的一种菌株产生。在一个方面,该亲本是胞外分泌的。
该亲本可以是细菌3-HPDH。例如,该亲本可以是革兰氏阳性菌多肽,例如芽孢杆菌属、梭菌属(Clostridium)、肠球菌属、土芽孢杆菌属、乳酸杆菌属、乳球菌属、海洋芽胞杆菌属、葡萄球菌属、链球菌属、或链霉菌属3-HPDH,或革兰氏阴性菌多肽,例如弯曲杆菌属、大肠杆菌、黄质菌属、梭杆菌属(Fusobacterium)、螺杆菌属、泥杆菌属、奈瑟菌属、假单胞菌属、沙门菌属、或脲原体属3-HPDH。
在一个方面,该亲本是嗜碱芽孢杆菌、解淀粉芽孢杆菌、短杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌3-HPDH。
在另一个方面中,该亲本是马链球菌、化脓链球菌、乳房链球菌、或马链球菌兽疫亚种3-HPDH。
在另一个方面中,该亲本是不产色链霉菌、阿维链霉菌、天蓝色链霉菌、灰色链霉菌、或变铅青链霉菌3-HPDH。
该亲本可以是真菌3-HPDH。例如,该亲本可以是酵母3-HPDH,例如假丝酵母属、克鲁维酵母菌属、毕赤酵母属、酵母菌属、裂殖酵母属、亚罗酵母属或伊萨酵母属3-HPDH;或丝状真菌3-HPDH,例如支顶孢属、伞蕈属、支链孢属、曲霉属、短梗霉属、葡萄座腔菌属(Botryospaeria)、拟蜡菌属、毛喙壳属、金孢子菌属、麦角菌属、旋孢腔菌属、拟鬼伞属、家白蚁属、棒囊孢壳菌属、隐丛壳属、隐球酵母属、壳色单隔孢属、黑耳属、网孢菌属(Filibasidium)、镰刀菌属、赤霉菌属、全鞭毛虫属、腐质霉属、耙齿菌属、香菇属、小球腔菌属、大毁壳属、马兰诺菌属(Melanocarpus)、亚灰树花菌属(Meripilus)、毛霉菌属、蚀丝霉属、新美鞭菌属(Neocallimastix)、脉孢菌属、拟青霉属、青霉属、平革菌属、梨囊鞭菌属、Poitrasia、假黑盘菌属、假披发虫属(Pseudotrichonympha)、根毛霉属、裂褶菌属、柱顶孢霉属、踝节菌属、嗜热子囊菌属(Thermoascus)、梭孢壳菌属、弯颈霉属、木霉属、长毛盘菌属(Trichophaea)、轮枝孢属、小包脚菇属、或炭角菌属3-HPDH。
在另一个方面中,该亲本是卡氏酵母(Saccharomyces carlsbergensis)、酿酒酵母、糖化酵母、道格拉氏酵母(Saccharomyces douglasii)、克鲁维酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomyces norbensis)、或卵形酵母(Saccharomycesoviformis)3-HPDH。
在另一个方面中,该亲本是解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、拉克淖金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporiummerdarium)、毡金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、带纹金孢子菌(Chrysosporium zonatum)、杆孢状镰孢、禾谷镰孢、库威镰孢、黄色镰刀菌、禾谷镰刀菌、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰刀菌、多枝镰孢、粉红镰孢菌、接骨木镰孢、肤色镰孢、拟分枝孢镰刀菌、硫色镰孢、圆镰孢、拟丝孢镰刀菌、镶片镰孢菌、灰腐质霉、特异腐质霉、疏棉状腐质霉、白囊耙齿菌、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉菌、产紫青霉、黄孢原毛平革菌、无色梭孢壳、成层梭孢壳菌(Thielavia albomyces)、白毛梭孢壳菌(Thielavia albopilosa)、澳洲梭孢壳、Thielavia fimeti、小孢梭孢壳、卵孢梭孢壳、多梭孢壳菌(Thielavia peruviana)、毛梭孢壳、瘤孢梭孢壳、耐热梭孢壳、太瑞斯梭孢壳霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉3-HPDH。
在一个方面中,该亲本3-HPDH来自大肠杆菌,例如SEQ ID NO:2的大肠杆菌3-HPDH。在另一个方面中,该亲本3-HPDH来自伊萨酵母属,例如SEQ ID NO:4的东方伊萨酵母(Issatchenkia orientalis)3-HPDH。在另一个方面中,该亲本3-HPDH来自酵母属,例如SEQID NO:6的酿酒酵母3-HPDH。
将理解的是,对于上述物种而言,本发明涵盖完全阶段状态和不完全状况两者、以及其他分类学等效物,例如无性型,无论它们被已知的种类名称。本领域普通技术人员将容易地识别鉴定适当等效物。
公众在许多培养物保藏中心易于可获得这些种类的菌株,如美国典型培养物保藏中心(ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung von Mikroorganismen undZellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(Centraalbureau VoorSchimmelcultures,CBS)及美国农业研究菌种保藏中心南方地区研究中心(NRRL)。
该亲本可以从其他来源鉴别并获得,这些其他来源包括从自然界(例如,土壤、堆肥、水等)分离的微生物或者使用上述探针直接从天然材料(例如,土壤、堆肥、水等)获得的DNA样品。用于直接地从天然生活环境分离微生物和DNA的技术是本领域中众所周知的。然后可以通过类似地筛选另一种微生物的一个基因组DNA或cDNA库或混合的DNA样品来获得编码一个亲本的一种多核苷酸。一旦已经用一个或多个探针检测到编码一个亲本的一种多核苷酸,则可以通过利用对本领域的普通技术人员来说已知的技术来分离或克隆该多核苷酸(参见,例如上文的萨拉布鲁克等人,1989)。
变体的制备
还描述了用于获得具有3-HPDH活性的变体的方法,这些方法包括:(a)在亲本3-HPDH中对应于SEQ ID NO:2的位置9、31、32、33、34、35、以及36中的一个或多个(例如,两个、若干个)位置处引入取代;并且(b)回收该变体。
可以使用本领域已知的任何诱变程序来制备这些变体,例如定点诱变、合成基因构建、半合成基因构建、随机诱变、改组、等。
定点诱变是其中在编码该亲本的多核苷酸内的一个或多个限定的位点处引入一个或多个(例如,若干个)突变的一种技术。
通过涉及含有所希望的突变的寡核苷酸引物的使用的PCR可以体外实现定点诱变。还可以通过以下方式在体外进行定点诱变:涉及由一种限制性内切酶在包括编码该亲本的多核苷酸的质粒的一个位点处进行切割的盒式诱变,并且随后连接一种包含该多核苷酸中的突变的寡核苷酸。通常,消化该质粒与该寡核苷酸的限制性内切酶是相同的,以允许该质粒的粘性末端以及插入片段彼此连接。参见,例如Scherer(谢雷尔)和Davis(戴维斯),1979,Proc.Natl.Acad.Sci.USA(美国国家科学院院刊)76:4949-4955;以及Barton(巴顿)等人,1990,《核酸研究》,18:7349-4966。
还可以通过本领域已知的方法体内实现定点诱变。参见,例如美国专利申请公开号2004/0171154;斯托西(Storici)等人,2001,Nature Biotechnol.(《自然生物技术》)19:773-776;Kren(卡伦)等人,1998,Nat.Med.(《自然医学》)4:285-290;以及Calissano(卡利萨诺)和Macino(马奇诺),1996,Fungal Genet.Newslett.(《真菌遗传学通讯》)43:15-16。
可以使用任何定点诱变程序来制备在此描述的这些变体。例如,存在许多可以使用的商品化的可获得的试剂盒。
合成基因构建需要体外合成一种设计的多核苷酸分子以编码一种所感兴趣的多肽。可以利用多种技术进行基因合成,例如由Tian(田)等人(2004,自然432:1050-1054)描述的基于多重微芯片的技术以及其中在光可编程的微流体芯片上合成并组装寡核苷酸的类似技术。
可以做出单个或多个氨基酸取代、缺失和/或插入并且使用已知的诱变、重组和/或改组方法进行测试,随后进行有关筛选程序,如Reidhaar-Olson(瑞达尔-奥尔逊)和Sauer(索尔),1988,Science(科学,241:53-57;Bowie(鲍威)和Sauer(索尔),1989,Proc.Natl.Acad.Sci.USA(美国科学院院刊),86:2152-2156;WO95/17413或WO95/22625所披露的那些。可以使用的其他方法包括:易错PCR、噬菌体展示(例如,Lowman(洛曼)等人,1991,生物化学30:10832-10837;美国专利号5,223,409;WO92/06204)以及定区诱变(Derbyshire(德比希尔)等人,1986,Gene(《基因》)46:145;Ner(内尔)等人,1988,DNA7:127)。
诱变/改组方法可以与高通量自动筛选方法组合,以检测由宿主细胞表达的克隆的经诱变处理的多肽的活性(Ness(内斯)等人,1999,Nature Biotechnology(《自然生物技术》)17:893-896)。编码活性多肽的诱变的DNA分子可以回收自宿主细胞,并且使用本领域的标准方法对其进行迅速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。
通过组合合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的多个方面来实现半合成基因构建。半合成构建典型地是,利用合成的多核苷酸片段的一个过程结合PCR技术。因此,基因的限定区域可以从头合成,而其他区域可以使用位点特异性诱变引物来扩增,而还有其他区域可以经受易错PCR或非易错PCR扩增。然后可以对多核苷酸子序列进行改组。
多核苷酸,核酸构建体,以及表达载体
在一个方面中,是编码在此描述的多肽和变体的多核苷酸(例如,分离的多核苷酸),连同包括这些多核苷酸的核酸构建体和表达载体。
这些核酸构建体包括一种编码在此描述的多肽或变体、可操作地连接至一个或多个控制序列的多核苷酸,该一个或多个控制序列在与这些控制序列相容的条件下指导该编码序列在一种适合的宿主细胞中的表达。
可以按多种方式来操纵该多核苷酸以提供一种变体的表达。取决于表达载体,在其插入载体以前操纵多核苷酸可以是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
控制序列可以是一个启动子,即由一个宿主细胞识别用于表达该多核苷酸的一种多核苷酸。启动子包含介导该变体的表达的转录控制序列。该启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括突变体、截短的及杂合启动子,并且可以是由编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
在细菌宿主细胞中,适合指导本发明的核酸构建体转录的启动子的实例是获得自以下各项的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌麦芽淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏芸金芽孢杆菌cryIIIA基因(Agaisse(阿盖斯)和Lereclus(里瑞克拉斯),1994,Molecular Microbiology(《分子微生物学》)13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon(埃贡)等人,1988,Gene(《基因》)69:301-315),天蓝色链霉菌琼脂酶基因(dagA)、和原核β-内酰胺酶基因(Villa(维拉)-Kamaroff(卡玛诺夫)等人,1978,Proc.Natl.Acad.Sci.USA(美国国家科学院院刊)75:3727-3731)、连同tac启动子(DeBoer(德波尔)等人,1983,Proc.Natl.Acad.Sci.USA(美国国家科学院院刊)80:21-25)。另外的启动子描述于(Gilbert(吉尔伯特)等人,1980,Scientific American(科学美国人)242:74-94)中的“来自重组细菌的有用蛋白(Useful proteins from recombinant bacteria)”;以及上文的萨拉布鲁克等人,1989中。串联启动子的实例披露在WO99/43835中。
在丝状真菌宿主细胞中,适合指导本发明的核酸构建体的转录的合适启动子的实例是获得自以下各项的基因的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖孢镰刀菌胰蛋白酶–样蛋白酶(WO96/00787)、镶片镰孢菌淀粉葡糖苷酶(WO00/56900)、镶片镰孢菌Daria(达莉亚)(WO00/56900)、镶片镰孢菌Quinn(奎恩)(WO00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉葡聚糖内切酶I、里氏木霉葡聚糖内切酶II、里氏木霉葡聚糖内切酶III、里氏木霉葡聚糖内切酶IV、里氏木霉葡聚糖内切酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,连同NA2-tpi启动子(来自曲霉属中性α-淀粉酶基因的修饰的启动子,其中非翻译前导子已经用来自一种曲霉属丙糖磷酸异构酶基因的非翻译前导子替换;非限制性实例包括来自黑曲霉中性α-淀粉酶基因的修饰的启动子,其中非翻译前导子已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的非翻译前导子替换);及其突变的、截短的、和杂交的启动子。
在酵母宿主中,有用的启动子获得自以下各项的基因:酿酒酵母烯醇酶(ENO1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇3-羟基丙酸脱氢酶/甘油醛-3磷酸3-羟基丙酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、以及酿酒酵母3磷酸甘油酸激酶。Romanos(罗马诺斯)等人,1992,Yeast(《酵母杂志》)8:423-488描述了酵母宿主细胞的其他有用的启动子。
该控制序列还可以是被宿主细胞识别以终止转录的转录终止子。该终止子序列被可操作地连接至编码该变体的多核苷酸的3’末端。可以使用在宿主细胞中具有功能的任何终止子。
优选的用于细菌宿主细胞的终止子是由克劳氏芽孢杆菌(Bacillus clausii)碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)及大肠杆菌核糖体RNA(rrnB)的基因获得。
丝状真菌宿主细胞的优选终止子是从以下各项的基因中获得的:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、以及尖孢镰刀菌胰蛋白酶样蛋白酶。
酵母宿主细胞的优选终止子获得自以下各项的基因:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、以及酿酒酵母甘油醛-3磷酸3-羟基丙酸脱氢酶。上文的罗马诺斯等人,1992描述了酵母宿主细胞其他有用的终止子。
该控制序列还可以是在启动子下游并且在基因编码序列上游的mRNA稳定区,它增加该基因的表达。
适合的mRNA稳定区的实例是从以下获得的:苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(化(Hue)等人,1995,Journal of Bacteriology(《细菌学杂志》)177:3465-3471)。
该控制序列还可以是一个前导子,一种对宿主细胞翻译很重要的非翻译mRNA区域。前导序列被可操作地连接至编码该变体的多核苷酸的5’末端。在宿主细胞中起作用的任何前导子都可以使用。
丝状真菌宿主细胞的优选前导子是从以下各项的基因中获得的:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
酵母宿主细胞的合适的前导子是从以下各项的基因中获得的:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3磷酸甘油酸激酶、酿酒酵母α-因子、以及酿酒酵母醇3-羟基丙酸脱氢酶/甘油醛-3磷酸3-羟基丙酸脱氢酶(ADH2/GAP)。
该控制序列还可以是一种多腺苷酸化序列,一种被可操作地连接至该变体编码序列的3’末端并且当被转录时由宿主细胞识别成将多腺苷酸残基添加到所转录的mRNA上的一个信号的序列。在宿主细胞中起作用的任何聚腺苷酸化序列都可以使用。
用于丝状真菌宿主细胞的优选多腺苷酸化序列是从以下各项的基因中获得的:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、以及尖孢镰刀菌胰蛋白酶样蛋白酶。
Guo(郭)&Sherman(谢尔曼),1995,Mol.Cellular Biol.(分子与细胞生物学杂志)15:5983-5990描述了酵母宿主细胞的有用的多腺苷酸化序列。
控制序列还可以是编码连接至一个变体的N末端上的一个信号肽并指导该变体进入细胞的分泌途径的一个信号肽编码区。该多核苷酸的编码序列的5’端可以固有地包含在翻译读码框内与编码该变体的编码序列的区段天然地连接的一个信号肽编码序列。可替代地,编码序列的5’端可以包含对编码序列是外源的信号肽编码序列。该编码序列不天然地包含一个信号肽编码序列时,可能需要外源信号肽编码序列。可替代地,一种外源信号肽编码序列可简单地替换该天然的信号肽编码序列以便提高该变体的分泌。然而,可以使用指导所表达的变体进入宿主细胞的分泌途径中的任何信号肽编码序列。
细菌宿主细胞的有效信号肽编码序列是从以下各项的基因中获得的信号肽编码序列:芽孢杆菌NCIB11837麦芽淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)、以及枯草芽孢杆菌prsA。Simonen(西蒙纳)和Palva(帕尔瓦),1993,MicrobiologicalReviews(微生物学评论)57:109-137描述了另外的信号肽。
丝状真菌宿主细胞的有效信号肽编码序列是从以下各项的基因中获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉葡聚糖内切酶V、疏棉状腐质霉脂肪酶、以及米黑根毛霉天冬氨酸蛋白酶。
酵母宿主细胞有用的信号肽是从以下各项的基因中获得的:酿酒酵母α-因子和酿酒酵母转化酶。上文的罗马诺斯等人,1992描述了其他有用的信号肽编码序列。
该控制序列还可以是编码位于一个变体的N末端的前肽的一种前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或者在一些情况下被称为酶原(zymogen))。多肽原一般是无活性的并且可以通过从该多肽原上催化切割或自动催化切割前肽而被转化成一种活性多肽。前肽编码序列可以从以下各项的基因中获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、米黑根毛霉天冬氨酸蛋白酶、以及酿酒酵母α-因子。
在信号肽序列和前肽序列都存在的情况下,该前肽序列定位成紧邻该变体的N末端并且该信号肽序列定位成紧邻该前肽序列的N末端。
还令人希望的可以是添加相对于宿主细胞的生长来调节该变体的表达的调节序列。调节系统的实例是响应于化学或物理刺激而引起基因的表达开启或关闭的那些,包括调控化合物的存在。在原核系统中的调节系统包括lac、tac、以及trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子、和米曲霉葡糖淀粉酶启动子。调节序列的其他实例是允许基因扩增的那些。在真核系统中,这些调节序列包括在氨甲蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下,编码该变体的多核苷酸将与该调节序列可操作地连接。
重组表达载体包括编码在此描述的多肽或变体的多核苷酸,启动子、以及转录终止信号和翻译终止信号。不同的核苷酸和控制序列可以接合在一起以产生一个重组表达载体,这一重组表达载体可以包括一个或多个便利的限制酶切位点以允许在这些位点处插入或取代编码该变体的多核苷酸。可替代地,该多核苷酸可以通过将该多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生表达载体时,该编码序列是位于该载体中,由此使该编码序列与该用于表达的适当控制序列可操作地连接。
该重组表达载体可以是能便利地经历重组DNA程序并且可以引起该多核苷酸的表达的任何载体(例如质粒或病毒)。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是一种线性的或闭合的环状质粒。
该载体可以是一种自主复制载体,即,作为一种染色体外实体存在的一种载体,该载体的复制与染色体复制无关,例如一种质粒、染色体外元件、微型染色体、或人工染色体。该载体可以包含用于确保自我复制任何工具。可替代地,该载体可以是这样一种载体,当它被引入该宿主细胞中时,被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒、或两种或更多种载体或质粒(这些载体或质粒共同包含了有待引入到宿主细胞的基因组中的总DNA)、或转座子。
该载体优选包含允许容易选择转化细胞、转染细胞、转导细胞或类似细胞的一种或多种选择性标记。选择性标记是一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型、等。
细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因、或赋予抗生素抗性(例如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素、或四环素抗性)的标记。用于酵母宿主细胞的适合的标记包括但不局限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1、以及URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不局限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合成酶)、连同其等效物。优选在曲霉细胞中使用的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。
该载体优选包含允许将该载体整合到宿主细胞基因组中或者该载体在细胞中不依赖该基因组而自主复制的一种或多种元件。
对于整合到该宿主细胞基因组中,该载体可以依靠编码该变体的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可以包含指导通过同源重组而整合到宿主细胞基因组中一个或多个染色体中的一个或多个精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性,这些整合的元件应包含足够数量的核酸,例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外,这些整合元件可以是非编码多核苷酸或编码多核苷酸。另一方面,通过非同源重组可以将该载体整合到该宿主细胞的基因组内。
对于自主复制,该载体可以进一步包含使该载体能够在所讨论的宿主细胞内进行自主复制的复制起点。复制起点可以是在细胞内起作用的介导自主复制的任何质粒复制因子。术语“复制起点”或“质粒复制因子”是指使质粒或载体能够在体内复制的多核苷酸。
细菌的复制起点的实例是允许在大肠杆菌内进行复制的质粒pBR322、pUC19、pACYC177、以及pACYC184以及允许在芽孢杆菌内进行复制的pUB110、pE194、pTA1060、以及pAMβ1的复制起点。
用于在酵母宿主细胞内使用的复制起点的实例是2微米(2micron)的复制起点、ARS1、ARS4、ARS1与CEN3的组合、以及ARS4与CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems(格姆斯)等人,1991,基因98:61-67;Cullen(卡伦)等人,1987,核酸研究15:9163-9175;WO00/24883)。根据WO00/24883中披露的方法可以实现AMA1基因的分离和包含该基因的质粒或载体的构建。
可以将本发明的多核苷酸的多于一个的拷贝插入到一个宿主细胞中以增加变体的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包含一个与该多核苷酸的可扩增的选择性标记基因可以获得增加的多核苷酸拷贝数目,其中通过在适当选择性试剂存在下培养细胞可以选择包含可扩增的选择性标记基因的经扩增的拷贝的细胞,并且由此是该多核苷酸的另外的拷贝。
用于连接上文所述的元件以构建本发明的重组表达载体的程序对于本领域普通技术人员来说是熟知的(参见,例如上文的萨拉布鲁克等人,1989)。
宿主细胞
本发明还涉及以下重组宿主细胞,这些重组宿主细胞包括一种编码在此描述的多肽或变体、被可操作地连接至一个或多个指导生产的控制序列的多核苷酸,例如用于在主动3-HP途径中使用。将包含多核苷酸的构建体或载体引入到宿主细胞中,这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体,如早先所述。术语“宿主细胞”涵盖由于复制期间发生的突变与亲本细胞不同的亲本细胞的任何后代。
在一些方面中,可以针对在此描述的多肽或变体的重组生产和回收对宿主细胞进行选择。在其他方面中,该宿主细胞包括主动3-HP途径并且被选择以表达在此描述的多肽或变体作为由该细胞在3-HP的重组生产中的3-HP途径基因(例如,如在WO2012/074818中所描述,将其内容通过引用而特此结合)。此类细胞可以从可发酵糖或丙二酰半醛前体生产3-HP。
原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括,但不限于芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括,但不限于弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟球菌属、假单胞菌属、沙门菌属和脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不局限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、以及苏云金芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞,包括但不局限于似马链球菌、化脓链球菌、乳房链球菌、以及马链球菌兽疫亚种细胞。
细菌宿主细胞还可以是任何链霉菌属细胞,包括但不局限于产色链霉菌、阿维链霉菌、天蓝色链霉菌、灰色链霉菌、以及变铅青链霉菌细胞。
通过原生质体转化(参见例如,Chang(常)和Cohen(科恩),1979,Mol.Gen.Genet.(《分子遗传学与基因组》)168:111-115)、感受态细胞转化(参见,例如,Young(杨格)和Spizizen(斯皮兹曾),1961,J.Bacteriol.(《细菌学杂志》)81:823-829;或者Dubnau(杜博楠)和Davidoff-Abelson(大卫多夫-阿贝尔森),1971,分子生物学杂志56:209-221)、电穿孔(参见,例如,Shigekawa(茂川)和Dower(道尔),1988,Biotechniques(《生物技术》)6:742-751)、或者接合(参见,例如Koehler(凯勒)和Thorne(索恩),1987,J.Bacteriol.(《细菌学杂志》)169:5271-5278)可以实现将DNA引入到芽孢杆菌属细胞之中。通过原生质体转化(参见例如,Hanahan(哈那汗),1983,分子生物学杂志166:557-580)或者电穿孔(参见,例如,道尔等人,1988,核酸研究16:6127-6145)可以实现将DNA引入到大肠杆菌细胞之中。通过原生质体转化、电穿孔(参见例如,Gong(宫)等人,2004,Folia Microbiol.(《微生物学报》)(Praha(布拉格))49:399-405)、接合(参见,例如,Mazodier(马佐迪耶)等人,1989,细菌学杂志171:3583-3585)、或转导(参见,例如,Burke(布尔克)等人,2001,美国国家科学院院刊98:6289-6294)可以实现将DNA引入到链霉菌属细胞中。通过电穿孔(参见,例如,Choi(崔)等人,2006,J.Microbiol.Methods(《微生物学方法杂志》)64:391-397)、或者接合(参见,例如,Pinedo(皮内多)和Smets(斯麦茨),2005,应用与环境微生物学71:51-57)可以实现将DNA引入到假单胞菌属细胞之中。通过天然感受态(参见例如,Perry(佩里)和Kuramitsu(仓光),1981,Infect.Immun.(《感染与免疫》)32:1295-1297)、原生质体转化(参见,例如,Catt(卡特)和Jollick(朱力克),1991,Microbios(《微体生物》)68:189-207)、电穿孔(参见,例如,Buckley(巴克利)等人,1999,应用与环境微生物学65:3800-3804)或者接合(参见,例如,Clewell(克拉维尔),1981,Microbiol.Rev.(生物学评论)45:409-436)可以实现将DNA引入到链球菌属细胞之中。然而,可以使用在本领域已知的任何方法将DNA引入到宿主细胞中。
该宿主细胞还可以是真核细胞,例如哺乳动物、昆虫、植物、或真菌细胞。
该宿主细胞可以是真菌细胞。如在此使用,“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、以及接合菌门(Zygomycota)、连同卵菌门(Oomycota)和全部有丝分裂孢子真菌(如由Hawksworth(霍克斯沃思)等人在安斯沃思和拜斯比真菌词典(Ainsworth and Bisby’s Dictionary of The Fungi),第8版,1995,国际应用生物科学中心(CAB International),大学出版社(University Press),英国剑桥(Cambridge,UK)中进行定义的)。
该真菌宿主细胞可以是酵母细胞。如在此使用,“酵母”包括产子囊孢子酵母(内孢霉目)、产担子酵母,以及属于半知菌(芽生菌)的酵母。由于酵母的分类未来可能改变,故出于本发明的目的,酵母应当如Biology and Activities of Yeast(酵母生物学与活性)(Skinner(斯金纳),Passmore(帕斯莫)及Davenport(达文波特)编辑,Soc.App.Bacteriol.Symposium(应用细菌学学会),第9辑,1980)中所描述进行定义。
酵母宿主细胞可以是假丝酵母属、汉逊酵母属、克鲁维酵母菌属、毕赤酵母属、酵母菌属、裂殖酵母属、或亚罗酵母属细胞,例如产乳糖酶酵母、卡氏酵母(Saccharomycescarlsbergensis)、酿酒酵母、糖化酵母、道格拉斯酵母(Saccharomyces douglasii)、克鲁费酵母(Saccharomyces kluyveri)、诺地酶母(Saccharomyces norbensis)、卵形酵母、或亚罗解脂酵母(Yarrowia lipolytica)细胞。
在一些方面中,该宿主细胞选自伊萨酵母属、假丝酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、有孢圆酵母属、接合酵母属、以及酵母菌属。在一些方面中,该宿主细胞是东方伊萨酵母、郎比可假丝酵母(C.lambica)、或博伊丁酵母(S.bulderi)宿主细胞。
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括所有丝状形式的细分真菌亚门和卵菌亚门(如由上文的Hawksworth(霍克斯沃思)等人,1995所定义的)。丝状真菌的特征一般在于由甲壳素、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复合多糖构成的菌丝体壁。营养生长是通过菌丝伸长来进行的并且碳分解代谢是专性需氧的。相比之下,酵母(例如酿酒酵母)的营养生长是通过单细胞菌体的出芽而进行的,并且碳分解代谢可以是发酵的。
丝状真菌宿主细胞可以是支顶孢属、曲霉属、短梗霉属、烟管菌属、拟蜡菌属(Ceriporiopsis)、金孢子菌属、鬼伞菌属、革盖菌属、隐球酵母属、Filibasidium、镰刀菌属、腐质霉属、大毁壳属、毛霉菌属、蚀丝霉属、新美鞭菌属(Neocallimastix)、脉孢菌属、拟青霉属、青霉菌属、平革菌属、白腐菌属、梨囊鞭菌属、侧耳属、裂褶菌属、踝节菌属、嗜热子囊菌属(Thermoascus)、梭孢壳菌属、弯颈霉属、栓菌属、或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、烟管菌、干拟蜡菌、卡内基拟蜡菌(Ceriporiopsiscaregiea)、浅黄拟蜡孔菌、潘诺希塔拟蜡菌(Ceriporiopsispannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsissubrufa)、虫拟蜡菌、狭边金孢子菌(Chrysosporiuminops)、嗜角质金孢子菌、拉克淖金孢子菌(Chrysosporiumlucknowense)、粪状金孢子菌(Chrysosporiummerdarium)、毡金孢子菌、女王杜香金孢子菌(Chrysosporiumqueenslandicum)、热带金孢子菌、褐薄金孢子菌、灰盖鬼伞、毛云芝菌、杆孢状镰孢、禾谷镰孢、库威镰孢、黄色镰刀菌、禾谷镰刀菌、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰刀菌、多枝镰孢、粉红镰孢菌、接骨木镰孢、肤色镰孢、拟分枝孢镰刀菌、硫色镰孢、圆镰孢、拟丝孢镰刀菌、镶片镰孢菌、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢原毛平革菌、射纹革菌、杏鲍菇、太瑞斯梭孢壳霉、长绒毛栓菌、韩国白腐菌、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
可以通过涉及原生质体形成、原生质体转化以及本身已知的一种方式进行细胞壁再生的一个过程来转化真菌细胞。用于转化曲霉属和木霉属宿主细胞的适合程序被描述于EP238023,Yelton(耶尔顿)等人,1984,美国国家科学院院刊81:1470-1474,以及Christensen(克里斯坦森)等人,1988,Bio/Technology(生物技术)6:1419-1422中。Malardier(马拉迪耶)等人,1989,基因78:147-156和WO96/00787描述了用于转化镰刀菌属物种的适合的方法。可以使用Becker(贝克尔)和Guarente(瓜伦特),在Abelson,J.N.(阿贝尔森J.N.)和Simon,M.I.(西蒙M.I.)编辑,Guide to Yeast Genetics and MolecularBiology(酵母遗传学和分子生物学指南),酶学方法(《Methods in Enzymology》),第194卷,第182-187页,Academic Press,Inc(学术出版社有限公司)纽约;Ito(伊托)等人,1983,细菌学杂志153:163;以及Hinnen(何妮诺)等人,1978,美国国家科学院院刊75:1920中描述的程序来转化酵母。
在一些方面中,该宿主细胞包括一个主动3-HP途径,该主动3-HP途径包括一种编码在此描述的多肽或变体的多核苷酸并且能够从可发酵糖(例如,葡萄糖)或丙酮酸化物生产3-HP。主动3-HP途径(例如在图1中所示的途径)在本领域是已知的(参见,例如WO2012/074818,将其内容通过引用而特此结合)。该宿主细胞可以包括PEP羧化酶活性或丙酮酸羧化酶活性;天冬氨酸转氨酶活性;天冬氨酸脱羧酶活性;以及β-丙氨酸/α-酮戊二酸转氨酶(BAAT)活性。(参见,例如,WO02/42418和WO2008/027742,将其内容通过引用而特此结合)。此类酶活性可以来自内源基因表达、编码代谢途径中的酶类的异源多核苷酸的表达、或来自内源基因表达辅以一个或多个(例如,两个、若干个)异源多核苷酸的表达的组合。在一些实施例中,该宿主细胞包括编码PEP羧化酶的异源多核苷酸、编码丙酮酸羧化酶的异源多核苷酸、编码天冬氨酸转氨酶的异源多核苷酸、编码天冬氨酸脱羧酶的异源多核苷酸、和/或编码BAAT的异源多核苷酸。
在一些方面中,该宿主细胞是3-HP抗性宿主细胞。如在此使用,“3-HP-抗性宿主细胞”是指在包含75g/L或更多3-HP的培养基中、在小于4.0的pH下,展示出至少2.5g/L/hr的平均糖分解速度的宿主细胞。这样的速度和条件代表用于生产3-HP的经济过程。在这些实施例的某些中,这些宿主细胞能以其天然形式展示出3-HP抗性。在其他实施例中,在引入与主动3-HP发酵途径相关的遗传修饰前、中、或后,这些细胞可以经历突变和/或选择,这样使得这些突变的和/或选择的细胞拥有比同一物种的野生型细胞对3-HP的更高程度的抗性。在某些实施例中,可以在以其天然形式展示出3-HP抗性的细胞上进行突变和/或选择。可以在不同水平的3-HP的存在下,针对糖消耗以及其他特征对经历突变和/或选择的细胞进行测试,以便确定它们作为用于生产3-HP的工业化宿主的可能性。除了3-HP抗性以外,在此提供的这些宿主细胞可以经历用于抵抗一种或多种另外的有机酸或抵抗其他发酵产物、副产物、或培养基组分的突变和/或选择。
可以使用本领域熟知的方法完成对3-HP或对其他化合物的抗性的选择。例如,可以使用恒化器进行选择。恒化器是一种允许微生物(例如,酵母)的连续培养的设备,其中可以独立控制比生长速率和细胞数目。连续培养实质上是一种定容的流动系统,向其中连续添加培养基并且从其中可以发生任何溢流的连续去除。一旦这样的一个系统处于平衡状态,则细胞数目和营养素状态保持不变,并且该系统处于稳态。恒化器允许通过一种限制性营养素(例如碳源或氮源)的稀释率和浓度的改变来控制培养物的群体密度和比生长速率两者。通过改变培养物生长时的条件(例如,在其他之中,减少接种物菌株的生长必需的次级碳源的浓度),将在该群体中选择能够在改变的条件下长得更快的微生物并且这些微生物将比在新的条件下作用得不同样好的微生物长得快。典型地,这样的选择需要在恒化培养物的生长过程中至少一种培养物组分的递增或递减。恒化器的操作以及它们在微生物的定向进化中的用途在本领域是熟知的(参见,例如Novick Proc Natl Acad Sci USA(《美国科学院院报》)36:708-719(1950),Harder(哈德)J Appl Bacteriol(《应用细菌学杂志》)43:1-24(1977))。
在一些方面中,当在相同条件下培养时,与不具有编码在此描述的多肽或变体的多核苷酸的宿主细胞相比,这些宿主细胞分泌(和/或能够分泌)增加水平的3-HP。在一些实施例中,当在相同条件下培养时,与不具有编码在此描述的多肽或变体的多核苷酸的宿主细胞相比,该宿主细胞分泌和/或能够分泌至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%、或至少500%的增加水平的3-HP。适合的培养条件的实例在下面进行了描述并且基于在此的教导,对本领域的普通技术人员而言将是容易地显而易见的。在一些实施例中,该宿主细胞产生(和/或能够产生)理论的至少10%,例如至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、或至少90%的产量的3-HP。在一些实施例中,该宿主细胞具有大于约0.1g/L/小时的3-HP体积生产力,例如大于约0.2g/L/小时、0.5g/L/小时、0.6g/L/小时、0.7g/L/小时、0.8g/L/小时、0.9g/L/小时、1.0g/L/小时、1.1g/L/小时、1.2g/L/小时、1.3g/L/小时、1.5g/L/小时、1.75g/L/小时、2.0g/L/小时、2.25g/L/小时、2.5g/L/小时、或3.0g/L/小时;或约0.1g/L/小时与约2.0g/L/小时之间,例如约0.3g/L/小时与约1.7g/L/小时之间、约0.5g/L/小时与约1.5g/L/小时之间、约0.7g/L/小时与约1.3g/L/小时之间、约0.8g/L/小时与约1.2g/L/小时之间、或约0.9g/L/小时与约1.1g/L/小时之间。
可以使用本领域熟知的方法,在适合产生这些多肽和变体的营养培养基中培养这些宿主细胞。例如,可以通过摇瓶培养,以及在合适的培养基中和在允许表达和/或分离所希望的多肽的条件下,在实验室或工业发酵罐中小规模或大规模发酵(包括连续发酵,分批发酵,补料分批发酵,或固态发酵)来培养该细胞。如在此所述,该培养是使用本领域中已知的程序,在一种适合营养培养基中发生,该培养基包括碳源和氮源及无机盐。合适的培养基从商业供应商处可获得或者可根据公开的组成(例如,在美国典型培养物保藏中心目录中)来制备,或可以从可商购的成分制备。
如在前所述,可以使用本领域已知的方法检测在此描述的这些酶的酶活性。这些检测方法可以包括使用特异性抗体、酶产物的形成、或酶底物的消失。参见,例如萨拉布鲁克(Sambrook)等人,Molecular Cloning:A Laboratory Manual(分子克隆实验指南),第三版,Cold Spring Harbor Laboratory(冷泉港实验室),纽约(2001);Ausubel(奥苏贝尔)等人,Current Protocols in Molecular Biology(《当前分子生物学》),John Wiley andSons(约翰威利父子公司),巴尔的摩,马里兰州(1999);以及Hanai(哈奈)等人,Appl.Environ.Microbiol.(《应用及环境微生物学》)73:7814-7818(2007))。
产生方法
本发明还涉及产生在此描述的多肽或变体的方法,这种方法包括:(a)在适于表达的条件下培养包括编码该多肽或变体的多核苷酸的细胞;并且(b)回收该多肽或变体。
这些宿主细胞是在适于使用本领域中已知的方法产生在此描述的多肽或变体的一种营养培养基中培养的。例如,可以通过摇瓶培养,或者在一种适合的培养基中并在允许该变体表达和/或分离的条件下在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批给料发酵或固态发酵)来培养该细胞。该培养是使用本领域中已知的程序,在一种适合营养培养基中发生,该培养基包含碳和氮来源及无机盐。合适的培养基从商业供应商处可获得或者可根据公开的组成(例如,在美国典型培养物保藏中心目录中)来制备。如果该变体被分泌到该营养培养基中,则该变体可直接从该培养基中回收。如果该变体没有分泌,则它可从细胞裂解液中回收。
使用本领域已知的对这些变体特异的方法可以检测该变体。这些检测方法包括但不限于,特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶活性测定(如在实例部分描述的测定)来确定酶活性。
可以使用本领域中已知的方法回收该多肽或变体。例如,可以通过多种常规程序从该营养培养基中回收该变体,这些常规程序包括但不局限于收集、离心、过滤、萃取、喷雾干燥、蒸发、或沉淀。
可以通过本领域已知的多种程序来纯化该多肽或变体,以获得基本上纯的变体,这些程序包括,但不局限于色谱法(例如,离子交换色谱、亲和色谱、疏水作用色谱、色谱聚焦、以及尺寸排阻色谱)、电泳程序(例如,制备型等电点聚焦)、溶解度差异(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(参见,例如Protein Purification(蛋白纯化),Janson(詹森)和Ryden(赖登)编辑,VCH出版社(VCH Publishers),纽约,1989)。
在一个可替代的方面中,不回收该多肽或变体,而是将表达该多肽的宿主细胞用作代谢途径的一部分,如在此所述用于生产3-HP。
生产3-HP的方法
可以使用在此描述的宿主细胞来生产3-HP。在一个方面中,是一种从可发酵糖(例如,葡萄糖)或丙酮酸化物生产3-HP的方法,该方法包括:(a)在用于生产3-HP的适合的条件下,在培养基中培养任一在此描述的宿主细胞(例如,包括主动3-HP途径以及编码在此描述的3-HPDH的多核苷酸的宿主细胞);并且(b)回收3-HP。在该方法的一些实施例中,该宿主细胞进一步包括PEP羧化酶活性或丙酮酸羧化酶活性;天冬氨酸转氨酶活性;天冬氨酸脱羧酶活性;以及β-丙氨酸/α-酮戊二酸转氨酶(BAAT)活性。在一些实施例中,该宿主细胞包括编码PEP羧化酶的异源多核苷酸、编码丙酮酸羧化酶的异源多核苷酸、编码天冬氨酸转氨酶的异源多核苷酸、编码天冬氨酸脱羧酶的异源多核苷酸、和/或编码BAAT的异源多核苷酸。在这些方法的一些实施例中,如前所述,这些宿主细胞是3-HP抗性宿主细胞。
在一个方面中,是一种从可发酵糖(例如,葡萄糖)或丙酮酸化物生产3-HP的方法,该方法包括:(a)在用于生产3-HP的适合的条件下,在培养基中培养任一在此描述的宿主细胞(例如,包括主动3-HP途径以及编码在此描述的SEQ ID NO:2、4、或6的3-HPDH变体的多核苷酸的宿主细胞);并且(b)回收3-HP。在该方法的一些实施例中,该3-HPDH变体与SEQ IDNO:2、4、或6具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性。在一些实施例中,该宿主细胞进一步包括PEP羧化酶活性或丙酮酸羧化酶活性;天冬氨酸转氨酶活性;天冬氨酸脱羧酶活性;以及β-丙氨酸/α-酮戊二酸转氨酶(BAAT)活性。在一些实施例中,该宿主细胞包括编码PEP羧化酶的异源多核苷酸、编码丙酮酸羧化酶的异源多核苷酸、编码天冬氨酸转氨酶的异源多核苷酸、编码天冬氨酸脱羧酶的异源多核苷酸、和/或编码BAAT的异源多核苷酸。在这些方法的一些实施例中,如前所述,这些宿主细胞是3-HP抗性宿主细胞。
在一个方面中,是一种从可发酵糖(例如,葡萄糖)或丙酮酸化物生产3-HP的方法,该方法包括:(a)在用于生产3-HP的适合的条件下,在培养基中培养任一在此描述的宿主细胞(例如,包括主动3-HP途径以及编码与SEQ ID NO:82有关的3-HPDH的多核苷酸的宿主细胞);并且(b)回收3-HP。在该方法的一些实施例中,该3-HPDH变体与SEQ ID NO:82的恶臭假单胞菌(P.putida)3-HPDH具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性。在一些实施例中,该宿主细胞进一步包括PEP羧化酶活性或丙酮酸羧化酶活性;天冬氨酸转氨酶活性;天冬氨酸脱羧酶活性;以及β-丙氨酸/α-酮戊二酸转氨酶(BAAT)活性。在一些实施例中,该宿主细胞包括编码PEP羧化酶的异源多核苷酸、编码丙酮酸羧化酶的异源多核苷酸、编码天冬氨酸转氨酶的异源多核苷酸、编码天冬氨酸脱羧酶的异源多核苷酸、和/或编码BAAT的异源多核苷酸。在这些方法的一些实施例中,如前所述,这些宿主细胞是3-HP抗性宿主细胞。
可以在包括任何一种或多种(例如,两种、若干种)糖的可发酵培养基中进行3-HP的生产方法,这些糖是例如葡萄糖、果糖、蔗糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖、和/或可溶的低聚糖。在一些情况下,这种发酵培养基来源于天然来源,例如甘蔗、淀粉、或纤维素;并且可以来自这种来源的酶水解(糖化作用)的预处理。
除了来自一种或多种(例如,两种、若干种)糖的适当的碳源之外,该可发酵的培养基可以包含本领域的普通技术人员已知的其他营养素或刺激物,例如大量营养素(如,氮源)以及微量营养素(如,维生素、矿物盐、以及金属辅因子)。在一些方面中,碳源优先地可以补充有至少一种碳源,例如酵母提取物、N2、蛋白胨(例如,BactoTM蛋白胨)、或大豆蛋白胨(例如,BactoTM大豆蛋白胨)。维生素的非限制性实例包括多种维生素、生物素、泛酸盐、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素、以及维生素A、维生素B、维生素C、维生素D、以及维生素E。矿物盐和金属辅因子的实例包括,但不限于,Na、P、K、Mg、S、Ca、Fe、Zn、Mn、以及Cu。
用于3-HP生产的方法的适合的条件可以由本领域普通技术人员根据在此的教导确定。在这些方法的一些方面中,将这些宿主细胞培养约12小时至约216小时,例如约24小时至约144小时、或约36小时至约96小时。温度典型地是在约26℃至约60℃之间,例如约34℃至约50℃,并且在约3.0至约8.0的pH下,例如约3.0至约7.0、约3.0至约6.0、约3.0至约5.0、约3.5至约4.5、约4.0至约8.0、约4.0至约7.0、约4.0至约6.0、约4.0至约5.0、约5.0至约8.0、约5.0至约7.0、或约5.0至约6.0。在这些方法的一些方面中,该宿主细胞的作为结果的胞内pH是约3.0至约8.0,例如约3.0至约7.0、约3.0至约6.0、约3.0至约5.0、约3.5至约4.5、约4.0至约8.0、约4.0至约7.0、约4.0至约6.0、约4.0至约5.0、约5.0至约8.0、约5.0至约7.0、或约5.0至约6.0。视情况而定,可以在厌氧、微好氧、或好氧条件下进行培养。在一些方面中,在厌氧情况下进行培养。适合的缓冲剂在本领域是已知的。
视情况而定,可以在厌氧、基本上厌氧(微好氧)、或好氧条件下进行培养。简言之,厌氧的是指一种缺少氧气的环境,基本上厌氧的(微好氧的)是指一种其中氧气的浓度比空气低的环境,并且好氧是指一种其中氧气浓度大致等于或大于空气的氧气浓度的环境。基本上缺氧条件包括例如使得在培养基中的溶氧浓度保持在小于10%的饱和度的培养、分批发酵或连续发酵。基本上缺氧条件还包括使细胞在维持有小于1%氧气的气氛的密封室内的液体培养基中或固体琼脂上生长或静止。例如可以通过向培养物鼓吹N2/CO2混合物或其他一种或多种适合的非氧气体来维持氧气的百分比。在一些实施例中,在缺氧条件或基本上缺氧条件下进行培养。
在此描述的这些方法可以利用任何适合的发酵操作模式。例如,分批模式发酵可以与一个封闭系统一起使用,其中培养基和宿主微生物(在发酵的开始设置的)除了试剂(某些例如用于pH控制、泡沫控制或过程支持所需的其他试剂)之外,没有另外的投入。在此描述的过程还可以在补料分批模式或连续模式中利用。
可以在若干生物反应器构型中实践在此描述的这些方法,例如搅拌槽、鼓泡塔、气升式反应器以及本领域的普通技术人员已知的其他反应器。
视情况而定,能以游离细胞培养或固定化细胞培养的方式执行这些方法。可以使用任何用于支持固定化细胞培养的材料,例如藻酸盐、纤维床、或菱形材料,例如温石棉、蒙脱石KSF和蒙脱石K-10。
在这些方法的一个方面中,以大于约10g/L的效价产生3-HP,例如大于约25g/L、50g/L、75g/L、100g/L、125g/L、150g/L、160g/L、170g/L、180g/L、190g/L、200g/L、210g/L、225g/L、250g/L、275g/L、300g/L、325g/L、350g/L、400g/L、或500g/L;或约10g/L与约500g/L之间,例如约50g/L与约350g/L之间、约100g/L与约300g/L之间、约150g/L与约250g/L之间、约175g/L与约225g/L之间、或约190g/L与约210g/L之间。在这些方法的一个方面中,以大于约0.01克/克碳水化合物的效价生产3-HP,例如大于约0.02、0.05、0.75、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、或1.0克/克碳水化合物。
在这些方法的一个方面中,与在同样的条件下,培养不具有编码3-HPDH的多核苷酸的宿主细胞相比,产生的3-HP的量多了至少5%,例如至少10%、至少15%、至少20%、至少25%、至少30%、至少50%、或至少100%。
可以使用本领域已知的任何程序从发酵培养基可任选地回收并纯化重组3-HP,这些程序包括,但不限于色谱法(例如,尺寸排阻色谱法、吸附色谱法、离子交换色谱法)、电泳程序、溶解度差异、蒸馏、萃取(例如,液液萃取)、渗透蒸发、萃取过滤、膜过滤、膜分离、反渗透、超滤、或结晶化。
在这些方法的一些方面中,在可任选地纯化之前和/或之后的重组3-HP是基本上纯的。关于生产3-HP的方法,“基本上纯的”意指包含不多于15%的杂质的3-HP的回收的制剂,其中杂质意指除了3-HP以外的化合物。在一种变化中,提供了一种基本上纯的3-HP制剂,其中该制剂包含至多25%杂质、或至多20%杂质、或至多10%杂质、或至多5%杂质、或至多3%杂质、或至多1%杂质、或至多0.5%杂质。
可以使用本领域已知的方法进行用来针对在此描述的生产方法的3-HP的产生和宿主细胞的测试的适合的测定。例如,可以通过方法(例如HPLC(高效液相色谱法)、GC-MS(气相色谱-质谱法)和LC-MS(液相色谱-质谱法))或使用本领域熟知的常规程序的其他适合的分析方法对最终的3-HP(以及其他有机化合物)进行分析。还可以用培养上清液测试发酵液中的3-HP的释放。可以使用例如针对葡萄糖和醇类的折光率检测器、以及针对有机酸的UV检测器通过HPLC(Lin(林)等人,Biotechnol.Bioeng.(《生物技术与生物工程》)90:775-779(2005))、或使用本领域熟知的其他适合的测定和检测方法量化在发酵培养基中的副产物和残余的糖(例如,葡萄糖)。
植物
还描述了包括在此描述的多核苷酸的植物,例如转基因植物、植物部分、或植物细胞,以便以可回收的数量表达并产生在此描述的多肽和变体。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草,如草甸草(蓝草,早熟禾属)、饲草如羊茅属(Festuca)、黑麦草属(Lolium),温带草,如剪谷颖属(Agrostis)和谷物,例如小麦、燕麦、黑麦、大麦、水稻、高粱及玉蜀黍(玉米)。
双子叶植物的实例是烟草,豆类,例如羽扇豆、马铃薯、甜菜、豌豆、菜豆和大豆,以及十字花的植物(十字花科)、例如花椰菜、油菜籽,以及紧密相关的模式生物拟南芥。
植物部分的实例是茎、愈伤组织、叶、根、果实、种子、以及块茎连同包含这些部分的单个组织,例如表皮、叶肉、薄壁组织、维管组织、分生组织。特定的植物细胞区室,例如叶绿体、质外体、线粒体、液泡、过氧化物酶体和细胞质也被认为是植物部分。此外,任何植物细胞,无论组织来源,也被认为是植物部分。同样,被分离以有助于本发明的利用的植物部分,如特定组织和细胞,也被认为是植物部分,例如胚芽、胚乳、糊粉及种皮。
表达变体的转基因植物或植物细胞可以根据本领域中已知的方法构建。简言之,通过将一个或多个编码变体的表达构建体并入该植物宿主基因组或叶绿体基因组中,并使所得经过修饰的植物或植物细胞繁殖为转基因植物或植物细胞来构建该植物或植物细胞。
该表达构建体便利地为一种核酸构建体,该核酸构建体包括对变体进行编码的多核苷酸,该多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当调节序列可操作地连接。此外,该表达构建体可以包含一种适用于对已经整合入该表达构建体的植物细胞进行鉴别的可选择标记,及将该构建体引入所讨论的植物中必需的DNA序列(后者取决于打算使用的DNA引入方法)。
例如,根据希望在何时、何处、和怎样表达该变体来决定调节序列的选择,例如启动子和终止子序列和可任选的信号或转运序列。例如,编码变体的基因的表达可以是组成型的或可诱导的,或可以为发育、阶段或组织特异性的,并且可以使基因产物靶向特定组织或植物部分,例如种子或叶。调节序列是例如由塔格(Tague)等人,1988,Plant Physiology(《植物生理学》)86:506描述的。
对于组成型表达,可以使用35S-CaMV、玉蜀黍泛素1、或水稻肌动蛋白1启动子(Franck(弗兰克)等人,1980,Cell(《细胞》)21:285-294;Christensen(克里斯滕森)等人,1992,Plant Mol.Biol.(《植物分子生物学》)18:675-689;Zhang(张)等人,1991,PlantCell(《植物细胞》)3:1155-1165)。器官特异性启动子可以是以下各项的启动子,例如来自贮藏库组织(例如种子、马铃薯块茎、和果实)(Edwards(爱德华兹)和Coruzzi(科鲁兹),1990,Ann.Rev.Genet.(遗传学年鉴)24:275-303),或来自代谢库组织(例如分生组织)(Ito(伊藤)等人,1994,Plant Mol.Biol.(《植物分子生物学》)24:863-878),种子特异性启动子,例如来自水稻的谷蛋白、醇溶谷蛋白、球蛋白、或白蛋白启动子(Wu(吴)等人,1998,Plant Cell Physiol.(植物与细胞生理学)39:885-889),来自豆球蛋白B4的蚕豆启动子和来自蚕豆的未知种子蛋白基因(Conrad(康拉德)等人,1998,J.Plant Physiol.(《植物生理学杂志》)152:708-711),来自种子油体蛋白的启动子(Chen(陈)等人,1998,Plant CellPhysiol.(《植物与细胞生理学》)39:935-941),来自欧洲油菜的贮藏蛋白napA启动子,或本领域已知的任何其他种子特异性启动子,例如,如在WO91/14772中所述的。此外,启动子可以是叶特异性启动子,例如来自水稻或番茄的rbcs启动子(Kyozuka(京冢)等人,1993,Plant Physiol.(《植物生理学》),102:991-1000),小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra(密特拉)和Higgins(希金斯),1994,Plant Mol.Biol.(《植物分子生物学》)26:85-93),来自水稻的aldP基因启动子(Kagaya(加贺)等人,1995,Mol.Gen.Genet.(《分子和普通遗传学》)248:668-674),或伤口可诱导的启动子,例如马铃薯pin2启动子(Xu(徐)等人,1993,Plant Mol.Biol.(《植物分子生物学》)22:573-588)。同样,启动子可通过非生物处理,例如温度、干旱、或盐度变化来诱导,或通过外源施加激活启动子的物质,例如乙醇,雌激素,植物激素(例如乙烯、脱落酸、和赤霉酸)、以及重金属来诱导。
还可以使用启动子增强子元件来在该植物中实现变体的更高表达。例如,该启动子增强子元件可以是放置在该启动子与编码变体的多核苷酸之间的一个内含子。例如Xu(徐)等人,1993,同上,披露了使用水稻肌动蛋白1基因的第一内含子来增强表达。
该选择性标记基因及该表达构建体的任何其他部分可以选自本领域中可用的那些。
可以根据本领域已知的常规技术将核酸构建体并入植物基因组中,这些常规技术包括土壤杆菌介导的转化、病毒介导的转化、微注射、粒子轰击、生物射弹转化、以及电穿孔(Gasser(加塞尔)等人,1990,Science(《科学》)244:1293;Potrykus(波特里库斯),1990,Bio/Technology(生物/技术)8:535;Shimamoto(岛本)等人,1989,Nature(自然)338:274)。
根癌土壤杆菌介导的基因转移是一种用于产生转基因双子叶植物(有关评述,参看Hooykas(霍伊卡)和Schilperoort(斯查珀特),1992,Plant Mol.Biol.(植物分子生物学)19:15-38)和用于转化单子叶植物的方法,尽管其他转化方法也可以用于这些植物。一种用于产生转基因单子叶植物的方法是胚性愈伤组织或发育的胚的粒子轰击(用转化DNA包衣的微观金或钨颗粒)(Christou(克里斯托),1992,Plant J.(《植物杂志》)2:275-281;Shimamoto(岛本),1994,Curr.Opin.Biotechnol.(《生物技术新见》)5:158-162;Vasil(瓦西尔)等人,1992,Bio/Technology(生物/技术)10:667-674)。如Omirulleh(奥米如列)等人,1993,Plant Molecular Biology(《植物分子生物学》)21:415-428中所描述,单子叶植物转化的替代方法基于原生质体转化。另外的转化方法包括美国专利号6,395,966和7,151,204(两者都通过引用以其全文结合于此)中所描述的那些。
在转化之后,根据本领域中众所周知的方法对并入了该表达构建体的转化体进行选择并且使其再生成为完整植物。通常转化程序被设计成通过使用例如用两种分开的T-DNA构建体共转化或通过特异性重组酶进行的选择基因的位点特异性切除,在再生期间或在后代中选择性清除选择基因。
除用本发明的构建体直接转化特定植物基因型外,还可以通过使具有该构建体的植物与缺乏该构建体的第二植物进行杂交来产生转基因植物。例如,可以通过杂交将编码变体的构建体引入特定植物品种中,无需总是直接地转化该给定品种的植物。因此,本发明不仅涵盖了从根据本发明已经转化的细胞直接再生的植物,而且还涵盖了这类植物的后代。如在此使用的,后代可以是指根据本发明制备的亲本植物的任何代的后代。此类后代可以包含根据本发明制备的DNA构建体。杂交导致通过供体植物系与起始系交叉授粉,将转基因引入植物系。此类步骤的非限制性实例描述于美国专利号7,151,204中。
可以通过回交转换过程产生植物。例如,植物包括被称为回交转换的基因型、系、近交、或杂交的植物。
遗传标记可以用于协助将本发明的一种或多种转基因从一种遗传背景渗入到另一种遗传背景中。相对于常规育种,标记辅助选择提供了很多优点,其中它可以用于避免由表型变异引起的错误。此外,遗传标记可以提供关于具体杂交的个体后代中的精英种质的相对程度的数据。例如,当具有希望的性状(否则会具有非农艺学上希望的遗传背景)的植物与精英亲本杂交时,遗传标记可以用于选择不仅拥有感兴趣的性状、而且还具有较大比例的希望的种质的后代。以此方式,将一个或多个性状渗入具体的遗传背景所需的世代数被最小化。
在一个方面中,是一种生产在此描述的多肽或变体的方法,这种方法包括:(a)在有益于生产的条件下,培养包含编码该多肽或变体的多核苷酸的一种转基因植物或一种植物细胞;并且(b)回收该多肽或变体。
以下实例进一步描述本发明,这些实例不应当解释为限制本发明的范围。
实例
用作缓沖液和底物的化学品至少是试剂等级的商品。
株系
可以将大肠杆菌菌株MG1655(NN059268)用作编码ydfG3-HPDH基因的DNA的来源。使用菌株MG1655、SoloPack Gold(安捷伦科技公司(Agilent Technologies,Inc.),圣克拉拉市,加利福尼亚州,美国)、以及SURE细胞(安捷伦科技公司)来表达ydfG质粒。
如在WO2012/074818中所描述,将东方伊萨酵母菌株MBin500用作编码东方伊萨酵母YMR226c3-HPDH基因的DNA的来源。使用东方伊萨酵母菌株McTs259(WO2012/074818)来表达用于生产3-HP的描述的3-HPDH基因。
培养基
LB培养基由10g的胰蛋白胨、5g的酵母提取物、5g的氯化钠、以及去离子水组成,至1升。
2XYT板由16g的胰蛋白胨、10g的酵母提取物、5g的NaCl、15g的细菌培养用琼脂(Bacto agar)、以及去离子水组成,至1升。
表0.引物序列
实例1:用于大肠杆菌ydfG3-HPDH基因的表达载体的构建
使用两个旨在用于整合进pTrc99A中而在5’端产生一个EcoRI限制酶切位点并且在3’端产生一个BamHI限制酶切位点的合成寡核苷酸引物通过PCR扩增大肠杆菌ydfG3-HPDH编码序列(图4;参见Amann,E.(阿曼,E.)等人(1988)。“Tightly regulated tacpromoter vectors useful for the expression of unfused and fused proteins inEscherichia coli.(用于在大肠杆菌中的未融合的和融合的蛋白质的表达的严格调控的tac启动子载体)”Gene(《基因》)69(2):301-315)。
通过从2XYT板中分离大肠杆菌MG1655的单菌落并且将其溶解在25μl1%Triton X-100、20mM Tris pH8.5、2mM EDTA(CLS溶液)中获得用于PCR的大肠杆菌基因组DNA,将其在80℃下加热10分钟并且然后在冰上冷却。将三微升的这一溶液用作PCR反应的模板,该溶液进一步包括1X Pfx扩增缓冲液、引物000001和000002每种五十皮摩尔,dATP、dGTP、dCTP、以及dTTP每种0.2mM,以及2.5单位的Pfx DNA聚合酶(英杰公司(Invitrogen),卡尔斯巴德,加利福尼亚州,美国),最终体积为50μl。在 5333(艾本德科技公司(Eppendorf Scientific,Inc.),韦斯特伯里,纽约州,美国)中进行扩增反应,编程为95℃、2分钟、一个循环;以及95℃、30秒钟,55℃、30秒钟,以及72℃、1分钟,各自25个循环。在25个循环以后,将该反应在72℃下孵育3分钟并且然后在10℃下冷却直到进一步处理。
使五微升的PCR反应混合物经受1%TBE-琼脂糖凝胶电泳,用在TBE缓冲液中的溴化乙锭,以鉴别所希望的765bp PCR片段。使用QIAquick PCR纯化试剂盒(凯捷公司(QiagenInc.),瓦伦西亚,加利福尼亚州,美国)纯化来自剩余的45μl的PCR反应混合物的PCR片段。用EcoRI和BamHI(新英格兰生物实验室(New England Biolabs),伊普斯维奇,马萨诸塞州,美国)消化纯化的片段并且在具有溴化乙锭的1%TBE-琼脂糖凝胶上对其进行分析。
用EcoRI和BamHI消化质粒pTrc99A(同上),并且将生成的片段通过1%TBE-琼脂糖凝胶电泳分离,随后用DARK READERTM(克莱尔化学研究公司(Clare Chemical Research),多洛雷斯CO,美国)可视化。用一次性剃须刀片将所希望的4.1kb片段从该凝胶切断并且使用QIAquick凝胶萃取试剂盒(凯捷公司)进行纯化。
使用T4DNA连接酶(新英格兰生物实验室)将包含大肠杆菌ydfG的DNA片段克隆进pTrc99A中。该反应混合物包含1X T4DNA连接酶缓冲液、1μl的T4DNA连接酶、1μl的上面的pTrc99A EcoRI/BamHI消化的DNA片段、以及5μl的上面的ydfG EcoRI/BamHI消化的PCR产物,总体积为10μl。将该反应混合物在16℃下孵育过夜并且随后根据制造厂商的指南,用其转化SURE感受态细胞(安捷伦科技公司)。在复苏期后,将来自该转化混合物的两个100μl等分部分放在补充有100μg氨比西林/ml的150mm2XYT板上并且在37℃下孵育过夜。
将转化的重组菌落各自接种到3ml补充有氨比西林(100μg/ml)的LB培养基中。使用9600工作站(workstation)(凯捷公司)从这些培养物中制备质粒DNA并且在EcoRI/BamHI消化后通过1%TBE-琼脂糖凝胶电泳进行分析。使来自特指的pMeJi9并且具有正确的限制酶切消化模式的一个克隆的质粒DNA进一步经受序列分析,以确认正确的ydfG编码序列的整合。
实例2:大肠杆菌ydfG3-HPDH基因变体的构建
来自DNA2.0(门洛派克公司(Menlo Park),加利福尼亚州,美国)的质粒构建体中提供了编码所希望的ydfG变体并且包含5’旁侧EcoRI限制酶切位点和3’NaeI限制酶切位点的合成DNA序列。用EcoRI和NaeI限制性内切酶消化每种质粒,并且将生成的片段在1%TAE琼脂糖凝胶上进行分离,随后借助于DARK READERTM(克莱尔化学研究公司)进行可视化。用一次性剃须刀片将包含ydfG变体编码序列的所希望的DNA条带从该凝胶切断并且使用NucleoSpin萃取II试剂盒(马歇雷-格尔公司(Machery-Nagel),迪伦(Düren),德国)进行纯化。
通过用EcoRI和NaeI消化线来线性化质粒pMeJi9(同上),随后用小牛肠内的碱性磷酸酶(Alkaline Phosphatase,Calf Intestinal)(CIP)(新英格兰生物实验室)进行孵育,用于除去5’磷酸。使生成的混合物经受凝胶电泳,可视化,并且如上所述进行纯化,以提供所希望的4657bp DNA片段。
通过将1X T4DNA连接酶缓冲液、1μl T4DNA连接酶(新英格兰生物实验室)、2μlEcoRI/NaeI线性化的pMeJi9、以及15μl的选择的EcoRI/NaeI ydfG变体编码序列(总体积为20μl)在室温下孵育2小时将每种ydfG变体编码序列克隆进线性化pMeJi9中。根据制造厂商的指南,使用孵育反应的10μl样品来转化Gold化学感受态细胞。在复苏期后,将来自该转化混合物的两个100μl等分部分放在补充有100μg氨比西林/ml的150mm2XYT板上并且在37℃下孵育过夜。从选择板中选择推定的重组克隆并且使用9600工作站从每种中制备DNA质粒。通过测序分析克隆。那些具有正确序列的质粒示于表1中。
表1.
变体名称 SEQ ID 克隆质粒名称 氨基酸变化
突变体1 7 pMcTs68 T9G/A10*/G31D/R32L/R33N/Q34P/E35A/R36A
突变体2 8 pMcTs69 T9G/G31E/R32L/R33N/Q34P/E35A/R36A
突变体3 9 pMcTs70 T9G/A10*/G31E/R32L/R33N/Q34P/E35A/R36A
突变体4 10 pMcTs71 T9G/G31D/R32L/R33S/Q34A/E35D/R36A
突变体5 11 pMcTs72 T9G/A10*/G31D/R32L/R33S/Q34A/E35D/R36A
突变体6 12 pMcTs73 T9G/G31D/R32L/R33N/Q34P/E35A/R36A
突变体7 13 pMcTs74 T9G/A10*/G31E/R32L/R33S/Q34A/E35D/R36A
突变体8 14 pMcTs75 T9G/G31E/R32L/R33S/Q34A/E35D/R36A
*表示氨基酸的缺失。
使用定点诱变和表明的引物在使用QuikChange II XL定点诱变试剂盒(安捷伦科技公司)的PCR反应中构建下表2所示的另外的变体。该反应PCR包含1X反应缓冲液、每种引物125ng、30ng质粒DNA模板、1X dNTPs、1X Quick溶液、2.5U PfuUltra HF DNA聚合酶,总体积为50μl。在 5333(艾本德科技公司)中进行扩增反应,编程为95℃、3分钟、一个循环;以及95℃、50秒钟,60℃、50秒钟,以及68℃、6分钟,各自18个循环。在18个循环以后,将该反应在68℃下孵育7分钟并且然后在10℃下冷却直到进一步处理。向每个PCR反应中添加1ul的DpnI并且在37℃下孵育1.5小时,以消化模板质粒DNA。
根据制造厂商的指南,将来自每个定点PCR反应的2.5μl的反应转化进XL10Gold超级感受态细胞(安捷伦科技公司)中。在复苏期后,将来自该转化混合物的两个100μl等分部分放在补充有100μg氨比西林/ml的150mm2XYT板上并且在37℃下孵育过夜。
将转化的重组菌落各自接种到3ml补充有氨比西林(100μg/ml)的LB培养基中。使用9600工作站(凯捷公司(Qiagen,Inc.))从这些培养物中制备质粒DNA并且使其经受序列分析,以确认在ydfG编码序列中的定点突变。
表2.
实例3:大肠杆菌ydfG3-HPDH基因变体在MG1655细胞中的表达
根据在Sheen,J.(施恩,J.)(1989).“High-Efficiency Transformation byElectroporation.(通过电穿孔的高效转化)”Current Protocols in MolecularBiology.(《当前分子生物学》)1.8.4中描述的程序,用来自实例2的生成的克隆质粒(或对照pMeJi9或pTrc99A)转化电感受态的MG1655细胞。在复苏期后,将来自该转化反应的两个100μl等分部分放在补充有100μg氨比西林/ml的150mm2XYT板上并且在37℃下孵育过夜。对于每种转化而言,使用9600工作站制备选择的重组克隆的质粒DNA并且通过测序进行分析。然后将选择的克隆接种进补充有100μg氨比西林的3ml的LB培养基的培养物中并且在37℃下孵育过夜,同时振荡。向在125ml的带挡板的摇瓶中的25ml的补充有100μg氨比西林/ml的LB培养基中添加250μl的过夜培养物并且在添加0.5mM IPTG以诱导从该质粒中的表达之前,使其生长到OD600~0.6。在用IPTG孵育1小时后,通过离心收集该培养物并且进行酶活性测定,如下所述。还收集来自这些培养物的样品,用于在8%-16%Bio-RadCriterion stain-free Tris-HCl凝胶(Bio-Rad实验室公司,赫拉克勒斯,加利福尼亚州,美国)上的SDS-PAGE分析。
实例4:表达大肠杆菌ydfG3-HPDH基因变体的细胞的辅因子特异性
通过离心(15,000x g,4℃,持续10min)收获来自实例3的培养物并且在-80℃下储存。将细胞在冰上解冻并且在pH7.4下,将沉淀物重悬于包含一片罗氏完整迷你蛋白酶抑制剂混合物(Roche Complete Mini proteases inhibitor cocktail)(罗氏公司(Roche),巴塞尔)/10mL缓冲液的磷酸盐缓冲盐水(PBS;NaCl,137mM;KCl,2.7mM;Na2HPO4,10mM;KH2PO4,1.76mM)中。将细胞洗涤三次,并且然后重悬于补充有处于2mg/mL浓度的溶菌酶(西格玛-奥德里奇公司(Sigma-Aldrich),圣路易,莫)的PBS加蛋白酶抑制剂中。然后将细胞在冰上孵育30分钟,以允许释放胞质内含物,并且通过离心(15,000x g,4℃,持续30min)收集膜碎片。将包含粗提物(CCE)的上清液转移至一个新的试管中并且将其保存在冰上直到进一步使用。通过遵循制造厂商的建议,使用皮尔斯(Pierce)BCA蛋白质检测试剂盒(热尔科技公司(Thermo Fisher scientific),罗克福德,伊利诺斯州,美国),使用BSA作为标准品量化CCE蛋白。使用以下描述的一种或两种方案从CCE中测定表明的变体。
通过在340nm处测量相关的还原的辅因子随时间的出现来用NADP+或NAD+辅因子进行反向丝氨酸脱氢酶活性测定。在一个96孔微板中进行该测定,并且终体积是300μL。通过向270μL的测定缓冲液(100mM Tris pH8.0,10mM NaHCO3,5mM MgCl2,400mM L-丝氨酸以及2mM的NAD+或NADP+)中添加30μL的CCE(同上)起始该反应。在室温(~25℃)下,在一个微板读板机(Spectra Max340PC,分子设备LLC,桑尼维尔,加利福尼亚州,美国)上追踪在340nm处的吸光度,持续10分钟。将一单位定义为在pH8.0下、在25℃下、在L-丝氨酸的存在下,在一分钟内产生1μmol的NADH或NADPH所必需的酶的量。
与亲本大肠杆菌ydfG基因产物(表达自pMeJi9)和缺乏ydfG基因产物的对照(空表达载体pTrc99A)相比,使用丝氨酸脱氢酶测定的结果(参见表3)显示某些脱氢酶变体对NAD(H)比对NADP(H)具有增加的特异性。
表3.
通过在340nm处测量NADH或NADPH随时间的消失进行正向丙二酸半醛还原酶测定。根据由Yamada(山田)和Jacoby(雅各比)(1960)“Direct conversion of malonicsemialdehyde to acetyl-coenzyme A(丙二酸半醛向乙酰辅酶A的直接转化)”,J.Biol.Chem.(《生物化学杂志》),235(3):589-594研发的方案内部合成丙二酸半醛。在一个96孔微板中进行该测定,并且终体积是200μL。通过向170μL的测定缓冲液(2mM丙二酸半醛,100mM Tris pH8.0以及0.5mM NADH或NADPH)中添加30μL的CCE(同上)起始该反应。在室温(~25℃)下,在一个微板读板机(Spectra Max340PC,分子设备LLC)上追踪在340nm处的吸光度,持续10分钟。将一单位定义为在pH8.0下、在25℃下、在丙二酸半醛的存在下,在一分钟内产生1μmol的NADH或NADPH所必需的酶的量。
与亲本大肠杆菌ydfG基因产物(表达自pMeJi9)和缺乏ydfG基因产物的对照(空表达载体pTrc99A)相比,使用丙二酸半醛还原酶测定的结果(参见表4)显示某些3-HPDH变体对NAD(H)比对NADP(H)具有增加的特异性。
表4.
实例5:用于东方伊萨酵母YMR226c3-HPDH基因的表达载体的构建
质粒pMBin190(WO2012/074818)包含编码SEQ ID NO:4的3-HPDH的东方伊萨酵母YMR226c核苷酸序列,该序列两侧是NheI/PacI位点。将pMBin190质粒用NheI和PacI消化,凝胶分离并且使用Qiagen凝胶萃取试剂盒(凯捷公司)进行纯化,并且将827bp片段连接至用XbaI和XbaI消化、被凝胶分离并且使用Qiagen凝胶萃取试剂盒纯化的pMlBa107(WO2012/074818)的7942bp片段。使用T4DNA连接酶(新英格兰生物实验室)将包含东方伊萨酵母YMR226c多核苷酸的DNA片段克隆进pMIBa107中。该反应混合物包含1X T4DNA连接酶缓冲液、1μl T4DNA连接酶、1μl的上面的pMIBa107XbaI/PacI消化的DNA片段、以及5μl的上面的YMR226c NheI/PacI消化的产物,总体积为10μl。将该反应混合物在室温下孵育至少1小时并且随后根据制造厂商的指南,用来转化One Shot TOP10细胞(英杰公司)。在复苏期后,将来自该转化混合物的两个100μl等分部分放在补充有100μg氨比西林/ml的150mm2XYT板上并且在37℃下孵育过夜。将转化的重组菌落各自接种到3ml补充有氨比西林(100μg/ml)的LB培养基中。使用9600工作站(凯捷公司)从这些培养物中制备质粒DNA并且使其经受限制酶切消化检查。使来自具有正确限制酶切消化模式的一个克隆的质粒DNA进一步经受序列分析并且特指pMBin200。
使用两个设计用于为了整合进pTrc99A中而在5’端产生一个EcoRI限制酶切位点并且在3’端产生一个XmaI限制酶切位点的合成寡核苷酸引物通过PCR扩增东方伊萨酵母YMR226c编码序列(同上)。
将二十纳克的pMBin200质粒DNA用作PCR反应的模板,该反应进一步包括1XPhusion HF缓冲液,引物614967和614968每种五十皮摩尔,dATP、dGTP、dCTP、和dTTP每种0.2mM,以及2单位热启动高保真DNA聚合酶(Hot Start High-Fidelity DNA Polymerase)(Finnzymes公司,万塔(Vantaa),芬兰),最终体积为50μl。在 5333(艾本德科技公司)中进行扩增反应,编程为95℃、3分钟、一个循环;以及95℃、30秒钟,56.5℃、30秒钟,以及72℃、1分钟,各自30个循环。在30个循环以后,将该反应在72℃下孵育5分钟并且然后在10℃下冷却直到进一步处理。
使来自该PCR反应混合物的831bp PCR片段经受1%TBE-琼脂糖凝胶电泳,用在TBE缓冲液中的溴化乙锭,并且将该PCR产物从凝胶上切下并且使用NucleoSpin萃取II试剂盒(马歇雷-纳高公司(Macherey-Nagel))进行纯化。用EcoRI和XmaI(新英格兰生物实验室)消化纯化的片段并且用EcoRI和XmaI消化质粒pTrc99A,并且将生成的片段通过1%TBE-琼脂糖凝胶电泳进行分离,随后用DARK READERTM(克莱尔化学研究公司)进行可视化。用一次性剃须刀片将pTrc99A的所希望的4.16kb片段和819bp YMR226c片段从该凝胶切断并且使用NucleoSpin萃取II试剂盒(马歇雷-纳高公司)进行纯化。
使用T4DNA连接酶(新英格兰生物实验室)将包含东方伊萨酵母YMR226c编码序列的DNA片段克隆进pTrc99A中。该反应混合物包含1X T4DNA连接酶缓冲液、1μl T4DNA连接酶、1μl的上面的pTrc99A EcoRI/XmaI消化的DNA片段、以及15μl的上面的YMR226c EcoRI/XmaI消化的PCR产物,总体积为20μl。将该反应混合物在室温下孵育1小时并且随后根据制造厂商的指南,用其转化Solo Pack Gold感受态细胞(安捷伦科技公司)。在复苏期后,将来自该转化混合物的两个100μl等分部分放在补充有100μg氨比西林/ml的150mm2XYT板上并且在37℃下孵育过夜。将转化的重组菌落各自接种到3ml补充有氨比西林(100μg/ml)的LB培养基中。
使用9600工作站(workstation)(凯捷公司)从这些培养物中制备质粒DNA并且在EcoRI/XmaI消化后通过1%TBE-琼脂糖凝胶电泳进行分析。使来自特指的pMcTs103并且具有正确的限制酶切消化模式的一个克隆的质粒DNA进一步经受序列分析,以确认正确的YMR226c编码序列的整合。从测序中确定这一YMR226c编码序列与预期的基因组序列存在1个碱基对的区别。
为了校正在pMcTs103中的1个碱基对突变,将pMcTs103用作模板DNA在PCR反应中进行定点诱变,使用QuikChange II XL定点诱变试剂盒(安捷伦科技公司),如上所述使用引物615428和614429。
将转化的重组菌落各自接种到3ml补充有氨比西林(100μg/ml)的LB培养基中。使用9600工作站(凯捷公司)从这些培养物中制备质粒DNA并且使其经受序列分析,以确认在YMR226c编码序列中的定点突变。将具有基于测序的正确序列的克隆命名为pMcTs107。
实例6:东方伊萨酵母YMR226c3-HPDH基因变体的构建
基于实例4中所示的发现,使用亲本东方伊萨酵母YMR226c同系物(SEQ ID NO:4)构建另外的3-HPDH基因变体。
将pMcTs107(同上)用作PCR反应的模板DNA进行定点诱变,使用QuikChange II XL定点诱变试剂盒(安捷伦科技公司),如上所述使用引物615006和615007,设计为制造分别在SEQ ID NO:4的位置45和46(对应于SEQ ID NO:2的位置31和32)处的天冬氨酸和亮氨酸的氨基酸取代,这形成变体突变体26(SEQ ID NO:80)。
使转化的重组菌落经受序列分析,以确认在YMR226c编码序列中的定点取代。将具有编码变体突变体26(SEQ ID NO:80)的正确序列的克隆命名为pMcTs110。
在PCR反应中,以pMcTs110进行定点诱变,使用QuikChange II XL定点诱变试剂盒(安捷伦科技公司),如上所述使用引物615004和615005,设计为在SEQ ID NO:80的位置20(对应于SEQ ID NO:2的位置9)处引入甘氨酸的氨基酸取代,这形成变体突变体27(SEQ IDNO:81)。
使转化的重组菌落经受序列分析,以确认在YMR226c编码序列中的定点取代并且将具有编码变体突变体27(SEQ ID NO:81)的正确序列的克隆命名为pMcTs112。
实例7:表达东方伊萨酵母YMR226c3-HPDH基因变体的细胞的辅因子特异性
在MG1655细胞中表达来自实例6的东方伊萨酵母基因变体并且使用如上所述的丙二酸半醛还原酶测定测量3-HPDH辅因子特异性。将结果示于下表5中。与表达自pMcTs107(SEQ ID NO:4)的亲本东方伊萨酵母YMR226c基因产物和缺乏YMR226c基因产物的对照(空表达载体pTrc99A)相比,,表达自pMcTs112(SEQ ID NO:81)的突变体27东方伊萨酵母YMR226c3-HPDH变体展示出对NAD(H)比对NADP(H)的增加的特异性。
表5.
实例8:用于在东方伊萨酵母adh9091基因座整合东方伊萨酵母YMR226c3-HPDH基因的表达载体的构建
使用设计以添加旁侧5’NheI和3’PacI限制酶切位点的引物,从pMcTs107(同上)中扩增东方伊萨酵母YMR2263-HPDH编码序列。将五十纳克的pMcTs107质粒DNA用作PCR反应的模板,该反应进一步包括1X Phusion HF缓冲液,引物615485和615486每种五十皮摩尔,dATP、dGTP、dCTP、和dTTP每种0.2mM,以及2单位热启动高保真DNA聚合酶(Finnzymes公司),最终体积为50μl。在 5333(艾本德科技公司)中进行扩增反应,编程为95℃、3分钟、一个循环;以及95℃、30秒钟,55℃、30秒钟,以及72℃、1分钟,各自30个循环。在30个循环以后,将该反应在72℃下孵育5分钟并且然后在10℃下冷却直到进一步处理。
使来自该PCR反应混合物的837bp PCR片段经受1%TBE-琼脂糖凝胶电泳,用在TBE缓冲液中的溴化乙锭,并且将该PCR产物从凝胶上切割并且使用NucleoSpin萃取II试剂盒(马歇雷-纳高公司)进行纯化。用NheI和PacI(新英格兰生物实验室)消化纯化的片段并且用XbaI和PacI消化质粒pMBin204(WO2012/074818),并且将生成的片段通过1%TBE-琼脂糖凝胶电泳进行分离,随后用DARK READERTM(克莱尔化学研究)进行可视化。将pMBin204的所希望的8.4kb片段和827bp YMR226c片段从该凝胶切割并且使用NucleoSpin萃取II试剂盒(马歇雷-纳高公司)进行纯化。
使用T4DNA连接酶(新英格兰生物实验室)将包含东方伊萨酵母YMR226c3-HPDH(SEQ ID NO:4)的编码序列的DNA片段克隆进pMBin204中。该反应混合物包含1X T4DNA连接酶缓冲液、1μl T4DNA连接酶、1μl的上面的pMBin204XbaI和PacI消化的DNA片段、以及5μl的上面的YMR226c NheI和PacI消化的PCR产物,总体积为20μl。将该反应混合物在室温下孵育1小时并且随后根据制造厂商的指南,用来转化One Shot TOP10细胞(英杰公司)。在复苏期后,将来自该转化混合物的两个100μl等分部分放在补充有100μg氨比西林/ml的150mm2XYT板上并且在37℃下孵育过夜。将转化物的重组菌落各自接种到3ml补充有氨比西林(100μg/ml)的LB培养基中。
使用9600工作站(凯捷公司)从这些培养物中制备质粒DNA并且通过限制酶切消化进行分析。使来自具有正确的限制酶切消化模式的一个克隆的质粒DNA进一步经受序列分析,以确认正确的YMR226c编码序列,将该质粒DNA指定为pMcTs108(图5)。
实例9:用于在东方伊萨酵母adh9091基因座整合东方伊萨酵母YMR226c3-HPDH基因变体的表达载体的构建
使用设计以添加旁侧5’NheI和3’PacI限制酶切位点的引物,从pMcTs112(同上)扩增东方伊萨酵母YMR226变体突变体27(SEQ ID NO:81)的编码序列。将五十纳克的pMcTs112质粒DNA用作PCR反应的模板,该反应进一步包括1X Phusion HF缓冲液,引物615485和615486每种五十皮摩尔,dATP、dGTP、dCTP、和dTTP每种0.2mM,以及2单位热启动高保真DNA聚合酶((Finnzymes公司),最终体积为50μl。在 5333(艾本德科技公司)中进行扩增反应,编程为95℃、3分钟、一个循环;以及95℃、30秒钟,55℃、30秒钟以及72℃、1分钟,各自30个循环。在30个循环以后,将该反应在72℃下孵育5分钟并且然后在10℃下冷却直到进一步处理。
使来自PCR反应混合物的837bp PCR片段经受1%TBE-琼脂糖凝胶电泳,用在TBE缓冲液中的溴化乙锭,并且将该PCR产物从凝胶上切下并且使用NucleoSpin萃取II试剂盒(马歇雷-纳高公司)进行纯化。用NheI和PacI(新英格兰生物实验室)消化纯化的片段并且用XbaI和PacI消化质粒pMBin204,并且将生成的片段通过1%TBE-琼脂糖凝胶电泳进行分离,随后用DARK READERTM(克莱尔化学研究)进行可视化。将pMBin204的所希望的8.4kb片段和827bp YMR226c变体片段从该凝胶切割并且使用NucleoSpin萃取II试剂盒(马歇雷-纳高公司)进行纯化。
使用T4DNA连接酶(新英格兰生物实验室)将包含东方伊萨酵母YMR226c3-HPDH变体突变体27的编码序列的DNA片段克隆进pMBin204中。该反应混合物包含1X T4DNA连接酶缓冲液、1μl T4DNA连接酶、1μl的上面的pMBin204XbaI和PacI消化的DNA片段、以及10μl的上面的YMR226c变体NheI和PacI消化的PCR产物,总体积为20μl。将该反应混合物在室温下孵育1小时并且随后根据制造厂商的指南,用来转化One Shot TOP10细胞(英杰公司)。在复苏期后,将来自该转化混合物的两个100μl等分部分放在补充有100μg氨比西林/ml的150mm2XYT板上并且在37℃下孵育过夜。将转化物的重组菌落各自接种到3ml补充有氨比西林(100μg/ml)的LB培养基中。
使用9600工作站(凯捷公司)从这些培养物中制备质粒DNA并且通过限制酶切消化进行分析。使来自具有正确的限制酶切消化模式的一个克隆的质粒DNA进一步经受序列分析,以确认正确的YMR226c编码序列并且特指pMcTs116(图6)。
实例10:用于在东方伊萨酵母adh9091基因座整合大肠杆菌ydfG3-HPDH基因的表达载体的构建
大肠杆菌ydfG3-HPDH的编码序列针对东方伊萨酵母DNA进行密码子优化,使两侧是5’XbaI位点和3’PacI限制酶切位点,并且由GeneArt提供于特指质粒p1045168中(图7)。将质粒p1045168和pMBin204(WO2012/074818)单独用XbaI和XbaI消化,并且通过1%TBE-琼脂糖凝胶电泳将生成的片段进行分离并且用DARK READERTM(克莱尔化学研究公司)可视化。将pMBin204的所希望的8.4kb片段和761bp大肠杆菌ydfG片段从该凝胶切割并且使用NucleoSpin萃取II试剂盒(马歇雷-纳高公司)进行纯化。
使用T4DNA连接酶(新英格兰生物实验室)将包含大肠杆菌ydfG3-HPDH(SEQ IDNO:2)的编码序列的DNA片段克隆进pMBin204中。该反应混合物包含1X T4DNA连接酶缓冲液、1μl T4DNA连接酶、1μl的上面的pMBin204XbaI和PacI消化的DNA片段、以及10μl的大肠杆菌ydfG产物,总体积为20μl。将该反应混合物在室温下孵育1小时并且随后根据制造厂商的指南,用来转化One Shot TOP10细胞(英杰公司)。在复苏期后,将来自该转化混合物的两个100μl等分部分放在补充有100μg氨比西林/ml的150mm2XYT板上并且在37℃下孵育过夜。将转化物的重组菌落各自接种到3ml补充有氨比西林(100μg/ml)的LB培养基中。
使用9600工作站(凯捷公司)从这些培养物中制备质粒DNA并且通过限制酶切消化进行分析。将来自具有正确限制酶切消化模式的一个克隆的质粒DNA指定为pMcTs77(图8)。
实例11:用于在东方伊萨酵母adh9091基因座整合大肠杆菌ydfG3-HPDH基因变体的表达载体的构建
大肠杆菌ydfG3-HPDH变体突变体6(SEQ ID NO:12)的编码序列针对东方伊萨酵母DNA进行密码子优化,使两侧是5’XbaI位点和3’PacI限制酶切位点并且由GeneArt提供于特指质粒p11AAT5WP中(图9)。将五十纳克的p11AAT5WP DNA用作PCR反应的模板,该反应进一步包括1X扩展缓冲液(Expand buffer),引物614697和614698每种五十皮摩尔,dATP、dGTP、dCTP、和dTTP每种0.2mM,以及2.6单位扩展高保真聚合酶(Expand High FidelityPolymerase)(罗氏公司),最终体积为50μl。在 5333(艾本德科技公司)中进行扩增反应,编程为95℃、2分钟、一个循环;以及95℃、30秒钟,55℃、30秒钟,以及72℃、1分钟,各自30个循环。在30个循环以后,将该反应在72℃下孵育5分钟并且然后在10℃下冷却直到进一步处理。
将783bp PCR片段用XbaI和PacI消化并且将其克隆进入也用XbaI和PacI消化的pMBin204(同上)的8.4kb片段中。通过限制酶切消化和测序筛选重组克隆并且将具有正确序列的克隆指定为pMcTs78(图10)。
使质粒p1045168(同上;也参见图7)经受定点诱变,使用如上所述的引物615892和615893,以将野生型大肠杆菌ydfG3-HPDH(SEQ ID NO:2)的编码序列改变成包含取代G31D和R32L的大肠杆菌ydfG3-HPDH变体突变体25(SEQ ID NO:33)的编码序列。对转化的重组菌落进行测序并且将编码具有正确氨基酸变化的3-HPDH的克隆命名为pMcTs111。
质粒pMcTs111经受定点诱变,使用如上所述的引物615890和615891,以将大肠杆菌ydfG3-HPDH变体突变体25(SEQ ID NO:33)的编码序列改变成包含另外的T9G取代的大肠杆菌ydfG3-HPDH变体突变体22(SEQ ID NO:30)的编码序列。对转化的重组菌落进行测序并且将编码具有正确氨基酸变化的3-HPDH的克隆命名为pMcTs111。对转化的重组菌落进行测序并且将编码具有正确氨基酸变化的3-HPDH的克隆命名为pMcTs113。
通过用XbaI和PacI消化pMcTs113并且将生成的pMcTs113的761bp片段连接至同样用XbaI和PacI消化的pMBin204的8.4kbp片段来将大肠杆菌ydfG3-HPDH变体突变体22(SEQID NO:30)的编码序列克隆进pMBin204中,如上所述。通过限制酶切消化和测序筛选重组克隆并且将具有正确序列的克隆指定为pMcTs115(图11)。
实例12:用于在东方伊萨酵母adh9091基因座整合恶臭假单胞菌mmsB3-HPDH的表达载体的构建
恶臭假单胞菌mmsB3-HPDH(SEQ ID NO:82)的编码序列针对东方伊萨酵母DNA进行密码子优化,使两侧是5’XbaI位点和3’PacI限制酶切位点并且由GeneArt提供于特指质粒p11AA2GJP中(图12)。将质粒p11AA2GJP用XbaI和PacI消化并且将898bp片段克隆进同样用XbaI和PacI消化的pMBin204的8.4kb片段中,如上所述。通过限制酶切消化和测序筛选若干重组克隆。将具有正确序列的一个克隆指定为pMcTs102(图13)。
实例13:包含主动3-HP途径并且在东方伊萨酵母adh9091基因座处表达3-HPDH的宿主菌株的构建
将大约10μg的如上的每种整合构建体pMcTs77、pMcTs78、pMcTs102、pMcTs115单独地用ApaI和KpnI消化并且通过凝胶电泳在1%琼脂糖凝胶上进行分离,使用89mM Tris碱-89mM硼酸-2mM二钠EDTA(TBE)缓冲液。将大约10μg的每种整合构建体pMcTs108和pMcTs116用ApaI和SacI消化并且通过凝胶电泳在1%琼脂糖凝胶上进行分离,使用TBE缓冲液。将pMcTs77、pMcTs78、以及pMcTs115的大约5348bp;pMcTs102的大约5485bp;以及pMcTs108和pMcTs116的大约5408bp的片段切割并且根据制造厂商的指南,使用QIAquick凝胶萃取试剂盒(凯捷公司)进行萃取。将来自质粒pMcTs77、pMcTs78、pMcTs102、pMcTs115、pMcTs116、pMcTs108的线性构建体转化进菌株McTs259(包含主动3-HP途径,但是对于天然东方伊萨酵母YMR226c3-HPDH基因而言具有缺失;参见WO2012/074818)中。针对整合位点对来自每个转化的若干单一的分离物进行筛选,以及确认其他基因座仍是被修饰的。根据制造厂商的指南,使用Plant Direct PCR试剂盒(Finnzymes公司)通过PCR确认在adh9091处的整合,用引物614627+612909和612908+614626。针对pMcTs77、pMcTs78、pMcTs102、pMcTs115、pMcTs116、以及pMcTs108整合体,使用引物612908+614626的PCR产物大约是1.97kb。针对pMcTs102整合体,使用引物614627+612909的PCR产物大约是3.4kb并且针对pMcTs77、pMcTs78、pMcTs102、pMcTs115、pMcTs116、pMcTs108,使用引物614627+612909的PCR产物大约是3.3kb。使用针对adh1202基因座的引物组611245+612794和611815+612795、以及针对YMR226c基因座的引物组613034+613241证实存在的adh1202基因座和YMR226c基因座的完整性。如下表6所示,设计具有用于PCR的正确尺寸条带的转化体。
表6.
质粒 3-HPDH基因 产生的宿主菌株
pMcTs77 大肠杆菌ydfG(wt) McTs263
pMcTs78 大肠杆菌突变体6 McTs265
pMcTs102 恶臭假单胞菌mmsB McTs276
pMcTs115 大肠杆菌突变体22 ShTh100
pMcTs116 东方伊萨酵母突变体27 ShTh101
pMcTs108 东方伊萨酵母YMR226c(wt) MBin556
实例14:由包含主动3-HP途径并且在东方伊萨酵母adh9091基因座处表达3-HPDH的宿主菌株产生3-HP
使如上菌株McTs263、McTs265、McTs276、ShTh100、ShTh101、以及MBin556在摇瓶中生长并且如在WO2012/074818中所述针对辅因子特异性(同上)和3-HP生产对样品进行分析。针对3-HPDH活性和3-HP生产还对描述于WO2012/074818中的对照菌株MeJi412(包含主动3-HP途径,该途径包括天然东方伊萨酵母YMR226c3-HPDH基因)和McTs244(包含主动3-HP途径,但是对于天然东方伊萨酵母YMR226c3-HPDH基因而言具有缺失)进行分析。表7中的结果显示东方伊萨酵母YMR226c基因的缺失没有形成可检测的3-HP生产并且显示使用编码对NAD(H)具有增加的特异性的3-HPDH的基因的一个拷贝可以恢复3-HP生产。
表7.
在此描述并且要求的本发明不限于在此披露的具体方面的范围,因为这些方面意图作为本发明若干方面的说明。预期任何等效方面都处于本发明的范围内。实际上,除在此所示和描述的那些之外,本发明的不同修改对于本领域普通技术人员来说从前述描述将变得清楚。这类修改也旨在落入所附权利要求书的范围内。在有冲突的情况下,以包括定义的本披露为准。
在一些方面中,本发明可以由以下已编号的段落描述:
[1]一种3-HPDH变体,在对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36处的一个或多个(若干个)位置处包括取代;
其中该变体与SEQ ID NO:2、4、或6具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列一致性;并且其中该变体具有3-HPDH活性。
[2]如段落[1]所述的变体,该变体是一种选自以下的亲本3-HPDH的变体:
a.一种与SEQ ID NO:2、4、或6具有至少60%序列一致性的多肽;
b.一种由以下多核苷酸编码的多肽,该多核苷酸在低严谨度条件下与具有SEQ IDNO:1、3、5的多核苷酸或其全长互补体杂交;以及
c.一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、3、或5具有至少60%序列一致性。
[3]如段落[2]所述的变体,其中该亲本3-HPDH与SEQ ID NO:2、4、或6具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
[4]如段落[2]或[3]所述的变体,其中该亲本3-HPDH由以下多核苷酸编码,该多核苷酸在至少低严谨度条件下,例如中严谨度条件下、中-高严谨度条件下、高严谨度条件下、或非常高严谨度条件下与具有SEQ ID NO:1、3、5的多核苷酸、或其全长互补体杂交。
[5]如段落[2]-[4]中任一段落所述的变体,其中该亲本3-HPDH由以下多核苷酸编码,该多核苷酸与SEQ ID NO:1、3、或5具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[6]如段落2-5中任一段落所述的变体,其中该亲本3-HPDH包括SEQ ID NO:2、4、或6或由其组成。
[7]如段落[2]-[6]中任一段落所述的变体,该变体与亲本3-HPDH的氨基酸序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%一致性、至少96%、至少97%、至少98%、或至少99%序列一致性。
[8]如段落[1]-[7]中任一段落所述的变体,其中取代的数目是1-20个,例如1-10个或1-5个,如1、2、3、4、5、6、7、8、9或10个取代。
[9]如段落[1]-[8]中任一段落所述的变体,在对应于SEQ ID NO:2的位置9的位置处包括取代。
[10]如段落[1]-[9]中任一段落所述的变体,在对应于SEQ ID NO:2的位置9的位置处包括Gly。
[11]如段落[1]-[10]中任一段落所述的变体,在对应于SEQ ID NO:2的位置31的位置处包括取代。
[12]如段落[1]-[11]中任一段落所述的变体,在对应于SEQ ID NO:2的位置31的位置处包括Asp或Glu。
[13]如段落[1]-[12]中任一段落所述的变体,在对应于SEQ ID NO:2的位置32的位置处包括取代。
[14]如段落[1]-[13]中任一段落所述的变体,在对应于SEQ ID NO:2的位置32的位置处包括Leu。
[15]如段落[1]-[14]中任一段落所述的变体,在对应于SEQ ID NO:2的位置33的位置处包括取代。
[16]如段落[1]-[15]中任一段落所述的变体,在对应于SEQ ID NO:2的位置33的位置处包括Ser或Asn。
[17]如段落[1]-[16]中任一段落所述的变体,在对应于SEQ ID NO:2的位置34的位置处包括取代。
[18]如段落[1]-[17]中任一段落所述的变体,在对应于SEQ ID NO:2的位置34的位置处包括Ala或Pro。
[19]如段落[1]-[18]中任一段落所述的变体,在对应于SEQ ID NO:2的位置35的位置处包括取代。
[20]如段落[1]-[19]中任一段落所述的变体,在对应于SEQ ID NO:2的位置35的位置处包括Ala或Asp。
[21]如段落[1]-[20]中任一段落所述的变体,在对应于SEQ ID NO:2的位置36的位置处包括取代。
[22]如段落[1]-[21]中任一段落所述的变体,在对应于SEQ ID NO:2的位置36的位置处包括Ala。
[23]如段落[1]-[22]中任一段落所述的变体,在对应于SEQ ID NO:2的任何位置9、31、32、33、34、35、以及36的位置处包括至少两个取代。
[24]如段落[1]-[22]中任一段落所述的变体,在对应于SEQ ID NO:2的任何位置9、31、32、33、34、35、以及36的位置处包括至少三个取代。
[25]如段落[1]-[22]中任一段落所述的变体,在对应于SEQ ID NO:2的任何位置9、31、32、33、34、35、以及36的位置处包括至少四个取代。
[26]如段落[1]-[22]中任一段落所述的变体,在对应于SEQ ID NO:2的任何位置9、31、32、33、34、35、以及36的位置处包括至少五个取代。
[27]如段落[1]-[22]中任一段落所述的变体,在对应于SEQ ID NO:2的任何位置9、31、32、33、34、35、以及36的位置处包括至少六个取代。
[28]如段落[1]-[22]中任一段落所述的变体,在对应于SEQ ID NO:2的位置9、31、32、33、34、35、以及36的位置处包括七个取代。
[29]如段落[1]-[24]中任一段落所述的变体,包括对应于SEQ ID NO:2的位置的一个或多个选自以下的取代:T/S9G、G/A31D/E、R32L、R33S/N、L/K/Q34A/P、E35D/A、以及K/R36A。
[30]如段落[1]-[29]中任一段落所述的变体,在对应于SEQ ID NO:2的位置10的位置处进一步包括缺失。
[31]如段落[1]-[30]中任一段落所述的变体,其中该变体包括SEQ ID NO:7、8、9、10、11、12、13、14、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、80、或81或由其组成。
[32]如段落[1]-[31]中任一段落所述的变体,其中与NADP(H)相比,该变体对NAD(H)具有增加的特异性(例如,与NADP(H)相比,针对NAD(H)的大于2倍、5倍、10倍、20倍、50倍、100倍、200倍、500倍、或1000倍的特异性)。
[33]如段落[1]-[32]中任一段落所述的变体,其中该变体被分离。
[34]一种编码如段落[1]-[32]中任一段落所述的变体的多核苷酸(例如,分离的多核苷酸)。
[35]一种核酸构建体,包括如段落[34]所述的多核苷酸。
[36]一种表达载体,包括如段落[34]所述的多核苷酸。
[37]一种宿主细胞,包括如段落[35]所述的多核苷酸。
[38]一种产生3-HPDH变体的方法,包括:
a.在适于表达该变体的条件下培养如段落[37]所述的宿主细胞;并且
b.回收该变体。
[39]一种用如段落[34]所述的多核苷酸转化的转基因植物、植物部分或植物细胞。
[40]一种产生如段落[1]-[34]中任一段落所述的变体的方法,包括:
a.在有益于生产该变体的条件下,培养包括编码该变体的多核苷酸的一种转基因植物或一种植物细胞;并且
b.回收该变体。
[41]一种用于获得如段落[1]-[34]中任一段落所述的3-HPDH变体的方法,该方法包括在对应于SEQ ID NO:2的位置9、31、32、33、34、35、以及36的一个或多个位置处,在亲本3-HPDH中引入取代;并且回收该变体。
[42]一种具有3-HPDH活性的多肽,其中该多肽是:
a.一种与SEQ ID NO:2、4、或6具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%序列一致性的多肽;
b.一种由以下多核苷酸编码的多肽,该多核苷酸在低严谨度条件下,例如中严谨度条件下、中-高严谨度条件下、高严谨度条件下、或非常高严谨度条件下与具有SEQ IDNO:1、3、5的多核苷酸或其全长互补体杂交;或
c.一种由以下多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1、3、或5具有至少60%序列一致性;
并且其中与NADP(H)相比,该多肽对NAD(H)具有增加的特异性(例如,与NADP(H)相比,针对NAD(H)的大于2倍、5倍、10倍、20倍、50倍、100倍、200倍、500倍、或1000倍的特异性)。
[43]如段落[42]所述的多肽,与SEQ ID NO:2具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[44]如段落[42]或[43]所述的多肽,该多肽由以下多核苷酸编码,该多核苷酸在至少低严谨度条件下,例如中严谨度条件下、中-高严谨度条件下、高严谨度条件下、或非常高严谨度条件下与具有SEQ ID NO:1的多核苷酸或其全长互补体杂交。
[45]如段落[42]-[44]中任一段落所述的多肽,该多肽与SEQ ID NO:1具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[46]如段落[42]-[45]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少一个与SEQ ID NO:2不同。
[47]如段落[42]-[45]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少两个与SEQ ID NO:2不同。
[48]如段落[42]-[45]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少三个与SEQ ID NO:2不同。
[49]如段落[42]-[45]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少四个与SEQ ID NO:2不同。
[50]如段落[42]-[45]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少五个与SEQ ID NO:2不同。
[51]如段落[42]-[45]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少六个与SEQ ID NO:2不同。
[52]如段落[42]-[45]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中所有位置与SEQ ID NO:2不同。
[53]如段落[42]-[52]中任一段落所述的多肽,与SEQ ID NO:4具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[54]如段落[42]-[53]中任一段落所述的多肽,该多肽由以下多核苷酸编码,该多核苷酸在至少低严谨度条件下,例如中严谨度条件下、中-高严谨度条件下、高严谨度条件下、或非常高严谨度条件下与具有SEQ ID NO:3的多核苷酸或其全长互补体杂交。
[55]如段落[42]-[54]中任一段落所述的多肽,该多肽由以下多核苷酸编码,该多核苷酸与SEQ ID NO:3具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[56]如段落[42]-[56]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少一个与SEQ ID NO:4不同。
[57]如段落[42]-[55]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少两个与SEQ ID NO:4不同。
[58]如段落[42]-[55]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少三个与SEQ ID NO:4不同。
[59]如段落[42]-[55]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少四个与SEQ ID NO:4不同。
[60]如段落[42]-[55]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少五个与SEQ ID NO:4不同。
[61]如段落[42]-[55]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少六个与SEQ ID NO:4不同。
[62]如段落[42]-[55]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中所有位置与SEQ ID NO:4不同。
[63]如段落[42]-[62]中任一段落所述的多肽,与SEQ ID NO:6具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[64]如段落[42]-[63]中任一段落所述的多肽,该多肽由以下多核苷酸编码,该多核苷酸在至少低严谨度条件下,例如中严谨度条件下、中-高严谨度条件下、高严谨度条件下、或非常高严谨度条件下与具有SEQ ID NO:5的多核苷酸或其全长互补体杂交。
[65]如段落[42]-[64]中任一段落所述的多肽,该多肽由以下多核苷酸编码,该多核苷酸与SEQ ID NO:5具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[66]如段落[42]-[65]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少一个与SEQ ID NO:6不同。
[67]如段落[42]-[65]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少两个与SEQ ID NO:6不同。
[68]如段落[42]-[65]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少三个与SEQ ID NO:6不同。
[69]如段落[42]-[65]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少四个与SEQ ID NO:6不同。
[70]如段落[42]-[65]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少五个与SEQ ID NO:6不同。
[71]如段落[42]-[65]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中至少六个与SEQ ID NO:6不同。
[72]如段落[42]-[65]中任一段落所述的多肽,其中对应于SEQ ID NO:2的位置9、31、32、33、34、35以及36中所有位置与SEQ ID NO:6不同。
[73]如段落[42]-[72]中任一段落所述的多肽,在对应于SEQ ID NO:2的位置9的位置处包括Gly。
[74]如段落[42]-[73]中任一段落所述的多肽,在对应于SEQ ID NO:2的位置31的位置处包括Asp或Glu。
[75]如段落[42]-[74]中任一段落所述的多肽,在对应于SEQ ID NO:2的位置32的位置处包括Leu。
[76]如段落[42]-[75]中任一段落所述的多肽,在对应于SEQ ID NO:2的位置33的位置处包括Ser或Asn。
[77]如段落[42]-[76]中任一段落所述的多肽,在对应于SEQ ID NO:2的位置34的位置处包括Ala或Pro。
[78]如段落[42]-[77]中任一段落所述的多肽,在对应于SEQ ID NO:2的位置35的位置处包括Ala或Asp。
[79]如段落[42]-[78]中任一段落所述的多肽,在对应于SEQ ID NO:2的位置36的位置处包括Ala。
[80]如段落[42]-[79]中任一段落所述的多肽,在对应于SEQ ID NO:2的位置10的位置处包括缺失。
[81]如段落[42]-[80]中任一段落所述的多肽,其中该多肽包括SEQ ID NO:7、8、9、10、11、12、13、14、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、80、或81或由其组成。
[82]如段落[42]-[82]中任一段落所述的多肽,其中该多肽被分离。
[83]一种编码如段落[42]-[82]中任一段落所述的多肽的多核苷酸(例如,分离的多核苷酸)。
[84]一种核酸构建体,包括如段落[83]所述的多核苷酸。
[85]一种表达载体,包括如段落[83]所述的多核苷酸。
[86]一种宿主细胞,包括如段落[83]所述的多核苷酸。
[87]一种产生如段落[42]-[82]中任一段落所述的多肽的方法,包括:
a.在适于表达该多肽的条件下培养包括编码该多肽的多核苷酸的宿主细胞;并且
b.回收该多肽。
[88]一种用如段落[83]所述的多核苷酸转化的转基因植物、植物部分或植物细胞。
[89]一种产生如段落[42]-[82]中任一段落所述的多肽的方法,包括:
a.在有益于生产该多肽的条件下,培养包括编码该多肽的多核苷酸的一种转基因植物或一种植物细胞;并且
b.回收该变体。
[90]一种用于获得如段落[42]-[82]中任一段落所述的多肽的方法,该方法包括在对应于SEQ ID NO:2的位置9、31、32、33、34、35、以及36的一个或多个位置处,在亲本3-HPDH中引入取代;并且回收该多肽。
[91]如段落[37]或[86]所述的宿主细胞,其中细胞是原核的。
[92]如段落[37]或[86]所述的宿主细胞,其中细胞是真核的。
[93]如段落[92]所述的宿主细胞,其中该细胞是酵母细胞。
[94]如段落[93]所述的宿主细胞,其中该细胞属于选自以下属:伊萨酵母属、假丝酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、有孢圆酵母属、接合酵母属、以及酵母菌属。
[95]如段落[94]所述的宿主细胞,其中该细胞选自东方伊萨酵母、郎比可假丝酵母、以及博伊丁酵母。
[96]如段落[37]、[86]、或[91]-[95]中任一段落所述的宿主细胞,其中该细胞包括主动3-HP途径。
[97]如段落[37]、[86]、或[91]-[96]中任一段落所述的宿主细胞,其中该细胞包括:
PEP羧化酶活性或丙酮酸羧化酶活性;
天冬氨酸转氨酶活性;
天冬氨酸脱羧酶活性;以及
β-丙氨酸/α-酮戊二酸转氨酶(BAAT)活性。
[98]如段落[37]、[86]、或[91]-[97]所述的宿主细胞,其中该细胞包括一个或多个选自以下的异源多核苷酸:
一种编码PEP羧化酶的异源多核苷酸,
一种编码丙酮酸羧化酶的异源多核苷酸,
一种编码天冬氨酸转氨酶的异源多核苷酸,
一种编码天冬氨酸脱羧酶的异源多核苷酸,以及
一种编码BAAT的异源多核苷酸。
[99]一种生产3-HP的方法,包括:
a.在有益于生产3-HP的条件下培养如段落[37]、[86]、以及[91]-[98]中任一段落所述的宿主细胞;并且
b.回收该3-HP。
[100]一种宿主细胞,包括主动3-HP途径以及编码3-HPDH的异源多核苷酸,该异源多核苷酸与SEQ ID NO:82具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[101]如段落[100]所述的宿主细胞,其中细胞是原核的。
[102]如段落[100]所述的宿主细胞,其中该细胞是真核的。
[103]如段落[102]所述的宿主细胞,其中该细胞是酵母细胞。
[104]如段落[103]所述的宿主细胞,其中该细胞属于选自以下属:伊萨酵母属、假丝酵母属、克鲁维酵母属、毕赤酵母属、裂殖酵母属、有孢圆酵母属、接合酵母属、以及酵母菌属。
[105]如段落[104]所述的宿主细胞,其中该细胞选自东方伊萨酵母、郎比可假丝酵母、以及博伊丁酵母。
[106]如段落[100]-[105]中任一段落所述的宿主细胞,其中该细胞包括:
PEP羧化酶活性或丙酮酸羧化酶活性;
天冬氨酸转氨酶活性;
天冬氨酸脱羧酶活性;以及
β-丙氨酸/α-酮戊二酸转氨酶(BAAT)活性。
[107]如段落[100]-[106]所述的宿主细胞,其中该细胞包括一个或多个选自以下的异源多核苷酸:
一种编码PEP羧化酶的异源多核苷酸,
一种编码丙酮酸羧化酶的异源多核苷酸,
一种编码天冬氨酸转氨酶的异源多核苷酸,
一种编码天冬氨酸脱羧酶的异源多核苷酸,以及
一种编码BAAT的异源多核苷酸。
[108]一种生产3-HP的方法,包括:
a.在有益于生产3-HP的条件下培养如段落[100]-[107]中任一段落所述的宿主细胞;并且
b.回收该3-HP。

Claims (10)

1.一种3-HPDH变体,其由SEQ ID NO:7、8、9、10、11、12、13、14、17、18、19、20、21、22、23、24、25、26、27、29、30、31、32、33、80、或81组成。
2.如权利要求1所述的变体,其中所述变体由SEQ ID NO:7、10、12、20、21、22、23、24、25、26、27、29、30、32、或81组成;并且所述的变体与NADP(H)相比,具有对NAD(H)增加的特异性。
3.一种分离的多核苷酸,该多核苷酸编码如权利要求1-2中任一项所述的变体。
4.一种包括主动3-HP途径以及异源多核苷酸的宿主细胞,该异源多核苷酸编码具有3-HPDH活性的3-HPDH变体,
其中该变体由SEQ ID NO:7、8、9、10、11、12、13、14、17、18、19、20、21、22、23、24、25、26、27、29、30、31、32、33、80、或81组成。
5.如权利要求4所述的宿主细胞,所述变体由SEQ ID NO:7、10、12、20、21、22、23、24、25、26、27、29、30、32或81组成;并且其中所述的变体与NADP(H)相比,具有对NAD(H)增加的特异性。
6.如权利要求4所述的宿主细胞,其中该细胞是一种酵母细胞。
7.权利要求4所述的宿主细胞,其中所述细胞为东方伊萨酵母细胞。
8.如权利要求4所述的宿主细胞,其中该细胞包括:
PEP羧化酶活性或丙酮酸羧化酶活性;
天冬氨酸转氨酶活性;
天冬氨酸脱羧酶活性;以及
β-丙氨酸/α-酮戊二酸转氨酶(BAAT)活性。
9.如权利要求4所述的宿主细胞,其中该宿主细胞包括一个或多个选自以下的异源多核苷酸:
一种编码PEP羧化酶的异源多核苷酸,
一种编码丙酮酸羧化酶的异源多核苷酸,
一种编码天冬氨酸转氨酶的异源多核苷酸,
一种编码天冬氨酸脱羧酶的异源多核苷酸,以及
一种编码BAAT的异源多核苷酸。
10.一种生产3-HP的方法,包括:
a.在有益于生产3-HP的条件下培养如权利要求4-9中任一项所述的宿主细胞;并且
b.回收该3-HP。
CN201280047868.6A 2011-09-30 2012-09-25 脱氢酶变体和编码它们的多核苷酸 Expired - Fee Related CN103857791B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161541363P 2011-09-30 2011-09-30
US61/541,363 2011-09-30
PCT/US2012/057134 WO2013049073A1 (en) 2011-09-30 2012-09-25 Dehydrogenase variants and polynucleotides encoding same

Publications (2)

Publication Number Publication Date
CN103857791A CN103857791A (zh) 2014-06-11
CN103857791B true CN103857791B (zh) 2016-11-23

Family

ID=47016840

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201280047868.6A Expired - Fee Related CN103857791B (zh) 2011-09-30 2012-09-25 脱氢酶变体和编码它们的多核苷酸

Country Status (10)

Country Link
US (3) US8728788B1 (zh)
EP (1) EP2751261B1 (zh)
JP (3) JP2014528726A (zh)
CN (1) CN103857791B (zh)
AU (1) AU2012316246B2 (zh)
BR (1) BR112014007647A2 (zh)
CA (1) CA2849303C (zh)
DK (1) DK2751261T3 (zh)
IN (1) IN2014CN03187A (zh)
WO (1) WO2013049073A1 (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2751261B1 (en) * 2011-09-30 2018-08-29 Novozymes, Inc. Dehydrogenase variants and polynucleotides encoding same
CN105431520A (zh) 2013-07-31 2016-03-23 诺维信公司 利用表达昆虫天冬氨酸1-脱羧酶的重组酵母的3-羟基丙酸生产
US20180273915A1 (en) * 2014-12-19 2018-09-27 Novozymes A/S Recombinant Host Cells For The Production Of 3-Hydroxypropionic Acid
US20180148744A1 (en) 2015-03-20 2018-05-31 Verdezyne, Inc. Biological methods for preparing 3-hydroxypropionic acid
WO2017035270A1 (en) 2015-08-24 2017-03-02 Novozymes A/S Beta-alanine aminotransferases for the production of 3-hydroxypropionic acid
WO2023168244A1 (en) * 2022-03-03 2023-09-07 Cargill, Incorporated Genetically modified yeast and fermentation processes for the production of 3-hydroxypropionate
WO2023168233A1 (en) * 2022-03-03 2023-09-07 Cargill, Incorporated Genetically modified yeast and fermentation processes for the production of 3-hydroxypropionate

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005118719A2 (en) * 2003-12-04 2005-12-15 Cargill, Incorporated Production of 3-hydroxypropionic acid using beta-alanine/pyruvate aminotransferase
WO2008027742A1 (en) * 2006-08-30 2008-03-06 Cargill, Incorporated Beta-alanine/alpha-ketoglutarate aminotransferase for 3-hydroxypropionic acid production
WO2011038364A1 (en) * 2009-09-27 2011-03-31 Opx Biotechnologies, Inc. Method for producing 3-hydroxypropionic acid and other products

Family Cites Families (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
NZ237549A (en) 1990-03-23 1993-06-25 Gist Brocades Nv Production of enhanced levels of enzymes in the seeds of transgenic plants and the use of these seeds
US6395966B1 (en) 1990-08-09 2002-05-28 Dekalb Genetics Corp. Fertile transgenic maize plants containing a gene encoding the pat protein
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
FR2704860B1 (fr) 1993-05-05 1995-07-13 Pasteur Institut Sequences de nucleotides du locus cryiiia pour le controle de l'expression de sequences d'adn dans un hote cellulaire.
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
EP0765394B1 (en) 1994-06-03 2001-10-04 Novo Nordisk Biotech, Inc. Purified myceliophthora laccases and nucleic acids encoding same
DE69534185T2 (de) 1994-06-30 2006-02-23 Novozymes Biotech, Inc., Davis Nicht-toxisches, nicht-toxigenes, nicht-pathogenes fusarium expressionssystem und darin zu verwendende promotoren und terminatoren
US5955310A (en) 1998-02-26 1999-09-21 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide in a bacillus cell
AU6188599A (en) 1998-10-26 2000-05-15 Novozymes A/S Constructing and screening a dna library of interest in filamentous fungal cells
CN100532561C (zh) 1999-03-22 2009-08-26 诺沃奇梅兹有限公司 新的葡糖淀粉酶及编码它的核酸序列
AU7093600A (en) 1999-08-30 2001-03-26 Wisconsin Alumni Research Foundation Production of 3-hydroxypropionic acid in recombinant organisms
CN1556855A (zh) 2000-11-20 2004-12-22 卡吉尔公司 3-羟基丙酸及其它有机化合物
US7151204B2 (en) 2001-01-09 2006-12-19 Monsanto Technology Llc Maize chloroplast aldolase promoter compositions and methods for use thereof
ATE375388T1 (de) 2001-07-27 2007-10-15 Us Gov Health & Human Serv Systeme zur stellengerichteten in-vivo-mutagenese mit oligonukleotiden
MXPA04006894A (es) 2002-01-18 2004-10-15 Cargill Inc Alanina 2,3 - aminomutasa.
CA2480152A1 (en) 2002-03-25 2003-10-09 Cargill, Incorporated Methods of manufacturing derivatives of .beta.-hydroxycarboxylic acids
CA2574280A1 (en) 2004-07-30 2006-03-02 Cargill, Incorporated Alanine 2, 3 aminomutases
MX2007004980A (es) 2004-10-25 2007-06-14 Codexis Inc Alanina 2,3-aminomutasas mejoradas, y polinucleotidos relacionados.
DE102005048818A1 (de) 2005-10-10 2007-04-12 Degussa Ag Mikrobiologische Herstellung von 3-Hydroxypropionsäure
CN101903513B (zh) 2007-01-12 2013-08-21 科罗拉多大学董事会法人 增强微生物对产生的有机化学物质的耐受性的组合物和方法
WO2008091627A2 (en) 2007-01-22 2008-07-31 Genomatica, Inc. Methods and organisms for growth-coupled production of 3-hydroxypropionic acid
WO2009089457A1 (en) 2008-01-11 2009-07-16 Novozymes A/S Methods for producing 3-hydroxypropionic acid and compounds thereof
US20100021978A1 (en) 2008-07-23 2010-01-28 Genomatica, Inc. Methods and organisms for production of 3-hydroxypropionic acid
WO2010031083A2 (en) 2008-09-15 2010-03-18 Opx Biotechnologies, Inc. Methods, systems and compositions related to reduction of conversions of microbially produced 3-hydroxypropionic acid (3-hp) to aldehyde metabolites
US20100151345A1 (en) 2008-12-17 2010-06-17 Saint-Gobain Ceramics & Plastics, Inc. Electrode Gas Channel Supports and Methods for Forming Internal Channels
KR20120129953A (ko) * 2010-02-12 2012-11-28 캘리포니아 인스티튜트 오브 테크놀로지 연료, 화학물질, 그리고 아미노산의 향상된 생산을 위한 감소된 부산물 축적을 갖는 효모 미생물
JP2012085635A (ja) * 2010-03-23 2012-05-10 Nippon Shokubai Co Ltd 3−ヒドロキシプロピオン酸の製造方法
CN107828671B (zh) 2010-11-22 2022-03-08 卡吉尔公司 用于生产3-羟基丙酸的组合物和方法
WO2013043758A2 (en) 2011-09-19 2013-03-28 Opx Biotechnologies, Inc. Compositions and methods regarding direct nadh utilization to produce 3-hydroxypropionic acid, derived chemicals and further derived products
EP2751261B1 (en) * 2011-09-30 2018-08-29 Novozymes, Inc. Dehydrogenase variants and polynucleotides encoding same

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005118719A2 (en) * 2003-12-04 2005-12-15 Cargill, Incorporated Production of 3-hydroxypropionic acid using beta-alanine/pyruvate aminotransferase
WO2008027742A1 (en) * 2006-08-30 2008-03-06 Cargill, Incorporated Beta-alanine/alpha-ketoglutarate aminotransferase for 3-hydroxypropionic acid production
WO2011038364A1 (en) * 2009-09-27 2011-03-31 Opx Biotechnologies, Inc. Method for producing 3-hydroxypropionic acid and other products

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
NADP-dependent l-serinel-allo-threonine dehydrogenase ydfg accession number:B1ELX0;Sutton G. et al.,;《EMBL》;20080429;第1-6页 *
产3-羟基丙酸重组菌的构建及其转化甘油的研究;张晓梅 等;《生物技术通报》;20091231(第8期);第104-108页 *

Also Published As

Publication number Publication date
CA2849303A1 (en) 2013-04-04
US20160017296A1 (en) 2016-01-21
JP2014528726A (ja) 2014-10-30
JP2019110916A (ja) 2019-07-11
CA2849303C (en) 2019-09-17
AU2012316246A1 (en) 2014-03-20
DK2751261T3 (en) 2018-12-10
US20140212938A1 (en) 2014-07-31
JP2018033457A (ja) 2018-03-08
EP2751261A1 (en) 2014-07-09
IN2014CN03187A (zh) 2015-07-03
AU2012316246B2 (en) 2017-10-26
CN103857791A (zh) 2014-06-11
BR112014007647A2 (pt) 2017-04-18
EP2751261B1 (en) 2018-08-29
WO2013049073A1 (en) 2013-04-04
US9163220B2 (en) 2015-10-20
US8728788B1 (en) 2014-05-20
US9404091B2 (en) 2016-08-02

Similar Documents

Publication Publication Date Title
CN103857791B (zh) 脱氢酶变体和编码它们的多核苷酸
CN103781910A (zh) α淀粉酶变体及其编码多核苷酸
CN104169417A (zh) 具有葡糖淀粉酶活性的多肽及其编码多核苷酸
CN103298932A (zh) 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸
CN105164253A (zh) 葡糖淀粉酶变体和编码它们的多核苷酸
US11180746B2 (en) Polypeptides having alpha-amylase activity and polynucleotides encoding same
CN107406821A (zh) 用于生产3‑羟基丙酸的突变宿主细胞
CN105934514A (zh) 角质酶变体以及对其进行编码的多核苷酸
CN104540394A (zh) 热稳定天冬酰胺酶变体以及对其进行编码的多核苷酸
CN102482658B (zh) 具有异淀粉酶活性的多肽和编码该多肽的多核苷酸
CN103797111A (zh) 用于正丙醇产生的微生物
CN107109347A (zh) 用于生产3‑羟基丙酸的重组宿主细胞
ES2632011T3 (es) Polipéptidos con actividad de alfa-amilasa y polinucleótidos que codifican los mismos
CN102869770A (zh) 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸
CN103080126B (zh) 具有c4-二羧酸转运蛋白活性的多肽和编码该多肽的多核苷酸
CN102459604B (zh) 来自加州海兔的dfp酶
US9476072B2 (en) Cutinase variants and polynucleotides encoding same
CN104364371B (zh) 具有有机磷水解酶活性的多肽
CN105793418A (zh) 过氧合酶变体
CN105121638A (zh) 葡糖淀粉酶变体和编码它们的多核苷酸
CN103764670A (zh) 具有葡糖淀粉酶活性的多肽和编码它的多核苷酸
CN103298359A (zh) 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸
CN102933596B (zh) 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸
CN105992818A (zh) 有机磷水解酶变体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20161123

Termination date: 20200925

CF01 Termination of patent right due to non-payment of annual fee