CN115175997A - 用于化学化合物的羟基化的生物催化剂和方法 - Google Patents

用于化学化合物的羟基化的生物催化剂和方法 Download PDF

Info

Publication number
CN115175997A
CN115175997A CN202080082591.5A CN202080082591A CN115175997A CN 115175997 A CN115175997 A CN 115175997A CN 202080082591 A CN202080082591 A CN 202080082591A CN 115175997 A CN115175997 A CN 115175997A
Authority
CN
China
Prior art keywords
seq
polypeptide
amino acid
sequence
engineered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080082591.5A
Other languages
English (en)
Inventor
乔纳森·弗罗姆
阿尔贝托·奥尔特加格拉
杰克·梁
格雷戈里·A·科普
尼基·德拉斯
克里斯托弗·凯尔蒂·普里尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Publication of CN115175997A publication Critical patent/CN115175997A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/24Proline; Hydroxyproline; Histidine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/11Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
    • C12Y114/11002Procollagen-proline dioxygenase (1.14.11.2), i.e. proline-hydroxylase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了用于产生羟基化化合物的工程化脯氨酸羟化酶多肽、编码该工程化脯氨酸羟化酶的多核苷酸、能够表达该工程化脯氨酸羟化酶的宿主细胞、以及使用该工程化脯氨酸羟化酶来制备可用于产生活性药剂的化合物的方法。

Description

用于化学化合物的羟基化的生物催化剂和方法
本申请要求2019年11月26日提交的美国临时专利申请序列第62/940,647号的优先权,该美国临时专利申请通过引用以其整体并入以用于所有目的。
技术领域
本发明涉及用于化学化合物的羟基化的生物催化剂。
对序列表、表格或计算机程序的引用
序列表的正式副本作为ASCII格式的文本文件经由EFS-Web与说明书同时提交,文件名为“CX2-193WO1_ST25.txt”,创建日期为2020年11月17日,且大小为1.39兆字节。经由EFS-Web提交的序列表是说明书的一部分并且通过引用以其整体并入本文。
背景
因为脯氨酸的受约束的构象,碳环上具有官能团的脯氨酸衍生物是用于合成药物化合物的有用构建单元(building block)。一种此类衍生物,羟基化的脯氨酸,是用于合成包括以下的多种治疗性化合物的起始材料:包括碳青霉烯类抗生素(参见例如,Altamura等人,J.Med.,Chem.38(21):4244-56[1995])、血管紧张素转换酶抑制剂、蛋白酶抑制剂(参见例如,Chen等人,J.Org.Chem.,67(8):2730-3[2002];Chen等人,2006,J Med Chem.49(3):995-1005)、核酸类似物(参见例如,Efimov等人,Nucleic Acids Res.,34(8):2247-2257[2006])、异戊二烯基转移酶抑制剂(O’Connell等人,Chem.Pharm.Bull.,48(5):740-742[2000])、以及药物文库构建(Vergnon等人,J.Comb.Chem.,6(1):91-8[2004];和Remuzon,Tetrahedron 52:13803-13835[1996])。
羟脯氨酸可从天然来源,诸如植物材料和胶原水解物获得。羟脯氨酸还可化学合成,诸如从起始材料烯丙基溴(allyl bromide)和二乙基乙酰氨基丙二酸(Kyun Lee等人,Bull.Chem.Soc.Japan,46:2924[1973])、D-谷氨酸(Eguchi等人,Bull.Chem.Soc.Japan,47:1704-08[1974])、乙二醛和草酰乙酸(Ramaswamy等人,J.Org.Chem.,42(21):3440-3443[1977])、和α-丙氨酸(Sinha等人,Proc.ECSOC-4,The Fourth International ElectronicConference on Synthetic Organic Chemistry,ISBN 3-906980-05-7[2000])。
从天然来源的分离受到原材料的可用性限制,需要从大量的背景污染物纯化,且缺少某些期望的非对映异构体。化学合成方法可需要复杂的步骤,难以扩大至工业规模水平,并且由于形成多种羟基化产物而需要另外的纯化步骤。
用于制备羟基化脯氨酸的另一种方法使用脯氨酸羟化酶,其是2-氧代戊二酸(2-oxoglutarate)依赖性双加氧酶,利用2-氧代戊二酸(α-酮戊二酸(α-ketoglutarate))和O2作为共底物和亚铁离子作为辅因子(参见例如,Klein等人,Adv.Synth.Catal.,353:1375-1383[2011];美国专利第5,364,775号;和Shibasaki等人,Appl.Environ.Microbiol.,65(9):4028–4031[1999])。不同于特异性识别前胶原和相关肽中的肽基脯氨酸的脯氨酰羟化酶,脯氨酸羟化酶能够将游离脯氨酸转化为羟脯氨酸。产生顺式-3-、顺式-4-或反式-4-羟脯氨酸的若干种微生物酶是本领域已知的(参见例如,美国专利第5,962,292号、第5,963,254号和第5,854,040号;WO2009139365;和EP2290065)且产生反式-3-羟脯氨酸的酶已在真菌的提取物中被鉴定。许多脯氨酸羟化酶发现于细菌和真菌中,其中脯氨酸羟化酶与肽类抗生素的生物合成相关。
对反式-3-羟脯氨酸选择性的天然脯氨酸羟化酶是本领域未知的。来自Glarealozoyensis的真菌脯氨酸羟化酶GloF产生反式-3-羟脯氨酸作为次要异构体和反式-4-羟脯氨酸作为主要异构体(Petersen等人,Appl.Microbiol.Biotechnol.2003,62,263;Houwaart等人,ChemBioChem 2014,15,2365)。来自褶皱裸胞壳(Emericella rugulosa)NRRL 11440的另一种真菌脯氨酸羟化酶HtyE,与GloF共有大约64%的序列同一性,被报道为棘球白素B生物合成基因簇的一部分(Cacho等人,J.Am.Chem.Soc.2012,134,16781)。还发现HtyE产生反式-3-羟脯氨酸作为次要异构体和反式-4-羟脯氨酸作为主要异构体。最近,在真菌sp.11243中鉴定了包含三个羟化酶基因的基因簇(Matsui等人,J.Biosci.Bioeng.2017,Feb;123(2):147-153),并且一个基因随后被鉴定为与HtyE具有同源性。
虽然表达克隆的脯氨酸羟化酶的重组全细胞更适合于大规模工业过程,然而全细胞的使用限制反应条件,诸如高底物浓度的变化;将可使用的底物类型约束为可渗透至细胞的那些;并导致必须从最终产物分离的不期望的副产物。另外,体内系统可要求非最佳或成本有效的限定的生长培养基,因为使用从蛋白水解物制备的富生长培养基包含游离脯氨酸,其在靶向脯氨酸之外的底物时可以是竞争性抑制剂。可容易地扩大规模并导致基本上纯的异构体产物的用于合成脯氨酸和脯氨酸类似物以及其他化学化合物的羟基化形式的替代方法是必需的。
发明概述
本发明提供了工程化脯氨酸羟化酶生物催化剂、编码该生物催化剂的多核苷酸、其制备方法、以及使用这些工程化生物催化剂制备羟基化化合物的方法。本发明的脯氨酸羟化酶已被工程化为相对于来自真菌sp.No.11243的ANO11243的天然存在的脯氨酸羟化酶(SEQ ID NO:2,已向其添加了N-末端his-标签)具有一种或更多种改进的特性。工程化脯氨酸羟化酶的改进的生物催化剂特性包括,除了其他以外,活性、底物耐受性、立体选择性、区域选择性和热稳定性。还已发现工程化脯氨酸羟化酶使多种底物化合物羟基化,包括使用α-酮戊二酸为共底物将L-脯氨酸羟基化为反式-3-羟脯氨酸。在一些实施方案中,该方法在存在氧气(即空气)和铁(即Fe(II))的情况下进行。
具有一种或更多种改进的特性的工程化酶具有与天然存在的脯氨酸羟化酶相比的一个或更多个残基差异,其中残基差异出现在影响一个或更多个上述酶特性的残基位置处。
因此,在一个方面,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,其中所述多肽包含与SEQ ID NO:4、116、162、322、412、492、562、598和/或630具有至少约80%同一性的氨基酸序列。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,其中所述多肽包含SEQ ID NO:6-658范围中的偶数编号的序列中所列的氨基酸序列。以下详细描述提供了对可用于制备具有期望的改进的生物催化特性的工程化脯氨酸羟化酶的残基差异的选择的指导。
本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含与SEQID NO:4具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:21、28、58/247、65、80、85、95、98、117、120、159、185、194、199、200、233、237、243、250、268、281、282、287、289、307、324、326、327、330、338、343、346和348。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:21、28、45、65、95、112、117、139、177、185、199、233、243、250、281、282、287、289、307、324、326、327、335、338、343和346。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:48/66/189/194、48/66/194和66/82/85/135/189/194/267。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:20/56/76/168/169/296、20/56/232/294、20/119/294/296、56/76/119/124/147/232、56/76/294、76/168/232/294、76/294/296、76/296、147和232。在一些实施方案中,所述工程化多肽与SEQ ID NO:4-658中的偶数编号的序列中的至少一个具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含与SEQID NO:116具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:116相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:123、189、195、233和296。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:116相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:20/21/56、20/21/56/76/95/232/294/307/335、20/21/56/76/147/225/232/233/281/294/296/307/335、20/21/56/95/147/281/294/307、20/21/56/281/307、20/21/76/232/243、20/21/95/232/307、20/21/95/281/294/296、20/21/147/189/233/243/281/307、20/56、20/56/76/95/281/307、20/56/76/147/294/296/307、20/56/95/147/294、20/56/281、20/76、20/76/95/281/294/296、20/76/95/281/296/307、20/76/233/294/307、20/76/243/281/294、21/76/147/233/294/307、21/76/147/243/296/307/335、21/95/185/189/232/281/296、21/95/233/243/281/296、21/95/294/296/307/335、21/95/307、21/281/307、29/76/281、56/76/95/232/243/281、56/76/147/281/307、56/76/243/294、56/76/281/294、56/76/296、56/76/307、56/95/147/307/335/348、56/95/232/233/281/294/307、56/95/243/281、56/147/281、56/232/243/281、56/232/281、56/232/281/294/296、56/233/281/294/296、56/281/307、76/95/232/243/281/307、76/95/243/281/307/335、76/95/294/307、76/147、76/147/233/243/294、76/147/233/281/294/307、76/147/243/294/296/307/335、76/147/281/307、76/189/296、76/232/233/243/294/296/307、76/281、76/281/294、76/294/296、95/120、95/147/335、95/232/243/281/294/307、95/232/281/294/296、95/281/294/296、95/335、147、147/225/232/243/281/296/307/335、147/233/243/281/307、147/233/281/307/335、147/243/281、147/307、232/233/281/294/296/307、232/281、232/284/307、233/243/281/296/307/335、233/281/296/307、243/281/294/296、281、281/294、281/307、307和335。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ IDNO:116相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:21/76/147/243/296/307/335、56/76/147/281/307和95/147/335。在一些实施方案中,所述工程化多肽与SEQ ID NO:4-658中的偶数编号的序列中的至少一个具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含与SEQID NO:162具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:162的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:162相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:2/85/123/237、28/115/117/120/123/268/270/343/346/348、45/123/326、65/117/120/123/343/346、85/123/281/282、114/115/117/120/123/268/271/313/326/343/346、123/139/233/237/281/282/289/324/326和123/199/200/247/250/338。在一些实施方案中,所述工程化多肽与SEQ ID NO:6-658中的偶数编号的序列中的至少一个具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含与SEQID NO:322具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:322相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:26、54、61、129、132、149、156、175、189、201、209、228、236、248、262、272、277、291和345。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQID NO:322相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:25、43、54、58、61、79、129、132、143、156、163、175、179、201、209、236、248、278、291、345和347。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:322相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:85/117/120/135/208/270/324/343/346、85/117/120/135/208/281/282/289、85/117/120/270/281/289、85/117/135/139/208和117/120/208/270/324/343/346。在一些实施方案中,所述工程化多肽与SEQ ID NO:6-658中的偶数编号的序列中的至少一个具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含与SEQID NO:412具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:412的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:412相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:47、48、56/118、85、95、95/289、113、118、118/247、154、162、162/204、164、164/198/271、168、169、187、195、243、271、275、281、314、330和342。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQID NO:412的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:412相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:25/129/163/236/262/345/347、120/156/175/179/201、129/189/236/262/277/278、129/236/262、156/175/179/228和162。在一些实施方案中,所述工程化多肽与SEQ ID NO:6-658中的偶数编号的序列中的至少一个具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含与SEQID NO:492具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:492的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:492相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:15、17、28、29、65、135、167、177、199、208、228、235、287、294、307和343。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:492的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:492相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:85/187/281/347、85/187/347、118/120/162/175/179/330、118/120/162/175/330、162/175/179/330、175/228/330、195/347和278/314/347。在一些实施方案中,所述工程化多肽与SEQ ID NO:6-658中的偶数编号的序列中的至少一个具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含与SEQID NO:562具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:562的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:562相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:15、40、43、44、59、79、82、149、164、179、345和347。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQID NO:562的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:562相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:29/85/177/208/228/347、29/85/208/228/343/347、29/177/195/228/343、29/208/228/278/294/347、56/195/278、85/187/205/208/278、113/177/187/195/208/278/294/343/347和177/205/208/228。在一些实施方案中,所述工程化多肽与SEQ ID NO:6-658中的偶数编号的序列中的至少一个具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含与SEQID NO:598具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:598的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:598相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:47、162、209、219、227和342。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:598的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:598相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:17/44/179/195/250/313/345、17/44/199/313、43/44/195/199、44/149/164/171/187、44/179/195/199、44/179/195/199/345、79/163/164/171/187/201/286/288、82/163/164、82/163/164/171/187/201/203/208/286/288/320、149/164/171/288和187/286。在一些实施方案中,所述工程化多肽与SEQ ID NO:6-658中的偶数编号的序列中的至少一个具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含与SEQID NO:630具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的氨基酸序列。在一些实施方案中,本发明提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽包含具有与SEQ ID NO:630的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:630相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:82/164/171/203/208、135/163/164/201/203/208、162、162/219/236、162/219/313/338、162/236/342、162/313/342和164/171/201/203/282。在一些实施方案中,所述工程化多肽与SEQ ID NO:6-658中的偶数编号的序列中的至少一个具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
本发明还提供了具有脯氨酸羟化酶活性的工程化多肽,所述工程化多肽能够将L-脯氨酸转化为反式-3-羟脯氨酸。在一些实施方案中,所述工程化多肽能够以天然存在的酶的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍或更多的活性将L-脯氨酸转化为反式-3-羟脯氨酸。在一些另外的实施方案中,所述工程化多肽能够以反式-3-羟脯氨酸的大于90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的异构体过量将L-脯氨酸转化为反式-3-羟脯氨酸。
本发明还提供了编码具有脯氨酸羟化酶活性的工程化多肽的多核苷酸。在一些实施方案中,多核苷酸包含为在大肠杆菌(E.coli)中表达而优化的核酸序列。
本发明还提供了包含编码具有脯氨酸羟化酶活性的工程化多肽的多核苷酸的表达载体。在一些实施方案中,表达载体包含至少一种控制序列。
本发明还提供了包含编码具有脯氨酸羟化酶活性的工程化多肽的多核苷酸的宿主细胞。在一些实施方案中,宿主细胞是大肠杆菌。
本发明还提供了制备具有脯氨酸羟化酶活性的工程化多肽的方法,包括在适合于表达多肽的条件下培养包含表达载体的宿主细胞,该表达载体包含编码具有脯氨酸羟化酶活性的工程化多肽的至少一种多核苷酸。在一些实施方案中,方法还包括分离工程化多肽的步骤。
发明描述
除非另外定义,否则本文使用的所有技术术语和科学术语通常具有与本发明所属领域普通技术人员通常理解的相同的含义。通常,本文使用的命名法和下文描述的细胞培养、分子遗传学、微生物学、有机化学、分析化学和核酸化学中的实验程序是本领域中熟知的并且普遍地采用的那些。这样的技术是熟知的,并且在本领域技术人员熟知的许多教科书和参考著作中进行了描述。对于化学合成和化学分析使用了标准技术或其修改形式。本文(上文和下文二者)提及的所有专利、专利申请、文章和出版物,特此通过引用明确并入本文。
尽管本发明的实践中可使用类似或等同于本文描述的那些的任何合适的方法和材料,本文描述了一些方法和材料。应理解本发明不限于所描述的特定方法、方案和试剂,因为这些可以根据本领域技术人员使用它们的情况而改变。因此,下文即将定义的术语通过参考本发明作为整体而被更充分地描述。
应理解,上文的一般描述和下文的详细描述二者仅是示例性的和说明性的,而不是限制本发明。
本文使用的章节标题仅用于组织目的,并且不被解释为限制所描述的主题。
数值范围包括限定该范围的数字。因此,本文公开的每个数值范围意图包括落在这样的较宽数值范围内的每一较窄数值范围,如同这样的较窄数值范围在本文被全部明确地写出。还意图本文公开的每个最大的(或最小的)数值限制包含每个较低(或较高)的数值限制,如同这样的较低(或较高)数值限制在本文被明确地写出。
缩写
用于遗传编码的氨基酸的缩写是常规的并如以下:
Figure BDA0003664691860000121
Figure BDA0003664691860000131
当使用三字母缩写时,除非前面具体地有“L”或“D”,或者从使用缩写的上下文清楚看出,否则氨基酸可以是关于α-碳(Cα)的L-构型或D-构型。例如,“Ala”表示丙氨酸而不指定关于α-碳的构型,而“D-Ala”和“L-Ala”分别表示D-丙氨酸和L-丙氨酸。当使用单字母缩写时,大写字母表示关于α-碳的L-构型的氨基酸,并且小写字母表示关于α-碳的D-构型的氨基酸。例如,“A”表示L-丙氨酸并且“a”表示D-丙氨酸。当多肽序列以一串单字母或三字母缩写(或其混合)呈现时,根据常规惯例将序列呈现为氨基(N)至羧基(C)方向。
用于遗传编码核苷的缩写是常规的并且如下:腺苷(A);鸟苷(G);胞苷(C);胸苷(T);和尿苷(U)。除非具体描述,否则缩写的核苷可以是核糖核苷或2’-脱氧核糖核苷。核苷可以基于单独地或基于总体地指定为核糖核苷或2’-脱氧核糖核苷。当核酸序列以单字母缩写串呈现时,序列按照常规惯例呈现为5’至3’方向,并且不示出磷酸。
定义
参考本发明,本文的描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义,除非另有具体定义。因此,以下术语意在具有以下含义。
除非上下文另外清楚地指明,否则如本文使用的单数形式“一(a)”、“一(an)”和“该(the)”包括复数指代物。因此,例如对“多肽(a polypeptide)”的提及包括多于一种多肽。
类似地,“包含(comprise)”、“包含(comprises)”、“包含(comprising)”、“包括(include)”、“包括(includes)”和“包括(including)”是可互换的,而不意图为限制性的。因此,如本文使用的,术语“包含(comprising)”及其同源词以其包括性意义被使用(即,等同于术语“包括(including)”及其相应的同源词)。
还应理解,在各种实施方案的描述使用术语“包含(comprising)”的情况下,本领域技术人员将理解,在一些具体实例中,可以可选择地使用“基本上由......组成”或“由......组成”的语言描述实施方案。
术语“约”意指特定值的可接受误差。在一些实例中,“约”意指在给定值范围的0.05%、0.5%、1.0%或2.0%内。在一些实例中,“约”意指在给定值的1、2、3或4个标准偏差内。
“EC”编号是指生物化学和分子生物学国际联合命名委员会(NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology)(NC-IUBMB)的酶命名法。该IUBMB生化分类是基于酶催化的化学反应的酶数字分类系统。
“ATCC”是指美国典型培养物保藏中心(American Type Culture Collection),其生物保藏收集物包括基因和菌株。
“NCBI”是指美国国家生物技术信息中心(National Center for BiologicalInformation)和其中提供的序列数据库。
“蛋白”、“多肽”和“肽”在本文中可互换地使用,来表示通过酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(例如糖基化或磷酸化)。该定义中包括D-氨基酸和L-氨基酸、以及D-氨基酸和L-氨基酸的混合物、以及包含D-氨基酸和L-氨基酸以及D-氨基酸和L-氨基酸的混合物的聚合物。
“氨基酸”通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会推荐的单字母符号在本文被提及。同样地,核苷酸可以通过其通常可接受的单字母代码被提及。
如本文使用的,“多核苷酸”和“核酸”是指共价连接在一起的两个或更多个核苷。多核苷酸可以完全包含核糖核苷酸(即RNA)、完全包含2’脱氧核糖核苷酸(即DNA)或是包含核糖核苷酸和2’脱氧核糖核苷酸的混合物。虽然核苷典型地将经由标准磷酸二酯连接连接在一起,但多核苷酸可以包含一个或更多个非标准连接。多核苷酸可以是单链或双链的,或者可以包含单链区域和双链区域二者。此外,虽然多核苷酸通常将包含天然存在的编码核碱基(即腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶),它可以包含一种或更多种修饰的核碱基和/或合成的核碱基,诸如例如肌苷、黄嘌呤、次黄嘌呤等。在一些实施方案中,这样的修饰的核碱基或合成的核碱基是编码氨基酸序列的核碱基。
“编码序列”是指编码蛋白的氨基酸序列的核酸部分(例如,基因)。
“脯氨酸羟化酶”是指具有在存在共底物α-酮戊二酸和分子氧(dioxygen)的情况下将游离脯氨酸转化为羟脯氨酸(如以下示例)的酶促能力的多肽:
Figure BDA0003664691860000151
应理解,脯氨酸羟化酶不限于与脯氨酸的上述反应,而是可以使其他底物羟基化或产生羟脯氨酸的各种异构体,例如反式-3-羟脯氨酸。如本文使用的脯氨酸羟化酶包括天然地存在的(野生型)脯氨酸羟化酶以及由人为操纵生成的非天然地存在的工程化的多肽。在一些实施方案中,本发明的脯氨酸羟化酶变体能够将L-脯氨酸转化为反式-3-羟脯氨酸,如以下方案1所示:
Figure BDA0003664691860000161
脯氨酸羟化酶的“共底物”是指α-酮戊二酸和可在脯氨酸和脯氨酸底物类似物的羟基化反应中代替α-酮戊二酸的共底物类似物。共底物类似物包括,例如但不限于,2-氧代己二酸(参见例如,Majamaa等人,Biochem.J.,229:127-133[1985])。
如本文使用的,“野生型”和“天然存在的”是指在自然界中发现的形式。例如,野生型多肽或多核苷酸序列为生物体中存在的序列,其可从天然来源分离且未通过人为操纵被有意地修饰。
当关于细胞、核酸或多肽使用时,“重组”或“工程化”或“非天然存在的”指已经以自然界中原本不存在的方式改变的材料或对应于该材料的天然或自然形式的材料。在一些实施方案中,细胞、核酸或多肽与天然存在的细胞、核酸或多肽相同,但由合成材料和/或通过使用重组技术操纵产生或衍生。非限制性实例包括,除了其他以外,表达自然(非重组)形式的细胞中未发现的基因或表达原本以不同水平表达的自然基因的重组细胞。
术语“序列同一性百分比(%)”在本文中用于指多核苷酸或多肽之间的比较,并通过比较比较窗中两条最佳比对的序列来确定,其中多核苷酸或多肽序列在比较窗中的部分与参考序列相比可以包括添加或缺失(即,空位),以用于两个序列的最佳比对。百分比可以通过如下计算:确定两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性百分比。可选择地,百分比可以通过如下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与空位对齐的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性百分比。本领域技术人员理解,存在许多可用于比对两个序列的已建立的算法。用于比较的序列的最佳比对可通过任何合适的方法进行,包括但不限于Smith和Waterman的局部同源性算法(Smith和Waterman,Adv.Appl.Math.,2:482[1981]),通过Needleman和Wunsch的同源性比对算法(Needleman和Wunsch,J.Mol.Biol.,48:443[1970]),通过Pearson和Lipman的相似性检索方法(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444[1988]),通过这些算法的计算机化实现(例如,GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA),或通过目测,如本领域已知的。适合于确定序列同一性和序列相似性百分比的算法的实例包括但不限于BLAST和BLAST 2.0算法,由Altschul等人描述(分别参见Altschul等人,J.Mol.Biol.,215:403-410[1990];和Altschul等人,Nucl.Acids Res.,3389-3402[1977])。公众可通过美国国家生物技术信息中心网站获得用于进行BLAST分析的软件。该算法涉及首先通过鉴定查询序列中长度W的短字来鉴定高评分序列对(HSP),所述短字在与数据库序列中相同长度的字比对时匹配或满足某一正值的阀值评分T。T被称为邻近字评分阈值(参见,Altschul等人,上文)。这些最初的邻近字击中(word hit)充当启动搜索的种子以找到包含它们的更长HSP。然后字击中沿着每个序列的两个方向延伸直到累积比对评分不能增加的程度。对于核苷酸序列,累积评分使用参数M(用于匹配残基对的奖励评分;总是>0)和N(用于错配残基的惩罚评分;总是<0)计算。对于氨基酸序列,评分矩阵用于计算累积评分。在以下情况时,停止字击中在每一个方向的延伸:累积比对评分从其最大达到值下降了量X;由于累积了一个或更多个负评分残基比对,累积评分达到0或小于0;或到达任一序列末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用以下作为默认值:字长(W)为11、期望值(E)为10、M=5、N=-4、以及两条链的比较。对于氨基酸序列,BLASTP程序使用以下作为默认值:字长(W)为3、期望值(E)为10和BLOSUM62评分矩阵(参见,Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915[1989])。序列比对与%序列同一性的示例性确定可以使用GCG Wisconsin软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序,使用提供的默认参数。
“参考序列”是指用作序列和/或活性比较的基础的确定序列。参考序列可以是更大序列的子集,例如,全长基因或多肽序列的区段(segment)。通常,参考序列的长度为至少20个核苷酸或氨基酸残基,长度为至少25个残基,长度为至少50个残基,长度为至少100个残基或者核酸或多肽的全长。因为两个多核苷酸或多肽可以各自(1)包含两个序列之间相似的序列(即,完整序列的一部分),和(2)还可以包含两个序列之间趋异的(divergent)序列,所以两个(或更多个)多核苷酸或多肽之间的序列比较通常通过比较两个多核苷酸或多肽在“比较窗”中的序列以鉴定和比较局部区域的序列相似性来进行。在一些实施方案中,“参考序列”可以基于一级氨基酸序列(primary amino acid sequence),其中参考序列是可以在一级序列中具有一个或更多个变化的序列。
如本文使用的,“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性区段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列进行比较,并且其中序列在比较窗中的部分与参考序列(其不包含添加或缺失)相比,可以包括20%或更少的添加或缺失(即,空位)以用于两个序列的最佳对齐。比较窗可以比20个连续残基更长,并任选地包括30、40、50、100或更长的窗。
当用于给定的氨基酸或多核苷酸序列的编号的上下文中时,“相应于”、“参考”或“相对于”是指当给定的氨基酸或多核苷酸序列与参考序列比较时指定的参考序列残基的编号。换言之,给定聚合物的残基编号或残基位置关于参考序列被指定,而不是通过给定氨基酸或多核苷酸序列内残基的实际数字位置被指定。例如,给定氨基酸序列,诸如工程化脯氨酸羟化酶的氨基酸序列可以通过引入空位以与参考序列对齐,来优化两个序列之间的残基匹配。在这些情况中,尽管存在空位,对给定氨基酸或多核苷酸序列中的残基关于与其比对的参考序列进行编号。
“大体同一性(substantial identity)”是指在至少20个残基位置的比较窗中、通常在至少30-50个残基的窗中,与参考序列相比,具有至少80%序列同一性、至少85%同一性、至少89%至95%之间的序列同一性,或更通常至少99%序列同一性的多核苷酸或多肽序列,其中序列同一性百分比通过在比较窗中比较参考序列和包含总计为参考序列的20%或更少的缺失或添加的序列来计算。在应用于多肽的一些具体实施方案中,术语“大体同一性”意指当诸如通过程序GAP或BESTFIT使用默认空位权重进行最佳比对时,两个多肽序列共有至少80%的序列同一性,优选地至少89%的序列同一性或至少95%的序列同一性或更多(例如99%的序列同一性)。在一些实施方案中,在被比较的序列中不相同的残基位置因保守氨基酸取代而有差异。
如本文使用的,“氨基酸差异”和“残基差异”是指在多肽序列的一个位置处氨基酸残基相对于参考序列中对应位置处的氨基酸残基的差异。本文中氨基酸差异的位置通常被称为“Xn”,其中n是指残基差异所基于的参考序列中的对应位置。例如,“与SEQ ID NO:4相比位置X93处的残基差异”是指对应于SEQ ID NO:4的位置93的多肽位置处的氨基酸残基的差异。因此,如果参考多肽SEQ ID NO:4在位置93处具有丝氨酸,则“与SEQ ID NO:4相比位置X93处的残基差异”是指在对应于SEQ ID NO:4的位置93的多肽位置处除了丝氨酸以外的任何残基的氨基酸取代。在本文的大多数情况下,在一个位置处的特定氨基酸残基差异指示为“XnY”,其中“Xn”指定如上文描述的对应位置,并且“Y”是在工程化多肽中发现的氨基酸(即,与参考多肽中的不同的残基)的单字母标识符。在一些情况下(例如,表4.1、表4.2、表4.3、表4.4、表5.1、表5.2、表5.3、表6.1、表7.1、表7.2、表7.3、表8.1、表8.2、表9.1、表9.2、表10.1、表10.2、表11.1、表11.2和/或表12.1中),本发明还提供由常规符号“AnB”表示的特定氨基酸差异,其中A是参考序列中的残基的单字母标识符,“n”是在参考序列中的残基位置的编号,并且B是工程化多肽的序列中残基取代的单字母标识符。在一些情况下,本发明的多肽相对于参考序列包含一个或更多个氨基酸残基差异,其由相对于参考序列存在残基差异的指定位置的列表指示。在一些实施方案中,在多于一个氨基酸可以用于多肽的具体残基位置中时,可以使用的各种氨基酸残基由“/”分开(例如,X307H/X307P或X307H/P)。斜线也可用于指示给定变体内的多于一个取代(即,在给定序列中诸如在组合变体中存在多于一个取代)。在一些实施方案中,本发明包括含有一个或更多个氨基酸差异的工程化多肽序列,所述氨基酸差异包括保守氨基酸取代或非保守氨基酸取代。在一些另外的实施方案中,本发明提供了包含保守氨基酸取代和非保守氨基酸取代二者的工程化多肽序列。
如本文使用的,“保守氨基酸取代”是指用具有相似侧链的不同残基取代残基,并且因此通常涉及用相同或相似的氨基酸定义类别中的氨基酸取代多肽中的氨基酸。例如但不限于,在一些实施方案中,具有脂肪族侧链的氨基酸被另一种脂肪族氨基酸(例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代;具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如,丝氨酸和苏氨酸)取代;具有芳族侧链的氨基酸被另一种具有芳族侧链的氨基酸(例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代;具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如,赖氨酸和精氨酸)取代;具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如,天冬氨酸或谷氨酸)取代;和/或疏水氨基酸或亲水氨基酸分别被另一种疏水氨基酸或亲水氨基酸取代。
如本文使用的,“非保守取代”是指用具有显著不同的侧链特性的氨基酸取代多肽中的氨基酸。非保守取代可以使用定义的组之间而不是之内的氨基酸,并且影响:(a)取代区域中的肽骨架的结构(例如,脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链体积。例如但不限于,示例性非保守取代可以是用碱性或脂肪族氨基酸取代酸性氨基酸;用小氨基酸取代芳族氨基酸;和用疏水氨基酸取代亲水氨基酸。
如本文使用的,“缺失”是指通过从参考多肽去除一个或更多个氨基酸对多肽进行的修饰。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或者20个或更多个氨基酸、多达组成参考酶的氨基酸总数的10%或多达氨基酸总数的20%,同时保留酶促活性和/或保留工程化脯氨酸羟化酶的改进的特性。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包括连续的区段或可以是不连续的。
如本文使用的,“插入”是指通过向参考多肽添加一个或更多个氨基酸对多肽进行的修饰。插入可以处于多肽的内部部分或者可以是插入到羧基或氨基末端。如本文使用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段或由天然存在的多肽中的一个或更多个氨基酸分开。
在本文中可互换使用的“功能片段”或“生物活性片段”是指这样的多肽,所述多肽具有氨基末端缺失和/或羧基末端缺失和/或内部缺失,但其中剩余的氨基酸序列与和它进行比较的序列(例如,本发明的全长工程化脯氨酸羟化酶)中的对应位置相同,并且保留全长多肽的基本上全部活性。
如本文使用的,“分离的多肽”是指与天然伴随其的其他污染物(例如蛋白质、脂质和多核苷酸)基本上分开的多肽。该术语包括已经从它们天然存在的环境或表达系统(例如,宿主细胞内或经由体外合成)中取出或纯化的多肽。重组脯氨酸羟化酶多肽可以存在于细胞内、存在于细胞培养基中,或以多种形式(诸如裂解物或分离的制品)制备。因此,在一些实施方案中,重组脯氨酸羟化酶多肽可以是分离的多肽。
如本文使用的,“基本上纯的多肽”是指其中多肽物质是存在的主要物质(即,以摩尔或重量计,其比组合物中的任何其他单独的大分子物质更丰富)的组合物,并且当目标物质构成存在的大分子物质的以摩尔或%重量计至少约50%时,该组合物通常为基本上纯化的组合物。然而,在一些实施方案中,包含脯氨酸羟化酶的组合物包含少于50%纯的(例如,约10%、约20%、约30%、约40%、或约50%)的脯氨酸羟化酶。通常,基本上纯的脯氨酸羟化酶组合物包含该组合物中存在的所有大分子物质的按摩尔或%重量计约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多以及约98%或更多。在一些实施方案中,将目标物质纯化至基本同质(即,通过常规检测方法不能在组合物中检测出污染物物质),其中该组合物基本上由单一大分子物质组成。溶剂物质、小分子(<500道尔顿)和元素离子物质不被认为是大分子物质。在一些实施方案中,分离的重组脯氨酸羟化酶多肽是基本上纯的多肽组合物。
如本文使用的,“改进的酶特性”是指酶的至少一种改进的特性。在一些实施方案中,本发明提供了与参考脯氨酸羟化酶多肽和/或野生型脯氨酸羟化酶多肽和/或另一种工程化脯氨酸羟化酶多肽相比表现出任何酶特性的改进的工程化脯氨酸羟化酶多肽。因此,可以确定并比较多种脯氨酸羟化酶,包括野生型以及工程化脯氨酸羟化酶之间的“改进”的水平。改进的特性包括但不限于诸如以下的特性:增加的蛋白表达、增加的热活性(thermoactivity)、增加的热稳定性、增加的pH活性、增加的稳定性、增加的酶促活性、增加的底物特异性或亲和力、增加的比活性、增加的对底物或终产物抑制的抗性、增加的化学稳定性、改进的化学选择性、改进的溶剂稳定性、增加的对酸性pH的耐受性、增加的对碱性pH的耐受性、增加的对蛋白水解活性的耐受性(即,降低的对蛋白水解的敏感性)、降低的聚集、增加的溶解度、和改变的温度谱(temperature profile)。
如本文使用的,“增加的酶活性”和“增强的催化活性”是指工程化脯氨酸羟化酶多肽的改进的特性,其可以被表示为与参考脯氨酸羟化酶相比,比活性(例如产生的产物/时间/重量蛋白)的增加或底物向产物的转化百分比(例如使用指定量的脯氨酸羟化酶,在指定的时间段内起始量的底物向产物的转化百分比)的增加。确定酶活性的示例性方法在实施例中提供。与酶活性相关的任何特性都可以被影响,包括经典的酶特性Km、Vmax或kcat,其变化可以导致酶促活性的增加。酶活性的改进可以是从对应野生型酶的酶促活性的约1.1倍至天然存在的脯氨酸羟化酶或脯氨酸羟化酶多肽所源自的另一种工程化脯氨酸羟化酶的多达2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍、150倍、200倍或更多的酶促活性。
如本文使用的,“转化”是指一种或更多种底物向一种或更多种对应的产物的酶促转化(或生物转化)。“转化百分比”是指在指定条件下在一定时间段内转化为产物的底物的百分比。因此,脯氨酸羟化酶多肽的“酶促活性”或“活性”可以表示为指定时间段内底物向产物的“转化百分比”。
具有“通用型特性(generalist properties)”的酶(或“通用型酶(generalistenzymes)”)是指与亲本序列相比,对宽范围的底物表现出改进的活性的酶。通用型酶不必对于每种可能的底物都表现出改进的活性。在一些实施方案中,本发明提供了具有通用型特性的脯氨酸羟化酶变体,因为相对于亲本基因,它们对宽范围的空间和电子不同的底物表现出相似或改进的活性。此外,本文提供的通用型酶被工程化为跨宽范围的有差异的API-样分子被改进以增加代谢物/产物的产生。
术语“严格杂交条件”在本文中用于指在该条件下核酸杂交体是稳定的条件。如本领域技术人员已知的,杂交体的稳定性反映在杂交体的解链温度(Tm)中。通常,杂交体的稳定性是离子强度、温度、G/C含量和离散剂的存在的函数。多核苷酸的Tm值可以使用预测解链温度的已知方法来计算(参见例如,Baldino等人,Meth.Enzymol.,168:761-777[1989];Bolton等人,Proc.Natl.Acad.Sci.USA 48:1390[1962];Bresslauer等人,Proc.Natl.Acad.Sci.USA 83:8893-8897[1986];Freier等人,Proc.Natl.Acad.Sci.USA83:9373-9377[1986];Kierzek等人,Biochem.,25:7840-7846[1986];Rychlik等人,Nucl.Acids Res.,18:6409-6412[1990](勘误,Nucl.Acids Res.,19:698[1991]);Sambrook等人,上文);Suggs等人,1981,于Developmental Biology Using Purified Genes,Brown等人.[编辑],pp.683-693,Academic Press,Cambridge,MA[1981];和Wetmur,Crit.Rev.Biochem.Mol.Biol.26:227-259[1991])。在一些实施方案中,多核苷酸编码本文公开的多肽,并且在限定的条件下,诸如中度严格或高度严格条件下,与编码本发明的工程化脯氨酸羟化酶的序列的互补体杂交。
“杂交严格性”是指核酸杂交中的杂交条件,诸如洗涤条件。通常,杂交反应在较低严格性的条件下进行,随后是不同的但较高严格性的洗涤。术语“中度严格杂交”是指允许靶DNA结合以下互补核酸的条件,所述互补核酸与靶DNA具有约60%同一性,优选地约75%同一性,约85%同一性,与靶多核苷酸具有大于约90%同一性。示例性中度严格条件是等同于在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中在42℃杂交,随后在0.2×SSPE、0.2%SDS中在42℃洗涤的条件。“高严格性杂交”通常是指与如对限定的多核苷酸序列在溶液条件下确定的热解链温度Tm相差约10℃或更小的条件。在一些实施方案中,高严格性条件是指仅允许在0.018M NaCl中在65℃形成稳定杂交体的那些核酸序列的杂交(即,如果杂交体在0.018M NaCl中在65℃是不稳定的,它在如本文设想的高严格性条件下将是不稳定的)的条件。例如,可以通过以下提供高严格性条件:在与50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS在42℃等同的条件杂交,然后在0.1×SSPE和0.1%SDS中在65℃洗涤。另一高严格性条件是在与以下等同的条件中杂交:在65℃在含有0.1%(w:v)SDS的5×SSC中杂交和在65℃在含有0.1%SDS的0.1×SSC中洗涤。其他高严格性杂交条件以及中度严格性条件在以上引用的参考文献中描述。
“密码子优化的”是指将编码蛋白的多核苷酸的密码子改变为特定生物体中优先使用的那些密码子,以致所编码的蛋白被有效表达在感兴趣的生物体中。尽管遗传密码是简并的,即大多数氨基酸由被称为“同义”(“synonyms”)或“同义”(“synonymous”)密码子的若干密码子表示,但熟知的是,特定生物体的密码子使用是非随机的和对于特定的密码子三联体是有偏倚的。就给定基因、具有共同功能或祖先起源的基因、高表达的蛋白对比低拷贝数蛋白和生物体的基因组的聚集蛋白编码区而言,这种密码子使用偏倚可能更高。在一些实施方案中,可以对编码脯氨酸羟化酶的多核苷酸进行密码子优化,用于在选择用于表达的宿主生物体中的优化产生。
“优选的、最佳的、高密码子使用偏倚密码子”可互换地指在蛋白编码区中比编码相同氨基酸的其他密码子使用频率更高的密码子。优选的密码子可以根据单个基因、共同功能或起源的一组基因、高表达基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子频率、相关生物体的聚集蛋白编码区中的密码子频率,或它们的组合来确定。其频率随着基因表达的水平而增加的密码子通常是用于表达的最佳密码子。用于确定特定生物体中密码子频率(例如密码子使用、相对同义密码子使用)和密码子偏好的多种方法是已知的,包括多变量分析,例如使用聚类分析或相关性分析,和基因中使用的密码子的有效数目(参见例如,GCG CodonPreference,Genetics Computer Group Wisconsin Package;CodonW,Peden,University of Nottingham;McInerney,Bioinform.,14:372-73[1998];Stenico等人,Nucl.Acids Res.,222437-46[1994];Wright,Gene 87:23-29[1990])。对于许多不同的生物体,密码子使用表是可获得的(参见例如,Wada等人,Nucl.Acids Res.,20:2111-2118[1992];Nakamura等人,Nucl.Acids Res.,28:292[2000];Duret等人,上文;Henaut和Danchin,于Escherichia coli and Salmonella,Neidhardt,等人(编辑),ASMPress,Washington D.C.,p.2047-2066[1996])。用于获得密码子使用的数据源可以依赖于能够编码蛋白的任何可获得的核苷酸序列。这些数据集包括实际已知编码表达的蛋白的核酸序列(例如,完整的蛋白编码序列-CDS)、表达的序列标签(ESTS),或基因组序列的预测编码区(参见例如,Mount,Bioinformatics:Sequence and Genome Analysis,第8章,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,N.Y.[2001];Uberbacher,Meth.Enzymol.,266:259-281[1996];和Tiwari等人,Comput.Appl.Biosci.,13:263-270[1997])。
“控制序列”在本文中是指包括对本发明的多核苷酸和/或多肽的表达必要或有利的所有组分。每一个控制序列对于编码多肽的核酸序列可以是天然的或外来的。这样的控制序列包括但不限于,前导序列、多腺苷酸化序列、前肽序列、启动子序列、信号肽序列、起始序列和转录终止子。在最小程度上,控制序列包括启动子和转录及翻译终止信号。控制序列可以与接头一起提供,用于引入特定限制性位点的目的,所述特定限制性位点促进控制序列与编码多肽的核酸序列的编码区的连接。
“可操作地连接的”在本文被定义为如下配置:在所述配置中控制序列被适当地放置(即,以功能关系)在相对于感兴趣的多核苷酸的一定位置处,使得控制序列指导或调节感兴趣的多核苷酸和/或多肽的表达。
“启动子序列”是指被宿主细胞识别用于感兴趣的多核苷酸诸如编码序列的表达的核酸序列。启动子序列包含介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的任何核酸序列,包括突变体、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
“合适的反应条件”是指在酶促转化反应溶液中的那些条件(例如,酶载量(enzymeloading)、底物载量、温度、pH、缓冲剂、助溶剂等的范围),在所述条件下本发明的脯氨酸羟化酶多肽能够将底物转化为期望的产物化合物。一些示例性的“合适的反应条件”在本文中提供。
如本文使用的,“载量”,诸如在“化合物载量”或“酶载量”中,是指在反应起始时组分在反应混合物中的浓度或量。
如本文使用的,在酶促转化反应过程的上下文中,“底物”是指受脯氨酸羟化酶多肽作用的化合物或分子。
如本文使用的,在酶促转化过程的上下文中,“产物”是指从脯氨酸羟化酶多肽对底物发挥的作用而产生的化合物或分子。
如本文使用的术语“培养”是指微生物细胞群体在任何合适的条件(例如,使用液体、凝胶或固体培养基)下的生长。
重组多肽可以使用本领域已知的任何合适的方法产生。编码感兴趣的野生型多肽的基因可以被克隆到载体诸如质粒中,并在期望的宿主诸如大肠杆菌等中表达。重组多肽的变体可以通过本领域已知的各种方法产生。事实上,存在本领域技术人员熟知的各种各样不同的诱变技术。此外,诱变试剂盒还可从许多商业分子生物学供应商获得。方法可用于做出确定的氨基酸(定点)处的特定取代、基因的局部区域中的特异性(区域特异性)或随机突变,或整个基因内的随机诱变(例如,饱和诱变)。本领域的技术人员已知产生酶变体的许多合适的方法,包括但不限于,使用PCR对单链DNA或双链DNA定点诱变、盒式诱变、基因合成、易错PCR、改组,和化学饱和诱变,或本领域已知的任何其他合适的方法。在以下专利中提供了用于DNA和蛋白质工程化的方法的非限制性实例:美国专利第6,117,679号;美国专利第6,420,175号;美国专利第6,376,246号;美国专利第6,586,182号;美国专利第7,747,391号;美国专利第7,747,393号;美国专利第7,783,428号;和美国专利第8,383,346号。产生变体后,可以对它们筛选任何期望的特性(例如,高或增加的活性、或者低或减少的活性、增加的热活性、增加的热稳定性和/或酸性pH稳定性等)。在一些实施方案中,可使用“重组脯氨酸羟化酶多肽”(在本文还称为“工程化脯氨酸羟化酶多肽”、“变体脯氨酸羟化酶”和“脯氨酸羟化酶变体”)。
如本文使用的,“载体”是用于将DNA序列引入到细胞中的DNA构建体。在一些实施方案中,载体是被可操作地连接至能够实现DNA序列中编码的多肽在合适宿主中的表达的合适的控制序列的表达载体。在一些实施方案中,“表达载体”具有可操作地连接至DNA序列(例如,转基因)以驱动在宿主细胞中表达的启动子序列,并且在一些实施方案中,还包含转录终止子序列。
如本文使用的,术语“表达”包括多肽产生中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还涵盖多肽从细胞的分泌。
如本文使用的,术语“产生”是指由细胞产生蛋白和/或其他化合物。意图该术语涵盖多肽产生中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译和翻译后修饰。在一些实施方案中,该术语还涵盖多肽从细胞的分泌。
如本文使用的,如果氨基酸或核苷酸序列(例如,启动子序列、信号肽、终止子序列等)与它可操作地连接至的另一个序列在自然界中未缔合,则这两个序列是“异源的”。例如,“异源多核苷酸”是通过实验室技术引入宿主细胞中的任何多核苷酸,并且包括从宿主细胞中取出、经历实验室操作并且然后再引入宿主细胞的多核苷酸。
如本文使用的,术语“宿主细胞”和“宿主菌株”是指用于包含本文提供的DNA(例如,编码脯氨酸羟化酶变体的多核苷酸)的表达载体的合适的宿主。在一些实施方案中,宿主细胞是已经用使用如本领域已知的重组DNA技术构建的载体转化或转染的原核细胞或真核细胞。
术语“类似物”意指与参考多肽具有多于70%序列同一性,但少于100%序列同一性(例如,多于75%、78%、80%、83%、85%、88%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性)的多肽。在一些实施方案中,类似物意指如下多肽,所述多肽包含一个或更多个非天然存在的氨基酸残基(包括但不限于高精氨酸、鸟氨酸和正缬氨酸)以及天然存在的氨基酸。在一些实施方案中,类似物还包含一个或更多个D-氨基酸残基和两个或更多个氨基酸残基之间的非肽连接。
术语“有效量”意指足以产生期望的结果的量。本领域普通技术人员可以通过使用常规实验确定有效量是多少。
术语“分离的”和“纯化的”用于指从与其天然缔合的至少一种其他组分取出的分子(例如,分离的核酸、多肽等)或其他组分。术语“纯化的”不要求绝对纯度,而是意图作为相对定义。
“立体选择性”是指在化学或酶促反应中一种立体异构体相对于另一种的优先形成。立体选择性可以是部分的,此时一种立体异构体的形成优于另一种立体异构体,或者立体选择性可以是完全的,此时只形成一种立体异构体。当立体异构体是对映异构体时,立体选择性被称为对映选择性,即两者的总和中一种对映异构体的分数(通常报告为百分比)。本领域中通常可选择地将其报道(通常为百分比)为根据下式从中计算的对映异构体过量(e.e.):[主要对映异构体-次要对映异构体]/[主要对映异构体+次要对映异构体]。当立体异构体是非对映异构体时,立体选择性被称为非对映选择性,即两种非对映异构体的混合物中一种非对映异构体的分数(通常报告为百分比),通常可选择地报告为非对映异构体过量(d.e.)。对映异构体过量和非对映异构体过量是立体异构体过量的类型。
“高度立体选择性”是指能够以至少约85%的立体异构体过量将底物(例如,L-脯氨酸)转化为其相应的羟基化产物(例如,反式-3-羟脯氨酸)的化学或酶促反应。
“区域选择性”或“区域选择性反应”是指其中键形成或断裂的一个方向优先于所有其他可能的方向发生的反应。如果区别是彻底的,则反应可以是完全(100%)区域选择性的,如果在一个位点的反应产物比在其他位点的反应产物占优势,例如优先形成产物化合物成(即,反式-3-羟脯氨酸超过不期望的产物反式-4-羟脯氨酸),则反应可以是基本上区域选择性的(至少75%),或者是部分区域选择性的(x%,其中百分比取决于感兴趣的反应来设置)。
“选择性的”或“选择性”可指立体选择性或区域选择性,如上文所定义,或可指立体选择性和区域选择性二者。
“异构体过量”是指按照公式[主要异构体-次要异构体]/[主要异构体+次要异构体]计算的百分比。这个百分比代表在化学或酶促反应中,一种异构体比另一种异构体优先形成。对映异构体过量是异构体过量的形式。
如本文使用的,“热稳定”是指与暴露于升高的温度(例如40℃至80℃)的野生型酶相比,在暴露于相同的升高的温度持续一段时间(例如0.5h-24h)后,维持类似活性(例如多于60%至80%)的脯氨酸羟化酶多肽。
如本文使用的,“溶剂稳定”是指与暴露于不同浓度(例如5%-99%)的溶剂(例如,乙醇、异丙醇、二甲基亚砜[DMSO]、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)的野生型酶相比,在暴露于相同浓度的相同溶剂持续一段时间(例如0.5h-24h)后,维持类似活性(多于例如60%至80%)的脯氨酸羟化酶多肽。
如本文使用的,“热稳定且溶剂稳定”是指既热稳定又溶剂稳定的脯氨酸羟化酶多肽。
如本文使用的,“还原剂”是指能够将Fe+3转化为Fe+2的化合物或剂。示例性还原剂是抗坏血酸,其通常呈L-抗坏血酸的形式。
“烷基”是指具有1个至18个碳原子(包括端点)的,直链的或支链的,更优选地1个至8个碳原子(包括端点),并且最优选地1个至6个碳原子(包括端点)的饱和烃基团。具有指定数目的碳原子的烷基在括号中表示(例如(C1-C6)烷基是指1个至6个碳原子的烷基)。
“烯基”是指具有2个至12个碳原子(包括端点)的、直链或支链的、含有至少一个双键但任选地含有多于一个双键的烃基团。
“炔基”是指具有2个至12个碳原子(包括端点)的、直链或支链的、含有至少一个三键但任选地含有多于一个三键,并且另外任选地含有一个或更多个双键键合部分的烃基团。
“亚烷基”是指具有1个至18个碳原子(包括端点),更优选地1个至8个碳原子(包括端点),并且最优选地1个至6个碳原子(包括端点),任选地被一个或更多个合适的取代基取代的直链或支链二价烃基。示例性的“亚烷基”包括但不限于亚甲基、亚乙基、亚丙基、亚丁基等。
“亚烯基”是指具有2个至12个碳原子(包括端点)和一个或更多个碳-碳双键,更优选地2个至8个碳原子(包括端点),并且最优选地2个至6个碳原子(包括端点),任选地被一个或更多个合适的取代基取代的直链或支链二价烃基。
“杂烷基”、“杂烯基”和“杂炔基”分别指其中碳原子中的一个或更多个各自独立地被相同或不同的杂原子或杂原子基团代替的如本文定义的烷基、烯基和炔基。可以代替碳原子的杂原子和/或杂原子基团包括但不限于-O-、-S-、-S-O-、-NRγ-、-PH-、-S(O)-、-S(O)2-、-S(O)NRγ-、-S(O)2NRγ-等,包括它们的组合,其中每个Rγ独立地选自氢、烷基、环烷基、杂环烷基、芳基和杂芳基。
“芳基”是指具有单个环(例如苯环)或多于一个稠环(例如,萘基或蒽基)的6个至12个碳原子(包括端点)的不饱和芳香碳环基团。示例性芳基包括苯基、吡啶基、萘基等。
“芳基烷基”是指用芳基取代的烷基(即,“芳基-烷基-”基团),优选地在烷基部分具有1个至6个碳原子(包括端点)以及在芳基部分具有6个至12个碳原子(包括端点)。这样的芳基烷基基团通过苯基、萘基等来示例。
“芳基氧基”是指–ORλ基团,其中Rλ为芳基基团,其可被任选地取代。
“环烷基”是指具有单个环或多于一个稠环的3个至12个碳原子(包括端点)的环状烷基基团,所述单个环或多于一个稠环可任选地被1个至3个烷基基团取代。示例性环烷基基团包括但不限于单个环结构诸如环丙基、环丁基、环戊基、环辛基、1-甲基环丙基、2-甲基环戊基、2-甲基环辛基等,或多于一个环结构,包括桥环系统,诸如金刚烷基等。
“环烷基烷基”是指用环烷基取代的烷基(即,“环烷基-烷基-”基团),优选地在烷基部分具有1个至6个碳原子(包括端点)以及在环烷基部分具有3个至12个碳原子(包括端点)。这样的环烷基烷基基团通过环丙基甲基、环己基乙基等来示例。
“氨基”是指基团-NH2。取代的氨基是指基团–NHRη、NRηRη和NRηRηRη,其中每个Rη独立地选自取代的或未取代的烷基、环烷基、环杂烷基、烷氧基、芳基、杂芳基、杂芳基烷基、酰基、烷氧基羰基、硫烷基、亚磺酰基、磺酰基等。典型的氨基基团包括但不限于二甲基氨基、二乙基氨基、三甲基铵、三乙基铵、甲基磺酰基氨基、呋喃基-氧基-磺氨基等。
“氨基烷基”是指其中一个或更多个氢原子被一个或更多个氨基基团,包括取代的氨基基团代替的烷基基团。
“氨基羰基”是指-C(O)NH2。取代的氨基羰基是指–C(O)NRηRη,其中氨基基团NRηRη为如本文定义的。
“氧基”是指二价基团-O-,其可具有各种取代基以形成不同的氧基基团,包括醚和酯。
“烷氧基(alkoxy)”或“烷基氧基(alkyloxy)”在本文可互换地被使用来指基团–ORξ,其中Rξ为烷基基团,包括任选地取代的烷基基团。
“羧基”是指-COOH。
“羰基”是指-C(O)-,其可具有多种取代基以形成不同的羰基基团,包括酸、酰基卤、醛、酰胺、酯和酮。
“羧基烷基”是指其中一个或更多个氢原子被一个或更多个羧基基团代替的烷基。
“氨基羰基烷基”是指被如本文定义的氨基羰基基团取代的烷基。
“卤素(halogen)”或“卤代(halo)”是指氟(代)、氯(代)、溴(代)和碘(代)。
“卤代烷基”是指其中一个或更多个氢原子被卤素代替的烷基基团。因此,术语“卤代烷基”意图包括单卤代烷基、二卤代烷基、三卤代烷基等,直至全卤代烷基。例如,表述“(C1-C2)卤代烷基”包括1-氟代甲基、二氟代甲基、三氟代甲基、1-氟代乙基、1,1-二氟代乙基、1,2-二氟代乙基、1,1,1三氟代乙基、全氟代乙基等。
“羟基”是指-OH。
“羟烷基”是指其中一个或更多个氢原子被一个或更多个羟基基团代替的烷基基团。
“硫基”或“硫烷基”是指-SH。取代的硫基或硫烷基是指–S-Rη,其中Rη为烷基、芳基或其他合适的取代基。
“烷基硫基”是指–SRξ,其中Rξ为烷基,其可被任选地取代。典型的烷基硫基基团包括但不限于,甲基硫基、乙基硫基、正丙基硫基等。
“烷基硫基烷基”是指被烷基硫基基团–SRξ取代的烷基,其中Rξ为烷基,其可被任选地取代。
“磺酰基”是指-SO2-。取代的磺酰基是指–SO2-Rη,其中Rη为烷基、芳基或其他合适的取代基。
“烷基磺酰基”是指–SO2-Rξ,其中Rξ为烷基,其可被任选地取代。典型的烷基磺酰基基团包括但不限于,甲基磺酰基、乙基磺酰基、正丙基磺酰基等。
“烷基磺酰基烷基”是指被烷基磺酰基基团–SO2-Rξ取代的烷基,其中Rξ为烷基,其可被任选地取代。
“杂芳基”是指在环内具有1个至10个碳原子(包括端点)以及选自氧、氮和硫的1个至4个杂原子(包括端点)的芳香族杂环基团。这样的杂芳基基团可以具有单环(例如吡啶基或呋喃基)或多于一个稠环(例如吲嗪基(indolizinyl)或苯并噻吩基)。
“杂芳基烷基”是指用杂芳基取代的烷基(即,“杂芳基-烷基-”基团),优选地在烷基部分具有1个至6个碳原子(包括端点)并且在杂芳基部分具有5个至12个环原子(包括端点)。这样的杂芳基烷基基团通过吡啶基甲基等示例。
“杂环”、“杂环的”和可互换的“杂环烷基”是指具有单个环或多于一个稠环的饱和或不饱和的基团,环内具有2个至10个碳环原子(包括端点)以及选自氮、硫或氧的1个至4个杂环原子(包括端点)。这样的杂环基团可以具有单个环(例如哌啶基或四氢呋喃基)或多于一个稠环(例如,二氢吲哚基、二氢苯并呋喃或奎宁环基(quinuclidinyl))。杂环的实例包括但不限于呋喃、噻吩、噻唑、噁唑、吡咯、咪唑、吡唑、吡啶、吡嗪、嘧啶、哒嗪、吲嗪、异吲哚、吲哚、吲唑、嘌呤、喹嗪(quinolizine)、异喹啉、喹啉、酞嗪(phthalazine)、萘基吡啶、喹喔啉、喹唑啉、噌啉、蝶啶、咔唑(carbazole)、咔啉(carboline)、菲啶(phenanthridine)、吖啶、菲咯啉(phenanthroline)、异噻唑、吩嗪(phenazine)、异噁唑、吩噁嗪(phenoxazine)、吩噻嗪(phenothiazine)、咪唑烷、咪唑啉(imidazoline)、哌啶、哌嗪、吡咯烷、吲哚啉等。
“杂环烷基烷基”是指用杂环烷基取代的烷基(即,“杂环烷基-烷基-”基团),优选地在烷基部分具有1个至6个碳原子(包括端点)并且在杂环烷基部分具有3个至12个环原子(包括端点)。
“元环(membered ring)”意指包括任何环状结构。术语“元”之前的数字表示构成环的骨架原子的数目。因此,例如环己基、吡啶、吡喃和噻喃是6元环,并且环戊基、吡咯、呋喃和噻吩是5元环。
如本文使用的,“并合双环”是指在每个环中具有5个至8个原子的未被取代和被取代的碳环和/或杂环的环部分二者,所述环具有2个共用原子。
除非另外指明,否则在前述基团中被氢占据的位置可以被例如但不限于以下的取代基进一步取代:羟基、氧代、硝基、甲氧基、乙氧基、烷氧基、被取代的烷氧基、三氟甲氧基、卤代烷氧基、氟代、氯代、溴代、碘代、卤代、甲基、乙基、丙基、丁基、烷基、烯基、炔基、被取代的烷基、三氟甲基、卤代烷基、羟基烷基、烷氧基烷基、硫基、烷硫基、酰基、羧基、烷氧基羰基、甲酰胺基、被取代的甲酰胺基、烷基磺酰基、烷基亚磺酰基、烷基磺酰基氨基、磺酰胺基(sulfonamido)、被取代的磺酰胺基、氰基、氨基、被取代的氨基、烷基氨基、二烷基氨基、氨基烷基、酰基氨基、脒基、脒肟基(amidoximo)、羟基甲酰基(hydroxamoyl)、苯基、芳基、被取代的芳基、芳氧基、芳基烷基、芳基烯基、芳基炔基、吡啶基、咪唑基、杂芳基、被取代的杂芳基、杂芳氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、被取代的环烷基、环烷基氧基、吡咯烷基、哌啶基、吗啉代、杂环、(杂环)氧基和(杂环)烷基;并且优选的杂原子是氧、氮和硫。应理解,在这些取代基上存在开放化合价的情况下,它们可以被烷基、环烷基、芳基、杂芳基和/或杂环基团进一步取代,在碳上存在这些开放化合价的情况下,它们可以被卤素和氧-、氮-或硫-键合的取代基进一步取代,并且在存在多于一个这样的开放化合价的情况下,这些基团可以通过直接形成键或通过与新的杂原子(优选地氧、氮或硫)形成键而连接形成环。还应理解,可以进行上文的取代,条件是用取代基代替氢不会对本发明的分子引入不可接受的不稳定性,并且以其他方式在化学上是合理的。
“任选的”或“任选地”意思是,随后描述的事件或情况可发生或可不发生,并且该描述包括其中该事件或情况发生的实例和其中该事件或情况不发生的实例。本领域普通技术人员将理解,对于被描述为包含一个或更多个任选的取代基的任何分子,仅意在包括空间上可实现的和/或合成上可行的化合物。“任选地取代的”是指在化学基团的术语或系列中所有随后的修饰语。例如,在术语“任选地被取代的芳基烷基”中,分子的“烷基”部分和“芳基”部分可以被取代或可以不被取代,并且对于一系列“任选地被取代的烷基、环烷基、芳基和杂芳基”,烷基基团、环烷基基团、芳基基团和杂芳基基团彼此独立地可以被取代或可以不被取代。
工程化脯氨酸羟化酶多肽
本发明提供了具有脯氨酸羟化酶活性的多肽、编码该多肽的多核苷酸、制备该多肽的方法以及用于使用该多肽的方法。在描述涉及多肽时,应理解,它可描述编码该多肽的多核苷酸。
脯氨酸羟化酶属于双加氧酶类别,其在存在α-酮戊二酸和氧气(O2)的情况下催化脯氨酸羟基化。α-酮戊二酸在羟基化期间化学计量地脱羧基,并且O2分子的一个原子掺入进琥珀酸,且另一个掺入进在脯氨酸残基上形成的羟基基团。如以上提到的,脯氨酸羟化酶以其使游离脯氨酸羟基化的能力与脯氨酰羟化酶区分开。
根据酶促反应中形成的主要非对映异构体产物,已鉴定了若干种类型的脯氨酸羟化酶:顺式-3-脯氨酸羟化酶(顺式-P3H)、顺式-4-脯氨酸羟化酶(顺式-P4H)、反式-3-脯氨酸羟化酶(反式-P3H)和反式-4-脯氨酸羟化酶(反式-P4H)。顺式-P3H酶已在链霉菌属种(Streptomyces sp.)TH1、暗灰链霉菌(Streptomyces canus)和芽孢杆菌属种(Bacillussp.)TH2和TH3中鉴定(Mori等人,Appl.Environ.Microbiol.,62(6):1903–1907[1996])。顺式-P4H酶已在百脉根根瘤菌(Lotus corniculatus rhizobia)、百脉根中慢生根瘤菌(Mesorhizobium loti)、苜蓿中华根瘤菌(Sinorhizobium meliloti)和紫花苜蓿根瘤菌(Medicago sativa rhizobia)中鉴定(Hara和Kino,Biochem.Biophys.Res.Commun.,379(4):882-6[2009];美国专利申请公布第2011/0091942号)。反式-P4H已在指孢囊菌属种(Dactylosporangium sp.)、拟无枝酸菌属种(Amycolatopsis sp.)、Streptomycesgriseoviridus、链霉菌属种(Streptomyces sp.)、Glarea lozoyensis和褶皱裸胞壳(Emericella rugulosa)NRRL 11440中鉴定(Shibasaki等人,Appl.Environ.Microbiol.,65(9):4028-31[1999];Petersen等人,Appl.Microbiol.Biotechnol.,62(2-3):263-7[2003];Mori等人,Appl.Environ.Microbiol.,62:1903–1907[1996];Lawrence等人,Biochem.J.,313:185–191[1996];和EP 0641862;Cacho等人,J.Am.Chem.Soc.2012,134,16781)。
最近,在真菌sp.11243中鉴定了包含三个羟化酶基因的基因簇(Matsui等人,J.Biosci.Bioeng.2017,二月;123(2):147-153)。随后,这些基因中的一个被鉴定为脯氨酸羟化酶,并表征为反式-选择性脯氨酸羟化酶。来自真菌sp.No.11243的脯氨酸羟化酶(称为ANO11243或ANO)将游离脯氨酸转化为反式-4-羟脯氨酸和反式-3-羟脯氨酸二者,并且略微富集反式-3-羟脯氨酸异构体。然而,天然存在的ANO11243脯氨酸羟化酶缺乏使其在大规模工业方法中有用的特性,包括低比活性、低热稳定性和对期望的反式-3-羟脯氨酸异构体的低选择性。
本文描述了克服了来自真菌sp.No.11243的野生型脯氨酸羟化酶的缺陷的工程化脯氨酸羟化酶。源自真菌sp.No.11243的野生型酶ANO的工程化脯氨酸羟化酶多肽能够有效地将L-脯氨酸转化为反式-3-羟脯氨酸。本发明鉴定了脯氨酸羟化酶多肽序列中与天然存在的酶相比改进了酶特性的氨基酸残基位置和相应突变,所述酶特性包括,除了其他以外,活性、稳定性、表达、区域选择性和立体选择性。特别地,本发明提供了能够在适当的反应条件下(例如,在存在氧气和Fe(II)的情况下)在存在共底物(例如,α-酮戊二酸)的情况下有效地将L-脯氨酸转化为反式-3-羟脯氨酸(如以上方案1所示)的工程化多肽。
在一些实施方案中,与SEQ ID NO:4的多肽相比,工程化脯氨酸羟化酶多肽显示在用相同量的酶在限定的时间内的L-脯氨酸向反式-3-羟脯氨酸的羟基化中增加的活性。在一些实施方案中,工程化脯氨酸羟化酶多肽具有在合适的反应条件下与由SEQ ID NO:4、116、162、322、412、492、562、598和/或630表示的多肽相比至少约1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍或更多的活性。
在一些实施方案中,与野生型脯氨酸羟化酶相比,工程化脯氨酸羟化酶多肽具有增加的区域选择性。具体地,天然存在的酶主要将脯氨酸转化为,如果不是排他地,反式-3-羟脯氨酸。在一些实施方案中,本文的工程化脯氨酸羟化酶多肽能够选择性地形成反式-3-羟脯氨酸超过反式-4-羟脯氨酸。在一些实施方案中,工程化多肽能够选择性地形成反式-3-羟脯氨酸超过反式-4-羟脯氨酸,其中在适当反应条件下形成的反式-3-羟脯氨酸与化合物反式-4-羟脯氨酸的比率为至少1.5、2、3、4、5、10、15、20、25、30或更多。
在一些实施方案中,工程化脯氨酸羟化酶多肽能够在合适的反应条件下,在约120h或更少、72h或更少、约48h或更少、约36h或更少、或约24h或更少的反应时间内,在至少约10g/L、约20g/L、约30g/L、约40g/L、约50g/L、约70g/L、约100g/L、约125g/L、约150g/L、约175g/L或约200g/L或更多的底物载量浓度,以至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约95%、至少约98%或至少约99%的转化百分比将L-脯氨酸转化成反式-3-羟脯氨酸。
工程化多肽的上述改进的特性进行羟基化反应的合适的反应条件可以根据多肽、底物、共底物、过渡金属辅因子的浓度或量、还原剂、缓冲剂、助溶剂、pH、包括温度和反应时间的条件、和/或多肽固定于固体支持物上的条件确定,如下文和实施例中进一步描述的。
在一些实施方案中,具有改进的特性,特别是将L-脯氨酸转化为反式-3-羟脯氨酸的具有脯氨酸羟化酶活性的示例性工程化多肽,包含具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比在表4.1、表4.2、表4.3、表4.4、表5.1、表5.2、表5.3、表6.1、表7.1、表7.2、表7.3、表8.1、表8.2、表9.1、表9.2、表10.1、表10.2、表11.1、表11.2和/或表12.1所示的残基位置处的一个或更多个残基差异的氨基酸序列。
本发明的示例性非天然存在的(或工程化)脯氨酸羟化酶多肽的结构和功能信息基于L-脯氨酸向反式-3-羟脯氨酸的转化,其结果如下表4.1、表4.2、表4.3、表4.4、表5.1、表5.2、表5.3、表6.1、表7.1、表7.2、表7.3、表8.1、表8.2、表9.1、表9.2、表10.1、表10.2、表11.1、表11.2和/或表12.1所示。奇数编号的序列标识符(即SEQ ID NO)是指编码由偶数编号的SEQ ID NO提供的氨基酸序列的核苷酸序列。示例性序列提供在伴随本发明的电子序列表文件中,该序列表文件通过引用特此并入本文。氨基酸残基差异是基于与参考序列SEQID NO:4、116、162、322、412、492、562、598和/或630的比较。来自真菌sp.No.11243的脯氨酸羟化酶ANO的天然存在的氨基酸序列在本文作为SEQ ID NO:2提供(相应的多核苷酸序列为SEQ ID NO:1,如本文提供的)。每种工程化多肽相对于参考多肽SEQ ID NO:4、116、162、322、412、492、562、598和/或630的活性按本文实施例中描述的底物的转化来确定。在一些实施方案中,使用摇瓶粉末(SFP)或下游处理(DSP)粉末测定作为次要筛选以评估工程化脯氨酸羟化酶的特性,其结果在表4.1、表4.2、表4.3、表4.4、表5.1、表5.2、表5.3、表6.1、表7.1、表7.2、表7.3、表8.1、表8.2、表9.1、表9.2、表10.1、表10.2、表11.1、表11.2和/或表12.1中提供。SFP形式提供工程化多肽的更纯化的粉末制品,并且可含有多达总蛋白的约30%的工程化多肽。因为DSP制品可含有多达总蛋白的约80%的工程化脯氨酸羟化酶,该制品可提供工程化多肽的甚至更纯化形式。
在一些实施方案中,与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比在本文所示的残基位置处的残基差异相关的特定酶特性包括,除了其他以外,酶活性、底物耐受性、热稳定性、区域选择性和立体选择性。酶活性的改进与本文实施例中所示的残基位置处的残基差异相关。选择性的改进与本文实施例中所示的残基位置处的残基差异相关。热稳定性的改进与本文实施例中所示的残基位置处的残基差异相关。因此,在这些残基位置处的残基差异可单独或以各种组合使用以产生具有期望的改进的特性的工程化脯氨酸羟化酶多肽,所述期望的改进的特性包括,除了其他以外,酶活性、底物耐受性、区域选择性、立体选择性和热稳定性。影响多肽表达的其他残基差异可以用来增加工程化脯氨酸羟化酶的表达。
根据本文提供的指导,还设想,包括SEQ ID NO:4-658的偶数编号的序列的示例性工程化多肽中的任一个可用作用于合成其他工程化脯氨酸羟化酶多肽的起始氨基酸序列,例如通过掺入来自表4.1、表4.2、表4.3、表4.4、表5.1、表5.2、表5.3、表6.1、表7.1、表7.2、表7.3、表8.1、表8.2、表9.1、表9.2、表10.1、表10.2、表11.1、表11.2和/或表12.1中的其他多肽以及本文描述的其他残基位置的各种氨基酸的新组合的随后几轮演化。另外的改进可通过在贯穿较早轮的演化保持未改变的残基位置处包含氨基酸差异来产生。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:21、28、58/247、65、80、85、95、98、117、120、159、185、194、199、200、233、237、243、250、268、281、282、287、289、307、324、326、327、330、338、343、346和348。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:21Q、28A、58V/247V、65A、80H、85L、95P、95R、98L、117E、117L、117R、117S、117T、120F、159G、185D、194L、194T、199A、200V、233A、233R、237E、243A、243V、250Q、268H、281S、282E、282S、287E、289D、307I、324D、326G、326H、326K、327Q、330G、338I、343N、343P、346S和348S(相对于SEQ ID NO:4)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:R21Q、P28A、E58V/P247V、S65A、K80H、E85L、G95P、G95R、Q98L、A117E、A117L、A117R、A117S、A117T、L120F、Q159G、A185D、N194L、N194T、T199A、P200V、V233A、V233R、Q237E、L243A、L243V、V250Q、R268H、R281S、L282E、L282S、D287E、M289D、V307I、A324D、R326G、R326H、R326K、W327Q、L330G、M338I、V343N、V343P、A346S和Q348S(相对于SEQ ID NO:4)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:21、28、45、65、95、112、117、139、177、185、199、233、243、250、281、282、287、289、307、324、326、327、335、338、343和346。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:21Q、28A、45S、65A、95R、112L、117S、139F、177P、185D、199A、233A、243V、250Q、250T、281S、281T、282E、282S、287E、289D、307I、324D、326G、326H、326K、327Q、335A、335M、338I、343N、343P和346S(相对于SEQ ID NO:4)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:R21Q、P28A、Y45S、S65A、G95R、R112L、A117S、M139F、S177P、A185D、T199A、V233A、L243V、V250Q、V250T、R281S、R281T、L282E、L282S、D287E、M289D、V307I、A324D、R326G、R326H、R326K、W327Q、S335A、S335M、M338I、V343N、V343P和A346S(相对于SEQ ID NO:4)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:48/66/189/194、48/66/194和66/82/85/135/189/194/267。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:48V/66W/189N/194L、48V/66W/194L和66W/82P/85P/135P/189N/194L/267D(相对于SEQ ID NO:4)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:A48V/Y66W/A189N/N194L、A48V/Y66W/N194L和Y66W/K82P/E85P/A135P/A189N/N194L/G267D(相对于SEQ ID NO:4)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:20/56/76/168/169/296、20/56/232/294、20/119/294/296、56/76/119/124/147/232、56/76/294、76/168/232/294、76/294/296、76/296、147和232。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:20F/56P/76E/168A/169L/296I、20F/56P/232E/294Y、20F/119D/294Y/296I、56P/76E/119D/124F/147F/232E、56P/76E/294Y、76E/168A/232E/294Y、76E/294Y/296I、76E/296I、147F和232E(相对于SEQ ID NO:4)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:Y20F/S56P/H76E/C168A/I169L/L296I、Y20F/S56P/Q232E/H294Y、Y20F/E119D/H294Y/L296I、S56P/H76E/E119D/W124F/Y147F/Q232E、S56P/H76E/H294Y、H76E/C168A/Q232E/H294Y、H76E/H294Y/L296I、H76E/L296I、Y147F和Q232E(相对于SEQ ID NO:4)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和与SEQ ID NO:116相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:123、189、195、233和296。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:123T、189A、189S、195Y、233A、233M和296V(相对于SEQ ID NO:116)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:S123T、N189A、N189S、H195Y、V233A、V233M和L296V(相对于SEQID NO:116)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:20/21/56、20/21/56/76/95/232/294/307/335、20/21/56/76/147/225/232/233/281/294/296/307/335、20/21/56/95/147/281/294/307、20/21/56/281/307、20/21/76/232/243、20/21/95/232/307、20/21/95/281/294/296、20/21/147/189/233/243/281/307、20/56、20/56/76/95/281/307、20/56/76/147/294/296/307、20/56/95/147/294、20/56/281、20/76、20/76/95/281/294/296、20/76/95/281/296/307、20/76/233/294/307、20/76/243/281/294、21/76/147/233/294/307、21/76/147/243/296/307/335、21/95/185/189/232/281/296、21/95/233/243/281/296、21/95/294/296/307/335、21/95/307、21/281/307、29/76/281、56/76/95/232/243/281、56/76/147/281/307、56/76/243/294、56/76/281/294、56/76/296、56/76/307、56/95/147/307/335/348、56/95/232/233/281/294/307、56/95/243/281、56/147/281、56/232/243/281、56/232/281、56/232/281/294/296、56/233/281/294/296、56/281/307、76/95/232/243/281/307、76/95/243/281/307/335、76/95/294/307、76/147、76/147/233/243/294、76/147/233/281/294/307、76/147/243/294/296/307/335、76/147/281/307、76/189/296、76/232/233/243/294/296/307、76/281、76/281/294、76/294/296、95/120、95/147/335、95/232/243/281/294/307、95/232/281/294/296、95/281/294/296、95/335、147、147/225/232/243/281/296/307/335、147/233/243/281/307、147/233/281/307/335、147/243/281、147/307、232/233/281/294/296/307、232/281、232/284/307、233/243/281/296/307/335、233/281/296/307、243/281/294/296、281、281/294、281/307、307和335、117、139、177、185、199、233、243、250、281、282、287、289、307、324、326、327、335、338、343和346。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:20F/21Q/56P、20F/21Q/56P/76E/95R/232E/294Y/307I/335M、20F/21Q/56P/76E/147F/225R/232E/233A/281S/294Y/296I/307L/335M、20F/21Q/56P/95R/147F/281T/294Y/307I、20F/21Q/56P/281T/307L、20F/21Q/76E/232E/243V、20F/21Q/95R/232E/307I、20F/21Q/95R/281T/294Y/296I、20F/21Q/147F/189A/233R/243V/281T/307I、20F/56P、20F/56P/76E/95R/281S/307I、20F/56P/76E/147F/294Y/296I/307L、20F/56P/95P/147F/294Y、20F/56P/281S、20F/76E、20F/76E/95R/281S/294Y/296I、20F/76E/95R/281T/296I/307I、20F/76E/233A/294Y/307I、20F/76E/243V/281T/294Y、21Q/76E/147F/233R/294Y/307I、21Q/76E/147F/243V/296I/307I/335M、21Q/95R/185L/189A/232E/281T/296I、21Q/95R/233A/243V/281T/296I、21Q/95R/294Y/296I/307I/335M、21Q/95R/307I、21Q/281T/307L、29T/76E/281T、56P/76E/95R/232E/243V/281T、56P/76E/147F/281T/307I、56P/76E/243V/294Y、56P/76E/281T/294Y、56P/76E/296I、56P/76E/307I、56P/95P/147F/307I/335M/348K、56P/95R/232E/233R/281S/294Y/307L、56P/95R/243V/281T、56P/147F/281T、56P/232E/243V/281S、56P/232E/281S、56P/232E/281S/294Y/296I、56P/233R/281S/294Y/296I、56P/281T/307I、76E/95P/232E/243V/281S/307L、76E/95R/243V/281S/307I/335M、76E/95R/294Y/307L、76E/147F、76E/147F/233A/243V/294Y、76E/147F/233R/281T/294Y/307L、76E/147F/243V/294Y/296I/307L/335M、76E/147F/281S/307L、76E/189A/296I、76E/232E/233R/243V/294Y/296I/307I、76E/281S、76E/281T/294Y、76E/294Y/296I、95P/232E/281T/294Y/296I、95P/335M、95R/120P、95R/147F/335M、95R/232E/243V/281T/294Y/307I、95R/281T/294Y/296I、95R/335M、147F、147F/225R/232E/243V/281S/296I/307L/335M、147F/233A/243V/281S/307L、147F/233R/281T/307L/335M、147F/243V/281S、147F/307I、232E/233A/281T/294Y/296I/307I、232E/281T、232E/284R/307I、233A/243V/281S/296I/307I/335M、233A/281T/296I/307I、243V/281S/294Y/296I、281T、281T/294Y、281T/307I、281T/307L、307I和335M(相对于SEQ ID NO:116)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:Y20F/R21Q/S56P、Y20F/R21Q/S56P/H76E/G95R/Q232E/H294Y/V307I/S335M、Y20F/R21Q/S56P/H76E/Y147F/Q225R/Q232E/V233A/R281S/H294Y/L296I/V307L/S335M、Y20F/R21Q/S56P/G95R/Y147F/R281T/H294Y/V307I、Y20F/R21Q/S56P/R281T/V307L、Y20F/R21Q/H76E/Q232E/L243V、Y20F/R21Q/G95R/Q232E/V307I、Y20F/R21Q/G95R/R281T/H294Y/L296I、Y20F/R21Q/Y147F/N189A/V233R/L243V/R281T/V307I、Y20F/S56P、Y20F/S56P/H76E/G95R/R281S/V307I、Y20F/S56P/H76E/Y147F/H294Y/L296I/V307L、Y20F/S56P/G95P/Y147F/H294Y、Y20F/S56P/R281S、Y20F/H76E、Y20F/H76E/G95R/R281S/H294Y/L296I、Y20F/H76E/G95R/R281T/L296I/V307I、Y20F/H76E/V233A/H294Y/V307I、Y20F/H76E/L243V/R281T/H294Y、R21Q/H76E/Y147F/V233R/H294Y/V307I、R21Q/H76E/Y147F/L243V/L296I/V307I/S335M、R21Q/G95R/A185L/N189A/Q232E/R281T/L296I、R21Q/G95R/V233A/L243V/R281T/L296I、R21Q/G95R/H294Y/L296I/V307I/S335M、R21Q/G95R/V307I、R21Q/R281T/V307L、A29T/H76E/R281T、S56P/H76E/G95R/Q232E/L243V/R281T、S56P/H76E/Y147F/R281T/V307I、S56P/H76E/L243V/H294Y、S56P/H76E/R281T/H294Y、S56P/H76E/L296I、S56P/H76E/V307I、S56P/G95P/Y147F/V307I/S335M/Q348K、S56P/G95R/Q232E/V233R/R281S/H294Y/V307L、S56P/G95R/L243V/R281T、S56P/Y147F/R281T、S56P/Q232E/L243V/R281S、S56P/Q232E/R281S、S56P/Q232E/R281S/H294Y/L296I、S56P/V233R/R281S/H294Y/L296I、S56P/R281T/V307I、H76E/G95P/Q232E/L243V/R281S/V307L、H76E/G95R/L243V/R281S/V307I/S335M、H76E/G95R/H294Y/V307L、H76E/Y147F、H76E/Y147F/V233A/L243V/H294Y、H76E/Y147F/V233R/R281T/H294Y/V307L、H76E/Y147F/L243V/H294Y/L296I/V307L/S335M、H76E/Y147F/R281S/V307L、H76E/N189A/L296I、H76E/Q232E/V233R/L243V/H294Y/L296I/V307I、H76E/R281S、H76E/R281T/H294Y、H76E/H294Y/L296I、G95P/Q232E/R281T/H294Y/L296I、G95P/S335M、G95R/L120P、G95R/Y147F/S335M、G95R/Q232E/L243V/R281T/H294Y/V307I、G95R/R281T/H294Y/L296I、G95R/S335M、Y147F、Y147F/Q225R/Q232E/L243V/R281S/L296I/V307L/S335M、Y147F/V233A/L243V/R281S/V307L、Y147F/V233R/R281T/V307L/S335M、Y147F/L243V/R281S、Y147F/V307I、Q232E/V233A/R281T/H294Y/L296I/V307I、Q232E/R281T、Q232E/G284R/V307I、V233A/L243V/R281S/L296I/V307I/S335M、V233A/R281T/L296I/V307I、L243V/R281S/H294Y/L296I、R281T、R281T/H294Y、R281T/V307I、R281T/V307L、V307I和S335M(相对于SEQID NO:116)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:21/76/147/243/296/307/335、56/76/147/281/307和95/147/335。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:21Q/76E/147F/243V/296I/307I/335M、56P/76E/147F/281T/307I和95R/147F/335M(相对于SEQ IDNO:116)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:R21Q/H76E/Y147F/L243V/L296I/V307I/S335M、S56P/H76E/Y147F/R281T/V307I和G95R/Y147F/S335M(相对于SEQ ID NO:116)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:162的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和与SEQ ID NO:162相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:2/85/123/237、28/115/117/120/123/268/270/343/346/348、45/123/326、65/117/120/123/343/346、85/123/281/282、114/115/117/120/123/268/271/313/326/343/346、123/139/233/237/281/282/289/324/326和123/199/200/247/250/338。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:162的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:2L/85L/123T/237E、28A/115T/117V/120I/123T/268T/270L/343N/346S/348S、45S/123T/326G、65R/117V/120I/123T/343N/346G、85L/123T/281T/282S、114G/115T/117T/120P/123T/268T/271A/313F/326G/343N/346S、123T/139F/233A/237E/281M/282S/289D/324Q/326G和123T/199A/200V/247L/250Q/338I(相对于SEQ ID NO:162)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:162的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:G2L/E85L/S123T/Q237E、P28A/V115T/A117V/L120I/S123T/R268T/R270L/V343N/A346S/Q348S、Y45S/S123T/R326G、S65R/A117V/L120I/S123T/V343N/A346G、E85L/S123T/R281T/L282S、E114G/V115T/A117T/L120P/S123T/R268T/S271A/L313F/R326G/V343N/A346S、S123T/M139F/V233A/Q237E/R281M/L282S/M289D/A324Q/R326G和S123T/T199A/P200V/P247L/V250Q/M338I(相对于SEQID NO:162)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和与SEQ ID NO:322相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:26、54、61、129、132、149、156、175、189、201、209、228、236、248、262、272、277、291和345。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:26N、54P、61H、129I、132P、149G、156S、175S、175V、189S、201C、201G、201T、209S、228T、236T、248R、262V、272S、277A、291G和345R(相对于SEQ ID NO:322)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ IDNO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:G26N、G54P、D61H、A129I、E132P、S149G、V156S、L175S、L175V、N189S、A201C、A201G、A201T、C209S、V228T、Q236T、D248R、S262V、V272S、V277A、P291G和T345R(相对于SEQ ID NO:322)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的工程化多肽包含具有与SEQ ID NO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:25、43、54、58、61、79、129、132、143、156、163、175、179、201、209、236、248、278、291、345和347。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:25K、43T、54P、54S、58T、61H、79T、129I、132N、143L、156D、156S、163L、175V、179L、201C、209S、236T、248R、278N、291G、345R和347E(相对于SEQ ID NO:322)。在一些实施方案中,具有与SEQ IDNO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:H25K、A43T、G54P、G54S、E58T、D61H、Q79T、A129I、E132N、D143L、V156D、V156S、Q163L、L175V、E179L、A201C、C209S、Q236T、D248R、S278N、P291G、T345R和A347E(相对于SEQ ID NO:322)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:85/117/120/135/208/270/324/343/346、85/117/120/135/208/281/282/289、85/117/120/270/281/289、85/117/135/139/208和117/120/208/270/324/343/346。在一些实施方案中,与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比具有一种或更多改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:85L/117T/120P/135S/208E/281R/282L/289M、85L/117T/135S/139M/208E、85L/117V/120I/135S/208E/270L/324A/343N/346G、85L/117V/120P/270L/281R/289M和117T/120I/208E/270L/324A/343N/346G(相对于SEQ ID NO:322)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:E85L/A117T/L120P/A135S/A208E/M281R/S282L/D289M、E85L/A117T/A135S/F139M/A208E、E85L/A117V/L120I/A135S/A208E/R270L/Q324A/V343N/A346G、E85L/A117V/L120P/R270L/M281R/D289M和A117T/L120I/A208E/R270L/Q324A/V343N/A346G(相对于SEQ ID NO:322)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:412的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:47、48、56/118、85、95、95/289、113、118、118/247、154、162、162/204、164、164/198/271、168、169、187、195、243、271、275、281、314、330和342。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:412的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:47M、48G、56P/118W、85P、95A/289V、95W、113H、113N、113P、113R、118D、118P/247A、118V、118W、154L、162A、162L、162M、162V、162V/204S、164D/198V/271V、164T、168V、169C、169T、169V、187P、195Y、243Y、271V、275K、281L、314A、314S、314T、330G、330H和342R(相对于SEQ ID NO:412)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:412的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:F47M、V48G、S56P/A118W、L85P、G95A/M289V、G95W、S113H、S113N、S113P、S113R、A118D、A118P/P247A、A118V、A118W、F154L、H162A、H162L、H162M、H162V、H162V/L204S、S164D/A198V/S271V、S164T、C168V、I169C、I169T、I169V、C187P、H195Y、V243Y、S271V、R275K、R281L、F314A、F314S、F314T、L330G、L330H和N342R(相对于SEQ ID NO:412)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:412的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和与SEQ ID NO:412相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:25/129/163/236/262/345/347、120/156/175/179/201、129/189/236/262/277/278、129/236/262、156/175/179/228和162。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:412的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:25K/129I/163L/236T/262V/345R/347E、120V/156S/175V/179L/201G、129I/189S/236T/262V/277A/278N、129I/236T/262V、156S/175V/179L/228A、162L和162V(相对于SEQ ID NO:412)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:412的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:H25K/A129I/Q163L/Q236T/S262V/T345R/A347E、P120V/V156S/L175V/E179L/A201G、A129I/N189S/Q236T/S262V/V277A/S278N、A129I/Q236T/S262V、V156S/L175V/E179L/V228A、H162L和H162V(相对于SEQ ID NO:412)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:492的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:15、17、28、29、65、135、167、177、199、208、228、235、287、294、307和343。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ IDNO:492的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:15V、17C、28I、29S、65V、135G、135N、135T、167G、177A、177L、177P、199C、208L、208M、208S、228T、235E、287E、294T、307L、343S和343T(相对于SEQ ID NO:492)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:492的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:I15V、S17C、P28I、A29S、S65V、S135G、S135N、S135T、Q167G、S177A、S177L、S177P、T199C、E208L、E208M、E208S、V228T、D235E、D287E、H294T、I307L、V343S和V343T(相对于SEQ ID NO:492)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:492的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和与SEQ ID NO:492相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:85/187/281/347、85/187/347、118/120/162/175/179/330、118/120/162/175/330、162/175/179/330、175/228/330、195/347和278/314/347。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ IDNO:492的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:85P/187P/281L/347E、85P/187P/347E、118V/120V/162V/175V/179L/330H、118V/120V/162V/175V/330H、162V/175V/179L/330H、175V/228A/330H、195Y/347E和278S/314A/347E(相对于SEQ ID NO:492)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:492的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:L85P/C187P/R281L/A347E、L85P/C187P/A347E、A118V/P120V/H162V/L175V/E179L/L330H、A118V/P120V/H162V/L175V/L330H、H162V/L175V/E179L/L330H、L175V/V228A/L330H、H195Y/A347E和N278S/F314A/A347E(相对于SEQ ID NO:492)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:562的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:15、40、43、44、59、79、82、149、164、179、345和347。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:562的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:15F、40A、43S、44R、44V、59L、79E、82A、149N、164Q、179T、345D和347K(相对于SEQ ID NO:562)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:562的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:I15F、K40A、A43S、G44R、G44V、R59L、Q79E、K82A、S149N、S164Q、L179T、T345D和A347K(相对于SEQ ID NO:562)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:562的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和与SEQ ID NO:562相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:29/85/177/208/228/347、29/85/208/228/343/347、29/177/195/228/343、29/208/228/278/294/347、56/195/278、85/187/205/208/278、113/177/187/195/208/278/294/343/347和177/205/208/228。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:562的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:29S/85P/177A/208S/228T/347E、29S/85P/208L/228T/343T/347E、29S/177P/195Y/228T/343T、29S/208S/228T/278S/294T/347E、56P/195Y/278S、85P/187P/205S/208L/278S、113N/177P/187P/195Y/208S/278S/294Y/343T/347E和177A/205S/208L/228T(相对于SEQ ID NO:562)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:562的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:A29S/L85P/S177A/E208S/V228T/A347E、A29S/L85P/E208L/V228T/V343T/A347E、A29S/S177P/H195Y/V228T/V343T、A29S/E208S/V228T/N278S/H294T/A347E、S56P/H195Y/N278S、L85P/C187P/A205S/E208L/N278S、S113N/S177P/C187P/H195Y/E208S/N278S/H294Y/V343T/A347E和S177A/A205S/E208L/V228T(相对于SEQ ID NO:562)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:598的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:47、162、209、219、227和342。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:598的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:47Q、162S、209H、219V、227R、342L和342M(相对于SEQ ID NO:598)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:598的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:F47Q、V162S、C209H、T219V、S227R、N342L和N342M(相对于SEQ ID NO:598)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:598的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和与SEQ ID NO:598相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:17/44/179/195/250/313/345、17/44/199/313、43/44/195/199、44/149/164/171/187、44/179/195/199、44/179/195/199/345、79/163/164/171/187/201/286/288、82/163/164、82/163/164/171/187/201/203/208/286/288/320、149/164/171/288和187/286。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:598的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:17V/44R/199C/313C、17V/44V/179T/195Y/250P/313C/345D、43S/44V/195Y/199C、44R/179T/195Y/199C、44R/179T/195Y/199C/345D、44V/149N/164Q/171M/187P、44V/179T/195Y/199C/345D、79E/163D/164Q/171M/187N/201V/286P/288T、82A/163D/164Q、82A/163D/164Q/171M/187P/201V/203Q/208I/286P/288T/320V、149N/164Q/171M/288T和187P/286P(相对于SEQ ID NO:598)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:598的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:S17V/G44R/T199C/L313C、S17V/G44V/L179T/H195Y/V250P/L313C/T345D、A43S/G44V/H195Y/T199C、G44R/L179T/H195Y/T199C、G44R/L179T/H195Y/T199C/T345D、G44V/S149N/S164Q/T171M/C187P、G44V/L179T/H195Y/T199C/T345D、Q79E/Q163D/S164Q/T171M/C187N/A201V/A286P/V288T、K82A/Q163D/S164Q、K82A/Q163D/S164Q/T171M/C187P/A201V/S203Q/L208I/A286P/V288T/K320V、S149N/S164Q/T171M/V288T和C187P/A286P(相对于SEQ ID NO:598)。
在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:630的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和与SEQ ID NO:630相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:82/164/171/203/208、135/163/164/201/203/208、162、162/219/236、162/219/313/338、162/236/342、162/313/342和164/171/201/203/282。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ IDNO:630的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:82A/164T/171M/203Q/208I、135P/163D/164Q/201V/203Q/208I、162S、162S/219V/236L、162S/219V/313C/338I、162S/236L/342M、162S/313C/342M和164Q/171M/201V/203Q/282V(相对于SEQ ID NO:630)。在一些实施方案中,具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进的特性的具有脯氨酸羟化酶活性的工程化多肽包含具有与SEQ ID NO:630的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性和选自以下的一个或更多个残基差异的氨基酸序列:K82A/S164T/T171M/S203Q/L208I、S135P/Q163D/S164Q/A201V/S203Q/L208I、V162S、V162S/T219V/T236L、V162S/T219V/L313C/M338I、V162S/T236L/N342M、V162S/L313C/N342M和S164Q/T171M/A201V/S203Q/L282V(相对于SEQ ID NO:630)。
如本领域技术人员将领会的,在一些实施方案中,选择的以上的残基差异的一个或组合在工程化脯氨酸羟化酶中可以作为核心特征而保持不变(即,维持),并且在其他残基位置处的另外的残基差异掺入序列以生成另外的具有改进的特性的工程化脯氨酸羟化酶多肽。相应地,应理解对于包含以上的残基差异中的一个或子集的任何工程化脯氨酸羟化酶,本发明设想了包含残基差异中的一个或子集,以及另外地在本文公开的其他残基位置处的一个或更多个残基差异的其他的工程化脯氨酸羟化酶。
如以上提到的,具有脯氨酸羟化酶活性的工程化多肽还能够将底物化合物L-脯氨酸转化为产物化合物反式-3-羟脯氨酸。在一些实施方案中,工程化脯氨酸羟化酶多肽能够以相对于参考多肽SEQ ID NO:4、116、162、322、412、492、562、598和/或630的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍或更大的活性将底物化合物L-脯氨酸转化为产物化合物反式-3-羟脯氨酸。在一些实施方案中,能够以相对于参考多肽SEQ ID NO:4、116、162、322、412、492、562、598和/或630的活性的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍或更大的活性将底物化合物L-脯氨酸转化为产物化合物反式-3-羟脯氨酸的工程化脯氨酸羟化酶多肽,包括具有选自改进的区域选择性、改进的活性、改进的比活性和/或改进的热稳定性的一个或更多个特征的氨基酸序列。
在一些实施方案中,工程化脯氨酸羟化酶多肽能够以相对于SEQ ID NO:4、116、162、322、412、492、562、598和/或630的至少1.2倍的活性将底物化合物L-脯氨酸转化为产物化合物反式-3-羟脯氨酸,并且包含选自以下范围中的偶数编号的序列的氨基酸序列:SEQ ID NO:6-658。
在一些实施方案中,工程化脯氨酸羟化酶多肽能够以相对于SEQ ID NO:4、116、162、322、412、492、562、598和/或630的至少2倍的活性将底物化合物L-脯氨酸转化为产物化合物反式-3-羟脯氨酸,并且包含具有本文提供的一个或更多个残基差异的氨基酸序列(与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比,视情况而定)。
在一些实施方案中,能够以相对于SEQ ID NO:4、116、162、322、412、492、562、598和/或630的至少2倍的活性将底物化合物L-脯氨酸转化为产物化合物反式-3-羟脯氨酸的工程化脯氨酸羟化酶多肽,包含选自以下范围中的偶数编号的序列的氨基酸序列:SEQ IDNO:6-658。
在一些实施方案中,工程化脯氨酸羟化酶多肽能够在HTP测定条件下、在SFP测定条件下、或DSP测定条件下,以约100g/L、约50g/L、或约20g/L的底物载量,在120h或更少时间、72h或更少时间、48h或更少时间、或24h或更少时间内将至少50%或更多、60%或更多、70%或更多、89%或更多、90%或更多、91%或更多、92%或更多、93%或更多、94%或更多、或95%或更多的化合物L-脯氨酸转化为产物化合物反式-3-羟脯氨酸。在一些实施方案中,工程化脯氨酸羟化酶多肽能够在DSP测定条件下在约25℃,以约20g/L的底物载量,在24h或更少时间内将至少50%或更多的化合物L-脯氨酸转化为产物化合物反式-3-羟脯氨酸。
在一些实施方案中,工程化脯氨酸羟化酶具有包含与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一个或更多个残基差异、增加工程化脯氨酸羟化酶活性在细菌宿主细胞(特别是大肠杆菌)中的表达的氨基酸序列。
在一些实施方案中,具有在化合物L-脯氨酸向产物化合物反式-3-羟脯氨酸的转化中的改进的特性的工程化脯氨酸羟化酶多肽具有包含选自以下范围中的偶数编号的序列的序列的氨基酸序列:SEQ ID NO:6-658。
在一些实施方案中,具有脯氨酸羟化酶活性的工程化多肽包含以下氨基酸序列,所述氨基酸序列具有与选自以下范围中的偶数编号的序列之一的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性:SEQID NO:6-658,和与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的、在以下范围中的偶数编号的序列的任何一个中存在的氨基酸残基差异:SEQ ID NO:6-658,如在表4.1、表4.2、表4.3、表4.4、表5.1、表5.2、表5.3、表6.1、表7.1、表7.2、表7.3、表8.1、表8.2、表9.1、表9.2、表10.1、表10.2、表11.1、表11.2和/或表12.1中提供的。
除以上指定的残基位置之外,本文公开的工程化脯氨酸羟化酶多肽中的任一个还可包含相对于SEQ ID NO:4、116、162、322、412、492、562、598和/或630,在其他残基位置(即,除在以下范围中的偶数编号的序列的任何一个中包括的那些残基位置外的残基位置:SEQ ID NO:6-658)的其他残基差异。在这些其他残基位置处的残基差异可提供氨基酸序列的另外的变异而没有不利地影响多肽进行脯氨酸向顺式-4-羟脯氨酸的转化以及化合物L-脯氨酸向产物化合物反式-3-羟脯氨酸的转化的能力。因此,在一些实施方案中,除了选自以下范围中的偶数编号的序列的工程化脯氨酸羟化酶多肽的任何一个中存在的氨基酸残基差异之外:SEQ ID NO:6-658,序列还可包含与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比在其他氨基酸残基位置处的1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-11个、1-12个、1-14个、1-15个、1-16个、1-18个、1-20个、1-22个、1-24个、1-26个、1-30个、1-35个、1-40个、1-45个、或1-50个残基差异。在一些实施方案中,与参考序列相比氨基酸残基差异的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个残基位置。在一些实施方案中,与参考序列相比氨基酸残基差异的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个残基位置。在这些其他位置处的残基差异可以是保守变化或非保守变化。在一些实施方案中,与SEQ ID NO:4、116、162、322、412、492、562、598和/或630的天然存在的脯氨酸羟化酶多肽相比,残基差异可以包括保守取代和非保守取代。
在一些实施方案中,本发明还提供了包含本文描述的工程化脯氨酸羟化酶多肽中的任一个的片段的工程化多肽,所述工程化脯氨酸羟化酶多肽的片段保留工程化脯氨酸羟化酶的功能活性和/或改进的特性。因此,在一些实施方案中,本发明提供了能够在适当的反应条件下将化合物L-脯氨酸转化为产物化合物反式-3-羟脯氨酸的多肽片段,其中该片段构成本发明的工程化脯氨酸羟化酶多肽的全长氨基酸序列的至少约80%、90%、95%、96%、97%、98%或99%,工程化脯氨酸羟化酶多肽诸如选自以下范围中的偶数编号的序列的示例性工程化脯氨酸羟化酶多肽:SEQ ID NO:6-658。
在一些实施方案中,工程化脯氨酸羟化酶多肽可以具有包含本文描述的工程化脯氨酸羟化酶多肽序列,例如以下范围中的偶数编号的序列的示例性工程化多肽中的任一个中的缺失的氨基酸序列:SEQ ID NO:6-658。因此,对于本发明的工程化脯氨酸羟化酶多肽的各个和每个实施方案,氨基酸序列可包含一个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多达脯氨酸羟化酶多肽的氨基酸总数的10%、多达脯氨酸羟化酶多肽的氨基酸总数的20%、或多达脯氨酸羟化酶多肽的氨基酸总数的30%的缺失,其中本文描述的工程化脯氨酸羟化酶的相关功能活性和/或改进的特性被保持。在一些实施方案中,缺失可包含1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个或1-50个氨基酸残基。在一些实施方案中,缺失的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基。在一些实施方案中,缺失可包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基的缺失。
在一些实施方案中,本文的工程化脯氨酸羟化酶多肽可具有与本文描述的工程化脯氨酸羟化酶多肽,例如以下范围中的偶数编号的序列的示例性工程化多肽中的任何一种相比包含插入的氨基酸序列:SEQ ID NO:6-658。因此,对于本发明的脯氨酸羟化酶多肽的各个和每个实施方案,插入可包含一个或更多个氨基酸、2个或更多个氨基酸,3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、20个或更多个氨基酸、30个或更多个氨基酸、40个或更多个氨基酸、或50个或更多个氨基酸,其中本文描述的工程化脯氨酸羟化酶的相关功能活性和/或改进的特性被保持。插入可以在脯氨酸羟化酶多肽的氨基末端或羧基末端或中间部分。
在一些实施方案中,本文的工程化脯氨酸羟化酶多肽可具有以下氨基酸序列,所述氨基酸序列包含选自以下范围中的偶数编号的序列的序列:SEQ ID NO:6-658,和任选地一个或数个(例如,多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个或1-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
在上述实施方案中,如实施例中描述的,提供了用于工程化多肽的合适反应条件。
在一些实施方案中,本发明的多肽是融合多肽,其中工程化多肽诸如通过例如但不限于抗体标签(例如,myc表位)、纯化序列(例如,用于结合金属的His标签)和细胞定位信号(例如,分泌信号)的方式被融合至其他多肽。因此,本文描述的工程化多肽可以与其他多肽融合或不融合地使用。
应理解,本文描述的多肽不局限于遗传编码的氨基酸。除了遗传编码的氨基酸之外,本文描述的多肽可以完全或部分地包含天然存在的和/或合成的非编码氨基酸。本文描述的多肽可以包含的某些常见的非编码氨基酸包括但不限于:遗传编码氨基酸的D-立体异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘苯丙氨酸(Pif);4-氨基甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla);3,3-二苯基丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4-羧酸;哌可酸(PA);氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aGly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu)、高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰赖氨酸(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟脯氨酸(Hyp)和高脯氨酸(hPro)。可以被本文描述的多肽包含的另外的非编码氨基酸对本领域技术人员将是明显的(参见例如,在Fasman,CRC Practical Handbook of Biochemistry and Molecular Biology,CRC Press,BocaRaton,FL,pp.3-70[1989]和其中引用的参考文献中提供的各种氨基酸,所有这些文献均通过引用并入)。这些氨基酸可以处于L-构型或D-构型。
本领域技术人员将认识到,带有侧链保护基团的氨基酸或残基也可以构成本文描述的多肽。在这种情况下属于芳香族类别的这样的受保护的氨基酸的非限制性实例包括(保护基团在括号中列出)但不限于:Arg(tos)、Cys(甲苄基)、Cys(硝基吡啶次磺酰基)、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
可以构成本文描述的多肽的构象上受限制的非编码氨基酸包括但不限于N-甲基氨基酸(L-构型);1-氨基环戊-(2或3)-烯-4-羧酸;哌可酸(pipecolic acid);氮杂环丁烷-3-羧酸;高脯氨酸(hPro);以及1-氨基环戊烷-3-羧酸。
在一些实施方案中,工程化的多肽可以是多种形式,例如诸如分离的制品、作为基本上纯化的酶、用编码酶的基因转化的全细胞和/或作为这样的细胞的细胞提取物和/或裂解物。酶可以是冻干的、喷雾干燥的、沉淀的或是粗制糊状物的形式,如以下进一步讨论的。
在一些实施方案中,工程化多肽可在固体支持物上提供,所述固体支持物诸如膜、树脂、固体载体或其他固相材料。固体支持物可以包括有机聚合物,诸如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯(polyethyleneoxy)和聚丙烯酰胺以及它们的共聚物和接枝物。固体支持物还可以是无机的,诸如玻璃、二氧化硅、可控孔隙玻璃(CPG)、反相二氧化硅或金属诸如金或铂。固体支持物的构型可以是珠、球、粒子、颗粒、凝胶、膜或表面的形式。表面可以是平坦的、基本上平坦的或非平坦的。固体支持物可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特征。固体支持物可以被配置为孔、凹陷(depression)或其他容器(container)、器皿(vessel)、特征或位置的形式。
在一些实施方案中,本发明的具有脯氨酸羟化酶活性的工程化多肽可被固定在固体支持物上,使得所述工程化多肽保留其相对于参考多肽SEQ ID NO:4、116、162、322、412、492、562、598和/或630的改进的活性、选择性和/或其他改进的特性。在这样的实施方案中,固定的多肽可以促进底物化合物或其他合适的底物向产物的生物催化转化,并且在反应完成后容易保留(例如,通过保留固定有多肽的珠),并且然后在随后的反应中重复使用或再循环。这样的固定酶的方法允许进一步的高效和降低成本。相应地还设想,使用本发明的工程化脯氨酸羟化酶多肽的方法中的任一种可使用结合或固定于固体支持物上的相同的脯氨酸羟化酶多肽来进行。
酶固定化的方法是本领域熟知的。工程化多肽可被非共价地或共价地结合。用于将酶缀合和固定到固体支持物(例如,树脂、膜、珠、玻璃等)的各种方法是本领域熟知的(参见例如,Yi等人,Proc.Biochem.,42(5):895-898[2007];Martin等人,Appl.Microbiol.Biotechnol.,76(4):843-851[2007];Koszelewski等人,J.Mol.Cat.B:Enzymatic,63:39-44[2010];Truppo等人,Org.Proc.Res.Dev.,published online:dx.doi.org/10.1021/op200157c;Hermanson,Bioconjugate Techniques,第2版,AcademicPress,Cambridge,MA[2008];Mateo等人,Biotechnol.Prog.,18(3):629-34[2002];和“Bioconjugation Protocols:Strategies and Methods,”于Methods in Molecular Biology,Niemeyer(编辑),Humana Press,New York,NY[2004];其每个的公开内容通过引用并入本文)。可用于固定本发明的工程化脯氨酸羟化酶的固体支持物包括但不限于珠或树脂,所述珠或树脂包含具有环氧官能团的聚甲基丙烯酸酯、具有氨基环氧官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯。可用于固定本发明的工程化脯氨酸羟化酶的示例性固体支持物包括但不限于壳聚糖珠、Eupergit C和SEPABEAD(Mitsubishi),包括以下不同类型的SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。
在一些实施方案中,本文描述的多肽以试剂盒的形式提供。试剂盒中的酶可单独地存在或作为多于一个酶存在。试剂盒还可包含用于进行酶促反应的试剂、用于评价酶活性的底物、以及用于检测产物的试剂。试剂盒还可包含试剂分配器和用于试剂盒使用的说明。
在一些实施方案中,本发明的试剂盒包含在不同的可寻址的位置处含有多于一个不同的脯氨酸羟化酶多肽的阵列,其中不同的多肽为参考序列的不同变体,其每个具有至少一种不同的改进的酶特性。在一些实施方案中,固定在固体支持物上的多于一个多肽被配置在阵列上可用试剂的自动递送或通过检测方法和/或仪器寻址的多个位置。阵列可用来测试用于被多肽转化的各种底物化合物。包含多于一个工程化多肽的这样的阵列及其使用方法是本领域已知的(参见例如,WO2009/008908A2)。
编码工程化脯氨酸羟化酶的多核苷酸、表达载体和宿主细胞
在另一方面,本发明提供了编码本文描述的工程化脯氨酸羟化酶多肽的多核苷酸。可以将多核苷酸可操作地连接至控制基因表达的一个或更多个异源调控序列以产生能够表达多肽的重组多核苷酸。将包含编码工程化脯氨酸羟化酶的异源多核苷酸的表达构建体引入合适的宿主细胞以表达相应的脯氨酸羟化酶多肽。
如对技术人员将是明显的,蛋白序列的可获得性和对应于各种氨基酸的密码子的知识提供了能够编码主题多肽的所有多核苷酸的说明。其中相同氨基酸由可选的或同义的密码子编码的遗传密码的简并性允许制备极大数量的核酸,所有这些核酸编码改进的脯氨酸羟化酶。因此,知道了特定的氨基酸序列后,本领域技术人员可以通过以不改变蛋白的氨基酸序列的方式简单修改序列的一个或更多个密码子来制备任何数量的不同核酸。在这一点上,本发明明确设想了可通过选择基于可能的密码子选择的组合制备的编码本文描述的多肽的多核苷酸的各种和每一种可能的变异,并且所有这样的变异都被认为对于本文描述的任何多肽被明确地公开,包括在表4.1、表4.2、表4.3、表4.4、表5.1、表5.2、表5.3、表6.1、表7.1、表7.2、表7.3、表8.1、表8.2、表9.1、表9.2、表10.1、表10.2、表11.1、表11.2和/或表12.1中呈现的以及在通过引用并入本文的序列表中作为在以下范围中的偶数编号的序列公开的氨基酸序列:SEQ ID NO:6-658。
在各种实施方案中,密码子优选地被选择为适应在其中产生蛋白的宿主细胞。例如,在细菌中使用的优选的密码子被用于在细菌中表达基因;在酵母中使用的优选的密码子被用于酵母中的表达;并且在哺乳动物中使用的优选的密码子被用于哺乳动物细胞中的表达。在一些实施方案中,不是所有密码子都需要被替换以优化脯氨酸羟化酶的密码子使用,因为天然序列将包含优选的密码子,并且因为可能不需要对所有氨基酸残基使用优选的密码子。因此,编码脯氨酸羟化酶的密码子优化的多核苷酸可以在全长编码区的约40%、50%、60%、70%、80%或大于90%的密码子位置包含优选的密码子。
在一些实施方案中,多核苷酸包含编码如由SEQ ID NO:4、116、162、322、412、492、562、598和/或630表示的天然存在的脯氨酸羟化酶多肽氨基酸序列的密码子优化的核苷酸序列。在一些实施方案中,多核苷酸具有包括与编码以下范围中的偶数编号的序列的密码子优化的核酸序列的至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的核酸序列:SEQ ID NO:6-658。在一些实施方案中,多核苷酸具有包括与以下范围中的奇数编号的序列的密码子优化的核酸序列的至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的核酸序列:SEQ ID NO:5-657。以下范围中的奇数编号的序列的密码子优化的序列:SEQ ID NO:5-657,增强编码的野生型脯氨酸羟化酶的表达,提供能够在微型-DSP测定条件下将超过80%的化合物L-脯氨酸体外转化为产物化合物反式-3-羟脯氨酸,以及在DSP测定条件下将超过45%的化合物L-脯氨酸转化为产物化合物反式-3-羟脯氨酸的酶制品。在一些实施方案中,与来自真菌sp.No.11243的ANO的天然存在的多核苷酸序列相比,密码子优化的多核苷酸序列可以以至少1.2倍、1.5倍或2倍或更大增强脯氨酸羟化酶的表达。
在一些实施方案中,多核苷酸能够在高严格性条件下与选自SEQ ID NO:3-657中的奇数编号的序列的参考序列或其互补体杂交,并编码具有脯氨酸羟化酶活性的多肽。
在一些实施方案中,如以上描述的,多核苷酸编码具有与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比的一种或更多种改进特性的具有脯氨酸羟化酶活性的工程化多肽,其中多肽包含以下氨基酸序列,所述氨基酸序列具有与选自SEQ ID NO:4、116、162、322、412、492、562、598和/或630的参考序列的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性,以及与SEQID NO:4、116、162、322、412、492、562、598和/或630相比选自以下范围中的偶数编号的序列的一个或更多个残基差异:SEQ ID NO:6-658。在一些实施方案中,参考氨基酸序列选自下列范围中的偶数编号的序列:SEQ ID NO:6-658。在一些实施方案中,参考氨基酸序列为SEQID NO:4。在一些实施方案中,参考氨基酸序列为SEQ ID NO:116。在一些实施方案中,参考氨基酸序列为SEQ ID NO:162。在一些实施方案中,参考氨基酸序列为SEQ ID NO:322。在一些实施方案中,参考氨基酸序列为SEQ ID NO:412。在一些实施方案中,参考氨基酸序列为SEQ ID NO:492。在一些实施方案中,参考氨基酸序列为SEQ ID NO:562。在一些实施方案中,参考氨基酸序列为SEQ ID NO:598。在一些实施方案中,参考氨基酸序列为SEQ ID NO:630。
在一些实施方案中,多核苷酸编码与参考多肽SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比具有改进的酶特性的能够将底物化合物L-脯氨酸转化为产物化合物反式-3-羟脯氨酸的工程化脯氨酸羟化酶多肽,其中多肽包含具有与选自以下范围中的偶数编号的序列的任一个的参考多肽的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列:SEQ ID NO:6-658,条件是氨基酸序列与SEQ ID NO:4、116、162、322、412、492、562、598和/或630相比包含来自以下范围中的偶数编号的序列的任何一个多肽序列中包含的残基差异集合的任何一个:SEQ ID NO:6-658,如列于表4.1、表4.2、表4.3、表4.4、表5.1、表5.2、表5.3、表6.1、表7.1、表7.2、表7.3、表8.1、表8.2、表9.1、表9.2、表10.1、表10.2、表11.1、表11.2和/或表12.1中的。
在一些实施方案中,编码工程化脯氨酸羟化酶的多核苷酸包括选自以下范围中的奇数编号的序列的多核苷酸序列:SEQ ID NO:5-657。
在一些实施方案中,多核苷酸能够在高严格性条件下与选自以下范围中的奇数编号的序列的参考多核苷酸序列或其互补体杂交:SEQ ID NO:5-657,并且编码本文描述的具有一种或更多种改进特性的具有脯氨酸羟化酶活性的多肽。
在一些实施方案中,能够在高严格性条件下杂交的多核苷酸编码工程化多肽,所述工程化多肽具有脯氨酸羟化酶活性,具有一种或更多种改进的特性,所述工程化多肽包含具有与SEQ ID NO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,和与SEQ ID NO:4相比在选自21、28、58/247、65、80、85、95、98、117、120、159、185、194、199、200、233、237、243、250、268、281、282、287、289、307、324、326、327、330、338、343、346和348的残基位置处或在选自21、28、45、65、95、112、117、139、177、185、199、233、243、250、281、282、287、289、307、324、326、327、335、338、343和346的残基位置处或在选自48/66/189/194、48/66/194和66/82/85/135/189/194/267的残基位置处或在选自20/56/76/168/169/296、20/56/232/294、20/119/294/296、56/76/119/124/147/232、56/76/294、76/168/232/294、76/294/296、76/296、147和232的残基位置处的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,能够在高严格性条件下杂交的多核苷酸编码工程化多肽,所述工程化多肽具有脯氨酸羟化酶活性,具有一种或更多种改进的特性,所述工程化多肽包含具有与SEQ ID NO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,和与SEQ ID NO:116相比在选自123、189、195、233和296的残基位置处或在选自20/21/56、20/21/56/76/95/232/294/307/335、20/21/56/76/147/225/232/233/281/294/296/307/335、20/21/56/95/147/281/294/307、20/21/56/281/307、20/21/76/232/243、20/21/95/232/307、20/21/95/281/294/296、20/21/147/189/233/243/281/307、20/56、20/56/76/95/281/307、20/56/76/147/294/296/307、20/56/95/147/294、20/56/281、20/76、20/76/95/281/294/296、20/76/95/281/296/307、20/76/233/294/307、20/76/243/281/294、21/76/147/233/294/307、21/76/147/243/296/307/335、21/95/185/189/232/281/296、21/95/233/243/281/296、21/95/294/296/307/335、21/95/307、21/281/307、29/76/281、56/76/95/232/243/281、56/76/147/281/307、56/76/243/294、56/76/281/294、56/76/296、56/76/307、56/95/147/307/335/348、56/95/232/233/281/294/307、56/95/243/281、56/147/281、56/232/243/281、56/232/281、56/232/281/294/296、56/233/281/294/296、56/281/307、76/95/232/243/281/307、76/95/243/281/307/335、76/95/294/307、76/147、76/147/233/243/294、76/147/233/281/294/307、76/147/243/294/296/307/335、76/147/281/307、76/189/296、76/232/233/243/294/296/307、76/281、76/281/294、76/294/296、95/120、95/147/335、95/232/243/281/294/307、95/232/281/294/296、95/281/294/296、95/335、147、147/225/232/243/281/296/307/335、147/233/243/281/307、147/233/281/307/335、147/243/281、147/307、232/233/281/294/296/307、232/281、232/284/307、233/243/281/296/307/335、233/281/296/307、243/281/294/296、281、281/294、281/307、307和335的残基位置处或在选自21/76/147/243/296/307/335、56/76/147/281/307和95/147/335的残基位置处的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,能够在高严格性条件下杂交的多核苷酸编码工程化多肽,所述工程化多肽具有脯氨酸羟化酶活性,具有一种或更多种改进的特性,所述工程化多肽包含具有与SEQ ID NO:162的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,和与SEQ ID NO:162相比在选自2/85/123/237、28/115/117/120/123/268/270/343/346/348、45/123/326、65/117/120/123/343/346、85/123/281/282、114/115/117/120/123/268/271/313/326/343/346、123/139/233/237/281/282/289/324/326和123/199/200/247/250/338的残基位置处的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,能够在高严格性条件下杂交的多核苷酸编码工程化多肽,所述工程化多肽具有脯氨酸羟化酶活性,具有一种或更多种改进的特性,所述工程化多肽包含具有与SEQ ID NO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,和与SEQ ID NO:322相比在选自26、54、61、129、132、149、156、175、189、201、209、228、236、248、262、272、277、291和345的残基位置处或在选自25、43、54、58、61、79、129、132、143、156、163、175、179、201、209、236、248、278、291、345和347的残基位置处或在选自85/117/120/135/208/270/324/343/346、85/117/120/135/208/281/282/289、85/117/120/270/281/289、85/117/135/139/208和117/120/208/270/324/343/346的残基位置处的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,能够在高严格性条件下杂交的多核苷酸编码工程化多肽,所述工程化多肽具有脯氨酸羟化酶活性,具有一种或更多种改进的特性,所述工程化多肽包含具有与SEQ ID NO:412的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,和与SEQ ID NO:412相比在选自47、48、56/118、85、95、95/289、113、118、118/247、154、162、162/204、164、164/198/271、168、169、187、195、243、271、275、281、314、330和342的残基位置处或在选自25/129/163/236/262/345/347、120/156/175/179/201、129/189/236/262/277/278、129/236/262、156/175/179/228和162的残基位置处的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,能够在高严格性条件下杂交的多核苷酸编码工程化多肽,所述工程化多肽具有脯氨酸羟化酶活性,具有一种或更多种改进的特性,所述工程化多肽包含具有与SEQ ID NO:492的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,和与SEQ ID NO:492相比在选自15、17、28、29、65、135、167、177、199、208、228、235、287、294、307和343的残基位置处或在选自85/187/281/347、85/187/347、118/120/162/175/179/330、118/120/162/175/330、162/175/179/330、175/228/330、195/347和278/314/347的残基位置处的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,能够在高严格性条件下杂交的多核苷酸编码工程化多肽,所述工程化多肽具有脯氨酸羟化酶活性,具有一种或更多种改进的特性,所述工程化多肽包含具有与SEQ ID NO:562的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,和与SEQ ID NO:562相比在选自15、40、43、44、59、79、82、149、164、179、345和347的残基位置处或在选自29/85/177/208/228/347、29/85/208/228/343/347、29/177/195/228/343、29/208/228/278/294/347、56/195/278、85/187/205/208/278、113/177/187/195/208/278/294/343/347和177/205/208/228的残基位置处的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,能够在高严格性条件下杂交的多核苷酸编码工程化多肽,所述工程化多肽具有脯氨酸羟化酶活性,具有一种或更多种改进的特性,所述工程化多肽包含具有与SEQ ID NO:598的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,和与SEQ ID NO:598相比在选自47、162、209、219、227和342的残基位置处或在选自17/44/179/195/250/313/345、17/44/199/313、43/44/195/199、44/149/164/171/187、44/179/195/199、44/179/195/199/345、79/163/164/171/187/201/286/288、82/163/164、82/163/164/171/187/201/203/208/286/288/320、149/164/171/288和187/286的残基位置处的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,能够在高严格性条件下杂交的多核苷酸编码工程化多肽,所述工程化多肽具有脯氨酸羟化酶活性,具有一种或更多种改进的特性,所述工程化多肽包含具有与SEQ ID NO:630的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,和与SEQ ID NO:630相比在选自82/164/171/203/208、135/163/164/201/203/208、162、162/219/236、162/219/313/338、162/236/342、162/313/342和164/171/201/203/282的残基位置处的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,多核苷酸编码本文描述的多肽,但是在核苷酸水平上与编码工程化脯氨酸羟化酶的参考多核苷酸具有至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多的序列同一性。在一些实施方案中,参考多核苷酸序列选自范围SEQ ID NO:3-657中的奇数编号的序列。
在一些实施方案中,编码本文提供的工程化脯氨酸羟化酶多肽中的任一种的分离的多核苷酸以各种方式被操作,以提供该多肽的表达。在一些实施方案中,编码多肽的多核苷酸以表达载体提供,表达载体中存在一个或更多个控制序列,以调控多核苷酸和/或多肽的表达。取决于表达载体,在将分离的多核苷酸插入载体前对分离的多核苷酸的操作可以是期望的或必要的。用于利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。
在一些实施方案中,控制序列包括,除其他序列以外,启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列和转录终止子。如本领域已知的,合适的启动子可以基于使用的宿主细胞来选择。对于细菌宿主细胞,用于指导本申请的核酸构建体的转录的合适启动子包括,但不限于从以下获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因,以及原核β-内酰胺酶基因(参见,例如,Villa-Kamaroff等人,Proc.Natl Acad.Sci.USA75:3727-3731[1978])以及tac启动子(参见例如,DeBoer等人,Proc.Natl Acad.Sci.USA 80:21-25[1983])。用于丝状真菌宿主细胞的示例性启动子包括从以下的基因获得的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰刀菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(参见,例如WO 96/00787),以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),和其突变体、截短的和杂合的启动子。示例性酵母细胞启动子可以来自以下的基因:酿酒酵母(Saccharomyces cerevisiae)烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)、和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其他有用的启动子是本领域已知的(参见例如,Romanos等人,Yeast 8:423-488[1992])。
在一些实施方案中,控制序列是合适的转录终止子序列,即由宿主细胞识别以终止转录的序列。终止子序列被可操作地连接至编码多肽的核酸序列的3’末端。在选择的宿主细胞中有功能的任何终止子可用于本发明中。例如,用于丝状真菌宿主细胞的示例性转录终止子可以从以下的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以从以下的基因获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子是本领域已知的(参见例如,Romanos等,上文)。
在一些实施方案中,控制序列是合适的前导序列,即对由宿主细胞的翻译重要的mRNA的非翻译区。前导序列被可操作地连接至编码多肽的核酸序列的5’末端。可以使用在所选择的宿主细胞中有功能的任何前导序列。用于丝状真菌宿主细胞的示例性前导序列从以下的基因获得:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的合适的前导序列包括但不限于从以下的基因获得的那些:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列还可以是多腺苷酸化序列,多腺苷酸化序列是被可操作地连接至核酸序列的3’末端的序列,并且其在转录时,被宿主细胞识别为将多腺苷残基添加至转录的mRNA的信号。在本发明中可以使用在所选择的宿主细胞中有功能的任何多腺苷酸化序列。用于丝状真菌宿主细胞的示例性多腺苷酸化序列包括但不限于来自以下的基因的那些:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。用于酵母宿主细胞的有用的多腺苷酸化序列也是本领域已知的(参见例如,Guo和Sherman,Mol.Cell.Biol.,15:5983-5990[1995])。
在一些实施方案中,控制序列为信号肽编码区,所述信号肽编码区编码连接至多肽的氨基末端的氨基酸序列并将编码的多肽引导到细胞的分泌途径中。核酸序列的编码序列的5’末端可以固有地包含信号肽编码区,所述信号肽编码区符合翻译阅读框地(intranslation reading frame)与编码分泌多肽的编码区的区段天然地连接。可选地,编码序列的5’末端可以包含对编码序列是外来的信号肽编码区。将表达的多肽引导到选择的宿主细胞的分泌途径中的任何信号肽编码区可用于本文提供的工程化脯氨酸羟化酶多肽的表达。用于细菌宿主细胞的有效的信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:芽孢杆菌NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽是本领域已知的(参见例如,Simonen和Palva,Microbiol.Rev.,57:109-137[1993])。用于丝状真菌宿主细胞的有效的信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和绵毛状腐质霉(Humicola lanuginosa)脂肪酶。用于酵母宿主细胞的有用的信号肽包括但不限于来自以下的基因的信号肽:酿酒酵母α因子和酿酒酵母转化酶。
在一些实施方案中,控制序列为前肽编码区,所述前肽编码区编码定位在多肽的氨基末端处的氨基酸序列。产生的多肽被称为“前酶(proenzyme)”、“前多肽(propolypeptide)”或在某些情况下称为“酶原(zymogen)”。前多肽可以通过催化或自体催化前肽从前多肽的裂解被转化为成熟活性多肽。前肽编码区包括但不限于以下的基因:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(参见例如,WO95/33836)。在信号肽和前肽区域两者均存在于多肽的氨基末端时,前肽区域紧邻多肽的氨基末端定位并且信号肽区域紧邻前肽区域的氨基末端定位。
在一些实施方案中,还利用了调节序列。这些序列促进相对于宿主细胞生长的多肽表达的调控。调控系统的实例是引起基因表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的那些。在原核宿主细胞中,合适的调控序列包括但不限于lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调控系统包括但不限于ADH2系统或GAL1系统。在丝状真菌中,合适的调控序列包括但不限于TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。
在另一方面,本发明还提供了重组表达载体,所述重组表达载体包含编码工程化脯氨酸羟化酶多肽的多核苷酸以及根据其待引入的宿主的类型,一个或更多个表达调控区诸如启动子和终止子、复制起点等。在一些实施方案中,将以上描述的各种核酸和控制序列组合在一起以产生重组表达载体,所述重组表达载体包含一个或更多个方便的限制性位点,以允许编码变体脯氨酸羟化酶多肽的核酸序列在这样的位点的插入或取代。可选地,本发明的多核苷酸序列可以通过将多核苷酸序列或包含该多核苷酸序列的核酸构建体插入到用于表达的适当的载体中来表达。在产生表达载体时,编码序列位于载体中,使得编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地经受重组DNA程序并且可以导致变体脯氨酸羟化酶多核苷酸序列的表达。载体的选择通常将取决于载体与待引入载体的宿主细胞的相容性。载体可以是线性质粒或闭合的环状质粒。
在一些实施方案中,表达载体是自主复制载体(即,作为染色体外实体存在的载体,其复制独立于染色体复制,诸如质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自我复制的任何工具(means)。在一些可选的实施方案中,载体可以是当被引入到宿主细胞中时,被整合到基因组中并与其被整合进的染色体一起复制的载体。此外,可以使用单一载体或质粒或者一起包含待引入到宿主细胞基因组中的总DNA的两个或更多个载体或质粒、或转座子。
在一些实施方案中,表达载体优选地包含允许容易选择转化的细胞的一个或更多个选择标志物(selectable marker)。“选择标志物”是一种基因,其产物提供杀生物剂或病毒耐受性、对重金属的耐受性、对营养缺陷型提供原养型等。细菌的选择标志物的实例包括但不限于,来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标志物。用于酵母宿主细胞的合适的标志物包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择标志物包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶(sulfate adenyltransferase))和trpC(邻氨基苯甲酸合酶)以及其等效物。在另一方面,本发明提供了包含编码本申请的至少一种工程化脯氨酸羟化酶多肽的多核苷酸的宿主细胞,所述多核苷酸被可操作地连接至一个或更多个控制序列,用于在宿主细胞中表达工程化脯氨酸羟化酶。用于表达由本发明的表达载体编码的多肽的宿主细胞是本领域熟知的,并包括但不限于细菌细胞诸如大肠杆菌、河流弧菌(Vibriofluvialis)、链霉菌(Streptomyces)和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞;真菌细胞诸如酵母细胞(例如酿酒酵母和巴斯德毕赤酵母(Pichia pastoris)[ATCC登录号201178]);昆虫细胞诸如果蝇(Drosophila)S2和夜蛾(Spodoptera)Sf9细胞;动物细胞诸如CHO、COS、BHK、293和Bowes黑素瘤细胞;和植物细胞。示例性宿主细胞是大肠杆菌(Escherichia coli)菌株(例如,W3110(ΔfhuA)和BL21)。
因此,在另一方面,本发明提供了用于产生工程化脯氨酸羟化酶多肽的方法,其中该方法包括将能够表达编码工程化脯氨酸羟化酶多肽的多核苷酸的宿主细胞在适于表达该多肽的条件下培养。在一些实施方案中,该方法还包括分离和/或纯化如本文描述的脯氨酸羟化酶多肽的步骤。
用于上文描述的宿主细胞的适当的培养基和生长条件是本领域熟知的。用于表达脯氨酸羟化酶多肽的多核苷酸可通过本领域已知的多种方法被引入至细胞。技术包括,除了其他以外,电穿孔、生物颗粒轰击法、脂质体介导的转染、氯化钙转染和原生质体融合。
具有本文公开的特性的工程化脯氨酸羟化酶可以通过使编码天然存在的或工程化的脯氨酸羟化酶多肽的多核苷酸经受本领域已知和如本文描述的诱变和/或定向演化方法来获得。示例性的定向演化技术是诱变和/或DNA改组(参见例如,Stemmer,Proc.Natl.Acad.Sci.USA 91:10747-10751[1994];WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利第6,537,746号)。可以使用的其他定向演化程序包括,除了其他以外,交错延伸过程(StEP)、体外重组(参见例如,Zhao等人,Nat.Biotechnol.,16:258-261[1998])、诱变PCR(参见例如,Caldwell等人,PCRMethods Appl.,3:S136-S140[1994])和盒式诱变(参见例如,Black等人,Proc.Natl.Acad.Sci.USA 93:3525-3529[1996])。
在一些实施方案中,如以上讨论的,工程化脯氨酸羟化酶可以通过使编码天然存在的脯氨酸羟化酶的多核苷酸经受诱变和/或定向演化方法来获得。诱变可以根据本领域已知的任何技术包括随机诱变和定点诱变来进行。定向演化可以用本领域已知的任何技术包括改组来进行,以筛选改进的启动子变体。诱变和定向演化方法是本领域熟知的(参见例如,美国专利第5,605,793号、第5,811,238号、第5,830,721号、第5,834,252号、第5,837,458号、第5,928,905号、第6,096,548号、第6,117,679号、第6,132,970号、第6,165,793号、第6,180,406号、第6,251,674号、第6,265,201号、第6,277,638号、第6,287,861号、第6,287,862号、第6,291,242号、第6,297,053号、第6,303,344号、第6,309,883号、第6,319,713号、第6,319,714号、第6,323,030号、第6,326,204号、第6,335,160号、第6,335,198号、第6,344,356号、第6,352,859号、第6,355,484号、第6,358,740号、第6,358,742号、第6,365,377号、第6,365,408号、第6,368,861号、第6,372,497号、第6,337,186号、第6,376,246号、第6,379,964号、第6,387,702号、第6,391,552号、第6,391,640号、第6,395,547号、第6,406,855号、第6,406,910号、第6,413,745号、第6,413,774号、第6,420,175号、第6,423,542号、第6,426,224号、第6,436,675号、第6,444,468号、第6,455,253号、第6,479,652号、第6,482,647号、第6,483,011号、第6,484,105号、第6,489,146号、第6,500,617号、第6,500,639号、第6,506,602号、第6,506,603号、第6,518,065号、第6,519,065号、第6,521,453号、第6,528,311号、第6,537,746号、第6,573,098号、第6,576,467号、第6,579,678号、第6,586,182号、第6,602,986号、第6,605,430号、第6,613,514号、第6,653,072号、第6,686,515号、第6,703,240号、第6,716,631号、第6,825,001号、第6,902,922号、第6,917,882号、第6,946,296号、第6,961,664号、第6,995,017号、第7,024,312号、第7,058,515号、第7,105,297号、第7,148,054号、第7,220,566号、第7,288,375号、第7,384,387号、第7,421,347号、第7,430,477号、第7,462,469号、第7,534,564号、第7,620,500号、第7,620,502号、第7,629,170号、第7,702,464号、第7,747,391号、第7,747,393号、第7,751,986号、第7,776,598号、第7,783,428号、第7,795,030号、第7,853,410号、第7,868,138号、第7,783,428号、第7,873,477号、第7,873,499号、第7,904,249号、第7,957,912号、第7,981,614号、第8,014,961号、第8,029,988号、第8,048,674号、第8,058,001号、第8,076,138号、第8,108,150号、第8,170,806号、第8,224,580号、第8,377,681号、第8,383,346号、第8,457,903号、第8,504,498号、第8,589,085号、第8,762,066号、第8,768,871号、第9,593,326号,以及所有相关的非美国的对应专利;Ling等人,Anal.Biochem.,254(2):157-78[1997];Dale等人,Meth.Mol.Biol.,57:369-74[1996];Smith,Ann.Rev.Genet.,19:423-462[1985];Botstein等人,Science,229:1193-1201[1985];Carter,Biochem.J.,237:1-7[1986];Kramer等人,Cell,38:879-887[1984];Wells等人,Gene,34:315-323[1985];Minshull等人,Curr.Op.Chem.Biol.,3:284-290[1999];Christians等人,Nat.Biotechnol.,17:259-264[1999];Crameri等人,Nature,391:288-291[1998];Crameri等人,Nat.Biotechnol.,15:436-438[1997];Zhang等人,Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997];Crameri等人,Nat.Biotechnol.,14:315-319[1996];Stemmer,Nature,370:389-391[1994];Stemmer,Proc.Nat.Acad.Sci.USA,91:10747-10751[1994];WO 95/22625;WO 97/0078;WO97/35966;WO 98/27230;WO 00/42651;WO 01/75767;和WO 2009/152336,其全部通过引用并入本文)。
在一些实施方案中,诱变处理后获得的酶克隆通过使酶经受规定的温度(或其他测定条件,诸如在广泛的底物范围内测试酶的活性)和测量热处理或其他测定条件后剩余的酶活性的量来筛选。然后对包含编码脯氨酸羟化酶多肽的多核苷酸的克隆进行测序以鉴定核苷酸序列的变化(如果有的话),并且将该克隆用于在宿主细胞中表达该酶。测量来自表达文库的酶活性可以使用本领域已知的任何合适的方法(例如,标准生物化学技术,诸如HPLC分析)来进行。
在一些实施方案中,可以对诱变处理后获得的克隆筛选具有一种或更多种期望的改进的酶特性(例如,改进的区域选择性)的工程化脯氨酸羟化酶。测量来自表达文库的酶活性可以使用标准生物化学技术,诸如HPLC分析和/或产物的衍生化(分离前或分离后),例如使用丹酰氯或OPA进行(参见例如,Yaegaki等人,J Chromatogr.356(1):163-70[1986])。
当已知工程化多肽的序列时,编码该酶的多核苷酸可以根据已知的合成方法通过标准固相方法来制备。在一些实施方案中,多达约100个碱基的片段可以被单独合成、然后被连接(例如,通过酶促或化学连接方法或聚合酶介导的方法)以形成任何期望的连续序列。例如,编码脯氨酸羟化酶的部分的多核苷酸和寡核苷酸可以通过本领域已知的化学合成来制备(例如,Beaucage等人,Tet.Lett.22:1859-69[1981]的经典亚磷酰胺方法或由Matthes等人,EMBO J.3:801-05[1984]描述的方法),如通常在自动化合成方法中实践的。根据亚磷酰胺方法,寡核苷酸被合成(例如,在自动DNA合成仪中)、纯化、退火、连接并克隆入适当的载体。另外,基本上任何核酸可从多种商业来源的任一个获得。在一些实施方案中,可以通过合成含有缺失、插入和/或取代的寡核苷酸并以各种排列组合寡核苷酸产生另外的变化,以产生具有一种或更多种改进的特性的工程化脯氨酸羟化酶。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含具有与选自SEQ ID NO:4-658的偶数编号的序列的氨基酸序列的至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多序列同一性和具有与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:21、28、58/247、65、80、85、95、98、117、120、159、185、194、199、200、233、237、243、250、268、281、282、287、289、307、324、326、327、330、338、343、346和348;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含具有与选自SEQ ID NO:4-658的偶数编号的序列的氨基酸序列的至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多序列同一性和具有与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:21、28、45、65、95、112、117、139、177、185、199、233、243、250、281、282、287、289、307、324、326、327、335、338、343和346;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含具有与选自SEQ ID NO:4-658的偶数编号的序列的氨基酸序列的至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多序列同一性和具有与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:48/66/189/194、48/66/194和66/82/85/135/189/194/267;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含具有与选自SEQ ID NO:4-658的偶数编号的序列的氨基酸序列的至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多序列同一性和具有与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:20/56/76/168/169/296、20/56/232/294、20/119/294/296、56/76/119/124/147/232、56/76/294、76/168/232/294、76/294/296、76/296、147和232;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含具有与选自SEQ ID NO:4-658的偶数编号的序列的氨基酸序列的至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多序列同一性和具有与SEQ ID NO:116相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:123、189、195、233和296;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:116相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:20/21/56、20/21/56/76/95/232/294/307/335、20/21/56/76/147/225/232/233/281/294/296/307/335、20/21/56/95/147/281/294/307、20/21/56/281/307、20/21/76/232/243、20/21/95/232/307、20/21/95/281/294/296、20/21/147/189/233/243/281/307、20/56、20/56/76/95/281/307、20/56/76/147/294/296/307、20/56/95/147/294、20/56/281、20/76、20/76/95/281/294/296、20/76/95/281/296/307、20/76/233/294/307、20/76/243/281/294、21/76/147/233/294/307、21/76/147/243/296/307/335、21/95/185/189/232/281/296、21/95/233/243/281/296、21/95/294/296/307/335、21/95/307、21/281/307、29/76/281、56/76/95/232/243/281、56/76/147/281/307、56/76/243/294、56/76/281/294、56/76/296、56/76/307、56/95/147/307/335/348、56/95/232/233/281/294/307、56/95/243/281、56/147/281、56/232/243/281、56/232/281、56/232/281/294/296、56/233/281/294/296、56/281/307、76/95/232/243/281/307、76/95/243/281/307/335、76/95/294/307、76/147、76/147/233/243/294、76/147/233/281/294/307、76/147/243/294/296/307/335、76/147/281/307、76/189/296、76/232/233/243/294/296/307、76/281、76/281/294、76/294/296、95/120、95/147/335、95/232/243/281/294/307、95/232/281/294/296、95/281/294/296、95/335、147、147/225/232/243/281/296/307/335、147/233/243/281/307、147/233/281/307/335、147/243/281、147/307、232/233/281/294/296/307、232/281、232/284/307、233/243/281/296/307/335、233/281/296/307、243/281/294/296、281、281/294、281/307、307和335;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:116相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:21/76/147/243/296/307/335、56/76/147/281/307和95/147/335;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:162相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:2/85/123/237、28/115/117/120/123/268/270/343/346/348、45/123/326、65/117/120/123/343/346、85/123/281/282、114/115/117/120/123/268/271/313/326/343/346、123/139/233/237/281/282/289/324/326和123/199/200/247/250/338;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:322相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:26、54、61、129、132、149、156、175、189、201、209、228、236、248、262、272、277、291和345;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:322相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:25、43、54、58、61、79、129、132、143、156、163、175、179、201、209、236、248、278、291、345和347;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:322相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:85/117/120/135/208/270/324/343/346、85/117/120/135/208/281/282/289、85/117/120/270/281/289、85/117/135/139/208和117/120/208/270/324/343/346;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:412相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:47、48、56/118、85、95、95/289、113、118、118/247、154、162、162/204、164、164/198/271、168、169、187、195、243、271、275、281、314、330和342;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:412相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:25/129/163/236/262/345/347、120/156/175/179/201、129/189/236/262/277/278、129/236/262、156/175/179/228和162;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:492相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:15、17、28、29、65、135、167、177、199、208、228、235、287、294、307和343;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:492相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:85/187/281/347、85/187/347、118/120/162/175/179/330、118/120/162/175/330、162/175/179/330、175/228/330、195/347和278/314/347;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:562相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:15、40、43、44、59、79、82、149、164、179、345和347;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:562相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:29/85/177/208/228/347、29/85/208/228/343/347、29/177/195/228/343、29/208/228/278/294/347、56/195/278、85/187/205/208/278、113/177/187/195/208/278/294/343/347和177/205/208/228;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:598相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:47、162、209、219、227和342;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:598相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:17/44/179/195/250/313/345、17/44/199/313、43/44/195/199、44/149/164/171/187、44/179/195/199、44/179/195/199/345、79/163/164/171/187/201/286/288、82/163/164、82/163/164/171/187/201/203/208/286/288/320、149/164/171/288和187/286;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
因此,在一些实施方案中,用于制备工程化脯氨酸羟化酶多肽的方法包括:(a)合成编码多肽的多核苷酸,所述多肽包含选自SEQ ID NO:4-658的偶数编号的序列并具有与SEQ ID NO:630相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:82/164/171/203/208、135/163/164/201/203/208、162、162/219/236、162/219/313/338、162/236/342、162/313/342和164/171/201/203/282;和(b)表达由该多核苷酸编码的脯氨酸羟化酶多肽。
在该方法的一些实施方案中,多核苷酸编码任选地具有一个或数个(例如,多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代的工程化脯氨酸羟化酶。在一些实施方案中,氨基酸序列任选地具有1-2个、1-3个、1-4个、1-5个、1-6个、1-7个、1-8个、1-9个、1-10个、1-15个、1-20个、1-21个、1-22个、1-23个、1-24个、1-25个、1-30个、1-35个、1-40个、1-45个或1-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
在一些实施方案中,在宿主细胞中表达的工程化脯氨酸羟化酶中的任一种可从细胞和/或培养基,使用用于蛋白质纯化的所熟知的技术的任一种或更多种,包括,除了其他以外溶菌酶处理、声处理、过滤、盐析、超速离心和色谱法来回收。用于从诸如大肠杆菌的细菌中裂解和高效提取蛋白质的适合溶液是可商业地获得的(例如,CelLytic BTM,Sigma-Aldrich,St.Louis MO)。
用于分离脯氨酸羟化酶多肽的色谱技术包括,除了其他以外,反相色谱法、高效液相色谱法、离子交换色谱法、凝胶电泳和亲和色谱法。用于纯化特定酶的条件将部分地取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等因素,并且对于本领域技术人员将是明显的。
在一些实施方案中,亲和技术可以用于分离改进的脯氨酸羟化酶。对于亲和色谱法纯化,可使用特异性结合脯氨酸羟化酶多肽的任何抗体。为了产生抗体,可以通过注射脯氨酸羟化酶多肽或其片段免疫接种各种宿主动物包括但不限于兔、小鼠、大鼠等。脯氨酸羟化酶多肽或片段可以借助于侧链官能基团或附接至侧链官能基团的接头附接至合适的载体诸如BSA。在一些实施方案中,亲和纯化可以使用脯氨酸羟化酶结合的特定配体诸如聚(L-脯氨酸)或染料亲和柱(参见例如,EP0641862;Stellwagen,“Dye AffinityChromatography,”于Current Protocols in Protein Science,Unit9.2-9.2.16[2001])。
使用工程化脯氨酸羟化酶的方法
在一些实施方案中,本文描述的脯氨酸羟化酶可用于将合适的底物转化为其羟基化产物的方法。通常,进行羟基化反应的方法包括在适合于形成羟基化产物的反应条件下,使底物化合物在存在共底物(诸如α-酮戊二酸)的情况下与本发明的脯氨酸羟化酶多肽接触或一起孵育,如上述方案1所示。
在本文提供并在实施例中说明的实施方案中,可用于该方法的各种合适反应条件的范围包括但不限于底物载量、共底物载量、还原剂、二价过渡金属、pH、温度、缓冲剂、溶剂体系、多肽载量和反应时间。使用本文描述的工程化的脯氨酸羟化酶多肽进行将底物化合物生物催化转化成产物化合物的方法的另外的合适的反应条件可鉴于本文提供的指导通过常规实验容易地优化,所述常规实验包括但不限于使工程化脯氨酸羟化酶多肽和底物化合物在浓度、pH、温度和溶剂条件的实验反应条件下接触,并检测产物化合物。
使用工程化脯氨酸羟化酶多肽的合适反应条件通常包括化学计量地用于羟基化反应的共底物。通常,用于脯氨酸羟化酶的共底物为α-酮戊二酸(α-ketoglutarate),又称α-酮戊二酸(α-ketoglutaric acid)和2-氧代戊二酸。可以使用能够用作脯氨酸羟化酶共底物的α-酮戊二酸的其他类似物。可用作共底物的示例类似物是α-氧代己二酸。因为化学计量地使用共底物,所以共底物以与底物化合物等摩尔或比底物化合物的量更高的量存在(即,共底物的摩尔浓度等于或高于底物化合物的摩尔浓度)。在一些实施方案中,合适的反应条件可以包括为底物化合物的摩尔浓度至少1倍、1.5倍、2倍、3倍、4倍或5倍或更多的共底物摩尔浓度。在一些实施方案中,合适的反应条件可包括约0.001M至约2M、0.01M至约2M、0.1M至约2M、0.2M至约2M、约0.5M至约2M或约1M至约2M的共底物浓度,特别是α-酮戊二酸浓度。在一些实施方案中,反应条件包括约0.001M、0.01M、0.1M、0.2M、0.3M、0.4M、0.5M、0.6M、0.7M、0.8M、1M、1.5M或2M的共底物浓度。在一些实施方案中,可在反应期间添加另外的共底物。
考虑到例如期望的产物化合物的量、底物浓度对酶活性的影响、反应条件下酶的稳定性、和底物向产物的转化百分比,反应混合物中的底物化合物可以变化。在一些实施方案中,合适的反应条件包括至少约0.5g/L至约200g/L、1g/L至约200g/L、5g/L至约150g/L、约10g/L至约100g/L、20g/L至约100g/L或约50g/L至约100g/L的底物化合物载量。在一些实施方案中,合适的反应条件包括至少约0.5g/L、至少约1g/L、至少约5g/L、至少约10g/L、至少约15g/L、至少约20g/L、至少约30g/L、至少约50g/L、至少约75g/L、至少约100g/L、至少约150g/L或至少约200g/L或甚至更大的底物化合物载量。虽然本文提供的底物载量的值是基于L-脯氨酸的分子量,然而还设想,也可在方法中使用相等摩尔量的L-脯氨酸的各种水合物和盐。
在进行本文描述的脯氨酸羟化酶介导的方法时,工程化多肽可以以纯化酶、部分纯化的酶、用编码酶的基因转化的全细胞、作为这样的细胞的细胞提取物和/或裂解物、和/或作为固定在固体支持物上的酶的形式添加到反应混合物中。用编码工程化脯氨酸羟化酶的基因转化的全细胞,或其细胞提取物、裂解物,以及分离的酶可以以多种不同的形式使用,包括固体(例如,冻干的、喷雾干燥的等)或半固体(例如,粗制糊状物)。细胞提取物或细胞裂解物可通过沉淀(硫酸铵、聚乙烯亚胺、热处理等)部分纯化,之后在冻干前进行脱盐程序(例如,超滤、透析等)。任何酶制品(包括全细胞制品)可通过使用已知的交联剂诸如例如戊二醛交联,或固定到固相(例如,Eupergit C等)而被稳定化。
编码工程化脯氨酸羟化酶多肽的基因可分别地被转化入宿主细胞或一起转化入同一宿主细胞。例如,在一些实施方案中,可用编码一种工程化脯氨酸羟化酶多肽的基因转化一组宿主细胞,并且用编码另一种工程化脯氨酸羟化酶多肽的基因转化另一组。两组转化的细胞均可以以全细胞的形式,或从其衍生的裂解物或提取物的形式一起用于反应混合物。在其他实施方案中,宿主细胞可用编码多种工程化脯氨酸羟化酶多肽的基因转化。在一些实施方案中,工程化的多肽可以以分泌的多肽的形式表达,并且含有分泌的多肽的培养基可被用于脯氨酸羟化酶反应。
在一些实施方案中,本文公开的工程化脯氨酸羟化酶多肽的改进的活性和/或选择性提供这样的方法,其中较高的转化百分比可以以较低浓度的工程化多肽实现。在该方法的一些实施方案中,合适的反应条件包括底物化合物载量的约1%(w/w)、2%(w/w)、5%(w/w)、10%(w/w)、20%(w/w)、30%(w/w)、40%(w/w)、50%(w/w)、75%(w/w)、100%(w/w)或更高的工程化多肽的量。
在一些实施方案中,工程化多肽以约0.01g/L至约50g/L;约0.05g/L至约50g/L;约0.1g/L至约40g/L;约1g/L至约40g/L;约2g/L至约40g/L;约5g/L至约40g/L;约5g/L至约30g/L;约0.1g/L至约10g/L;约0.5g/L至约10g/L;约1g/L至约10g/L;约0.1g/L至约5g/L;约0.5g/L至约5g/L;或约0.1g/L至约2g/L存在。在一些实施方案中,脯氨酸羟化酶多肽以约0.01g/L、0.05g/L、0.1g/L、0.2g/L、0.5g/L、1g/L、2g/L、5g/L、10g/L、15g/L、20g/L、25g/L、30g/L、35g/L、40g/L或50g/L存在。
在一些实施方案中,反应条件还包括能够在氧化反应中用作辅因子的二价过渡金属。通常,二价过渡金属辅因子是亚铁离子(即,Fe+2)。亚铁离子可以以各种形式提供,诸如硫酸亚铁(FeSO4)、氯化亚铁(FeCl2)、碳酸亚铁(FeCO3)以及有机酸的盐,诸如柠檬酸盐、乳酸盐和延胡索酸盐。硫酸亚铁的示例性来源是莫尔盐(Mohr’s salt),即硫酸亚铁铵(NH4)2Fe(SO4)2,并以无水和水合(即六水合物)形式可得。虽然亚铁离子是在天然存在的脯氨酸羟化酶中发现的过渡金属辅因子并在工程化酶中有效地发挥作用,但可以理解的是,可以在该方法中使用其他能够用作辅因子的二价过渡金属。在一些实施方案中,二价过渡金属辅因子可以包括Mn+2和Cr+2。在一些实施方案中,反应条件可以包括二价过渡金属辅因子,特别是Fe+2,浓度为约0.1mM至10mM、0.1mM至约5mM、0.5mM至约5mM、约0.5mM至约3mM或约1mM至约2mM。在一些实施方案中,反应条件包括约0.1mM、0.2mM、0.5mM、1mM、1.5mM、2mM、3mM、5mM、7.5mM或10mM的二价过渡金属辅因子浓度。在一些实施方案中,可以使用更高浓度,例如高达50mM或高达100mM的二价过渡金属辅因子。
在一些实施方案中,反应条件还可以包括能够将铁离子Fe+3还原为亚铁离子Fe+2的还原剂。在一些实施方案中,还原剂包括抗坏血酸(ascorbic acid),通常是L-抗坏血酸。虽然羟基化反应不需要抗坏血酸,但其存在增强酶促活性。不受理论约束,认为抗坏血酸(ascorbate)维持酶-铁+2形式或使酶-铁+2形式再生,酶-铁+2形式是介导羟基化反应的活性形式。通常,反应条件可以包括与底物载量成比例对应的抗坏血酸浓度。在一些实施方案中,抗坏血酸以底物摩尔量的至少约0.1倍、0.2倍、0.3倍、0.5倍、0.75倍、1倍、1.5倍或至少2倍存在。在一些实施方案中,还原剂,特别是L-抗坏血酸的浓度为约0.001M至约0.5M、约0.01M至约0.5M、约0.01M至约0.4M、约0.1M至约0.4M或约0.1M至约0.3M。在一些实施方案中,还原剂,特别是抗坏血酸的浓度为约0.001M、0.005M、0.01M、0.02M、0.03M、0.05M、0.1M、0.15M、0.2M、0.3M、0.4M或0.5M。
在一些实施方案中,反应条件包括分子氧(即,O2)。不受理论的约束,分子氧中的一个氧原子被掺入到底物化合物中以形成羟基化产物化合物。O2可在反应溶液中天然存在,或人工引入和/或补充到反应中。在一些实施方案中,反应条件可以包括用空气、O2气体或其他含有O2的气体强制通气(例如,吹扫(sparging))。在一些实施方案中,反应中的O2可以通过用O2或者含有O2的气体增加反应压力来增加。这可以通过在可以用O2加压的容器中进行反应来实现。在一些实施方案中,O2气体可以以至少1升/小时(L/h)、至少2L/h、至少3L/h、至少4L/h、至少5L/h或更大的速率吹扫通过反应溶液。在一些实施方案中,O2气体可以以约1L/h和10L/h之间、约2L/h和7L/h之间或约3L/h和5L/h之间的速率吹扫通过反应溶液。
在反应的过程期间,反应混合物的pH可变化。反应混合物的pH可保持在期望的pH或在期望的pH范围内。这可通过在反应过程之前和/或期间添加酸或碱来完成。可选地,pH可通过使用缓冲剂来控制。相应地,在一些实施方案中,反应条件包括缓冲剂。维持期望pH范围的合适缓冲剂是本领域已知的,并且包括,例如而非限制,硼酸盐、磷酸盐、2-(N-吗啉代)乙磺酸(MES)、3-(N-吗啉代)丙磺酸(MOPS)、乙酸盐、三乙醇胺和2-氨基-2-羟甲基-丙烷-1,3-二醇(Tris)等。在一些实施方案中,缓冲剂是磷酸盐。在该方法的一些实施方案中,合适的反应条件包括以下的缓冲剂(例如,磷酸盐)浓度:约0.01M至约0.4M、0.05M至约0.4M、0.1M至约0.3M或约0.1M至约0.2M。在一些实施方案中,反应条件包括以下的缓冲剂(例如,磷酸盐)浓度:约0.01M、0.02M、0.03M、0.04M、0.05M、0.07M、0.1M、0.12M、0.14M、0.16M、0.18M、0.2M、0.3M或0.4M。在一些实施方案中,反应条件包括水作为合适的溶剂而不存在缓冲剂。
在该方法的实施方案中,反应条件可包括合适的pH。期望的pH或期望的pH范围可通过使用酸或碱、合适的缓冲剂、或缓冲和添加酸或碱的组合来保持。反应混合物的pH可在反应过程之前和/或期间控制。在一些实施方案中,合适的反应条件包括约4至约10的溶液pH、约5至约10的pH、约5至约9的pH、约6至约9的pH、约6至约8的pH。在一些实施方案中,反应条件包括约4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5或10的溶液pH。
在本文的方法的实施方案中,考虑到例如在较高温度下增加的反应速率和在反应时间段期间的酶的活性,合适的温度可被用于反应条件。因此,在一些实施方案中,合适的反应条件包括以下的温度:约10℃至约60℃、约10℃至约55℃、约15℃至约60℃、约20℃至约60℃、约20℃至约55℃、约25℃至约55℃、或约30℃至约50℃。在一些实施方案中,合适的反应条件包括约10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃或60℃的温度。在一些实施方案中,酶促反应期间的温度可以在整个反应过程中维持在特定温度。在一些实施方案中,酶促反应期间的温度可以在反应过程期间调整为温度曲线。
本发明的方法通常在溶剂中进行。合适的溶剂包括水、水性缓冲溶液、有机溶剂、聚合物溶剂和/或助溶剂体系,助溶剂体系通常包括水性溶剂、有机溶剂和/或聚合物溶剂。水性溶液(水或水性助溶剂体系)可为pH-缓冲的或非缓冲的。在一些实施方案中,使用工程化脯氨酸羟化酶多肽的方法可以于包含以下的水性助溶剂体系中进行:有机溶剂(例如,乙醇、异丙醇(IPA)、二甲基亚砜(DMSO)、二甲基甲酰胺(DMF)、乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯等)、离子或极性溶剂(例如,四氟硼酸1-乙基4甲基咪唑、四氟硼酸1-丁基-3-甲基咪唑、六氟磷酸1-丁基3甲基咪唑、甘油、聚乙二醇等)。在一些实施方案中,助溶剂可以是极性溶剂,诸如多元醇、二甲基亚砜(DMSO)或低级醇。水性助溶剂体系中的非水性助溶剂组分可与水性组分混溶,提供单一的液相,或可与水性组分部分混溶或不混溶,提供双液相。示例性水性助溶剂体系可包含水和选自有机溶剂、极性溶剂和多元醇溶剂中的一种或更多种助溶剂。通常,选择水性助溶剂体系的助溶剂组分以使得其在反应条件下不会不利地使脯氨酸羟化酶失活。通过在候选溶剂体系中用感兴趣的确定的底物并应用诸如本文描述的那些的酶活性测定而测量特定的工程化的脯氨酸羟化酶的酶促活性,合适的助溶剂体系可被容易地鉴定。
在该方法的一些实施方案中,合适的反应条件包括水性助溶剂,其中助溶剂包含约1%至约50%(v/v)、约1%至约40%(v/v)、约2%至约40%(v/v)、约5%至约30%(v/v)、约10%至约30%(v/v)或约10%至约20%(v/v)的DMSO。在该方法的一些实施方案中,合适的反应条件可包括水性助溶剂,所述水性助溶剂包含约1%(v/v)、约5%(v/v)、约10%(v/v)、约15%(v/v)、约20%(v/v)、约25%(v/v)、约30%(v/v)、约35%(v/v)、约40%(v/v)、约45%(v/v)或约50%(v/v)的DMSO。
在一些实施方案中,反应条件可以包括用于稳定或增强反应的表面活性剂。表面活性剂可以包括非离子、阳离子、阴离子和/或两亲性表面活性剂。示例性的表面活性剂包括例如但不限于壬基苯氧基聚乙氧基乙醇(NP40)、Triton X-100、聚氧乙烯-硬脂酰胺、十六烷基三甲基溴化铵、油烯基酰氨基硫酸钠、聚氧乙烯脱水山梨糖醇单硬脂酸酯、十六烷基二甲基胺等。可以使用任何可以稳定或增强反应的表面活性剂。在反应中使用的表面活性剂的浓度通常可以0.l mg/ml至50mg/ml,特别是1mg/ml至20mg/ml。
在一些实施方案中,反应条件可以包括消泡剂,其有助于减少或防止在反应溶液中形成泡沫,诸如当反应溶液被混合或吹扫时。消泡剂包括非极性油(例如矿物油、硅酮等)、极性油(例如脂肪酸、烷基胺、烷基酰胺、烷基硫酸酯等)和疏水剂(例如经处理的二氧化硅(silica)、聚丙烯等),其中的一些也作为表面活性剂起作用。示例性的消泡剂包括
Figure BDA0003664691860000931
(Dow Corning)、聚乙二醇共聚物、氧基/乙氧基化醇和聚二甲基硅氧烷。在一些实施方案中,消泡剂可以以约0.001%(v/v)至约5%(v/v)、约0.01%(v/v)至约5%(v/v)、约0.1%(v/v)至约5%(v/v)或约0.1%(v/v)至约2%(v/v)存在。在一些实施方案中,消泡剂可以以约0.001%(v/v)、约0.01%(v/v)、约0.1%(v/v)、约0.5%(v/v)、约1%(v/v)、约2%(v/v)、约3%(v/v)、约4%(v/v)或约5%(v/v)或更多存在,如促进反应所需的。
用于羟化酶反应的反应物的量通常将根据期望的产物的量以及伴随地使用的脯氨酸羟化酶底物的量而变化。本领域的普通技术人员将容易地理解如何改变这些量以使其适用于期望的产率水平和生产规模。
在一些实施方案中,添加反应物的顺序并不关键。反应物可同时一起添加至溶剂中(例如,单相溶剂、双相水性助溶剂体系等),或者可选地,一些反应物可分别地添加,以及一些一起在不同的时间点添加。例如,辅因子、共底物、脯氨酸羟化酶和底物可首先添加至溶剂中。
固体反应物(例如,酶、盐等)可以各种不同的形式提供给反应,包括粉末(例如,冻干的、喷雾干燥的等)、溶液、乳剂、悬浮液等形式。反应物可使用本领域普通技术人员已知的方法和仪器容易地冻干或喷雾干燥。例如,蛋白溶液可以小等份冷冻于-80℃,然后加入至预冷却的冻干室内,之后应用真空。
为了当使用水性助溶剂体系时的改进的混合效率,脯氨酸羟化酶和辅因子可首先被添加和混合至水相中。然后可将有机相添加和混合至其中,然后添加脯氨酸羟化酶底物和共底物。可选地,脯氨酸羟化酶底物可在添加至水相之前在有机相中预混合。
通常允许羟基化过程进行直至随着反应时间底物至羟基化产物的进一步转化不显著地改变(例如少于10%的底物被转化,或少于5%的底物被转化)。在一些实施方案中,允许反应进行直至达到底物至产物的完全或接近完全的转化。底物至产物的转化可使用已知的方法通过检测底物和/或产物来监测,伴有或不伴有衍生化。合适的分析方法包括气相色谱、HPLC、MS等。
在该方法的一些实施方案中,合适的反应条件包括至少约5g/L、10g/L、20g/L、30g/L、40g/L、50g/L、60g/L、70g/L、100g/L或更多的底物载量,并且其中该方法在约48h或更少时间内、在约36h或更少时间内、或在约24h或更少时间内导致至少约50%、60%、70%、80%、90%、95%或更多的底物化合物向产物化合物的转化。
当在合适的反应条件下在该方法中使用时,本发明的工程化脯氨酸羟化酶多肽产生相比于反式-4-羟基化产物,至少90%、95%、96%、97%、98%、99%或更多的反式-3-羟基化产物的异构体过量的过量。在一些实施方案中,未形成可检测量的反式-4-羟基化产物化合物。
在使用工程化脯氨酸羟化酶多肽将底物化合物转化为羟基化产物化合物的方法的另外的实施方案中,合适的反应条件可以包括反应溶液中的初始底物载量,其然后与多肽接触。然后该反应溶液用另外的底物化合物进一步补充,另外的底物化合物作为随时间的连续或批次添加以至少约1g/L/h、至少约2g/L/h、至少约4g/L/h、至少约6g/L/h或更高的速率添加。因此,根据这些合适的反应条件,多肽被添加至具有至少约20g/L、30g/L或40g/L的初始底物载量的溶液。添加多肽后,然后以约2g/L/h、4g/L/h或6g/L/h的速率向溶液连续添加另外的底物,直到达到高得多的至少约30g/L、40g/L、50g/L、60g/L、70g/L、100g/L、150g/L、200g/L或更高的最终底物载量。因此,在该方法的一些实施方案中,合适的反应条件包括将多肽添加到具有至少约20g/L、30g/L或40g/L的初始底物载量的溶液中,然后以约2g/L/h、4g/L/h或6g/L/h的速率向溶液添加另外的底物直到达到至少约30g/L、40g/L、50g/L、60g/L、70g/L、100g/L或更大的最终底物载量。这种底物补充的反应条件允许达到较高的底物载量,同时保持至少约50%、60%、70%、80%、90%或更多的底物转化的的底物向羟基化产物的高转化率。在该方法的一些实施方案中,添加的底物是在以与另外添加的底物等摩尔或更高的量包含α-酮戊二酸的溶液中。
在该方法的一些实施方案中,使用工程化脯氨酸羟化酶多肽的反应可包括以下合适的反应条件:(a)约60g/L的底物载量;(b)约6g/L的工程化多肽;(c)底物化合物的约1.2摩尔当量的α-酮戊二酸;(d)约10mM抗坏血酸;(e)约4mM FeSO4;(f)约6.8的pH;(g)约20℃的温度;和(h)约24小时的反应时间。
在一些实施方案中,进行另外的反应组分或另外的技术以补充反应条件。这些可包括采取措施来稳定酶或阻止酶的失活、降低产物抑制,将反应平衡转向羟基化产物形成。
在另外的实施方案中,用于将底物化合物转化为产物化合物的任何以上描述的方法还可以包括一个或更多个选自以下的步骤:产物化合物的提取;分离;纯化;和结晶。用于从通过以上公开的方法产生的生物催化反应混合物提取、分离、纯化和/或结晶羟基化产物的方法、技术和方案是普通技术人员已知的和/或可通过常规实验获得的。此外,在下文的实施例中提供了说明性方法。
本发明的各种特征和实施方案在以下代表性实施例中进行了说明,这些实施例旨在说明而非限制。
实验
提供了以下实施例,包括实验和获得的结果,仅用于说明性目的,而不应当被解释为限制本发明。
在以下的实验公开内容中,适用以下缩写:ppm(百万分率);M(摩尔/升);mM(毫摩尔/升)、uM和μM(微摩尔/升);nM(纳摩尔/升);mol(摩尔);gm和g(克);mg(毫克);ug和μg(微克);L和l(升);ml和mL(毫升);cm(厘米);mm(毫米);um和μm(微米);sec.(秒);min(s)(分钟);h(s)和hr(s)(小时);U(单位);MW(分子量);rpm(每分钟转数);℃(摄氏度);CDS(编码序列);DNA(脱氧核糖核酸);RNA(核糖核酸);NA(核酸;多核苷酸);AA(氨基酸;多肽);大肠杆菌W3110(常用的实验室大肠杆菌菌株,可从Coli Genetic Stock Center[CGSC],NewHaven,CT获得);HPLC(高压液相色谱);SDS-PAGE(十二烷基硫酸钠聚丙烯酰胺凝胶电泳);PES(聚醚砜);CFSE(羧基荧光素琥珀酰亚胺酯);IPTG(异丙基β-D-1-硫代吡喃半乳糖苷);PMBS(硫酸多粘菌素B);NADPH(烟酰胺腺嘌呤二核苷酸磷酸盐);GDH(葡萄糖脱氢酶);聚乙烯亚胺(PEI);FIOPC(相对于阳性对照的改进倍数);DO(溶解氧);ESI(电喷雾电离);LB(Luria肉汤);TB(terrific肉汤);MeOH(甲醇);HTP(高通量);SFP(摇瓶粉末);DSP(下游工艺粉末);Athens Research(Athens Research Technology,Athens,GA);ProSpec(ProSpecTany Technogene,East Brunswick,NJ);Sigma-Aldrich(Sigma-Aldrich,St.Louis,MO);Ram Scientific(Ram Scientific,Inc.,Yonkers,NY);Pall Corp.(Pall,Corp.,Pt.Washington,NY);Millipore(Millipore,Corp.,Billerica MA);Difco(DifcoLaboratories,BD Diagnostic Systems,Detroit,MI);Molecular Devices(MolecularDevices,LLC,Sunnyvale,CA);Kuhner(Adolf Kuhner,AG,Basel,Switzerland);CambridgeIsotope Laboratories,(Cambridge Isotope Laboratories,Inc.,Tewksbury,MA);Applied Biosystems(Applied Biosystems,Life Technologies,Corp.,Grand Island,NY的一部分),Agilent(Agilent Technologies,Inc.,Santa Clara,CA);Thermo Scientific(Thermo Fisher Scientific,Waltham,MA的一部分);Fisher(Fisher Scientific,Waltham,MA);Corning(Corning,Inc.,Palo Alto,CA);Waters(Waters Corp.,Milford,MA);GE Healthcare(GE Healthcare Bio-Sciences,Piscataway,NJ);Pierce(PierceBiotechnology(现为Thermo Fisher Scientific的一部分),Rockford,IL);Phenomenex(Phenomenex,Inc.,Torrance,CA);Optimal(Optimal Biotech Group,Belmont,CA);和Bio-Rad(Bio-Rad Laboratories,Hercules,CA)。
实施例1
含有重组脯氨酸羟化酶基因的大肠杆菌表达宿主
用于产生本发明变体的初始脯氨酸羟化酶(PH)从来自真菌sp.No.11243的野生型ANO序列(登录号GAM84982)获得。对野生型PH蛋白序列进行密码子优化以在大肠杆菌中表达,并将DNA克隆到表达载体pCK110900(参见美国专利申请公布第2006/0195947号的图3),可操作地连接到在lacI阻遏子的控制下的lac启动子。该表达载体还包含P15a复制起点和氯霉素抗性基因。使用本领域已知的标准方法将所得质粒转化到大肠杆菌W3110中。通过使细胞经受氯霉素选择来分离转化体,如本领域已知的(参见例如,美国专利第8,383,346号和WO2010/144103)。
实施例2
制备HTP含有PH的湿细胞沉淀物和裂解物
将来自单克隆菌落的含有重组PH编码基因的大肠杆菌细胞接种到96孔浅孔微量滴定板的孔中的含有1%葡萄糖和30μg/mL氯霉素(CAM)的180μl LB中。将板用O2可透过的密封件(seal)密封,并使培养物在30℃、200rpm和85%湿度生长过夜。然后,将10μl的每种细胞培养物转移到含有390mL TB和30μg/mL CAM的96孔深孔板的孔中。用O2可透过的密封件密封深孔板,并将其在30℃、250rpm和85%湿度孵育,直到达到OD6000.6-0.8。然后用IPTG至1mM的终浓度诱导细胞培养物,并在20℃或30℃孵育过夜。然后用在4000rpm离心10min将细胞沉淀。丢弃上清液,并在裂解前将沉淀物冷冻在-80℃。
对于裂解,将含有50mM磷酸钠缓冲液pH 6.5、1g/L溶菌酶和0.5g/L硫酸多粘菌素b(PMBS)的400μl裂解缓冲液添加到如实施例2所述地产生的每个孔中的细胞糊状物中。伴随在台式振荡器(bench top shaker)上摇动,使细胞在室温裂解2小时。然后将板在4000rpm和4℃离心15min。然后将澄清的上清液用于生物催化反应以确定它们的活性水平。
实施例3
从摇瓶(SF)培养物制备冻干裂解物
将如上所述地生长的选择的HTP培养物铺板到具有1%葡萄糖和30μg/ml CAM的LB琼脂板上并在37℃生长过夜。将来自每种培养物的单个菌落转移到具有1%葡萄糖和30μg/ml CAM的6ml LB。使培养物在30℃、250rpm生长18h,并以约1:50传代培养至250ml含有30μg/ml CAM的TB中,至0.05的最终OD600。使培养物在30℃、250rpm生长约195分钟,至0.6-0.8之间的OD600,并用1mM IPTG诱导。然后使培养物在20℃或30℃、250rpm生长20h。将培养物4000rpm离心20min。丢弃上清液,并将沉淀物重悬于30ml的20mM三乙醇胺pH 7.5中,并使用
Figure BDA0003664691860000981
处理器系统(Microfluidics)在18,000psi裂解。使裂解物沉淀(10,000rpm沉淀60min)并且将上清液冷冻并冻干以产生摇瓶(SF)酶。
实施例4
脯氨酸底物向反式-3-羟脯氨酸的转化中相比于SEQ ID NO:4的改进
根据筛选将L-脯氨酸底物转化为反式-3-羟脯氨酸的变体的结果,选择SEQ IDNO:4作为亲本酶。SEQ ID NO:4与SEQ ID NO:2相同;这两个序列都是已向其添加了N-末端his-标签的野生型脯氨酸羟化酶,而SEQ ID NO:3是编码野生型脯氨酸羟化酶的密码子优化的多核苷酸。使用成熟的技术(例如饱和诱变和重组先前鉴定的有益突变)产生工程化基因的文库。由每种基因编码的多肽以HTP产生,如实施例2所述(其中蛋白在20℃过夜表达)。对于所有变体,通过添加200μL裂解缓冲液(含有50mM磷酸钠缓冲液pH 6.5、1g/L溶菌酶和0.5g/L PMBS)并在室温在台式振荡器上摇动2小时,使细胞沉淀物裂解。将平板在4℃以4000rpm离心15分钟以去除细胞碎片。
在300μL圆底板中,将50μL的大肠杆菌裂解物添加到每个孔中的200μL的反应混合物(包含75μL 63g/Lα-酮戊二酸[在50mM磷酸钠pH6.5中]、65mM抗坏血酸中的50μL 20mM莫尔盐[在50mM磷酸钠pH 6.5中]和75μL 33g/L脯氨酸)中。用AirPore密封件(Qiagen)密封板,并将反应在30℃、200rpm和85%相对湿度,以2”摆幅在Kuhner中继续进行过夜(~18小时)。
在过夜孵育后,通过将25μL反应混合物等分到含有225μL衍生化溶液(每孔包含75μL饱和碳酸氢钠、25μL水和125μL 2.5mg/mL FmocCl[在ACN中])的96孔深孔板中,将每个孔的反应衍生化和猝灭。在室温摇动1hr后,将板以4000rpm离心一分钟,并将40μL猝灭反应的可溶性级分与160μL 1:1ACN:0.5M HCl混合。衍生化和稀释的样品按表13.1所述进行分析。相对于SEQ ID NO:4的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:4产生的比率。相对于SEQ ID NO:4的活性(活性FIOP)计算为变体的反式-3-羟脯氨酸的峰面积与由SEQ ID NO:4产生的反式-3-羟脯氨酸的峰面积相比的比率。结果在表4.1和表4.2中示出。
Figure BDA0003664691860000991
Figure BDA0003664691860001001
Figure BDA0003664691860001002
Figure BDA0003664691860001011
除了HTP分析外,还以摇瓶规模制备了来自HTP筛选的精选有益变体子集,如实施例3所述(其中蛋白在20℃过夜表达)。在以下条件下,对冻干的摇瓶裂解物粉末(SFP)进行1mL规模反应测试:10g/L L-脯氨酸、50wt%脯氨酸羟化酶变体SFP、1.5当量a-KG(α-酮戊二酸)、0.15当量抗坏血酸、4mM硫酸铁(II)铵六水合物、50mM磷酸钠pH 6.5、空气和室温。将反应运行过夜,并使用以上对HTP反应描述的类似方法进行分析。相对于SEQ ID NO:4的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:4产生的比率。
结果在表4.3中示出。
Figure BDA0003664691860001012
由SEQ ID NO:4产生的脯氨酸羟化酶蛋白在30℃在标准表达条件下不完全稳定。如上所述,对于表4.1、表4.2和表4.3所示的所有数据,HTP和摇瓶蛋白在20℃表达产生。为了选择更稳定和更具活性的变体,使用成熟的技术(例如,饱和诱变和重组先前鉴定的有益突变)产生衍生自SEQ ID NO:4的工程化基因的文库,并以HTP在30℃表达产生由每种基因编码的多肽。如上所述进行反应、衍生化和分析。相对于SEQ ID NO:4的稳定性和活性(稳定性/活性FIOP)计算为变体的反式-3-羟脯氨酸的峰面积与由SEQ ID NO:4产生的反式-3-羟脯氨酸的峰面积相比的比率,其中这两种酶都在30℃产生。结果在表4.4中示出。
Figure BDA0003664691860001021
实施例5
脯氨酸底物向反式-3-羟脯氨酸的转化中相比于SEQ ID NO:116的改进
使用成熟的技术(例如,饱和诱变和重组先前鉴定的有益突变)从编码SEQ ID NO:116的具有脯氨酸羟化酶活性的多肽的工程化多核苷酸(SEQ ID NO:115)产生工程化基因的文库。由每种基因编码的多肽以HTP产生,如实施例2所述(其中蛋白在20℃过夜表达)。对于所有变体,通过添加200μL裂解缓冲液(包含50mM磷酸钠缓冲液pH 6.5、1g/L溶菌酶和0.5g/L PMBS)并在室温在台式振荡器上摇动2小时,使细胞沉淀物裂解。将板在4℃以4000rpm离心15分钟以去除细胞碎片。
在300μL圆底板中,将50μL的大肠杆菌裂解物添加到每个孔中的200μL的反应混合物(包含75μL 63g/Lα-酮戊二酸[在50mM磷酸钠pH6.5中]、65mM抗坏血酸中的50μL 20mM莫尔盐[在50mM磷酸钠pH 6.5中]和75μL 33g/L脯氨酸)中。用AirPore密封件(Qiagen)密封板,并将反应在30℃、200rpm和85%相对湿度,以2”摆幅在Kuhner中继续进行过夜(~18小时)。
在过夜孵育后,通过将25μL反应混合物等分到含有225μL衍生化溶液(每孔包含75μL饱和碳酸氢钠、25μL水和125μL 2.5mg/mL FmocCl[在ACN中])的96孔深孔板中,将每个孔的反应衍生化和猝灭。在室温摇动1hr后,将板以4000rpm离心一分钟,并将40μL猝灭反应的可溶性级分与160μL 1:1ACN:0.5M HCl混合。衍生化和稀释的样品按表13.1所述进行分析。相对于SEQ ID NO:116的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:116产生的比率。结果在表5.1中示出。
Figure BDA0003664691860001031
由SEQ ID NO:116产生的脯氨酸羟化酶蛋白在30℃在标准表达条件下不完全稳定。为了选择更稳定和更具活性的变体,使用成熟的技术(例如,饱和诱变和重组先前鉴定的有益突变)产生衍生自SEQ ID NO:116的工程化基因的文库,并以HTP在30℃表达产生由每种基因编码的多肽。如上所述完成反应、衍生化和分析。相对于SEQ ID NO:116的稳定性和活性(稳定性/活性FIOP)计算为变体的反式-3-羟脯氨酸的峰面积与由SEQ ID NO:116产生的反式-3-羟脯氨酸的峰面积相比的比率,其中这两种酶都在30℃产生。结果在表5.2中示出。
Figure BDA0003664691860001041
Figure BDA0003664691860001051
Figure BDA0003664691860001061
除了HTP分析外,还以摇瓶规模制备了来自HTP筛选的精选有益变体子集,如实施例3所述。SEQ ID NO:116的SFP在20℃产生,并且衍生自SEQ ID NO:116的变体在30℃产生。在以下条件下,对冻干的摇瓶裂解物粉末(SFP)进行1mL规模反应测试:20g/L L-脯氨酸、5wt%脯氨酸羟化酶变体SFP、1.5当量a-KG(α-酮戊二酸)、0.15当量抗坏血酸、4mM硫酸铁(II)铵六水合物、50mM磷酸钠pH 6.5、空气和室温。将反应运行过夜,并使用以上对HTP反应描述的类似方法进行分析。相对于SEQ ID NO:116的稳定性和活性(稳定性/活性FIOP)计算为变体的反式-3-羟脯氨酸的峰面积与由SEQ ID NO:116产生的反式-3-羟脯氨酸的峰面积相比的比率,其中SEQ ID NO:116在20℃产生,并且衍生自SEQ ID NO:116的变体在30℃产生。结果在表5.3中示出。
Figure BDA0003664691860001071
实施例6
脯氨酸底物向反式-3-羟脯氨酸的转化中相比于SEQ ID NO:162的改进
使用成熟的技术(例如,饱和诱变和重组先前鉴定的有益突变)从编码SEQ ID NO:162的具有脯氨酸羟化酶活性的多肽的工程化多核苷酸(SEQ ID NO:161)产生工程化基因的文库。由每种基因编码的多肽以HTP产生,如实施例2所述(其中蛋白在30℃过夜表达)。对于所有变体,通过添加400μL裂解缓冲液(包含50mM磷酸钠缓冲液pH 6.5、1g/L溶菌酶和0.5g/L PMBS)并在室温在台式振荡器上摇动2小时,使细胞沉淀物裂解。将板在4℃以4000rpm离心15分钟以去除细胞碎片。
在300μL圆底板中,将50μL的大肠杆菌裂解产物添加到每个孔中的200μL的反应混合物(包含75μL 133g/Lα-酮戊二酸[在50mM磷酸钠pH6.5中]、65mM抗坏血酸中的50μL 20mM莫尔盐[在50mM磷酸钠pH 6.5中]和75μL 67g/L脯氨酸)中。用AirPore密封件(Qiagen)密封板,并将反应在30℃、200rpm和85%相对湿度,以2”摆幅在Kuhner中继续进行过夜(~18小时)。
在过夜孵育后,通过将25μL反应混合物等分到含有225μL衍生化溶液(每孔包含75μL饱和碳酸氢钠、25μL水和125μL 2.5mg/mL FmocCl[在ACN中])的96孔深孔板中,将每个孔的反应衍生化和猝灭。在室温摇动1hr后,将板以4000rpm离心一分钟,并将40μL猝灭反应的可溶性级分与160μL 1:1ACN:0.5M HCl混合。衍生化和稀释的样品按表13.1所述进行分析。相对于SEQ ID NO:162的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:162产生的比率。
除了HTP分析外,还以摇瓶规模制备了来自HTP筛选的精选有益变体子集,如实施例3所述并在30℃表达。在以下条件下,对冻干的摇瓶裂解物粉末(SFP)进行1mL规模反应测试:40g/L L-脯氨酸、5wt%脯氨酸羟化酶变体SFP、1.2当量a-KG(α-酮戊二酸)、25mM抗坏血酸、4mM硫酸铁(II)铵六水合物、50mM磷酸钠pH 6.5、空气和室温。将反应运行过夜,并使用以上对HTP反应描述的类似方法进行分析。相对于SEQ ID NO:162的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:162产生的比率。结果在表6.1中示出。
Figure BDA0003664691860001081
Figure BDA0003664691860001091
实施例7
脯氨酸底物向反式-3-羟脯氨酸的转化中相比于SEQ ID NO:322的改进
使用成熟的技术(例如,饱和诱变和重组先前鉴定的有益突变)从编码SEQ ID NO:322的具有脯氨酸羟化酶活性的多肽的工程化多核苷酸(SEQ ID NO:321)产生工程化基因的文库。由每种基因编码的多肽以HTP产生,如实施例2所述(其中蛋白在30℃过夜表达)。对于所有变体,通过添加400μL裂解缓冲液(包含50mM磷酸钠缓冲液pH 6.5、1g/L溶菌酶和0.5g/L PMBS)并在室温在台式振荡器上摇动2小时,使细胞沉淀物裂解。将板在4℃以4000rpm离心15分钟以去除细胞碎片。
在300μL圆底板中,将50μL的大肠杆菌裂解产物添加到每个孔中的200μL的反应混合物(包含75μL 266g/Lα-酮戊二酸[在50mM磷酸钠pH6.5中]、65mM抗坏血酸中的50μL 20mM莫尔盐[在50mM磷酸钠pH 6.5中]和75μL 133g/L脯氨酸)中。用AirPore密封件(Qiagen)密封板,并将反应在30℃、200rpm和85%相对湿度,以2”摆幅在Kuhner中继续进行过夜(~18小时)。
在过夜孵育后,通过将25μL反应混合物等分到含有225μL衍生化溶液(每孔包含75μL饱和碳酸氢钠、25μL水和125μL 2.5mg/mL FmocCl[在ACN中])的96孔深孔板中,将每个孔的反应衍生化和猝灭。在室温摇动1hr后,将板以4000rpm离心一分钟,并将40μL猝灭反应的可溶性级分与160μL 1:1ACN:0.5M HCl混合。衍生化和稀释的样品按表13.1所述进行分析。相对于SEQ ID NO:322的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:322产生的比率。相对于SEQ ID NO:322的活性(活性FIOP)计算为变体的反式-3-羟脯氨酸的峰面积与由SEQ ID NO:322产生的反式-3-羟脯氨酸的峰面积相比的比率,结果分别在表7.1和表7.2中示出。
Figure BDA0003664691860001101
Figure BDA0003664691860001111
除了HTP分析外,还以摇瓶规模制备了来自HTP筛选的精选有益变体子集,如实施例3所述并在30℃表达。在以下条件下,对冻干的摇瓶裂解物粉末(SFP)进行1mL规模反应测试:40g/L L-脯氨酸、5wt%脯氨酸羟化酶变体SFP、1.2当量a-KG(α-酮戊二酸)、10mM抗坏血酸、4mM硫酸铁(II)铵六水合物、50mM磷酸钠pH 6.5、空气和室温。将反应运行过夜,并使用以上对HTP反应描述的类似方法进行分析。相对于SEQ ID NO:322的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:322产生的比率。结果在表7.3中示出。
Figure BDA0003664691860001121
实施例8
脯氨酸底物向反式-3-羟脯氨酸的转化中相比于SEQ ID NO:412的改进
使用成熟的技术(例如,饱和诱变和重组先前鉴定的有益突变)从编码SEQ ID NO:412的具有脯氨酸羟化酶活性的多肽的工程化多核苷酸(SEQ ID NO:411)产生工程化基因的文库。由每种基因编码的多肽以HTP产生,如实施例2所述(其中蛋白在30℃过夜表达)。对于所有变体,通过添加400μL裂解缓冲液(包含50mM磷酸钠缓冲液pH 6.5、1g/L溶菌酶和0.5g/L PMBS)并在室温在台式振荡器上摇动2小时,使细胞沉淀物裂解。将板在4℃以4000rpm离心15分钟以去除细胞碎片。
在300μL圆底板中,将50μL的大肠杆菌裂解产物添加到每个孔中的200μL的反应混合物(包含75μL 266g/Lα-酮戊二酸[在50mM磷酸钠pH6.5中]、65mM抗坏血酸中的50μL 20mM莫尔盐[在50mM磷酸钠pH 6.5中]和75μL 133g/L脯氨酸)中。用AirPore密封件(Qiagen)密封板,并将反应在30℃、200rpm和85%相对湿度,以2”摆幅在Kuhner中继续进行过夜(~18小时)。
在过夜孵育后,通过将25μL反应混合物等分到含有225μL衍生化溶液(每孔包含75μL饱和碳酸氢钠、25μL水和125μL 2.5mg/mL FmocCl[在ACN中])的96孔深孔板中,将每个孔的反应衍生化和猝灭。在室温摇动1hr后,将板以4000rpm离心一分钟,并将40μL猝灭反应的可溶性级分与160μL 1:1ACN:0.5M HCl混合。衍生化和稀释的样品按表13.1所述进行分析。相对于SEQ ID NO:412的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:412产生的比率。结果在表8.1中示出。
Figure BDA0003664691860001131
Figure BDA0003664691860001141
除了HTP分析外,还以摇瓶规模制备了来自HTP筛选的精选有益变体子集,如实施例3所述并在30℃表达。在以下条件下,对冻干的摇瓶裂解物粉末(SFP)进行1mL规模反应测试:60g/L L-脯氨酸、5wt%脯氨酸羟化酶变体SFP、1.2当量a-KG(α-酮戊二酸)、10mM抗坏血酸、4mM硫酸铁(II)铵六水合物、50mM磷酸钠pH 6.8、空气和室温。将反应运行过夜,并使用以上对HTP反应描述的类似方法进行分析。相对于SEQ ID NO:412的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:412产生的比率。结果在表8.2中示出。
Figure BDA0003664691860001151
实施例9
脯氨酸底物向反式-3-羟脯氨酸的转化中相比于SEQ ID NO:492的改进
使用成熟的技术(例如,饱和诱变和重组先前鉴定的有益突变)从编码SEQ ID NO:492的具有脯氨酸羟化酶活性的多肽的工程化多核苷酸(SEQ ID NO:491)产生工程化基因的文库。由每种基因编码的多肽以HTP产生,如实施例2所述(其中蛋白在30℃过夜表达)。对于所有变体,通过添加600μL裂解缓冲液(包含50mM磷酸钠缓冲液pH 6.5、1g/L溶菌酶和0.5g/L PMBS)并在室温在台式振荡器上摇动2小时,使细胞沉淀物裂解。将板在4℃以4000rpm离心15分钟以去除细胞碎片。
在300μL圆底板中,将50μL的大肠杆菌裂解产物添加到每个孔中的200μL的反应混合物(包含75μL 667g/Lα-酮戊二酸[在50mM磷酸钠pH6.5中]、65mM抗坏血酸中的50μL 20mM莫尔盐[在50mM磷酸钠pH 6.5中]和75μL 333g/L脯氨酸)中。用AirPore密封件(Qiagen)密封板,并将反应在30℃、200rpm和85%相对湿度,以2”摆幅在Kuhner中继续进行过夜(~18小时)。
在过夜孵育后,通过将25μL反应混合物等分到含有225μL衍生化溶液(每孔包含75μL饱和碳酸氢钠、25μL水和125μL 2.5mg/mL FmocCl[在ACN中])的96孔深孔板中,将每个孔的反应衍生化和猝灭。在室温摇动1hr后,将板以4000rpm离心一分钟,并将40μL猝灭反应的可溶性级分与160μL 1:1ACN:0.5M HCl混合。衍生化和稀释的样品按表13.1所述进行分析。相对于SEQ ID NO:492的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:492产生的比率。结果在表9.1中示出。
Figure BDA0003664691860001161
Figure BDA0003664691860001171
除了HTP分析外,还以摇瓶规模制备了来自HTP筛选的精选有益变体子集,如实施例3所述并在30℃表达。在以下条件下,对冻干的摇瓶裂解物粉末(SFP)进行1mL规模反应测试:60g/L L-脯氨酸、5wt%脯氨酸羟化酶变体SFP、1.2当量a-KG(α-酮戊二酸)、10mM抗坏血酸、4mM硫酸铁(II)铵六水合物、50mM磷酸钠pH 6.8、空气和室温。将反应运行过夜,并使用以上对HTP反应描述的类似方法进行分析。相对于SEQ ID NO:492的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:492产生的比率。结果在表9.2中示出。
Figure BDA0003664691860001172
实施例10
脯氨酸底物向反式-3-羟脯氨酸的转化中相比于SEQ ID NO:562的改进
使用成熟的技术(例如,饱和诱变和重组先前鉴定的有益突变)从编码SEQ ID NO:562的具有脯氨酸羟化酶活性的多肽的工程化多核苷酸(SEQ ID NO:561)产生工程化基因的文库。由每种基因编码的多肽以HTP产生,如实施例2所述(其中蛋白在30℃过夜表达)。对于所有变体,通过添加400μL裂解缓冲液(包含50mM磷酸钠缓冲液pH 6.5、1g/L溶菌酶和0.5g/L PMBS)并在室温在台式振荡器上摇动2小时,使细胞沉淀物裂解。将板在4℃以4000rpm离心15分钟以去除细胞碎片。
在300μL圆底板中,将50μL的大肠杆菌裂解产物添加到每个孔中的200μL的反应混合物(包含75μL 400g/Lα-酮戊二酸[在50mM磷酸钠pH6.5中]、65mM抗坏血酸中的50μL 20mM莫尔盐[在50mM磷酸钠pH 6.5中]和200μL 200g/L脯氨酸)中。用AirPore密封件(Qiagen)密封板,并将反应在30℃、200rpm和85%相对湿度,以2”摆幅在Kuhner中继续进行过夜(~18小时)。
在过夜孵育后,通过将25μL反应混合物等分到含有225μL衍生化溶液(每孔包含75μL饱和碳酸氢钠、25μL水和125μL 2.5mg/mL FmocCl[在ACN中])的96孔深孔板中,将每个孔的反应衍生化和猝。在室温摇动1hr后,将板以4000rpm离心一分钟,并将40μL猝灭反应的可溶性级分与160μL 1:1ACN:0.5M HCl混合。衍生化和稀释的样品按表13.1所述进行分析。相对于SEQ ID NO:562的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:562产生的比率。结果在表10.1中示出。
Figure BDA0003664691860001181
Figure BDA0003664691860001191
除了HTP分析外,还以摇瓶规模制备了来自HTP筛选的精选有益变体子集,如实施例3所述并在30℃表达。在以下条件下,对冻干的摇瓶裂解物粉末(SFP)进行1mL规模反应测试:60g/L L-脯氨酸、5wt%脯氨酸羟化酶变体SFP、1.2当量a-KG(α-酮戊二酸)、10mM抗坏血酸、4mM硫酸铁(II)铵六水合物、50mM磷酸钠pH 6.8、空气和室温。将反应运行过夜,并使用以上对HTP反应描述的类似方法进行分析。相对于SEQ ID NO:562的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:562产生的比率。结果在表10.2中示出。
Figure BDA0003664691860001192
Figure BDA0003664691860001201
实施例11
脯氨酸底物向反式-3-羟脯氨酸的转化中相比于SEQ ID NO:598的改进
使用成熟的技术(例如,饱和诱变和重组先前鉴定的有益突变)从编码SEQ ID NO:598的具有脯氨酸羟化酶活性的多肽的工程化多核苷酸(SEQ ID NO:597)产生工程化基因的文库。由每种基因编码的多肽以HTP产生,如实施例2所述(其中蛋白在30℃过夜表达)。对于所有变体,通过添加200μL裂解缓冲液(包含50mM磷酸钠缓冲液pH 6.5、1g/L溶菌酶和0.5g/L PMBS)并在室温在台式振荡器上摇动2小时,使细胞沉淀物裂解。将板在4℃以4000rpm离心15分钟以去除细胞碎片。
在300μL圆底板中,将50μL的大肠杆菌裂解产物添加到每个孔中的200μL的反应混合物(包含75μL 267g/Lα-酮戊二酸[在50mM磷酸钠pH6.5中]、65mM抗坏血酸中的50μL 20mM莫尔盐[在50mM磷酸钠pH 6.5中]和200μL 133g/L脯氨酸)中。用AirPore密封件(Qiagen)密封板,并将反应在30℃、200rpm和85%相对湿度,以2”摆幅在Kuhner中继续进行过夜(~18小时)。
在过夜孵育后,通过将25μL反应混合物等分到含有225μL衍生化溶液(每孔包含75μL饱和碳酸氢钠、25μL水和125μL 2.5mg/mL FmocCl[在ACN中])的96孔深孔板中,将每个孔的反应衍生化和猝灭。在室温摇动1hr后,将板以4000rpm离心一分钟,并将40μL猝灭反应的可溶性级分与160μL 1:1ACN:0.5M HCl混合。衍生化和稀释的样品按表13.1所述进行分析。相对于SEQ ID NO:598的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:598产生的比率。结果在表11.1中示出。
Figure BDA0003664691860001211
除了HTP分析外,还以摇瓶规模制备了来自HTP筛选的精选有益变体子集,如实施例3所述并在30℃表达。在以下条件下,对冻干的摇瓶裂解物粉末(SFP)进行1mL规模反应测试:60g/L L-脯氨酸、5wt%脯氨酸羟化酶变体SFP、1.2当量a-KG(α-酮戊二酸)、10mM抗坏血酸、4mM硫酸铁(II)铵六水合物、50mM磷酸钠pH 6.8、空气和室温。将反应运行过夜,并使用以上对HTP反应描述的类似方法进行分析。相对于SEQ ID NO:598的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:598产生的比率。结果在表11.2中示出。
Figure BDA0003664691860001212
Figure BDA0003664691860001221
实施例12
脯氨酸底物向反式-3-羟脯氨酸的转化中相比于SEQ ID NO:630的改进
使用成熟的技术(例如,饱和诱变和重组先前鉴定的有益突变)从编码SEQ ID NO:630的具有脯氨酸羟化酶活性的多肽的工程化多核苷酸(SEQ ID NO:629)产生工程化基因的文库。由每种基因编码的多肽以HTP产生,如实施例2所述(其中蛋白在30℃过夜表达)。对于所有变体,通过添加200μL裂解缓冲液(包含50mM磷酸钠缓冲液pH 6.5、1g/L溶菌酶和0.5g/L PMBS)并在室温在台式振荡器上摇动2小时,使细胞沉淀物裂解。将板在4℃以4000rpm离心15分钟以去除细胞碎片。
在300μL圆底板中,将50μL的大肠杆菌裂解产物添加到每个孔中的200μL的反应混合物(包含75μL 267g/Lα-酮戊二酸[在50mM磷酸钠pH6.5中]、65mM抗坏血酸中的50μL 20mM莫尔盐[在50mM磷酸钠pH 6.5中]和200μL 133g/L脯氨酸)中。用AirPore密封件(Qiagen)密封板,并将反应在30℃、200rpm和85%相对湿度,以2”摆幅在Kuhner中继续进行过夜(~18小时)。
在过夜孵育后,通过将25μL反应混合物等分到含有225μL衍生化溶液(每孔包含75μL饱和碳酸氢钠、25μL水和125μL 2.5mg/mL FmocCl[在ACN中])的96孔深孔板中,将每个孔的反应衍生化和猝灭。在室温摇动1hr后,将板以4000rpm离心一分钟,并将40μL猝灭反应的可溶性级分与160μL 1:1ACN:0.5M HCl混合。衍生化和稀释的样品按表13.1所述进行分析。相对于SEQ ID NO:630的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:630产生的比率。
除了HTP分析外,还以摇瓶规模制备了来自HTP筛选的精选有益变体子集,如实施例3所述并在30℃表达。在以下条件下,对冻干的摇瓶裂解物粉末(SFP)进行1mL规模反应测试:60g/L L-脯氨酸、5wt%脯氨酸羟化酶变体SFP、1.2当量a-KG(α-酮戊二酸)、10mM抗坏血酸、4mM硫酸铁(II)铵六水合物、50mM磷酸钠pH 6.8、空气和室温。将反应运行过夜,并使用以上对HTP反应描述的类似方法进行分析。相对于SEQ ID NO:630的选择性(选择性FIOP)计算为由变体形成的产物的反式-3-羟脯氨酸:反式-4-羟脯氨酸的比率相比于由SEQ ID NO:630产生的比率。结果在表12.1中示出。
Figure BDA0003664691860001231
Figure BDA0003664691860001241
实施例13
由脯氨酸产生的反式-3-羟脯氨酸的分析检测
实施例4-实施例12中描述的数据使用表13.1中的分析方法来收集。本文提供的方法都可用于分析使用本发明产生的变体。然而,并不意图本文描述的方法是可适用于分析本文提供的变体和/或使用本文提供的方法产生的变体的唯一方法。
脯氨酸底物和羟脯氨酸产物如下所述地分析。通过将25μL反应混合物等分到含有225μL衍生化溶液(每孔包含75μL饱和碳酸氢钠、25μL水和125μL 2.5mg/mL FmocCl[在ACN中])的96孔深孔板中,将反应衍生化和猝灭。在室温摇动1hr后,将板以4000rpm离心一分钟,并将40μL猝灭反应的可溶性级分与160μL 1:1ACN:0.5M HCl混合。衍生化和稀释的样品按表13.1中所述进行分析。
Figure BDA0003664691860001242
Figure BDA0003664691860001251
出于所有目的,本文的所有出版物、专利、专利申请和其他文件在此通过引用以其整体并入,其程度如同每个单独的出版物、专利、专利申请或其他文件被单独地指出出于所有目的通过引用并入一样。
虽然已经示出和描述了各种具体的实施方案,但是将理解,可以做出各种改变而不偏离本发明的精神和范围。

Claims (36)

1.一种工程化多肽,具有脯氨酸羟化酶活性,所述工程化多肽包含具有与参考序列SEQID NO:4、116、162、322、412、492、562、598和/或630的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQID NO:4、116、162、322、412、492、562、598和/或630相比的一个或更多个残基差异的氨基酸序列。
2.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:194、123、21、28、58/247、65、80、85、95、98、117、120、159、185、199、200、233、237、243、250、268、281、282、287、289、307、324、326、327、330、338、343、346和348。
3.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:21、28、45、65、95、112、117、139、177、185、199、233、243、250、281、282、287、289、307、324、326、327、335、338、343和346。
4.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:48/66/189/194、48/66/194和66/82/85/135/189/194/267。
5.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:4的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:20/56/76/168/169/296、20/56/232/294、20/119/294/296、56/76/119/124/147/232、56/76/294、76/168/232/294、76/294/296、76/296、147和232。
6.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:116相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:123、189、195、233和296。
7.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:116相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:20/21/56、20/21/56/76/95/232/294/307/335、20/21/56/76/147/225/232/233/281/294/296/307/335、20/21/56/95/147/281/294/307、20/21/56/281/307、20/21/76/232/243、20/21/95/232/307、20/21/95/281/294/296、20/21/147/189/233/243/281/307、20/56、20/56/76/95/281/307、20/56/76/147/294/296/307、20/56/95/147/294、20/56/281、20/76、20/76/95/281/294/296、20/76/95/281/296/307、20/76/233/294/307、20/76/243/281/294、21/76/147/233/294/307、21/76/147/243/296/307/335、21/95/185/189/232/281/296、21/95/233/243/281/296、21/95/294/296/307/335、21/95/307、21/281/307、29/76/281、56/76/95/232/243/281、56/76/147/281/307、56/76/243/294、56/76/281/294、56/76/296、56/76/307、56/95/147/307/335/348、56/95/232/233/281/294/307、56/95/243/281、56/147/281、56/232/243/281、56/232/281、56/232/281/294/296、56/233/281/294/296、56/281/307、76/95/232/243/281/307、76/95/243/281/307/335、76/95/294/307、76/147、76/147/233/243/294、76/147/233/281/294/307、76/147/243/294/296/307/335、76/147/281/307、76/189/296、76/232/233/243/294/296/307、76/281、76/281/294、76/294/296、95/120、95/147/335、95/232/243/281/294/307、95/232/281/294/296、95/281/294/296、95/335、147、147/225/232/243/281/296/307/335、147/233/243/281/307、147/233/281/307/335、147/243/281、147/307、232/233/281/294/296/307、232/281、232/284/307、233/243/281/296/307/335、233/281/296/307、243/281/294/296、281、281/294、281/307、307和335。
8.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:116的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:116相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:21/76/147/243/296/307/335、56/76/147/281/307和95/147/335。
9.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:162的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:162相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:2/85/123/237、28/115/117/120/123/268/270/343/346/348、45/123/326、65/117/120/123/343/346、85/123/281/282、114/115/117/120/123/268/271/313/326/343/346、123/139/233/237/281/282/289/324/326和123/199/200/247/250/338。
10.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:322相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:26、54、61、129、132、149、156、175、189、201、209、228、236、248、262、272、277、291和345。
11.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:322相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:25、43、54、58、61、79、129、132、143、156、163、175、179、201、209、236、248、278、291、345和347。
12.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:322的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:322相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:85/117/120/135/208/270/324/343/346、85/117/120/135/208/281/282/289、85/117/120/270/281/289、85/117/135/139/208和117/120/208/270/324/343/346。
13.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:412的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:412相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:47、48、56/118、85、95、95/289、113、118、118/247、154、162、162/204、164、164/198/271、168、169、187、195、243、271、275、281、314、330和342。
14.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:412的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:412相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:25/129/163/236/262/345/347、120/156/175/179/201、129/189/236/262/277/278、129/236/262、156/175/179/228和162。
15.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:492的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:492相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:15、17、28、29、65、135、167、177、199、208、228、235、287、294、307和343。
16.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:492的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:492相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:85/187/281/347、85/187/347、118/120/162/175/179/330、118/120/162/175/330、162/175/179/330、175/228/330、195/347和278/314/347。
17.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:562的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:562相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:15、40、43、44、59、79、82、149、164、179、345和347。
18.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:562的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:562相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:29/85/177/208/228/347、29/85/208/228/343/347、29/177/195/228/343、29/208/228/278/294/347、56/195/278、85/187/205/208/278、113/177/187/195/208/278/294/343/347和177/205/208/228。
19.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:598的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:598相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:47、162、209、219、227和342。
20.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:598的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:598相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:17/44/179/195/250/313/345、17/44/199/313、43/44/195/199、44/149/164/171/187、44/179/195/199、44/179/195/199/345、79/163/164/171/187/201/286/288、82/163/164、82/163/164/171/187/201/203/208/286/288/320、149/164/171/288和187/286。
21.根据权利要求1所述的工程化多肽,所述工程化多肽包含具有与参考序列SEQ IDNO:630的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性和与SEQ ID NO:630相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:82/164/171/203/208、135/163/164/201/203/208、162、162/219/236、162/219/313/338、162/236/342、162/313/342和164/171/201/203/282。
22.根据权利要求1所述的工程化多肽,其中所述多肽与SEQ ID NO:6-658中的偶数编号的序列中的至少一个具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
23.根据权利要求1所述的工程化多肽,其中所述工程化多肽能够将L-脯氨酸转化为反式-3-羟脯氨酸。
24.根据权利要求23所述的工程化多肽,其中所述工程化多肽能够以天然存在的酶的至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍或更多的活性将L-脯氨酸转化为反式-3-羟脯氨酸。
25.根据权利要求23的工程化多肽,其中所述工程化多肽能够以反式-3-羟脯氨酸的大于90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的非对映异构体过量将L-脯氨酸转化为反式-3-羟脯氨酸。
26.一种多核苷酸,所述多核苷酸编码根据权利要求1-25中任一项所述的工程化多肽。
27.一种多核苷酸,所述多核苷酸编码根据权利要求22所述的工程化多肽。
28.一种多核苷酸,所述多核苷酸编码根据权利要求24所述的工程化多肽。
29.根据权利要求26-28中任一项所述的多核苷酸,其中所述多核苷酸包括为在大肠杆菌(E.coli)中表达而优化的核酸序列。
30.一种表达载体,所述表达载体包含根据权利要求26-29中任一项所述的多核苷酸,任选地还包含至少一种控制序列。
31.根据权利要求30所述的表达载体,其中所述载体包含SEQ ID NO:4、116、162、322、412、492、562、598和/或630的工程化多肽。
32.一种宿主细胞,所述宿主细胞包含根据权利要求26-29中任一项所述的多核苷酸。
33.一种宿主细胞,所述宿主细胞包含根据权利要求30或31所述的表达载体。
34.根据权利要求32或33所述的宿主细胞,其中所述宿主细胞是大肠杆菌。
35.一种制备工程化多肽的方法,所述方法包括在适合于表达所述多肽的条件下培养根据权利要求32-34中任一项所述的宿主细胞。
36.根据权利要求35所述的方法,所述方法还包括分离所述工程化多肽的步骤。
CN202080082591.5A 2019-11-26 2020-11-19 用于化学化合物的羟基化的生物催化剂和方法 Pending CN115175997A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962940647P 2019-11-26 2019-11-26
US62/940,647 2019-11-26
PCT/US2020/061237 WO2021108209A1 (en) 2019-11-26 2020-11-19 Biocatalysts and methods for hydroxylation of chemical compounds

Publications (1)

Publication Number Publication Date
CN115175997A true CN115175997A (zh) 2022-10-11

Family

ID=76130387

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080082591.5A Pending CN115175997A (zh) 2019-11-26 2020-11-19 用于化学化合物的羟基化的生物催化剂和方法

Country Status (7)

Country Link
US (1) US20230002744A1 (zh)
EP (1) EP4065704A1 (zh)
JP (1) JP2023502779A (zh)
CN (1) CN115175997A (zh)
CA (1) CA3160437A1 (zh)
IL (1) IL293038A (zh)
WO (1) WO2021108209A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2024050501A2 (en) * 2022-09-01 2024-03-07 University Of Miami Tyr peptide compositions and methods for use

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HUE042605T2 (hu) * 2012-05-08 2019-07-29 Codexis Inc Biokatalizátorok és kémiai vegyületek hidroxilálására szolgáló eljárások

Also Published As

Publication number Publication date
EP4065704A1 (en) 2022-10-05
US20230002744A1 (en) 2023-01-05
JP2023502779A (ja) 2023-01-25
IL293038A (en) 2022-07-01
WO2021108209A1 (en) 2021-06-03
CA3160437A1 (en) 2021-06-03

Similar Documents

Publication Publication Date Title
US10995349B2 (en) Engineered proline hydroxylase polypeptides and methods
US11634695B2 (en) Vectors for expression of biocatalysts
WO2018231462A1 (en) Engineered transaminase polypeptides for industrial biocatalysis
JP2022065092A (ja) 操作されたイミンレダクターゼ、ならびにケトン化合物およびアミン化合物の還元的アミノ化のための方法
CN114127272A (zh) 工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法
CN115175997A (zh) 用于化学化合物的羟基化的生物催化剂和方法
US20220145268A1 (en) Engineered glucose dehydrogenases and methods for the reductive amination of ketone and amine compounds
US20230287361A1 (en) Engineered monoamine oxidases for the preparation of stereomerically pure fused bicyclic proline compounds

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination