CN114127272A - 工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法 - Google Patents

工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法 Download PDF

Info

Publication number
CN114127272A
CN114127272A CN202080048335.4A CN202080048335A CN114127272A CN 114127272 A CN114127272 A CN 114127272A CN 202080048335 A CN202080048335 A CN 202080048335A CN 114127272 A CN114127272 A CN 114127272A
Authority
CN
China
Prior art keywords
sequence
seq
polypeptide
engineered
engineered polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080048335.4A
Other languages
English (en)
Inventor
易翔
奥斯卡·阿尔维左
拉维·大卫·加西亚
大卫·恩特韦斯特尔
沙琳·奇恩
詹姆斯·尼古拉斯·里金斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Publication of CN114127272A publication Critical patent/CN114127272A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0026Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on CH-NH groups of donors (1.5)
    • C12N9/0028Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on CH-NH groups of donors (1.5) with NAD or NADP as acceptor (1.5.1)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本申请提供了具有亚胺还原酶活性的工程化多肽、编码该工程化多肽的多核苷酸、能够表达该工程化多肽的宿主细胞、以及使用这些工程化多肽和一系列酮和胺底物化合物以制备仲胺和叔胺产物化合物的方法。

Description

工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法
本申请要求2019年5月1日提交的美国专利申请序列第62/841,633号的优先权,该美国专利申请在此通过引用以其整体并入以用于所有目的。
技术领域
本发明提供了可用于产生仲胺的具有亚胺还原酶活性的工程化多肽,以及利用这些工程化多肽的组合物和方法。
对序列表、表格或计算机程序的引用
序列表的正式副本以ASCII格式化文本文件经由EFS-Web与说明书同时提交,文件名为“CX2-186WO1_ST25.txt”,创建日期为2020年4月21日,且大小为1.76兆字节。经由EFS-Web提交的序列表是本说明书的一部分并且通过引用以其整体并入本文。
背景
手性仲胺是制药行业的重要构建单元(building block)。然而,仅存在少量的已知产生这类手性胺化合物的生物催化途径。现有的化学方法使用基于手性硼试剂、过渡金属的还原方法或保护基团策略,它们需要多步骤合成用于总体还原亚胺。
在文献中存在几篇关于生物催化合成稳定环状胺的报道。亚胺还原酶或“IRED”从链霉菌属种(Streptomyces sp.)GF3587和GF3546纯化和表征,并且显示出立体选择性地还原2-甲基-1-吡咯啉(参见,Mitsukura等人,Biosci.Biotech.Biochem.,75:1778-1782[2011)];Huber等人.Chem.Cat.Chem.,6:2248-2252[2014])。还显示了使用天然亚胺还原酶还原成无环胺和带有烷基基团的氨基酸(Gand等人,J.Mol.Catal.B:Enzym.,110:126-132[2014])。最近,其他作者报道了也被称为还原胺(RedAm)的IRED,其催化在合成上感兴趣的还原胺化(Grogan,Curr.Opin.Chem.Biol.,2018,43,15-22;France等人,ChemCatChem.,2018,10(3),510-514;Aleku等人,Nat.Chem.,2017,9,961-969和ChemCatChem.,2018,10(3),515-519;Sharma等人,ACS Catalysis 2018,8(12),11534-11541以及Adv.Synth.Catal.,2017,359(12),2011-2015;Roiban等人,ChemCatChem.,2017,9(24),4475-4479)。
本领域对生物催化剂和在工业适用条件下使用它们合成手性仲胺和叔胺的方法存在需求。
概述
本发明提供了用于通过亚胺底物的直接还原来合成手性仲胺的新型生物催化剂和相关方法。本公开内容的生物催化剂是源自节杆菌属种(Arthrobacter sp.)菌株1C的编码具有SEQ ID NO:2的氨基酸序列的冠瘿碱脱氢酶(opine dehydrogenase)的野生型基因的工程化多肽变体。这些工程化多肽具有亚胺还原酶活性,并且能够催化酮或醛底物和伯胺或仲胺底物的转化以形成仲胺或叔胺产物化合物。
在一些实施方案中,本公开内容提供了具有亚胺还原酶活性的工程化多肽,所述工程化多肽包含与选自由SEQ ID NO:4、16、50、306、648和708组成的组的参考氨基酸序列具有至少80%序列同一性的氨基酸序列,并且还包含与参考氨基酸序列相比的一个或更多个残基差异。在具有亚胺还原酶活性的工程化多肽的一些实施方案中,亚胺还原酶活性是以下的活性:方案1;任选地,表2中公开的反应;任选地,将式(V)化合物和式(VI)化合物转化为式(IV)化合物产物的反应;以及任选地,将化合物(2)和化合物(3)转化为产物化合物(1)的反应。
本发明提供了一种工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:4具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,包含选自以下一个或更多个位置处的至少一个取代或取代集:145、146、153、160、222、223、226和261,其中位置参考SEQ ID NO:4编号。在一些另外的实施方案中,工程化多肽包含至少一个选自E145I、E145V、R146A、N153L、N153R、D160T、Y222F、Y222W、L223A、L223G、L223I、L223S、L223V、I226M和E261T的取代,其中位置参考SEQ ID NO:4编号。在一些实施方案中,工程化多肽包含至少一个选自E145I、E145V、R146A、N153L、N153R、D160T、Y222F、Y222W、L223A、L223G、L223I、L223S、L223V、I226M和E261T的取代或取代集,其中位置参考SEQ ID NO:4编号。在一些另外的实施方案中,工程化多肽包含与SEQ ID NO:6至SEQID NO:802中列出的任何偶数编号序列具有至少80%序列同一性的氨基酸序列。
本发明提供了一种工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:16具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,包含选自以下一个或更多个位置处的至少一个取代或取代集:29/94/184/223/232/288/293、29/94/184/232/287/288/293/311、29/94/184/232/287/288/311、29/94/184/232/287/293/332、29/94/184/232/288/293/311/324/353、29/94/184/232/288/311/324/332、29/94/184/232/293、29/94/184/232/311、29/94/184/287/293、29/94/184/287/293/311/353、29/94/184/287/311、29/94/184/288/293/324、29/94/184/288/293/332/353、29/94/184/288/298/332、29/94/184/288/353、29/94/184/293/311、29/94/184/324、29/94/223/232/287、29/94/223/232/293/311/324、29/94/223/288/293、29/94/232/287/288/311、29/94/232/288/293、29/94/287/288/293、29/94/287/288/293/353、29/94/287/311、29/94/293/311/324、29/94/293/332/353、29/94/311、29/94/324/353、29/184、29/184/223/288/293/324、29/184/232/288、29/184/287、29/184/287/288/293、29/184/287/288/293/311、29/184/287/311/332、29/184/288/293、29/184/288/293/311、29/184/293、29/184/293/311、29/184/293/324、29/184/353、29/223/287/288/293/353、29/232/287/288/293/332/353、29/287/288/293、29/287/288/293/324/353、29/288/293、29/311、29/311/332、29/353、72/94/184/288/311、86、94/96/223/287/288/293/311/324/332、94/99/184/293/311/332/353、94/184/223、94/184/223/232/287/311、94/184/223/288/293、94/184/223/293、94/184/232/287/288、94/184/232/287/288/324/332、94/184/232/287/293、94/184/232/287/293/332、94/184/287/288/293、94/184/287/288/311、94/184/287/293/311/324/353、94/184/287/311、94/184/287/353、94/184/288/293、94/184/288/293/311、94/184/288/293/311/332、94/184/293、94/184/293/311、94/184/293/332/353、94/223/232/311/353/355/356/357/358/359、94/223/287/288/293、94/223/288/293/311、94/232/287/288/293/353、94/232/288/293/353、94/232/293、94/232/293/324/332、94/232/311、94/287/288/293、94/287/288/311/324、94/288/293、94/288/293/324、94/293/324、94/311/324、153、184/223、184/223/287/288/353、184/232/287/288/293/311、184/232/287/288/324/353、184/232/287/293/332、184/287/288、184/287/288/293、184/287/288/293/324/353、184/287/293、184/287/293/311、184/288/293/311/324、184/332/353、205、223/232/287/288/332/353、223/287/288、223/287/288/293/311、223/287/311/353、223/288/293、232/287/288/293、232/287/288/293/311、232/287/288/293/321、232/287/311、232/288/293、232/288/293/332、234/287/288/293/311、287/288/293、287/288/311/324、287/293、287/311、287/311/332、287/324、288/293、288/293/311/324/353、288/293/324、293/311和311/332,其中位置参考SEQ ID NO:16编号。在一些另外的实施方案中,工程化多肽包含选自以下的至少一个取代或取代集:29R/94K/184Q/288S/353E、29R/94K/184R/232A/288S/293F/311V/324L/353E、29R/94K/184R/287T/293F、29R/94K/184R/288S/293Q/332V/353E、29R/94K/184R/324L、29R/94K/223S/232A/287K、29R/94K/232A/287T/288S/311V、29R/94K/232A/288S/293F、29R/94K/287K/311V、29R/94K/287T/288S/293F、29R/94K/293H/311V/324L、29R/94K/324L/353E、29R/94R/184Q/223S/232A/288S/293F、29R/94R/184Q/232A/287T/293F/332V、29R/94R/184Q/232A/288S/311V/324L/332V、29R/94R/184Q/287K/293F/311V/353E、29R/94R/184Q/287K/311V、29R/94R/184Q/288S/293F/324L、29R/94R/184R/232A/287K/288S/293F/311V、29R/94R/184R/232A/287T/288S/311V、29R/94R/184R/232A/293F、29R/94R/184R/232A/311V、29R/94R/184R/288S/298A/332V、29R/94R/184R/293F/311V、29R/94R/223S/288S/293F、29R/94R/223T/232A/293H/311V/324L、29R/94R/287K/288S/293F、29R/94R/287T/288S/293F、29R/94R/287T/288S/293F/353E、29R/94R/293F/332V/353E、29R/94R/311V、29R/184Q/223S/288S/293F/324L、29R/184Q/287T/288S/293F、29R/184R、29R/184R/232A/288S、29R/184R/287K/288S/293F/311V、29R/184R/287K/311V/332V、29R/184R/287T、29R/184R/288S/293F、29R/184R/288S/293F/311V、29R/184R/293F、29R/184R/293F/311V、29R/184R/293F/324L、29R/184R/353E、29R/223T/287T/288S/293F/353E、29R/232A/287T/288S/293Q/332V/353E、29R/287T/288S/293F、29R/287T/288S/293F/324L/353E、29R/288S/293F、29R/311V、29R/311V/332V、29R/353E、72V/94R/184R/288S/311V、86Q、94K/96V/223T/287K/288S/293F/311V/324L/332V、94K/184Q/232A/287T/293F、94K/184Q/232A/287T/293F/332V、94K/184Q/287T/293F/311V/324L/353E、94K/184R/223S/288S/293F、94K/184R/223T/232A/287K/311V、94K/184R/232A/287K/288S、94K/184R/287T/311V、94K/184R/287T/353E、94K/184R/288S/293F/311V、94K/184R/293H/311V、94K/287K/288S/293F、94K/287T/288S/311V/324L、94K/288S/293F、94K/288S/293F/324L、94K/311V/324L、94R/99T/184R/293F/311V/332V/353E、94R/184Q/287K/288S/311V、94R/184Q/288S/293F/311V、94R/184Q/293F/332V/353E、94R/184R/223S、94R/184R/223S/293F、94R/184R/232A/287K/288S/324L/332V、94R/184R/287K/288S/293F、94R/184R/287K/288S/311V、94R/184R/288S/293F、94R/184R/288S/293F/311V/332V、94R/184R/293F、94R/223S/232A/311V/353E/355K/356K/357C/358C/359-、94R/223S/287K/288S/293F、94R/223S/288S/293F/311V、94R/232A/287K/288S/293F/353E、94R/232A/288S/293F/353E、94R/232A/293F、94R/232A/293F/324L/332V、94R/232A/311V、94R/287K/288S/293F、94R/287T/288S/293F、94R/293F/324L、94R/311V/324L、153Y、184Q/223T/287K/288S/353E、184Q/232A/287K/288S/293F/311V、184Q/232A/287K/288S/324L/353E、184Q/287K/293F、184R/223T、184R/232A/287K/293F/332V、184R/287K/293F/311V、184R/287T/288S、184R/287T/288S/293F、184R/287T/288S/293F/324L/353E、184R/287T/288S/293Q、184R/288S/293H/311V/324L、184R/332V/353E、205I、205V、223S/232A/287K/288S/332V/353E、223S/287K/288S/293F/311V、223S/287K/311V/353E、223S/287T/288S、223S/288S/293F、232A/287K/288S/293F、232A/287K/288S/293F/311V、232A/287K/311V、232A/287T/288S/293F/321V、232A/288S/293F、232A/288S/293F/332V、234V/287K/288S/293F/311V、287K/288S/293F、287K/293F、287K/311V/332V、287K/324L、287T/288S/311V/324L、287T/311V、288S/293F、288S/293F/311V/324L/353E、288S/293F/324L、293F/311V和311V/332V,其中位置参考SEQ IDNO:16编号。在一些实施方案中,工程化多肽包含选自以下的至少一个取代或取代集:S29R/N94K/V184Q/N288S/G353E、S29R/N94K/V184R/S232A/N288S/Y293F/A311V/D324L/G353E、S29R/N94K/V184R/I287T/Y293F、S29R/N94K/V184R/N288S/Y293Q/T332V/G353E、S29R/N94K/V184R/D324L、S29R/N94K/L223S/S232A/I287K、S29R/N94K/S232A/I287T/N288S/A311V、S29R/N94K/S232A/N288S/Y293F、S29R/N94K/I287K/A311V、S29R/N94K/I287T/N288S/Y293F、S29R/N94K/Y293H/A311V/D324L、S29R/N94K/D324L/G353E、S29R/N94R/V184Q/L223S/S232A/N288S/Y293F、S29R/N94R/V184Q/S232A/I287T/Y293F/T332V、S29R/N94R/V184Q/S232A/N288S/A311V/D324L/T332V、S29R/N94R/V184Q/I287K/Y293F/A311V/G353E、S29R/N94R/V184Q/I287K/A311V、S29R/N94R/V184Q/N288S/Y293F/D324L、S29R/N94R/V184R/S232A/I287K/N288S/Y293F/A311V、S29R/N94R/V184R/S232A/I287T/N288S/A311V、S29R/N94R/V184R/S232A/Y293F、S29R/N94R/V184R/S232A/A311V、S29R/N94R/V184R/N288S/V298A/T332V、S29R/N94R/V184R/Y293F/A311V、S29R/N94R/L223S/N288S/Y293F、S29R/N94R/L223T/S232A/Y293H/A311V/D324L、S29R/N94R/I287K/N288S/Y293F、S29R/N94R/I287T/N288S/Y293F、S29R/N94R/I287T/N288S/Y293F/G353E、S29R/N94R/Y293F/T332V/G353E、S29R/N94R/A311V、S29R/V184Q/L223S/N288S/Y293F/D324L、S29R/V184Q/I287T/N288S/Y293F、S29R/V184R、S29R/V184R/S232A/N288S、S29R/V184R/I287K/N288S/Y293F/A311V、S29R/V184R/I287K/A311V/T332V、S29R/V184R/I287T、S29R/V184R/N288S/Y293F、S29R/V184R/N288S/Y293F/A311V、S29R/V184R/Y293F、S29R/V184R/Y293F/A311V、S29R/V184R/Y293F/D324L、S29R/V184R/G353E、S29R/L223T/I287T/N288S/Y293F/G353E、S29R/S232A/I287T/N288S/Y293Q/T332V/G353E、S29R/I287T/N288S/Y293F、S29R/I287T/N288S/Y293F/D324L/G353E、S29R/N288S/Y293F、S29R/A311V、S29R/A311V/T332V、S29R/G353E、A72V/N94R/V184R/N288S/A311V、I86Q、N94K/A96V/L223T/I287K/N288S/Y293F/A311V/D324L/T332V、N94K/V184Q/S232A/I287T/Y293F、N94K/V184Q/S232A/I287T/Y293F/T332V、N94K/V184Q/I287T/Y293F/A311V/D324L/G353E、N94K/V184R/L223S/N288S/Y293F、N94K/V184R/L223T/S232A/I287K/A311V、N94K/V184R/S232A/I287K/N288S、N94K/V184R/I287T/A311V、N94K/V184R/I287T/G353E、N94K/V184R/N288S/Y293F/A311V、N94K/V184R/Y293H/A311V、N94K/I287K/N288S/Y293F、N94K/I287T/N288S/A311V/D324L、N94K/N288S/Y293F、N94K/N288S/Y293F/D324L、N94K/A311V/D324L、N94R/I99T/V184R/Y293F/A311V/T332V/G353E、N94R/V184Q/I287K/N288S/A311V、N94R/V184Q/N288S/Y293F/A311V、N94R/V184Q/Y293F/T332V/G353E、N94R/V184R/L223S、N94R/V184R/L223S/Y293F、N94R/V184R/S232A/I287K/N288S/D324L/T332V、N94R/V184R/I287K/N288S/Y293F、N94R/V184R/I287K/N288S/A311V、N94R/V184R/N288S/Y293F、N94R/V184R/N288S/Y293F/A311V/T332V、N94R/V184R/Y293F、N94R/L223S/S232A/A311V/G353E/R355K/S356K/A357C/V358C/E359-、N94R/L223S/I287K/N288S/Y293F、N94R/L223S/N288S/Y293F/A311V、N94R/S232A/I287K/N288S/Y293F/G353E、N94R/S232A/N288S/Y293F/G353E、N94R/S232A/Y293F、N94R/S232A/Y293F/D324L/T332V、N94R/S232A/A311V、N94R/I287K/N288S/Y293F、N94R/I287T/N288S/Y293F、N94R/Y293F/D324L、N94R/A311V/D324L、N153Y、V184Q/L223T/I287K/N288S/G353E、V184Q/S232A/I287K/N288S/Y293F/A311V、V184Q/S232A/I287K/N288S/D324L/G353E、V184Q/I287K/Y293F、V184R/L223T、V184R/S232A/I287K/Y293F/T332V、V184R/I287K/Y293F/A311V、V184R/I287T/N288S、V184R/I287T/N288S/Y293F、V184R/I287T/N288S/Y293F/D324L/G353E、V184R/I287T/N288S/Y293Q、V184R/N288S/Y293H/A311V/D324L、V184R/T332V/G353E、P205I、P205V、L223S/S232A/I287K/N288S/T332V/G353E、L223S/I287K/N288S/Y293F/A311V、L223S/I287K/A311V/G353E、L223S/I287T/N288S、L223S/N288S/Y293F、S232A/I287K/N288S/Y293F、S232A/I287K/N288S/Y293F/A311V、S232A/I287K/A311V、S232A/I287T/N288S/Y293F/A321V、S232A/N288S/Y293F、S232A/N288S/Y293F/T332V、A234V/I287K/N288S/Y293F/A311V、I287K/N288S/Y293F、I287K/Y293F、I287K/A311V/T332V、I287K/D324L、I287T/N288S/A311V/D324L、I287T/A311V、N288S/Y293F、N288S/Y293F/A311V/D324L/G353E、N288S/Y293F/D324L、Y293F/A311V和A311V/T332V,其中位置参考SEQ ID NO:16编号。
本发明提供了一种工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:50具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,包含选自以下一个或更多个位置处的至少一个取代或一个取代集:29/57/94/153/184/205/261/265/287、29/57/94/153/205/265、29/57/94/184/205/277/353、29/57/94/205/259/261/265、29/57/94/205/261/353、29/57/153/184/205/259/261/265/277、29/57/153/184/205/353、29/57/153/205/261/265、29/57/153/205/261/265/277、29/57/153/205/265/277、29/57/153/205/277/353、29/57/184/205/259/261/265/277/287/357、29/57/184/205/259/261/265/287、29/57/205/259/261/265、29/57/205/259/261/265/287、29/57/205/261/265/353、29/94/153/184/205、29/94/153/205/259/261/265、29/94/153/205/259/261/287、29/94/153/205/259/261/287/353、29/94/184/205/259/261、29/94/184/205/261、29/94/205、29/94/205/259/261/287、29/94/205/261、29/94/261/265/287/353、29/153/184/205、29/153/205、29/153/205/259/261/265/277/287、29/153/261/265/287/353、29/184/205、29/184/205/259/261/277、29/184/205/353、29/184/261/265、29/184/265、29/205、29/205/259/261、29/205/259/261/265/287、29/205/259/261/287、29/205/261、29/205/261/265、29/205/261/265/353、29/205/261/353、29/205/277、29/205/287、29/205/287/353、29/259/261/265、29/261/353、57/94/153/184/205/259/261、57/94/153/205/261/265、57/94/153/259/261/265、57/94/153/261/265、57/94/184/205/261/265/287、57/94/184/261/265/287、57/94/205/259、57/94/205/259/261/265/277/287、57/94/205/261/265、57/94/205/277、57/153/205/259/261/265/287、57/153/205/259/265/277、57/153/205/261、57/153/205/261/265、57/153/205/265、57/153/261/265、57/153/261/265/287/353、57/205、57/205/259/261、57/205/259/261/265/277/287/353、57/205/259/261/287/353、57/205/259/265、57/205/261、57/205/261/265/277/287/353、57/205/261/277、57/205/261/277/353、57/261/265/353、94/126/184/205/259/261/265、94/153/184/205、94/153/184/259/261/265、94/153/205/259/261/265/353、94/153/205/287、94/153/205/287/353、94/153/205/353、94/184/205/259/261、94/184/205/259/261/265/287、94/184/205/259/261/353、94/184/205/261/265/287/353、94/184/353、94/205、94/205/259/261/265、94/205/259/261/265/277/287、94/205/259/261/265/353、94/205/259/261/287/353、94/205/261/265/277、94/205/261/265/353、94/205/261/353、94/205/277、94/259/261/265、153/184/205/261/277/287、153/184/261/265/287、153/205、153/205/261、153/205/261/265/287、153/259/261/265、153/259/265/287、153/261/265、153/261/265/287/353、153/265、153/265/277/287/353、184/205、184/205/259/261/287、184/205/261、184/205/261/265、184/205/261/287、184/205/277、184/205/287/353、184/261/265/287、202、205、205/259/261、205/259/261/265、205/259/261/265/277/287/353、205/259/261/277/287、205/259/265、205/261、205/261/265、205/261/265/274、205/261/265/287、205/261/265/287/353、205/261/277、205/261/353、205/277/287、205/287、223、225、256、259/261/265、261/265/287、265/287、283和294,其中位置参考SEQ ID NO:50编号。在一些另外的实施方案中,工程化多肽包含选自以下的至少一个取代或取代集:29S/57G/94K/153F/184R/205C/261L/265I/287T、29S/57G/94K/153L/205A/265I、29S/57G/94K/184R/205C/277V/353E、29S/57G/94K/205C/259F/261S/265I、29S/57G/94K/205C/261L/353E、29S/57G/153F/184R/205C/259F/261V/265I/277V、29S/57G/153F/205C/261L/265I/277V、29S/57G/153F/205C/261V/265I、29S/57G/153F/205C/277V/353E、29S/57G/153L/184R/205A/353E、29S/57G/153L/205A/265I/277V、29S/57G/184R/205C/259F/261L/265I/277V/287K/357S、29S/57G/184R/205C/259F/261V/265I/287T、29S/57G/205A/259F/261L/265I/287T、29S/57G/205A/259F/261S/265I、29S/57G/205C/261S/265I/353E、29S/94K/153F/205A/259F/261S/287T/353E、29S/94K/153F/205C/259F/261L/287K、29S/94K/153L/184R/205C、29S/94K/153L/205C/259F/261R/265I、29S/94K/184R/205C/259F/261S、29S/94K/184R/205C/261V、29S/94K/205A、29S/94K/205A/261V、29S/94K/205C/259F/261L/287T、29S/94K/261R/265I/287T/353E、29S/153F/184R/205C、29S/153F/205A、29S/153F/261R/265I/287K/353E、29S/153L/205A/259F/261L/265I/277V/287T、29S/184R/205A、29S/184R/205A/353E、29S/184R/205C/259F/261V/277V、29S/184R/261L/265I、29S/184R/265I、29S/205A、29S/205A/259F/261L/265I/287K、29S/205A/259F/261R、29S/205A/261V、29S/205C/259F/261L、29S/205C/259F/261L/265I/287T、29S/205C/259F/261L/287K、29S/205C/259F/261L/287T、29S/205C/259F/261S、29S/205C/261L、29S/205C/261L/265I/353E、29S/205C/261R/353E、29S/205C/261S、29S/205C/261S/265I、29S/205C/261V/265I、29S/205C/277V、29S/205C/287T、29S/205C/287T/353E、29S/259F/261L/265I、29S/261V/353E、57G/94K/153F/184R/205A/259F/261L、57G/94K/153F/205A/261L/265I、57G/94K/153F/259F/261V/265I、57G/94K/153F/261V/265I、57G/94K/184R/205C/261V/265I/287T、57G/94K/184R/261S/265I/287T、57G/94K/205A/259F、57G/94K/205A/259F/261V/265I/277V/287T、57G/94K/205A/277V、57G/94K/205C/259F、57G/94K/205C/261S/265I、57G/153F/205A/261L/265I、57G/153F/205A/261S、57G/153F/205C/259F/261L/265I/287T、57G/153F/205C/259F/265I/277V、57G/153F/205C/265I、57G/153F/261L/265I/287K/353E、57G/153F/261R/265I、57G/205A、57G/205A/259F/261L/265I/277V/287K/353E、57G/205A/259F/261L/287T/353E、57G/205A/259F/261V、57G/205A/261R、57G/205C、57G/205C/259F/265I、57G/205C/261L/265I/277V/287T/353E、57G/205C/261L/277V、57G/205C/261S/277V/353E、57G/261L/265I/353E、94K/126C/184R/205A/259F/261L/265I、94K/153F/184R/259F/261S/265I、94K/153F/205A/287K/353E、94K/153F/205A/353E、94K/153F/205C/287K、94K/153F/205C/287T/353E、94K/153L/184R/205C、94K/153L/205C/259F/261S/265I/353E、94K/184R/205A/259F/261L/353E、94K/184R/205A/259F/261S、94K/184R/205A/261V/265I/287T/353E、94K/184R/205C/259F/261S/265I/287K、94K/184R/353E、94K/205A、94K/205A/259F/261L/265I、94K/205A/259F/261L/265I/277V/287K、94K/205A/259F/261R/265I、94K/205A/259F/261V/287K/353E、94K/205A/277V、94K/205C、94K/205C/259F/261S/265I、94K/205C/259F/261S/265I/353E、94K/205C/259F/261V/265I/353E、94K/205C/261L/353E、94K/205C/261S/265I/277V、94K/205C/261V/265I/353E、94K/259F/261S/265I、94K/259F/261V/265I、153F/184R/205A/261L/277V/287T、153F/184R/261S/265I/287T、153F/205A、153F/205A/261R/265I/287T、153F/205C、153F/205C/261L、153F/205C/261V、153F/259F/261V/265I、153F/259F/265I/287K、153F/261L/265I、153F/261R/265I、153F/261S/265I/287T/353E、153F/265I、153F/265I/277V/287T/353E、184R/205A/261R/265I、184R/205A/287T/353E、184R/205C、184R/205C/259F/261L/287K、184R/205C/261L、184R/205C/261R/287K、184R/205C/277V、184R/261L/265I/287T、202L、202M、205A、205A/259F/261V/265I、205A/259F/265I、205A/261L、205A/261R/265I/287K、205C、205C/259F/261L、205C/259F/261R/265I/277V/287T/353E、205C/259F/261S、205C/259F/261S/265I、205C/259F/261V/277V/287T、205C/259F/265I、205C/261L/265I/274A、205C/261L/277V、205C/261L/353E、205C/261R、205C/261R/265I/287K/353E、205C/261S、205C/261V/265I、205C/277V/287K、205C/287K、205C/287T、205S、205T、223G、225F、225Y、256L、256V、259F/261L/265I、259F/261V/265I、261R/265I/287K、261S/265I/287T、265I/287T、283L和294I,其中位置参考SEQ ID NO:50编号。在一些实施方案中,工程化多肽包含选自以下的至少一个取代或取代集:R29S/A57G/N94K/N153F/Q184R/P205C/E261L/Q265I/I287T、R29S/A57G/N94K/N153L/P205A/Q265I、R29S/A57G/N94K/Q184R/P205C/N277V/G353E、R29S/A57G/N94K/P205C/Y259F/E261S/Q265I、R29S/A57G/N94K/P205C/E261L/G353E、R29S/A57G/N153F/Q184R/P205C/Y259F/E261V/Q265I/N277V、R29S/A57G/N153F/P205C/E261L/Q265I/N277V、R29S/A57G/N153F/P205C/E261V/Q265I、R29S/A57G/N153F/P205C/N277V/G353E、R29S/A57G/N153L/Q184R/P205A/G353E、R29S/A57G/N153L/P205A/Q265I/N277V、R29S/A57G/Q184R/P205C/Y259F/E261L/Q265I/N277V/I287K/A357S、R29S/A57G/Q184R/P205C/Y259F/E261V/Q265I/I287T、R29S/A57G/P205A/Y259F/E261L/Q265I/I287T、R29S/A57G/P205A/Y259F/E261S/Q265I、R29S/A57G/P205C/E261S/Q265I/G353E、R29S/N94K/N153F/P205A/Y259F/E261S/I287T/G353E、R29S/N94K/N153F/P205C/Y259F/E261L/I287K、R29S/N94K/N153L/Q184R/P205C、R29S/N94K/N153L/P205C/Y259F/E261R/Q265I、R29S/N94K/Q184R/P205C/Y259F/E261S、R29S/N94K/Q184R/P205C/E261V、R29S/N94K/P205A、R29S/N94K/P205A/E261V、R29S/N94K/P205C/Y259F/E261L/I287T、R29S/N94K/E261R/Q265I/I287T/G353E、R29S/N153F/Q184R/P205C、R29S/N153F/P205A、R29S/N153F/E261R/Q265I/I287K/G353E、R29S/N153L/P205A/Y259F/E261L/Q265I/N277V/I287T、R29S/Q184R/P205A、R29S/Q184R/P205A/G353E、R29S/Q184R/P205C/Y259F/E261V/N277V、R29S/Q184R/E261L/Q265I、R29S/Q184R/Q265I、R29S/P205A、R29S/P205A/Y259F/E261L/Q265I/I287K、R29S/P205A/Y259F/E261R、R29S/P205A/E261V、R29S/P205C/Y259F/E261L、R29S/P205C/Y259F/E261L/Q265I/I287T、R29S/P205C/Y259F/E261L/I287K、R29S/P205C/Y259F/E261L/I287T、R29S/P205C/Y259F/E261S、R29S/P205C/E261L、R29S/P205C/E261L/Q265I/G353E、R29S/P205C/E261R/G353E、R29S/P205C/E261S、R29S/P205C/E261S/Q265I、R29S/P205C/E261V/Q265I、R29S/P205C/N277V、R29S/P205C/I287T、R29S/P205C/I287T/G353E、R29S/Y259F/E261L/Q265I、R29S/E261V/G353E、A57G/N94K/N153F/Q184R/P205A/Y259F/E261L、A57G/N94K/N153F/P205A/E261L/Q265I、A57G/N94K/N153F/Y259F/E261V/Q265I、A57G/N94K/N153F/E261V/Q265I、A57G/N94K/Q184R/P205C/E261V/Q265I/I287T、A57G/N94K/Q184R/E261S/Q265I/I287T、A57G/N94K/P205A/Y259F、A57G/N94K/P205A/Y259F/E261V/Q265I/N277V/I287T、A57G/N94K/P205A/N277V、A57G/N94K/P205C/Y259F、A57G/N94K/P205C/E261S/Q265I、A57G/N153F/P205A/E261L/Q265I、A57G/N153F/P205A/E261S、A57G/N153F/P205C/Y259F/E261L/Q265I/I287T、A57G/N153F/P205C/Y259F/Q265I/N277V、A57G/N153F/P205C/Q265I、A57G/N153F/E261L/Q265I/I287K/G353E、A57G/N153F/E261R/Q265I、A57G/P205A、A57G/P205A/Y259F/E261L/Q265I/N277V/I287K/G353E、A57G/P205A/Y259F/E261L/I287T/G353E、A57G/P205A/Y259F/E261V、A57G/P205A/E261R、A57G/P205C、A57G/P205C/Y259F/Q265I、A57G/P205C/E261L/Q265I/N277V/I287T/G353E、A57G/P205C/E261L/N277V、A57G/P205C/E261S/N277V/G353E、A57G/E261L/Q265I/G353E、N94K/G126C/Q184R/P205A/Y259F/E261L/Q265I、N94K/N153F/Q184R/Y259F/E261S/Q265I、N94K/N153F/P205A/I287K/G353E、N94K/N153F/P205A/G353E、N94K/N153F/P205C/I287K、N94K/N153F/P205C/I287T/G353E、N94K/N153L/Q184R/P205C、N94K/N153L/P205C/Y259F/E261S/Q265I/G353E、N94K/Q184R/P205A/Y259F/E261L/G353E、N94K/Q184R/P205A/Y259F/E261S、N94K/Q184R/P205A/E261V/Q265I/I287T/G353E、N94K/Q184R/P205C/Y259F/E261S/Q265I/I287K、N94K/Q184R/G353E、N94K/P205A、N94K/P205A/Y259F/E261L/Q265I、N94K/P205A/Y259F/E261L/Q265I/N277V/I287K、N94K/P205A/Y259F/E261R/Q265I、N94K/P205A/Y259F/E261V/I287K/G353E、N94K/P205A/N277V、N94K/P205C、N94K/P205C/Y259F/E261S/Q265I、N94K/P205C/Y259F/E261S/Q265I/G353E、N94K/P205C/Y259F/E261V/Q265I/G353E、N94K/P205C/E261L/G353E、N94K/P205C/E261S/Q265I/N277V、N94K/P205C/E261V/Q265I/G353E、N94K/Y259F/E261S/Q265I、N94K/Y259F/E261V/Q265I、N153F/Q184R/P205A/E261L/N277V/I287T、N153F/Q184R/E261S/Q265I/I287T、N153F/P205A、N153F/P205A/E261R/Q265I/I287T、N153F/P205C、N153F/P205C/E261L、N153F/P205C/E261V、N153F/Y259F/E261V/Q265I、N153F/Y259F/Q265I/I287K、N153F/E261L/Q265I、N153F/E261R/Q265I、N153F/E261S/Q265I/I287T/G353E、N153F/Q265I、N153F/Q265I/N277V/I287T/G353E、Q184R/P205A/E261R/Q265I、Q184R/P205A/I287T/G353E、Q184R/P205C、Q184R/P205C/Y259F/E261L/I287K、Q184R/P205C/E261L、Q184R/P205C/E261R/I287K、Q184R/P205C/N277V、Q184R/E261L/Q265I/I287T、H202L、H202M、P205A、P205A/Y259F/E261V/Q265I、P205A/Y259F/Q265I、P205A/E261L、P205A/E261R/Q265I/I287K、P205C、P205C/Y259F/E261L、P205C/Y259F/E261R/Q265I/N277V/I287T/G353E、P205C/Y259F/E261S、P205C/Y259F/E261S/Q265I、P205C/Y259F/E261V/N277V/I287T、P205C/Y259F/Q265I、P205C/E261L/Q265I/V274A、P205C/E261L/N277V、P205C/E261L/G353E、P205C/E261R、P205C/E261R/Q265I/I287K/G353E、P205C/E261S、P205C/E261V/Q265I、P205C/N277V/I287K、P205C/I287K、P205C/I287T、P205S、P205T、S223G、G225F、G225Y、C256L、C256V、Y259F/E261L/Q265I、Y259F/E261V/Q265I、E261R/Q265I/I287K、E261S/Q265I/I287T、Q265I/I287T、I283L和F294I,其中位置参考SEQ ID NO:50编号。
本发明提供了一种工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:306具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,包含选自以下一个或更多个位置处的至少一个取代或一个取代集:197/198/201/259、198/201/259/280、202/205/221/223/225/261、202/205/221/223/261/294、202/221/222/225/256/261/294、202/221/223/225/283/294、205/221/222、205/221/223/225/256/261/283、219、221/222/223/225、221/223、221/223/225、221/223/225/256/261、221/223/225/261、221/223/225/294、221/225、221/225/256、221/225/256/261、221/225/256/261/283/294、223/225/256/261、225/256/261、280和280/306,其中位置参考SEQ IDNO:306编号。在一些另外的实施方案中,工程化多肽包含选自以下的至少一个取代或取代集:197T/198S/201L/259V、198A/201L/259V/280L、202L/205S/221S/223G/225Y/261Y、202L/221H/223G/225F/283M/294I、202M/205S/221H/223G/261Y/294I、202M/205T/221L/223G/225Y/261R、202M/221S/222I/225Y/256L/261R/294I、205S/221S/223G/225F/256L/261T/283M、205T/221H/222I、219L、221H/222I/223G/225Y、221H/223G/225L、221H/225F、221L/223G/225L/256T/261R、221L/225F/256V、221S/223G、221S/223G/225L/256L/261R、221S/223G/225L/261R、221S/223G/225L/294I、221S/225F/256T/261R、221S/225Y/256T/261Y/283M/294I、223G/225L/256V/261R、225F/256T/261T、280D、280E、280I、280V、280V/306F和280W,其中位置参考SEQ ID NO:306编号。在一些实施方案中,工程化多肽包含选自以下的至少一个取代或取代集:V197T/H198S/M201L/Y259V、H198A/M201L/Y259V/Y280L、H202L/A205S/Y221S/S223G/G225Y/V261Y、H202L/Y221H/S223G/G225F/I283M/F294I、H202M/A205S/Y221H/S223G/V261Y/F294I、H202M/A205T/Y221L/S223G/G225Y/V261R、H202M/Y221S/F222I/G225Y/C256L/V261R/F294I、A205S/Y221S/S223G/G225F/C256L/V261T/I283M、A205T/Y221H/F222I、F219L、Y221H/F222I/S223G/G225Y、Y221H/S223G/G225L、Y221H/G225F、Y221L/S223G/G225L/C256T/V261R、Y221L/G225F/C256V、Y221S/S223G、Y221S/S223G/G225L/C256L/V261R、Y221S/S223G/G225L/V261R、Y221S/S223G/G225L/F294I、Y221S/G225F/C256T/V261R、Y221S/G225Y/C256T/V261Y/I283M/F294I、S223G/G225L/C256V/V261R、G225F/C256T/V261T、Y280D、Y280E、Y280I、Y280V、Y280V/S306F和Y280W,其中位置参考SEQ ID NO:306编号。
本发明提供了一种工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:648具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,包含在选自以下的一个或更多个位置的至少一个取代或一个取代集:17/198/259/280、197、197/198、197/198/223/259、197/223/277/280、197/259、197/277、198、198/223、198/223/259/277/280、198/259、198/259/277、198/259/277/280、198/277/280、223/259、223/259/280、258、259、259/268/277/280、259/277、259/280、263、277和280,其中位置参考SEQ ID NO:648编号。在一些另外的实施方案中,工程化多肽包含选自以下的至少一个取代或取代集:17P/198S/259V/280F、17P/198S/259W/280W、197L、197L/198S、197L/198S/223G/259W、197L/223G/277T/280K、197L/259W、197L/277F、198A、198S、198S/223G、198S/223G/259W/277W/280G、198S/259V、198S/259V/277T、198S/259W/277F/280G、198S/259W/277T/280F、198S/277F/280F、198S/277G/280W、198S/277P/280F、223G/259V/280W、223G/259W、258Y、259N/280W、259W、259W/268S/277T/280F、259W/277W、263D、263E、263F、263G、263L、263M、263N、263Q、263R、263V、263W、277W、280D、280F和280W,其中位置参考SEQID NO:648编号。在一些实施方案中,工程化多肽包含选自以下的至少一个取代或取代集:H17P/H198S/Y259V/Y280F、H17P/H198S/Y259W/Y280W、V197L、V197L/H198S、V197L/H198S/S223G/Y259W、V197L/S223G/N277T/Y280K、V197L/Y259W、V197L/N277F、H198A、H198S、H198S/S223G、H198S/S223G/Y259W/N277W/Y280G、H198S/Y259V、H198S/Y259V/N277T、H198S/Y259W/N277F/Y280G、H198S/Y259W/N277T/Y280F、H198S/N277F/Y280F、H198S/N277G/Y280W、H198S/N277P/Y280F、S223G/Y259V/Y280W、S223G/Y259W、W258Y、Y259N/Y280W、Y259W、Y259W/A268S/N277T/Y280F、Y259W/N277W、Y263D、Y263E、Y263F、Y263G、Y263L、Y263M、Y263N、Y263Q、Y263R、Y263V、Y263W、N277W、Y280D、Y280F和Y280W,其中位置参考SEQ ID NO:648编号。
本发明提供了一种工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:708具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,包含选自141、154、197、197/198和278的一个或更多个位置处的至少一个取代或取代集,其中位置参照SEQ ID NO:708编号。在一些另外的实施方案中,工程化多肽包含至少一个选自141D、154G、154H、197A、197P/198A、278E和278V的取代或取代集,其中位置参考SEQ ID NO:708编号。在一些实施方案中,工程化多肽包含至少一个选自T141D、A154G、A154H、V197A、V197P/S198A、P278E和P278V的取代或取代集,其中位置参考SEQ ID NO:708编号。
本发明还提供了编码至少一种在上文段落中描述的工程化多肽的工程化多核苷酸。在一些实施方案中,工程化多核苷酸包括SEQ ID NO:5至SEQ ID NO:801中列出的奇数编号序列。
本发明还提供了载体,所述载体包含至少一种上文描述的工程化多核苷酸。在一些实施方案中,载体还包含至少一种控制序列。
本发明还提供了宿主细胞,所述宿主细胞包含本文提供的载体。在一些实施方案中,宿主细胞产生至少一种本文提供的工程化多肽。
本发明还提供了产生工程化亚胺还原酶多肽的方法,所述方法包括在使得工程化多核苷酸被表达和工程化多肽被产生的条件下培养本文提供的宿主细胞的步骤。在一些实施方案中,方法还包括回收工程化多肽的步骤。
发明描述
除非另外定义,否则本文使用的所有技术和科学术语通常具有与本发明所属领域普通技术人员通常理解的相同的含义。通常,本文使用的命名法和下文描述的细胞培养、分子遗传学、微生物学、有机化学、分析化学和核酸化学中的实验程序是本领域中熟知的并且普遍地采用的那些。这样的技术是熟知的,并且在本领域技术人员熟知的许多教科书和参考著作中进行了描述。对于化学合成和化学分析使用了标准技术或其修改形式。本文(上文和下文两者)提及的所有专利、专利申请、文章和出版物,特此通过引用明确并入本文。
尽管本发明的实践中可使用类似或等同于本文描述的那些的任何合适的方法和材料,但本文描述了一些方法和材料。应理解本发明不限于所描述的特定方法、方案和试剂,因为这些可以根据本领域技术人员使用它们的情况而改变。因此,下文即将定义的术语通过参考本发明作为整体而被更充分地描述。
应理解,上文的一般描述和下文的详细描述仅是示例性的和说明性的,而不是限制本发明。本文使用的章节标题仅用于组织目的,并且不被解释为限制所描述的主题。数值范围包括限定该范围的数字。因此,本文公开的每个数值范围意图包括落在这样的较宽数值范围内的每一较窄数值范围,如同这样的较窄数值范围在本文被全部清楚地写出。还意图本文公开的每个最大的(或最小的)数值限制包含每个较低(或较高)的数值限制,如同此类较低(或较高)数值限制在本文被清楚地写出。
除非上下文另外清楚地指明,否则如在该说明书和所附权利要求书中使用的单数形式“一(a)”、“一(an)”和“所述/该(the)”包括复数的指代对象。因此,例如对“多肽(apolypeptide)”的提及包括多于一个多肽。类似地,“包含/包括(comprise、comprises、comprising)”、“包括/包含(include、includes和including)”是可互换的,而不意图为限制性的。
要理解,当各种实施方案的描述使用术语“包含/包括”时,本领域技术人员将理解,在一些具体情况下,可选地,可以使用语言“基本由...组成”或“由...组成”来描述实施方案。还应理解,在各种实施方案的描述中使用术语“任选的(optional)”或“任选地(optionally)”的情况下,随后描述的事件或情况可能发生或可能不发生,并且该描述包括事件或情况发生的情况和其中它不发生的情况。应理解,上文的一般描述和下文的详细描述两者仅是示例性的和说明性的,而不是限制本公开内容。本文使用的章节标题仅用于组织目的,并且不被解释为限制所描述的主题。
缩写:
用于遗传编码的氨基酸的缩写是常规的并且如下所示:
氨基酸 三字母缩写 单字母缩写
丙氨酸 Ala A
精氨酸 Arg R
天冬酰胺 Asn N
天冬氨酸 Asp D
半胱氨酸 Cys C
谷氨酸 Glu E
谷氨酰胺 Gln Q
甘氨酸 Gly G
组氨酸 His H
异亮氨酸 Ile I
亮氨酸 Leu L
赖氨酸 Lys K
甲硫氨酸 Met M
苯丙氨酸 Phe F
脯氨酸 Pro P
丝氨酸 Ser S
苏氨酸 Thr T
色氨酸 Trp W
酪氨酸 Tyr Y
缬氨酸 Val V
当使用三字母缩写时,除非前面具体地有“L”或“D”,或者从使用缩写的上下文清楚看出,否则氨基酸可以关于α-碳(Cα)是L-构型或D-构型的。例如,“Ala”表示丙氨酸而不指定关于α-碳的构型,而“D-Ala”和“L-Ala”分别表示D-丙氨酸和L-丙氨酸。
当使用单字母缩写时,大写字母表示关于α-碳的L-构型的氨基酸,并且小写字母表示关于α-碳的D-构型的氨基酸。例如,“A”表示L-丙氨酸并且“a”表示D-丙氨酸。当多肽序列以一串单字母或三字母缩写(或其混合)呈现时,根据常规惯例将序列呈现为氨基(N)至羧基(C)方向。
用于遗传编码核苷的缩写是常规的并且如下:腺苷(A);鸟苷(G);胞苷(C);胸苷(T);和尿苷(U)。除非特定地描述,否则缩写的核苷可以是核糖核苷或2’-脱氧核糖核苷。核苷可以基于单独地或基于总体地指定为核糖核苷或2’-脱氧核糖核苷。当核酸序列以单字母缩写串呈现时,序列按照常规惯例呈现为5’至3’方向,并且不示出磷酸。
定义:
参考本发明,本文的描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义,除非另有明确定义。因此,以下术语意在具有以下含义。
“EC”数字是指生物化学和分子生物学国际联合命名委员会(NomenclatureCommittee of the International Union of Biochemistry and Molecular Biology,NC-IUBMB)的酶命名法。该IUBMB生物化学分类是基于酶催化的化学反应的酶数字分类系统。
“ATCC”是指美国典型培养物保藏中心(American Type Culture Collection),其生物保藏收集包括基因和菌株。
“NCBI”是指美国国家生物信息中心(National Center for BiologicalInformation)和在其中提供的序列数据库。
“蛋白”、“多肽”和“肽”在本文中可互换使用,以表示通过酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(例如糖基化、磷酸化、脂化、肉豆蔻酸化、泛素化等)如何。该定义中包括D-氨基酸和L-氨基酸、以及D-氨基酸和L-氨基酸的混合物、以及包含D-氨基酸和L-氨基酸以及D-氨基酸和L-氨基酸的混合物的聚合物。
“氨基酸”通过其通常已知的三字母符号或通过IUPAC-IUB生物化学命名委员会推荐的单字母符号在本文被提及。同样地,核苷酸可以通过其通常可接受的单字母代码被提及。
如本文使用的,“多核苷酸”和“核酸”是指共价连接在一起的两个或更多个核苷。多核苷酸可以完全包含核糖核苷酸(即RNA)、完全包含2’脱氧核糖核苷酸(即DNA)或包含核糖核苷酸和2’脱氧核糖核苷酸的混合物。虽然核苷典型地将经由标准磷酸二酯连接连接在一起,但多核苷酸可以包括一个或更多个非标准连接。多核苷酸可以是单链或双链的,或者可以包括单链区域和双链区域二者。此外,虽然多核苷酸典型地由天然存在的编码核苷碱基(即腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶)组成,它可以包含一种或更多种修饰的和/或合成的核苷碱基,诸如例如肌苷、黄嘌呤、次黄嘌呤等。在一些实施方案中,这样的修饰的或合成的核苷碱基是编码氨基酸序列的核苷碱基。
如本文使用的“冠瘿碱脱氢酶活性”是指其中将2-酮酸(例如丙酮酸)的羰基基团和中性L-氨基酸(例如L-正缬氨酸)的氨基基团转化为仲胺二羧酸化合物(例如N-[1-(R)-(羧基)乙基]-(S)-正缬氨酸)的酶活性。
如本文使用的,“亚胺”是指包含氮-碳双键的有机化合物或官能团,其中氮与氢或有机基团键合。
如本文使用的“亚胺还原酶活性”是指如在方案1中说明的,其中在辅因子NAD(P)H的存在下,酮或醛的羰基基团和伯胺或仲胺的氨基基团(其中羰基基团和氨基基团可以在单独的化合物上或在同一化合物上)被转化为仲胺或叔胺产物化合物的酶活性。
如本文使用的“亚胺还原酶”或“IRED”是指具有亚胺还原酶活性的酶。应理解,亚胺还原酶不限于源自节杆菌属种菌株1C的野生型冠瘿碱脱氢酶(正缬氨酸脱氢酶,冠瘿碱脱氢酶的一种类型)的工程化多肽,而是可包括具有亚胺还原酶活性的其他酶,包括源自其他冠瘿碱脱氢酶的工程化多肽,所述其他冠瘿碱脱氢酶诸如来自大扇贝(Pecten maximus)的章鱼碱脱氢酶(OpDH)、来自乳酸乳球菌(Lactococcus lactis)K1的鸟氨酸合酶(CEOS)、来自斗笠螺(Cellana grata)的β-丙氨奥品脱氢酶(β-alanopine dehydrogenase,BADH)、来自居蟹皮海绵(Suberites domuncula)的牛磺奥品脱氢酶(tauropine dehydrogenase,TauDH)和来自恶臭假单胞菌(Pseudomonas putida)的N-甲基L-氨基酸脱氢酶(NMDH);或源自具有亚胺还原酶活性的野生型酶的工程化酶。如本文使用的亚胺还原酶包括天然存在的(野生型)亚胺还原酶以及通过人类操作产生的非天然存在的工程化多肽。
“编码序列”是指编码蛋白的氨基酸序列的核酸部分(例如基因)。
“天然存在的”或“野生型”是指自然界中发现的形式。例如,天然存在的或野生型多肽或多核苷酸序列是存在于可以从自然界的来源分离的生物体中并且没有被人工操作有意修饰的序列。
如本文使用的,当关于细胞、核酸或多肽使用时,“重组”、“工程化”和“非天然存在的”是指已经以自然中原本不存在的方式修饰的材料或相应于材料的天然(natural)或自然(native)形式的材料。在一些实施方案中,细胞、核酸或多肽与天然存在的细胞、核酸或多肽相同,但由合成材料和/或通过使用重组技术操纵产生或衍生。非限制性实例包括,除其他以外,表达自然(非重组)形式的细胞中未发现的基因或表达原本以不同水平表达的自然基因的重组细胞。
“序列同一性百分比”和“同源性百分比”在本文中可互换使用,以指多核苷酸或多肽之间的比较,并且通过在比较窗上比较两个最佳对齐(aligned)的序列来确定,其中与用于两个序列的最佳对齐的参考序列相比,比较窗中的多核苷酸或多肽序列的部分可以包括添加或缺失(即,空位)。百分比可以通过如下计算:确定两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性百分比。可选地,百分比可以通过如下计算:确定两个序列中出现相同的核酸碱基或氨基酸残基或者核酸碱基或氨基酸残基与空位对齐的位置的数目以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数目,并将结果乘以100以得到序列同一性的百分比。本领域技术人员理解,存在许多可用于比对两个序列的已建立的算法。用于比较的序列的最佳比对可以例如通过Smith和Waterman的局部同源性算法(Smith和Waterman,Adv.Appl.Math.,2:482[1981])、通过Needleman和Wunsch的同源性比对算法(Needleman和Wunsch,J.Mol.Biol.,48:443[1970])、通过Pearson和Lipman的搜索相似性方法(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444[1988])、通过这些算法的计算机化执行(例如GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA)、或通过如本领域已知的目视检查进行。适合于确定序列同一性和序列相似性百分比的算法的实例包括但不限于BLAST和BLAST 2.0算法,其由Altschul等人(分别参见,Altschul等人,J.Mol.Biol.,215:403-410[1990];和Altschul等人,Nucl.Acids Res.,3389-3402[1977])描述。公众可通过美国国家生物技术信息中心网站获得用于进行BLAST分析的软件。该算法包括首先通过鉴定查询序列中长度W的短字来鉴定高评分序列对(HSP),所述短字在与数据库序列中相同长度的字比对时匹配或满足某一正值的阀值评分T。T被称为相邻字评分阈值(neighborhood word score threshold)(Altschul等人,同上)。这些最初的邻近字击中(word hit)充当启动搜索的种子以找到包含它们的更长HSP。然后字击中沿着每个序列的两个方向延伸直到累积比对评分不能增加的程度。对于核苷酸序列,累积评分使用参数M(用于匹配残基对的奖励评分;总是>0)和N(用于错配残基的惩罚评分;总是<0)计算。对于氨基酸序列,评分矩阵用于计算累积评分。在以下情况时,停止字击中在每一个方向的延伸:累积比对评分从其最大达到值下降了量X;由于累积了一个或更多个负评分残基比对,累积评分达到0或小于0;或到达任一序列末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用以下作为默认值:字长(W)为11、期望值(E)为10、M=5、N=-4、以及两条链的比较。对于氨基酸序列,BLASTP程序使用以下作为默认值:字长(W)为3,期望值(E)为10和BLOSUM62评分矩阵(参见,Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915[1989])。序列比对与%序列同一性的示例性确定可以使用GCG Wisconsin软件包(Accelrys、Madison WI)中的BESTFIT或GAP程序,使用提供的默认参数。
“参考序列”是指用作序列比较的基础的指定序列。参考序列可以是更大序列的子集,例如,全长基因或多肽序列的区段(segment)。通常,参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度,或核酸或多肽的全长。由于两个多核苷酸或多肽可以各自(1)包含两个序列之间相似的序列(即完整序列的一部分),和(2)还可以包含两个序列之间不同的序列,因此两个(或更多个)多核苷酸或多肽之间的序列比较典型地通过比较两个多核苷酸或多肽在“比较窗”上的序列来鉴定和比较序列相似性的局部区域来进行。在一些实施方案中,“参考序列”可以基于一级氨基酸序列(primaryamino acid sequence),其中参考序列是可以在一级序列中具有一个或更多个变化的序列。例如,“基于SEQ ID NO:4的在对应于X14的残基处具有缬氨酸的参考序列”或X14V是指其中在SEQ ID NO:4中X14处的对应残基(酪氨酸)已经改变为缬氨酸的参考序列。
“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念区段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列比较,并且其中与用于两个序列的最佳对齐的参考序列(其不包含添加或缺失)相比,比较窗中的序列的部分可以包含20%或更少的添加或缺失(即,空位)。比较窗可以比20个连续残基更长,并任选地包括30、40、50、100或更长的窗。
如本文使用的,“大体同一性(substantial identity)”是指在至少20个残基位置的比较窗中、通常在至少30-50个残基的窗中,与参考序列相比,具有至少80%序列同一性、至少85%同一性、至少89%至95%之间的序列同一性,或更通常至少99%序列同一性的多核苷酸或多肽序列,其中序列同一性百分比通过在比较窗中比较参考序列和包含总计为参考序列的20%或更少的缺失或添加的序列来计算。在应用于多肽的一些具体实施方案中,术语“大体同一性”意指当诸如通过程序GAP或BESTFIT使用默认空位权重进行最佳比对时,两个多肽序列共有至少80%的序列同一性,优选地至少89%的序列同一性、至少95%的序列同一性或更多(例如99%的序列同一性)。在一些实施方案中,在被比较的序列中不相同的残基位置因保守氨基酸取代而有差异。
当在给定氨基酸或多核苷酸序列的编号的上下文中使用时,“对应于”、“参考(reference to)”和“相对于”是指,当将给定氨基酸或多核苷酸序列与指定参考序列相比时,该参考序列的残基的编号。换言之,给定聚合物的残基编号或残基位置关于参考序列被指定,而不是通过给定氨基酸或多核苷酸序列内残基的实际数字位置被指定。例如,可以通过引入空位以优化两个序列之间的残基匹配来比对给定氨基酸序列诸如工程化亚胺还原酶的氨基酸序列与参考序列。在这些情况中,尽管存在空位,对给定氨基酸或多核苷酸序列中的残基关于与其比对的参考序列进行编号。
“氨基酸差异”或“残基差异”是指多肽序列的一个位置的氨基酸残基相对于参考序列中的相应位置的氨基酸残基的变化。本文中氨基酸差异的位置通常被称为“Xn”,其中n是指残基差异所基于的参考序列中的对应位置。例如,“与SEQ ID NO:2相比在位置X25处的残基差异”是指在对应于SEQ ID NO:2的位置25的多肽位置处的氨基酸残基的变化。因此,如果参考多肽SEQ ID NO:2在位置25处具有缬氨酸,则“与SEQ ID NO:2相比在位置X25处的残基差异”是指在对应于SEQ ID NO:2的位置25的多肽的位置处除了缬氨酸以外的任何残基的氨基酸取代。在本文的大多数实例中,在一个位置处的具体氨基酸残基差异指示为“XnY”,其中“Xn”指定如上文描述的对应位置,并且“Y”是在工程化多肽中发现的氨基酸(即,与参考多肽中不同的残基)的单字母标识符。在一些实施方案中,多于一种氨基酸可以出现在指定的残基位置(即,替代氨基酸可以以XnY/Z的形式列出,其中Y和Z表示替代的氨基酸残基)。在一些情况下(例如,在表5.1、表6.1、表7.1、表8.1、表9.1和表10.1中),本发明还提供由常规符号“AnB”表示的特定氨基酸差异,其中A是参考序列中的残基的单字母标识符,“n”是在参考序列中的残基位置的数字,并且B是工程化多肽的序列中残基取代的单字母标识符。此外,在一些情况下,本发明的多肽可以包括相对于参考序列的一个或更多个氨基酸残基差异,其由相对于参考序列进行改变的指定位置的列表指示。在一些另外的实施方案中,本发明提供了包含保守氨基酸取代和非保守氨基酸取代两者的工程化多肽序列。
如本文使用的,“保守氨基酸取代”是指用具有相似侧链的不同残基取代残基,并且因此通常包括用相同或相似的氨基酸定义类别中的氨基酸取代多肽中的氨基酸。例如但不限于,具有脂肪族侧链的氨基酸被另一种脂肪族氨基酸(例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代;具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如,丝氨酸和苏氨酸)取代;具有芳族侧链的氨基酸被另一种具有芳族侧链的氨基酸(例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代;具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如,赖氨酸和精氨酸)取代;具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如,天冬氨酸或谷氨酸)取代;和/或疏水氨基酸或亲水氨基酸分别被另一种疏水氨基酸或亲水氨基酸取代。示例性保守取代在下表1中提供。
Figure BDA0003448136950000271
“非保守取代”是指用具有显著不同的侧链特性的氨基酸取代多肽中的氨基酸。非保守取代可以使用定义的组之间而非定义的组之内的氨基酸,并且影响(a)取代区域中肽骨架的结构(例如,用脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链的体积。例如但不限于,示例性非保守取代可以是用碱性或脂肪族氨基酸取代酸性氨基酸;用小氨基酸取代芳族氨基酸;和用疏水氨基酸取代亲水氨基酸。
“缺失”是指通过从参考多肽去除一个或更多个氨基酸的多肽修饰。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或者20个或更多个氨基酸、多达组成参考酶的氨基酸总数的10%、或多达氨基酸总数的20%,同时保留酶活性和/或保留工程化亚胺还原酶的改进的性质。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包括连续的区段或可以是不连续的。
“插入”是指通过向参考多肽添加一个或更多个氨基酸的多肽修饰。在一些实施方案中,改进的工程化亚胺还原酶包括将一个或更多个氨基酸插入到具有亚胺还原酶活性的天然存在的多肽中,以及将一个或更多个氨基酸插入到其他改进的亚胺还原酶多肽中。插入可以处于多肽的内部部分或者是向羧基或氨基末端的插入。如本文使用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段,或被天然存在的多肽中的一个或更多个氨基酸分开。
如本文使用的“片段”是指具有氨基末端和/或羧基末端缺失但其余氨基酸序列与序列中相应位置相同的多肽。片段可以是至少14个氨基酸长、至少20个氨基酸长、至少50个氨基酸长或更长、以及多达全长亚胺还原酶多肽例如SEQ ID NO:2的多肽或在SEQ ID NO:6至SEQ ID NO:802的偶数编号序列中提供的工程化亚胺还原酶的70%、80%、90%、95%、98%和99%。
“分离的多肽”是指如下多肽:所述多肽与其天然伴随的其他污染物例如蛋白、脂质和多核苷酸基本上分开。该术语包括已经从其天然存在的环境或表达系统(例如,宿主细胞或体外合成)中取出或纯化的多肽。工程化亚胺还原酶可以存在于细胞内、存在于细胞培养基中,或以各种形式制备,诸如裂解物或分离的制品。因此,在一些实施方案中,工程化亚胺还原酶可以是分离的多肽。
“基本上纯的多肽”是指其中多肽种类是存在的优势种类的组合物(即,在摩尔或重量基础上,它比在该组合物中的任何其他单独的大分子种类更丰富),并且当目标种类构成存在的大分子种类的按摩尔或%重量计的至少约50%时,通常为基本上纯的组合物。通常,基本上纯的亚胺还原酶组合物将包含组合物中存在的所有大分子种类的按摩尔或%重量计的约60%或更多、约70%或更多、约80%或更多、约90%或更多、约95%或更多和约98%或更多。在一些实施方案中,将目标物质纯化至基本同质(即,通过常规检测方法不能在组合物中检测出污染物物质),其中该组合物基本上由单一大分子物质组成。溶剂物质、小分子(<500道尔顿)和元素离子物质不被认为是大分子物质。在一些实施方案中,分离的工程化亚胺还原酶多肽是基本上纯的多肽组合物。
“立体选择性”是指在化学或酶促反应中一种立体异构体相对于另一种立体异构体的优先形成。立体选择性可以是部分的,此时一种立体异构体的形成优于另一种立体异构体,或者立体选择性可以是完全的,此时只形成一种立体异构体。当立体异构体是对映异构体时,立体选择性被称为对映选择性,即两者的总和中一种对映异构体的分数(通常被报告为百分比)。可选地,本领域通常将其报告为根据下式从中计算的对映异构体过量(e.e.)(通常为百分比):[主要对映异构体-次要对映异构体]/[主要对映异构体+次要对映异构体]。当立体异构体是非对映异构体时,立体选择性被称为非对映选择性,即两种非对映异构体的混合物中一种非对映异构体的分数(通常报道为百分比),通常可选地报告为非对映异构体过量(d.e.)。对映异构体过量和非对映异构体过量是立体异构体过量的类型。
“高度立体选择性”是指能够以至少约85%立体异构体过量将一种或更多种底物(例如底物化合物(2)和(3))转化为相应的胺产物(例如化合物(1))的化学反应或酶促反应。
如本文使用的,“改进的酶性质”是指酶的至少一种改进的性质。在一些实施方案中,本发明提供了工程化亚胺还原酶多肽,其与参考亚胺还原酶多肽和/或野生型亚胺还原酶多肽和/或另一种工程化亚胺还原酶多肽相比呈现出任何酶性质的改进。对于本文描述的工程化亚胺还原酶多肽,比较通常针对亚胺还原酶由其衍生的野生型酶进行,尽管在一些实施方案中,参考酶可以是另一种改进的工程化亚胺还原酶。因此,“改进”的水平可以在各种亚胺还原酶多肽(包括野生型)以及工程化亚胺还原酶之间确定和比较。改进的性质包括但不限于诸如以下的性质:酶活性(其可以用底物转化的百分比表示)、热稳定性、溶剂稳定性、pH活性谱、辅因子需求、对抑制剂的耐性(refractoriness)(例如底物或产物抑制)、立体专一性和立体选择性(包括对映选择性)。
“增加的酶活性”是指工程化亚胺还原酶多肽的改进性质,其可以通过与参考亚胺还原酶相比,比活性(例如,产生的产物/时间/重量蛋白)的增加或将底物转化为产物的百分比(例如使用指定量的亚胺还原酶,在指定时间段内将起始量的底物转化为产物的转化百分比)的增加来表示。在实施例中提供了确定酶活性的示例性方法。可以影响与酶活性相关的任何性质,包括经典酶性质Km、Vmax或kcat,它们的改变可以导致增加的酶活性。酶活性的改进可以从相应的野生型酶的约1.2倍的酶活性至亚胺还原酶多肽由其衍生的天然存在的或另一种工程化亚胺还原酶活性的多达2倍、5倍、10倍、20倍、25倍、50倍或更多。亚胺还原酶活性可以通过任何一种标准测定来测量,诸如通过监测底物、辅因子或产物的性质的变化。在一些实施方案中,产生的产物的量可以通过液相色谱-质谱(LC-MS)测量。酶活性的比较使用指定的酶制品、在设定条件下的指定的测定和一种或更多种指定的底物进行,如本文进一步详细描述的。通常,当比较裂解物时,确定细胞的数目和测定的蛋白的量,并且使用相同的表达系统和相同的宿主细胞以使由宿主细胞产生并存在于裂解物中的酶的量的变化最小化。
“转化”是指将底物酶促转化为相应的产物。“转化百分比”是指在指定条件下在一定时间段内被转化为产物的底物的百分比。因此,亚胺还原酶多肽的“酶活性”或“活性”可以表示为底物向产物的“转化百分比”。
“热稳定”是指与暴露于高温(例如,40℃-80℃)的野生型酶相比,在暴露于相同的高温持续一定时间段(例如,0.5小时-24小时)后,保持相似活性(例如超过60%至80%)的亚胺还原酶多肽。
“溶剂稳定”是指与暴露于不同浓度(例如,5%-99%)的溶剂(乙醇、异丙醇、二甲基亚砜(DMSO)、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯,乙酸丁酯、甲基叔丁基醚等)的野生型酶相比,在暴露于相同浓度的相同溶剂持续一定时间段(例如,0.5小时-24小时)后,保持相似活性(超过例如60%至80%)的亚胺还原酶多肽。
“热稳定且溶剂稳定”是指既热稳定也溶剂稳定的亚胺还原酶多肽。
术语“严格杂交条件”在本文中用于指在该条件下核酸杂交体是稳定的条件。如本领域技术人员已知的,杂交体的稳定性反映在杂交体的解链温度(Tm)中。通常,杂交体的稳定性是离子强度、温度、G/C含量和离液剂的存在的函数。多核苷酸的Tm值可以使用用于预测解链温度的已知方法来计算(参见例如,Baldino等人,Meth.Enzymol.,168:761-777[1989];Bolton等人,Proc.Natl.Acad.Sci.USA 48:1390[1962];Bresslauer等人,Proc.Natl.Acad.Sci.USA 83:8893-8897[1986];Freier等人,Proc.Natl.Acad.Sci.USA83:9373-9377[1986];Kierzek等人,Biochem.,25:7840-7846[1986];Rychlik等人,1990,Nucl.Acids Res.,18:6409-6412[1990](勘误,Nucl.Acids Res.,19:698[1991]);Sambrook等人,同上);Suggs等人,1981,于Developmental Biology Using Purified Genes,Brown等人.[Eds.],第683-693页,Academic Press,Cambridge,MA[1981];和Wetmur,Crit.Rev.Biochem.Mol.Biol.,26:227-259[1991])。在一些实施方案中,多核苷酸编码本文公开的多肽,并且在限定的条件下,诸如中度严格或高度严格的条件下,与编码本发明的工程化亚胺还原酶的序列的互补序列杂交。
“杂交严格度”是指在核酸杂交中的杂交条件,诸如洗涤条件。通常,杂交反应在较低严格性的条件下进行,随后是不同的但较高严格性的洗涤。术语“中度严格杂交”是指允许靶DNA结合以下互补核酸的条件,所述互补核酸与靶DNA具有约60%同一性,优选地约75%同一性,约85%同一性,与靶多核苷酸具有大于约90%同一性。示例性中度严格性条件是等同于在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中在42℃杂交,随后在0.2×SSPE、0.2%SDS中在42℃洗涤的条件。“高严格性杂交”通常是指与如对限定的多核苷酸序列在溶液条件下确定的热解链温度Tm相差约10℃或更小的条件。在一些实施方案中,高严格度条件是指仅允许在0.018M NaCl中在65℃形成稳定杂交体的那些核酸序列的杂交(即,如果杂交体在0.018M NaCl中在65℃是不稳定的,它在如本文考虑的高严格度条件下是不稳定的)的条件。可以例如通过在等同于在42℃、50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS的条件中杂交,然后在65℃在0.1×SSPE和0.1%SDS中洗涤来提供高严格度条件。另一个高严格度条件是在等同于在65℃、在含有0.1%(w:v)SDS的5X SSC中杂交,并且在65℃在含有0.1%SDS的0.1×SSC中洗涤的条件中洗涤。其他高严格度杂交条件以及中等严格条件在上文引用的参考文献中被描述。
“异源”多核苷酸是指通过实验室技术被引入宿主细胞的任何多核苷酸,并且包括从宿主细胞中取出、经历实验室操作并且然后重新引入宿主细胞的多核苷酸。
“密码子优化”是指编码蛋白的多核苷酸的密码子改变为在特定生物体中优先使用的那些密码子,使得编码的蛋白在感兴趣的生物体中有效地表达。尽管遗传密码是简并的,即大多数氨基酸由被称为“同义”(“synonyms”)或“同义”(“synonymous”)密码子的若干密码子表示,但熟知的是,特定生物体的密码子使用是非随机的和对于特定的密码子三联体是有偏倚的。就给定基因、具有共同功能或祖先起源的基因、高表达的蛋白对比低拷贝数蛋白和生物体的基因组的聚集蛋白编码区而言,这种密码子使用偏倚可能更高。在一些实施方案中,编码亚胺还原酶的多核苷酸可以被密码子优化用于从选择用于表达的宿主生物体的最佳生产。
如本文使用的,“优选的、最佳的、高密码子使用偏好密码子”可互换地是指在蛋白编码区中的使用频率高于编码相同氨基酸的其他密码子的密码子。优选的密码子可以根据单个基因、共同功能或起源的一组基因、高表达基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子频率、相关生物体的聚集蛋白编码区中的密码子频率,或它们的组合来确定。其频率随着基因表达的水平而增加的密码子通常是用于表达的最佳密码子。用于确定特定生物体中密码子的频率(例如密码子使用、相对同义密码子使用)和密码子偏好的多种方法是已知的,包括多变量分析,例如使用聚类分析或相关性分析和基因中使用的密码子的有效数目(参见例如,GCG CodonPreference,Genetics Computer Group WisconsinPackage;CodonW,Peden,University of Nottingham;McInerney,Bioinform.,14:372-73[1998];Stenico等人,Nucl.Acids Res.,222437-46[1994];Wright,Gene 87:23-29[1990])。对于许多不同的生物体,密码子使用表是可获得的(参见例如,Wada等人,Nucl.Acids Res.,20:2111-2118[1992];Nakamura等人,Nucl.Acids Res.,28:292[2000];Duret,等人,同上;Henaut和Danchin,于Escherichia coli and Salmonella,Neidhardt,等人(编著),ASM Press,Washington D.C.,第2047-2066页[1996])。用于获得密码子使用的数据源可以依赖于能够编码蛋白的任何可获得的核苷酸序列。这些数据集包括实际已知编码表达蛋白(例如完整的蛋白编码序列-CDS)、表达序列标签(ESTS)或基因组序列的预测编码区域的核酸序列(参见例如Mount,Bioinformatics:Sequence and Genome Analysis,第8章,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.[2001];Uberbacher,Meth.Enzymol.,266:259-281[1996];和Tiwari等人,Comput.Appl.Biosci.,13:263-270[1997])。
“控制序列”在本文中被定义为包括对本发明的多核苷酸和/或多肽的表达是必需或有利的所有组分。每一个控制序列对于编码多肽的核酸序列可以是天然的或外来的。这样的控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最低程度而言,控制序列包括启动子以及转录和翻译终止信号。出于引入特定限制性位点的目的,控制序列可以与接头一起提供,所述特定限制性位点促进控制序列与编码多肽的核酸序列的编码区的连接。
“可操作地连接的”在本文被定义为如下配置:在所述配置中控制序列被适当地放置(即,以功能关系)在相对于感兴趣的多核苷酸的位置处,使得控制序列指导或调节感兴趣的多核苷酸和/或多肽的表达。
“启动子序列”是指被宿主细胞识别用于感兴趣的多核苷酸诸如编码序列的表达的核酸序列。启动子序列包含介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的任何核酸序列,包括突变体、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
“合适的反应条件”是指生物催化反应溶液中的那些条件(例如酶载量、底物载量、辅因子载量、温度、pH、缓冲剂、共溶剂等的范围),在此条件下,本发明的亚胺还原酶多肽能够将底物化合物转化为产物化合物(例如,将化合物(2)转化为化合物(1))。在本发明中提供并通过实施例说明了示例性的“合适的反应条件”。
“辅因子再生系统”或“辅因子循环系统”是指参与还原辅因子的氧化形式的反应(例如,NADP+至NADPH)的一组反应物。被亚胺还原酶催化的酮底物的还原胺化反应氧化的辅因子通过辅因子再生系统以还原形式再生。辅因子再生系统包括化学计量还原剂,所述化学计量还原剂是还原性氢等同物的来源,并且能够将辅因子的氧化形式还原。辅因子再生系统还可以包含催化剂,例如催化由还原剂还原辅因子的氧化形式的酶催化剂。分别由NAD+或NADP+再生NADH或NADPH的辅因子再生系统是本领域已知的,并且可以用于本文描述的方法中。
“磷酸脱氢酶”和“PDH”在本文中可互换使用,以分别指催化亚磷酸酯(phosphite)和NAD+或NADP+转化为二氧化碳和NADH或NADPH的NAD+或NADP+依赖性酶。
“载量”(诸如在“化合物载量”或“酶载量”或“辅因子载量”中)是指在反应开始时反应混合物中组分的浓度或量。
在生物催化剂介导的过程的上下文中,“底物”是指生物催化剂所作用的化合物或分子。例如,在本文公开的还原胺化方法中使用的亚胺还原酶生物催化剂中,存在式(II)的酮(或醛)底物诸如环己酮,和式(III)的胺底物诸如丁胺。
在生物催化剂介导的过程的上下文中,“产物”是指由生物催化剂的作用所产生的化合物或分子。例如,在本文公开的方法中使用的亚胺还原酶生物催化剂的示例性产物是仲胺或叔胺化合物,诸如式(I)的化合物。
“烷基”是指具有从1个至18个碳原子(包括端点)的,直链的或支链的,更优选地1个至8个碳原子(包括端点),并且最优选地1个至6个碳原子(包括端点)的饱和烃基团。具有指定数目的碳原子的烷基在括号中表示(例如(C1-C6)烷基是指1个至6个碳原子的烷基)。
“烯基”是指具有从2个至12个碳原子(包括端点)的、直链或支链的、含有至少一个双键但任选地含有多于一个双键的烃基团。
“炔基”是指具有从2个至12个碳原子(包括端点)的、直链或支链的、含有至少一个三键但任选地含有多于一个三键,并且另外任选地含有一个或更多个双键键合部分的烃基团。
“亚烷基”是指具有从1个至18个碳原子(包括端点),更优选地1个至8个碳原子(包括端点),并且最优选地1个至6个碳原子(包括端点)的,任选地被一个或更多个合适的取代基取代的直链或支链的二价烃基团。示例性的“亚烷基”包括但不限于亚甲基、亚乙基、亚丙基、亚丁基等。
“亚烯基”是指具有2个至12个碳原子(包括端点)和一个或更多个碳-碳双键,更优选地2个至8个碳原子(包括端点),并且最优选地2个至6个碳原子(包括端点)的,任选地被一个或更多个合适的取代基取代的直链或支链的二价烃基团。
“杂烷基”、“杂烯基”和“杂炔基”分别是指其中一个或更多个碳原子各自独立地被相同或不同的杂原子或杂原子基团替代的如本文定义的烷基、烯基和炔基。可以替代碳原子的杂原子和/或杂原子基团包括但不限于-O-、-S-、-S-O-、-NRγ-、-PH-、-S(O)-、-S(O)2-、-S(O)NRγ-、-S(O)2NRγ-等,包括其组合,其中每个Rγ独立地选自氢、烷基、环烷基、杂环烃基、芳基和杂芳基。
“芳基”是指具有单环(例如苯基)或多个稠环(例如萘基或蒽基)的具有6个至12个碳原子(包括端点)的不饱和的芳香族碳环基团。示例性的芳基包括苯基、吡啶基、萘基等。
“芳基烷基”是指被芳基取代的烷基(即“芳基-烷基-”基团),优选地在烷基部分中具有1个至6个碳原子(包括端点)且在芳基部分中具有6个至12个碳原子(包括端点)。这样的芳基烷基基团由苄基、苯乙基等例示。
“芳氧基”是指–ORλ基团,其中Rλ是可以任选地被取代的芳基基团。
“环烷基”是指具有3个至12个碳原子(包括端点)的、具有单个环状环或多个稠环的环状烷基基团,其可以任选地被1个至3个烷基基团取代。示例性的环烷基基团包括但不限于单环结构和多环结构,所述单环结构诸如环丙基、环丁基、环戊基、环辛基、1-甲基环丙基、2-甲基环戊基、2-甲基环辛基等,所述多环结构包括桥接的环体系诸如金刚烷基等。
“环烷基烷基”是指被环烷基取代的烷基(即“环烷基-烷基-”基团),优选地在烷基部分中具有1个至6个碳原子(包括端点)并且在环烷基部分中具有3个至12个碳原子(包括端点)。这样的环烷基烷基基团由环丙基甲基、环己基乙基等例示。
“氨基”是指基团-NH2。被取代的氨基是指基团–NHRε、NRεRε和NRεRεRε,其中每个Rε独立地选自被取代的或未被取代的烷基、环烷基、环杂烷基、烷氧基、芳基、杂芳基、杂芳基烷基、酰基、烷氧基羰基、氢硫基、亚磺酰基、磺酰基等。典型的氨基基团包括但不限于二甲基氨基、二乙基氨基、三甲基铵、三乙基铵、甲基磺酰基氨基、呋喃基-氧基-磺氨基等。
“氨基烷基”是指其中一个或更多个氢原子被一个或更多个氨基基团(包括被取代的氨基基团)替代的烷基基团。
“氨基羰基”是指-C(O)NH2。被取代的氨基羰基是指–C(O)NRεRε,其中氨基基团NRεRε如本文定义。
“氧基”是指二价基团-O-,其可以具有各种取代基以形成不同的氧基基团,包括醚和酯。
“烷氧基”或“烷基氧基”在本文中可互换使用以是指基团–ORδ,其中Rδ是烷基基团,包括任选地被取代的烷基基团。
“羧基”是指-COOH。
“羰基”是指-C(O)-,其可以具有多种取代基以形成不同的羰基基团,包括酸、酸性卤化物、醛、酰胺、酯和酮。
“羧基烷基”是指其中一个或更多个氢原子被一个或更多个羧基基团替代的烷基。
“氨基羰基烷基”是指被如本文定义的氨基羰基基团取代的烷基。
“卤素(halogen)”或“卤代(halo)”是指氟、氯、溴和碘。
“卤代烷基”是指其中一个或更多个氢原子被卤素替代的烷基基团。因此,术语“卤代烷基”意指包括单卤代烷基、二卤代烷基、三卤代烷基等直到全卤代烷基。例如,表述“(C1-C2)卤代烷基”包括1-氟甲基、二氟甲基、三氟甲基、1-氟乙基、1,1-二氟乙基、1,2-二氟乙基、1,1,1-三氟乙基、全氟乙基等。
“羟基”是指-OH。
“羟基烷基”是指其中一个或更多个氢原子被一个或更多个羟基基团替代的烷基基团。
“硫氢基(thiol)”或“氢硫基(sulfanyl)”是指-SH。被取代的硫氢基或氢硫基是指–S-Rε,其中Rε是烷基、芳基或其他合适的取代基。
“烷硫基”是指–SRδ,其中Rδ是可以任选地被取代的烷基。典型的烷硫基基团包括但不限于甲硫基、乙硫基、正丙硫基等。
“烷硫基烷基(alkylthioalkyl)”是指被烷硫基基团–SRδ取代的烷基,其中Rδ是可以任选地被取代的烷基。
“磺酰基”是指-SO2-。被取代的磺酰基是指–SO2-Rε,其中Rε是烷基、芳基或其他合适的取代基。
“烷基磺酰基”是指–SO2-Rδ,其中Rδ是可以任选地被取代的烷基。典型的烷基磺酰基基团包括但不限于甲基磺酰基、乙基磺酰基、正丙基磺酰基等。
“烷基磺酰基烷基”是指被烷基磺酰基基团–SO2-Rδ取代的烷基,其中Rδ是可以任选地被取代的烷基。
“杂芳基”是指具有1个至10个碳原子(包括端点)和在环内的选自氧、氮和硫的1个至4个杂原子(包括端点)的芳香族杂环基团。这样的杂芳基基团可以具有单环(例如吡啶基或呋喃基)或多于一个稠环(例如吲嗪基(indolizinyl)或苯并噻吩基)。
“杂芳基烷基”是指被杂芳基取代的烷基(即“杂芳基-烷基-”基团),优选地在烷基部分中具有1个至6个碳原子(包括端点)并且在杂芳基部分中具有5个至12个环原子(包括端点)。这样的杂芳基烷基基团通过吡啶基甲基等例示。
“杂环”、“杂环的”和可互换的“杂环烃基(heterocycloalkyl)”是指具有单环或多个稠环的、具有2个至10个碳环原子(包括端点)和在环内的选自氮、硫或氧的1个至4个杂环原子(包括端点)的饱和的或不饱和的基团。这样的杂环基团可以具有单环(例如哌啶基或四氢呋喃基)或多于一个稠环(例如,二氢吲哚基、二氢苯并呋喃或奎宁环基(quinuclidinyl))。杂环的实例包括但不限于呋喃、噻吩、噻唑、噁唑、吡咯、咪唑、吡唑、吡啶、吡嗪、嘧啶、哒嗪、吲嗪、异吲哚、吲哚、吲唑、嘌呤、喹嗪(quinolizine)、异喹啉、喹啉、酞嗪(phthalazine)、萘基吡啶、喹喔啉、喹唑啉、噌啉、蝶啶、咔唑(carbazole)、咔啉(carboline)、菲啶(phenanthridine)、吖啶、菲咯啉(phenanthroline)、异噻唑、吩嗪(phenazine)、异噁唑、吩噁嗪(phenoxazine)、吩噻嗪(phenothiazine)、咪唑烷、咪唑啉(imidazoline)、哌啶、哌嗪、吡咯烷、吲哚啉等。
“杂环烃基烷基”是指被杂环烃基取代的烷基(即“杂环烃基-烷基-”基团),优选地在烷基部分中具有1个至6个碳原子(包括端点),并且在杂环烃基部分中具有3个至12个环原子(包括端点)。
“元环(membered ring)”意图包括任何环状结构。术语“元”之前的数字表示构成环的骨架原子的数目。因此,例如环己基、吡啶、吡喃和噻喃是6元环,并且环戊基、吡咯、呋喃和噻吩是5元环。
如本文使用的“稠合双环(Fused bicyclic ring)”是指在每个环中具有5个至8个原子的未被取代的和被取代的碳环和/或杂环的环部分,所述环具有2个共用原子。
在本文中关于上述化学基团使用的“任选地被取代的”意指由氢占据的化学基团的位置可以被另一个原子(除非另外说明)或化学基团取代,所述另一个原子例如但不限于碳、氧、氮或硫,所述化学基团例如但不限于羟基、氧代、硝基、甲氧基、乙氧基、烷氧基、被取代的烷氧基、三氟甲氧基、卤代烷氧基、氟、氯、溴、碘、卤素、甲基、乙基、丙基、丁基、烷基、烯基、炔基、被取代的烷基、三氟甲基、卤代烷基、羟基烷基、烷氧基烷基、硫代、烷硫基、酰基、羧基、烷氧基羰基、甲酰氨基(carboxamido)、被取代的甲酰氨基、烷基磺酰基、烷基亚磺酰基、烷基磺酰基氨基、磺酰氨基、被取代的磺酰氨基、氰基、氨基、被取代的氨基、烷基氨基、二烷基氨基、氨基烷基、酰基氨基、脒基、脒肟基(amidoximo)、羟基肟基(hydroxamoyl)、苯基、芳基、被取代的芳基、芳氧基、芳基烷基、芳基烯基、芳基炔基、吡啶基、咪唑基、杂芳基、被取代的杂芳基、杂芳氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、被取代的环烷基、环烷基氧基、吡咯烷基、哌啶基、吗啉代、杂环基、(杂环)氧基和(杂环)烷基;其中优选的杂原子是氧、氮和硫。另外,在这些取代化学基团上存在开放化合价的情况下,它们可以进一步被烷基、环烷基、芳基、杂芳基和/或杂环基团取代,在这些开放化合价存在于碳上的情况下,它们可以进一步被卤素和被氧-、氮-、或硫-键合的取代基取代,并且在存在多于一个这样的开放化合价的情况下,这些基团可以通过直接形成键或通过与新的杂原子(优选地氧、氮或硫)形成键而连接以形成环。还设想,可以进行上文的取代,条件是用取代基替代氢不会对本发明的分子带来不可接受的不稳定性,并且以其他方式在化学上是合理的。本领域普通技术人员将理解,对于被描述为任选地被取代的任何化学基团,仅意图包括空间上可实现的和/或合成上可行的化学基团。如本文使用的“任选地被取代的”是指术语或一系列化学基团中的所有后续修饰对象(modifier)。例如,在术语“任选地被取代的芳基烷基”中,分子的“烷基”部分和“芳基”部分可以被取代或可以不被取代,并且对于一系列“任选地被取代的烷基、环烷基、芳基和杂芳基”,烷基、环烷基、芳基和杂芳基基团彼此独立地可以被取代或可以不被取代。
亚胺向仲胺的转化
本发明提供了用于通过含羰基和胺的底物的直接还原胺化来合成手性仲胺的新型生物催化剂和相关方法。本公开内容的生物催化剂是来自节杆菌属种(Arthrobactersp)菌株1C的野生型基因的工程化多肽变体,其编码具有SEQ ID NO:2的氨基酸序列的亚胺还原酶。野生型亚胺还原酶的变体(SEQ ID NO:4)与SEQ ID NO:2相比含有以下残基差异:N198H(美国专利第9,487,760号、第9,695,451号),被用作蛋白工程化的起点。这些工程化多肽能够催化羰基化合物和胺转化为仲胺。IRED的一般亚胺还原酶活性如下文的方案1所示。
方案1
Figure BDA0003448136950000391
本发明的具有亚胺还原酶活性的工程化多肽可以接受一系列的底物。因此,在方案2的生物催化反应中,底物的R1基团选自氢原子或任选地被取代的烷基、烯基、炔基、烷氧基、芳基烷氧基、羟基烷基、杂烷基、杂烯基、杂炔基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基;底物的R2基团独立地选自烷基、烯基、炔基、羟基烷基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、烷基氨基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基;并且底物的R3基团独立地选自甲基、d3-甲基和乙基。
如本文进一步描述的,具有亚胺还原酶活性的工程化多肽表现出立体选择性;因此,方案2的亚胺还原酶反应可以用于在单个生物催化反应中建立产物的一个或更多个手性中心。
方案2
Figure BDA0003448136950000401
在一些实施方案中,本发明提供了工程化多肽,其包含与SEQ ID NO:4的氨基酸参考序列具有至少80%序列同一性的氨基酸序列,并且还包含与参考氨基酸序列相比的一个或更多个氨基酸残基差异,其中工程化多肽具有亚胺还原酶活性。在工程化多肽的一些实施方案中,亚胺还原酶活性是方案2的活性。
特别地,本公开内容的工程化亚胺还原酶多肽已经被工程化,以用于在水性条件下将酮酯底物3-[4-(3-氯苯基)苯基]-2-氧-丙酸(本文称为氯代联苯基丙酮酸和“化合物(2)”)和胺底物L-丙氨酸乙酯(本文称为“化合物(3)”)有效转化为相应的手性胺产物化合物3-[4-(3-氯苯基)苯基]-2-[(2-乙氧基-1-甲基-2-氧-乙基)氨基]丙酸(本文称为“化合物(1)”),如方案3所示。
化合物(1)是一种被取代的氨甲酰甲基氨基乙酸衍生物,其化学合成是多步骤过程。这种多步骤化学过程的低产量使得使用具有亚胺还原酶活性的酶成为一种有吸引力的替代方法,因为可以从合成序列中去除若干个步骤。
方案3
Figure BDA0003448136950000402
工程化亚胺还原酶多肽
本发明提供了具有亚胺还原酶活性的多肽、编码该多肽的多核苷酸、制备该多肽的方法以及用于使用该多肽的方法。在描述涉及多肽的情况下,应理解,它可以描述编码多肽的多核苷酸。
上文描述的工程化多肽的改进的性质藉以进行期望的反应的合适的反应条件可以考虑以下来确定:多肽、底物、共底物的浓度或量、缓冲剂、溶剂、pH,包括温度和反应时间的条件和/或多肽固定于固体支持物上的条件,如下文和实施例中进一步描述的。
在一些实施方案中,具有改进的性质(特别是在将式(II)化合物和式(III)化合物转化为式(I)化合物方面)的具有亚胺还原酶活性的示例性工程化多肽包含与SEQ ID NO:4相比在表5.1所示的残基位置处具有一个或更多个残基差异的氨基酸序列。
在一些实施方案中,具有改进的性质(特别是在将式(II)化合物和式(III)化合物转化为式(I)化合物方面)的具有亚胺还原酶活性的示例性工程化多肽包含与SEQ ID NO:16相比在表6.1所示的残基位置处具有一个或更多个残基差异的氨基酸序列。
在一些实施方案中,具有改进的性质(特别是在将式(II)化合物和式(III)化合物转化为式(I)化合物方面)的具有亚胺还原酶活性的示例性工程化多肽包含与SEQ ID NO:50相比在表7.1所示的残基位置处具有一个或更多个残基差异的氨基酸序列。
在一些实施方案中,具有改进的性质(特别是在将式(II)化合物和式(III)化合物转化为式(I)化合物方面)的具有亚胺还原酶活性的示例性工程化多肽包含与SEQ ID NO:306相比在表8.1所示的残基位置处具有一个或更多个残基差异的氨基酸序列。
在一些实施方案中,具有改进的性质(特别是在将式(II)化合物和式(III)化合物转化为式(I)化合物方面)的具有亚胺还原酶活性的示例性工程化多肽包含与SEQ ID NO:648相比在表9.1所示的残基位置处具有一个或更多个残基差异的氨基酸序列。
在一些实施方案中,具有改进的性质(特别是在将式(II)化合物和式(III)化合物转化为式(I)化合物方面)的具有亚胺还原酶活性的示例性工程化多肽包含与SEQ ID NO:708相比在表10.1所示的残基位置处具有一个或更多个残基差异的氨基酸序列。
本发明的示例性非天然存在的(或工程化)多肽的结构和功能信息是基于式(II)化合物和式(III)化合物向式(I)化合物的转化,其结果如以下表5.1、表6.1、表7.1、表8.1、表9.1和表10.1所示,并在实施例中进一步描述。这些表中的奇数编号序列标识符(即SEQID NO)是指编码由这些表中的偶数编号SEQ ID NO所提供的氨基酸序列的核苷酸序列。示例性序列提供于本发明随附的电子序列表文件中,其在此通过引用并入本文。氨基酸残基差异是基于与参考序列SEQ ID NO:4、16、50、306、648和708的比较,如所示的。
野生型节杆菌属种菌株1C(CENDH)酶用于产生变体SEQ ID NO:4(美国专利第9,487,760号、第9,695,451号),其包含相对于SEQ ID NO:2的N198H取代。SEQ ID NO:4被用作产生本发明变体的起始序列。亚胺还原酶的氨基酸序列(SEQ ID NO:4)被密码子优化以用于在大肠杆菌(Escherichia coli)中表达和合成(SEQ ID NO:3)。
每种工程化多肽相对于参考多肽SEQ ID NO:4、16、50、306、648或708的活性以本文实施例中描述的底物的转化来确定。在一些实施方案中,摇瓶粉末(SFP)被用作二次筛选,以评估工程化亚胺还原酶的性质,其结果在实施例中提供。在一些实施方案中,SFP形式提供了工程化多肽的更纯的粉末制品,并且可以包含多达总蛋白的约30%的工程化多肽。
在一些实施方案中,特定的酶性质与在本文所示的残基位置处与SEQ ID NO:4、16、50、306、648或708相比的残基差异相关。在一些实施方案中,影响多肽表达的残基差异可以用于增加工程化亚胺还原酶的表达。
鉴于本文提供的指导,还设想包含SEQ ID NO:6-802的偶数编号序列的示例性工程化多肽中的任一个通过例如随后轮次的演化可用作用于合成其他工程化亚胺还原酶多肽的起始氨基酸序列,所述演化并入来自表5.1、表6.1、表7.1、表8.1、表9.1和表10.1中的其他多肽和本文描述的其他残基位置的各种氨基酸差异的新的组合。另外的改进可以通过在贯穿较早轮次的演化中维持未改变的残基位置处包含氨基酸差异来生成。
在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ IDNO:4具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:4相比选自以下的一个或更多个残基差异:145、146、153、160、222、223、226和261。在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ ID NO:4具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:4相比选自以下的一个或更多个残基差异:145I、145V、146A、153L、153R、160T、222F、222W、223A、223G、223I、223S、223V、226M和261T。在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ ID NO:4具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:4相比选自以下的一个或更多个残基差异:E145I、E145V、R146A、N153L、N153R、D160T、Y222F、Y222W、L223A、L223G、L223I、L223S、L223V、I226M和E261T。
在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ IDNO:16具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:16相比选自以下的一个或更多个残基差异:29/94/184/223/232/288/293、29/94/184/232/287/288/293/311、29/94/184/232/287/288/311、29/94/184/232/287/293/332、29/94/184/232/288/293/311/324/353、29/94/184/232/288/311/324/332、29/94/184/232/293、29/94/184/232/311、29/94/184/287/293、29/94/184/287/293/311/353、29/94/184/287/311、29/94/184/288/293/324、29/94/184/288/293/332/353、29/94/184/288/298/332、29/94/184/288/353、29/94/184/293/311、29/94/184/324、29/94/223/232/287、29/94/223/232/293/311/324、29/94/223/288/293、29/94/232/287/288/311、29/94/232/288/293、29/94/287/288/293、29/94/287/288/293/353、29/94/287/311、29/94/293/311/324、29/94/293/332/353、29/94/311、29/94/324/353、29/184、29/184/223/288/293/324、29/184/232/288、29/184/287、29/184/287/288/293、29/184/287/288/293/311、29/184/287/311/332、29/184/288/293、29/184/288/293/311、29/184/293、29/184/293/311、29/184/293/324、29/184/353、29/223/287/288/293/353、29/232/287/288/293/332/353、29/287/288/293、29/287/288/293/324/353、29/288/293、29/311、29/311/332、29/353、72/94/184/288/311、86、94/96/223/287/288/293/311/324/332、94/99/184/293/311/332/353、94/184/223、94/184/223/232/287/311、94/184/223/288/293、94/184/223/293、94/184/232/287/288、94/184/232/287/288/324/332、94/184/232/287/293、94/184/232/287/293/332、94/184/287/288/293、94/184/287/288/311、94/184/287/293/311/324/353、94/184/287/311、94/184/287/353、94/184/288/293、94/184/288/293/311、94/184/288/293/311/332、94/184/293、94/184/293/311、94/184/293/332/353、94/223/232/311/353/355/356/357/358/359、94/223/287/288/293、94/223/288/293/311、94/232/287/288/293/353、94/232/288/293/353、94/232/293、94/232/293/324/332、94/232/311、94/287/288/293、94/287/288/311/324、94/288/293、94/288/293/324、94/293/324、94/311/324、153、184/223、184/223/287/288/353、184/232/287/288/293/311、184/232/287/288/324/353、184/232/287/293/332、184/287/288、184/287/288/293、184/287/288/293/324/353、184/287/293、184/287/293/311、184/288/293/311/324、184/332/353、205、223/232/287/288/332/353、223/287/288、223/287/288/293/311、223/287/311/353、223/288/293、232/287/288/293、232/287/288/293/311、232/287/288/293/321、232/287/311、232/288/293、232/288/293/332、234/287/288/293/311、287/288/293、287/288/311/324、287/293、287/311、287/311/332、287/324、288/293、288/293/311/324/353、288/293/324、293/311和311/332。在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ ID NO:16具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:16相比选自以下的一个或更多个残基差异:29R/94K/184Q/288S/353E、29R/94K/184R/232A/288S/293F/311V/324L/353E、29R/94K/184R/287T/293F、29R/94K/184R/288S/293Q/332V/353E、29R/94K/184R/324L、29R/94K/223S/232A/287K、29R/94K/232A/287T/288S/311V、29R/94K/232A/288S/293F、29R/94K/287K/311V、29R/94K/287T/288S/293F、29R/94K/293H/311V/324L、29R/94K/324L/353E、29R/94R/184Q/223S/232A/288S/293F、29R/94R/184Q/232A/287T/293F/332V、29R/94R/184Q/232A/288S/311V/324L/332V、29R/94R/184Q/287K/293F/311V/353E、29R/94R/184Q/287K/311V、29R/94R/184Q/288S/293F/324L、29R/94R/184R/232A/287K/288S/293F/311V、29R/94R/184R/232A/287T/288S/311V、29R/94R/184R/232A/293F、29R/94R/184R/232A/311V、29R/94R/184R/288S/298A/332V、29R/94R/184R/293F/311V、29R/94R/223S/288S/293F、29R/94R/223T/232A/293H/311V/324L、29R/94R/287K/288S/293F、29R/94R/287T/288S/293F、29R/94R/287T/288S/293F/353E、29R/94R/293F/332V/353E、29R/94R/311V、29R/184Q/223S/288S/293F/324L、29R/184Q/287T/288S/293F、29R/184R、29R/184R/232A/288S、29R/184R/287K/288S/293F/311V、29R/184R/287K/311V/332V、29R/184R/287T、29R/184R/288S/293F、29R/184R/288S/293F/311V、29R/184R/293F、29R/184R/293F/311V、29R/184R/293F/324L、29R/184R/353E、29R/223T/287T/288S/293F/353E、29R/232A/287T/288S/293Q/332V/353E、29R/287T/288S/293F、29R/287T/288S/293F/324L/353E、29R/288S/293F、29R/311V、29R/311V/332V、29R/353E、72V/94R/184R/288S/311V、86Q、94K/96V/223T/287K/288S/293F/311V/324L/332V、94K/184Q/232A/287T/293F、94K/184Q/232A/287T/293F/332V、94K/184Q/287T/293F/311V/324L/353E、94K/184R/223S/288S/293F、94K/184R/223T/232A/287K/311V、94K/184R/232A/287K/288S、94K/184R/287T/311V、94K/184R/287T/353E、94K/184R/288S/293F/311V、94K/184R/293H/311V、94K/287K/288S/293F、94K/287T/288S/311V/324L、94K/288S/293F、94K/288S/293F/324L、94K/311V/324L、94R/99T/184R/293F/311V/332V/353E、94R/184Q/287K/288S/311V、94R/184Q/288S/293F/311V、94R/184Q/293F/332V/353E、94R/184R/223S、94R/184R/223S/293F、94R/184R/232A/287K/288S/324L/332V、94R/184R/287K/288S/293F、94R/184R/287K/288S/311V、94R/184R/288S/293F、94R/184R/288S/293F/311V/332V、94R/184R/293F、94R/223S/232A/311V/353E/355K/356K/357C/358C/359-、94R/223S/287K/288S/293F、94R/223S/288S/293F/311V、94R/232A/287K/288S/293F/353E、94R/232A/288S/293F/353E、94R/232A/293F、94R/232A/293F/324L/332V、94R/232A/311V、94R/287K/288S/293F、94R/287T/288S/293F、94R/293F/324L、94R/311V/324L、153Y、184Q/223T/287K/288S/353E、184Q/232A/287K/288S/293F/311V、184Q/232A/287K/288S/324L/353E、184Q/287K/293F、184R/223T、184R/232A/287K/293F/332V、184R/287K/293F/311V、184R/287T/288S、184R/287T/288S/293F、184R/287T/288S/293F/324L/353E、184R/287T/288S/293Q、184R/288S/293H/311V/324L、184R/332V/353E、205I、205V、223S/232A/287K/288S/332V/353E、223S/287K/288S/293F/311V、223S/287K/311V/353E、223S/287T/288S、223S/288S/293F、232A/287K/288S/293F、232A/287K/288S/293F/311V、232A/287K/311V、232A/287T/288S/293F/321V、232A/288S/293F、232A/288S/293F/332V、234V/287K/288S/293F/311V、287K/288S/293F、287K/293F、287K/311V/332V、287K/324L、287T/288S/311V/324L、287T/311V、288S/293F、288S/293F/311V/324L/353E、288S/293F/324L、293F/311V和311V/332V。在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ ID NO:16具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:16相比选自以下的一个或更多个残基差异:S29R/N94K/V184Q/N288S/G353E、S29R/N94K/V184R/S232A/N288S/Y293F/A311V/D324L/G353E、S29R/N94K/V184R/I287T/Y293F、S29R/N94K/V184R/N288S/Y293Q/T332V/G353E、S29R/N94K/V184R/D324L、S29R/N94K/L223S/S232A/I287K、S29R/N94K/S232A/I287T/N288S/A311V、S29R/N94K/S232A/N288S/Y293F、S29R/N94K/I287K/A311V、S29R/N94K/I287T/N288S/Y293F、S29R/N94K/Y293H/A311V/D324L、S29R/N94K/D324L/G353E、S29R/N94R/V184Q/L223S/S232A/N288S/Y293F、S29R/N94R/V184Q/S232A/I287T/Y293F/T332V、S29R/N94R/V184Q/S232A/N288S/A311V/D324L/T332V、S29R/N94R/V184Q/I287K/Y293F/A311V/G353E、S29R/N94R/V184Q/I287K/A311V、S29R/N94R/V184Q/N288S/Y293F/D324L、S29R/N94R/V184R/S232A/I287K/N288S/Y293F/A311V、S29R/N94R/V184R/S232A/I287T/N288S/A311V、S29R/N94R/V184R/S232A/Y293F、S29R/N94R/V184R/S232A/A311V、S29R/N94R/V184R/N288S/V298A/T332V、S29R/N94R/V184R/Y293F/A311V、S29R/N94R/L223S/N288S/Y293F、S29R/N94R/L223T/S232A/Y293H/A311V/D324L、S29R/N94R/I287K/N288S/Y293F、S29R/N94R/I287T/N288S/Y293F、S29R/N94R/I287T/N288S/Y293F/G353E、S29R/N94R/Y293F/T332V/G353E、S29R/N94R/A311V、S29R/V184Q/L223S/N288S/Y293F/D324L、S29R/V184Q/I287T/N288S/Y293F、S29R/V184R、S29R/V184R/S232A/N288S、S29R/V184R/I287K/N288S/Y293F/A311V、S29R/V184R/I287K/A311V/T332V、S29R/V184R/I287T、S29R/V184R/N288S/Y293F、S29R/V184R/N288S/Y293F/A311V、S29R/V184R/Y293F、S29R/V184R/Y293F/A311V、S29R/V184R/Y293F/D324L、S29R/V184R/G353E、S29R/L223T/I287T/N288S/Y293F/G353E、S29R/S232A/I287T/N288S/Y293Q/T332V/G353E、S29R/I287T/N288S/Y293F、S29R/I287T/N288S/Y293F/D324L/G353E、S29R/N288S/Y293F、S29R/A311V、S29R/A311V/T332V、S29R/G353E、A72V/N94R/V184R/N288S/A311V、I86Q、N94K/A96V/L223T/I287K/N288S/Y293F/A311V/D324L/T332V、N94K/V184Q/S232A/I287T/Y293F、N94K/V184Q/S232A/I287T/Y293F/T332V、N94K/V184Q/I287T/Y293F/A311V/D324L/G353E、N94K/V184R/L223S/N288S/Y293F、N94K/V184R/L223T/S232A/I287K/A311V、N94K/V184R/S232A/I287K/N288S、N94K/V184R/I287T/A311V、N94K/V184R/I287T/G353E、N94K/V184R/N288S/Y293F/A311V、N94K/V184R/Y293H/A311V、N94K/I287K/N288S/Y293F、N94K/I287T/N288S/A311V/D324L、N94K/N288S/Y293F、N94K/N288S/Y293F/D324L、N94K/A311V/D324L、N94R/I99T/V184R/Y293F/A311V/T332V/G353E、N94R/V184Q/I287K/N288S/A311V、N94R/V184Q/N288S/Y293F/A311V、N94R/V184Q/Y293F/T332V/G353E、N94R/V184R/L223S、N94R/V184R/L223S/Y293F、N94R/V184R/S232A/I287K/N288S/D324L/T332V、N94R/V184R/I287K/N288S/Y293F、N94R/V184R/I287K/N288S/A311V、N94R/V184R/N288S/Y293F、N94R/V184R/N288S/Y293F/A311V/T332V、N94R/V184R/Y293F、N94R/L223S/S232A/A311V/G353E/R355K/S356K/A357C/V358C/E359-、N94R/L223S/I287K/N288S/Y293F、N94R/L223S/N288S/Y293F/A311V、N94R/S232A/I287K/N288S/Y293F/G353E、N94R/S232A/N288S/Y293F/G353E、N94R/S232A/Y293F、N94R/S232A/Y293F/D324L/T332V、N94R/S232A/A311V、N94R/I287K/N288S/Y293F、N94R/I287T/N288S/Y293F、N94R/Y293F/D324L、N94R/A311V/D324L、N153Y、V184Q/L223T/I287K/N288S/G353E、V184Q/S232A/I287K/N288S/Y293F/A311V、V184Q/S232A/I287K/N288S/D324L/G353E、V184Q/I287K/Y293F、V184R/L223T、V184R/S232A/I287K/Y293F/T332V、V184R/I287K/Y293F/A311V、V184R/I287T/N288S、V184R/I287T/N288S/Y293F、V184R/I287T/N288S/Y293F/D324L/G353E、V184R/I287T/N288S/Y293Q、V184R/N288S/Y293H/A311V/D324L、V184R/T332V/G353E、P205I、P205V、L223S/S232A/I287K/N288S/T332V/G353E、L223S/I287K/N288S/Y293F/A311V、L223S/I287K/A311V/G353E、L223S/I287T/N288S、L223S/N288S/Y293F、S232A/I287K/N288S/Y293F、S232A/I287K/N288S/Y293F/A311V、S232A/I287K/A311V、S232A/I287T/N288S/Y293F/A321V、S232A/N288S/Y293F、S232A/N288S/Y293F/T332V、A234V/I287K/N288S/Y293F/A311V、I287K/N288S/Y293F、I287K/Y293F、I287K/A311V/T332V、I287K/D324L、I287T/N288S/A311V/D324L、I287T/A311V、N288S/Y293F、N288S/Y293F/A311V/D324L/G353E、N288S/Y293F/D324L、Y293F/A311V和A311V/T332V。
在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ IDNO:50具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:50相比选自以下的一个或更多个残基差异:29/57/94/153/184/205/261/265/287、29/57/94/153/205/265、29/57/94/184/205/277/353、29/57/94/205/259/261/265、29/57/94/205/261/353、29/57/153/184/205/259/261/265/277、29/57/153/184/205/353、29/57/153/205/261/265、29/57/153/205/261/265/277、29/57/153/205/265/277、29/57/153/205/277/353、29/57/184/205/259/261/265/277/287/357、29/57/184/205/259/261/265/287、29/57/205/259/261/265、29/57/205/259/261/265/287、29/57/205/261/265/353、29/94/153/184/205、29/94/153/205/259/261/265、29/94/153/205/259/261/287、29/94/153/205/259/261/287/353、29/94/184/205/259/261、29/94/184/205/261、29/94/205、29/94/205/259/261/287、29/94/205/261、29/94/261/265/287/353、29/153/184/205、29/153/205、29/153/205/259/261/265/277/287、29/153/261/265/287/353、29/184/205、29/184/205/259/261/277、29/184/205/353、29/184/261/265、29/184/265、29/205、29/205/259/261、29/205/259/261/265/287、29/205/259/261/287、29/205/261、29/205/261/265、29/205/261/265/353、29/205/261/353、29/205/277、29/205/287、29/205/287/353、29/259/261/265、29/261/353、57/94/153/184/205/259/261、57/94/153/205/261/265、57/94/153/259/261/265、57/94/153/261/265、57/94/184/205/261/265/287、57/94/184/261/265/287、57/94/205/259、57/94/205/259/261/265/277/287、57/94/205/261/265、57/94/205/277、57/153/205/259/261/265/287、57/153/205/259/265/277、57/153/205/261、57/153/205/261/265、57/153/205/265、57/153/261/265、57/153/261/265/287/353、57/205、57/205/259/261、57/205/259/261/265/277/287/353、57/205/259/261/287/353、57/205/259/265、57/205/261、57/205/261/265/277/287/353、57/205/261/277、57/205/261/277/353、57/261/265/353、94/126/184/205/259/261/265、94/153/184/205、94/153/184/259/261/265、94/153/205/259/261/265/353、94/153/205/287、94/153/205/287/353、94/153/205/353、94/184/205/259/261、94/184/205/259/261/265/287、94/184/205/259/261/353、94/184/205/261/265/287/353、94/184/353、94/205、94/205/259/261/265、94/205/259/261/265/277/287、94/205/259/261/265/353、94/205/259/261/287/353、94/205/261/265/277、94/205/261/265/353、94/205/261/353、94/205/277、94/259/261/265、153/184/205/261/277/287、153/184/261/265/287、153/205、153/205/261、153/205/261/265/287、153/259/261/265、153/259/265/287、153/261/265、153/261/265/287/353、153/265、153/265/277/287/353、184/205、184/205/259/261/287、184/205/261、184/205/261/265、184/205/261/287、184/205/277、184/205/287/353、184/261/265/287、202、205、205/259/261、205/259/261/265、205/259/261/265/277/287/353、205/259/261/277/287、205/259/265、205/261、205/261/265、205/261/265/274、205/261/265/287、205/261/265/287/353、205/261/277、205/261/353、205/277/287、205/287、223、225、256、259/261/265、261/265/287、265/287、283和294。在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ ID NO:50具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:50相比选自以下的一个或更多个残基差异:29S/57G/94K/153F/184R/205C/261L/265I/287T、29S/57G/94K/153L/205A/265I、29S/57G/94K/184R/205C/277V/353E、29S/57G/94K/205C/259F/261S/265I、29S/57G/94K/205C/261L/353E、29S/57G/153F/184R/205C/259F/261V/265I/277V、29S/57G/153F/205C/261L/265I/277V、29S/57G/153F/205C/261V/265I、29S/57G/153F/205C/277V/353E、29S/57G/153L/184R/205A/353E、29S/57G/153L/205A/265I/277V、29S/57G/184R/205C/259F/261L/265I/277V/287K/357S、29S/57G/184R/205C/259F/261V/265I/287T、29S/57G/205A/259F/261L/265I/287T、29S/57G/205A/259F/261S/265I、29S/57G/205C/261S/265I/353E、29S/94K/153F/205A/259F/261S/287T/353E、29S/94K/153F/205C/259F/261L/287K、29S/94K/153L/184R/205C、29S/94K/153L/205C/259F/261R/265I、29S/94K/184R/205C/259F/261S、29S/94K/184R/205C/261V、29S/94K/205A、29S/94K/205A/261V、29S/94K/205C/259F/261L/287T、29S/94K/261R/265I/287T/353E、29S/153F/184R/205C、29S/153F/205A、29S/153F/261R/265I/287K/353E、29S/153L/205A/259F/261L/265I/277V/287T、29S/184R/205A、29S/184R/205A/353E、29S/184R/205C/259F/261V/277V、29S/184R/261L/265I、29S/184R/265I、29S/205A、29S/205A/259F/261L/265I/287K、29S/205A/259F/261R、29S/205A/261V、29S/205C/259F/261L、29S/205C/259F/261L/265I/287T、29S/205C/259F/261L/287K、29S/205C/259F/261L/287T、29S/205C/259F/261S、29S/205C/261L、29S/205C/261L/265I/353E、29S/205C/261R/353E、29S/205C/261S、29S/205C/261S/265I、29S/205C/261V/265I、29S/205C/277V、29S/205C/287T、29S/205C/287T/353E、29S/259F/261L/265I、29S/261V/353E、57G/94K/153F/184R/205A/259F/261L、57G/94K/153F/205A/261L/265I、57G/94K/153F/259F/261V/265I、57G/94K/153F/261V/265I、57G/94K/184R/205C/261V/265I/287T、57G/94K/184R/261S/265I/287T、57G/94K/205A/259F、57G/94K/205A/259F/261V/265I/277V/287T、57G/94K/205A/277V、57G/94K/205C/259F、57G/94K/205C/261S/265I、57G/153F/205A/261L/265I、57G/153F/205A/261S、57G/153F/205C/259F/261L/265I/287T、57G/153F/205C/259F/265I/277V、57G/153F/205C/265I、57G/153F/261L/265I/287K/353E、57G/153F/261R/265I、57G/205A、57G/205A/259F/261L/265I/277V/287K/353E、57G/205A/259F/261L/287T/353E、57G/205A/259F/261V、57G/205A/261R、57G/205C、57G/205C/259F/265I、57G/205C/261L/265I/277V/287T/353E、57G/205C/261L/277V、57G/205C/261S/277V/353E、57G/261L/265I/353E、94K/126C/184R/205A/259F/261L/265I、94K/153F/184R/259F/261S/265I、94K/153F/205A/287K/353E、94K/153F/205A/353E、94K/153F/205C/287K、94K/153F/205C/287T/353E、94K/153L/184R/205C、94K/153L/205C/259F/261S/265I/353E、94K/184R/205A/259F/261L/353E、94K/184R/205A/259F/261S、94K/184R/205A/261V/265I/287T/353E、94K/184R/205C/259F/261S/265I/287K、94K/184R/353E、94K/205A、94K/205A/259F/261L/265I、94K/205A/259F/261L/265I/277V/287K、94K/205A/259F/261R/265I、94K/205A/259F/261V/287K/353E、94K/205A/277V、94K/205C、94K/205C/259F/261S/265I、94K/205C/259F/261S/265I/353E、94K/205C/259F/261V/265I/353E、94K/205C/261L/353E、94K/205C/261S/265I/277V、94K/205C/261V/265I/353E、94K/259F/261S/265I、94K/259F/261V/265I、153F/184R/205A/261L/277V/287T、153F/184R/261S/265I/287T、153F/205A、153F/205A/261R/265I/287T、153F/205C、153F/205C/261L、153F/205C/261V、153F/259F/261V/265I、153F/259F/265I/287K、153F/261L/265I、153F/261R/265I、153F/261S/265I/287T/353E、153F/265I、153F/265I/277V/287T/353E、184R/205A/261R/265I、184R/205A/287T/353E、184R/205C、184R/205C/259F/261L/287K、184R/205C/261L、184R/205C/261R/287K、184R/205C/277V、184R/261L/265I/287T、202L、202M、205A、205A/259F/261V/265I、205A/259F/265I、205A/261L、205A/261R/265I/287K、205C、205C/259F/261L、205C/259F/261R/265I/277V/287T/353E、205C/259F/261S、205C/259F/261S/265I、205C/259F/261V/277V/287T、205C/259F/265I、205C/261L/265I/274A、205C/261L/277V、205C/261L/353E、205C/261R、205C/261R/265I/287K/353E、205C/261S、205C/261V/265I、205C/277V/287K、205C/287K、205C/287T、205S、205T、223G、225F、225Y、256L、256V、259F/261L/265I、259F/261V/265I、261R/265I/287K、261S/265I/287T、265I/287T、283L和294I。在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ ID NO:50具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:50相比选自以下的一个或更多个残基差异:R29S/A57G/N94K/N153F/Q184R/P205C/E261L/Q265I/I287T、R29S/A57G/N94K/N153L/P205A/Q265I、R29S/A57G/N94K/Q184R/P205C/N277V/G353E、R29S/A57G/N94K/P205C/Y259F/E261S/Q265I、R29S/A57G/N94K/P205C/E261L/G353E、R29S/A57G/N153F/Q184R/P205C/Y259F/E261V/Q265I/N277V、R29S/A57G/N153F/P205C/E261L/Q265I/N277V、R29S/A57G/N153F/P205C/E261V/Q265I、R29S/A57G/N153F/P205C/N277V/G353E、R29S/A57G/N153L/Q184R/P205A/G353E、R29S/A57G/N153L/P205A/Q265I/N277V、R29S/A57G/Q184R/P205C/Y259F/E261L/Q265I/N277V/I287K/A357S、R29S/A57G/Q184R/P205C/Y259F/E261V/Q265I/I287T、R29S/A57G/P205A/Y259F/E261L/Q265I/I287T、R29S/A57G/P205A/Y259F/E261S/Q265I、R29S/A57G/P205C/E261S/Q265I/G353E、R29S/N94K/N153F/P205A/Y259F/E261S/I287T/G353E、R29S/N94K/N153F/P205C/Y259F/E261L/I287K、R29S/N94K/N153L/Q184R/P205C、R29S/N94K/N153L/P205C/Y259F/E261R/Q265I、R29S/N94K/Q184R/P205C/Y259F/E261S、R29S/N94K/Q184R/P205C/E261V、R29S/N94K/P205A、R29S/N94K/P205A/E261V、R29S/N94K/P205C/Y259F/E261L/I287T、R29S/N94K/E261R/Q265I/I287T/G353E、R29S/N153F/Q184R/P205C、R29S/N153F/P205A、R29S/N153F/E261R/Q265I/I287K/G353E、R29S/N153L/P205A/Y259F/E261L/Q265I/N277V/I287T、R29S/Q184R/P205A、R29S/Q184R/P205A/G353E、R29S/Q184R/P205C/Y259F/E261V/N277V、R29S/Q184R/E261L/Q265I、R29S/Q184R/Q265I、R29S/P205A、R29S/P205A/Y259F/E261L/Q265I/I287K、R29S/P205A/Y259F/E261R、R29S/P205A/E261V、R29S/P205C/Y259F/E261L、R29S/P205C/Y259F/E261L/Q265I/I287T、R29S/P205C/Y259F/E261L/I287K、R29S/P205C/Y259F/E261L/I287T、R29S/P205C/Y259F/E261S、R29S/P205C/E261L、R29S/P205C/E261L/Q265I/G353E、R29S/P205C/E261R/G353E、R29S/P205C/E261S、R29S/P205C/E261S/Q265I、R29S/P205C/E261V/Q265I、R29S/P205C/N277V、R29S/P205C/I287T、R29S/P205C/I287T/G353E、R29S/Y259F/E261L/Q265I、R29S/E261V/G353E、A57G/N94K/N153F/Q184R/P205A/Y259F/E261L、A57G/N94K/N153F/P205A/E261L/Q265I、A57G/N94K/N153F/Y259F/E261V/Q265I、A57G/N94K/N153F/E261V/Q265I、A57G/N94K/Q184R/P205C/E261V/Q265I/I287T、A57G/N94K/Q184R/E261S/Q265I/I287T、A57G/N94K/P205A/Y259F、A57G/N94K/P205A/Y259F/E261V/Q265I/N277V/I287T、A57G/N94K/P205A/N277V、A57G/N94K/P205C/Y259F、A57G/N94K/P205C/E261S/Q265I、A57G/N153F/P205A/E261L/Q265I、A57G/N153F/P205A/E261S、A57G/N153F/P205C/Y259F/E261L/Q265I/I287T、A57G/N153F/P205C/Y259F/Q265I/N277V、A57G/N153F/P205C/Q265I、A57G/N153F/E261L/Q265I/I287K/G353E、A57G/N153F/E261R/Q265I、A57G/P205A、A57G/P205A/Y259F/E261L/Q265I/N277V/I287K/G353E、A57G/P205A/Y259F/E261L/I287T/G353E、A57G/P205A/Y259F/E261V、A57G/P205A/E261R、A57G/P205C、A57G/P205C/Y259F/Q265I、A57G/P205C/E261L/Q265I/N277V/I287T/G353E、A57G/P205C/E261L/N277V、A57G/P205C/E261S/N277V/G353E、A57G/E261L/Q265I/G353E、N94K/G126C/Q184R/P205A/Y259F/E261L/Q265I、N94K/N153F/Q184R/Y259F/E261S/Q265I、N94K/N153F/P205A/I287K/G353E、N94K/N153F/P205A/G353E、N94K/N153F/P205C/I287K、N94K/N153F/P205C/I287T/G353E、N94K/N153L/Q184R/P205C、N94K/N153L/P205C/Y259F/E261S/Q265I/G353E、N94K/Q184R/P205A/Y259F/E261L/G353E、N94K/Q184R/P205A/Y259F/E261S、N94K/Q184R/P205A/E261V/Q265I/I287T/G353E、N94K/Q184R/P205C/Y259F/E261S/Q265I/I287K、N94K/Q184R/G353E、N94K/P205A、N94K/P205A/Y259F/E261L/Q265I、N94K/P205A/Y259F/E261L/Q265I/N277V/I287K、N94K/P205A/Y259F/E261R/Q265I、N94K/P205A/Y259F/E261V/I287K/G353E、N94K/P205A/N277V、N94K/P205C、N94K/P205C/Y259F/E261S/Q265I、N94K/P205C/Y259F/E261S/Q265I/G353E、N94K/P205C/Y259F/E261V/Q265I/G353E、N94K/P205C/E261L/G353E、N94K/P205C/E261S/Q265I/N277V、N94K/P205C/E261V/Q265I/G353E、N94K/Y259F/E261S/Q265I、N94K/Y259F/E261V/Q265I、N153F/Q184R/P205A/E261L/N277V/I287T、N153F/Q184R/E261S/Q265I/I287T、N153F/P205A、N153F/P205A/E261R/Q265I/I287T、N153F/P205C、N153F/P205C/E261L、N153F/P205C/E261V、N153F/Y259F/E261V/Q265I、N153F/Y259F/Q265I/I287K、N153F/E261L/Q265I、N153F/E261R/Q265I、N153F/E261S/Q265I/I287T/G353E、N153F/Q265I、N153F/Q265I/N277V/I287T/G353E、Q184R/P205A/E261R/Q265I、Q184R/P205A/I287T/G353E、Q184R/P205C、Q184R/P205C/Y259F/E261L/I287K、Q184R/P205C/E261L、Q184R/P205C/E261R/I287K、Q184R/P205C/N277V、Q184R/E261L/Q265I/I287T、H202L、H202M、P205A、P205A/Y259F/E261V/Q265I、P205A/Y259F/Q265I、P205A/E261L、P205A/E261R/Q265I/I287K、P205C、P205C/Y259F/E261L、P205C/Y259F/E261R/Q265I/N277V/I287T/G353E、P205C/Y259F/E261S、P205C/Y259F/E261S/Q265I、P205C/Y259F/E261V/N277V/I287T、P205C/Y259F/Q265I、P205C/E261L/Q265I/V274A、P205C/E261L/N277V、P205C/E261L/G353E、P205C/E261R、P205C/E261R/Q265I/I287K/G353E、P205C/E261S、P205C/E261V/Q265I、P205C/N277V/I287K、P205C/I287K、P205C/I287T、P205S、P205T、S223G、G225F、G225Y、C256L、C256V、Y259F/E261L/Q265I、Y259F/E261V/Q265I、E261R/Q265I/I287K、E261S/Q265I/I287T、Q265I/I287T、I283L和F294I。
在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ IDNO:306具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:306相比选自以下的一个或更多个残基差异:197/198/201/259、198/201/259/280、202/205/221/223/225/261、202/205/221/223/261/294、202/221/222/225/256/261/294、202/221/223/225/283/294、205/221/222、205/221/223/225/256/261/283、219、221/222/223/225、221/223、221/223/225、221/223/225/256/261、221/223/225/261、221/223/225/294、221/225、221/225/256、221/225/256/261、221/225/256/261/283/294、223/225/256/261、225/256/261、280和280/306。在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQID NO:306具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:306相比选自以下的一个或更多个残基差异:197T/198S/201L/259V、198A/201L/259V/280L、202L/205S/221S/223G/225Y/261Y、202L/221H/223G/225F/283M/294I、202M/205S/221H/223G/261Y/294I、202M/205T/221L/223G/225Y/261R、202M/221S/222I/225Y/256L/261R/294I、205S/221S/223G/225F/256L/261T/283M、205T/221H/222I、219L、221H/222I/223G/225Y、221H/223G/225L、221H/225F、221L/223G/225L/256T/261R、221L/225F/256V、221S/223G、221S/223G/225L/256L/261R、221S/223G/225L/261R、221S/223G/225L/294I、221S/225F/256T/261R、221S/225Y/256T/261Y/283M/294I、223G/225L/256V/261R、225F/256T/261T、280D、280E、280I、280V、280V/306F和280W。在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ ID NO:306具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:306相比选自以下的一个或更多个残基差异:V197T/H198S/M201L/Y259V、H198A/M201L/Y259V/Y280L、H202L/A205S/Y221S/S223G/G225Y/V261Y、H202L/Y221H/S223G/G225F/I283M/F294I、H202M/A205S/Y221H/S223G/V261Y/F294I、H202M/A205T/Y221L/S223G/G225Y/V261R、H202M/Y221S/F222I/G225Y/C256L/V261R/F294I、A205S/Y221S/S223G/G225F/C256L/V261T/I283M、A205T/Y221H/F222I、F219L、Y221H/F222I/S223G/G225Y、Y221H/S223G/G225L、Y221H/G225F、Y221L/S223G/G225L/C256T/V261R、Y221L/G225F/C256V、Y221S/S223G、Y221S/S223G/G225L/C256L/V261R、Y221S/S223G/G225L/V261R、Y221S/S223G/G225L/F294I、Y221S/G225F/C256T/V261R、Y221S/G225Y/C256T/V261Y/I283M/F294I、S223G/G225L/C256V/V261R、G225F/C256T/V261T、Y280D、Y280E、Y280I、Y280V、Y280V/S306F和Y280W。
在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ IDNO:648具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:648相比选自以下的一个或更多个残基差异:17/198/259/280、197、197/198、197/198/223/259、197/223/277/280、197/259、197/277、198、198/223、198/223/259/277/280、198/259、198/259/277、198/259/277/280、198/277/280、223/259、223/259/280、258、259、259/268/277/280、259/277、259/280、263、277和280。在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ ID NO:648具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:648相比选自以下的一个或更多个残基差异:17P/198S/259V/280F、17P/198S/259W/280W、197L、197L/198S、197L/198S/223G/259W、197L/223G/277T/280K、197L/259W、197L/277F、198A、198S、198S/223G、198S/223G/259W/277W/280G、198S/259V、198S/259V/277T、198S/259W/277F/280G、198S/259W/277T/280F、198S/277F/280F、198S/277G/280W、198S/277P/280F、223G/259V/280W、223G/259W、258Y、259N/280W、259W、259W/268S/277T/280F、259W/277W、263D、263E、263F、263G、263L、263M、263N、263Q、263R、263V、263W、277W、280D、280F和280W。在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ ID NO:648具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:648相比选自以下的一个或更多个残基差异:H17P/H198S/Y259V/Y280F、H17P/H198S/Y259W/Y280W、V197L、V197L/H198S、V197L/H198S/S223G/Y259W、V197L/S223G/N277T/Y280K、V197L/Y259W、V197L/N277F、H198A、H198S、H198S/S223G、H198S/S223G/Y259W/N277W/Y280G、H198S/Y259V、H198S/Y259V/N277T、H198S/Y259W/N277F/Y280G、H198S/Y259W/N277T/Y280F、H198S/N277F/Y280F、H198S/N277G/Y280W、H198S/N277P/Y280F、S223G/Y259V/Y280W、S223G/Y259W、W258Y、Y259N/Y280W、Y259W、Y259W/A268S/N277T/Y280F、Y259W/N277W、Y263D、Y263E、Y263F、Y263G、Y263L、Y263M、Y263N、Y263Q、Y263R、Y263V、Y263W、N277W、Y280D、Y280F和Y280W。
在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ IDNO:708具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:708相比选自以下的一个或更多个残基差异:141、154、197、197/198和278。在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ ID NO:708具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:708相比选自以下的一个或更多个残基差异:141D、154G、154H、197A、197P/198A、278E和278V。在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与参考序列SEQ ID NO:708具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列以及与SEQ ID NO:708相比选自以下的一个或更多个残基差异:T141D、A154G、A154H、V197A、V197P/S198A、P278E和P278V。
如本领域技术人员将理解的,在一些实施方案中,选择的以上残基差异之一或其组合可以作为核心特征在工程化亚胺还原酶中保持恒定(即维持),并且在其他残基位置处的另外的残基差异可以被掺入到序列以产生具有改进性质的另外的工程化亚胺还原酶多肽。因此,应理解,对于含有以上残基差异的一个或子集的任何工程化亚胺还原酶,本发明设想了包含所述残基差异的一个或子集并且在本文公开的其他残基位置处另外包含一个或更多个残基差异的其他工程化亚胺还原酶。
如上文提到的,具有亚胺还原酶活性的工程化多肽也能够将底物(例如化合物(2)和化合物(3))转化为产物(例如化合物(1))。在一些实施方案中,工程化亚胺还原酶多肽能够以相对于参考多肽SEQ ID NO:4、16、50、306、648和/或708的活性至少1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、60倍、70倍、80倍、90倍、100倍或更高的活性将底物化合物转化为产物化合物。
在一些实施方案中,能够以相对于SEQ ID NO:4、16、50、306、648和/或708的活性至少2倍的活性将底物化合物转化为产物化合物的工程化亚胺还原酶多肽包含选自SEQ IDNO:6至802中的偶数编号序列的氨基酸序列。
在一些实施方案中,工程化亚胺还原酶具有包含与SEQ ID NO:4、16、50、306、648和/或708相比的一个或更多个残基差异的氨基酸序列,这增加了工程化亚胺还原酶活性在细菌宿主细胞中(特别地在大肠杆菌中)的表达。
在一些实施方案中,具有改进的性质的工程化亚胺还原酶多肽具有包含选自SEQID NO:6至802范围内的偶数编号序列的序列的氨基酸序列。
在一些实施方案中,具有亚胺还原酶活性的工程化多肽包含与SEQ ID NO:6至802范围内的偶数编号序列中的一个具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,以及与SEQ ID NO:4、16、50、306、648和/或708相比在SEQ ID NO:6-802范围内的偶数编号序列中的任一个中存在的氨基酸残基差异,如实施例中提供的。
除了上文指定的残基位置之外,本文公开的任何工程化亚胺还原酶多肽还可以包含相对于SEQ ID NO:4、16、50、306、648和/或708在其他残基位置(即,除了本文包含的那些残基位置之外的残基位置)处的其他残基差异。这些其他残基位置处的残基差异可以提供氨基酸序列的另外的变化,而不会不利地影响多肽进行底物向产物的转化的能力。因此,在一些实施方案中,除了存在于选自SEQ ID NO:6-802范围内的偶数编号序列的工程化亚胺还原酶多肽的任一个中的氨基酸残基差异之外,序列还可以包含与SEQ ID NO:4、16、50、306、648和/或708相比在其他氨基酸残基位置处的1个-2个、1个-3个、1个-4个、1个-5个、1个-6个、1个-7个、1个-8个、1个-9个、1个-10个、1个-11个、1个-12个、1个-14个、1个-15个、1个-16个、1个-18个、1个-20个、1个-22个、1个-24个、1个-26个、1个-30个、1个-35个、1个-40个、1个-45个或1个-50个残基差异。在一些实施方案中,与参考序列相比的氨基酸残基差异的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个残基位置。在一些实施方案中,与参考序列相比的氨基酸残基差异的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个残基位置。在这些其他位置处的残基差异可以是保守变化或非保守变化。在一些实施方案中,与SEQ ID NO:4、16、50、306、648和/或708的天然存在的亚胺还原酶多肽相比,残基差异可以包括保守取代和非保守取代。
在一些实施方案中,本发明还提供了包含保持本文描述的任何工程化亚胺还原酶的功能活性和/或改进的性质的该工程化亚胺还原酶多肽的片段的工程化多肽。因此,在一些实施方案中,本发明提供了在合适的反应条件下能够将底物转化为产物的多肽片段,其中该片段包含本发明的工程化亚胺还原酶多肽的全长氨基酸序列的至少约80%、85%、90%、95%、96%、97%、98%或99%,本发明的工程化亚胺还原酶多肽诸如选自SEQ ID NO:6-802范围内的偶数编号序列的示例性工程化亚胺还原酶多肽。在一些实施方案中,工程化亚胺还原酶多肽可以具有包含本文描述的工程化亚胺还原酶多肽序列的任一个中的缺失的氨基酸序列,本文描述的工程化亚胺还原酶多肽诸如SEQ ID NO:6-802范围内的偶数编号序列的示例性工程化多肽。
因此,对于本发明的工程化亚胺还原酶多肽的各种和每一种实施方案,氨基酸序列可以包括1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多达亚胺还原酶多肽的氨基酸总数的10%、多达氨基酸总数的20%、或多达氨基酸总数的30%的缺失,其中本文描述的工程化亚胺还原酶的相关的功能活性和/或改进的性质被保持。在一些实施方案中,缺失可以包括1个-2个、1个-3个、1个-4个、1个-5个、1个-6个、1个-7个、1个-8个、1个-9个、1个-10个、1个-15个、1个-20个、1个-21个、1个-22个、1个-23个、1个-24个、1个-25个、1个-30个、1个-35个、1个-40个、1个-45个或1个-50个氨基酸残基。在一些实施方案中,缺失的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基。在一些实施方案中,缺失可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基的缺失。
在一些实施方案中,本文的工程化亚胺还原酶多肽可以具有与本文描述的工程化亚胺还原酶多肽的任一个相比包含插入的氨基酸序列,本文描述的工程化亚胺还原酶多肽诸如SEQ ID NO:6-802范围内的偶数编号序列的示例性工程化多肽。因此,对于本发明的亚胺还原酶多肽的各个和每一个实施方案,插入可以包含1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多个氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、20个或更多个氨基酸、30个或更多个氨基酸、40个或更多个氨基酸或50个或更多个氨基酸,其中本文描述的工程化亚胺还原酶的相关功能活性和/或改进的性质被保持。插入可以是在亚胺还原酶多肽的氨基末端或羧基末端,或内部部分。
在一些实施方案中,本文的工程化亚胺还原酶多肽可以具有包含选自SEQ ID NO:6-802范围内的偶数编号序列的序列和任选地一个或数个(例如多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代的氨基酸序列。在一些实施方案中,氨基酸序列任选地具有1个-2个、1个-3个、1个-4个、1个-5个、1个-6个、1个-7个、1个-8个、1个-9个、1个-10个、1个-15个、1个-20个、1个-21个、1个-22个、1个-23个、1个-24个、1个-25个、1个-30个、1个-35个、1个-40个、1个-45个或1个-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
在上文的实施方案中,用于工程化多肽的合适的反应条件在表5.1、表6.1、表7.1、表8.1、表9.1和表10.1中提供,并且如本文实施例中描述的。
在一些实施方案中,本发明的多肽是融合多肽,其中工程化多肽与其他多肽融合,所述其他多肽诸如,例如但不限于抗体标签(例如myc表位)、纯化序列(例如用于结合金属的His标签)和细胞定位信号(例如分泌信号)。因此,本文描述的工程化多肽可以与其他多肽融合或不融合使用。
应理解,本文描述的多肽不限于遗传编码氨基酸。除了遗传编码氨基酸之外,本文描述的多肽可以全部地或部分地包含天然存在的和/或合成的非编码氨基酸。本文描述的多肽可以包含的某些常见的非编码氨基酸包括但不限于:遗传编码氨基酸的D-立体异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘苯丙氨酸(Pif);4-氨基甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(styrylkalanine,sAla);蒽基丙氨酸(aAla);3,3-二苯丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4-羧酸;哌啶酸(PA);氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aGly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu)、高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰基赖氨酸(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。本文描述的多肽可以包含的另外的非编码氨基酸对于本领域技术人员将是明显的(参见例如Fasman,CRC Practical Handbook ofBiochemistry and Molecular Biology,CRC Press,Boca Raton,FL,第3-70页[1989]以及其中引用的参考文献中提供的各种氨基酸,将其全部通过引用并入)。这些氨基酸可以处于L-构型或D-构型。
本领域技术人员将认识到,带有侧链保护基团的氨基酸或残基也可以构成本文描述的多肽。这样的受保护的氨基酸的非限制性实例,其在此情况下属于芳香族类,包括但不限于(保护基团列于括号中):Arg(tos)、Cys(甲基苄基)、Cys(硝基吡啶次磺酰基(nitropyridinesulfenyl))、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
可以构成本文描述的多肽的构象上受限制的非编码氨基酸包括但不限于N-甲基氨基酸(L-构型)、1-氨基环戊-(2或3)-烯-4-羧酸、哌可酸(pipecolic acid)、氮杂环丁烷-3-羧酸、高脯氨酸(hPro)以及1-氨基环戊烷-3-羧酸。
在一些实施方案中,工程化多肽可以呈各种形式,例如,诸如分离的制品、作为基本上纯的酶、用编码该酶的基因转化的完整细胞和/或作为这样的细胞的细胞提取物和/或裂解物。酶可以被冻干、喷雾干燥、沉淀或呈粗制糊状物的形式,如下文进一步讨论的。
在一些实施方案中,工程化多肽可以被提供于固体支持物诸如膜、树脂、固体载体或其他固相材料上。固体支持物可以包括有机聚合物,诸如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯(polyethyleneoxy)和聚丙烯酰胺以及它们的共聚物和接枝物。固体支持物还可以是无机的,诸如玻璃、二氧化硅、可控孔隙玻璃(CPG)、反相二氧化硅或金属诸如金或铂。固体支持物的构型可以呈珠、球、微粒、颗粒、凝胶、膜或表面的形式。表面可以是平坦的、基本上平坦的或非平坦的。固体支持物可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特性。固体支持物可以被配置为孔、凹陷(depression)或其他容器(container)、器皿(vessel)、特征或位置的形式。
在一些实施方案中,本发明的具有亚胺还原酶活性的工程化多肽可以被固定在固体支持物上,使得它们保留其相对于参考多肽SEQ ID NO:4、16、50、306、648和/或708改进的活性和/或其他改进的性质。在这样的实施方案中,固定的多肽可以促进底物化合物或其他合适的底物向产物的生物催化转化,并且反应完成后容易保留(例如通过保留固定有多肽的珠)并且然后在随后的反应中重新使用或再循环。这样的固定化酶方法允许进一步提高效率和降低成本。因此,还设想,使用本发明的亚胺还原酶多肽的任何方法可以使用结合或固定在固体支持物上的相同的亚胺还原酶多肽进行。
酶固定化的方法是本领域熟知的。工程化多肽可以被非共价地或共价地结合。用于将酶缀合和固定到固体支持物(例如树脂、膜、珠、玻璃等)的各种方法是本领域熟知的(参见例如Yi等人,Proc.Biochem.,42(5):895-898[2007];Martin等人,Appl.Microbiol.Biotechnol.,76(4):843-851[2007];Koszelewski等人,J.Mol.Cat.B:Enzymatic,63:39-44[2010];Truppo等人,Org.Proc.Res.Dev.,网络出版:dx.doi.org/10.1021/op200157c;Hermanson,Bioconjugate Techniques,第2版,Academic Press,Cambridge,MA[2008];Mateo等人,Biotechnol.Prog.,18(3):629-34[2002];和“Bioconjugation Protocols:Strategies and Methods,”于Methods in Molecular Biology,Niemeyer(编著),Humana Press,New York,NY[2004];将各参考文献的公开内容通过引用并入本文)。可用于固定本发明的工程化亚胺还原酶的固体支持物包括但不限于包含具有环氧化物官能团的聚甲基丙烯酸酯、具有氨基环氧化物官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯的珠或树脂。可用于固定本发明的工程化亚胺还原酶多肽的示例性固体支持物包括但不限于壳聚糖珠、Eupergit C和SEPABEAD(Mitsubishi),包括以下不同类型的SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。
在一些实施方案中,本文描述的多肽以试剂盒的形式提供。试剂盒中的酶可以单独存在或作为多种酶存在。试剂盒还可以包括用于进行酶促反应的试剂、用于评估酶的活性的底物以及用于检测产物的试剂。试剂盒还可以包括试剂分配器和用于使用试剂盒的使用说明。
在一些实施方案中,本发明的试剂盒包括在不同可寻址位置上包含多个不同亚胺还原酶多肽的阵列,其中不同多肽是参考序列的各自具有至少一种不同的改进的酶性质的不同变体。在一些实施方案中,固定在固体支持物上的多个多肽被配置在阵列的多个位置上,用于试剂的自动递送或通过检测方法和/或仪器可寻址。阵列可以被用于测试多肽对各种底物化合物的转化。包含多种工程化多肽的这样的阵列及其使用方法是本领域已知的(参见例如WO2009/008908A2)。
编码工程化亚胺还原酶的多核苷酸、表达载体和宿主细胞
在另一个方面中,本发明提供了编码本文描述的工程化亚胺还原酶多肽的多核苷酸。可以将多核苷酸可操作地连接至控制基因表达的一个或更多个异源调控序列,以创建能够表达多肽的重组多核苷酸。包含编码工程化亚胺还原酶的异源多核苷酸的表达构建体被引入到适当的宿主细胞以表达相应的亚胺还原酶多肽。
如对技术人员将是明显的,蛋白序列的可得性以及对对应于各种氨基酸的密码子的了解提供能够编码主题多肽的所有多核苷酸的描述。遗传密码的简并性(其中相同的氨基酸由可选的密码子或同义密码子编码)允许制备极大量的核酸,所有这些核酸都编码改进的亚胺还原酶。因此,知道了特定的氨基酸序列后,本领域技术人员可以通过以不改变蛋白的氨基酸序列的方式简单改变一个或更多个密码子的序列来制备任何数目的不同核酸。在这方面,本发明具体地考虑了可以通过基于可能的密码子选择来选择组合来制备编码本文描述的多肽的多核苷酸的每一种可能的改变,并且对于本文描述的任何多肽,所有这样的改变被认为具体地公开,包括表5.1、表6.1、表7.1、表8.1、表9.1和表10.1中呈现的和通过引用并入本文的序列表中如SEQ ID NO:6-802范围内的偶数编号序列公开的氨基酸序列。
在多种实施方案中,优选地选择密码子来适应在其中产生蛋白的宿主细胞。例如,在细菌中使用的偏好密码子被用于在细菌中表达基因;在酵母中使用的偏好密码子被用于酵母中的表达;并且在哺乳动物中使用的偏好密码子被用于在哺乳动物细胞中表达。在一些实施方案中,不需要替代所有密码子以优化亚胺还原酶的密码子使用,因为天然序列将包含优选的密码子并且因为可能不需要对所有氨基酸残基使用优选的密码子。因此,编码亚胺还原酶的密码子优化的多核苷酸可以在全长编码区的约40%、50%、60%、70%、80%或大于90%的密码子位置包含优选的密码子。
在一些实施方案中,多核苷酸包含编码如由SEQ ID NO:4、16、50、306、648和/或708表示的天然存在的亚胺还原酶多肽氨基酸序列的密码子优化的核苷酸序列。在一些实施方案中,多核苷酸具有包含与编码SEQ ID NO:6-802范围内的偶数编号序列的密码子优化的核酸序列至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的核酸序列。在一些实施方案中,多核苷酸具有包含与SEQ ID NO:5-801范围内的奇数编号序列的密码子优化的核酸序列至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的核酸序列。在一些实施方案中,SEQ ID NO:5-801范围内的奇数编号序列的密码子优化的序列增强了编码的野生型亚胺还原酶的表达,提供能够将底物转化为产物的酶的制品。
在一些实施方案中,多核苷酸能够在高严格条件下与选自SEQ ID NO:5-801中的奇数编号序列的参考序列或其互补序列杂交,并且编码具有亚胺还原酶活性的多肽。
在一些实施方案中,如上文描述的,多核苷酸编码与SEQ ID NO:4、16、50、306、648和/或708相比具有改进的性质的具有亚胺还原酶活性的工程化多肽,其中该多肽包含与选自SEQ ID NO:4、16、50、306、648和/或708的参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性,且与SEQ ID NO:4、16、50、306、648和/或708相比具有一个或更多个残基差异的氨基酸序列,其中该序列选自SEQ ID NO:6-802范围内的偶数编号序列。在一些实施方案中,参考氨基酸序列选自SEQ ID NO:6-802范围内的偶数编号序列。在一些实施方案中,参考氨基酸序列是SEQ ID NO:4,而在一些其他实施方案中,参考序列是SEQ ID NO:16,而在一些其他实施方案中,参考序列是SEQ ID NO:50,而在一些其他实施方案中,参考序列是SEQ ID NO:306,而在一些其他实施方案中,参考序列是SEQ ID NO:648,并且在仍一些其他实施方案中,参考序列是SEQ ID NO:708。
在一些实施方案中,多核苷酸编码能够以与SEQ ID NO:4、16、50、306、648和/或708相比改进的性质将底物转化为产物的亚胺还原酶多肽,其中该多肽包含与参考序列SEQID NO:4、16、50、306、648和/或708具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的氨基酸序列。
在一些实施方案中,编码工程化亚胺还原酶的多核苷酸包含选自SEQ ID NO:5-801范围内的奇数编号序列的多核苷酸序列。
在一些实施方案中,多核苷酸能够在高严格条件下与选自SEQ ID NO:5-801范围内的奇数编号序列的参考多核苷酸序列或其互补序列杂交,并且编码具有本文描述的一种或更多种具有改进的性质的具有亚胺还原酶活性的多肽。在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码包含与SEQ ID NO:4具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列的亚胺还原酶多肽,该亚胺还原酶多肽具有包含与SEQ ID NO:4相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:145、146、153、160、222、223、226和261。
在一些实施方案中,多核苷酸能够在高严格条件下与选自SEQ ID NO:5-801范围内的奇数编号序列的参考多核苷酸序列或其互补序列杂交,并且编码具有本文描述的一种或更多种具有改进的性质的具有亚胺还原酶活性的多肽。在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码包含与SEQ ID NO:16具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列的亚胺还原酶多肽,该亚胺还原酶多肽具有包含与SEQ ID NO:16相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:29/94/184/223/232/288/293、29/94/184/232/287/288/293/311、29/94/184/232/287/288/311、29/94/184/232/287/293/332、29/94/184/232/288/293/311/324/353、29/94/184/232/288/311/324/332、29/94/184/232/293、29/94/184/232/311、29/94/184/287/293、29/94/184/287/293/311/353、29/94/184/287/311、29/94/184/288/293/324、29/94/184/288/293/332/353、29/94/184/288/298/332、29/94/184/288/353、29/94/184/293/311、29/94/184/324、29/94/223/232/287、29/94/223/232/293/311/324、29/94/223/288/293、29/94/232/287/288/311、29/94/232/288/293、29/94/287/288/293、29/94/287/288/293/353、29/94/287/311、29/94/293/311/324、29/94/293/332/353、29/94/311、29/94/324/353、29/184、29/184/223/288/293/324、29/184/232/288、29/184/287、29/184/287/288/293、29/184/287/288/293/311、29/184/287/311/332、29/184/288/293、29/184/288/293/311、29/184/293、29/184/293/311、29/184/293/324、29/184/353、29/223/287/288/293/353、29/232/287/288/293/332/353、29/287/288/293、29/287/288/293/324/353、29/288/293、29/311、29/311/332、29/353、72/94/184/288/311、86、94/96/223/287/288/293/311/324/332、94/99/184/293/311/332/353、94/184/223、94/184/223/232/287/311、94/184/223/288/293、94/184/223/293、94/184/232/287/288、94/184/232/287/288/324/332、94/184/232/287/293、94/184/232/287/293/332、94/184/287/288/293、94/184/287/288/311、94/184/287/293/311/324/353、94/184/287/311、94/184/287/353、94/184/288/293、94/184/288/293/311、94/184/288/293/311/332、94/184/293、94/184/293/311、94/184/293/332/353、94/223/232/311/353/355/356/357/358/359、94/223/287/288/293、94/223/288/293/311、94/232/287/288/293/353、94/232/288/293/353、94/232/293、94/232/293/324/332、94/232/311、94/287/288/293、94/287/288/311/324、94/288/293、94/288/293/324、94/293/324、94/311/324、153、184/223、184/223/287/288/353、184/232/287/288/293/311、184/232/287/288/324/353、184/232/287/293/332、184/287/288、184/287/288/293、184/287/288/293/324/353、184/287/293、184/287/293/311、184/288/293/311/324、184/332/353、205、223/232/287/288/332/353、223/287/288、223/287/288/293/311、223/287/311/353、223/288/293、232/287/288/293、232/287/288/293/311、232/287/288/293/321、232/287/311、232/288/293、232/288/293/332、234/287/288/293/311、287/288/293、287/288/311/324、287/293、287/311、287/311/332、287/324、288/293、288/293/311/324/353、288/293/324、293/311和311/332。
在一些实施方案中,多核苷酸能够在高严格条件下与选自SEQ ID NO:5-801范围内的奇数编号序列的参考多核苷酸序列或其互补序列杂交,并且编码具有本文描述的一种或更多种具有改进的性质的具有亚胺还原酶活性的多肽。在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码包含与SEQ ID NO:50具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列的亚胺还原酶多肽,该亚胺还原酶多肽具有包含与SEQ ID NO:50相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:29/57/94/153/184/205/261/265/287、29/57/94/153/205/265、29/57/94/184/205/277/353、29/57/94/205/259/261/265、29/57/94/205/261/353、29/57/153/184/205/259/261/265/277、29/57/153/184/205/353、29/57/153/205/261/265、29/57/153/205/261/265/277、29/57/153/205/265/277、29/57/153/205/277/353、29/57/184/205/259/261/265/277/287/357、29/57/184/205/259/261/265/287、29/57/205/259/261/265、29/57/205/259/261/265/287、29/57/205/261/265/353、29/94/153/184/205、29/94/153/205/259/261/265、29/94/153/205/259/261/287、29/94/153/205/259/261/287/353、29/94/184/205/259/261、29/94/184/205/261、29/94/205、29/94/205/259/261/287、29/94/205/261、29/94/261/265/287/353、29/153/184/205、29/153/205、29/153/205/259/261/265/277/287、29/153/261/265/287/353、29/184/205、29/184/205/259/261/277、29/184/205/353、29/184/261/265、29/184/265、29/205、29/205/259/261、29/205/259/261/265/287、29/205/259/261/287、29/205/261、29/205/261/265、29/205/261/265/353、29/205/261/353、29/205/277、29/205/287、29/205/287/353、29/259/261/265、29/261/353、57/94/153/184/205/259/261、57/94/153/205/261/265、57/94/153/259/261/265、57/94/153/261/265、57/94/184/205/261/265/287、57/94/184/261/265/287、57/94/205/259、57/94/205/259/261/265/277/287、57/94/205/261/265、57/94/205/277、57/153/205/259/261/265/287、57/153/205/259/265/277、57/153/205/261、57/153/205/261/265、57/153/205/265、57/153/261/265、57/153/261/265/287/353、57/205、57/205/259/261、57/205/259/261/265/277/287/353、57/205/259/261/287/353、57/205/259/265、57/205/261、57/205/261/265/277/287/353、57/205/261/277、57/205/261/277/353、57/261/265/353、94/126/184/205/259/261/265、94/153/184/205、94/153/184/259/261/265、94/153/205/259/261/265/353、94/153/205/287、94/153/205/287/353、94/153/205/353、94/184/205/259/261、94/184/205/259/261/265/287、94/184/205/259/261/353、94/184/205/261/265/287/353、94/184/353、94/205、94/205/259/261/265、94/205/259/261/265/277/287、94/205/259/261/265/353、94/205/259/261/287/353、94/205/261/265/277、94/205/261/265/353、94/205/261/353、94/205/277、94/259/261/265、153/184/205/261/277/287、153/184/261/265/287、153/205、153/205/261、153/205/261/265/287、153/259/261/265、153/259/265/287、153/261/265、153/261/265/287/353、153/265、153/265/277/287/353、184/205、184/205/259/261/287、184/205/261、184/205/261/265、184/205/261/287、184/205/277、184/205/287/353、184/261/265/287、202、205、205/259/261、205/259/261/265、205/259/261/265/277/287/353、205/259/261/277/287、205/259/265、205/261、205/261/265、205/261/265/274、205/261/265/287、205/261/265/287/353、205/261/277、205/261/353、205/277/287、205/287、223、225、256、259/261/265、261/265/287、265/287、283和294。
在一些实施方案中,多核苷酸能够在高严格条件下与选自SEQ ID NO:5-801范围内的奇数编号序列的参考多核苷酸序列或其互补序列杂交,并且编码具有本文描述的一种或更多种具有改进的性质的具有亚胺还原酶活性的多肽。在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码包含与SEQ ID NO:306具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列的亚胺还原酶多肽,该亚胺还原酶多肽具有包含与SEQ ID NO:306相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:197/198/201/259、198/201/259/280、202/205/221/223/225/261、202/205/221/223/261/294、202/221/222/225/256/261/294、202/221/223/225/283/294、205/221/222、205/221/223/225/256/261/283、219、221/222/223/225、221/223、221/223/225、221/223/225/256/261、221/223/225/261、221/223/225/294、221/225、221/225/256、221/225/256/261、221/225/256/261/283/294、223/225/256/261、225/256/261、280和280/306。
在一些实施方案中,多核苷酸能够在高严格条件下与选自SEQ ID NO:5-801范围内的奇数编号序列的参考多核苷酸序列或其互补序列杂交,并且编码具有本文描述的一种或更多种具有改进的性质的具有亚胺还原酶活性的多肽。在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码包含与SEQ ID NO:648具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列的亚胺还原酶多肽,该亚胺还原酶多肽具有包含与SEQ ID NO:648相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:17/198/259/280、197、197/198、197/198/223/259、197/223/277/280、197/259、197/277、198、198/223、198/223/259/277/280、198/259、198/259/277、198/259/277/280、198/277/280、223/259、223/259/280、258、259、259/268/277/280、259/277、259/280、263、277和280。
在一些实施方案中,多核苷酸能够在高严格条件下与选自SEQ ID NO:5-801范围内的奇数编号序列的参考多核苷酸序列或其互补序列杂交,并且编码具有本文描述的一种或更多种具有改进的性质的具有亚胺还原酶活性的多肽。在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码包含与SEQ ID NO:708具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列的亚胺还原酶多肽,该亚胺还原酶多肽具有包含与SEQ ID NO:708相比在选自以下的残基位置处的一个或更多个残基差异的氨基酸序列:141、154、197、197/198和278。
在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码具有改进性质的具有亚胺还原酶活性的工程化多肽,所述工程化多肽包含与SEQ ID NO:4、16、50、306、648和/或708具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性的氨基酸序列。在一些实施方案中,多核苷酸编码本文描述的多肽,但在核苷酸水平与编码工程化亚胺还原酶的参考多核苷酸具有至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多的序列同一性。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:5-801。
在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码具有改进性质的具有亚胺还原酶活性的工程化多肽,所述工程化多肽包含与SEQ ID NO:4具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性的氨基酸序列。在一些实施方案中,多核苷酸编码本文描述的多肽,但在核苷酸水平与编码工程化亚胺还原酶的参考多核苷酸具有至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多的序列同一性。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:5-35。
在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码具有改进性质的具有亚胺还原酶活性的工程化多肽,所述工程化多肽包含与SEQ ID NO:16具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性的氨基酸序列。在一些实施方案中,多核苷酸编码本文描述的多肽,但在核苷酸水平与编码工程化亚胺还原酶的参考多核苷酸具有至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多的序列同一性。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:37-301。
在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码具有改进性质的具有亚胺还原酶活性的工程化多肽,所述工程化多肽包含与SEQ ID NO:50具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性的氨基酸序列。在一些实施方案中,多核苷酸编码本文描述的多肽,但在核苷酸水平与编码工程化亚胺还原酶的参考多核苷酸具有至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多的序列同一性。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:301-645。
在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码具有改进性质的具有亚胺还原酶活性的工程化多肽,所述工程化多肽包含与SEQ ID NO:306具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性的氨基酸序列。在一些实施方案中,多核苷酸编码本文描述的多肽,但在核苷酸水平与编码工程化亚胺还原酶的参考多核苷酸具有至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多的序列同一性。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:647-703。
在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码具有改进性质的具有亚胺还原酶活性的工程化多肽,所述工程化多肽包含与SEQ ID NO:648具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性的氨基酸序列。在一些实施方案中,多核苷酸编码本文描述的多肽,但在核苷酸水平与编码工程化亚胺还原酶的参考多核苷酸具有至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多的序列同一性。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:705-785。
在一些实施方案中,能够在高严格条件下杂交的多核苷酸编码具有改进性质的具有亚胺还原酶活性的工程化多肽,所述工程化多肽包含与SEQ ID NO:708具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高同一性的氨基酸序列。在一些实施方案中,多核苷酸编码本文描述的多肽,但在核苷酸水平与编码工程化亚胺还原酶的参考多核苷酸具有至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多的序列同一性。在一些实施方案中,参考多核苷酸序列选自SEQ ID NO:787-801。
在一些实施方案中,编码本文提供的工程化亚胺还原酶多肽中的任一个的分离的多核苷酸以多种方式被操作,以提供多肽的表达。在一些实施方案中,编码多肽的多核苷酸作为表达载体来提供,其中存在一个或更多个控制序列来调节多核苷酸和/或多肽的表达。取决于表达载体,对分离的多核苷酸在其插入到载体中之前的操作可以是期望的或必要的。用于利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。
在一些实施方案中,控制序列包括,除了其他序列以外,启动子、前导序列、多腺苷酸化序列、前肽序列、信号肽序列和转录终止子。如本领域已知的,合适的启动子可以基于使用的宿主细胞来选择。对于细菌宿主细胞,用于指导本申请的核酸构建体的转录的合适的启动子包括,但不限于从以下获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌(Bacillus subtilis)果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌(Bacillus licheniformis)α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因以及原核β-内酰胺酶基因(参见,例如,Villa-Kamaroff等人,Proc.Natl Acad.Sci.USA75:3727-3731[1978]),以及tac启动子(参见例如,DeBoer等人,Proc.Natl Acad.Sci.USA 80:21-25[1983])。用于丝状真菌宿主细胞的示例性启动子包括从以下的基因获得的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定型α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰孢菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(参见,例如WO 96/00787),以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体),和其突变启动子、截短启动子和杂合启动子。示例性酵母细胞启动子可以来自以下的基因:酿酒酵母(Saccharomyces cerevisiae)烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)、和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其他有用的启动子是本领域已知的(参见例如,Romanos等人,Yeast 8:423-488[1992])。
在一些实施方案中,控制序列是合适的转录终止子序列,转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列被可操作地连接至编码多肽的核酸序列的3’末端。在选择的宿主细胞中有功能的任何终止子可用于本发明中。例如,用于丝状真菌宿主细胞的示例性转录终止子可以从以下的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶、和尖孢镰刀菌胰蛋白酶样蛋白酶。用于酵母宿主细胞的示例性终止子可以从以下的基因获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子是本领域已知的(参见例如,Romanos等,上文)。
在一些实施方案中,控制序列是合适的前导序列,前导序列是一种对由宿主细胞的翻译重要的mRNA的非翻译区域。前导序列被可操作地连接至编码多肽的核酸序列的5’末端。可以使用在所选择的宿主细胞中起作用的任何前导序列。用于丝状真菌宿主细胞的示例性前导序列从以下的基因获得:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的合适的前导序列包括但不限于从以下的基因获得的那些:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。控制序列还可以是多腺苷酸化序列,多腺苷酸化序列是被可操作地连接至核酸序列的3’末端的序列,并且其在转录时,被宿主细胞识别为将多腺苷残基添加至转录的mRNA的信号。在本发明中可以使用在所选择的宿主细胞中起作用的任何多腺苷酸化序列。用于丝状真菌宿主细胞的示例性多腺苷酸化序列包括,但不限于来自以下的基因的那些:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。用于酵母宿主细胞的有用的多腺苷酸化序列也是本领域已知的(参见例如,Guo和Sherman,Mol.Cell.Bio.,15:5983-5990[1995])。
在一些实施方案中,控制序列是信号肽编码区域,其编码连接至多肽的氨基末端的氨基酸序列并且将编码的多肽引导到细胞的分泌途径中。核酸序列的编码序列的5’末端可以固有地包含信号肽编码区,所述信号肽编码区符合翻译阅读框地(in translationreading frame)与编码分泌多肽的编码区的区段天然地连接。可选地,编码序列的5’末端可以包含对编码序列是外源的信号肽编码区。将表达的多肽引导到选择的宿主细胞的分泌途径中的任何信号肽编码区域可用于本文提供的工程化亚胺还原酶多肽的表达。用于细菌宿主细胞的有效信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:芽孢杆菌NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽是本领域已知的(参见例如,Simonen和Palva,Microbiol.Rev.,57:109-137[1993])。用于丝状真菌宿主细胞的有效的信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶和绵毛状腐质霉脂肪酶。用于酵母宿主细胞的有用的信号肽包括但不限于来自以下的基因的那些:酿酒酵母α因子和酿酒酵母转化酶。
在一些实施方案中,控制序列是编码定位在多肽的氨基末端处的氨基酸序列的前肽编码区。产生的多肽被称为“前酶(proenzyme)”、“前多肽(propolypeptide)”或在一些情况下被称为“酶原(zymogen)”。前多肽可以通过催化或自动催化前肽从前多肽的裂解被转化为成熟活性多肽。前肽编码区域包括但不限于以下的基因:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶、和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(参见,例如WO 95/33836)。在信号肽和前肽区域两者均存在于多肽的氨基末端时,前肽区域紧邻多肽的氨基末端定位并且信号肽区域紧邻前肽区域的氨基末端定位。
在一些实施方案中,还利用了调节序列。这些序列促进相对于宿主细胞生长的多肽表达调节。调控系统的实例是引起基因表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的那些。在原核宿主细胞中,合适的调节序列包括但不限于lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调节系统包括但不限于ADH2系统或GAL1系统。在丝状真菌中,合适的调节序列包括但不限于TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。
本发明还提供了重组表达载体,所述重组表达载体包含编码工程化亚胺还原酶多肽的多核苷酸以及取决于它们将被引入的宿主的类型的一个或更多个表达调节区域,诸如启动子和终止子、复制起点等。在一些实施方案中,上文描述的各种核酸和控制序列可以被组合在一起以产生重组表达载体,该重组表达载体包括一个或更多个方便的限制性位点,以允许在这样的位点插入或取代编码变体亚胺还原酶多肽的核酸序列。可选地,本发明的多核苷酸序列通过将多核苷酸序列或包含该多核苷酸的核酸构建体插入到适当的表达载体来表达。在产生表达载体时,编码序列位于载体中,使得编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其可以方便地经历重组DNA程序并且可以导致变体亚胺还原酶多核苷酸序列的表达。载体的选择通常将取决于载体与载体待引入的宿主细胞的相容性。载体可以是线性质粒或闭合的环状质粒。
在一些实施方案中,表达载体为自主复制载体(即,作为染色体外的实体存在的载体,其复制独立于染色体复制,诸如质粒、染色体外元件、微型染色体或人工染色体)。载体可以包含用于确保自我复制的任何工具(means)。在一些可选择的实施方案中,载体可以是当被引入到宿主细胞中时,被整合到基因组中并且与其被整合进的染色体一起复制的载体。此外,可以使用单一载体或质粒或者一起包含待引入到宿主细胞基因组中的总DNA的两种或更多种载体或质粒、或转座子。
在一些实施方案中,表达载体优选地包含一个或更多个选择标志物,其允许容易选择转化的细胞。“选择标志物”是其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养型等的基因。细菌的选择标志物的实例包括但不限于,来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标志物。用于酵母宿主细胞的合适的标志物包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择标志物包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶)及其等同物。在另一个方面中,本发明提供了一种宿主细胞,所述宿主细胞包含编码本发明的至少一种工程化亚胺还原酶多肽的多核苷酸,所述多核苷酸被可操作地连接至用于在宿主细胞中表达工程化亚胺还原酶的一个或更多个控制序列。用于在表达由本发明的表达载体编码的多肽中使用的宿主细胞是本领域熟知的,并且包括但不限于细菌细胞,诸如大肠杆菌、河流弧菌(Vibrio fluvialis)、链霉菌属(Streptomyces)和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母和巴斯德毕赤酵母(Pichia pastoris)[ATCC保藏号201178]);昆虫细胞,诸如果蝇属(Drosophila)S2和夜蛾属(Spodoptera)Sf9细胞;动物细胞,诸如CHO、COS、BHK、293和Bowes黑素瘤细胞;和植物细胞。示例性宿主细胞为大肠杆菌菌株(诸如,W3110(ΔfhuA)和BL21)。
因此,在另一个方面中,本发明提供了用于产生工程化亚胺还原酶多肽的方法,其中该方法包括将能够表达编码工程化亚胺还原酶多肽的多核苷酸的宿主细胞在适合于该多肽表达的条件下培养。在一些实施方案中,该方法还包括分离和/或纯化如本文描述的亚胺还原酶多肽的步骤。
用于上文描述的宿主细胞的合适的培养基和生长条件是本领域熟知的。用于表达亚胺还原酶多肽的多核苷酸可以通过本领域已知的各种方法被引入细胞。技术包括,除了其他以外,电穿孔、生物颗粒轰击、脂质体介导的转染、氯化钙转染和原生质体融合。
具有本文公开的性质的工程化亚胺还原酶可以通过使编码天然存在的或工程化的亚胺还原酶多肽的多核苷酸经历本领域已知的和如本文描述的诱变和/或定向演化方法来获得。示例性的定向演化技术是诱变和/或DNA改组(参见例如,Stemmer,Proc.Natl.Acad.Sci.USA 91:10747-10751[1994];WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和美国专利6,537,746)。可以使用的其他定向演化程序包括,除了其他以外,交错延伸过程(StEP)、体外重组(参见例如,Zhao等人,Nat.Biotechnol.,16:258–261[1998])、诱变PCR(参见例如,Caldwell等人,PCR MethodsAppl.,3:S136-S140[1994])、和盒式诱变(参见例如,Black等人,Proc.Natl.Acad.Sci.USA93:3525-3529[1996])。
例如,诱变和定向演化方法可以容易地应用于多核苷酸以产生可以被表达、筛选和测定的变体文库。诱变和定向演化方法是本领域熟知的(参见例如,美国专利第5,605,793号、第5,811,238号、第5,830,721号、第5,834,252号、第5,837,458号、第5,928,905号、第6,096,548号、第6,117,679号、第6,132,970号、第6,165,793号、第6,180,406号、第6,251,674号、第6,265,201号、第6,277,638号、第6,287,861号、第6,287,862号、第6,291,242号、第6,297,053号、第6,303,344号、第6,309,883号、第6,319,713号、第6,319,714号、第6,323,030号、第6,326,204号、第6,335,160号、第6,335,198号、第6,344,356号、第6,352,859号、第6,355,484号、第6,358,740号、第6,358,742号、第6,365,377号、第6,365,408号、第6,368,861号、第6,372,497号、第6,337,186号、第6,376,246号、第6,379,964号、第6,387,702号、第6,391,552号、第6,391,640号、第6,395,547号、第6,406,855号、第6,406,910号、第6,413,745号、第6,413,774号、第6,420,175号、第6,423,542号、第6,426,224号、第6,436,675号、第6,444,468号、第6,455,253号、第6,479,652号、第6,482,647号、第6,483,011号、第6,484,105号、第6,489,146号、第6,500,617号、第6,500,639号、第6,506,602号、第6,506,603号、第6,518,065号、第6,519,065号、第6,521,453号、第6,528,311号、第6,537,746号、第6,573,098号、第6,576,467号、第6,579,678号、第6,586,182号、第6,602,986号、第6,605,430号、第6,613,514号、第6,653,072号、第6,686,515号、第6,703,240号、第6,716,631号、第6,825,001号、第6,902,922号、第6,917,882号、第6,946,296号、第6,961,664号、第6,995,017号、第7,024,312号、第7,058,515号、第7,105,297号、第7,148,054号、第7,220,566号、第7,288,375号、第7,384,387号、第7,421,347号、第7,430,477号、第7,462,469号、第7,534,564号、第7,620,500号、第7,620,502号、第7,629,170号、第7,702,464号、第7,747,391号、第7,747,393号、第7,751,986号、第7,776,598号、第7,783,428号、第7,795,030号、第7,853,410号、第7,868,138号、第7,783,428号、第7,873,477号、第7,873,499号、第7,904,249号、第7,957,912号、第7,981,614号、第8,014,961号、第8,029,988号、第8,048,674号、第8,058,001号、第8,076,138号、第8,108,150号、第8,170,806号、第8,224,580号、第8,377,681号、第8,383,346号、第8,457,903号、第8,504,498号、第8,589,085号、第8,762,066号、第8,768,871号、第9,593,326号、以及所有相关的美国和PCT以及非美国的对应专利;Ling等人,Anal.Biochem.,254:157-78[1997];Dale等人,Meth.Mol.Biol.,57:369-74[1996];Smith,Ann.Rev.Genet.,19:423-462[1985];Botstein等人,Science,229:1193-1201[1985];Carter,Biochem.J.,237:1-7[1986];Kramer等人,Cell,38:879-887[1984];Wells等人,Gene,34:315-323[1985];Minshull等人,Curr.Op.Chem.Biol.,3:284-290[1999];Christians等人,Nat.Biotechnol.,17:259-264[1999];Crameri等人,Nature,391:288-291[1998];Crameri,等人,Nat.Biotechnol.,15:436-438[1997];Zhang等人,Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997];Crameri等人,Nat.Biotechnol.,14:315-319[1996];Stemmer,Nature,370:389-391[1994];Stemmer,Proc.Nat.Acad.Sci.USA,91:10747-10751[1994];WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和WO 2009/152336,其全部通过引用并入本文)。
在一些实施方案中,诱变处理后获得的酶克隆通过以下来筛选:使酶经历指定的温度(或其他测定条件,诸如测试酶对宽范围的底物的活性),并测量热处理或其他测定条件之后剩余的酶活性的量。然后包含编码亚胺还原酶多肽的多核苷酸的克隆被测序以鉴定核苷酸序列的改变(如果有的话),并且用于在宿主细胞中表达酶。测量来自表达文库的酶活性可以使用本领域已知的任何合适的方法(例如,标准生物化学技术,诸如HPLC分析)进行。
在一些实施方案中,可以对在诱变处理后获得的克隆筛选具有一种或更多种期望的改进的酶性质(例如,改进的区域选择性(regioselectivity))的工程化亚胺还原酶。测量来自表达文库的酶活性可以使用诸如以下的标准生物化学技术进行:HPLC分析和/或产物的衍生(分离前或分离后),例如使用丹磺酰氯或OPA(参见例如,Yaegaki等人,JChromatogr.356(1):163-70[1986])。
当已知工程化多肽的序列时,编码该酶的多核苷酸可以根据已知的合成方法通过标准固相方法来制备。在一些实施方案中,多达约100个碱基的片段可以被单独地合成、然后连接(例如,通过酶促连接方法或化学连接方法或聚合酶介导的方法)以形成任何期望的连续序列。例如,编码亚胺还原酶的部分的多核苷酸和寡核苷酸可以通过如本领域已知的化学合成来制备(例如Beaucage等人,Tet.Lett.22:1859-69[1981]的经典的亚磷酰胺法、或由Matthes等人,EMBO J.3:801-05[1984]描述的方法),因为它典型地以自动合成方法实施。根据亚磷酰胺方法,寡核苷酸被合成(例如,在自动DNA合成仪中)、纯化、退火、连接并克隆到适当的载体中。此外,可以从各种商业来源中的任一个获得基本上任何核酸。在一些实施方案中,通过合成含有缺失、插入和/或取代的寡核苷酸并且以各种排列组合寡核苷酸可以产生另外的变化,以产生具有改进性质的工程化亚胺还原酶。
因此,在一些实施方案中,用于制备工程化亚胺还原酶多肽的方法包括:(a)合成编码多肽的多核苷酸,该多肽包含与选自SEQ ID NO:6-802的偶数编号序列的氨基酸序列具有至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%或更多的序列同一性,并且与SEQ ID NO:4、16、50、306、648和/或708相比具有一个或更多个残基差异,其中该残基差异选自表5.1、表6.1、表7.1、表8.1、表9.1和表10.1中的任一个残基差异;和(b)表达由多核苷酸编码的亚胺还原酶多肽。
在方法的一些实施方案中,多核苷酸编码任选地具有一个或数个(例如多达3个、4个、5个或多达10个)氨基酸残基缺失、插入和/或取代的工程化亚胺还原酶。在一些实施方案中,氨基酸序列任选地具有1个-2个、1个-3个、1个-4个、1个-5个、1个-6个、1个-7个、1个-8个、1个-9个、1个-10个、1个-15个、1个-20个、1个-21个、1个-22个、1个-23个、1个-24个、1个-25个、1个-30个、1个-35个、1个-40个、1个-45个或1个-50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个或50个氨基酸残基缺失、插入和/或取代。在一些实施方案中,氨基酸序列任选地具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个或25个氨基酸残基缺失、插入和/或取代。在一些实施方案中,取代可以是保守取代或非保守取代。
在一些实施方案中,可以使用用于蛋白纯化的熟知技术中的任何一种或更多种,从细胞和/或培养基中回收在宿主细胞中表达的工程化亚胺还原酶的任一种,用于蛋白纯化的熟知技术除了其他以外包括,溶菌酶处理、超声处理、过滤、盐析、超离心和色谱法。用于裂解和从细菌诸如大肠杆菌高效提取蛋白的合适的溶液是商业上可获得的(例如,CelLytic BTM,Sigma-Aldrich,St.Louis MO)。
用于分离亚胺还原酶多肽的色谱技术包括,除了其他以外,反相色谱法、高效液相色谱法、离子交换色谱法、凝胶电泳和亲和色谱法。用于纯化特定酶的条件将部分地取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等因素,并且对于本领域技术人员将是明显的。
在一些实施方案中,亲和技术可以被用于分离改进的亚胺还原酶。对于亲和色谱纯化,可以使用特异性结合亚胺还原酶多肽的任何抗体。为了产生抗体,可以通过注射亚胺还原酶多肽或其片段来免疫各种宿主动物,包括但不限于兔、小鼠、大鼠等。亚胺还原酶多肽或片段可以通过侧链官能团或附接至侧链官能团的接头的方式附接至合适的载体诸如BSA。在一些实施方案中,亲和纯化可以使用结合亚胺还原酶的特异性配体或染料亲和柱(参见例如,EP0641862;Stellwagen,“Dye Affinity Chromatography,”于Current Protocols in Protein Science,Unit 9.2-9.2.16[2001])。
使用工程化亚胺还原酶的方法
在一些实施方案中,本文所述的亚胺还原酶可用于将一种或更多种合适的底物转化为产物的方法。
在另一方面,本文公开的工程化多肽可在用于将底物化合物(2)或其结构类似物和底物化合物(3)或其结构类似物转化成化合物(1)的产物或相应的结构类似物的方法中使用。通常化合物(1)的结构类似物被包括于结构式(IV)内。
在一些实施方案中,本公开内容提供了用于制备结构式(IV)的化合物的方法:
Figure BDA0003448136950000851
其中
R1选自氢原子、或任选地被取代的烷基、烯基、炔基、烷氧基、芳基烷氧基、羟烷基、杂烷基、杂烯基、杂炔基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基;和
R2独立地选自烷基、烯基、炔基、羟烷基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、烷基氨基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基;和
R3独立地选自甲基、d3-甲基和乙基;
该方法包括在合适的反应条件下使结构式(V)的酮底物和式(VI)的胺底物与本文公开的工程化多肽接触的步骤:
Figure BDA0003448136950000852
从而制备式(IV)的产物。
在一些实施方案中,本公开内容提供了制备化合物(1)的方法;
Figure BDA0003448136950000861
该方法包括在合适的反应条件下使化合物(2)的底物
Figure BDA0003448136950000862
和化合物(3)的底物
Figure BDA0003448136950000863
与本文公开的工程化多肽接触的步骤,从而制备化合物(1)的产物。
来源于节杆菌属种菌株1C的野生型酶的工程化的亚胺还原酶多肽能够有效地将底物化合物(2)和底物化合物(3)转化为产物化合物(1),但是也能够有效地将一系列式(I)的酮底物化合物和式(II)的胺底物化合物转化为式(III)的仲胺和叔胺产物化合物,如以下表2中列出的转化反应(A)至(E)所示。
Figure BDA0003448136950000864
Figure BDA0003448136950000871
本发明提供了许多具有亚胺还原酶活性的示例性工程化多肽。这些示例性多肽从先前工程化的多肽SEQ ID NO:4、16、50、306、648和/或708(它们通过从SEQ ID NO:2的野生型CENDH定向演化获得)演化并表现出改进的性质,特别是在各种酮和胺底物的转化方面增加的活性和稳定性,包括化合物(2a)和化合物(3a)向胺产物化合物(1a)的转化,化合物(2)和化合物(3a)向胺产物化合物(1b)的转化,化合物(2a)和化合物(3b)向胺产物化合物(1c)的转化,化合物(2)和化合物(3c)向胺产物化合物(1d)的转化,以及化合物(2)和化合物(3b)向胺产物化合物(1e)的转化。表5.1、表6.1、表7.1、表8.1、表9.1和表10.1中的结果提供了对一系列酮和胺底物具有增加的亚胺还原酶活性和/或稳定性的变体。
本发明的示例性非天然存在的(或工程化的)亚胺还原酶多肽的结构和功能信息是基于在这些酶的定向演化中使用的五种不同的高通量(HTP)筛选测定:化合物(2a)和化合物(3a)向胺产物化合物(1a)的转化,化合物(2)和化合物(3a)向胺产物化合物(1b)的转化,化合物(2a)和化合物(3b)向胺产物化合物(1c)的转化,化合物(2)和化合物(3c)向胺产物化合物(1d)的转化,以及化合物(2)和化合物(3b)向胺产物化合物(1e)的转化。
因此,在一些实施方案中,本发明的具有亚胺还原酶活性的工程化多肽(其具有与选自偶数编号序列标识符SEQ ID NO:4-802的参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列,且与SEQ ID NO:2相比在选自本文提供的那些残基位置处具有一个或更多个残基差异)能够在合适的反应条件下进行一种或更多种下列转化反应,相对于偶数编号序列标识符SEQ ID NO:4-802的参考多肽具有改进的活性和/或改进的立体选择性:
(a)底物化合物(2a)和底物化合物(3a)向产物化合物(1a)的转化;
(b)底物化合物(2)和底物化合物(3a)向产物化合物(1b)的转化;
(c)底物化合物(2a)和底物化合物(3b)向产物化合物(1c)的转化;
(d)底物化合物(2)和底物化合物(3c)向产物化合物(1d)的转化;和
(e)底物化合物(2)和底物化合物(3b)向产物化合物(1e)的转化。
在一些实施方案中,具有亚胺还原酶活性并且能够在合适的反应条件下以改进的活性和/或立体选择性催化一个或更多个上述转化反应(A)–(E)的工程化多肽包含与偶数编号序列标识符SEQ ID NO:4-802之一具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列,以及如表5.1、表6.1、表7.1、表8.1、表9.1和表10.1中提供的偶数编号序列标识符SEQ ID NO:4-802中的任一个中存在的与SEQ ID NO:2相比的氨基酸残基差异。
在一些实施方案中,具有亚胺还原酶活性并且能够在合适的反应条件下以改进的活性和/或立体选择性催化一个或更多个上述转化反应(A)–(E)的工程化多肽具有包含选自偶数编号序列标识符SEQ ID NO:4-802的序列的氨基酸序列。本发明的工程化多肽所来源的节杆菌属种菌株C1的野生型冠瘿碱脱氢酶SEQ ID NO:2(CENDH)在将化合物(2)的酮底物和化合物(3)的胺底物转化为仲胺产物化合物(1)方面不具有可检测到的活性。然而,在一些实施方案中,具有亚胺还原酶活性的工程化多肽能够将本文提供的酮底物和胺底物转化为本文描述的仲胺产物化合物。
在本文提供且在实施例中说明的实施方案中,可以在该方法中使用的合适的反应条件的各种范围包括但不限于底物载量、共底物载量、pH、温度、缓冲剂、溶剂体系、多肽载量和反应时间。用于使用本文描述的工程化亚胺还原酶进行底物化合物向产物化合物的生物催化转化的另外的合适反应条件可以根据本文提供的指导通过常规实验容易地优化,其包括但不限于使工程化亚胺还原酶多肽和一种或更多种底物化合物在浓度、pH、温度和溶剂条件的实验反应条件下接触,并检测产物化合物。
考虑到例如产物化合物的期望量、每种底物浓度对酶活性的影响、酶在反应条件下的稳定性和每种底物向产物的转化百分比,反应混合物中的底物化合物可以变化。在一些实施方案中,合适的反应条件包括对于一种或更多种底物的每一种,至少约0.5g/L至约25g/L、1g/L至约25g/L、5g/L至约25g/L、约10g/L至约25g/L或20g/L至约25g/L的底物化合物载量。在一些实施方案中,合适的反应条件包括对于一种或更多种底物的每一种,至少约0.5g/L、至少约1g/L、至少约5g/L、至少约10g/L、至少约15g/L、至少约20g/L或至少约30g/L或甚至更大的底物化合物载量。
在进行本文描述的亚胺还原酶介导的方法时,工程化多肽可以以纯化的酶、部分纯化的酶、用编码该酶的基因转化的完整的细胞、这样的细胞的提取物和/或裂解物、和/或固定在固体支持物上的酶的形式添加到反应混合物中。用编码工程化亚胺还原酶的基因转化的完整细胞或细胞提取物、其裂解物和分离的酶可以以各种不同的形式使用,包括固体(例如冻干、喷雾干燥等)或半固体(例如粗制糊状物)。细胞提取物或细胞裂解物可以通过沉淀(硫酸铵、聚乙烯亚胺、热处理等)部分纯化,然后在冻干之前进行脱盐程序(例如超滤、透析等)。任何酶制品(包括完整细胞制品)可以通过使用已知的交联剂(诸如例如戊二醛)交联或固定于固相(例如Eupergit C等)来稳定。
编码工程化亚胺还原酶多肽的基因可以被单独地转化到宿主细胞中或一起转化到同一宿主细胞中。例如,在一些实施方案中,一组宿主细胞可以用编码一种工程化亚胺还原酶多肽的基因转化,并且另一组宿主细胞可以用编码另一种工程化亚胺还原酶多肽的基因转化。两组转化的细胞可以以完整细胞的形式或以源自其的裂解物或提取物的形式一起用于反应混合物中。在其他实施方案中,宿主细胞可以用编码多于一种工程化亚胺还原酶多肽的基因转化。在一些实施方案中,工程化多肽可以以分泌的多肽的形式表达,并且含有分泌的多肽的培养基可以用于亚胺还原酶反应。
在一些实施方案中,本文公开的工程化亚胺还原酶多肽的改进的活性和/或区域选择性和/或立体选择性提供了其中可以用更低浓度的工程化多肽实现更高转化百分比的方法。在该方法的一些实施方案中,合适的反应条件包括底物化合物载量的约1%(w/w)、2%(w/w)、5%(w/w)、10%(w/w)、20%(w/w)、30%(w/w)、40%(w/w)、50%(w/w)、75%(w/w)、100%(w/w)或更高的工程化多肽的量。
在一些实施方案中,工程化多肽以约0.01g/L至约50g/L;约0.05g/L至约50g/L;约0.1g/L至约40g/L;约1g/L至约40g/L;约2g/L至约40g/L;约5g/L至约40g/L;约5g/L至约30g/L;约0.1g/L至约10g/L;约0.5g/L至约10g/L;约1g/L至约10g/L;约0.1g/L至约5g/L;约0.5g/L至约5g/L或约0.1g/L至约2g/L存在。在一些实施方案中,亚胺还原酶多肽以约0.01g/L、0.05g/L、0.1g/L、0.2g/L、0.5g/L、1g/L、2g/L、5g/L、10g/L、15g/L、20g/L、25g/L、30g/L、35g/L、40g/L或50g/L存在。
在反应过程期间,反应混合物的pH可以变化。反应混合物的pH可以保持在期望的pH或在期望的pH范围内。这可以通过在反应过程之前和/或期间添加酸或碱来进行。可选地,可以通过使用缓冲剂来控制pH。因此,在一些实施方案中,反应条件包括缓冲剂。保持期望的pH范围的合适的缓冲剂是本领域已知的,并且包括例如但不限于硼酸盐、磷酸盐、2-(N-吗啉代)乙磺酸(MES)、3-(N-吗啉代)丙磺酸(MOPS)、乙酸盐、三乙醇胺和2-氨基-2-羟甲基-丙-1,3-二醇(Tris)等。在一些实施方案中,反应条件包括作为合适溶剂的水,而不存在缓冲剂。
在方法的实施方案中,反应条件包括合适的pH。期望的pH或期望的pH范围可通过使用酸或碱、合适的缓冲剂、或缓冲和酸或碱添加的组合来保持。反应混合物的pH可以在反应过程之前和/或期间控制。在一些实施方案中,合适的反应条件包括约4至约10的pH、约5至约10的pH、约5至约9的pH、约6至约9的pH、约6至约8的pH的溶液。在一些实施方案中,反应条件包括约4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5或10的pH的溶液。
在本文的方法的实施方案中,使用合适的温度用于反应条件,例如考虑到反应速率在较高温度的增加和反应时间段期间酶的活性。因此,在一些实施方案中,合适的反应条件包括约10℃至约60℃、约10℃至约55℃、约15℃至约60℃、约20℃至约60℃、约20℃至约55℃、约25℃至约55℃或约30℃至约50℃的温度。在一些实施方案中,合适的反应条件包括约10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃或60℃的温度。在一些实施方案中,酶促反应期间的温度可以在整个反应过程中保持在特定温度。在一些实施方案中,酶促反应期间的温度可以在反应过程期间随温度曲线的变化进行调节。
在一些实施方案中,本发明的方法在溶剂中进行。合适的溶剂包括水、水性缓冲溶液、有机溶剂、聚合物溶剂和/或共溶剂体系,其通常包含水性溶剂、有机溶剂和/或聚合物溶剂。水性溶剂(水或水性共溶剂体系)可以是pH缓冲的或非缓冲的。在一些实施方案中,使用工程化亚胺还原酶多肽的方法可以在包含以下的水性共溶剂体系中进行:有机溶剂(例如乙醇、异丙醇(IPA)、二甲基亚砜(DMSO)、二甲基甲酰胺(DMF)、乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯等)、离子或极性溶剂(例如1-乙基4-甲基咪唑鎓四氟硼酸盐、1-丁基-3-甲基咪唑鎓四氟硼酸盐、1-丁基3-甲基咪唑鎓六氟磷酸盐、甘油、聚乙二醇等)。在一些实施方案中,共溶剂可以是极性溶剂,诸如多元醇、二甲基亚砜(DMSO)或低级醇。水性共溶剂体系的非水性共溶剂组分可以与水性组分混溶,从而提供单一液相,或者可以与水性组分部分地混溶或不混溶,从而提供两个液相。示例性的水性共溶剂体系可以包含水和选自有机溶剂、极性溶剂和多元醇溶剂的一种或更多种共溶剂。通常,选择水性共溶剂体系的共溶剂组分,使得其在反应条件下不会不利地使亚胺还原酶失活。通过利用酶活性测定(诸如本文描述的那些)测量特定的工程化亚胺还原酶与限定的感兴趣的底物在候选溶剂体系中的酶活性可以容易地鉴定适当的共溶剂体系。
在方法的一些实施方案中,合适的反应条件包括水性共溶剂,其中共溶剂包含约1%至约50%(v/v)、约1%至约40%(v/v)、约2%至约40%(v/v)、约5%至约30%(v/v)、约10%至约30%(v/v)或约10%至约20%(v/v)的DMSO。在方法的一些实施方案中,合适的反应条件可以包括包含约1%(v/v)、约5%(v/v)、约10%(v/v)、约15%(v/v)、约20%(v/v)、约25%(v/v)、约30%(v/v)、约35%(v/v)、约40%(v/v)、约45%(v/v)或约50%(v/v)的乙醇的水性共溶剂。
在一些实施方案中,反应条件包括用于稳定或增强反应的表面活性剂。表面活性剂可以包括非离子表面活性剂、阳离子表面活性剂、阴离子表面活性剂和/或两亲性表面活性剂。示例性的表面活性剂包括,例如但不限于,壬基苯氧基聚乙氧基乙醇(NP40)、TRITONTMX-100聚乙二醇叔辛基苯基醚、聚氧乙烯-硬脂酰胺、十六烷基三甲基溴化铵、油烯基酰氨基硫酸钠、聚氧乙烯脱水山梨糖醇单硬脂酸酯、十六烷基二甲基胺等。可以使用任何可以稳定或增强反应的表面活性剂。在反应中使用的表面活性剂的浓度通常可以是0.1mg/ml至50mg/ml,特别地1mg/ml至20mg/ml。
在一些实施方案中,反应条件包括消泡剂,其有助于减少或防止在反应溶液中形成泡沫,诸如当反应溶液被混合或喷洒时。消泡剂包括非极性油(例如矿物油、硅酮等)、极性油(例如脂肪酸、烷基胺、烷基酰胺、烷基硫酸酯(alkyl sulfate)等)和疏水性物(例如处理的二氧化硅、聚丙烯等),其中一些也发挥表面活性剂的功能。示例性的消泡剂包括
Figure BDA0003448136950000921
(Dow Corning)、聚二醇共聚物、氧基/乙氧基化醇和聚二甲基硅氧烷。在一些实施方案中,消泡剂可以以约0.001%(v/v)至约5%(v/v)、约0.01%(v/v)至约5%(v/v)、约0.1%(v/v)至约5%(v/v)或约0.1%(v/v)至约2%(v/v)存在。在一些实施方案中,消泡剂可以以约0.001%(v/v)、约0.01%(v/v)、约0.1%(v/v)、约0.5%(v/v)、约1%(v/v)、约2%(v/v)、约3%(v/v)、约4%(v/v)或约5%(v/v)或更高存在,如促进反应所期望的。
在亚胺还原酶反应中使用的反应物的量通常将取决于期望的产物的量以及伴随的所使用的亚胺还原酶底物的量而变化。本领域普通技术人员将容易地理解如何改变这些量以将它们定制到期望的生产率和生产规模的水平。
在一些实施方案中,添加反应物的顺序不是关键的。反应物可以一起同时添加到溶剂(例如单相溶剂、双相水性共溶剂体系等)中,或者可选地,一些反应物可以分开添加,而一些反应物可以在不同的时间点一起添加。例如,辅因子、共底物和底物可以首先添加到溶剂中。
固体反应物(例如酶、盐等)可以以各种不同的形式(包括粉末(例如冻干粉末、喷雾干燥粉末等)、溶液、乳液、悬浮液等)提供给反应。使用本领域普通技术人员已知的方法和设备,可以容易地将反应物冻干或喷雾干燥。例如,蛋白溶液可以在-80℃以小等分试样冷冻,然后添加到预冷的冻干室中,随后施加真空。
当使用水性共溶剂体系时,为了提高混合效率,可以首先将亚胺还原酶和共底物添加并混合到水相中。亚胺还原酶底物可以被添加并混合进去,然后是有机相,或者底物可以被溶解在有机相中并混合进去。可选地,亚胺还原酶底物可以在有机相中预混合,然后添加到水相中。
通常允许本发明的方法进行,直到底物向产物的进一步转化不随反应时间显著变化(例如少于10%的底物被转化或少于5%的底物被转化)。在一些实施方案中,允许反应进行直到底物完全或接近完全转化为产物。底物向产物的转化可以使用已知方法通过检测底物和/或产物(伴随或不伴随衍生化)来监测。合适的分析方法包括气相色谱法、HPLC、MS等。
在方法的一些实施方案中,合适的反应条件包括对于一种或更多种底物的每一种,至少约5g/L、10g/L、20g/L或更高的底物载量,并且其中该方法在约24h或更少、在约12h或更少、在约6h或更少或在约4h或更少的时间内产生至少约50%、60%、70%、80%、90%、95%或更高的底物化合物向产物化合物的转化。
当在合适的反应条件下在方法中使用时,本发明的工程化亚胺还原酶多肽产生相比于不期望的产物至少90%、95%、96%、97%、98%、99%或更高非对映异构体过量的期望的产物的过量。
在使用工程化亚胺还原酶多肽将一种或更多种化合物转化为产物化合物的方法的一些另外的实施方案中,合适的反应条件可以包括在反应溶液中对于一种或更多种底物的每一种的初始底物载量,然后与多肽接触。然后该反应溶液进一步补充以连续或分批添加的另外的底物化合物,对于一种或更多种底物的每一种,以至少约1g/L/h、至少约2g/L/h、至少约4g/L/h、至少约6g/L/h或更高的速率随时间添加。因此,根据这些合适的反应条件,对于一种或更多种底物的每一种,多肽被添加到具有至少约1g/L、5g/L或10g/L的初始底物载量的溶液中。在多肽的这种添加之后,然后对于一种或更多种底物的每一种,以约2g/L/h、4g/L/h或6g/L/h的速率向溶液连续添加另外的底物,直到对于一种或更多种底物的每一种达到高得多的至少约30g/L或更高的最终底物载量。因此,在方法的一些实施方案中,合适的反应条件包括将多肽添加到具有至少约1g/L、5g/L或10g/L的初始底物载量的溶液中,然后以约2g/L/h、4g/L/h或6g/L/h的速率向溶液添加另外的底物直到对于一种或更多种底物的每一种达到至少约30g/L或更高的最终底物载量。该底物补充反应条件允许达到更高的底物载量,同时对于一种或更多种底物的每一种或两者,保持底物向产物的至少约5%、25%、50%、75%、90%或更高的底物转化的高转化率。
本文公开的使用工程化多肽来制备式(IV)化合物或化合物(1)的任何方法可以在合适的反应条件范围(包括但不限于胺底物范围、酮底物范围、温度、pH、溶剂体系、底物载量、多肽载量、辅因子载量和反应时间)下进行。在一种实例中,在一些实施方案中,可以进行式(IV)化合物或化合物(1)的制备,其中合适的反应条件包括:(a)约1g/L至50g/L底物化合物的胺底物载量;(b)约1g/L至50g/L底物化合物的酮底物载量;(c)约0.5g/L至10g/L的工程化多肽;(d)0-20%DMSO;(e)1g/L的PDH辅因子循环酶、0.1g/L的NAD+辅因子和高达20g/L的亚磷酸酯;(f)约30℃至60℃的温度。在一些实施方案中,合适的反应条件包括:(a)约2g/L的胺底物化合物;(b)约2g/L的酮底物化合物;(c)约5g/L的工程化多肽;(d)5%DMSO;(e)1g/L PDH辅因子循环酶、0.1g/L NAD+辅因子和20g/L亚磷酸酯;和(f)约30℃。
在一些实施方案中,进行另外的反应组分或另外的技术以补充反应条件。这些可以包括采取措施以稳定酶或防止酶失活、减少产物抑制、使反应平衡向期望产物的形成移动。
在另外的实施方案中,用于将一种或更多种底物化合物转化为产物化合物的任何上文描述的方法还可以包括一个或更多个选自以下的步骤:产物化合物的提取、分离、纯化和结晶。用于从通过上文公开的方法产生的生物催化反应混合物提取、分离、纯化和/或结晶产物的方法、技术和方案是普通技术人员已知的和/或通过常规实验获得的。此外,在下文的实施例中提供了说明性方法。
本发明的各种特征和实施方案在以下代表性实施例中进行了说明,这些实施例旨在说明而非限制。
实验
提供以下实施例,包括实验和获得的结果,仅用于说明的目的,而不应被解释为限制本发明。
在下文的实施例中,适用以下缩写:ppm(百万分率(parts per million));M(摩尔/升);mM(毫摩尔/升),uM和μM(微摩尔/升);nM(纳摩尔/升);mol(摩尔);gm和g(克);mg(毫克);ug和μg(微克);L和l(升);ml和mL(毫升);cm(厘米);mm(毫米);um和μm(微米);sec.(秒);min(s)(分钟);h(s)和hr(s)(小时);U(单位);MW(分子量);rpm(每分钟转数);psi和PSI(磅/平方英寸);℃(摄氏度);RT和rt(室温);CAM和cam(氯霉素);DMSO(二甲基亚砜);PMBS(硫酸多粘菌素B);IPTG(异丙基β-D-1-硫代吡喃半乳糖苷);LB(Luria-Bertani肉汤);TB(Terrific肉汤;12g/L细菌用胰蛋白胨、24g/L酵母提取物、4mL/L甘油、65mM磷酸钾,pH7.0,1mM MgSO4);HEPES(HEPES两性离子缓冲剂;4-(2-羟乙基)-哌嗪乙磺酸);SFP(摇瓶粉末);CDS(编码序列);DNA(脱氧核糖核酸);RNA(核糖核酸);大肠杆菌W3110(常用的实验室大肠杆菌菌株,从Coli Genetic Stock Center[CGSC],New Haven,CT可获得);HTP(高通量);HPLC(高压液相色谱);FIOPC(比阳性对照提高的倍数);Microfluidics(Microfluidics,Corp.,Westwood,MA);Sigma-Aldrich(Sigma-Aldrich,St.Louis,MO;Difco(Difco Laboratories,BD Diagnostic Systems,Detroit,MI);Agilent(AgilentTechnologies,Inc.,Santa Clara,CA);Corning(Corning,Inc.,Palo Alto,CA);DowCorning(Dow Corning,Corp.,Midland,MI)和Gene Oracle(Gene Oracle,Inc.,MountainView,CA)。
实施例1
包含重组CENDH基因的大肠杆菌表达宿主
使用GeneIOS合成平台(GeneOracle)对报道的来自节杆菌属种菌株C1的野生型冠瘿碱脱氢酶多肽(CENDH)进行密码子优化,并合成为SEQ ID NO:2的基因。将野生型CENDH编码基因克隆到表达载体pCK110900(参见美国专利申请公布第2006/0195947号的图3)中,可操作地连接到在lacl阻遏子的控制下的lac启动子。所述表达载体还包含P15a复制起点和氯霉素抗性基因。使用本领域已知的标准方法将所得质粒转化到大肠杆菌W3110fhuA中。如本领域已知的,通过使细胞经受氯霉素选择来分离转化体(参见例如,美国专利第8,383,346号和WO2010/144103)。如美国专利第9,487,760号和第9,695,451号所述,用于产生本发明变体的初始CENDH酶(如SEQ ID NO:4所示)是基于SEQ ID NO:2的基因工程化的。
实施例2
高通量含CENDH的湿细胞沉淀物的制备
将来自单克隆菌落的含有重组CENDH编码基因的大肠杆菌细胞接种到96孔浅孔微量滴定板的孔中的含有1%葡萄糖和30μg/mL氯霉素的180μl LB中。将板用O2可透过的密封件(seal)密封,并使培养物在30℃、200rpm和85%湿度生长过夜。然后,将20μl的每种细胞培养物转移到含有380mL TB和30μg/mL CAM的96孔深孔板的孔中。用O2可透过的密封件密封深孔板,并在30℃、250rpm和85%湿度培养,直到达到OD600 0.6-0.8。然后将细胞培养物用达到1mM的最终浓度的IPTG诱导,并且在与最初使用的相同条件下培养过夜。然后用4000rpm离心10分钟沉淀细胞。在一些情况下,从两个板合并过夜培养物,然后离心,并获得双份沉淀物。弃去上清液,并在裂解前将沉淀在-80℃冷冻。
实施例3
高通量含CENDH的细胞裂解物的制备
首先,向如实施例2中所述地产生的每个孔中的细胞团(cell paste)添加含有200mM三乙醇胺(TEoA)缓冲液pH 8.5、1mg/mL溶菌酶和0.5mg/mL PMBS的200μl裂解缓冲液。伴随在台式振荡器(bench top shaker)上震荡,使细胞在室温裂解2小时。然后将板在4000rpm和4℃离心15min。将澄清的上清液用于生物催化反应以确定其活性水平。
实施例4
从摇瓶(SF)培养物制备冻干裂解物
将如上所述生长的选择的HTP培养物铺到含有1%葡萄糖和30μg/ml CAM的LB琼脂板上并在37℃生长过夜。将来自每种培养物的单个菌落转移到含有1%葡萄糖和30μg/mlCAM的6ml LB中。使培养物在30℃、250rpm生长18h,并以约1:50传代培养至含30μg/ml CAM的250ml TB中,至0.05的最终OD600。使培养物在30℃、250rpm生长约195分钟,达到0.6-0.8之间的OD600,并用1mM IPTG诱导。然后使培养物在30℃、250rpm生长20h。将培养物以4000rpm离心20min。弃去上清液,并将沉淀物重悬于30ml的200mM TEoA缓冲液,pH 8.5中。使细胞沉淀(4000rpm×20min)并且在-80℃冷冻120分钟。将冷冻的沉淀物重悬于30ml的200mM TEoA缓冲液,pH 8.5中,并且使用Microfluidizer系统(Microfluidics)以18,000psi裂解。使裂解物沉淀(10,000rpm×60min)并且将上清液冷冻并冻干以产生摇瓶(SF)酶。
实施例5
在高通量筛选中,CENDH相对于SEQ ID NO:4的活性改进
选择SEQ ID NO:4作为亲本酶,其已经朝向将环己酮和正缬氨酸转化为仲胺产物的改进的亚胺还原酶活性演化。如美国专利第9,487,760号和第9,695,451号所公开的,它相对于SEQ ID NO:2具有一个氨基酸差异(N198H)。SEQ ID NO:4的多肽没有可检测到的将氯代联苯基丙酮酸(化合物(2))和L-丙氨酸酯(化合物(3))转化为其胺产物(化合物(1))或将苯丙酮酸盐(化合物(2a))和L-丙氨酸酯(化合物(3))转化为其胺产物的活性。使用公认的技术(例如饱和诱变、先前鉴定的有益突变的重组)产生工程化基因的文库,以改进其对苯丙酮酸盐(化合物(2a))和L-丙氨酸(化合物(3a))反应产物(化合物(1a))的亚胺还原酶活性。每种基因编码的多肽如实施例2中描述的以HTP产生,获得双份沉淀物,并且可溶性裂解物如实施例3中描述的产生。
为了裂解细胞,向细胞团添加含有200mM TEoA缓冲液pH 8.5、1mg/mL溶菌酶和0.5mg/mL PMBS的200μl裂解缓冲液。伴随在台式振荡器上振荡,在室温孵育细胞2小时。然后将板在4000rpm和4℃离心15min,并将澄清的上清液用于随后的生物催化反应。
HTP反应在含有200μL 0.2M TEoA pH 8.5、2.5g/L苯丙酮酸钠、6g/LL-丙氨酸(~5x摩尔过量)、1g/L葡萄糖脱氢酶(GDH)105(美国专利第7,816,111号和第7,939,309号)、10g/L葡萄糖、3g/L NAD+和5μL或10μL上述HTP上清液的96孔深孔板中进行。将HTP板在Thermotron(3mm摆幅,模式#AJ185,Infors)中在30℃、400rpm孵育12小时。将反应用200μl乙腈猝灭并使用台式振荡器混合5分钟。然后将板以4000rpm离心10分钟。将4uL上清液进一步稀释到3996uL水中,并加载到RapidFire中进行分析,如实施例11所述。
相对于SEQ ID NO:4的活性被计算为比阳性对照提高的倍数(FIOPC)。其通过将指定反应条件下每个样品中的产物质谱信号除以存在于同一板中的亲本变体(阳性对照)中的苯丙酮酸产物(化合物(1a))质谱信号来确定,并在表5.1中示出。
Figure BDA0003448136950000991
实施例6
在高通量筛选中,CENDH相对于SEQ ID NO:16的活性改进
在实施例5中描述的筛选变体后,选择SEQ ID NO:16作为亲本酶。使用公认的技术(例如饱和诱变,先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述的以HTP产生,获得双份沉淀物,并且可溶性裂解物如实施例3中描述的产生。
为了裂解细胞,向细胞团添加含有200mM TEoA缓冲液pH 8.5、1mg/mL溶菌酶和0.5mg/mL PMBS的200μl裂解缓冲液。伴随在台式振荡器上振荡,在室温孵育细胞2小时。然后将板在4000rpm和4℃离心15分钟,并将澄清的上清液用于随后的生物催化反应。
HTP反应在含有200μL 0.2M TEoA pH 8.5、2.5g/L 3-[4-(3-氯苯基)苯基]-2-氧-丙酸(在本文称为氯代联苯基丙酮酸或(化合物(2))、4g/L L-丙氨酸(化合物(3a))(~5x摩尔过量)、1g/L GDH 105、10g/L葡萄糖、3g/L NAD+、5%DMSO和100μl上述HTP上清液的96孔深孔板中进行。将HTP板在Thermotron(3mm摆幅,模式#AJ185,Infors)中在30℃、400rpm孵育12小时。平行地,还进行了苯丙酮酸盐(化合物(2a))和L-丙氨酸反应(化合物(3a))的HTP反应,如实施例5所述。用甲醇中的0.1%甲酸以1:10的比猝灭反应,并使用台式振荡器混合5分钟。然后将平板以4000rpm离心10分钟,将上清液用水以1:40的比进一步稀释,并且然后加载到RapidFire中进行分析,如实施例11所述。
相对于SEQ ID NO:50的活性被计算为比阳性对照提高的倍数(FIOPC)。其通过将指定反应条件下每个样品中的产物质谱信号除以存在于同一板中的亲本变体(阳性对照)中的苯丙酮酸产物(化合物(1a))或氯代联苯基丙酮酸产物(化合物(1b))质谱信号来确定,并如表6.1所示。
Figure BDA0003448136950001001
Figure BDA0003448136950001011
Figure BDA0003448136950001021
Figure BDA0003448136950001031
Figure BDA0003448136950001041
实施例7
CENDH相对于SEQ ID NO:50的活性改进
在实施例6中描述的筛选变体后,选择SEQ ID NO:50作为亲本酶。使用公认的技术(例如饱和诱变,先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述的以HTP产生,获得双份沉淀物,并且可溶性裂解物如实施例3中描述的产生。
为了裂解细胞,向细胞团添加含有200mM TEoA缓冲液pH 8.5、1mg/mL溶菌酶和0.5mg/mL PMBS的300μl裂解缓冲液。伴随在台式振荡器上振荡,在室温孵育细胞2小时。然后将板在4000rpm和4℃离心15分钟,并将澄清的上清液用于随后的生物催化反应。
HTP反应以与实施例6相同的方式进行,以检测氯代联苯基丙酮酸(化合物(2))和L-丙氨酸(化合物(3a))反应产物(化合物(1b))。
相对于SEQ ID NO:50的活性被计算为比阳性对照提高的倍数(FIOPC),并在表7.1中示出。其通过将指定反应条件下每个样品中的产物质谱信号除以存在于同一板中的亲本变体(阳性对照)中的氯代联苯基丙酮酸产物(化合物(1b))质谱信号来确定。
Figure BDA0003448136950001051
Figure BDA0003448136950001061
Figure BDA0003448136950001071
Figure BDA0003448136950001081
Figure BDA0003448136950001091
实施例8
CENDH相对于SEQ ID NO:306的活性改进
在实施例7中描述的筛选变体后,选择SEQ ID NO:306作为亲本酶。使用公认的技术(例如饱和诱变,先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述的以HTP产生,获得双份沉淀物,并且可溶性裂解物如实施例3中描述的产生。
为了裂解细胞,向细胞团添加含有200mM TEoA缓冲液pH 8.5、1mg/mL溶菌酶和0.5mg/mL PMBS的300μl裂解缓冲液。伴随在台式振荡器上振荡,在室温孵育细胞2小时。然后将板在4000rpm和4℃离心15分钟,并将澄清的上清液用于随后的生物催化反应。
HTP反应在含有200μL 0.2M TEoA pH 8.5、1.25g/L氯代联苯基丙酮酸(化合物(2))、3.6g/L 3,3,3-d3 L-丙氨酸酯(化合物(3b))(~5x摩尔过量)、0.5g/L PDH wt、25mM亚磷酸酯、1.5g/L NAD+、5%DMSO和100μl上述HTP上清液的96孔深孔板中进行,以产生化合物(1e)的产物。将HTP板在Thermotron(3mm摆幅,模式#AJ185,Infors)中在30℃、400rpm孵育12小时。还进行了HTP反应以确定苯丙酮酸盐(化合物(2a))和3,3,3-d3 L-丙氨酸酯(化合物(3b))反应产物(化合物(1c))。除了使用1.25g/L苯丙酮酸钠和2.6g/L 3,3,3-d3-丙氨酸酯(~5x摩尔过量)之外,反应条件与上述氯代联苯基丙酮酸反应相同。
用甲醇中的0.1%甲酸以1:10的比猝灭反应,并使用台式振荡器混合5分钟。然后将平板以4000rpm离心10分钟,将上清液用水以1:40的比进一步稀释,并且然后加载到RapidFire中进行分析,如实施例11所述。氯代联苯基丙酮酸和3,3,3-d3 L-丙氨酸酯的HTP反应也用200ul乙腈猝灭,将40uL上清液进一步稀释到160uL 50%乙腈中,并加载到LC-MS中进行分析,如实施例12所述。
HTP反应也在含有200μL 0.2M TEA pH 8.5、1.25g/L氯代联苯基丙酮酸(化合物(2))、~3.6g/L乙基酰胺丙氨酸(化合物(3c))(~5x摩尔过量)、0.5g/L PDH wt、25mM亚磷酸酯、1.5g/L NAD+、5%DMSO和100μl上述HTP上清液的96孔深孔板中进行,以产生化合物(1d)的产物。将HTP板在Thermotron(3mm摆幅,模式#AJ185,Infors)中在30℃、400rpm孵育12小时。将反应用200μl乙腈猝灭并使用台式振荡器混合5分钟。然后将板以4000rpm离心10分钟,将40uL上清液进一步稀释到160uL 50%乙腈中,并加载到LC-MS中进行分析,如实施例12所述。
相对于SEQ ID NO:306的活性被计算为比阳性对照提高的倍数(FIOPC),并在表8.1中示出。其通过将指定反应条件下每个样品中的产物质谱信号除以存在于同一板中的亲本变体(阳性对照)中的D3-氯代联苯基丙酮酸酯产物信号(化合物(1e))、D3-苯丙酮酸酯产物信号(化合物(1c))、D3-氯代联苯基丙酮酸产物信号(不期望的水解的酯底物的产物)、D3-苯丙酮酸酸信号(不期望的水解的酯底物的产物)或氯代联苯基丙酮酸酰胺产物(化合物(1d))质谱信号来确定。
Figure BDA0003448136950001111
Figure BDA0003448136950001121
实施例9
CENDH相对于SEQ ID NO:648的活性改进
在实施例8中描述的筛选变体后,选择SEQ ID NO:648作为亲本酶。使用公认的技术(例如饱和诱变,先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述的以HTP产生,获得双份沉淀物,并且可溶性裂解物如实施例3中描述的产生。
为了裂解细胞,向细胞团添加含有200mM TEoA缓冲液pH 8.5、1mg/mL溶菌酶和0.5mg/mL PMBS的200μl裂解缓冲液。伴随在台式振荡器上振荡,在室温孵育细胞2小时。然后将板在4000rpm和4℃离心15分钟,并将澄清的上清液用于随后的生物催化反应。
HTP反应在含有200μL 0.2M TEoA pH 8.5、1.25g/L氯代联苯基丙酮酸(化合物(2))、3.6g/L 3,3,3-d3 L-丙氨酸酯(化合物(3b))(~5x摩尔过量)、0.5g/L PDH wt、25mM亚磷酸酯、1.5g/L NAD+、5%DMSO和100μL上述HTP上清液的96孔深孔板中进行。将HTP板在Thermotron(3mm摆幅,模式#AJ185,Infors)中在30℃、400rpm孵育12小时。将HTP板在Thermotron(3mm摆幅,模式#AJ185,Infors)中在30℃、400rpm孵育12小时。用甲醇中的0.1%甲酸以1:10的比猝灭反应,并使用台式振荡器混合5分钟。然后将平板以4000rpm离心10分钟,将上清液用水以1:40的比进一步稀释,并且然后加载到RapidFire中进行分析,如实施例11所述。还将所有样品用200μl乙腈猝灭,将40uL上清液进一步稀释到160uL 50%乙腈中,并加载到LC-MS中进行分析,如实施例12所述。
相对于SEQ ID NO:648的活性被计算为比阳性对照提高的倍数(FIOPC),并在表9.1中示出。其通过将指定反应条件下每个样品中的产物质谱信号除以存在于同一板中的亲本变体(阳性对照)中的氯代联苯基丙酮酸酯产物(化合物(1e))或D3-氯-联苯丙酮酸产物(不期望的水解的酯底物的产物)质谱信号来确定。
Figure BDA0003448136950001131
Figure BDA0003448136950001141
Figure BDA0003448136950001151
实施例10
CENDH相对于SEQ ID NO:708的活性改进
在实施例9中描述的筛选变体后,选择SEQ ID NO:708作为亲本酶。使用公认的技术(例如饱和诱变,先前鉴定的有益突变的重组)产生工程化基因的文库。每种基因编码的多肽如实施例2中描述的以HTP产生,获得单份沉淀物,并且可溶性裂解物如实施例3中描述的产生。
为了裂解细胞,向细胞团添加含有200mM TEoA缓冲液pH 8.5、1mg/mL溶菌酶和0.5mg/mL PMBS的200μl裂解缓冲液。伴随在台式振荡器上振荡,在室温孵育细胞2小时。然后将板在4000rpm和4℃离心15分钟,并将澄清的上清液用于随后的生物催化反应。
HTP反应在含有200μL 0.2M TEoA pH 8.5、1.25g/L氯代联苯基丙酮酸(化合物(2))、3.5g/L L-丙氨酸酯(化合物(3))(~5x摩尔过量)、0.5g/L PDH wt、20mM亚磷酸酯、1.5g/L NAD+、5%DMSO和50μL上述HTP上清液的96孔深孔板中进行。将HTP板在Thermotron(3mm摆幅,模式#AJ185,Infors)中在30℃、600rpm孵育20小时。然后如实施例9所述猝灭反应并进一步分析。
相对于SEQ ID NO:708的活性被计算为比阳性对照提高的倍数(FIOPC),并在表10.1中示出。其通过将指定反应条件下每个样品中的产物质谱信号除以存在于同一板中的亲本变体(阳性对照)中的氯代联苯基丙酮酸酯产物(化合物(1))质谱信号来确定。
Figure BDA0003448136950001161
实施例11
CENDH反应产物的RapidFire分析检测
使用下表11.1中描述的仪器和参数,通过RapidFire SPE-MS/MS分析实施例5-10中制备的HTP测定混合物中苯丙酮酸丙氨酸产物(化合物(1a))、氯代联苯基丙氨酸产物(化合物(1b))、D3标记的苯丙酮酸丙氨酸酯产物(化合物(1c))、D3标记的氯代联苯基丙氨酸酯产物(化合物(1e))和氯代联苯基丙氨酸酯产物(化合物(1))的非对映异构体形式的形成。
Figure BDA0003448136950001162
Figure BDA0003448136950001171
Figure BDA0003448136950001181
实施例12
CENDH反应产物的LC-UV-MS分析检测
使用表12.1中所示的仪器参数和条件,使用LC-MS方法分析实施例8-10中的一部分样品和实施例8中的所有HTP氯代联苯基丙酮酸和乙基酰胺丙氨酸反应混合物。如实施例中所述,它们被制备为水和乙腈中的稀释液。使用产物的质量来确定产物异构体的峰。基于LC-MS,所有(D3)-氯代联苯基丙酮酸产物均被检测为非对映异构体形式。所有(D3)-氯代联苯基丙酮酸酯产物(化合物(1e))均被检测为在1.1min洗脱的s,r产物异构体。对于氯代联苯基丙酮酸乙基酰胺产物(化合物(1d))检测到四个峰,假设每个峰代表四种对映异构体中的一种,并且所有峰用于计算氯代联苯基丙酮酸乙基酰胺产物的活性。
Figure BDA0003448136950001182
Figure BDA0003448136950001191
出于所有目的,本申请中引用的所有出版物、专利、专利申请和其他文件在此通过引用以其整体并入,其程度如同每个单独的出版物、专利、专利申请或其他文件被单独地指出出于所有目的通过引用并入一样。
虽然已经说明和描述了各种特定实施方案,但是将理解,可以做出各种改变而不偏离本发明的精神和范围。

Claims (35)

1.一种工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:4、16、50、306、648和/或708具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列或其功能片段,其中所述工程化多肽在所述多肽序列中包含至少一个取代或取代集,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:4、16、50、306、648和/或708编号。
2.根据权利要求1所述的工程化多肽,其中所述多肽包含与表5.1、表6.1、表7.1、表8.1、表9.1和/或表10.1中列出的至少一种工程化多肽的序列至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列。
3.根据权利要求1所述的工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:4具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,包含选自以下一个或更多个位置处的至少一个取代或取代集:222、145、146、153、160、223、226和261,其中所述位置参考SEQ ID NO:4编号。
4.根据权利要求1所述的工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:16具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,包含选自以下一个或更多个位置处的至少一个取代或取代集:29/94/184/223/232/288/293、29/94/184/232/287/288/293/311、29/94/184/232/287/288/311、29/94/184/232/287/293/332、29/94/184/232/288/293/311/324/353、29/94/184/232/288/311/324/332、29/94/184/232/293、29/94/184/232/311、29/94/184/287/293、29/94/184/287/293/311/353、29/94/184/287/311、29/94/184/288/293/324、29/94/184/288/293/332/353、29/94/184/288/298/332、29/94/184/288/353、29/94/184/293/311、29/94/184/324、29/94/223/232/287、29/94/223/232/293/311/324、29/94/223/288/293、29/94/232/287/288/311、29/94/232/288/293、29/94/287/288/293、29/94/287/288/293/353、29/94/287/311、29/94/293/311/324、29/94/293/332/353、29/94/311、29/94/324/353、29/184、29/184/223/288/293/324、29/184/232/288、29/184/287、29/184/287/288/293、29/184/287/288/293/311、29/184/287/311/332、29/184/288/293、29/184/288/293/311、29/184/293、29/184/293/311、29/184/293/324、29/184/353、29/223/287/288/293/353、29/232/287/288/293/332/353、29/287/288/293、29/287/288/293/324/353、29/288/293、29/311、29/311/332、29/353、72/94/184/288/311、86、94/96/223/287/288/293/311/324/332、94/99/184/293/311/332/353、94/184/223、94/184/223/232/287/311、94/184/223/288/293、94/184/223/293、94/184/232/287/288、94/184/232/287/288/324/332、94/184/232/287/293、94/184/232/287/293/332、94/184/287/288/293、94/184/287/288/311、94/184/287/293/311/324/353、94/184/287/311、94/184/287/353、94/184/288/293、94/184/288/293/311、94/184/288/293/311/332、94/184/293、94/184/293/311、94/184/293/332/353、94/223/232/311/353/355/356/357/358/359、94/223/287/288/293、94/223/288/293/311、94/232/287/288/293/353、94/232/288/293/353、94/232/293、94/232/293/324/332、94/232/311、94/287/288/293、94/287/288/311/324、94/288/293、94/288/293/324、94/293/324、94/311/324、153、184/223、184/223/287/288/353、184/232/287/288/293/311、184/232/287/288/324/353、184/232/287/293/332、184/287/288、184/287/288/293、184/287/288/293/324/353、184/287/293、184/287/293/311、184/288/293/311/324、184/332/353、205、223/232/287/288/332/353、223/287/288、223/287/288/293/311、223/287/311/353、223/288/293、232/287/288/293、232/287/288/293/311、232/287/288/293/321、232/287/311、232/288/293、232/288/293/332、234/287/288/293/311、287/288/293、287/288/311/324、287/293、287/311、287/311/332、287/324、288/293、288/293/311/324/353、288/293/324、293/311和311/332,其中所述位置参考SEQ ID NO:16编号。
5.根据权利要求1所述的工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:50具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,包含选自以下一个或更多个位置处的至少一个取代或取代集:29/57/94/153/184/205/261/265/287、29/57/94/153/205/265、29/57/94/184/205/277/353、29/57/94/205/259/261/265、29/57/94/205/261/353、29/57/153/184/205/259/261/265/277、29/57/153/184/205/353、29/57/153/205/261/265、29/57/153/205/261/265/277、29/57/153/205/265/277、29/57/153/205/277/353、29/57/184/205/259/261/265/277/287/357、29/57/184/205/259/261/265/287、29/57/205/259/261/265、29/57/205/259/261/265/287、29/57/205/261/265/353、29/94/153/184/205、29/94/153/205/259/261/265、29/94/153/205/259/261/287、29/94/153/205/259/261/287/353、29/94/184/205/259/261、29/94/184/205/261、29/94/205、29/94/205/259/261/287、29/94/205/261、29/94/261/265/287/353、29/153/184/205、29/153/205、29/153/205/259/261/265/277/287、29/153/261/265/287/353、29/184/205、29/184/205/259/261/277、29/184/205/353、29/184/261/265、29/184/265、29/205、29/205/259/261、29/205/259/261/265/287、29/205/259/261/287、29/205/261、29/205/261/265、29/205/261/265/353、29/205/261/353、29/205/277、29/205/287、29/205/287/353、29/259/261/265、29/261/353、57/94/153/184/205/259/261、57/94/153/205/261/265、57/94/153/259/261/265、57/94/153/261/265、57/94/184/205/261/265/287、57/94/184/261/265/287、57/94/205/259、57/94/205/259/261/265/277/287、57/94/205/261/265、57/94/205/277、57/153/205/259/261/265/287、57/153/205/259/265/277、57/153/205/261、57/153/205/261/265、57/153/205/265、57/153/261/265、57/153/261/265/287/353、57/205、57/205/259/261、57/205/259/261/265/277/287/353、57/205/259/261/287/353、57/205/259/265、57/205/261、57/205/261/265/277/287/353、57/205/261/277、57/205/261/277/353、57/261/265/353、94/126/184/205/259/261/265、94/153/184/205、94/153/184/259/261/265、94/153/205/259/261/265/353、94/153/205/287、94/153/205/287/353、94/153/205/353、94/184/205/259/261、94/184/205/259/261/265/287、94/184/205/259/261/353、94/184/205/261/265/287/353、94/184/353、94/205、94/205/259/261/265、94/205/259/261/265/277/287、94/205/259/261/265/353、94/205/259/261/287/353、94/205/261/265/277、94/205/261/265/353、94/205/261/353、94/205/277、94/259/261/265、153/184/205/261/277/287、153/184/261/265/287、153/205、153/205/261、153/205/261/265/287、153/259/261/265、153/259/265/287、153/261/265、153/261/265/287/353、153/265、153/265/277/287/353、184/205、184/205/259/261/287、184/205/261、184/205/261/265、184/205/261/287、184/205/277、184/205/287/353、184/261/265/287、202、205、205/259/261、205/259/261/265、205/259/261/265/277/287/353、205/259/261/277/287、205/259/265、205/261、205/261/265、205/261/265/274、205/261/265/287、205/261/265/287/353、205/261/277、205/261/353、205/277/287、205/287、223、225、256、259/261/265、261/265/287、265/287、283和294,其中所述位置参考SEQ ID NO:50编号。
6.根据权利要求1所述的工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:306具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,包含选自以下一个或更多个位置处的至少一个取代或取代集:197/198/201/259、198/201/259/280、202/205/221/223/225/261、202/205/221/223/261/294、202/221/222/225/256/261/294、202/221/223/225/283/294、205/221/222、205/221/223/225/256/261/283、219、221/222/223/225、221/223、221/223/225、221/223/225/256/261、221/223/225/261、221/223/225/294、221/225、221/225/256、221/225/256/261、221/225/256/261/283/294、223/225/256/261、225/256/261、280和280/306,其中所述位置参考SEQ IDNO:306编号。
7.根据权利要求1所述的工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:648具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,包含选自以下一个或更多个位置处的至少一个取代或取代集:17/198/259/280、197、197/198、197/198/223/259、197/223/277/280、197/259、197/277、198、198/223、198/223/259/277/280、198/259、198/259/277、198/259/277/280、198/277/280、223/259、223/259/280、258、259、259/268/277/280、259/277、259/280、263、277和280,其中所述位置参考SEQ ID NO:648编号。
8.根据权利要求1所述的工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:708具有至少80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%序列同一性的氨基酸序列,包含选自以下一个或更多个位置处的至少一个取代或取代集:141、154、197、197/198和278,其中所述位置参考SEQ ID NO:708编号。
9.根据权利要求1所述的工程化多肽,其中所述工程化多肽包含与SEQ ID NO:4、16、50、306、648和/或708至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列或其功能片段。
10.根据权利要求1所述的工程化多肽,其中所述工程化多肽包括SEQ ID NO:4、16、50、306、648和/或708或其功能片段。
11.根据权利要求1所述的工程化多肽,其中所述多肽包含与SEQ ID NO:6至SEQ IDNO:802中列出的任何偶数编号序列具有至少80%序列同一性的氨基酸序列。
12.根据权利要求1所述的工程化多肽,其中所述工程化多肽包括SEQ ID NO:6-802的偶数编号序列中列出的多肽序列。
13.根据权利要求1-12中任一项所述的工程化多肽,其中所述工程化多肽包含与SEQID NO:4的工程化多肽相比表现出至少一种改进的性质的多肽序列。
14.根据权利要求13所述的工程化多肽,其中所述改进的性质包括结构式(IV)化合物的改进的产生
Figure FDA0003448136940000051
其中
R1选自氢原子、或任选地被取代的烷基、烯基、炔基、烷氧基、芳基烷氧基、羟烷基、杂烷基、杂烯基、杂炔基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基;并且其中
R2独立地选自烷基、烯基、炔基、羟烷基、羧基、氨基羰基、杂烷基、杂烯基、杂炔基、羧基烷基、烷基氨基、卤代烷基、烷硫基烷基、环烷基、芳基、芳基烷基、杂环烃基、杂芳基和杂芳基烷基;并且其中
R3独立地选自甲基、d3-甲基和乙基。
15.根据权利要求13所述的工程化多肽,其中所述改进的性质包括化合物(1)的改进的产生
Figure FDA0003448136940000061
16.根据权利要求13所述的工程化多肽,其中所述改进的性质包括改进的对化合物(2)的利用
Figure FDA0003448136940000062
17.根据权利要求13所述的工程化多肽,其中所述改进的性质包括改进的对化合物(3)的利用
Figure FDA0003448136940000063
18.根据权利要求13所述的工程化多肽,其中所述改进的性质包括
化合物(1)
Figure FDA0003448136940000071
从化合物(2)
Figure FDA0003448136940000072
和化合物(3)
Figure FDA0003448136940000073
的改进的产生。
19.根据权利要求13所述的工程化多肽,其中所述改进的性质包括表2中一个或更多个转化反应(A)至(E)的改进的转化。
20.根据权利要求13所述的工程化多肽,其中所述改进的性质包括改进的对映选择性。
21.根据权利要求13所述的工程化多肽,其中所述改进的性质包括改进的稳定性。
22.根据权利要求1-21中任一项所述的工程化多肽,其中所述工程化多肽是纯化的。
23.一种组合物,所述组合物包含至少一种根据权利要求1-22中任一项提供的多肽。
24.一种工程化多核苷酸序列,所述工程化多核苷酸序列编码至少一种根据权利要求1-22中任一项所述的工程化多肽。
25.一种工程化多核苷酸序列,所述工程化多核苷酸序列编码至少一种工程化多肽,其中所述多核苷酸序列包含与SEQ ID NO:3、15、49、305、647和/或707的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中所述多肽的多核苷酸序列在一个或更多个位置处包含至少一个取代。
26.根据权利要求24或25所述的工程化多核苷酸序列,其中所述多核苷酸序列包含与SEQ ID NO:3、15、49、305、647和/或707的至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
27.根据权利要求24-26中任一项所述的工程化多核苷酸序列,其中所述多核苷酸序列包括SEQ ID NO:3、15、49、305、647和/或707。
28.一种工程化多核苷酸,所述工程化多核苷酸包括SEQ ID NO:5至SEQ ID NO:801中列出的奇数编号序列。
29.一种载体,所述载体包含根据权利要求24至28中任一项所述的工程化多核苷酸。
30.根据权利要求29所述的载体,所述载体还包含至少一种控制序列。
31.一种宿主细胞,所述宿主细胞包含根据权利要求29和/或30所述的载体。
32.根据权利要求31所述的宿主细胞,其中所述宿主细胞产生至少一种根据权利要求1-22中任一项所述的工程化多肽。
33.一种以宿主细胞产生工程化多肽的方法,所述方法包括在合适的条件下在培养基中培养根据权利要求31和/或32所述的宿主细胞,从而产生至少一种工程化多肽。
34.根据权利要求33所述的方法,所述方法还包括回收所述工程化多肽的步骤。
35.根据权利要求33和/或34所述的方法,所述方法还包括纯化所述至少一种工程化多肽的步骤。
CN202080048335.4A 2019-05-01 2020-04-23 工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法 Pending CN114127272A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962841633P 2019-05-01 2019-05-01
US62/841,633 2019-05-01
PCT/US2020/029507 WO2020223102A1 (en) 2019-05-01 2020-04-23 Engineered imine reductases and methods for the reductive amination of ketone and amine compounds

Publications (1)

Publication Number Publication Date
CN114127272A true CN114127272A (zh) 2022-03-01

Family

ID=73028685

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080048335.4A Pending CN114127272A (zh) 2019-05-01 2020-04-23 工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法

Country Status (8)

Country Link
US (1) US20220213518A1 (zh)
EP (1) EP3963057A4 (zh)
JP (1) JP2022533010A (zh)
CN (1) CN114127272A (zh)
CA (1) CA3136828A1 (zh)
IL (1) IL287633A (zh)
SG (1) SG11202110852RA (zh)
WO (1) WO2020223102A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114774383A (zh) * 2022-04-29 2022-07-22 上海健康医学院 一类亚胺还原酶突变体及其在催化合成手性2-芳基吡咯烷中的应用

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116286700A (zh) * 2021-10-18 2023-06-23 迪嘉药业集团股份有限公司 一种亚胺还原酶突变体及用途
CN117363667B (zh) * 2023-12-07 2024-03-22 欣雅利华生物技术(上海)有限公司 亚胺还原酶在制备达泊西汀中间体和/或达泊西汀中的用途

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104428313A (zh) * 2012-05-11 2015-03-18 科德克希思公司 工程化亚胺还原酶以及用于酮和胺化合物的还原胺化的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6643987B2 (ja) * 2013-11-13 2020-02-12 コデクシス, インコーポレイテッド ケトン化合物およびアミン化合物の還元的アミノ化のための操作されたイミンレダクターゼおよび方法
JP6719463B2 (ja) * 2014-11-25 2020-07-15 コデクシス, インコーポレイテッド ケトン化合物およびアミン化合物の還元的アミノ化のための操作されたイミンレダクターゼおよび方法
JP7316662B2 (ja) * 2016-08-26 2023-07-28 コデクシス, インコーポレイテッド 操作されたイミンレダクターゼ、ならびにケトン化合物およびアミン化合物の還元的アミノ化のための方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104428313A (zh) * 2012-05-11 2015-03-18 科德克希思公司 工程化亚胺还原酶以及用于酮和胺化合物的还原胺化的方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114774383A (zh) * 2022-04-29 2022-07-22 上海健康医学院 一类亚胺还原酶突变体及其在催化合成手性2-芳基吡咯烷中的应用
CN114774383B (zh) * 2022-04-29 2024-03-12 安徽趣酶生物科技有限公司 一类亚胺还原酶突变体及其在催化合成手性2-芳基吡咯烷中的应用

Also Published As

Publication number Publication date
US20220213518A1 (en) 2022-07-07
JP2022533010A (ja) 2022-07-21
CA3136828A1 (en) 2020-11-05
EP3963057A4 (en) 2023-06-14
SG11202110852RA (en) 2021-10-28
IL287633A (en) 2021-12-01
WO2020223102A1 (en) 2020-11-05
EP3963057A1 (en) 2022-03-09

Similar Documents

Publication Publication Date Title
CN107904216B (zh) 工程化亚胺还原酶以及用于酮和胺化合物的还原胺化的方法
US11359183B2 (en) Engineered transaminase polypeptides for industrial biocatalysis
CN106232619B (zh) 工程化的亚胺还原酶和用于酮和胺化合物的还原胺化的方法
CN109715817B (zh) 用于化合物的羟基化的生物催化剂和方法
US11987818B2 (en) Engineered imine reductases and methods for the reductive amination of ketone and amine compounds
CN114127272A (zh) 工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法
US20240002816A1 (en) Engineered transaminase polypeptides
EP4065704A1 (en) Biocatalysts and methods for hydroxylation of chemical compounds
CN114096662A (zh) 工程化葡萄糖脱氢酶和用于酮和胺化合物的还原胺化的方法
EP4217502A1 (en) Engineered biocatalysts and methods for synthesizing chiral amines

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination