CN115427557A - 工程化转氨酶多肽 - Google Patents
工程化转氨酶多肽 Download PDFInfo
- Publication number
- CN115427557A CN115427557A CN202180027564.2A CN202180027564A CN115427557A CN 115427557 A CN115427557 A CN 115427557A CN 202180027564 A CN202180027564 A CN 202180027564A CN 115427557 A CN115427557 A CN 115427557A
- Authority
- CN
- China
- Prior art keywords
- engineered transaminase
- sequence
- seq
- polypeptide
- transaminase
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1096—Transferases (2.) transferring nitrogenous groups (2.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P17/00—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
- C12P17/18—Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
- C12P17/182—Heterocyclic compounds containing nitrogen atoms as the only ring heteroatoms in the condensed system
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Biotechnology (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本公开内容提供了可用于在工业相关条件下合成手性胺化合物的工程化转氨酶多肽。本公开内容还提供了编码工程化转氨酶多肽的多核苷酸、能够表达工程化转氨酶的宿主细胞和使用工程化转氨酶产生手性胺化合物的方法。
Description
本申请要求2020年4月10日提交的美国临时专利申请序号63/008,047的优先权,该美国临时专利申请为了所有目的通过引用以其整体并入。
对序列表、表格或计算机程序的引用
序列表的正式副本作为ASCII格式的文本文件经由EFS-Web与本说明书同时提交,文件名为“CX2-197WO1_ST25.txt”,创建日期为2021年4月5日,且大小为2.53兆字节。经由EFS-Web提交的序列表为本说明书的一部分并且通过引用以其整体并入本文。
发明领域
本公开内容提供了可用于在工业过程条件下产生药物和精细化学胺化合物的工程化转氨酶多肽。
背景
转氨酶(E.C.2.6.1)催化氨基基团、一对电子和质子从氨基供体化合物转移至氨基受体化合物的酮基基团。转氨酶反应可以导致手性胺产物化合物的形成。如方案1中示出的,氨基受体化合物(B)(它是期望的手性胺产物(D)的酮基底物前体)在存在转氨酶的情况下与氨基供体化合物(A)反应。转氨酶催化氨基供体化合物(A)的伯胺基团转移至氨基受体化合物(B)的酮基基团。转氨酶反应产生手性胺产物化合物(D)(假定R3与R4不同)以及具有酮基基团的新的氨基受体副产物(或“羰基副产物”)化合物(C)。
方案1
手性胺化合物作为中间体或合成子常被用在制药、农业化学和化学工业中,用于制备广泛范围的商业上期望的化合物,诸如头孢菌素或吡咯烷衍生物。通常,手性胺化合物的这些工业应用涉及仅利用分子的一种特定的立体异构形式(例如,只有(R)或(S)对映异构体具有生理学活性)。转氨酶是高度立体选择性的,并且具有许多用于合成光学纯手性胺化合物的潜在工业用途。
转氨酶用于制备手性胺化合物的实例包括:氨基酸的对映异构体富集(参见例如,Shin等人,Biosci.Biotechnol.Biochem.,65:1782-1788[2001];Iwasaki等人,Biotech.Lett.,25:1843-1846[2003];Iwasaki等人,Appl.Microbiol.Biotech.,69:499-505[2004];Yun等人,Appl.Environ.Microbiol.,70:2529-2534[2004];和Hwang等人,Enz.Microbiol.Technol.,34:429-426[2004]);普瑞巴林的中间体和前体的制备(例如,WO2008/127646);环巴胺类似物的酶促转氨基作用(例如,WO2011/017551);β-氨基酸的立体特异性合成和对映异构体富集(例如,WO2005/005633);胺类的对映异构体富集(参见例如,美国专利第US 4,950,606号;美国专利第5,300,437号;和美国专利5,169,780号);氨基酸及衍生物的产生(参见例如,美国专利第5,316,943号;美国专利第4,518,692号;美国专利第4,826,766号;美国专利第6,197,558号;和美国专利第4,600,692号);以及药物化合物西他列汀、卡巴拉汀和维那卡兰的产生(参见例如,美国专利第8,293,507号;Savile等人,Sci.,329:305-9[2010];WO2011/159910;和WO2012/024104)。
具有催化方案1的反应的能力的野生型转氨酶已经被从多种微生物分离出,所述多种微生物包括但不限于反消化产碱菌(Alcaligenes denitrificans)、支气管败血性博德特菌(Bordetella bronchiseptica)、副百日咳博德特菌(Bordetella parapertussis)、羊布鲁式杆菌(Brucella melitensis)、鼻疽伯克氏菌(Burkholderia mallei)、类鼻疽伯克氏菌(Burkholderia pseudomallei)、青紫色素杆菌(Chromobacterium violaceum)、Oceanicola granulosus HTCC2516、海洋杆菌属种(Oceanobacter sp.)RED65、海洋螺菌属种(Oceanospirillum sp.)MED92、恶臭假单胞菌(Pseudomonas putida)、青枯雷尔氏菌(Ralstonia solanacearum)、苜蓿根瘤菌(Rhizobium meliloti)、根瘤菌属种(Rhizobiumsp.)(菌株NGR234)、苏云金芽孢杆菌(Bacillus thuringensis)、肺炎克雷伯杆菌(Klebsiella pneumonia)、河流弧菌(Vibrio fluvialis)(参见例如,Shin等人,Biosci.Biotechnol,Biochem.,65:1782-1788[2001])、和节杆菌属种(Arthrobacter sp.)KNK168(参见例如,Iwasaki等人,Appl.Microbiol.Biotechnol.,69:499-505[2006];和美国专利第7,169,592号)。这些野生型转氨酶基因和编码的多肽中的若干种已经被测序(例如,青枯雷尔氏菌[Genbank登录号YP_002257813.1,GI:207739420]、类鼻疽伯克氏菌1710b[Genbank登录号ABA47738.1,GI:76578263]、百日咳博德特菌(Bordetella petrii)[Genbank登录号AM902716.1,GI:163258032]、河流弧菌JS17[Genbank登录号AEA39183.1,GI:327207066]和节杆菌属种KNK168[GenBank登录号BAK39753.1,GI:336088341])。EC2.6.1.18和EC2.6.1-19类的至少两种野生型转氨酶已经被结晶并结构上表征(参见例如,Yonaha等人,Agric.Biol.Chem.,47:2257-2265[1983])。
具有(R)-选择性的或(S)-选择性的立体选择性的转氨酶是已知的。例如,认为来自节杆菌属种KNK168的野生型转氨酶是(R)-选择性的并从某些底物主要产生(R)-胺化合物(参见例如,Iwasaki等人,Appl.Microbiol.Biotechnol.,69:499-505[2006];和美国专利第7,169,592号),而认为来自河流弧菌JS17的野生型转氨酶是(S)-选择性的并从某些底物主要产生(S)-胺化合物(参见例如Shin等人,Appl.Microbiol.Biotechnol.,61:463-471[2003])。
非天然存在的具有(R)-选择性、增加的溶剂稳定性和热稳定性、以及对于转化广泛范围的氨基受体底物的其他改进的特性的转氨酶已经通过对野生型和其他工程化转氨酶骨架序列的诱变和/或定向演化生成(参见例如,美国专利第8,293,507B2号;WO2011/005477A1;WO2012/024104;和Savile等人,Sci.,329:305-9[2010])。
然而,转氨酶通常具有对于制备手性胺化合物的商业应用不期望的特性,诸如对工业上可用的工艺条件(例如,溶剂、温度)的不稳定性、对商业上可用的氨基受体和/或氨基供体底物的差的识别和立体选择性、以及由于不利的反应平衡造成的低的产物产率。因此,对于可以在用于制备光学活性形式的手性胺化合物的工业过程中使用的工程化转氨酶存在需求。
发明概述
本公开内容提供了具有转氨酶活性的工程化多肽、编码该多肽的多核苷酸、制备该多肽的方法、及使用该多肽用于氨基受体底物化合物(即,包含酮基基团的化合物)向手性胺产物化合物的生物催化转化的方法。本公开内容的转氨酶多肽已经被工程化为具有与先前(氨基酸序列为SEQ ID NO:4的)工程化转氨酶多肽相比的一个或更多个残基差异以及相对于SEQ ID NO:4的转氨酶和SEQ ID NO:2的野生型转氨酶的相关增强的溶剂稳定性和热稳定性。氨基酸残基差异位于导致多种酶特性的改进的残基位置处,所述酶特性包括活性、立体选择性、稳定性、表达和产物耐受性以及其他。
特别地,本公开内容的工程化转氨酶多肽已经被工程化为用于如方案2中示出的底物(R)-21-(二氟甲基)-5-甲基-21H-3-氮杂-1(4,2)-吡啶杂-2(2,3)-吡咯杂环九蕃-4,9-二酮(本文中称为“化合物(1)”)向其对应的手性胺产物化合物(5R,9S)-9-氨基-21-(二氟甲基)-5-甲基-21H-3-氮杂-1(4,2)-吡啶杂-2(2,3)-吡咯杂环九蕃-4-酮(本文中称为“化合物(2)”)的有效转化。
方案2
在一些实施方案中,本公开内容提供了与SEQ ID NO:2、4、8、366和/或650具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的工程化转氨酶或其功能片段,其中所述工程化转氨酶在所述多肽序列中包含至少一个取代或取代集,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:2、4、8、366和/或650编号。在一些实施方案中,工程化转氨酶包括包含与SEQ ID NO:4的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:21/163/286/291/314/316/323/383/388/408/414/416、18、20、21、21/23/56/146、21/23/56/146/432、21/23/146/417、21/23/395/417/432、21/53/56、21/53/417、21/56/395、21/417/432、23、23/53、23/53/56、23/53/56/146/395、23/53/395、23/53/417、23/53/432、23/56、23/56/395、23/56/395/417、23/395/417、23/417、23/417/432、53、53/56、53/146/417、53/395、56、56/74/241/286/314/316/323、56/86/163/314/316/383/414/416/422、56/86/286/314/414/416、56/86/314/316/323/394/414/422、56/146/417、56/146/432、56/147、56/163、56/163/286/316/323/383/394、56/286/314/316/323/422、56/286/383、56/323、56/323/383、56/323/383/394、56/383、56/395、74/81/286/316/323/383、74/85/86/163/286/316/323/394、74/85/314/316/414/416、74/86/163/316、74/86/316/323/383/394、74/88/286/316/323/383、74/88/323/383、74/163/286/316/383/394/416、74/163/314/316、74/163/314/316/323/394、74/163/314/323/383/414/416、74/286、74/286/316/323、74/286/394/416、74/314/323/383/394/414、74/316/323/394、85/86/88/163/323/383/394、85/86/163/314/323/394/414、85/286、85/286/323、86、86/88/163/323/383/414/422、86/383/394、88、88/163/286/383、88/286/316/323、88/286/316/323/383/414/416、88/316/323、146、146/147/395/417、146/395、146/395/417、146/417、147/395/417/432、147/417、149、157、163、163/222/286/316/323/383/394、163/286、163/286/314/316/323/414/416、163/286/314/323/394、163/286/316/323/394/416、163/286/414、163/314/316/394、163/314/323/394、163/314/383、163/314/414、163/316/323、163/323、163/383、164、199/417、259、260、284、286、286/314/323/383、286/314/394、286/316/323/383/414/416、286/316/383/394、286/316/394/414/416、286/323、286/323/383/414、286/323/416、286/383、286/416、314/316、314/316/323、314/316/323/383/422、314/316/323/394、314/316/394、314/323/383/394、314/383、314/383/414/422、315、316、316/323/383/394、316/323/394/414/416、316/414/422、323、323/383、323/383/394/414/416、323/394、383、395、395/417、395/417/432、400、401、403、404、405、406、408、415、417、417/432、420和422,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:4编号。在一些另外的实施方案中,工程化转氨酶包括包含与SEQ ID NO:4的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:74/81/286/316/323/383、163/286/314/316/323/414/416、163/286/314/323/394、286/314/323/383、286/316/323/383/414/416、315和408,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:4编号。在一些另外的实施方案中,工程化转氨酶包括包含与SEQ ID NO:8的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:5、18/23/149/260/383/395/401/416、18/23/149/383、18/163/164、21、21/163/315/316、21/163/323/408、21/408、23/56/86/149/163/164/383/401/416、23/86、23/149/260、23/149/284/383/395、23/163/164/383、23/163/164/401/416、24、42、42/110、42/187/272、42/187/324/363/366、42/187/353、42/272/291、42/272/291/363、42/272/324/363/366、42/272/363/410、42/272/410、42/291/313/363/410、42/291/363、42/291/363/366、42/353、42/363、46、66、77、86/149/163/164/383/395/401、86/149/395、86/163/164/260/383、86/383、107、110、110/187、110/187/253/410、134、138、149/164/260/383/395/401、149/260/383、149/416、163/259/323/408、163/259/408、163/315/316、164/260/401、164/316/383/401、167、186、187、187/253/363/366、187/272/324/363/410、187/272/363、187/272/363/366/410、187/291、189、191、195、199、203、210、211、248、259/307、260/395/401、272、272/353、272/363/366、272/410、277、291、305、309、315、342、343、351、354、358、361、362、363、363/366、365、367、383、383/401、383/416/422、385、388、389、392、395、396、401、404、405、408、410、416、417、439、443、447、450和451,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:8编号。在又一些另外的实施方案中,工程化转氨酶包括包含与SEQ ID NO:8的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:18/23/149/383、21/163/323/408、272、291和383,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:8编号。在一些另外的实施方案中,工程化转氨酶包括包含与SEQ ID NO:366的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:24、24/42/66/291、24/42/291/362、24/66/163/191/362/383/388、24/66/191/199/260/291/351、24/66/191/199/291、24/66/191/260/408、24/66/260/291/383/388/408、24/66/291/342/383、24/66/291/365、24/66/342/365/388/408、24/77/291、24/107/163/191/291/351/383/388、24/107/291/351/365/388、24/163/351/383、24/191/291/365、24/199/260/351/362/383、24/199/260/362/383/388、24/260/362/383/388、24/291、24/291/342/351/383、24/291/362/388、24/291/408、24/383/388、24/388、25、28、33、42/191/408、42/199/291/383、42/291/351/362/365/383/388、42/291/351/362/383/408、42/291/383/388、66/82/291/383、66/163/191/365/383、66/199/351/383、66/291、66/291/362/365/383、66/291/383/388、66/383、77/291、77/383/388、86、107/191/199/365/383/388、107/191/291/383、148、153、163/291/362/365/383/388、163/291/383/388、163/383、191/199/365/383/388、191/260/388、191/291、191/291/342/362/365、191/351/383/388、199/260/383、199/291、260、260/291/365/383/408、260/365/383、291、291/351/383/388、291/351/383/388/408、291/362/365、291/365/388、291/383、314、315、316、319、342/362、351/383/388、362、362/388、383、383/388、396、397、405、406、413、419和423,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:366编号。在一些另外的实施方案中,工程化转氨酶包括包含与SEQ ID NO:366的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:24/66/191/199/291、24/66/291/365、163/291/362/365/383/388、163/291/383/388、191/291/342/362/365、291和291/383,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:366编号。在又一些另外的实施方案中,工程化转氨酶包括包含与SEQ ID NO:650的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:10、13、13/24/108/163、13/24/108/163/311、13/24/133/199/311、13/24/163、13/24/199/311、13/108、13/108/199、13/108/311、13/199、13/311、14、14/24/108、14/24/108/133、14/24/108/199、14/24/199、14/108、14/108/133/311、14/108/311、14/311、24、24/163、24/163/199、35、72、73、78、95、101、108、108/199、114、154、163、169、175/316、199、199/311、226、293、311、316、382、383和386,并且其中所述多肽序列的氨基酸位置参考SEQID NO:650编号。在又一些另外的实施方案中,工程化转氨酶包括包含与SEQ ID NO:650的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性的多肽序列,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:14/108/133/311、24/163/199、72、78、316和383,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:650编号。
在一些另外的实施方案中,工程化转氨酶包括包含与表2-1、表2-2、表3-1、表3-2、表4-1、表4-2、表5-1和/或表5-2中列出的至少一种工程化转氨酶变体的序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列。在又一些另外的实施方案中,工程化转氨酶是表2-1、表2-2、表3-1、表3-2、表4-1、表4-2、表5-1和/或表5-2中提供的变体工程化转氨酶。在一些另外的实施方案中,工程化转氨酶包含与SEQ ID NO:2、4、8、366和/或650中列出的至少一种工程化转氨酶变体的序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列。在一些另外的实施方案中,工程化转氨酶包括包含SEQID NO:2、4、8、366和/或650的多肽序列。在一些另外的实施方案中,工程化转氨酶包含与SEQ ID NO:6-936中的偶数编号序列中列出的至少一种工程化转氨酶变体的序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多相同的多肽序列。在又一些另外的实施方案中,工程化转氨酶包含SEQ ID NO:6-936中的偶数编号序列中列出的多肽序列。在一些另外的实施方案中,工程化转氨酶与野生型河流弧菌(V.fluvialis)转氨酶相比包含至少一种改进的特性。在一些另外的实施方案中,工程化转氨酶的改进的特性包括改进的对底物的活性。在一些另外的实施方案中,底物包括化合物(1)。在一些另外的实施方案中,工程化转氨酶的改进的特性包括改进的热稳定性。在一些另外的实施方案中,工程化转氨酶是纯化的。本公开内容还提供了组合物,所述组合物包含本文提供的工程化转氨酶。在一些实施方案中,组合物包含多于一种本文提供的工程化转氨酶。
本公开内容还提供了编码至少一种本文提供的工程化转氨酶的多核苷酸序列。在一些实施方案中,多核苷酸序列编码至少一种工程化转氨酶,所述多核苷酸序列包含与SEQID NO:3、7、365和/或649至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中所述工程化转氨酶的多核苷酸序列包含一个或更多个位置处的至少一个取代。在一些另外的实施方案中,多核苷酸序列编码至少一种包含与SEQ ID NO:2、4、8、366和/或650的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的工程化转氨酶或其功能片段。在又一些另外的实施方案中,多核苷酸序列被可操作地连接到控制序列。在又一些另外的实施方案中,多核苷酸序列是密码子优化的。
本公开内容还提供了包含编码至少一种本文提供的工程化转氨酶的多核苷酸序列的表达载体。在一些实施方案中,表达载体包含至少一种多核苷酸序列,该多核苷酸序列包含与SEQ ID NO:3、7、365和/或649的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中所述工程化转氨酶的多核苷酸序列包含一个或更多个位置处的至少一个取代。在一些实施方案中,表达载体包含编码至少一种工程化转氨酶或其功能片段的多核苷酸序列,该多核苷酸序列包含与SEQ IDNO:3、7、365和/或649的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
本公开内容还提供了包含至少一种本文提供的表达载体的宿主细胞。在一些实施方案中,宿主细胞包含至少一种本文提供的多核苷酸序列。在一些实施方案中,宿主细胞包含至少一种多核苷酸序列,该多核苷酸序列包含与SEQ ID NO:3、7、365和/或649的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中编码工程化转氨酶的多核苷酸序列包含一个或更多个位置处的至少一个取代。在一些实施方案中,宿主细胞包含编码至少一种工程化转氨酶或其功能片段的多核苷酸序列,该工程化转氨酶包含与SEQ ID NO:2、4、8、366和/或650的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。在一些实施方案中,至少一种编码工程化转氨酶的多核苷酸序列存在于至少一种表达载体中。
本公开内容还提供了在宿主细胞中产生工程化转氨酶的方法,该方法包括在合适条件下培养本文提供的宿主细胞,使得产生至少一种工程化转氨酶。在一些实施方案中,该方法还包括从培养物和/或宿主细胞回收至少一种工程化转氨酶。在一些另外的实施方案中,该方法还包括纯化所述至少一种工程化转氨酶的步骤。
在一些实施方案中,具有转氨酶活性的工程化多肽被固定在固体支持物上,任选地,其中固体支持物选自包含具有环氧化物官能团的聚甲基丙烯酸酯、具有氨基环氧化物官能团的聚甲基丙烯酸酯、苯乙烯/DVB共聚物或具有十八烷基官能团的聚甲基丙烯酸酯的珠或树脂。
在一些实施方案中,具有转氨酶活性的工程化多肽能够在合适的反应条件下将底物化合物(1)转化为产物化合物(2)。在一些实施方案中,工程化多肽能够在合适的反应条件下以参考序列SEQ ID NO:2、4、8、366和/或650的至少1.2倍、2倍、5倍、10倍、20倍、25倍、50倍、75倍、100倍或更大的活性将化合物(1)转化为化合物(2)。在一些实施方案中,工程化多肽能够以相对于参考序列(例如SEQ ID NO:2、4、8、366和/或650)增加的活性将化合物(1)转化为化合物(2),其中合适的反应条件包括至少100g/L的载量的化合物(1)、约1g/L工程化多肽、约0.5g/L PLP、约1M异丙胺、约pH 9和约50℃。
在一些实施方案中,本公开内容提供了制备化合物(2)
的方法,包括以下步骤:使底物化合物(1)
与如本文公开的工程化多肽在存在氨基基团供体的情况下在合适的反应条件下接触的步骤。
在一些实施方案中,可以进行使用本文公开的工程化多肽的方法,其中以至少90%、97%、98%、99%或更高的对映异构体过量和非对映异构体过量产生化合物(2)。
本文公开的使用工程化多肽用于制备化合物(2)的方法中的任一种可以在一系列合适的反应条件下进行,所述合适的反应条件包括但不限于一系列胺供体、pH、温度、缓冲液、溶剂系统、底物载量、多肽载量、辅因子载量、压力和反应时间。例如,可以在包括以下的合适的反应条件下进行化合物(2)的制备:(a)约10g/L至300g/L底物载量的底物化合物(例如,50g/L或200g/L化合物(1));(b)约0.5g/L至60g/L工程化多肽;(c)约0.5M至2M的IPM浓度;(d)约0.1g/L至1g/L的PLP辅因子浓度;(e)约0%(v/v)至约20%(v/v)的DMSO浓度;(f)约8.5至11.5的pH;和(g)约45℃至65℃的温度。在一些实施方案中,合适的反应条件包括:(a)约100g/L的底物化合物(例如,化合物(1));(b)约1g/L工程化多肽;(c)约1M异丙胺(IPM);(d)约0.5g/L磷酸吡哆醛(PLP);(e)约pH 9;和(f)约50℃。
在一些实施方案中,可以进行使用本文公开的工程化多肽的方法,其中氨基基团供体选自异丙胺、丙氨酸、3-氨基丁酸或甲基苄胺。在一些实施方案中,氨基基团供体是异丙胺。
发明描述
对于本文提供的描述,单数形式的使用包括复数(并且反之亦然),除非另外具体说明。例如,单数形式“一(a)”、“一(an)”和“该(the)”包括复数指代物,除非上下文另外清楚指明。类似地,“包含(comprise)”、“包含(comprises)”、“包含(comprising)”、“包括(include)”、“包括(includes)”和“包括(including)”是可互换的,而不意图是限制性的。
还应理解,在各种实施方案的描述使用术语“包含(comprising)”的情况下,本领域技术人员将理解,在一些特定情况下,实施方案可以使用语言“主要由...组成”或“由...组成”来可选择地描述。
前述的一般性描述,包括附图,和以下的详细描述仅是示例性和说明性的,而不是限制本发明。此外,本文使用的章节标题仅用于组织目的,而不应被解释为限制所描述的主题。
定义
如本文使用的,意图以下术语具有以下含义。参考本发明,本文描述中使用的技术和科学术语将具有本领域普通技术人员通常理解的含义,除非另外具体定义。因此,意图以下术语具有以下含义。另外,本文提及的所有专利和出版物,包括这些专利和出版物中公开的所有序列,都通过引用明确并入。
除非另外指出,否则本公开内容的实践涉及分子生物学、发酵、微生物学和相关领域中常用的常规技术,这些技术是本领域技术人员已知的。除非本文另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。尽管与本文描述的那些相似或等效的任何方法和材料都可用于实践或测试本公开内容,但描述了优选的方法和材料。实际上,意图的是本发明并不受限于本文描述的特定方法、方案和试剂,因为它们可以根据使用它们的环境而变化。本文提供的标题不是可以通过参考作为整体的本说明书而被具有的本发明的各方面或实施方案的限制。因此,以下定义的术语通过参考作为整体的本说明书而被更充分地定义。
尽管如此,但为了便于理解本公开内容,以下定义了许多术语。数值范围包括限定该范围的数字。因此,本文公开的每个数值范围意图包括落在这些较宽数值范围内的每个较窄数值范围,如同这些较窄数值范围在本文中被全部明确记录。还意图本文公开的每个最大(或最小)的数值限制包括每一个更低(或更高)的数值限制,如同这些更低(或更高)的数值限制在本文中被明确记录。
如本文使用的,术语“包含(comprising)”及其同根词以其包含性含义被使用(即,等同于术语“包括(including)”及其相应的同根词)。
如本文和所附权利要求中所使用的,单数形式的“一(a)”、“一(an)”及“该(the)”包括复数的指示物,除非上下文另外清楚地指示。因此,例如,提及“宿主细胞”包括多于一个这样的宿主细胞。
除非另外指示,否则,分别地,核酸以5'至3'方向从左至右书写;并且氨基酸序列以氨基至羧基方向从左至右书写。
如本文使用的,术语“蛋白”、“多肽”和“肽”在本文中可互换使用,以表示通过酰胺键共价连接的至少两个氨基酸的聚合物,而不论长度或翻译后修饰(例如糖基化、磷酸化、脂质化、豆蔻酰化、泛素化等)如何。此定义中包括D-氨基酸和L-氨基酸以及D-氨基酸和L-氨基酸的混合物。
用于遗传编码的氨基酸的缩写是常规的并且如下所示:
当使用三字母缩写时,除非前面具体地有“L”或“D”,或者从使用缩写的上下文中是明确的,否则氨基酸可以关于α-碳(Cα)是L-构型或D-构型。例如,虽然“Ala”表示丙氨酸而不指定关于α-碳的构型,但是“D-Ala”和“L-Ala”分别表示D-丙氨酸和L-丙氨酸。当使用单字母缩写时,大写字母表示呈关于α-碳的L-构型的氨基酸,而小写字母表示呈关于α-碳的D-构型的氨基酸。例如,“A”表示L-丙氨酸并且“a”表示D-丙氨酸。当多肽序列以单字母或三字母缩写(或其混合)的串呈现时,根据通常惯例将序列以氨基(N)至羧基(C)方向呈现。
如本文使用的,“亲水性氨基酸或残基”是指具有根据Eisenberg等人的归一化共识疏水性量表(normalized consensus hydrophobicity scale)表现出小于零的疏水性的侧链的氨基酸或残基(Eisenberg等人,J.Mol.Biol.,179:125-142[1984])。遗传编码的亲水性氨基酸包括L-Thr(T)、L-Ser(S)、L-His(H)、L-Glu(E)、L-Asn(N)、L-Gln(Q)、L-Asp(D)、L-Lys(K)和L-Arg(R)。
如本文使用的,“酸性氨基酸或残基”是指当氨基酸被包含于肽或多肽中时,具有表现出小于约6的pK值的侧链的亲水性氨基酸或残基。由于失去氢离子,酸性氨基酸在生理pH通常具有带负电荷的侧链。遗传编码的酸性氨基酸包括L-Glu(E)和L-Asp(D)。
如本文使用的,“碱性氨基酸或残基”是指当氨基酸被包含于肽或多肽中时,具有表现出大于约6的pK值的侧链的亲水性氨基酸或残基。由于与水合离子的缔合,碱性氨基酸通常在生理pH具有带正电荷的侧链。遗传编码的碱性氨基酸包括L-Arg(R)和L-Lys(K)。
如本文使用的,“极性氨基酸或残基”是指具有在生理pH不带电荷的侧链的亲水性氨基酸或残基,但所述侧链具有至少一个其中两个原子共有的电子对被原子之一更紧密地持有的键。遗传编码的极性氨基酸包括L-Asn(N)、L-Gln(Q)、L-Ser(S)和L-Thr(T)。
如本文使用的,“疏水性氨基酸或残基”是指具有根据Eisenberg等人的归一化共识疏水性量表表现出大于零的疏水性的侧链的氨基酸或残基(Eisenberg等人,J.Mol.Biol.,179:125-142[1984])。遗传编码的疏水性氨基酸包括L-Pro(P)、L-Ile(I)、L-Phe(F)、L-Val(V)、L-Leu(L)、L-Trp(W)、L-Met(M)、L-Ala(A)和L-Tyr(Y)。
如本文使用的,“芳香族氨基酸或残基”是指具有包括至少一个芳香族环或杂芳香族环的侧链的亲水性或疏水性氨基酸或残基。遗传编码的芳香族氨基酸包括L-Phe(F)、L-Tyr(Y)和L-Trp(W)。尽管由于L-His(H)的杂芳香族氮原子的pKa,它有时被归类为碱性残基,或者因为它的侧链包含杂芳香族环而被归类为芳香族残基,但在本文中将组氨酸归类为亲水性残基或“受限残基(constrained residue)”(参见下文)。
如本文使用的,“受限氨基酸或残基”是指具有受限的几何结构(geometry)的氨基酸或残基。本文中,受限残基包括L-Pro(P)和L-His(H)。组氨酸具有受限的几何结构,因为它具有相对较小的咪唑环。脯氨酸具有受限的几何结构,因为它也具有一个五元环。
如本文使用的,“非极性氨基酸或残基”是指具有在生理pH不带电荷的侧链的疏水性氨基酸或残基,并且所述侧链具有其中两个原子共有的电子对通常被两个原子的每一个等同地持有的键(即,侧链不是极性的)。遗传编码的非极性氨基酸包括L-Gly(G)、L-Leu(L)、L-Val(V)、L-Ile(I)、L-Met(M)和L-Ala(A)。
如本文使用的,“脂肪族氨基酸或残基”是指具有脂肪族烃侧链的疏水性氨基酸或残基。遗传编码的脂肪族氨基酸包括L-Ala(A)、L-Val(V)、L-Leu(L)和L-Ile(I)。应注意,半胱氨酸(或“L-Cys”或“[C]”)之所以与众不同,是因为它可以与其他L-Cys(C)氨基酸或其他含巯基(sulfanyl)或硫氢基(sulfhydryl)氨基酸形成二硫桥。“半胱氨酸样残基”包括半胱氨酸和含有可用于形成二硫桥的硫氢基部分的其他氨基酸。L-Cys(C)(和具有含-SH侧链的其他氨基酸)以还原的游离-SH或氧化的二硫桥的形式存在于肽中的能力影响L-Cys(C)是否向肽贡献净的疏水特征或亲水特征。虽然根据Eisenberg的归一化共识量表(Eisenberg等人,1984,同上),L-Cys(C)表现出0.29的疏水性,但应理解,为了本公开内容的目的,将L-Cys(C)归入它自己的独特的组。
如本文使用的,“小氨基酸或残基”是指具有包括总计三个或更少的碳和/或杂原子(不包括α-碳和氢)的侧链的氨基酸或残基。根据上文定义,小氨基酸或残基可以进一步分类为脂肪族、非极性、极性或酸性小氨基酸或残基。遗传编码的小氨基酸包括L-Ala(A)、L-Val(V)、L-Cys(C)、L-Asn(N)、L-Ser(S)、L-Thr(T)和L-Asp(D)。
如本文使用的,“含羟基的氨基酸或残基”是指含有羟基(-OH)部分的氨基酸。遗传编码的含羟基的氨基酸包括L-Ser(S)、L-Thr(T)和L-Tyr(Y)。
如本文使用的,“氨基酸差异”和“残基差异”是指多肽序列的一个位置处的氨基酸残基相对于参考序列中对应位置处的氨基酸残基的差异。本文中氨基酸差异的位置通常被称为“Xn”,其中n是指残基差异所基于的参考序列中的对应位置。例如,“与SEQ ID NO:2相比在位置X40处的残基差异”是指在对应于SEQ ID NO:2的位置40的多肽位置处的氨基酸残基的差异。因此,如果参考多肽SEQ ID NO:2在位置40处具有组氨酸,则“与SEQ ID NO:2相比在位置X40处的残基差异”是指在对应于SEQ ID NO:2的位置40的多肽位置处的除组氨酸以外的任何残基的氨基酸取代。在本文的大多数情况下,在一个位置处的特定氨基酸残基差异被指示为“XnY”,其中“Xn”指定如上文描述的对应位置,并且“Y”是工程化多肽中存在的氨基酸(即,与参考多肽中不同的残基)的单字母标识符。在一些情况下,本公开内容还提供由常规符号“AnB”表示的特定氨基酸差异,其中A是参考序列中的残基的单字母标识符,“n”是参考序列中的残基位置的编号,并且B是工程化多肽序列中残基取代的单字母标识符。在一些情况下,本公开内容的多肽可以包含相对于参考序列的一个或更多个氨基酸残基差异,所述氨基酸残基差异由相对于参考序列存在残基差异的具体位置的列表指示。在一些实施方案中,当多于一个氨基酸可以在多肽的特定残基位置中使用时,可以使用的不同氨基酸残基由“/”隔开(例如,X192A/G)。在一些实施方案中,其中存在具有多于一个取代的变体,取代由分号(;)或斜线(/)隔开(例如,Y17V;I259T;E347K或Y17V/I259T/E347K)。
本公开内容包括包含一个或更多个氨基酸差异的工程化多肽序列,所述一个或更多个氨基酸差异包括保守氨基酸取代和非保守氨基酸取代的任一种/或两者。本公开内容的序列表中包括的特定重组转氨酶多肽的氨基酸序列包括起始甲硫氨酸(M)残基(即,M代表残基位置1)。然而,本领域技术人员理解,该起始甲硫氨酸残基可以通过生物加工机制诸如在宿主细胞或体外翻译系统中被去除,以产生缺少起始甲硫氨酸残基但在其他方面保留酶特性的成熟蛋白。因此,如本文使用的术语“相对于SEQ ID NO:2在位置Xn处的氨基酸残基差异”可以指位置“Xn”或已经被加工使得缺少起始甲硫氨酸的参考序列中的对应位置(例如,位置(X-1)n)。
如本文使用的,措辞“保守氨基酸取代”是指具有相似侧链的残基的可互换性,并且因此通常包括用相同或相似的特定氨基酸类别中的氨基酸取代多肽中的氨基酸。通过实例而非限制的方式,在一些实施方案中,具有脂肪族侧链的氨基酸被另一种脂肪族氨基酸(例如,丙氨酸、缬氨酸、亮氨酸和异亮氨酸)取代;具有羟基侧链的氨基酸被另一种具有羟基侧链的氨基酸(例如,丝氨酸和苏氨酸)取代;具有芳香族侧链的氨基酸被另一种具有芳香族侧链的氨基酸(例如,苯丙氨酸、酪氨酸、色氨酸和组氨酸)取代;具有碱性侧链的氨基酸被另一种具有碱性侧链的氨基酸(例如,赖氨酸和精氨酸)取代;具有酸性侧链的氨基酸被另一种具有酸性侧链的氨基酸(例如,天冬氨酸或谷氨酸)取代;和/或疏水性或亲水性氨基酸分别被另一种疏水性或亲水性氨基酸取代。示例性保守取代在表1中提供。
如本文使用的,措辞“非保守取代”是指多肽中的氨基酸被具有显著不同的侧链特性的氨基酸取代。非保守取代可以使用在特定组之间而不是特定组之内的氨基酸,并且影响:(a)取代区域中的肽骨架的结构(例如,脯氨酸取代甘氨酸),(b)电荷或疏水性,或(c)侧链堆积。例如但不限于,示例性非保守取代可以是用碱性或脂肪族氨基酸取代酸性氨基酸;用小氨基酸取代芳香族氨基酸;和用疏水性氨基酸取代亲水性氨基酸。
如本文使用的,“缺失”是指通过从参考多肽去除一个或更多个氨基酸来修饰多肽。缺失可以包括去除1个或更多个氨基酸、2个或更多个氨基酸、5个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸或20个或更多个氨基酸、多达构成多肽的氨基酸总数的10%、或多达构成多肽的氨基酸总数的20%,同时保留酶活性和/或保留工程化酶的改进的特性。缺失可以涉及多肽的内部部分和/或末端部分。在各种实施方案中,缺失可以包括连续的区段,或者可以是不连续的。
如本文使用的,“插入”是指通过向参考多肽添加一个或更多个氨基酸来修饰多肽。在一些实施方案中,改进的工程化转氨酶包括一个或更多个氨基酸插入天然存在的转氨酶多肽,以及一个或更多个氨基酸插入工程化转氨酶多肽。插入可以在多肽的内部部分,或在羧基或氨基末端。如本文使用的插入包括如本领域已知的融合蛋白。插入可以是氨基酸的连续区段,或由天然存在的多肽中的一个或更多个氨基酸隔开。
术语“氨基酸取代集”或“取代集”是指与参考序列相比,多肽序列中的一组氨基酸取代。取代集可以具有1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个或更多氨基酸取代。在一些实施方案中,取代集是指在实施例中提供的表格中列出的变体转氨酶中的任一种中存在的一组氨基酸取代。术语“取代集”也用于指与参考序列相比,多核苷酸序列中的一组核苷酸取代。
如本文使用的,“片段”是指具有氨基末端缺失和/或羧基末端缺失,但其余氨基酸序列与序列中的对应位置相同的多肽。片段通常可以具有全长转氨酶多肽例如多肽SEQ IDNO:2的约80%、约90%、约95%、约98%或约99%。在一些实施方案中,片段是“有生物活性的”(即,它表现出与全长序列相同的酶活性)。
如本文使用的,“分离的多肽”是指与天然伴随多肽的其他污染物(例如,蛋白、脂质和多核苷酸)基本上分离的多肽。该术语包括已经从其天然存在的环境或表达系统(例如,宿主细胞或体外合成)中取出或纯化的多肽。改进的转氨酶可以存在于细胞内、存在于细胞培养基中,或以各种形式来制备,诸如裂解物或分离的制备物。因此,在一些实施方案中,本公开内容的工程化转氨酶多肽可以是分离的多肽。
如本文使用的,“基本上纯的多肽”是指其中多肽物质是存在的主要物质(即,以摩尔或重量计,其比组合物中的任何其他单独的大分子物质更丰富)的组合物,并且当目标物质以摩尔或%重量计构成存在的大分子物质的至少约50%时,该组合物通常为基本上纯的组合物。通常,基本上纯的工程化转氨酶多肽组合物按摩尔或%重量计包含组合物中存在的所有大分子物质的约60%或更多、约70%或更多、约80%或更多、约90%或更多、约91%或更多、约92%或更多、约93%或更多、约94%或更多、约95%或更多、约96%或更多、约97%或更多、约98%或更多、或约99%。溶剂物质、小分子(<500道尔顿)和元素离子物质不被认为是大分子物质。在一些实施方案中,分离的改进的转氨酶多肽是基本上纯的多肽组合物。
如本文使用的,“基本上纯的多核苷酸”是指其中多核苷酸物质是存在的主要物质(即,以摩尔或重量计,其比组合物中的任何其他单独的大分子物质更丰富)的组合物,并且当目标物质以摩尔或%重量计构成存在的大分子物质的至少约50%时,该组合物通常为基本上纯的组合物。通常,基本上纯的工程化转氨酶多核苷酸组合物按摩尔或%重量计包含组合物中存在的所有大分子物质的约60%或更多、约70%或更多、约80%或更多、约90%或更多、约91%或更多、约92%或更多、约93%或更多、约94%或更多、约95%或更多、约96%或更多、约97%或更多、约98%或更多、或约99%。在一些实施方案中,分离的改进的转氨酶多核苷酸是基本上纯的多核苷酸组合物。
如本文使用的,“多核苷酸”和“核酸”是指共价连接在一起的两个或更多个核苷。多核苷酸可以完全由核糖核苷(即,RNA)构成、完全由2'脱氧核糖核苷酸(即,DNA)构成或为核糖核苷和2'脱氧核糖核苷的混合物。虽然核苷通常将经由标准磷酸二酯键(linkage)连接在一起,但多核苷酸可以包括一个或更多个非标准连接。多核苷酸可以是单链或双链的,或者可以包括单链区和双链区两者。此外,虽然多核苷酸通常将包含天然存在的编码核苷碱基(即,腺嘌呤、鸟嘌呤、尿嘧啶、胸腺嘧啶和胞嘧啶),但它也可以包含一种或更多种修饰和/或合成的核苷碱基(例如,肌苷、黄嘌呤、次黄嘌呤等)。优选地,这些修饰的或合成的核苷碱基将是编码核苷碱基。
用于遗传编码核苷的缩写是常规的并且如下:腺苷(A);鸟苷(G);胞苷(C);胸苷(T);和尿苷(U)。除非具体描述,否则缩写的核苷酸可以是核糖核苷或2'-脱氧核糖核苷。核苷可以在个体基础上或聚集物基础上被指定为核糖核苷或2'-脱氧核糖核苷。当核酸序列以单字母缩写串呈现时,序列根据常规惯例以5'至3'方向呈现,并且不示出磷酸。
如本文使用的,“杂交严格性”涉及核酸杂交中的杂交条件,诸如洗涤条件。通常,杂交反应在较低严格性的条件下进行,随后是不同但严格性更高的洗涤。术语“中等严格性杂交”是指允许靶DNA结合互补核酸的条件,所述互补核酸与靶DNA具有约60%同一性、优选地约75%同一性、约85%同一性;与靶多核苷酸具有大于约90%同一性。示例性中等严格性条件是相当于在50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS中在42℃杂交、随后在0.2×SSPE、0.2%SDS中在42℃洗涤的条件。“高度严格性杂交”通常是指与在针对限定的多核苷酸序列的溶液条件下确定的热解链温度Tm相差约10℃或更少的条件。在一些实施方案中,高度严格性条件是指仅允许在65℃在0.018M NaCl中形成稳定杂交体的那些核酸序列杂交的条件(即,如本文设想的,如果杂交体在65℃在0.018M NaCl中不稳定,它在高度严格性条件下将不稳定)。高度严格性条件可以例如通过在相当于在42℃、50%甲酰胺、5×Denhart溶液、5×SSPE、0.2%SDS的条件杂交,然后在65℃、0.1×SSPE和0.1%SDS中洗涤来提供。另一种高度严格性条件是在相当于在65℃、在含有0.1%(w:v)SDS的5×SSC中杂交的条件杂交,并在65℃、在含有0.1%SDS的0.1×SSC中洗涤。其他高度严格性杂交条件以及中等严格性条件是本领域技术人员已知的。
如本文使用的,“编码序列”是指编码蛋白的氨基酸序列的那部分核酸(例如,基因)。
如本文使用的,“密码子优化”是指编码蛋白的多核苷酸的密码子向特定生物体中优先使用的密码子的改变,使得编码的蛋白在感兴趣的生物体中有效地表达。在一些实施方案中,编码转氨酶的多核苷酸可以被密码子优化以用于从所选择的用于表达的宿主生物体优化产生。尽管遗传密码是简并的,因为大多数氨基酸由数个被称为“同义(synonym)”或“同义(synonymous)”密码子的密码子代表,但熟知的是特定生物体的密码子使用是非随机的,并且偏向于特定的密码子三联体。这种密码子使用偏好对于特定基因、具有共同功能或祖先来源的基因、相比于低拷贝数蛋白的高表达蛋白、以及生物体的基因组的密集蛋白编码区可能更高。在一些实施方案中,编码转氨酶的多核苷酸可以被密码子优化以用于从所选择的用于表达的宿主生物体优化产生。
如本文使用的,“优选的、最佳的、高密码子使用偏好密码子”可互换地指在蛋白编码区中使用频率高于编码相同氨基酸的其他密码子的密码子。优选的密码子可以根据单个基因、具有共同功能或来源的一组基因、高表达基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子频率、相关生物体的聚集蛋白编码区中的密码子频率或其组合来确定。其频率随基因表达的水平而增加的密码子通常是用于表达的最佳密码子。用来确定特定生物体中密码子的频率(例如,密码子使用、相对同义密码子使用)和密码子偏好的多种方法是已知的,包括多变量分析,例如使用聚类分析或相关性分析和基因中使用的密码子的有效数目(参见例如,GCG CodonPreference,Genetics Computer Group WisconsinPackage;CodonW,John Peden,University of Nottingham;McInerney,Bioinform.,14:372-73[1998];Stenico等人,Nucleic Acids Res.,222:437-46[1994];和Wright,Gene87:23-29[1990])。密码子使用表可用于越来越多的生物体(参见例如,Wada等人,NucleicAcids Res.,20:2111-2118[1992];Nakamura等人,Nucl.Acids Res.,28:292[2000];Duret,等人,同上;Henaut和Danchin,“Escherichia coli and Salmonella,”Neidhardt等人(编辑),ASM Press,Washington D.C.,[1996],第2047-2066页。用于获得密码子使用的数据源可以依赖于能够编码蛋白的任何可得的核苷酸序列。这些数据集包括实际已知编码表达蛋白的核酸序列(例如,完整的蛋白编码序列-CDS)、表达序列标签(ESTS)或基因组序列的预测编码区(参见例如,Uberbacher,Meth.Enzymol.,266:259-281[1996];Tiwari等人,Comput.Appl.Biosci.,13:263-270[1997])。
如本文使用的,“控制序列”在本文中定义为包括对本公开内容的多核苷酸和/或多肽的表达是必需或有利的所有组分。每个控制序列对于感兴趣的多核苷酸可以是天然的或外源的。这样的控制序列包括但不限于前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。
如本文使用的,“可操作地连接”在本文中定义为控制序列被适当地放置(即,以功能关系)在相对于感兴趣的多核苷酸的位置处的布置,使得控制序列指导或调控感兴趣的多核苷酸和/或多肽的表达。
如本文使用的,“启动子序列”是指被宿主细胞识别用于表达感兴趣的多核苷酸诸如编码序列的核酸序列。控制序列可以包括适当的启动子序列。启动子序列包含介导感兴趣的多核苷酸的表达的转录控制序列。启动子可以是在选择的宿主细胞中显示出转录活性的任何核酸序列,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的细胞外多肽或细胞内多肽的基因获得。
如本文使用的,“天然存在的”和“野生型”是指自然界中存在的形式。例如,天然存在的或野生型多肽或多核苷酸序列是存在于生物体中、可以从自然来源分离并且未被通过人为操作有意修饰的序列。
如本文使用的,当在本公开内容中关于(例如,细胞、核酸或多肽)使用时,“非天然存在的”、“工程化”和“重组”是指材料或对应于该材料的自然或天然形式的材料,其已经被以自然中原本不存在的方式修饰。在一些实施方案中,材料与天然存在的材料相同,但从合成材料和/或通过使用重组技术操作而产生或获得。非限制性实例包括,表达在天然(非重组)形式的细胞中不存在的基因或表达本来以不同水平表达的天然基因的重组细胞以及其他。
如本文使用的,“序列同一性百分比”、“同一性百分比”和“百分比相同”是指多核苷酸序列或多肽序列之间的比较,并通过在比较窗上比较两个最佳比对的序列来确定,其中与用于两个序列的最佳比对的参考序列相比,多核苷酸或多肽序列在比较窗中的部分可以包括添加或缺失(即,空位)。百分比通过如下计算:确定两个序列中出现的相同的核酸碱基或氨基酸残基的位置的数目,或在具有空位的情况下比对核酸碱基或氨基酸残基以产生匹配位置的数目,将匹配位置的数目除以比较窗中位置的总数,并将结果乘以100以产生序列同一性的百分比。对最佳比对和序列同一性百分比的确定使用BLAST和BLAST 2.0算法来进行(参见例如,Altschul等人,J.Mol.Biol.215:403-410[1990];和Altschul等人,Nucl.Acids Res.,25:3389-3402[1977])。用于进行BLAST分析的软件可通过美国国家生物技术信息中心(National Center for Biotechnology Information)网站公开获得。
简言之,BLAST分析包括首先通过识别查询序列中长度W的短字(short words)来识别高评分序列对(HSP),所述长度W的短字在与数据库序列中相同长度的字比对时,匹配或满足一定的正值阈值评分T。T被称为相邻字评分阈值(Altschul等人,同上)。这些初始的相邻字击中(word hit)充当种子,用于启始检索以发现包含它们的更长的HSP。然后,字击中沿每个序列在两个方向上延伸,直至累积比对评分不能增加。对于核苷酸序列,累积评分使用参数M(对于匹配残基对的奖励评分;永远>0)和N(对于错配残基的惩罚评分;永远<0)来计算。对于氨基酸序列,使用评分矩阵来计算累积评分。当以下情况时,字击中在每个方向上的延伸停止:累积比对评分从其达到的最大值下降了量X;由于一个或更多个负评分的残基比对的累积,累积评分达到零或以下;或到达任一序列的末端。BLAST算法参数W、T和X决定比对的敏感性和速度。BLASTN程序(对于核苷酸序列)使用以下作为默认值:字长(W)为11、期望值(E)为10、M=5、N=-4,以及两个链的比较。对于氨基酸序列,BLASTP程序使用以下作为默认值:字长(W)为3、期望值(E)为10,以及BLOSUM62评分矩阵(参见例如,Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915[1989])。
许多其他算法是可获得及本领域已知的,这些算法在提供两个序列的同一性百分比方面与BLAST功能相似。用于比较的序列的最佳比对可以使用本领域已知的任何合适的方法进行(例如,通过Smith和Waterman,Adv.Appl.Math.2:482[1981]的局部同源性算法;通过Needleman和Wunsch,J.Mol.Biol.48:443[1970]的同源性比对算法;通过Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85:2444[1988]的搜索相似性的方法;和/或通过这些算法的计算机化实现[GCG Wisconsin软件包中的GAP、BESTFIT、FASTA和TFASTA]),或通过使用本领域通常已知的方法进行目视检查。此外,序列比对和序列同一性百分比的确定可以使用所提供的默认参数,利用GCG Wisconsin软件包(Accelrys,Madison WI)中的BESTFIT或GAP程序。
如本文使用的,“基本同一性(substantial identity)”是指,多核苷酸或多肽序列与参考序列相比在至少20个残基位置的比较窗中、通常在至少30个-50个残基的窗中具有至少80%序列同一性、至少85%同一性和89%至95%序列同一性,更通常至少99%序列同一性,其中序列同一性的百分比通过在比较窗中比较参考序列和包含总计为参考序列的20%或更少的缺失或添加的序列来计算。在应用于多肽的具体实施方案中,术语“基本同一性”是指,当诸如通过程序GAP或BESTFIT使用默认空位权重进行最佳比对时,两个多肽序列共有至少80%序列同一性,优选地至少89%序列同一性、至少95%序列同一性或更高的序列同一性(例如,99%序列同一性)。在一些优选的实施方案中,不相同的残基位置因保守氨基酸取代而不同。
如本文使用的,“参考序列”指另一序列被与其比较的特定序列。参考序列可以是更大序列的子集,例如,全长基因或多肽序列的区段。通常,参考序列为至少20个核苷酸或氨基酸残基的长度、至少25个残基的长度、至少50个残基的长度,或者为核酸或多肽的全长。由于两个多核苷酸或多肽可以各自(1)包含两个序列之间相似的序列(即,完整序列的一部分),和(2)还可以包含两个序列之间不同的序列,因此两个(或更多个)多核苷酸或多肽之间的序列比较通常通过在比较窗中比较两个多核苷酸的序列来鉴定和比较局部区域的序列相似性来进行。术语“参考序列”不意图受限于野生型序列,并且可以包括工程化序列或改变的序列。例如,在一些实施方案中,“参考序列”可以是先前工程化或改变的氨基酸序列。
如本文使用的,“比较窗”是指至少约20个连续核苷酸位置或氨基酸残基的概念性区段,其中序列可以与至少20个连续核苷酸或氨基酸的参考序列比较,并且其中序列在比较窗中与参考序列(其不包含添加或缺失)相比的部分可以包含20%或更少的添加或缺失(即,空位),以获得两个序列的最佳比对。比较窗可以比20个连续残基长,并且任选地包括30个、40个、50个、100个或更长的窗。
如本文使用的,当在特定氨基酸或多核苷酸序列的编号的上下文中使用时,“对应于”、“关于”和“相对于”是指,当将特定氨基酸或多核苷酸序列与指定参考序列相比时,该参考序列的残基的编号。换言之,特定聚合物的残基编号或残基位置相对于参考序列来指定,而不是由残基在特定氨基酸或多核苷酸序列内的实际数值位置指定。例如,可以通过引入空位将特定氨基酸序列诸如工程化转氨酶的氨基酸序列与参考序列比对,以优化两个序列之间的残基匹配。在这些情况下,尽管存在空位,但是特定氨基酸或多核苷酸序列中残基的编号相对于与其比对的参考序列来进行。如本文使用的,对残基位置的指代,诸如以下进一步描述的“Xn”,应被理解为是指“对应于……的残基”,除非另外明确说明。因此,例如,“X94”是指多肽序列中位置94处的任何氨基酸。
如本文使用的,当述及核酸或多肽使用时,术语“异源的”是指正常情况下生物体(例如,野生型生物体)不表达及分泌的序列。在一些实施方案中,该术语包括这样的序列,所述序列包含两个或更多个子序列,所述子序列彼此之间的关系被发现与在自然界中正常存在的关系不同,或所述序列被重组工程化,使得其表达水平或与细胞中的其他核酸或其他分子的物理关系或结构不是正常存在于自然界中的。例如,异源核酸通常通过重组产生,具有以自然界中未发现的方式排列的来自不相关的基因的两个或更多个序列(例如,本公开内容的核酸开放阅读框(ORF)可操作地连接至被插入到表达盒诸如载体中的启动子序列)。在一些实施方案中,“异源多核苷酸”是指通过实验室技术被引入宿主细胞中的任何多核苷酸,并且包括从宿主细胞中取出、经受实验室操作、并且然后重新引入到宿主细胞中的多核苷酸。
如本文使用的,“改进的酶特性”指与参考转氨酶相比表现出任何酶特性的改进的转氨酶。对于本文描述的工程化转氨酶多肽,通常针对野生型转氨酶进行比较,但是在一些实施方案中,参考转氨酶可以是另一种改进的工程化转氨酶。期望改进的酶特性包括但不限于酶活性(其可以依据使用指定量的转氨酶在指定反应时间对底物的转化百分比表示)、化学选择性、热稳定性、溶剂稳定性、pH活性谱、辅因子需求、对抑制物的耐受性(例如,产物抑制)、立体特异性和立体选择性(包括对映异构体选择性)。
如本文使用的,“增加的酶活性”和“增加的活性”是指工程化酶的改进的特性,其可以通过与如本文描述的参考酶相比,比活性(例如,产生的产物/时间/重量蛋白)的增加或底物向产物的转化百分比(例如,使用指定量的转氨酶,在指定时间段内,起始量的底物向产物的转化百分比)的增加来表示。可以影响与酶活性相关的任何特性,包括经典的酶特性Km、Vmax或kcat,其改变可以导致酶活性的增加。如本文进一步详细描述的,酶活性的比较使用特定的酶制品、设定条件下的特定测定和一种或更多种特定的底物来进行。通常,当比较细胞裂解物中的酶时,确定细胞的数目和测定的蛋白的量,并使用相同表达系统和相同宿主细胞以使由宿主细胞产生并存在于裂解物中的酶的量的变化最小化。
如本文使用的,“转化”是指底物向对应产物的酶促转化。
如本文使用的,“转化百分比”是指在指定条件下在一定时间段内底物转化为产物的百分比。因此,例如,转氨酶多肽的“酶活性”或“活性”可以表示为底物向产物的“转化百分比”。
如本文使用的,“化学选择性”是指一种产物相对于另一种产物在化学反应或酶促反应中优先形成。
如本文使用的,“热稳定的(thermostable)”和“热稳定的(thermal stable)”可互换使用以指这样的多肽,其与未处理的酶相比,当暴露于一组温度条件(例如,40℃-80℃)一定时间段(例如,0.5hr-24hr)时是抗失活的,因此在暴露于升高的温度后,保持一定水平的剩余活性(例如,多于60%至80%)。
如本文使用的,“溶剂稳定的”是指与未处理的酶相比,多肽在暴露于不同浓度(例如,5%-99%)的溶剂(例如,异丙醇、四氢呋喃、2-甲基四氢呋喃、丙酮、甲苯、乙酸丁酯、甲基叔丁基醚等)持续一定时间段(例如,0.5hr-24hr)后,维持相似活性(例如,多于例如60%至80%)的能力。
如本文使用的,“pH稳定的”是指与未处理的酶相比,在暴露于高pH或低pH(例如,4.5-6或8至12)一定时间段(例如,0.5hr-24hr)后维持相似活性(例如,多于60%至80%)的转氨酶多肽。
如本文使用的,“热稳定且溶剂稳定的”是指既热稳定也溶剂稳定的转氨酶多肽。
如本文使用的,“合适的反应条件”是指生物催化反应溶液中的那些条件(例如,酶载量、底物载量、辅因子载量、温度、pH、缓冲剂、共溶剂等的范围),在这些条件下本公开内容的转氨酶多肽能够进行转氨基作用。在本公开内容中提供并通过实施例示出了示例性的“合适的反应条件”。
如本文使用的,诸如“化合物载量”、“酶载量”或“辅因子载量”中的“载量”是指在反应开始时反应混合物中的组分的浓度或量。
如本文使用的,在生物催化剂介导的方法的上下文中,“底物”是指被生物催化剂作用的化合物或分子。
如本文使用的,在生物催化剂介导的方法的上下文中,“产物”是指由生物催化剂的作用产生的化合物或分子。
如本文使用的,“平衡”是指在化学或酶促反应中产生稳定状态浓度的化学物质的过程(例如,两种物质A和B的相互转化),包括立体异构体的相互转化,如通过该化学或酶促反应的正向速率常数和逆向速率常数确定的。
“转氨酶”或“氨基转移酶”在本文中可互换使用以指具有将氨基基团(-NH2)、一对电子和质子从氨基供体化合物的伯胺转移至氨基受体化合物的羰基基团(C=O),从而将氨基供体化合物转化为其对应的羰基化合物并将羰基受体化合物转化为其对应的伯胺化合物的酶促能力的多肽(参见例如,方案1)。如本文使用的转氨酶包括天然存在的(野生型)转氨酶以及通过人为操作产生的非天然存在的工程化多肽。
“氨基基团供体”或“氨基供体”在本文中可互换地使用以指能够向受体羰基化合物(即,氨基基团受体)提供氨基基团,从而变成羰基副产物的包含氨基基团的化合物。氨基基团供体具有以下一般性结构式,
其中R1和R2中的每一个当独立使用时是未被取代的或被一个或更多个酶促非抑制性基团(enzymatically non-inhibiting group)取代的烷基、烷基芳基基团或芳基基团。R1在结构或手性方面可以与R2相同或不同。R1和R2基团可以一起形成未被取代、被取代、或与其他环稠合的环。典型的氨基供体包括手性和非手性氨基酸、以及手性和非手性胺。
“手性胺”是指具有以下一般性结构式的包含氨基基团的化合物,
其中R1和R2中的每一个当独立使用时是未被取代的或被一个或更多个基团取代的烷基、烷基芳基基团或芳基基团。R1在结构上与R2不同,使得带有氨基基团的碳(用a*表示)成为立体中心。R1和R2基团可以一起形成未被取代、被取代、或与其他环稠合,但在其他方面是不对称的环。
“羰基副产物”是指转氨基反应中,当氨基基团供体上的氨基基团转移至氨基基团受体时,由氨基基团供体形成的羰基化合物。羰基副产物具有以下一般性结构式,
其中R1和R2为上文对氨基基团供体定义的。
“氨基受体”和“胺受体”、“酮基底物”在本文中可互换使用以指在通过转氨酶介导的反应(参见例如,方案1)中从氨基基团供体接受氨基基团的包含羰基基团的化合物。在本公开内容的上下文中,转氨酶的氨基受体化合物可以包括化合物(2)以及其他。
如本文使用的,“辅因子”是指在催化反应中与酶联合起作用的非蛋白化合物。如本文使用的,“辅因子”意图包括维生素B6家族化合物PLP、PN、PL、PM、PNP和PMP,它们有时也被称作辅酶。
“磷酸吡哆醛”、“PLP”、“吡哆醛-5'-磷酸”、“PYP”和“P5P”在本文可互换使用,以指在转氨酶反应中用作辅因子的化合物。在一些实施方案中,磷酸吡哆醛由结构1-(4'-甲酰基-3'-羟基-2'-甲基-5'-吡啶基)甲氧基膦酸定义,CAS编号是[54-47-7]。吡哆醛-5'-磷酸可以在体内由吡哆醇(也称为维生素B6)的磷酸化和氧化生成。在使用转氨酶的转氨基反应中,氨基供体的胺基团被转移至辅因子以产生酮基副产物,同时吡哆醛-5'-磷酸被转化为磷酸吡哆胺。吡哆醛-5'-磷酸通过与不同的酮基化合物(氨基受体)反应而再生。胺基团从磷酸吡哆胺转移至氨基受体产生胺并使辅因子再生。在一些实施方案中,吡哆醛-5'-磷酸可以由维生素B6家族的其他成员代替,包括吡哆醇(PN)、吡哆醛(PL)、吡哆胺(PM)和它们的磷酸化对应物:磷酸吡哆醇(PNP)和磷酸吡哆胺(PMP)。
“烷基(alkyl)”是指直链的或支链的从1个至18个碳原子、特别地从1个至8个碳原子、且更特别地1个至6个碳原子的基团。具有指定数目的碳原子的烷基在圆括号中表示(例如,(C1-C4)烷基是指1个至4个碳原子的烷基)。
“烯基”是指直链的或支链的包含至少一个双键但任选地包含多于一个双键的从2个至12个碳原子的基团。
“炔基”是指直链的或支链的包含至少一个三键但任选地包含多于一个三键,并且任选地包含一个或更多个双键部分的从2个至12个碳原子的基团。
“芳基”是指具有单个环(例如,苯基)或多元的稠环(例如,萘基或蒽基)的从5个至14个碳原子的不饱和芳香族碳环基团。对于多元的稠环,环中的至少一个是芳香族的。代表性芳基包括苯基、吡啶基、萘基等。
“芳基烷基”是指用芳基部分取代的烷基。代表性芳基烷基基团包括苄基、苯乙基等。
“芳基烯基”是指用芳基基团取代的如本文定义的烯基。
“芳基炔基”是指用芳基基团取代的如本文定义的炔基。
“杂芳基”是指在环内包含选自氧、氮和硫的1个至4个环杂原子的5个至14个环原子的芳香族杂环基团。杂芳基基团可具有单个环(例如,吡啶基或呋喃基)或多元的稠环(例如,吲哚嗪基或苯并噻吩基)。对于多元的稠环,环中的至少一个是芳香族的。
“杂芳基烷基”是指用如本文定义的杂芳基部分取代的烷基。
“杂芳基烯基”是指用如本文定义的杂芳基基团取代的烯基。
“杂芳基炔基”是指用如本文定义的杂芳基部分取代的炔基。
“环烷基(cycloalkyl)”是指具有单个环状环或多元的稠环的从3个至12个碳原子的环状烷基基团。代表性环烷基基团包括例如单个环结构诸如环丙基、环丁基、环戊基、环辛基、1-甲基环丙基、2-甲基环戊基、2-甲基环辛基等,或包括桥环系统的多元环结构,诸如金刚烷基等。
“杂环”和可互换的“杂环烃基(heterocycloalkyl)”是指具有从3个至14个环原子的单个环或多元的稠环的饱和或不饱和的基团,所述单个环或多元的稠环在环内具有选自氮、硫或氧的1个至4个杂原子。杂环基团可以具有单个环(例如,哌啶基或四氢呋喃基)或多元的稠环(例如,二氢吲哚基、二氢苯并呋喃或奎宁环基)。代表性杂环和杂芳基包括但不限于呋喃、噻吩、噻唑、噁唑、吡咯、咪唑、吡唑、吡啶、吡嗪、嘧啶、哒嗪、吲哚嗪、异吲哚、吲哚、吲唑、嘌呤、喹嗪、异喹啉、喹啉、酞嗪、萘基吡啶、喹喔啉、喹唑啉、噌啉、喋啶、咔唑、咔啉、菲啶、吖啶、菲咯啉、异噻唑、吩嗪、异噁唑、吩噁嗪、吩噻嗪、咪唑啉啶、咪唑啉、哌啶、哌嗪、吡咯烷、吲哚啉等。
“环烷基烷基”是指用如本文定义的环烷基部分取代的烷基。
“环烷基烯基”是指用如本文定义的环烷基部分取代的烯基。
“环烷基炔基”是指用如本文定义的环烷基部分取代的炔基。
“杂环烃基烷基”是指用如本文定义的杂环烃基部分取代的烷基。
“杂环烃基烯基”是指用如本文定义的杂环烃基部分取代的烯基。
“杂环烃基炔基”是指用如本文定义的杂环烃基部分取代的炔基。
“烷氧基”或“烷基氧基”是指基团烷基-O-,其中烷基基团为如上文定义的,包括同样如上文定义的任选地取代的烷基基团。
“氨基”是指基团-NH2。取代的氨基是指基团-NHR'、NR'R'和NR'R'R',其中每个R'独立于其他地选自取代的或未取代的烷基、环烷基、杂环烃基、环烷基烷基、杂环烃基烷基、烷氧基、芳基、杂芳基、芳基烷基、杂芳基烷基、酰基、烷氧基羰基、硫烷基、亚硫酰基、磺酰基等。典型的氨基基团包括但不限于二甲基氨基、二乙基氨基、三甲基铵、三乙基铵、甲基磺酰基氨基、呋喃基-氧基-磺氨基等。
“羧基”是指-COOH。
“羰基”是指-C(O)-,其可以具有多个取代基以形成不同的羰基基团,包括酸、酰基卤、醛、酰胺、酯和酮。
“羟基”是指-OH。
“氰基”是指-CN。
“卤素(halogen)”或“卤代(halo)”是指氟代、氯代、溴代和碘代。
“磺酰基”是指-SO2-。取代的磺酰基是指-SO2R',其中R'是如以下描述的合适的取代基。
诸如在稠合的芳基或稠合的杂芳基中的“稠合的”或“稠环”是指连接使得它们具有至少2个共同的环原子的两个或更多个环。稠合的芳基是指其中至少一个环为芳基的稠环。稠合的杂芳基是指其中至少一个环为杂芳基的稠环。
除非另外指定,否则“取代的”是指在前述基团中由氢占据的位置被以下取代基取代,例如但不限于:羟基、氧代、硝基、甲氧基、乙氧基、烷氧基、取代的烷氧基、三氟甲氧基、卤代烷氧基、氟代、氯代、溴代、碘代、卤代、甲基、乙基、丙基、丁基、烷基、烯基、炔基、取代的烷基、三氟甲基、卤代烷基、羟烷基、烷氧基烷基、硫基、烷硫基、酰基、羧基、烷氧基羰基、羧基酰氨基(carboxamido)、取代的羧基酰氨基、烷基磺酰基、烷基亚磺酰基、烷基磺酰基氨基、磺酰基酰氨基、取代的磺酰基酰氨基、氰基、氨基、取代的氨基、烷基氨基、二烷基氨基、氨基烷基、酰氨基、脒基、酰氨基脒基(amidoximo)、羟基酰胺基(hydroxamoyl)、苯基、芳基、取代的芳基、芳基氧基、芳基烷基、芳香烯基、芳香炔基、吡啶基、咪唑基、杂芳基、取代的杂芳基、杂芳基氧基、杂芳基烷基、杂芳基烯基、杂芳基炔基、环丙基、环丁基、环戊基、环己基、环烷基、环烯基、环烷基烷基、取代的环烷基、环烷基氧基、吡咯烷基、哌啶基、吗啉代、杂环基、(杂环基)氧基和(杂环基)烷基;并且优选的杂原子为氧、氮和硫。应理解,当开放(open)的价存在于这些取代基上时,其可以用烷基、环烷基、芳基、杂芳基和/或杂环基团进一步取代,当这些开放的价存在于碳上时,其可以被卤素以及被结合氧、氮、或硫的取代基进一步取代,并且当多个此类开放的价存在时,这些基团可通过直接形成键或通过与新的杂原子形成键而被连接形成环,所述新的杂原子优选地为氧、氮或硫。还应理解,可以进行以上取代的条件是,用取代基替代氢不会向本公开内容的分子引入不可接受的不稳定性,并且在其他方面是化学上合理的。
“任选的”或“任选地”意指随后描述的事件或情形可以发生或可以不发生,并且该描述包括其中所述事件或情形发生的情况和其中事件或情形不发生的情况。本领域普通技术人员将理解,对于被描述为含有一个或更多个任选的取代基的任何分子,仅意图包括空间上可实现的和/或合成上可行的化合物。“任选地被取代的”是指一种化学基团形式或一系列化学基团的所有后续修饰物(modifier)。例如,在术语“任选地被取代的芳基烷基”中,分子的“烷基”部分和“芳基”部分可以被取代或可以不被取代,并且对于“任选地被取代的烷基、环烷基、芳基和杂芳基”系列,烷基、环烷基、芳基和杂芳基彼此独立地可以被取代或可以不被取代。
“保护基团”是指当附接至分子中的反应官能团时掩蔽、降低或阻止官能团的反应性的一组原子。通常,保护基团可以在合成过程期间根据期望被选择性地移除。保护基团的实例在本领域中是已知的(例如,Wuts和Greene,“Greene’s Protective Groups inOrganic Synthesis,”第4版,Wiley Interscience[2006],和Harrison等人,Compendiumof Synthetic Organic Methods,第1-8卷,John Wiley&Sons,NY[1971-1976])。可以具有保护基团的官能团包括但不限于羟基、氨基和羧基。代表性氨基保护基团包括但不限于甲酰基、乙酰基、三氟乙酰基、苄基、苄基氧基羰基(“CBZ”)、叔丁氧基羰基(“Boc”)、三甲基甲硅烷基(“TMS”)、2-三甲基甲硅烷基-乙烷磺酰基(“SES”)、三苯甲基和取代的三苯甲基、烯丙基氧基羰基、9-芴基甲氧基羰基(“FMOC”)、硝基-藜芦基氧基羰基(“NVOC”)等。代表性羟基保护基团包括但不限于其中羟基被酰化的那些(例如,甲基和乙基酯、乙酸酯或丙酸酯基团或乙二醇酯)或其中羟基被烷基化的那些,诸如苄基和三苯甲基醚、以及烷基醚、四氢吡喃基醚、三烷基甲硅烷基醚(例如,TMS或TIPPS基团)和烯丙基醚。其他保护基团可见于本文描述的参考文献中。
“离去基团”通常是指在化学反应中能被另一个原子或部分替代的任何原子或部分。更具体地,离去基团指被亲核体(例如,胺、硫醇、醇或氰化物)容易地替代和取代的原子或部分。此类离去基团是熟知的并且包括羧酸酯(carboxylates)、N-羟基琥珀酰亚胺(“NHS”)、N-羟基苯并三唑、卤素(氟、氯、溴或碘)和烷氧基基团。离去基团的非限制性特征和实例在本领域中是已知的,并且在多种化学教科书中描述。
工程化转氨酶多肽
本公开内容提供了具有转氨酶活性的工程化多肽(本文也称为“工程化转氨酶多肽”),其可用于氨基受体底物化合物的选择性转氨基作用以产生手性胺产物,在一些实施方案中,手性胺产物可以包括化合物(2)。相应地,在一方面,本公开内容提供了具有转氨酶活性的工程化多肽,其能够将底物化合物(1)转化为产物化合物(2),如方案2中所示。此外,本公开内容提供了编码工程化多肽的多核苷酸、包含该多核苷酸的相关载体和宿主细胞、用于制备工程化多肽的方法和使用工程化多肽的方法,包括合适的反应条件。
本公开内容的工程化多肽为非天然存在的转氨酶,其被工程化为具有与河流弧菌JS17的野生型转氨酶多肽(GenBank登录号AEA39183.1,GI:327207066;SEQ ID NO:2)相比,并且还与用作本公开内容的工程化多肽的定向演化的起始骨架序列的参考工程化转氨酶多肽SEQ ID NO:4相比改进的酶特性(诸如增加的立体选择性)。参考工程化转氨酶多肽SEQID NO:4相对于河流弧菌JS17的野生型转氨酶(SEQ ID NO:2)具有以下11个氨基酸差异:A9T、N45H、W57L、F86S、R88H、V153A、V177L、R211K、M294V、S324G和T391A。
本公开内容的工程化转氨酶多肽通过SEQ ID NO:4的定向演化产生,用于在某些工业相关条件下将化合物(1)有效转化为化合物(2),并且与参考工程化转氨酶多肽相比具有一个或更多个残基差异。这些残基差异与各种酶特性的改进相关,特别是增加的活性、增加的立体选择性、增加的稳定性及对增加的底物和/或产物浓度的耐受性(例如,降低的产物抑制)。相应地,在一些实施方案中,在合适的反应条件下,具有转氨酶活性的工程化多肽能够以相对于参考多肽(例如,SEQ ID NO:2、4、8、366和/或650)的活性增加至少约1.2倍、1.5倍、2倍、3倍、4倍、5倍、10倍、20倍、30倍、40倍、50倍、100倍或更大的活性将底物化合物(1)转化为化合物(2)。在一些实施方案中,在合适的反应条件下,在约48h、约36h、约24h或甚至更短时间长度的反应时间内,具有转氨酶活性的工程化多肽能够以至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、或至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%的转化率百分比将底物化合物(1)转化为化合物(2)。在一些实施方案中,在合适的反应条件下,具有转氨酶活性的工程化多肽能够以至少90%、95%、97%、98%、99%或更高的非对映异构体过量将化合物(1)转化为化合物(2)。
本公开内容提供了许多示例性工程化转氨酶多肽,其包含SEQ ID NO:6-936中的偶数编号序列标识符的氨基酸序列。这些示例性工程化转氨酶多肽包含含有一个或更多个以下残基差异的氨基酸序列,这些残基差异与它们相比于参考序列(例如,SEQ ID NO:2、4、8、366和/或650)将化合物(1)转化为化合物(2)的改进的特性相关。
在一些情况下,示例性工程化多肽具有还包含与参考序列(例如,SEQ ID NO:2、4、8、366和/或650)相比的一个或更多个残基差异的氨基酸序列。在一些情况下,示例性工程化多肽具有还包含与参考序列(例如,SEQ ID NO:2、4、8、366和/或650)相比的一个或更多个残基差异的氨基酸序列。
在一些实施方案中,工程化多肽包含与选自SEQ ID NO:2、4、8、366和/或650的参考序列至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多地相同的氨基酸序列,其中该多肽具有转氨酶活性和如本文描述的一种或更多种改进的特性,例如以与参考序列(例如,多肽SEQ ID NO:2、4、8、366和/或650)相比增加的活性将化合物(1)转化为产物化合物(2)的能力。在一些实施方案中,参考序列是SEQ ID NO:2。在一些实施方案中,参考序列是SEQ ID NO:4。在一些实施方案中,参考序列是SEQ ID NO:8。在一些实施方案中,参考序列是SEQ ID NO:366。在一些实施方案中,参考序列是SEQ ID NO:650。
在一些实施方案中,工程化转氨酶多肽包含与SEQ ID NO:2、4、8、366和/或650相比具有一个或更多个氨基酸残基差异的氨基酸序列。在一些实施方案中,本公开内容提供了具有转氨酶活性的工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:2、4、8、366和/或650具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,和选自本文提供的那些取代(参见例如,表2-1、表2-2、表3-1、表3-2、表4-1、表4-2、表5-1和/或表5-2)的至少一种氨基酸残基差异的氨基酸序列。
在一些实施方案中,本公开内容提供了一种工程化转氨酶多肽,其包含与SEQ IDNO:4相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:21/163/286/291/314/316/323/383/388/408/414/416、18、20、21、21/23/56/146、21/23/56/146/432、21/23/146/417、21/23/395/417/432、21/53/56、21/53/417、21/56/395、21/417/432、23、23/53、23/53/56、23/53/56/146/395、23/53/395、23/53/417、23/53/432、23/56、23/56/395、23/56/395/417、23/395/417、23/417、23/417/432、53、53/56、53/146/417、53/395、56、56/74/241/286/314/316/323、56/86/163/314/316/383/414/416/422、56/86/286/314/414/416、56/86/314/316/323/394/414/422、56/146/417、56/146/432、56/147、56/163、56/163/286/316/323/383/394、56/286/314/316/323/422、56/286/383、56/323、56/323/383、56/323/383/394、56/383、56/395、74/81/286/316/323/383、74/85/86/163/286/316/323/394、74/85/314/316/414/416、74/86/163/316、74/86/316/323/383/394、74/88/286/316/323/383、74/88/323/383、74/163/286/316/383/394/416、74/163/314/316、74/163/314/316/323/394、74/163/314/323/383/414/416、74/286、74/286/316/323、74/286/394/416、74/314/323/383/394/414、74/316/323/394、85/86/88/163/323/383/394、85/86/163/314/323/394/414、85/286、85/286/323、86、86/88/163/323/383/414/422、86/383/394、88、88/163/286/383、88/286/316/323、88/286/316/323/383/414/416、88/316/323、146、146/147/395/417、146/395、146/395/417、146/417、147/395/417/432、147/417、149、157、163、163/222/286/316/323/383/394、163/286、163/286/314/316/323/414/416、163/286/314/323/394、163/286/316/323/394/416、163/286/414、163/314/316/394、163/314/323/394、163/314/383、163/314/414、163/316/323、163/323、163/383、164、199/417、259、260、284、286、286/314/323/383、286/314/394、286/316/323/383/414/416、286/316/383/394、286/316/394/414/416、286/323、286/323/383/414、286/323/416、286/383、286/416、314/316、314/316/323、314/316/323/383/422、314/316/323/394、314/316/394、314/323/383/394、314/383、314/383/414/422、315、316、316/323/383/394、316/323/394/414/416、316/414/422、323、323/383、323/383/394/414/416、323/394、383、395、395/417、395/417/432、400、401、403、404、405、406、408、415、417、417/432、420和422,其中位置参考SEQ ID NO:4编号。在一些实施方案中,氨基酸差异包括取代18A、20C、21H、21P/23S/56C/146H、21P/23S/56C/146H/432V、21P/23S/146H/417V、21P/23S/395D/417S/432V、21P/53C/56C、21P/53C/417S、21P/56C/395D、21P/417S/432V、21R、23A、23R、23S/53C、23S/53C/56C、23S/53C/56C/146H/395D、23S/53C/395D、23S/53C/417S、23S/53C/432V、23S/56C、23S/56C/395D、23S/56C/395D/417V、23S/395D/417S、23S/417S、23S/417V、23S/417V/432V、53C、53C/56C、53C/146H/417S、53C/395D、56A、56A/74T/241V/286S/314R/316W/323T、56A/86A/163F/314R/316W/383V/414V/416A/422A、56A/86A/286S/314R/414V/416A、56A/86A/314R/316W/323T/394G/414V/422A、56A/163F、56A/163F/286S/316W/323T/383V/394G、56A/286S/314R/316W/323T/422A、56A/286S/383V、56A/323T、56A/323T/383V、56A/323T/383V/394G、56A/383V、56C、56C/146H/417V、56C/146H/432V、56C/147R、56C/395D、56T、56V、74T/81S/286S/316W/323T/383V、74T/85V/86A/163F/286S/316W/323T/394G、74T/85V/314R/316W/414V/416A、74T/86A/163F/316W、74T/86A/316W/323T/383V/394G、74T/88R/286S/316W/323T/383V、74T/88R/323T/383V、74T/163F/286S/316W/383V/394G/416A、74T/163F/314R/316W、74T/163F/314R/316W/323T/394G、74T/163F/314R/323T/383V/414V/416A、74T/286S、74T/286S/316W/323T、74T/286S/394G/416A、74T/314R/323T/383V/394G/414V、74T/316W/323T/394G、85V/86A/88R/163F/323T/383V/394G、85V/86A/163F/314R/323T/394G/414V、85V/286S、85V/286S/323T、86A/88R/163F/323T/383V/414V/422A、86A/383V/394G、86G、88R/163F/286S/383V、88R/286S/316W/323T、88R/286S/316W/323T/383V/414V/416A、88R/316W/323T、88S、88T、146H、146H/147R/395D/417S、146H/395D、146H/395D/417S、146H/417S、146H/417V、147R/395D/417S/432V、147R/417S、149S、157A、163F、163F/222V/286S/316W/323T/383V/394G、163F/286S、163F/286S/314R/316W/323T/414V/416A、163F/286S/314R/323T/394G、163F/286S/316W/323T/394G/416A、163F/286S/414V、163F/314R/316W/394G、163F/314R/323T/394G、163F/314R/383V、163F/314R/414V、163F/316W/323T、163F/323T、163F/383V、163L、163M、164A、164D、164Q、164S、199V/417S、259V、260T、284A、286S、286S/314R/323T/383V、286S/314R/394G、286S/316W/323T/383V/414V/416A、286S/316W/383V/394G、286S/316W/394G/414V/416A、286S/323T、286S/323T/383V/414V、286S/323T/416A、286S/383V、286S/416A、314R/316W、314R/316W/323T、314R/316W/323T/383V/422A、314R/316W/323T/394G、314R/316W/394G、314R/323T/383V/394G、314R/383V、314R/383V/414V/422A、315G、315R、316A、316F、316G、316H、316L、316N、316R、316V、316W/323T/383V/394G、316W/323T/394G/414V/416A、316W/414V/422A、323C、323S、323T、323T/383V、323T/383V/394G/414V/416A、323T/394G、383V、395D、395D/417S、395D/417S/432V、395D/417V、400D、401A、401K、401S、403V、404S、405H、405W、406S、408F、408L、408W、415G、415W、417A、417S、417S/432V、417V、417V/432V、420G、422L和422T和424R,其中位置参考SEQ ID NO:4编号。在一些另外的实施方案中,氨基酸差异包括取代G18A、T20C、D21H、D21P/P23S/L56C/R146H、D21P/P23S/L56C/R146H/A432V、D21P/P23S/R146H/L417V、D21P/P23S/G395D/L417S/A432V、D21P/N53C/L56C、D21P/N53C/L417S、D21P/L56C/G395D、D21P/L417S/A432V、D21R、P23A、P23R、P23S/N53C、P23S/N53C/L56C、P23S/N53C/L56C/R146H/G395D、P23S/N53C/G395D、P23S/N53C/L417S、P23S/N53C/A432V、P23S/L56C、P23S/L56C/G395D、P23S/L56C/G395D/L417V、P23S/G395D/L417S、P23S/L417S、P23S/L417V、P23S/L417V/A432V、N53C、N53C/L56C、N53C/R146H/L417S、N53C/G395D、L56A、L56A/A74T/A241V/N286S/I314R/E316W/A323T、L56A/S86A/K163F/I314R/E316W/A383V/C414V/P416A/V422A、L56A/S86A/N286S/I314R/C414V/P416A、L56A/S86A/I314R/E316W/A323T/D394G/C414V/V422A、L56A/K163F、L56A/K163F/N286S/E316W/A323T/A383V/D394G、L56A/N286S/I314R/E316W/A323T/V422A、L56A/N286S/A383V、L56A/A323T、L56A/A323T/A383V、L56A/A323T/A383V/D394G、L56A/A383V、L56C、L56C/R146H/L417V、L56C/R146H/A432V、L56C/W147R、L56C/G395D、L56T、L56V、A74T/G81S/N286S/E316W/A323T/A383V、A74T/F85V/S86A/K163F/N286S/E316W/A323T/D394G、A74T/F85V/I314R/E316W/C414V/P416A、A74T/S86A/K163F/E316W、A74T/S86A/E316W/A323T/A383V/D394G、A74T/H88R/N286S/E316W/A323T/A383V、A74T/H88R/A323T/A383V、A74T/K163F/N286S/E316W/A383V/D394G/P416A、A74T/K163F/I314R/E316W、A74T/K163F/I314R/E316W/A323T/D394G、A74T/K163F/I314R/A323T/A383V/C414V/P416A、A74T/N286S、A74T/N286S/E316W/A323T、A74T/N286S/D394G/P416A、A74T/I314R/A323T/A383V/D394G/C414V、A74T/E316W/A323T/D394G、F85V/S86A/H88R/K163F/A323T/A383V/D394G、F85V/S86A/K163F/I314R/A323T/D394G/C414V、F85V/N286S、F85V/N286S/A323T、S86A/H88R/K163F/A323T/A383V/C414V/V422A、S86A/A383V/D394G、S86G、H88R/K163F/N286S/A383V、H88R/N286S/E316W/A323T、H88R/N286S/E316W/A323T/A383V/C414V/P416A、H88R/E316W/A323T、H88S、H88T、R146H、R146H/W147R/G395D/L417S、R146H/G395D、R146H/G395D/L417S、R146H/L417S、R146H/L417V、W147R/G395D/L417S/A432V、W147R/L417S、A149S、S157A、K163F、K163F/A222V/N286S/E316W/A323T/A383V/D394G、K163F/N286S、K163F/N286S/I314R/E316W/A323T/C414V/P416A、K163F/N286S/I314R/A323T/D394G、K163F/N286S/E316W/A323T/D394G/P416A、K163F/N286S/C414V、K163F/I314R/E316W/D394G、K163F/I314R/A323T/D394G、K163F/I314R/A383V、K163F/I314R/C414V、K163F/E316W/A323T、K163F/A323T、K163F/A383V、K163L、K163M、P164A、P164D、P164Q、P164S、A199V/L417S、I259V、C260T、S284A、N286S、N286S/I314R/A323T/A383V、N286S/I314R/D394G、N286S/E316W/A323T/A383V/C414V/P416A、N286S/E316W/A383V/D394G、N286S/E316W/D394G/C414V/P416A、N286S/A323T、N286S/A323T/A383V/C414V、N286S/A323T/P416A、N286S/A383V、N286S/P416A、I314R/E316W、I314R/E316W/A323T、I314R/E316W/A323T/A383V/V422A、I314R/E316W/A323T/D394G、I314R/E316W/D394G、I314R/A323T/A383V/D394G、I314R/A383V、I314R/A383V/C414V/V422A、E315G、E315R、E316A、E316F、E316G、E316H、E316L、E316N、E316R、E316V、E316W/A323T/A383V/D394G、E316W/A323T/D394G/C414V/P416A、E316W/C414V/V422A、A323C、A323S、A323T、A323T/A383V、A323T/A383V/D394G/C414V/P416A、A323T/D394G、A383V、G395D、G395D/L417S、G395D/L417S/A432V、G395D/L417V、S400D、E401A、E401K、E401S、I403V、A404S、N405H、N405W、T406S、T408F、T408L、T408W、R415G、R415W、L417A、L417S、L417S/A432V、L417V、L417V/A432V、S420G、V422L和V422T,其中位置参考SEQ ID NO:4编号。
在一些实施方案中,本公开内容提供了一种工程化转氨酶多肽,其包含与SEQ IDNO:4相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:74/81/286/316/323/383、163/286/314/316/323/414/416、163/286/314/323/394、286/314/323/383、286/316/323/383/414/416、315和408,其中位置参考SEQ ID NO:4编号。在一些实施方案中,氨基酸差异包括取代74T/81S/286S/316W/323T/383V、163F/286S/314R/316W/323T/414V/416A、163F/286S/314R/323T/394G、286S/314R/323T/383V、286S/316W/323T/383V/414V/416A、315G和408F,其中位置参考SEQ ID NO:4编号。在一些另外的实施方案中,氨基酸差异包括取代A74T/G81S/N286S/E316W/A323T/A383V、K163F/N286S/I314R/E316W/A323T/C414V/P416A、K163F/N286S/I314R/A323T/D394G、N286S/I314R/A323T/A383V、N286S/E316W/A323T/A383V/C414V/P416A、E315G和T408F,其中位置参考SEQ ID NO:4编号。
在一些实施方案中,本公开内容提供了一种工程化转氨酶多肽,其包含与SEQ IDNO:8相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:5、18/23/149/260/383/395/401/416、18/23/149/383、18/163/164、21、21/163/315/316、21/163/323/408、21/408、23/56/86/149/163/164/383/401/416、23/86、23/149/260、23/149/284/383/395、23/163/164/383、23/163/164/401/416、24、42、42/110、42/187/272、42/187/324/363/366、42/187/353、42/272/291、42/272/291/363、42/272/324/363/366、42/272/363/410、42/272/410、42/291/313/363/410、42/291/363、42/291/363/366、42/353、42/363、46、66、77、86/149/163/164/383/395/401、86/149/395、86/163/164/260/383、86/383、107、110、110/187、110/187/253/410、134、138、149/164/260/383/395/401、149/260/383、149/416、163/259/323/408、163/259/408、163/315/316、164/260/401、164/316/383/401、167、186、187、187/253/363/366、187/272/324/363/410、187/272/363、187/272/363/366/410、187/291、189、191、195、199、203、210、211、248、259/307、260/395/401、272、272/353、272/363/366、272/410、277、291、305、309、315、342、343、351、354、358、361、362、363、363/366、365、367、383、383/401、383/416/422、385、388、389、392、395、396、401、404、405、408、410、416、417、439、443、447、450和451,其中位置参考SEQ ID NO:8编号。在一些实施方案中,氨基酸差异包括取代5E、5G、18A/23R/149S/260T/383V/395D/401S/416P、18A/23R/149S/383V、18A/163M/164Q、21H、21H/163L/315G/316F、21H/163L/323C/408F、21H/408F、23R/56C/86G/149S/163M/164D/383V/401S/416P、23R/86G、23R/149S/260T、23R/149S/284A/383V/395D、23R/163M/164Q/383V、23R/163M/164S/401S/416P、24K、24R、42F、42F/110K、42F/187E/272E、42F/187E/324S/363L/366H、42F/187E/353T、42F/272E/291Y、42F/272E/291Y/363L、42F/272E/324S/363L/366H、42F/272E/363L/410H、42F/272E/410H、42F/291Y/313V/363L/410H、42F/291Y/363L、42F/291Y/363L/366H、42F/353T、42F/363L、46S、66A、77M、86G/149S/163M/164S/383V/395D/401S、86G/149S/395D、86G/163M/164S/260T/383V、86G/383V、107L、107S、107Y、110K、110K/187E、110K/187E/253L/410H、134V、138R、149S/164S/260T/383V/395D/401A、149S/260T/383V、149S/416P、163L/259V/323C/408F、163L/259V/408F、163L/315G/316F、164D/316H/383V/401S、164S/260T/401S、167N、186Q、187E、187E/253L/363L/366H、187E/272E/324S/363L/410H、187E/272E/363L、187E/272E/363L/366H/410H、187E/291Y、189F、189S、189V、189W、191D、191F、195W、199Q、203L、210A、210L、210M、210V、210Y、211R、248G、259V/307M、260T/395D/401S、272E、272E/353T、272E/363L/366H、272E/410H、277S、291Y、305E、309A、309F、309R、315G、342T、343G、351L、354S、358L、361R、362Q、362V、363L、363L/366H、365L、365Q、365R、365S、367T、383V、383V/401A、383V/416P/422T、385L、385T、388D、388L、388P、389D、392A、392L、395R、396P、396Y、401Q、401S、404M、405W、408A、408E、408W、410H、416P、417S、439L、439S、443L、443S、447S、447T、450D和451S,其中位置参考SEQID NO:8编号。在一些另外的实施方案中,氨基酸差异包括取代Q5E、Q5G、G18A/P23R/A149S/C260T/A383V/G395D/E401S/A416P、G18A/P23R/A149S/A383V、G18A/F163M/P164Q、D21H、D21H/F163L/E315G/W316F、D21H/F163L/T323C/T408F、D21H/T408F、P23R/L56C/S86G/A149S/F163M/P164D/A383V/E401S/A416P、P23R/S86G、P23R/A149S/C260T、P23R/A149S/S284A/A383V/G395D、P23R/F163M/P164Q/A383V、P23R/F163M/P164S/E401S/A416P、S24K、S24R、V42F、V42F/R110K、V42F/Y187E/V272E、V42F/Y187E/G324S/I363L/R366H、V42F/Y187E/A353T、V42F/V272E/F291Y、V42F/V272E/F291Y/I363L、V42F/V272E/G324S/I363L/R366H、V42F/V272E/I363L/L410H、V42F/V272E/L410H、V42F/F291Y/A313V/I363L/L410H、V42F/F291Y/I363L、V42F/F291Y/I363L/R366H、V42F/A353T、V42F/I363L、G46S、K66A、E77M、S86G/A149S/F163M/P164S/A383V/G395D/E401S、S86G/A149S/G395D、S86G/F163M/P164S/C260T/A383V、S86G/A383V、D107L、D107S、D107Y、R110K、R110K/Y187E、R110K/Y187E/V253L/L410H、A134V、P138R、A149S/P164S/C260T/A383V/G395D/E401A、A149S/C260T/A383V、A149S/A416P、F163L/I259V/T323C/T408F、F163L/I259V/T408F、F163L/E315G/W316F、P164D/W316H/A383V/E401S、P164S/C260T/E401S、S167N、R186Q、Y187E、Y187E/V253L/I363L/R366H、Y187E/V272E/G324S/I363L/L410H、Y187E/V272E/I363L、Y187E/V272E/I363L/R366H/L410H、Y187E/F291Y、E189F、E189S、E189V、E189W、G191D、G191F、E195W、A199Q、R203L、Q210A、Q210L、Q210M、Q210V、Q210Y、K211R、K248G、I259V/L307M、C260T/G395D/E401S、V272E、V272E/A353T、V272E/I363L/R366H、V272E/L410H、T277S、F291Y、K305E、T309A、T309F、T309R、E315G、N342T、E343G、R351L、P354S、E358L、K361R、H362Q、H362V、I363L、I363L/R366H、E365L、E365Q、E365R、E365S、P367T、A383V、A383V/E401A、A383V/A416P/V422T、K385L、K385T、A388D、A388L、A388P、S389D、P392A、P392L、G395R、N396P、N396Y、E401Q、E401S、A404M、N405W、T408A、T408E、T408W、L410H、A416P、L417S、D439L、D439S、K443L、K443S、K447S、K447T、A450D和E451S,其中位置参考SEQ ID NO:8编号。
在一些实施方案中,本公开内容提供了一种工程化转氨酶多肽,其包含与SEQ IDNO:8相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:18/23/149/383、21/163/323/408、272、291和383,其中位置参考SEQ ID NO:8编号。在一些实施方案中,氨基酸差异包括取代18A/23R/149S/383V、21H/163L/323C/408F、272E、291Y和383V,其中位置参考SEQ ID NO:8编号。在一些另外的实施方案中,氨基酸差异包括取代G18A/P23R/A149S/A383V、D21H/F163L/T323C/T408F、V272E、F291Y和A383V,其中位置参考SEQ ID NO:8编号。
在一些实施方案中,本公开内容提供了一种工程化转氨酶多肽,其包含与SEQ IDNO:366相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:24、24/42/66/291、24/42/291/362、24/66/163/191/362/383/388、24/66/191/199/260/291/351、24/66/191/199/291、24/66/191/260/408、24/66/260/291/383/388/408、24/66/291/342/383、24/66/291/365、24/66/342/365/388/408、24/77/291、24/107/163/191/291/351/383/388、24/107/291/351/365/388、24/163/351/383、24/191/291/365、24/199/260/351/362/383、24/199/260/362/383/388、24/260/362/383/388、24/291、24/291/342/351/383、24/291/362/388、24/291/408、24/383/388、24/388、25、28、33、42/191/408、42/199/291/383、42/291/351/362/365/383/388、42/291/351/362/383/408、42/291/383/388、66/82/291/383、66/163/191/365/383、66/199/351/383、66/291、66/291/362/365/383、66/291/383/388、66/383、77/291、77/383/388、86、107/191/199/365/383/388、107/191/291/383、148、153、163/291/362/365/383/388、163/291/383/388、163/383、191/199/365/383/388、191/260/388、191/291、191/291/342/362/365、191/351/383/388、199/260/383、199/291、260、260/291/365/383/408、260/365/383、291、291/351/383/388、291/351/383/388/408、291/362/365、291/365/388、291/383、314、315、316、319、342/362、351/383/388、362、362/388、383、383/388、396、397、405、406、413、419和423,其中位置参考SEQ ID NO:366编号。在一些实施方案中,氨基酸差异包括取代24E、24K、24K/42F/66A/291Y、24K/42F/291Y/362Q、24K/66A/163M/191D/362Q/383V/388D、24K/66A/191D/199Q/260T/291Y/351L、24K/66A/191D/199Q/291Y、24K/66A/191D/260T/408A、24K/66A/260T/291Y/383V/388D/408A、24K/66A/291Y/342T/383V、24K/66A/291Y/365S、24K/66A/342T/365S/388D/408E、24K/77M/291Y、24K/107L/163M/191D/291Y/351L/383V/388D、24K/107L/291Y/351L/365S/388D、24K/163M/351L/383V、24K/191D/291Y/365S、24K/199Q/260T/351L/362Q/383V、24K/199Q/260T/362Q/383V/388D、24K/260T/362Q/383V/388D、24K/291Y、24K/291Y/342T/351L/383V、24K/291Y/362Q/388D、24K/291Y/408A、24K/383V/388D、24K/388D、25H、25V、28S、28T、33T、42F/191D/408E、42F/199Q/291Y/383V、42F/291Y/351L/362Q/365S/383V/388D、42F/291Y/351L/362Q/383V/408A、42F/291Y/383V/388D、66A/82H/291Y/383V、66A/163M/191D/365S/383V、66A/199Q/351L/383V、66A/291Y、66A/291Y/362Q/365S/383V、66A/291Y/383V/388D、66A/383V、77M/291Y、77M/383V/388D、86T、107L/191D/199Q/365S/383V/388D、107L/191D/291Y/383V、148G、153S、163M/291Y/362Q/365S/383V/388D、163M/291Y/383V/388D、163M/383V、191D/199Q/365S/383V/388D、191D/260T/388D、191D/291Y、191D/291Y/342T/362Q/365S、191D/351L/383V/388D、199Q/260T/383V、199Q/291Y、260T、260T/291Y/365S/383V/408A、260T/365S/383V、291Y、291Y/351L/383V/388D、291Y/351L/383V/388D/408A、291Y/362Q/365S、291Y/365S/388D、291Y/383V、314K、315S、316V、319S、342T/362Q、351L/383V/388D、362Q、362Q/388D、383V、383V/388D、396R、397M、405A、406H、413L、419S和423V,其中位置参考SEQID NO:366编号。在一些另外的实施方案中,氨基酸差异包括取代S24E、S24K、S24K/V42F/K66A/F291Y、S24K/V42F/F291Y/H362Q、S24K/K66A/L163M/G191D/H362Q/A383V/A388D、S24K/K66A/G191D/A199Q/C260T/F291Y/R351L、S24K/K66A/G191D/A199Q/F291Y、S24K/K66A/G191D/C260T/F408A、S24K/K66A/C260T/F291Y/A383V/A388D/F408A、S24K/K66A/F291Y/N342T/A383V、S24K/K66A/F291Y/E365S、S24K/K66A/N342T/E365S/A388D/F408E、S24K/E77M/F291Y、S24K/D107L/L163M/G191D/F291Y/R351L/A383V/A388D、S24K/D107L/F291Y/R351L/E365S/A388D、S24K/L163M/R351L/A383V、S24K/G191D/F291Y/E365S、S24K/A199Q/C260T/R351L/H362Q/A383V、S24K/A199Q/C260T/H362Q/A383V/A388D、S24K/C260T/H362Q/A383V/A388D、S24K/F291Y、S24K/F291Y/N342T/R351L/A383V、S24K/F291Y/H362Q/A388D、S24K/F291Y/F408A、S24K/A383V/A388D、S24K/A388D、L25H、L25V、R28S、R28T、V33T、V42F/G191D/F408E、V42F/A199Q/F291Y/A383V、V42F/F291Y/R351L/H362Q/E365S/A383V/A388D、V42F/F291Y/R351L/H362Q/A383V/F408A、V42F/F291Y/A383V/A388D、K66A/Y82H/F291Y/A383V、K66A/L163M/G191D/E365S/A383V、K66A/A199Q/R351L/A383V、K66A/F291Y、K66A/F291Y/H362Q/E365S/A383V、K66A/F291Y/A383V/A388D、K66A/A383V、E77M/F291Y、E77M/A383V/A388D、S86T、D107L/G191D/A199Q/E365S/A383V/A388D、D107L/G191D/F291Y/A383V、N148G、A153S、L163M/F291Y/H362Q/E365S/A383V/A388D、L163M/F291Y/A383V/A388D、L163M/A383V、G191D/A199Q/E365S/A383V/A388D、G191D/C260T/A388D、G191D/F291Y、G191D/F291Y/N342T/H362Q/E365S、G191D/R351L/A383V/A388D、A199Q/C260T/A383V、A199Q/F291Y、C260T、C260T/F291Y/E365S/A383V/F408A、C260T/E365S/A383V、F291Y、F291Y/R351L/A383V/A388D、F291Y/R351L/A383V/A388D/F408A、F291Y/H362Q/E365S、F291Y/E365S/A388D、F291Y/A383V、R314K、E315S、W316V、H319S、N342T/H362Q、R351L/A383V/A388D、H362Q、H362Q/A388D、A383V、A383V/A388D、N396R、L397M、N405A、T406H、I413L、Q419S和L423V,其中位置参考SEQ ID NO:366编号。
在一些实施方案中,本公开内容提供了一种工程化转氨酶多肽,其包含与SEQ IDNO:366相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:24/66/191/199/291、24/66/291/365、163/291/362/365/383/388、163/291/383/388、191/291/342/362/365、291和291/383,其中位置参考SEQID NO:366编号。在一些实施方案中,氨基酸差异包括取代24K/66A/191D/199Q/291Y、24K/66A/291Y/365S、163M/291Y/362Q/365S/383V/388D、163M/291Y/383V/388D、191D/291Y/342T/362Q/365S、291Y和291Y/383V,其中位置参考SEQID NO:366编号。在一些另外的实施方案中,氨基酸差异包括取代S24K/K66A/G191D/A199Q/F291Y、S24K/K66A/F291Y/E365S、L163M/F291Y/H362Q/E365S/A383V/A388D、L163M/F291Y/A383V/A388D、G191D/F291Y/N342T/H362Q/E365S、F291Y和F291Y/A383V,其中位置参考SEQID NO:366编号。
在一些实施方案中,本公开内容提供了一种工程化转氨酶多肽,其包含与SEQ IDNO:650相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:10、13、13/24/108/163、13/24/108/163/311、13/24/133/199/311、13/24/163、13/24/199/311、13/108、13/108/199、13/108/311、13/199、13/311、14、14/24/108、14/24/108/133、14/24/108/199、14/24/199、14/108、14/108/133/311、14/108/311、14/311、24、24/163、24/163/199、35、72、73、78、95、101、108、108/199、114、154、163、169、175/316、199、199/311、226、293、311、316、382、383和386,其中位置参考SEQ ID NO:650编号。在一些实施方案中,氨基酸差异包括取代10E、13A、13A/24E/108R/163L/311S、13A/24E/133R/199Q/311S、13A/24E/163L、13A/24K/108R/163L、13A/24K/199Q/311S、13A/108R、13A/108R/199Q、13A/108R/311S、13A/199Q、13A/311S、14A、14G、14H、14H/24E/108R/133R、14H/24K/108R、14H/24K/108R/199Q、14H/24K/199Q、14H/108R、14H/108R/133R/311S、14H/108R/311S、14H/311S、24E、24E/163L、24E/163L/199Q、35E、72G、73R、73S、78A、95I、101L、108R、108R/199Q、114A、154S、163H、163S、163V、169C、169V、175D/316F、199Q、199Q/311S、226Q、293A、311K、316D、316E、316F、316G、316H、316I、316L、316N、316S、316V、316Y、382D、383L和386A,其中位置参考SEQ ID NO:650编号。在一些另外的实施方案中,氨基酸差异包括取代R10E、T13A、T13A/S24E/S108R/M163L/I311S、T13A/S24E/A133R/A199Q/I311S、T13A/S24E/M163L、T13A/S24K/S108R/M163L、T13A/S24K/A199Q/I311S、T13A/S108R、T13A/S108R/A199Q、T13A/S108R/I311S、T13A/A199Q、T13A/I311S、Y14A、Y14G、Y14H、Y14H/S24E/S108R/A133R、Y14H/S24K/S108R、Y14H/S24K/S108R/A199Q、Y14H/S24K/A199Q、Y14H/S108R、Y14H/S108R/A133R/I311S、Y14H/S108R/I311S、Y14H/I311S、S24E、S24E/M163L、S24E/M163L/A199Q、H35E、A72G、K73R、K73S、R78A、M95I、V101L、S108R、S108R/A199Q、T114A、T154S、M163H、M163S、M163V、F169C、F169V、G175D/W316F、A199Q、A199Q/I311S、M226Q、P293A、I311K、W316D、W316E、W316F、W316G、W316H、W316I、W316L、W316N、W316S、W316V、W316Y、E382D、V383L和D386A,其中位置参考SEQID NO:650编号。
在一些实施方案中,本公开内容提供了一种工程化转氨酶多肽,其包含与SEQ IDNO:650相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:14/108/133/311、24/163/199、72、78、316和383,其中位置参考SEQ ID NO:650编号。在一些实施方案中,氨基酸差异包括取代14H/108R/133R/311S、24E/163L/199Q、72G、78A、316L、316N、316S和383L,其中位置参考SEQ ID NO:650编号。在一些另外的实施方案中,氨基酸差异包括取代Y14H/S108R/A133R/I311S、S24E/M163L/A199Q、A72G、R78A、W316L、W316N、W316S和V383L,其中位置参考SEQ ID NO:650编号。
在一些实施方案中,在合适的反应条件下,具有转氨酶活性的工程化多肽能够以相对于参考多肽(例如,SEQ ID NO:2、4、8、366和/或650)的底物耐受性增加的对底物存在的耐受性将化合物(1)转化为化合物(2)。相应地,在一些实施方案中,在合适的反应条件下,在约72h、约48h、约36h、约24h或甚至更短时间长度的反应时间内,工程化多肽能够在存在至少约1g/L、5g/L、10g/L、20g/L、约30g/L、约40g/L、约50g/L、约70g/L、约75g/L、约100g/L的底物载量浓度的情况下,以至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%的转化率百分比将底物化合物(1)转化为化合物(2)。
本文提供了一些合适的反应条件,在这些条件下,工程化多肽的上述改进的特性可以根据多肽、底物、胺供体、辅因子、缓冲剂、共溶剂的浓度或量、pH和/或包括温度和反应时间的条件来确定。在一些实施方案中,合适的反应条件包括下文和实施例中描述的HTP、SFP或DSP测定条件。
如对于本领域技术人员将明显的,前述残基位置和每个残基位置的特定氨基酸残基可以被单独地或以各种组合使用,以合成转氨酶多肽,所述转氨酶多肽具有期望的改进的特性,包括酶活性、底物/产物偏好、立体选择性、底物/产物耐受性、及在多种条件诸如增加的温度、溶剂和/或pH的稳定性,以及其他。
在一些实施方案中,本公开内容还提供了包含本文描述的任何工程化转氨酶多肽的片段的工程化转氨酶多肽,所述工程化转氨酶多肽的片段保持工程化转氨酶多肽的功能性转氨酶活性和/或改进的特性。相应地,在一些实施方案中,本公开内容提供了具有转氨酶活性(例如,在合适的反应条件下能够将化合物(1)转化为化合物(2))的多肽片段,其中该片段包含本公开内容的工程化多肽诸如具有SEQ ID NO:6-936中的偶数编号序列标识符的示例性工程化多肽的全长氨基酸序列的至少约80%、90%、95%、98%或99%。
在一些实施方案中,本公开内容的工程化转氨酶多肽包含与本文描述的工程化转氨酶多肽序列(诸如具有SEQ ID NO:6-936中的偶数编号序列标识符的示例性工程化多肽序列)中的任一种相比包含缺失的氨基酸序列。因此,对于本公开内容的工程化转氨酶多肽的每个和每一个实施方案,氨基酸序列可以包括1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多的氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸、多达转氨酶多肽的氨基酸总数的10%、多达转氨酶多肽的氨基酸总数的10%、多达转氨酶多肽的氨基酸总数的20%、或多达转氨酶多肽的氨基酸总数的30%的缺失,其中本文描述的工程化转氨酶的相关功能活性和/或改进的特性被保持。在一些实施方案中,缺失可以包括1个-2个、1个-3个、1个-4个、1个-5个、1个-6个、1个-7个、1个-8个、1个-9个、1个-10个、1个-15个、1个-20个、1个-21个、1个-22个、1个-23个、1个-24个、1个-25个、1个-30个、1个-35个、1个-40个、1个-45个、1个-50个、1个-55个或约1个-60个氨基酸残基。在一些实施方案中,缺失的数目可以是1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、30个、30个、35个、40个、45个、50个、55个或60个氨基酸残基。在一些实施方案中,缺失可以包括1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、18个、20个、21个、22个、23个、24个、25个或30个氨基酸残基的缺失。
在一些实施方案中,本公开内容提供的工程化转氨酶多肽具有与本文描述的工程化转氨酶多肽序列(诸如具有SEQ ID NO:6-936中的偶数编号序列标识符的示例性工程化多肽序列)中的任一种相比包含插入的氨基酸序列。因此,对于本公开内容的转氨酶多肽的每个和每一个实施方案,插入可以包括1个或更多个氨基酸、2个或更多个氨基酸、3个或更多个氨基酸、4个或更多个氨基酸、5个或更多的氨基酸、6个或更多个氨基酸、8个或更多个氨基酸、10个或更多个氨基酸、15个或更多个氨基酸、或20个或更多个氨基酸,其中本文描述的工程化转氨酶的相关的功能活性和/或改进的特性被保持。插入可以是在转氨酶多肽的氨基末端或羧基末端,或内部部分。
在一些实施方案中,本公开内容的多肽呈融合多肽的形式,其中工程化多肽与其他多肽融合,其他多肽诸如,例如但不限于抗体标签(例如,myc表位)、纯化序列(例如,用于结合金属的His标签)和细胞定位信号(例如,分泌信号)。因此,本文描述的工程化多肽可以与其他多肽融合或不融合来使用。
本文描述的工程化转氨酶多肽不限于遗传编码氨基酸。因此,除了遗传编码氨基酸之外,本文所述的多肽可以完全或部分地包含天然存在的和/或合成的非编码氨基酸。本文描述的多肽可以包含的某些常见的非编码氨基酸包括但不限于:遗传编码氨基酸的D-立体异构体;2,3-二氨基丙酸(Dpr);α-氨基异丁酸(Aib);ε-氨基己酸(Aha);δ-氨基戊酸(Ava);N-甲基甘氨酸或肌氨酸(MeGly或Sar);鸟氨酸(Orn);瓜氨酸(Cit);叔丁基丙氨酸(Bua);叔丁基甘氨酸(Bug);N-甲基异亮氨酸(MeIle);苯基甘氨酸(Phg);环己基丙氨酸(Cha);正亮氨酸(Nle);萘基丙氨酸(Nal);2-氯苯丙氨酸(Ocf);3-氯苯丙氨酸(Mcf);4-氯苯丙氨酸(Pcf);2-氟苯丙氨酸(Off);3-氟苯丙氨酸(Mff);4-氟苯丙氨酸(Pff);2-溴苯丙氨酸(Obf);3-溴苯丙氨酸(Mbf);4-溴苯丙氨酸(Pbf);2-甲基苯丙氨酸(Omf);3-甲基苯丙氨酸(Mmf);4-甲基苯丙氨酸(Pmf);2-硝基苯丙氨酸(Onf);3-硝基苯丙氨酸(Mnf);4-硝基苯丙氨酸(Pnf);2-氰基苯丙氨酸(Ocf);3-氰基苯丙氨酸(Mcf);4-氰基苯丙氨酸(Pcf);2-三氟甲基苯丙氨酸(Otf);3-三氟甲基苯丙氨酸(Mtf);4-三氟甲基苯丙氨酸(Ptf);4-氨基苯丙氨酸(Paf);4-碘苯丙氨酸(Pif);4-氨基甲基苯丙氨酸(Pamf);2,4-二氯苯丙氨酸(Opef);3,4-二氯苯丙氨酸(Mpcf);2,4-二氟苯丙氨酸(Opff);3,4-二氟苯丙氨酸(Mpff);吡啶-2-基丙氨酸(2pAla);吡啶-3-基丙氨酸(3pAla);吡啶-4-基丙氨酸(4pAla);萘-1-基丙氨酸(1nAla);萘-2-基丙氨酸(2nAla);噻唑基丙氨酸(taAla);苯并噻吩基丙氨酸(bAla);噻吩基丙氨酸(tAla);呋喃基丙氨酸(fAla);高苯丙氨酸(hPhe);高酪氨酸(hTyr);高色氨酸(hTrp);五氟苯丙氨酸(5ff);苯乙烯基丙氨酸(sAla);蒽基丙氨酸(aAla);3,3-二苯基丙氨酸(Dfa);3-氨基-5-苯基戊酸(Afp);青霉胺(Pen);1,2,3,4-四氢异喹啉-3-羧酸(Tic);β-2-噻吩基丙氨酸(Thi);甲硫氨酸亚砜(Mso);N(w)-硝基精氨酸(nArg);高赖氨酸(hLys);膦酰基甲基苯丙氨酸(pmPhe);磷酸丝氨酸(pSer);磷酸苏氨酸(pThr);高天冬氨酸(hAsp);高谷氨酸(hGlu);1-氨基环戊-(2或3)-烯-4-羧酸;哌啶酸(PA);氮杂环丁烷-3-羧酸(ACA);1-氨基环戊烷-3-羧酸;烯丙基甘氨酸(aOly);炔丙基甘氨酸(pgGly);高丙氨酸(hAla);正缬氨酸(nVal);高亮氨酸(hLeu)、高缬氨酸(hVal);高异亮氨酸(hIle);高精氨酸(hArg);N-乙酰赖氨酸(AcLys);2,4-二氨基丁酸(Dbu);2,3-二氨基丁酸(Dab);N-甲基缬氨酸(MeVal);高半胱氨酸(hCys);高丝氨酸(hSer);羟基脯氨酸(Hyp)和高脯氨酸(hPro)。本文描述的多肽可以包含的另外的非编码氨基酸对本领域技术人员将是明显的。这些氨基酸可以处于L-构型或D-构型。
本领域技术人员将认识到,带有侧链保护基团的氨基酸或残基也可以构成本文描述的多肽。这种受保护氨基酸的非限制性实例,在这种情况下属于芳香类,包括(括号中列出保护基团),但不限于:Arg(tos)、Cys(甲基苄基)、Cys(硝基吡啶亚磺酰基)、Glu(δ-苄基酯)、Gln(呫吨基)、Asn(N-δ-呫吨基)、His(bom)、His(苄基)、His(tos)、Lys(fmoc)、Lys(tos)、Ser(O-苄基)、Thr(O-苄基)和Tyr(O-苄基)。
可以构成本文描述的多肽的构象上受限制的非编码氨基酸包括但不限于N-甲基氨基酸(L-构型);1-氨基环戊-(2或3)-烯-4-羧酸;哌可酸(pipecolic acid);氮杂环丁烷-3-羧酸;高脯氨酸(hPro);以及1-氨基环戊烷-3-羧酸。
在一些实施方案中,工程化多肽可以被提供于固体支持物诸如膜、树脂、固体载体或其他固相材料上。固体支持物可以包括有机聚合物,诸如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯(polyethyleneoxy)和聚丙烯酰胺以及它们的共聚物和接枝物。固体支持物还可以是无机的,诸如玻璃、二氧化硅、可控孔隙玻璃(CPG)、反相二氧化硅或金属诸如金或铂。固体支持物的构型可以呈珠、球、粒子(particle)、颗粒(granule)、凝胶、膜或表面的形式。表面可以是平面的、基本上平面的或非平面的。固体支持物可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特征。固体支持物可以被配置为孔、凹陷的形式或配置在其他容器(container)、器皿(vessel)、特征或位置中。
在一些实施方案中,具有转氨酶活性的工程化多肽结合或固定于固体支持物上,使得它们保留其相对于参考多肽(例如,SEQ ID NO:2、4、8、366和/或650)的改进的活性、对映异构体选择性、立体选择性和/或其他改进的特性。在这样的实施方案中,固定化多肽可以促进底物化合物向期望产物的生物催化转化,并且容易在反应完成后被保留(例如,通过保留其上固定有多肽的珠)并且然后在后续反应中重新使用或再循环。这样的固定化酶方法允许进一步提高效率和降低成本。相应地,还设想使用本公开内容的工程化转氨酶多肽的任何方法可以使用结合或固定在固体支持物上的相同的转氨酶多肽来进行。
工程化转氨酶多肽可以被非共价地或共价地结合。用于将酶缀合及固定至固体支持物(例如,树脂、膜、珠、玻璃等)的各种方法是本领域熟知的。特别地,PCT公布WO2012/177527 A1公开了能够将化合物(2)转化为化合物(1)的固定化的工程化转氨酶多肽,以及制备固定化多肽的方法,其中多肽通过疏水相互作用或共价键被物理附接至树脂,并且在包含至少多达100%有机溶剂的溶剂系统中是稳定的。用于将酶缀合及固定至固体支持物(例如,树脂、膜、珠、玻璃等)的其他方法是本领域熟知的(参见例如,Yi等人,Proc.Biochem.,42:895-898[2007];Martin等人,Appl.Microbiol.Biotechnol.,76:843-851[2007];Koszelewski等人,J.Mol.Cat.B:Enz.,63:39-44[2010];Truppo等人,Org.Proc.Res.Develop.,在线公布:dx.doi.org/10.1021/op200157c;和Mateo等人,Biotechnol.Prog.,18:629-34[2002]等)。
可用于固定本公开内容的工程化转氨酶多肽的固体支持物包括但不限于包含具有环氧化物官能团的聚甲基丙烯酸酯、具有氨基环氧化物官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯的珠或树脂。可用于固定本公开内容的工程化转氨酶的示例性固体支持物包括但不限于壳聚糖珠、Eupergit C和SEPABEAD(Mitsubishi),包括以下不同类型的SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。
在一些实施方案中,工程化转氨酶多肽可以以阵列的形式提供,多肽被布置在阵列中位置上不同的位置。在一些实施方案中,位置上不同的位置是固体支持物诸如96孔板中的孔。多于一种支持物可以被配置在阵列的多个位置上,所述多个位置是试剂的自动递送或通过检测方法和/或仪器可寻址的。这样的阵列可以用于测试多肽对多种底物化合物的转化。
在一些实施方案中,本文所述的工程化多肽可以以试剂盒的形式提供。试剂盒中的多肽可以单独存在或作为多于一种多肽存在。试剂盒还可以包括用于进行酶促反应的试剂、用于评估多肽活性的底物以及用于检测产物的试剂。试剂盒还可以包括试剂分配器和对于使用试剂盒的说明书。在一些实施方案中,本公开内容的试剂盒包括在不同可寻址位置处包含多于一种不同的工程化转氨酶多肽的阵列,其中不同的多肽是各自具有至少一种不同的改进的酶特性的参考序列的不同变体。这样的包含多于一种工程化多肽的阵列及其使用方法是已知的(参见例如,WO2009/008908A2)。
可用于制备工程化转氨酶多肽的多核苷酸、控制序列、表达载体和宿主细胞
在另一方面中,本公开内容提供了编码本文描述的具有转氨酶活性的工程化多肽的多核苷酸。可以将多核苷酸可操作地连接至控制基因表达的一个或更多个异源调控序列,以创建能够表达多肽的重组多核苷酸。包含编码工程化转氨酶的异源多核苷酸的表达构建体可以被引入到适当的宿主细胞中以表达相应的工程化转氨酶多肽。
在一些实施方案中,编码改进的转氨酶多肽的分离的多核苷酸被以多种方式操作以提供改进的多肽的活性和/或表达。取决于表达载体,在将分离的多核苷酸插入载体前对分离的多核苷酸的操作可以是期望的或必要的。用于利用重组DNA方法修饰多核苷酸和核酸序列的技术是本领域熟知的。
本领域普通技术人员理解,由于遗传密码的简并性,存在编码本公开内容的变体转氨酶多肽的多种核苷酸序列。例如,密码子AGA、AGG、CGA、CGC、CGG和CGU都编码氨基酸精氨酸。因此,在其中密码子指定精氨酸的本公开内容的核酸的每个位置处,该密码子可以被改变为以上描述的对应密码子中的任一个,而不改变所编码的多肽。应理解,RNA序列中的“U”对应于DNA序列中的“T”。本公开内容设想并提供了可以通过选择基于可能的密码子选择的组合制备的编码本公开内容的多肽的核酸序列的每种和每一种可能的变异。
如上文指示的,编码转氨酶的DNA序列还可以被设计为高密码子使用偏好密码子(在蛋白编码区比编码相同氨基酸的其他密码子以更高的频率使用的密码子)。优选的密码子可以根据单个基因、具有共同功能或来源的一组基因、高表达基因中的密码子使用、整个生物体的聚集蛋白编码区中的密码子频率、相关生物体的聚集蛋白编码区中的密码子频率或其组合来确定。其频率随基因表达的水平而增加的密码子通常是用于表达的最佳密码子。特别地,DNA序列可以针对在特定宿主生物体中表达被优化。用于确定特定生物体中的密码子频率(例如,密码子使用、相对同义密码子使用)和密码子偏好的多种方法是本领域熟知的,包括对基因中使用的密码子的多变量分析(例如,使用聚类分析或相关性分析)和有效数目。用于获得密码子使用的数据源可以依赖于能够编码蛋白的任何可得的核苷酸序列。如本领域熟知的,这些数据集包括实际已知编码表达蛋白(例如,完整的蛋白编码序列-CDS)、表达序列标签(EST)或基因组序列的预测编码区的核酸序列。编码变体转氨酶的多核苷酸可以使用本领域已知的任何合适的方法来制备。通常,寡核苷酸被单独地合成,然后连接(例如,通过酶促连接方法或化学连接方法或聚合酶介导的方法),以形成基本上任何期望的连续序列。在一些实施方案中,本公开内容的多核苷酸使用本领域已知的任何合适的方法通过化学合成来制备,包括但不限于自动化合成方法。例如,在亚磷酰胺方法中,寡核苷酸被合成(例如,在自动DNA合成仪中)、纯化、退火、连接并克隆到适当的载体中。在一些实施方案中,然后通过合成互补链和将链在适当条件下退火到一起,或通过用适当引物序列使用DNA聚合酶添加互补链来获得双链DNA片段。存在提供可在本公开内容中使用的本领域技术人员熟知的方法的多种常规和标准教科书。
例如,诱变和定向演化方法可以容易地应用于多核苷酸,以生成可以被表达、筛选和测定的变体文库。诱变和定向演化方法是本领域熟知的(参见例如,美国专利号5,605,793、5,811,238、5,830,721、5,834,252、5,837,458、5,928,905、6,096,548、6,117,679、6,132,970、6,165,793、6,180,406、6,251,674、6,265,201、6,277,638、6,287,861、6,287,862、6,291,242、6,297,053、6,303,344、6,309,883、6,319,713、6,319,714、6,323,030、6,326,204、6,335,160、6,335,198、6,344,356、6,352,859、6,355,484、6,358,740、6,358,742、6,365,377、6,365,408、6,368,861、6,372,497、6,337,186、6,376,246、6,379,964、6,387,702、6,391,552、6,391,640、6,395,547、6,406,855、6,406,910、6,413,745、6,413,774、6,420,175、6,423,542、6,426,224、6,436,675、6,444,468、6,455,253、6,479,652、6,482,647、6,483,011、6,484,105、6,489,146、6,500,617、6,500,639、6,506,602、6,506,603、6,518,065、6,519,065、6,521,453、6,528,311、6,537,746、6,573,098、6,576,467、6,579,678、6,586,182、6,602,986、6,605,430、6,613,514、6,653,072、6,686,515、6,703,240、6,716,631、6,825,001、6,902,922、6,917,882、6,946,296、6,961,664、6,995,017、7,024,312、7,058,515、7,105,297、7,148,054、7,220,566、7,288,375、7,384,387、7,421,347、7,430,477、7,462,469、7,534,564、7,620,500、7,620,502、7,629,170、7,702,464、7,747,391、7,747,393、7,751,986、7,776,598、7,783,428、7,795,030、7,853,410、7,868,138、7,783,428、7,873,477、7,873,499、7,904,249、7,957,912、7,981,614、8,014,961、8,029,988、8,048,674、8,058,001、8,076,138、8,108,150、8,170,806、8,224,580、8,377,681、8,383,346、8,457,903、8,504,498、8,589,085、8,762,066、8,768,871、9,593,326和所有相关的非美国的对应专利;Ling等人,Anal.Biochem.,254(2):157-78[1997];Dale等人,Meth.Mol.Biol.,57:369-74[1996];Smith,Ann.Rev.Genet.,19:423-462[1985];Botstein等人,Science,229:1193-1201[1985];Carter,Biochem.J.,237:1-7[1986];Kramer等人,Cell,38:879-887[1984];Wells等人,Gene,34:315-323[1985];Minshull等人,Curr.Op.Chem.Biol.,3:284-290[1999];Christians等人,Nat.Biotechnol.,17:259-264[1999];Crameri等人,Nature,391:288-291[1998];Crameri等人,Nat.Biotechnol.,15:436-438[1997];Zhang等人,Proc.Nat.Acad.Sci.U.S.A.,94:4504-4509[1997];Crameri等人,Nat.Biotechnol.,14:315-319[1996];Stemmer,Nature,370:389-391[1994];Stemmer,Proc.Nat.Acad.Sci.USA,91:10747-10751[1994];WO 95/22625;WO 97/0078;WO 97/35966;WO 98/27230;WO 00/42651;WO 01/75767和WO 2009/152336,其全部通过引用并入本文)。
在一些实施方案中,多核苷酸编码转氨酶多肽,所述转氨酶多肽包含与选自偶数编号序列标识符SEQ ID NO:2、4、8、366和/或650的参考序列至少约80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多地相同的氨基酸序列,其中该多肽具有转氨酶活性和如本文描述的一种或更多种改进的特性,例如以与参考序列(例如,多肽SEQ ID NO:2、4、8、366和/或650)相比增加的活性将化合物(1)转化为产物化合物(2)的能力。在一些实施方案中,参考序列选自SEQ ID NO:2、4、8、366和/或650。在一些实施方案中,参考序列是SEQ ID NO:2。在一些实施方案中,参考序列是SEQ ID NO:4。在一些实施方案中,参考序列是SEQ ID NO:8。在一些实施方案中,参考序列是SEQ IDNO:366。在一些实施方案中,参考序列是SEQ ID NO:650。
在一些实施方案中,多核苷酸编码工程化转氨酶多肽,所述多肽包含与SEQ IDNO:2、4、8、366和/或650相比具有上文描述的同一性百分比,并且具有一个或更多个氨基酸残基差异的氨基酸序列。在一些实施方案中,本公开内容提供了具有转氨酶活性的工程化多肽,所述工程化多肽包含与参考序列SEQ ID NO:2、4、8、366和/或650具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多序列同一性,和选自本文提供的那些取代(参见例如,表2-1、表2-2、表3-1、表3-2、表4-1、表4-2、表5-1和/或表5-2)的至少一种氨基酸残基差异的氨基酸序列。
在一些实施方案中,编码工程化转氨酶多肽的多核苷酸包含选自SEQ ID NO:5-171中的奇数编号序列标识符的序列。在一些实施方案中,多核苷酸序列选自SEQ ID NO:1、3、7、365和/或935。在一些实施方案中,本公开内容提供了编码具有转氨酶活性的多肽的工程化多核苷酸,其中工程化多核苷酸与选自SEQ ID NO:1、3、7、365和/或935的至少一种参考序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性。
在一些实施方案中,本公开内容提供了在特定条件诸如中等严格性或高度严格性的条件下,与编码本公开内容的工程化转氨酶的多核苷酸序列(或其互补序列)杂交的多核苷酸。在一些实施方案中,多核苷酸能够在高度严格性条件下与选自具有SEQ ID NO:5-935中的奇数编号序列标识符的序列的多核苷酸或其互补序列杂交,并且编码本文描述的具有一种或更多种改进的特性的具有转氨酶活性的多肽。
在一些实施方案中,能够在高度严格性条件下杂交的多核苷酸编码以下工程化转氨酶多肽,所述工程化转氨酶多肽包含与SEQ ID NO:4相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:21/163/286/291/314/316/323/383/388/408/414/416、18、20、21、21/23/56/146、21/23/56/146/432、21/23/146/417、21/23/395/417/432、21/53/56、21/53/417、21/56/395、21/417/432、23、23/53、23/53/56、23/53/56/146/395、23/53/395、23/53/417、23/53/432、23/56、23/56/395、23/56/395/417、23/395/417、23/417、23/417/432、53、53/56、53/146/417、53/395、56、56/74/241/286/314/316/323、56/86/163/314/316/383/414/416/422、56/86/286/314/414/416、56/86/314/316/323/394/414/422、56/146/417、56/146/432、56/147、56/163、56/163/286/316/323/383/394、56/286/314/316/323/422、56/286/383、56/323、56/323/383、56/323/383/394、56/383、56/395、74/81/286/316/323/383、74/85/86/163/286/316/323/394、74/85/314/316/414/416、74/86/163/316、74/86/316/323/383/394、74/88/286/316/323/383、74/88/323/383、74/163/286/316/383/394/416、74/163/314/316、74/163/314/316/323/394、74/163/314/323/383/414/416、74/286、74/286/316/323、74/286/394/416、74/314/323/383/394/414、74/316/323/394、85/86/88/163/323/383/394、85/86/163/314/323/394/414、85/286、85/286/323、86、86/88/163/323/383/414/422、86/383/394、88、88/163/286/383、88/286/316/323、88/286/316/323/383/414/416、88/316/323、146、146/147/395/417、146/395、146/395/417、146/417、147/395/417/432、147/417、149、157、163、163/222/286/316/323/383/394、163/286、163/286/314/316/323/414/416、163/286/314/323/394、163/286/316/323/394/416、163/286/414、163/314/316/394、163/314/323/394、163/314/383、163/314/414、163/316/323、163/323、163/383、164、199/417、259、260、284、286、286/314/323/383、286/314/394、286/316/323/383/414/416、286/316/383/394、286/316/394/414/416、286/323、286/323/383/414、286/323/416、286/383、286/416、314/316、314/316/323、314/316/323/383/422、314/316/323/394、314/316/394、314/323/383/394、314/383、314/383/414/422、315、316、316/323/383/394、316/323/394/414/416、316/414/422、323、323/383、323/383/394/414/416、323/394、383、395、395/417、395/417/432、400、401、403、404、405、406、408、415、417、417/432、420和422,其中位置参考SEQ ID NO:4编号。在一些实施方案中,氨基酸差异包括取代18A、20C、21H、21P/23S/56C/146H、21P/23S/56C/146H/432V、21P/23S/146H/417V、21P/23S/395D/417S/432V、21P/53C/56C、21P/53C/417S、21P/56C/395D、21P/417S/432V、21R、23A、23R、23S/53C、23S/53C/56C、23S/53C/56C/146H/395D、23S/53C/395D、23S/53C/417S、23S/53C/432V、23S/56C、23S/56C/395D、23S/56C/395D/417V、23S/395D/417S、23S/417S、23S/417V、23S/417V/432V、53C、53C/56C、53C/146H/417S、53C/395D、56A、56A/74T/241V/286S/314R/316W/323T、56A/86A/163F/314R/316W/383V/414V/416A/422A、56A/86A/286S/314R/414V/416A、56A/86A/314R/316W/323T/394G/414V/422A、56A/163F、56A/163F/286S/316W/323T/383V/394G、56A/286S/314R/316W/323T/422A、56A/286S/383V、56A/323T、56A/323T/383V、56A/323T/383V/394G、56A/383V、56C、56C/146H/417V、56C/146H/432V、56C/147R、56C/395D、56T、56V、74T/81S/286S/316W/323T/383V、74T/85V/86A/163F/286S/316W/323T/394G、74T/85V/314R/316W/414V/416A、74T/86A/163F/316W、74T/86A/316W/323T/383V/394G、74T/88R/286S/316W/323T/383V、74T/88R/323T/383V、74T/163F/286S/316W/383V/394G/416A、74T/163F/314R/316W、74T/163F/314R/316W/323T/394G、74T/163F/314R/323T/383V/414V/416A、74T/286S、74T/286S/316W/323T、74T/286S/394G/416A、74T/314R/323T/383V/394G/414V、74T/316W/323T/394G、85V/86A/88R/163F/323T/383V/394G、85V/86A/163F/314R/323T/394G/414V、85V/286S、85V/286S/323T、86A/88R/163F/323T/383V/414V/422A、86A/383V/394G、86G、88R/163F/286S/383V、88R/286S/316W/323T、88R/286S/316W/323T/383V/414V/416A、88R/316W/323T、88S、88T、146H、146H/147R/395D/417S、146H/395D、146H/395D/417S、146H/417S、146H/417V、147R/395D/417S/432V、147R/417S、149S、157A、163F、163F/222V/286S/316W/323T/383V/394G、163F/286S、163F/286S/314R/316W/323T/414V/416A、163F/286S/314R/323T/394G、163F/286S/316W/323T/394G/416A、163F/286S/414V、163F/314R/316W/394G、163F/314R/323T/394G、163F/314R/383V、163F/314R/414V、163F/316W/323T、163F/323T、163F/383V、163L、163M、164A、164D、164Q、164S、199V/417S、259V、260T、284A、286S、286S/314R/323T/383V、286S/314R/394G、286S/316W/323T/383V/414V/416A、286S/316W/383V/394G、286S/316W/394G/414V/416A、286S/323T、286S/323T/383V/414V、286S/323T/416A、286S/383V、286S/416A、314R/316W、314R/316W/323T、314R/316W/323T/383V/422A、314R/316W/323T/394G、314R/316W/394G、314R/323T/383V/394G、314R/383V、314R/383V/414V/422A、315G、315R、316A、316F、316G、316H、316L、316N、316R、316V、316W/323T/383V/394G、316W/323T/394G/414V/416A、316W/414V/422A、323C、323S、323T、323T/383V、323T/383V/394G/414V/416A、323T/394G、383V、395D、395D/417S、395D/417S/432V、395D/417V、400D、401A、401K、401S、403V、404S、405H、405W、406S、408F、408L、408W、415G、415W、417A、417S、417S/432V、417V、417V/432V、420G、422L和422T,其中位置参考SEQ ID NO:4编号。在一些另外的实施方案中,氨基酸差异包括取代G18A、T20C、D21H、D21P/P23S/L56C/R146H、D21P/P23S/L56C/R146H/A432V、D21P/P23S/R146H/L417V、D21P/P23S/G395D/L417S/A432V、D21P/N53C/L56C、D21P/N53C/L417S、D21P/L56C/G395D、D21P/L417S/A432V、D21R、P23A、P23R、P23S/N53C、P23S/N53C/L56C、P23S/N53C/L56C/R146H/G395D、P23S/N53C/G395D、P23S/N53C/L417S、P23S/N53C/A432V、P23S/L56C、P23S/L56C/G395D、P23S/L56C/G395D/L417V、P23S/G395D/L417S、P23S/L417S、P23S/L417V、P23S/L417V/A432V、N53C、N53C/L56C、N53C/R146H/L417S、N53C/G395D、L56A、L56A/A74T/A241V/N286S/I314R/E316W/A323T、L56A/S86A/K163F/I314R/E316W/A383V/C414V/P416A/V422A、L56A/S86A/N286S/I314R/C414V/P416A、L56A/S86A/I314R/E316W/A323T/D394G/C414V/V422A、L56A/K163F、L56A/K163F/N286S/E316W/A323T/A383V/D394G、L56A/N286S/I314R/E316W/A323T/V422A、L56A/N286S/A383V、L56A/A323T、L56A/A323T/A383V、L56A/A323T/A383V/D394G、L56A/A383V、L56C、L56C/R146H/L417V、L56C/R146H/A432V、L56C/W147R、L56C/G395D、L56T、L56V、A74T/G81S/N286S/E316W/A323T/A383V、A74T/F85V/S86A/K163F/N286S/E316W/A323T/D394G、A74T/F85V/I314R/E316W/C414V/P416A、A74T/S86A/K163F/E316W、A74T/S86A/E316W/A323T/A383V/D394G、A74T/H88R/N286S/E316W/A323T/A383V、A74T/H88R/A323T/A383V、A74T/K163F/N286S/E316W/A383V/D394G/P416A、A74T/K163F/I314R/E316W、A74T/K163F/I314R/E316W/A323T/D394G、A74T/K163F/I314R/A323T/A383V/C414V/P416A、A74T/N286S、A74T/N286S/E316W/A323T、A74T/N286S/D394G/P416A、A74T/I314R/A323T/A383V/D394G/C414V、A74T/E316W/A323T/D394G、F85V/S86A/H88R/K163F/A323T/A383V/D394G、F85V/S86A/K163F/I314R/A323T/D394G/C414V、F85V/N286S、F85V/N286S/A323T、S86A/H88R/K163F/A323T/A383V/C414V/V422A、S86A/A383V/D394G、S86G、H88R/K163F/N286S/A383V、H88R/N286S/E316W/A323T、H88R/N286S/E316W/A323T/A383V/C414V/P416A、H88R/E316W/A323T、H88S、H88T、R146H、R146H/W147R/G395D/L417S、R146H/G395D、R146H/G395D/L417S、R146H/L417S、R146H/L417V、W147R/G395D/L417S/A432V、W147R/L417S、A149S、S157A、K163F、K163F/A222V/N286S/E316W/A323T/A383V/D394G、K163F/N286S、K163F/N286S/I314R/E316W/A323T/C414V/P416A、K163F/N286S/I314R/A323T/D394G、K163F/N286S/E316W/A323T/D394G/P416A、K163F/N286S/C414V、K163F/I314R/E316W/D394G、K163F/I314R/A323T/D394G、K163F/I314R/A383V、K163F/I314R/C414V、K163F/E316W/A323T、K163F/A323T、K163F/A383V、K163L、K163M、P164A、P164D、P164Q、P164S、A199V/L417S、I259V、C260T、S284A、N286S、N286S/I314R/A323T/A383V、N286S/I314R/D394G、N286S/E316W/A323T/A383V/C414V/P416A、N286S/E316W/A383V/D394G、N286S/E316W/D394G/C414V/P416A、N286S/A323T、N286S/A323T/A383V/C414V、N286S/A323T/P416A、N286S/A383V、N286S/P416A、I314R/E316W、I314R/E316W/A323T、I314R/E316W/A323T/A383V/V422A、I314R/E316W/A323T/D394G、I314R/E316W/D394G、I314R/A323T/A383V/D394G、I314R/A383V、I314R/A383V/C414V/V422A、E315G、E315R、E316A、E316F、E316G、E316H、E316L、E316N、E316R、E316V、E316W/A323T/A383V/D394G、E316W/A323T/D394G/C414V/P416A、E316W/C414V/V422A、A323C、A323S、A323T、A323T/A383V、A323T/A383V/D394G/C414V/P416A、A323T/D394G、A383V、G395D、G395D/L417S、G395D/L417S/A432V、G395D/L417V、S400D、E401A、E401K、E401S、I403V、A404S、N405H、N405W、T406S、T408F、T408L、T408W、R415G、R415W、L417A、L417S、L417S/A432V、L417V、L417V/A432V、S420G、V422L和V422T,其中位置参考SEQ ID NO:4编号。
在一些实施方案中,能够在高度严格性条件下杂交的多核苷酸编码以下工程化转氨酶多肽,所述工程化转氨酶多肽包含与SEQ ID NO:4相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:74/81/286/316/323/383、163/286/314/316/323/414/416、163/286/314/323/394、286/314/323/383、286/316/323/383/414/416、315和408,其中位置参考SEQ ID NO:4编号。在一些实施方案中,氨基酸差异包括取代74T/81S/286S/316W/323T/383V、163F/286S/314R/316W/323T/414V/416A、163F/286S/314R/323T/394G、286S/314R/323T/383V、286S/316W/323T/383V/414V/416A、315G和408F,其中位置参考SEQ IDNO:4编号。在一些另外的实施方案中,氨基酸差异包括取代A74T/G81S/N286S/E316W/A323T/A383V、K163F/N286S/I314R/E316W/A323T/C414V/P416A、K163F/N286S/I314R/A323T/D394G、N286S/I314R/A323T/A383V、N286S/E316W/A323T/A383V/C414V/P416A、E315G和T408F,其中位置参考SEQ ID NO:4编号。
在一些实施方案中,能够在高度严格性条件下杂交的多核苷酸编码以下工程化转氨酶多肽,所述工程化转氨酶多肽包含与SEQ ID NO:8相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:5、18/23/149/260/383/395/401/416、18/23/149/383、18/163/164、21、21/163/315/316、21/163/323/408、21/408、23/56/86/149/163/164/383/401/416、23/86、23/149/260、23/149/284/383/395、23/163/164/383、23/163/164/401/416、24、42、42/110、42/187/272、42/187/324/363/366、42/187/353、42/272/291、42/272/291/363、42/272/324/363/366、42/272/363/410、42/272/410、42/291/313/363/410、42/291/363、42/291/363/366、42/353、42/363、46、66、77、86/149/163/164/383/395/401、86/149/395、86/163/164/260/383、86/383、107、110、110/187、110/187/253/410、134、138、149/164/260/383/395/401、149/260/383、149/416、163/259/323/408、163/259/408、163/315/316、164/260/401、164/316/383/401、167、186、187、187/253/363/366、187/272/324/363/410、187/272/363、187/272/363/366/410、187/291、189、191、195、199、203、210、211、248、259/307、260/395/401、272、272/353、272/363/366、272/410、277、291、305、309、315、342、343、351、354、358、361、362、363、363/366、365、367、383、383/401、383/416/422、385、388、389、392、395、396、401、404、405、408、410、416、417、439、443、447、450和451,其中位置参考SEQID NO:8编号。在一些实施方案中,氨基酸差异包括取代5E、5G、18A/23R/149S/260T/383V/395D/401S/416P、18A/23R/149S/383V、18A/163M/164Q、21H、21H/163L/315G/316F、21H/163L/323C/408F、21H/408F、23R/56C/86G/149S/163M/164D/383V/401S/416P、23R/86G、23R/149S/260T、23R/149S/284A/383V/395D、23R/163M/164Q/383V、23R/163M/164S/401S/416P、24K、24R、42F、42F/110K、42F/187E/272E、42F/187E/324S/363L/366H、42F/187E/353T、42F/272E/291Y、42F/272E/291Y/363L、42F/272E/324S/363L/366H、42F/272E/363L/410H、42F/272E/410H、42F/291Y/313V/363L/410H、42F/291Y/363L、42F/291Y/363L/366H、42F/353T、42F/363L、46S、66A、77M、86G/149S/163M/164S/383V/395D/401S、86G/149S/395D、86G/163M/164S/260T/383V、86G/383V、107L、107S、107Y、110K、110K/187E、110K/187E/253L/410H、134V、138R、149S/164S/260T/383V/395D/401A、149S/260T/383V、149S/416P、163L/259V/323C/408F、163L/259V/408F、163L/315G/316F、164D/316H/383V/401S、164S/260T/401S、167N、186Q、187E、187E/253L/363L/366H、187E/272E/324S/363L/410H、187E/272E/363L、187E/272E/363L/366H/410H、187E/291Y、189F、189S、189V、189W、191D、191F、195W、199Q、203L、210A、210L、210M、210V、210Y、211R、248G、259V/307M、260T/395D/401S、272E、272E/353T、272E/363L/366H、272E/410H、277S、291Y、305E、309A、309F、309R、315G、342T、343G、351L、354S、358L、361R、362Q、362V、363L、363L/366H、365L、365Q、365R、365S、367T、383V、383V/401A、383V/416P/422T、385L、385T、388D、388L、388P、389D、392A、392L、395R、396P、396Y、401Q、401S、404M、405W、408A、408E、408W、410H、416P、417S、439L、439S、443L、443S、447S、447T、450D和451S,其中位置参考SEQ ID NO:8编号。在一些另外的实施方案中,氨基酸差异包括取代Q5E、Q5G、G18A/P23R/A149S/C260T/A383V/G395D/E401S/A416P、G18A/P23R/A149S/A383V、G18A/F163M/P164Q、D21H、D21H/F163L/E315G/W316F、D21H/F163L/T323C/T408F、D21H/T408F、P23R/L56C/S86G/A149S/F163M/P164D/A383V/E401S/A416P、P23R/S86G、P23R/A149S/C260T、P23R/A149S/S284A/A383V/G395D、P23R/F163M/P164Q/A383V、P23R/F163M/P164S/E401S/A416P、S24K、S24R、V42F、V42F/R110K、V42F/Y187E/V272E、V42F/Y187E/G324S/I363L/R366H、V42F/Y187E/A353T、V42F/V272E/F291Y、V42F/V272E/F291Y/I363L、V42F/V272E/G324S/I363L/R366H、V42F/V272E/I363L/L410H、V42F/V272E/L410H、V42F/F291Y/A313V/I363L/L410H、V42F/F291Y/I363L、V42F/F291Y/I363L/R366H、V42F/A353T、V42F/I363L、G46S、K66A、E77M、S86G/A149S/F163M/P164S/A383V/G395D/E401S、S86G/A149S/G395D、S86G/F163M/P164S/C260T/A383V、S86G/A383V、D107L、D107S、D107Y、R110K、R110K/Y187E、R110K/Y187E/V253L/L410H、A134V、P138R、A149S/P164S/C260T/A383V/G395D/E401A、A149S/C260T/A383V、A149S/A416P、F163L/I259V/T323C/T408F、F163L/I259V/T408F、F163L/E315G/W316F、P164D/W316H/A383V/E401S、P164S/C260T/E401S、S167N、R186Q、Y187E、Y187E/V253L/I363L/R366H、Y187E/V272E/G324S/I363L/L410H、Y187E/V272E/I363L、Y187E/V272E/I363L/R366H/L410H、Y187E/F291Y、E189F、E189S、E189V、E189W、G191D、G191F、E195W、A199Q、R203L、Q210A、Q210L、Q210M、Q210V、Q210Y、K211R、K248G、I259V/L307M、C260T/G395D/E401S、V272E、V272E/A353T、V272E/I363L/R366H、V272E/L410H、T277S、F291Y、K305E、T309A、T309F、T309R、E315G、N342T、E343G、R351L、P354S、E358L、K361R、H362Q、H362V、I363L、I363L/R366H、E365L、E365Q、E365R、E365S、P367T、A383V、A383V/E401A、A383V/A416P/V422T、K385L、K385T、A388D、A388L、A388P、S389D、P392A、P392L、G395R、N396P、N396Y、E401Q、E401S、A404M、N405W、T408A、T408E、T408W、L410H、A416P、L417S、D439L、D439S、K443L、K443S、K447S、K447T、A450D和E451S,其中位置参考SEQ ID NO:8编号。
在一些实施方案中,能够在高度严格性条件下杂交的多核苷酸编码以下工程化转氨酶多肽,所述工程化转氨酶多肽包含与SEQ ID NO:8相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:18/23/149/383、21/163/323/408、272、291和383,其中位置参考SEQ ID NO:8编号。在一些实施方案中,氨基酸差异包括取代18A/23R/149S/383V、21H/163L/323C/408F、272E、291Y和383V,其中位置参考SEQ ID NO:8编号。在一些另外的实施方案中,氨基酸差异包括取代G18A/P23R/A149S/A383V、D21H/F163L/T323C/T408F、V272E、F291Y和A383V,其中位置参考SEQ ID NO:8编号。
在一些实施方案中,能够在高度严格性条件下杂交的多核苷酸编码以下工程化转氨酶多肽,所述工程化转氨酶多肽包含与SEQ ID NO:366相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:24、24/42/66/291、24/42/291/362、24/66/163/191/362/383/388、24/66/191/199/260/291/351、24/66/191/199/291、24/66/191/260/408、24/66/260/291/383/388/408、24/66/291/342/383、24/66/291/365、24/66/342/365/388/408、24/77/291、24/107/163/191/291/351/383/388、24/107/291/351/365/388、24/163/351/383、24/191/291/365、24/199/260/351/362/383、24/199/260/362/383/388、24/260/362/383/388、24/291、24/291/342/351/383、24/291/362/388、24/291/408、24/383/388、24/388、25、28、33、42/191/408、42/199/291/383、42/291/351/362/365/383/388、42/291/351/362/383/408、42/291/383/388、66/82/291/383、66/163/191/365/383、66/199/351/383、66/291、66/291/362/365/383、66/291/383/388、66/383、77/291、77/383/388、86、107/191/199/365/383/388、107/191/291/383、148、153、163/291/362/365/383/388、163/291/383/388、163/383、191/199/365/383/388、191/260/388、191/291、191/291/342/362/365、191/351/383/388、199/260/383、199/291、260、260/291/365/383/408、260/365/383、291、291/351/383/388、291/351/383/388/408、291/362/365、291/365/388、291/383、314、315、316、319、342/362、351/383/388、362、362/388、383、383/388、396、397、405、406、413、419和423,其中位置参考SEQ ID NO:366编号。在一些实施方案中,氨基酸差异包括取代24E、24K、24K/42F/66A/291Y、24K/42F/291Y/362Q、24K/66A/163M/191D/362Q/383V/388D、24K/66A/191D/199Q/260T/291Y/351L、24K/66A/191D/199Q/291Y、24K/66A/191D/260T/408A、24K/66A/260T/291Y/383V/388D/408A、24K/66A/291Y/342T/383V、24K/66A/291Y/365S、24K/66A/342T/365S/388D/408E、24K/77M/291Y、24K/107L/163M/191D/291Y/351L/383V/388D、24K/107L/291Y/351L/365S/388D、24K/163M/351L/383V、24K/191D/291Y/365S、24K/199Q/260T/351L/362Q/383V、24K/199Q/260T/362Q/383V/388D、24K/260T/362Q/383V/388D、24K/291Y、24K/291Y/342T/351L/383V、24K/291Y/362Q/388D、24K/291Y/408A、24K/383V/388D、24K/388D、25H、25V、28S、28T、33T、42F/191D/408E、42F/199Q/291Y/383V、42F/291Y/351L/362Q/365S/383V/388D、42F/291Y/351L/362Q/383V/408A、42F/291Y/383V/388D、66A/82H/291Y/383V、66A/163M/191D/365S/383V、66A/199Q/351L/383V、66A/291Y、66A/291Y/362Q/365S/383V、66A/291Y/383V/388D、66A/383V、77M/291Y、77M/383V/388D、86T、107L/191D/199Q/365S/383V/388D、107L/191D/291Y/383V、148G、153S、163M/291Y/362Q/365S/383V/388D、163M/291Y/383V/388D、163M/383V、191D/199Q/365S/383V/388D、191D/260T/388D、191D/291Y、191D/291Y/342T/362Q/365S、191D/351L/383V/388D、199Q/260T/383V、199Q/291Y、260T、260T/291Y/365S/383V/408A、260T/365S/383V、291Y、291Y/351L/383V/388D、291Y/351L/383V/388D/408A、291Y/362Q/365S、291Y/365S/388D、291Y/383V、314K、315S、316V、319S、342T/362Q、351L/383V/388D、362Q、362Q/388D、383V、383V/388D、396R、397M、405A、406H、413L、419S和423V,其中位置参考SEQ ID NO:366编号。在一些另外的实施方案中,氨基酸差异包括取代S24E、S24K、S24K/V42F/K66A/F291Y、S24K/V42F/F291Y/H362Q、S24K/K66A/L163M/G191D/H362Q/A383V/A388D、S24K/K66A/G191D/A199Q/C260T/F291Y/R351L、S24K/K66A/G191D/A199Q/F291Y、S24K/K66A/G191D/C260T/F408A、S24K/K66A/C260T/F291Y/A383V/A388D/F408A、S24K/K66A/F291Y/N342T/A383V、S24K/K66A/F291Y/E365S、S24K/K66A/N342T/E365S/A388D/F408E、S24K/E77M/F291Y、S24K/D107L/L163M/G191D/F291Y/R351L/A383V/A388D、S24K/D107L/F291Y/R351L/E365S/A388D、S24K/L163M/R351L/A383V、S24K/G191D/F291Y/E365S、S24K/A199Q/C260T/R351L/H362Q/A383V、S24K/A199Q/C260T/H362Q/A383V/A388D、S24K/C260T/H362Q/A383V/A388D、S24K/F291Y、S24K/F291Y/N342T/R351L/A383V、S24K/F291Y/H362Q/A388D、S24K/F291Y/F408A、S24K/A383V/A388D、S24K/A388D、L25H、L25V、R28S、R28T、V33T、V42F/G191D/F408E、V42F/A199Q/F291Y/A383V、V42F/F291Y/R351L/H362Q/E365S/A383V/A388D、V42F/F291Y/R351L/H362Q/A383V/F408A、V42F/F291Y/A383V/A388D、K66A/Y82H/F291Y/A383V、K66A/L163M/G191D/E365S/A383V、K66A/A199Q/R351L/A383V、K66A/F291Y、K66A/F291Y/H362Q/E365S/A383V、K66A/F291Y/A383V/A388D、K66A/A383V、E77M/F291Y、E77M/A383V/A388D、S86T、D107L/G191D/A199Q/E365S/A383V/A388D、D107L/G191D/F291Y/A383V、N148G、A153S、L163M/F291Y/H362Q/E365S/A383V/A388D、L163M/F291Y/A383V/A388D、L163M/A383V、G191D/A199Q/E365S/A383V/A388D、G191D/C260T/A388D、G191D/F291Y、G191D/F291Y/N342T/H362Q/E365S、G191D/R351L/A383V/A388D、A199Q/C260T/A383V、A199Q/F291Y、C260T、C260T/F291Y/E365S/A383V/F408A、C260T/E365S/A383V、F291Y、F291Y/R351L/A383V/A388D、F291Y/R351L/A383V/A388D/F408A、F291Y/H362Q/E365S、F291Y/E365S/A388D、F291Y/A383V、R314K、E315S、W316V、H319S、N342T/H362Q、R351L/A383V/A388D、H362Q、H362Q/A388D、A383V、A383V/A388D、N396R、L397M、N405A、T406H、I413L、Q419S和L423V,其中位置参考SEQID NO:366编号。
在一些实施方案中,能够在高度严格性条件下杂交的多核苷酸编码以下工程化转氨酶多肽,所述工程化转氨酶多肽包含与SEQ ID NO:366相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:24/66/191/199/291、24/66/291/365、163/291/362/365/383/388、163/291/383/388、191/291/342/362/365、291和291/383,其中位置参考SEQ IDNO:366编号。在一些实施方案中,氨基酸差异包括取代24K/66A/191D/199Q/291Y、24K/66A/291Y/365S、163M/291Y/362Q/365S/383V/388D、163M/291Y/383V/388D、191D/291Y/342T/362Q/365S、291Y和291Y/383V,其中位置参考SEQ ID NO:366编号。在一些另外的实施方案中,氨基酸差异包括取代S24K/K66A/G191D/A199Q/F291Y、S24K/K66A/F291Y/E365S、L163M/F291Y/H362Q/E365S/A383V/A388D、L163M/F291Y/A383V/A388D、G191D/F291Y/N342T/H362Q/E365S、F291Y和F291Y/A383V,其中位置参考SEQ ID NO:366编号。
在一些实施方案中,能够在高度严格性条件下杂交的多核苷酸编码以下工程化转氨酶多肽,所述工程化转氨酶多肽包含与SEQ ID NO:650相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:10、13、13/24/108/163、13/24/108/163/311、13/24/133/199/311、13/24/163、13/24/199/311、13/108、13/108/199、13/108/311、13/199、13/311、14、14/24/108、14/24/108/133、14/24/108/199、14/24/199、14/108、14/108/133/311、14/108/311、14/311、24、24/163、24/163/199、35、72、73、78、95、101、108、108/199、114、154、163、169、175/316、199、199/311、226、293、311、316、382、383和386,其中位置参考SEQ IDNO:650编号。在一些实施方案中,氨基酸差异包括取代10E、13A、13A/24E/108R/163L/311S、13A/24E/133R/199Q/311S、13A/24E/163L、13A/24K/108R/163L、13A/24K/199Q/311S、13A/108R、13A/108R/199Q、13A/108R/311S、13A/199Q、13A/311S、14A、14G、14H、14H/24E/108R/133R、14H/24K/108R、14H/24K/108R/199Q、14H/24K/199Q、14H/108R、14H/108R/133R/311S、14H/108R/311S、14H/311S、24E、24E/163L、24E/163L/199Q、35E、72G、73R、73S、78A、95I、101L、108R、108R/199Q、114A、154S、163H、163S、163V、169C、169V、175D/316F、199Q、199Q/311S、226Q、293A、311K、316D、316E、316F、316G、316H、316I、316L、316N、316S、316V、316Y、382D、383L和386A,其中位置参考SEQ ID NO:650编号。在一些另外的实施方案中,氨基酸差异包括取代R10E、T13A、T13A/S24E/S108R/M163L/I311S、T13A/S24E/A133R/A199Q/I311S、T13A/S24E/M163L、T13A/S24K/S108R/M163L、T13A/S24K/A199Q/I311S、T13A/S108R、T13A/S108R/A199Q、T13A/S108R/I311S、T13A/A199Q、T13A/I311S、Y14A、Y14G、Y14H、Y14H/S24E/S108R/A133R、Y14H/S24K/S108R、Y14H/S24K/S108R/A199Q、Y14H/S24K/A199Q、Y14H/S108R、Y14H/S108R/A133R/I311S、Y14H/S108R/I311S、Y14H/I311S、S24E、S24E/M163L、S24E/M163L/A199Q、H35E、A72G、K73R、K73S、R78A、M95I、V101L、S108R、S108R/A199Q、T114A、T154S、M163H、M163S、M163V、F169C、F169V、G175D/W316F、A199Q、A199Q/I311S、M226Q、P293A、I311K、W316D、W316E、W316F、W316G、W316H、W316I、W316L、W316N、W316S、W316V、W316Y、E382D、V383L和D386A,其中位置参考SEQ ID NO:650编号。
在一些实施方案中,能够在高度严格性条件下杂交的多核苷酸编码以下工程化转氨酶多肽,所述工程化转氨酶多肽包含与SEQ ID NO:650相比具有选自以下的一个或更多个氨基酸残基差异的氨基酸序列:14/108/133/311、24/163/199、72、78、316和383,其中位置参考SEQ ID NO:650编号。在一些实施方案中,氨基酸差异包括取代14H/108R/133R/311S、24E/163L/199Q、72G、78A、316L、316N、316S和383L,其中位置参考SEQ ID NO:650编号。在一些另外的实施方案中,氨基酸差异包括取代Y14H/S108R/A133R/I311S、S24E/M163L/A199Q、A72G、R78A、W316L、W316N、W316S和V383L,其中位置参考SEQ ID NO:650编号。
在一些实施方案中,本公开内容的变体转氨酶还包含不改变酶被编码的活性的另外的序列。例如,在一些实施方案中,变体转氨酶被连接至可用于纯化的表位标签或另一个序列。
在一些实施方案中,本公开内容的变体转氨酶多肽从它们在其中被表达的宿主细胞(例如,酵母宿主细胞或丝状真菌宿主细胞)分泌,并且被表达为包括信号肽(即,连接至多肽的氨基末端并指导所编码的多肽进入细胞分泌途径的氨基酸序列)的前蛋白。
当已知工程化多肽的序列时,编码该酶的多核苷酸可以根据已知的合成方法通过标准固相方法来制备。在一些实施方案中,多达约100个碱基的片段可以被单独合成、然后连接(例如,通过酶促连接方法或化学连接方法或聚合酶介导的方法)以形成任何期望的连续序列。例如,本公开内容的多核苷酸和寡核苷酸可以通过化学合成来制备(例如,使用由Beaucage等人,Tet.Lett.,22:1859-69[1981]描述的经典亚磷酰胺方法,或由Matthes等人,EMBO J.,3:801-05[1984]描述的方法,如它在自动化合成方法中通常实践的)。根据亚磷酰胺方法,寡核苷酸被合成(例如,在自动DNA合成仪中)、纯化、退火、连接并克隆入适当的载体。此外,基本上任何核酸可以从多种商业来源中的任一种获得(例如,The MidlandCertified Reagent Company,Midland,TX,The Great American Gene Company,Ramona,CA,ExpressGen Inc.Chicago,IL,Operon Technologies Inc.,Alameda,CA,以及许多其他商业来源)。
本公开内容还提供了包含编码如本文提供的至少一种变体转氨酶的序列的重组构建体。在一些实施方案中,本公开内容提供了一种表达载体,所述表达载体包含可操作地连接至异源启动子的变体转氨酶多核苷酸。在一些实施方案中,本公开内容的表达载体被用于转化适当的宿主细胞,以允许该宿主细胞表达变体转氨酶蛋白。用于在真菌和其他生物体中重组表达蛋白的方法是本领域熟知的,并且多种表达载体是可得的或可以使用常规方法构建。在一些实施方案中,本公开内容的核酸构建体包含本公开内容的核酸序列插入其中的载体,诸如质粒、黏粒、噬菌体、病毒、细菌人工染色体(BAC)、酵母人工染色体(YAC)等。在一些实施方案中,本公开内容的多核苷酸被整合到适用于表达变体转氨酶多肽的多种表达载体中的任一种中。合适的载体包括但不限于染色体、非染色体和合成的DNA序列(例如,SV40的衍生物),以及细菌质粒、噬菌体DNA、杆状病毒(baculovirus)、酵母质粒、源自质粒和噬菌体DNA的组合的载体、病毒DNA诸如牛痘、腺病毒、禽痘病毒、假狂犬病、腺病毒、腺相关病毒、反转录病毒以及许多其他载体。本公开内容可使用将遗传材料转导到细胞中的任何合适的载体,并且如果期望复制,该载体在相关宿主中是可复制并且可生存的。
在一些实施方案中,构建体还包含调控序列,包括但不限于可操作地连接至蛋白编码序列的启动子。大量合适的载体和启动子是本领域技术人员已知的。实际上,在一些实施方案中,为了在特定宿主中获得高表达水平,在异源启动子的控制下表达本公开内容的变体转氨酶经常是有用的。在一些实施方案中,使用本领域已知的任何合适的方法将启动子序列可操作地连接至变体转氨酶编码序列的5'区域。用于表达变体转氨酶的有用的启动子的实例包括但不限于来自真菌的启动子。在一些实施方案中,可使用驱动真菌菌株中除转氨酶基因以外的基因表达的启动子序列。作为非限制性实例,可以使用来自编码内切葡聚糖酶的基因的真菌启动子。在一些实施方案中,可使用在除转氨酶源自的真菌菌株以外的真菌菌株中驱动转氨酶基因表达的启动子序列。可用于指导本公开内容的核苷酸构建体在丝状真菌宿主细胞中的转录的其他合适的启动子的实例包括但不限于从以下的基因获得的启动子:米曲霉(Aspergillus oryzae)TAKA淀粉酶、米黑根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖孢镰孢菌(Fusarium oxysporum)胰蛋白酶样蛋白酶(参见例如,WO 96/00787,通过引用并入本文),以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶的基因的启动子的杂合体)、启动子诸如cbh1、cbh2、egl1、egl2、pepA、hfb1、hfb2、xyn1、amy和glaA(参见例如,Nunberg等人,Mol.Cell Biol.,4:2306-2315[1984];Boel等人,EMBO J.,3:1581-85[1984];和欧洲专利申请137280,这些全部通过引用并入本文),以及它们的突变的、截短的和杂合的启动子。
在酵母宿主细胞中,有用的启动子包括但不限于来自以下基因的那些:酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(eno-1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)和酿酒酵母(S.cerevisiae)3-磷酸甘油酸激酶。可用于酵母宿主细胞的另外的有用的启动子是本领域已知的(参见例如,Romanos等人,Yeast 8:423-488[1992],通过引用并入本文)。另外,与真菌中壳多糖酶产生相关的启动子可用于本公开内容(参见例如,Blaiseau和Lafay,Gene 120243-248[1992];和Limon等人,Curr.Genet.28:478-83[1995],这两者均通过引用并入本文)。
对于细菌宿主细胞,用于指导本公开内容的核酸构建体的转录的合适的启动子包括但不限于从以下获得的启动子:大肠杆菌(E.coli)lac操纵子、大肠杆菌trp操纵子、噬菌体λ、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、和原核生物β-内酰胺酶基因(参见例如,Villa-Kamaroff等人,Proc.Natl.Acad.Sci.USA 75:3727-3731[1978]),以及tac启动子(参见例如DeBoer等人,Proc.Natl.Acad.Sci.USA 80:21-25[1983])。
在一些实施方案中,本公开内容的克隆的变体转氨酶还具有合适的转录终止子序列,转录终止子序列是由宿主细胞识别以终止转录的序列。终止子序列被可操作地连接至编码多肽的核酸序列的3'末端。在所选择的宿主细胞中有功能的任何终止子可用于本公开内容中。用于丝状真菌宿主细胞的示例性转录终止子包括但不限于从以下的基因获得的那些:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡萄糖苷酶和尖孢镰刀菌胰蛋白酶样蛋白酶(参见例如,美国专利第7,399,627号,通过引用并入本文)。在一些实施方案中,用于酵母宿主细胞的示例性终止子包括从以下的基因获得的那些:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子是本领域技术人员熟知的(参见例如,Romanos等人,Yeast 8:423-88[1992])。
在一些实施方案中,合适的前导序列是克隆的变体转氨酶序列的一部分,前导序列是mRNA的对被宿主细胞翻译重要的非翻译区。前导序列被可操作地连接至编码多肽的核酸序列的5'末端。在所选择的宿主细胞中有功能的任何前导序列可用于本公开内容中。用于丝状真菌宿主细胞的示例性前导序列包括但不限于从以下的基因获得的那些:米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶。用于酵母宿主细胞的合适的前导序列包括但不限于从以下的基因获得的那些:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
在一些实施方案中,本公开内容的序列还包括多腺苷酸化序列,它是可操作地连接至核酸序列的3'末端的序列,并且它在转录时被宿主细胞识别为向转录的mRNA添加多腺苷酸残基的信号。在所选择的宿主细胞中有功能的任何多腺苷酸化序列可用于本公开内容中。用于丝状真菌宿主细胞的示例性多腺苷酸化序列包括但不限于从以下的基因获得的那些:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰刀菌胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。用于酵母宿主细胞的有用的多腺苷酸化序列是本领域已知的(参见例如,Guo和Sherman,Mol.Cell.Biol.,l5:5983-5990[1995])。
在一些实施方案中,控制序列包括编码连接至多肽的氨基末端的氨基酸序列的信号肽编码区,并指导编码的多肽进入细胞的分泌途径中。核酸序列的编码序列的5'末端可以固有地包含信号肽编码区,所述信号肽编码区符合翻译阅读框地(in translationreading frame)与编码分泌多肽的编码区的区段天然地连接。可选择地,编码序列的5'末端可以包含对编码序列是外源的信号肽编码区。当编码序列不天然包含信号肽编码区时可能需要外源信号肽编码区。
可选择地,外源信号肽编码区可以简单替换天然信号肽编码区以增加多肽的分泌。然而,指导所表达的多肽进入所选择的宿主细胞的分泌途径的任何信号肽编码区都可以在本公开内容中使用。
在一些实施方案中,信号肽是内源性河流弧菌转氨酶信号肽。在一些另外的实施方案中,使用来自其他河流弧菌分泌蛋白的信号肽。在一些实施方案中,根据宿主细胞和其他因素可使用其他信号肽。
用于细菌宿主细胞的有效信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:芽孢杆菌NClB 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽是本领域已知的(参见例如,Simonen和Palva,Microbiol.Rev.,57:109-137[1993])。
用于丝状真菌宿主细胞的有效的信号肽编码区包括但不限于从以下的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉(Humicola insolens)纤维素酶和绵毛状腐质霉(Humicolalanuginosa)脂肪酶。
用于酵母宿主细胞的有用的信号肽包括但不限于酿酒酵母α因子和酿酒酵母转化酶的基因。其他有用的信号肽编码区是本领域已知的(参见例如,Romanos等人,[1992],同上)。
在一些实施方案中,控制序列包含前肽编码区,该前肽编码区编码位于多肽的氨基末端的氨基酸序列。所得多肽被称为酶原(proenzyme)或多肽原(或在某些情况下为酶原(zymogen))。多肽原通常是无活性的并且可以通过前肽从多肽原的催化裂解或自动催化裂解转化为成熟的有活性的转氨酶多肽。前肽编码区可以从以下的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶和嗜热毁丝霉(Myceliophthora thermophila)乳糖酶(参见例如,WO 95/33836)。
当信号肽区域和前肽区域两者存在于多肽的氨基末端时,前肽区域紧邻多肽的氨基末端定位,并且信号肽区域紧邻前肽区域的氨基末端定位。
在一些实施方案中,还使用调控序列以允许相对于宿主细胞的生长调控多肽的表达。调控系统的实例是引起基因表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的那些。在原核宿主细胞中,合适的调控序列包括但不限于lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调控系统包括例如ADH2系统或GAL1系统。在丝状真菌中,合适的调控序列包括TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。
调控序列的其他实例是允许基因扩增的那些。在真核系统中,这些包括在氨甲蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下,编码本公开内容的转氨酶多肽的核酸序列将与调控序列可操作地连接。
因此,在另外的实施方案中,本公开内容提供了包含编码工程化转氨酶多肽或其变体的多核苷酸,以及根据它们将被引入的宿主的类型,一个或更多个表达调控区诸如启动子和终止子、复制起点等的重组表达载体。在一些实施方案中,上文描述的各种核酸和控制序列被连接在一起以产生重组表达载体,所述重组表达载体可以包括一个或更多个方便的限制性位点以允许在这样的位点插入或取代编码多肽的核酸序列。可选择地,在一些实施方案中,核酸序列通过将该核酸序列或包含该序列的核酸构建体插入到用于表达的适当的载体中来表达。在产生表达载体时,编码序列位于载体中,使得编码序列与用于表达的适当的控制序列可操作地连接。
重组表达载体包括任何合适的载体(例如,质粒或病毒),其可以方便地经受重组DNA程序并且可以引起多核苷酸序列的表达。载体的选择通常取决于载体与待引入该载体的宿主细胞的相容性。在一些实施方案中,载体是线性质粒或闭合的环状质粒。
在一些实施方案中,表达载体是自主复制载体(即,作为染色体外实体存在的载体,其复制独立于染色体复制,诸如质粒、染色体外元件、微型染色体或人工染色体)。在一些实施方案中,载体包含用于确保自我复制的任何工具(means)。可选择地,在一些其他实施方案中,当被引入到宿主细胞后,载体被整合到基因组中并与其被整合入的染色体一起复制。此外,在另外的实施方案中,可使用单个载体或质粒,或共同包含待引入到宿主细胞的基因组的总DNA的两个或更多个载体或质粒。
在一些实施方案中,本公开内容的表达载体包含一个或更多个选择标志物,其允许容易地选择转化的细胞。“选择标志物”是其产物提供杀生物剂或病毒耐受性、对抗微生物剂或重金属的耐受性、对营养缺陷型的原养型等的基因。本公开内容中可使用用于在丝状真菌宿主细胞中使用的任何合适的选择标志物,包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶(sulfateadenyltransferase))和trpC(邻氨基苯甲酸合酶)以及其等同物。在宿主细胞诸如曲霉属(Aspergillus)中可用的另外的标志物包括但不限于构巢曲霉或米曲霉的amdS和pyrG基因,以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。用于酵母宿主细胞的合适的标志物包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。细菌的选择标志物的实例包括但不限于来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素耐受性诸如氨苄青霉素、卡那霉素、氯霉素和/或四环素耐受性的标志物。
在一些实施方案中,本公开内容的表达载体包含允许载体整合到宿主细胞的基因组中或允许载体在细胞中独立于基因组自主复制的元件。在一些涉及整合到宿主细胞基因组中的实施方案中,载体依赖于编码多肽的核酸序列或用于通过同源或非同源重组将载体整合到基因组的载体的任何其他元件。
在一些可选择的实施方案中,表达载体包含用于指导通过同源重组整合到宿主细胞的基因组中的另外的核酸序列。另外的核酸序列能够使载体在染色体的准确位置整合到宿主细胞基因组中。为了增加在准确位置整合的可能性,整合元件优选地含有足够数目的核苷酸,诸如100至10,000个碱基对,优选地400至10,000个碱基对,并且最优选地800至10,000个碱基对,所述足够数目的核苷酸与对应的靶序列高度同源以增加同源重组的可能性。整合元件可以是与宿主细胞的基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码的或编码的核酸序列。在另一方面,载体可以通过非同源重组整合到宿主细胞的基因组中。
对于自主复制,载体还可以包含能够使载体在所讨论的宿主细胞中自主复制的复制起点。细菌复制起点的实例是允许在大肠杆菌中复制的P15A ori或质粒pBR322、pUC19、pACYCl77(该质粒具有P15A ori)、或pACYC184的复制起点,和允许在芽孢杆菌中复制的pUB110、pE194、pTA1060或pAMβ1的复制起点。用于在酵母宿主细胞中使用的复制起点的实例是2微米(2micron)复制起点、ARS1、ARS4、ARS1和CEN3的组合、以及ARS4和CEN6的组合。复制起点可以是具有使其在宿主细胞中的功能对温度敏感的突变的复制起点(参见例如,Ehrlich,Proc.Natl.Acad.Sci.USA 75:1433[1978])。
在一些实施方案中,多于一个拷贝的本公开内容的核酸序列被插入到宿主细胞中以增加基因产物的产生。核酸序列的拷贝数的增加可以通过将至少一个另外拷贝的序列整合到宿主细胞基因组中,或通过随所述核酸序列包括可扩增的选择标志物基因来获得,其中包含选择标志物基因的扩增拷贝并从而包含核酸序列的另外拷贝的细胞可以通过在适当的选择剂的存在下培养细胞来选择。
用于在本公开内容中使用的许多表达载体是商业上可得的。合适的商业表达载体包括但不限于p3xFLAGTMTM表达载体(Sigma-Aldrich Chemicals),其包括CMV启动子和用于在哺乳动物宿主细胞中表达的hGH多腺苷酸化位点以及用于在大肠杆菌中扩增的pBR322复制起点和氨苄青霉素耐受性标志物。其他合适的表达载体包括但不限于pBluescriptII SK(-)和pBK-CMV(Stratagene),以及源自pBR322(Gibco BRL)、pUC(Gibco BRL)、pREP4、pCEP4(Invitrogen)或pPoly的质粒(参见例如,Lathe等人,Gene 57:193-201[1987])。
因此,在一些实施方案中,包含编码至少一种变体转氨酶的序列的载体被转化到宿主细胞中以允许载体繁殖和表达变体转氨酶。在一些实施方案中,变体转氨酶被翻译后修饰以去除信号肽,并且在一些情况下可以在分泌后被裂解。在一些实施方案中,上文描述的转化的宿主细胞在允许表达变体转氨酶的条件下在合适的营养培养基中培养。可用于培养宿主细胞的任何合适的培养基可用于本公开内容中,包括但不限于基本培养基或包含适当补充剂的复合培养基。在一些实施方案中,宿主细胞在HTP培养基中生长。合适的培养基从各种商业供应商可获得,或者可以根据公开的配方(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中)制备。
在另一方面中,本公开内容提供了包含编码本文提供的改进的转氨酶多肽的多核苷酸的宿主细胞,该多核苷酸被可操作地连接至用于在宿主细胞中表达转氨酶的一个或更多个控制序列。用于在表达由本公开内容的表达载体编码的转氨酶多肽中使用的宿主细胞是本领域熟知的,并且包括但不限于细菌细胞诸如大肠杆菌、巨大芽孢杆菌(Bacillusmegaterium)、开菲尔乳杆菌(Lactobacillus kefir)、链霉菌属(Streptomyces)和鼠伤寒沙门氏菌(Salmonella typhimurium)细胞;真菌细胞,诸如酵母细胞(例如,酿酒酵母或巴斯德毕赤酵母(Pichia pastoris)(ATCC登录号201178));昆虫细胞诸如果蝇属(Drosophila)S2和夜蛾属(Spodoptera)Sf9细胞;动物细胞诸如CHO、COS、BHK、293和Bowes黑素瘤细胞;以及植物细胞。用于上文描述的宿主细胞的适当的培养基和生长条件是本领域熟知的。
用于表达转氨酶的多核苷酸可以通过本领域已知的各种方法引入到细胞中。技术包括电穿孔、生物弹射微粒轰击、脂质体介导的转染、氯化钙转染和原生质体融合,以及其他。用于将多核苷酸引入到细胞中的各种方法是本领域技术人员已知的。
在一些实施方案中,宿主细胞是真核细胞。合适的真核宿主细胞包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。合适的真菌宿主细胞包括但不限于子囊菌亚门(Ascomycota)、担子菌亚门(Basidiomycota)、半知菌亚门(Deuteromycota)、接合菌亚门(Zygomycota)、半知菌(Fungiimperfecti)。在一些实施方案中,真菌宿主细胞是酵母细胞和丝状真菌细胞。本公开内容的丝状真菌宿主细胞包括亚门真菌亚门(Eumycotina)和卵菌亚门(Oomycota)的所有丝状形式。丝状真菌的特征在于具有包含壳多糖、纤维素和其他复杂多糖的细胞壁的营养菌丝体。本公开内容的丝状真菌宿主细胞在形态学上与酵母不同。
在本公开内容的一些实施方案中,丝状真菌宿主细胞是任何合适的属和种的,包括但不限于绵霉属(Achlya)、枝顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管菌属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、头孢霉属(Cephalosporium)、金孢子菌属(Chrysosporium)、旋孢腔菌属(Cochliobolus)、棒囊壳属(Corynascus)、丛赤壳属(Cryphonectria)、隐球菌属(Cryptococcus)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、色二孢属(Diplodia)、内座壳属(Endothia)、镰孢属(Fusarium)、赤霉菌属(Gibberella)、胶枝霉属(Gliocladium)、腐质霉属(Humicola)、肉座菌属(Hypocrea)、毁丝霉属(Myceliophthora)、毛霉属(Mucor)、脉孢菌属(Neurospora)、青霉菌属(Penicillium)、柄孢壳菌属(Podospora)、白腐菌属(Phlebia)、瘤胃壶菌属(Piromyces)、梨形孢属(Pyricularia)、根毛霉属(Rhizomucor)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、柱顶孢霉属(Scytalidium)、孢子丝菌属(Sporotrichum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、栓菌属(Trametes)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、轮枝孢属(Verticillium)和/或小包脚菇属(Volvariella)、和/或它们的有性型或无性型、及同义型、基原异名或分类学等同物。
在本公开内容的一些实施方案中,宿主细胞是酵母细胞,包括但不限于假丝酵母属(Candida)、汉逊酵母属(Hansenula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)或耶氏酵母属(Yarrowia)的种的细胞。在本公开内容的一些实施方案中,酵母细胞是多形汉逊酵母(Hansenula polymorpha)、酿酒酵母、卡氏酵母(Saccharomyces carlsbergensis)、糖化酵母(Saccharomyces diastaticus)、诺地酵母(Saccharomyces norbensis)、克氏酵母(Saccharomyces kluyveri)、粟酒裂殖酵母(Schizosaccharomyces pombe)、巴斯德毕赤酵母(Pichia pastoris)、芬兰毕赤酵母(Pichia finlandica)、Pichia trehalophila、Pichia kodamae、膜醭毕赤酵母(Pichia membranaefaciens)、Pichia opuntiae、Pichiathermotolerans、Pichia salictaria、Pichia quercuum、Pichia pijperi、树干毕赤酵母(Pichia stipitis)、甲醇毕赤酵母(Pichia methanolica)、安格斯毕赤酵母(Pichiaangusta)、乳酸克鲁维酵母(Kluyveromyces lactis)、白假丝酵母(Candida albicans)或解脂耶氏酵母(Yarrowia lipolytica)。
在本公开内容的一些实施方案中,宿主细胞是藻类细胞,诸如衣藻属(Chlamydomonas)(例如,莱茵衣藻(C.reinhardtii))和席藻属(Phormidium)(例如,席藻属种(Phormidium sp.)ATCC29409)。
在一些其他实施方案中,宿主细胞是原核细胞。合适的原核细胞包括但不限于革兰氏阳性、革兰氏阴性和革兰氏不定(Gram-variable)的细菌细胞。在本公开内容中可使用任何合适的细菌生物体,包括但不限于土壤杆菌属(Agrobacterium)、脂环酸芽孢杆菌属(Alicyclobacillus)、鱼腥藻属(Anabaena)、倒囊藻属(Anacystis)、不动杆菌属(Acinetobacter)、嗜酸菌属(Acidothermus)、节杆菌属(Arthrobacter)、固氮菌属(Azobacter)、芽孢杆菌属(Bacillus)、双歧杆菌属(Bifidobacterium)、短杆菌属(Brevibacterium)、丁酸弧菌属(Butyrivibrio)、布赫纳氏菌属(Buchnera)、Campestris、弯曲杆菌属(Campylobacter)、梭菌属(Clostridium)、棒杆菌属(Corynebacterium)、着色菌属(Chromatium)、粪球菌属(Coprococcus)、埃希氏菌属(Escherichia)、肠球菌属(Enterococcus)、肠杆菌属(Enterobacter)、欧文氏菌属(Erwinia)、梭杆菌属(Fusobacterium)、粪杆菌属(Faecalibacterium)、弗朗西斯菌属(Francisella)、黄杆菌属(Flavobacterium)、地芽孢杆菌属(Geobacillus)、嗜血杆菌属(Haemophilus)、螺杆菌属(Helicobacter)、克雷伯菌属(Klebsiella)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、泥杆菌属(Ilyobacter)、微球菌属(Micrococcus)、细杆菌属(Microbacterium)、生根瘤菌属(Mesorhizobium)、甲基杆菌属(Methylobacterium)、甲基杆菌属(Methylobacterium)、分枝杆菌属(Mycobacterium)、奈瑟菌属(Neisseria)、泛菌属(Pantoea)、假单胞菌属(Pseudomonas)、原绿球藻属(Prochlorococcus)、红细菌属(Rhodobacter)、红假单胞菌属(Rhodopseudomonas)、红假单胞菌属(Rhodopseudomonas)、罗氏菌属(Roseburia)、红螺菌属(Rhodospirillum)、红球菌属(Rhodococcus)、栅藻属(Scenedesmus)、链霉菌属(Streptomyces)、链球菌属(Streptococcus)、Synecoccus、糖单孢菌属(Saccharomonospora)、葡萄球菌属(Staphylococcus)、沙雷氏菌属(Serratia)、沙门氏菌属(Salmonella)、志贺氏菌属(Shigella)、嗜热厌氧杆菌属(Thermoanaerobacterium)、Tropheryma、Tularensis、Temecula、热聚球藻属(Thermosynechococcus)、高温球菌属(Thermococcus)、脲原体属(Ureaplasma)、黄单胞菌属(Xanthomonas)、木杆菌属(Xylella)、耶尔森氏菌属(Yersinia)和发酵单胞菌属(Zymomonas)。在一些实施方案中,宿主细胞是以下中的物种:土壤杆菌属、不动杆菌属、固氮菌属、芽孢杆菌属、双歧杆菌属、布赫纳氏菌属、地芽孢杆菌属、弯曲杆菌属、梭菌属、棒杆菌属、埃希氏菌属、肠球菌属、欧文氏菌属、黄杆菌属、乳杆菌属、乳球菌属、泛菌属、假单胞菌属、葡萄球菌属、沙门氏菌属、链球菌属、链霉菌属或发酵单胞菌属。在一些实施方案中,细菌宿主菌株是对人类非致病性的。在一些实施方案中,细菌宿主菌株是工业菌株。许多细菌工业菌株是已知的,并且在本公开内容中是合适的。在本公开内容的一些实施方案中,细菌宿主细胞是土壤杆菌属种(例如,放射型土壤杆菌(A.radiobacter)、发根土壤杆菌(A.rhizogenes)和悬钩土壤杆菌(A.rubi))。在本公开内容的一些实施方案中,细菌宿主细胞是节杆菌属种(例如,金黄节杆菌(A.aurescens)、柠檬色节杆菌(A.citreus)、球形节杆菌(A.globiformis)、裂烃谷氨酸节杆菌(A.hydrocarboglutamicus)、迈索尔节杆菌(A.mysorens)、烟草节杆菌(A.nicotianae)、石蜡节杆菌(A.paraffineus)、原玻璃蝇节杆菌(A.protophormiae)、A.roseoparqffinus、硫磺节杆菌(A.sulfureus)和产脲节杆菌(A.ureafaciens))。在本公开内容的一些实施方案中,细菌宿主细胞是芽孢杆菌属种(例如,苏云金芽孢杆菌(B.thuringensis)、炭疽芽孢杆菌(B.anthracis)、巨大芽孢杆菌(B.megaterium)、枯草芽孢杆菌(B.subtilis)、迟缓芽孢杆菌(B.lentus)、环状芽孢杆菌(B.circulans)、短小芽孢杆菌(B.pumilus)、灿烂芽孢杆菌(B.lautus)、凝结芽孢杆菌(B.coagulans)、短芽孢杆菌(B.brevis)、坚强芽孢杆菌(B.firmus)、嗜碱芽孢杆菌(B.alcalophius)、地衣芽孢杆菌(B.licheniformis)、克劳氏芽孢杆菌(B.clausii)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、耐盐芽孢杆菌(B.halodurans)和解淀粉芽孢杆菌(B.amyloliquefaciens))。在一些实施方案中,宿主细胞是工业芽孢杆菌菌株,包括但不限于枯草芽孢杆菌、短小芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、克劳氏芽孢杆菌、嗜热脂肪芽杆菌或解淀粉芽孢杆菌。在一些实施方案中,芽孢杆菌宿主细胞是枯草芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌和/或解淀粉芽孢杆菌。在一些实施方案中,细菌宿主细胞是梭菌属种(例如,丙酮丁醇梭菌(C.acetobutylicum)、破伤风梭菌(C.tetani)E88、C.lituseburense、糖丁酸梭菌(C.saccharobutyricum)、产气荚膜梭菌(C.perfringens)和C.beijerinckii)。在一些实施方案中,细菌宿主细胞是棒杆菌属种(例如,谷氨酸棒杆菌(C.glutamicum)和嗜乙酸棒杆菌(C.acetoacidophilum))。在一些实施方案中,细菌宿主细胞是埃希氏菌属种(例如,大肠杆菌)。在一些实施方案中,宿主细胞是大肠杆菌W3110。在一些实施方案中,细菌宿主细胞是欧文氏菌属种(例如,噬夏孢欧文氏菌(E.uredovora)、胡萝卜欧文氏菌(E.carotovora)、菠萝欧文氏菌(E.ananas)、草生欧文氏菌(E.herbicola)、斑点欧文氏菌(E.punctata)和土欧文氏菌(E.terreus))。在一些实施方案中,细菌宿主细胞是泛菌属种(例如,柠檬泛菌(P.citrea)和成团泛菌(P.agglomerans))。在一些实施方案中,细菌宿主细胞是假单胞菌属种(例如,恶臭假单胞菌(P.putida)、铜绿假单胞菌(P.aeruginosa)、P.mevalonii和假单胞菌属种(P.sp)D-0110)。在一些实施方案中,细菌宿主细胞是链球菌属种(例如,似马链球菌(S.equisimilis)、酿脓链球菌(S.pyogenes)和乳房链球菌(S.uberis))。在一些实施方案中,细菌宿主细胞是链霉菌属种(例如,生二素链霉菌(S.ambofaciens)、不发色链霉菌(S.achromogenes)、阿维链霉菌(S.avermitilis)、天蓝色链霉菌、金黄色链霉菌(S.aureofaciens)、金色链霉菌(S.aureus)、杀真菌素链霉菌(S.fungicidicus)、灰色链霉菌(S.griseus)和变铅青链霉菌(S.lividans))。在一些实施方案中,细菌宿主细胞是发酵单胞菌属种(例如,运动发酵单胞菌(Z.mobilis)和Z.lipolytica)。
在本公开内容中可用的许多原核和真核菌株是公众从多个培养物保藏中心可容易地获得的,诸如美国典型培养物保藏中心(ATCC)、德国微生物保藏中心(DeutscheSammlung von Mikroorganismen und Zellkulturen GmbH,DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures,CBS)和农业研究机构专利培养物保藏中心,北方区域研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center(NRRL))。
在一些实施方案中,宿主细胞被遗传修饰为具有改进蛋白分泌、蛋白稳定性的特征和/或蛋白表达和/或分泌期望的其他特性。遗传修饰可以通过遗传工程技术和/或经典微生物技术(例如,化学或UV诱变和随后的选择)来实现。实际上,在一些实施方案中,重组修饰和经典选择技术的组合被用于产生宿主细胞。使用重组技术,可以以在宿主细胞中和/或在培养基中导致转氨酶变体的收率增加的方式引入、缺失、抑制或修饰核酸分子。例如,敲除Alp1功能导致蛋白酶缺陷型细胞,而敲除pyr5功能导致具有嘧啶缺陷表型的细胞。在一种遗传工程方法中,同源重组被用于通过体内特异性靶向基因引起靶向基因修饰,以抑制编码的蛋白的表达。在可选择的方法中,siRNA、反义和/或核酶技术可用于抑制基因表达。本领域已知多种方法用于降低蛋白在细胞中的表达,包括但不限于缺失编码该蛋白的全部或部分基因和定点诱变(site-specific mutagenesis)以破坏基因产物的表达或活性。(参见例如,Chaveroche等人,Nucl.Acids Res.,28:22e97[2000];Cho等人,Mol.PlantMic.Interact.,19:7-15[2006];Maruyama和Kitamoto,Biotechnol Lett.,30:1811-1817[2008];Takahashi等人,Mol.Gen.Genom.,272:344-352[2004];和You等人,Arch.Micriobiol.,191:615-622[2009],这些全部通过引用并入本文)。也可使用随机诱变,随后筛选期望的突变(参见例如,Combier等人,FEMS Microbiol.Lett.,220:141-8[2003];和Firon等人,Eukary.Cell 2:247-55[2003],两者通过引用并入)。
将载体或DNA构建体引入宿主细胞可以使用本领域已知的任何合适的方法来实现,包括但不限于磷酸钙转染、DEAE-右旋糖酐介导的转染、PEG介导的转化、电穿孔或本领域已知的其他常用技术。在一些实施方案中,可使用大肠杆菌表达载体pCK100900i(参见美国专利申请公布2006/0195947,其在此通过引用并入本文)。
在一些实施方案中,本公开内容的工程化宿主细胞(即“重组宿主细胞”)在常规营养培养基中培养,所述常规营养培养基经适当修饰用于活化启动子、选择转化体或扩增转氨酶多核苷酸。培养条件,诸如温度、pH等,是先前对所选择的用于表达的宿主细胞使用的那些,并且是本领域技术人员熟知的。如所提及的,对于许多细胞,包括细菌、植物、动物(特别是哺乳动物)和古细菌来源的细胞的培养和产生,许多标准参考文献和教科书是可用的。
在一些实施方案中,表达本公开内容的变体转氨酶多肽的细胞在分批或连续发酵条件下生长。经典的“分批发酵”是封闭的系统,其中培养基的组成在发酵开始时设置并且在发酵期间不进行人工调整。分批系统的变化形式是也可在本公开内容中使用的“补料-分批发酵”。在此变化形式中,随发酵进展增量地添加底物。当分解代谢物阻遏可能抑制细胞的新陈代谢时以及当期望在培养基中具有有限量的底物时,可使用补料-分批系统。分批发酵和补料-分批发酵在本领域中是常见的和熟知的。“连续发酵”是一种开放系统,其中向生物反应器连续添加指定的发酵培养基,并且同时取出等量的条件培养基用于加工。连续发酵通常使培养物维持在恒定的高密度,其中细胞主要处于对数期生长。连续发酵系统力求维持稳定状态的生长条件。用于调节用于连续发酵过程的营养物和生长因子的方法以及用于使产物形成的速率最大化的技术是工业微生物学领域熟知的。
在本公开内容的一些实施方案中,可使用无细胞转录/翻译系统产生变体转氨酶。若干系统是商业上可得的并且方法是本领域技术人员熟知的。
本公开内容提供了制备变体转氨酶多肽或其生物活性片段的方法。在一些实施方案中,该方法包括:提供用以下多核苷酸转化的宿主细胞,所述多核苷酸编码包含与SEQ IDNO:2、4、8、366和/或650具有至少约70%(或至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%)序列同一性的氨基酸序列并包含如本文提供的至少一种突变;在宿主细胞表达编码的变体转氨酶多肽的条件下在培养基中培养转化的宿主细胞;以及任选地回收或分离所表达的变体转氨酶多肽,和/或回收或分离包含所表达的变体转氨酶多肽的培养基。在一些实施方案中,所述方法还提供了任选地在表达编码的转氨酶多肽后裂解转化的宿主细胞,以及任选地从细胞裂解物回收和/或分离所表达的变体转氨酶多肽。本公开内容还提供了制备变体转氨酶多肽的方法,所述方法包括在适合于产生变体转氨酶多肽的条件下培养用变体转氨酶多肽转化的宿主细胞,以及回收变体转氨酶多肽。通常,使用本领域熟知的蛋白回收技术,包括本文描述的那些,从宿主细胞培养基、宿主细胞或两者回收或分离转氨酶多肽。在一些实施方案中,将宿主细胞通过离心收获,通过物理或化学手段破碎,并将所得粗提取物保留用于进一步纯化。在蛋白的表达中使用的微生物细胞可以通过任何常规方法破碎,包括但不限于冻融循环、超声、机械破碎和/或使用细胞裂解剂,以及本领域技术人员熟知的许多其他合适的方法。
由宿主细胞产生的工程化转氨酶可以从细胞和/或培养基回收,使用蛋白纯化领域中的已知技术中的任一种或更多种,包括溶菌酶处理、超声、过滤、盐析、超速离心和层析、以及其他。用于裂解和从细菌诸如大肠杆菌高效提取蛋白的合适的溶液是以商标名CelLytic BTM(Sigma-Aldrich)商业上可得的。因此,在一些实施方案中,所得多肽被回收/分离,并任选地通过本领域已知的多种方法中的任一种来纯化。例如,在一些实施方案中,多肽通过常规程序从营养培养基分离,包括但不限于离心、过滤、提取、喷雾干燥、蒸发、层析(例如,离子交换、亲和性、疏水相互作用、聚焦层析和尺寸排阻)或沉淀。在一些实施方案中,按需要使用蛋白重折叠步骤完成成熟蛋白的构型。此外,在一些实施方案中,在最后纯化步骤中使用高效液相层析(HPLC)。例如,在一些实施方案中,本公开内容可使用本领域已知的方法(参见例如,Parry等人,Biochem.J.,353:117[2001];和Hong等人,Appl.Microbiol.Biotechnol.,73:1331[2007],这两者均通过引用并入本文)。实际上,本领域已知的任何合适的纯化方法均可用于本公开内容。
用于分离转氨酶多肽的层析技术包括但不限于反相层析、高效液相层析、离子交换层析、凝胶电泳和亲和层析。用于纯化特定酶的条件将部分地取决于诸如净电荷、疏水性、亲水性、分子量、分子形状等因素,这些因素是本领域技术人员已知的。
在一些实施方案中,亲和技术可用于分离改进的转氨酶。对于亲和层析纯化,可以使用特异性结合转氨酶多肽的任何抗体。为了产生抗体,可以通过注射转氨酶来免疫各种宿主动物,包括但不限于兔、小鼠、大鼠等。转氨酶多肽可以通过侧链官能团或附接至侧链官能团的接头的方式被附接至合适的载体,诸如BSA。取决于宿主物种,多种佐剂可以被用来增加免疫应答,包括但不限于弗氏佐剂(完全和不完全)、矿物凝胶诸如氢氧化铝、表面活性物质诸如溶血卵磷脂、普朗尼克多元醇、聚阴离子、肽、油乳剂、钥孔虫戚血兰素、二硝基酚和可能有用的人类佐剂诸如BCG(卡介苗)和短棒杆菌(Corynebacterium parvum)。
在一些实施方案中,转氨酶变体以表达酶的细胞的形式、作为粗提取物、或作为分离的或纯化的制品来制备和使用。在一些实施方案中,转氨酶变体被制备为呈粉末形式(例如,丙酮粉末)的冻干物或被制备为酶溶液。在一些实施方案中,转氨酶变体呈基本上纯的制品的形式。
在一些实施方案中,转氨酶多肽被附接至任何合适的固体基底。固体基底包括但不限于固相、表面和/或膜。固体支持物包括但不限于有机聚合物诸如聚苯乙烯、聚乙烯、聚丙烯、聚氟乙烯、聚氧乙烯(polyethyleneoxy)和聚丙烯酰胺以及它们的共聚物和接枝物。固体支持物还可以是无机的,诸如玻璃、二氧化硅、可控孔隙玻璃(CPG)、反相二氧化硅或金属诸如金或铂。基底的构型可以呈珠、球、微粒、颗粒、凝胶、膜或表面的形式。表面可以是平坦的、基本上平面的或非平面的。固体支持物可以是多孔的或无孔的,并且可以具有溶胀或非溶胀特征。固体支持物可以被配置为孔、凹陷或其他容器、器皿、特征或位置的形式。多于一种支持物可以被配置在阵列的多个位置上,所述多个位置对于试剂的自动递送或通过检测方法和/或仪器是可寻址的。
在一些实施方案中,使用免疫学方法来纯化转氨酶变体。在一种方法中,将使用常规方法针对变体转氨酶多肽(例如,针对包含本文提供的工程化转氨酶变体的多肽和/或其免疫原性片段,所述工程化转氨酶变体包括但不限于SEQ ID NO:2、4、8、366和/或650)产生的抗体固定在珠上,使抗体与细胞培养基在其中变体转氨酶被结合并沉淀的条件下混合。在相关方法中,可使用免疫层析。
在一些实施方案中,变体转氨酶被表达为包括非酶部分的融合蛋白。在一些实施方案中,变体转氨酶序列被融合至纯化辅助结构域。如本文使用的,术语“纯化辅助结构域”是指介导与其融合的多肽的纯化的结构域。合适的纯化结构域包括但不限于金属螯合肽、允许在固定化金属上纯化的组氨酸-色氨酸模块、结合谷胱甘肽的序列(例如,GST)、血球凝集素(HA)标签(对应于源自流感血球凝集素蛋白的表位;参见例如,Wilson等人,Cell 37:767[1984])、麦芽糖结合蛋白序列、在FLAGS延伸/亲和纯化系统(例如,从Immunex Corp可获得的系统)中使用的FLAG表位等。设想用于在本文描述的组合物和方法中使用的一种表达载体提供包含本公开内容的多肽的融合蛋白的表达,本公开内容的多肽被融合至多组氨酸区,由肠激酶裂解位点隔开。组氨酸残基有助于在IMIAC(固定化金属离子亲和层析;参见例如,Porath等人,Prot.Exp.Purif.,3:263-281[1992])上的纯化,同时肠激酶裂解位点提供用于从融合蛋白分离变体转氨酶多肽的手段。pGEX载体(Promega)还可以被用于以与谷胱甘肽S-转移酶(GST)融合的融合蛋白表达外源多肽。一般而言,这样的融合蛋白是可溶的,并且可以被容易地通过吸附至配体-琼脂糖珠(例如,在GST-融合的情况下是谷胱甘肽-琼脂糖)从裂解的细胞纯化,随后在游离配体的存在下洗脱。
使用工程化转氨酶的方法
在另一方面中,本文公开的工程化转氨酶多肽可以用于将底物化合物(1)或其结构类似物转化为产物化合物(2)或对应结构类似物的方法。
如本文描述并在实施例中示出的,本公开内容设想了可以在本文的方法中使用的合适的反应条件的范围,包括但不限于pH、温度、缓冲剂、溶剂系统、底物载量、底物化合物对映异构体的混合物、多肽载量、辅因子载量、压力和反应时间的范围。用于进行使用本文描述的工程化转氨酶多肽将底物化合物生物催化转化为产物化合物的方法的另外的合适的反应条件可容易地通过常规实验优化,所述常规实验包括但不限于在浓度、pH、温度、溶剂条件的实验反应条件下使工程化转氨酶多肽与底物化合物接触,并检测产物化合物,例如,使用本文提供的实施例中描述的方法。
如上文描述的,用于本公开内容的方法的具有转氨酶活性的工程化多肽通常包含与选自SEQ ID NO:6-936中的偶数编号序列中的任一种的参考氨基酸序列具有至少80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同一性的氨基酸序列,以及包含与参考序列(例如,SEQ ID NO:2、4、8、366和/或650)相比具有一个或更多个氨基酸残基差异的氨基酸序列的工程化转氨酶多肽。在一些实施方案中,能够在高度严格性条件下杂交的多核苷酸编码以下转氨酶多肽,所述转氨酶多肽具有上文描述的同一性百分比以及与参考序列(例如,SEQ ID NO:2、4、8、366和/或650)相比的一个或更多个残基差异。
考虑到例如期望的产物化合物的量、底物浓度对酶活性的影响、酶在反应条件下的稳定性、以及底物向产物的转化百分比,反应混合物中的底物化合物可以变化。在该方法的一些实施方案中,合适的反应条件包括至少约0.5g/L至约200g/L、1g/L至约200g/L、5g/L至约150g/L、约10g/L至约100g/L、或约50g/L至约100g/L的底物化合物载量。在一些实施方案中,合适的反应条件包括至少约0.5g/L、至少约1g/L、至少约5g/L、至少约10g/L、至少约15g/L、至少约20g/L、至少约30g/L、至少约50g/L、至少约75g/L、至少约100g/L、至少约150g/L或至少约200g/L、或甚至更大的底物化合物载量。本文提供的底物载量的值是基于化合物(1)的分子量,然而还设想,也可以在方法中使用相等的摩尔量的化合物(1)的多种水合物和盐。
在本文描述的方法中,工程化转氨酶多肽使用氨基供体以形成产物化合物。在一些实施方案中,反应条件中的氨基供体包括选自异丙胺(本文中也被称为“IPM”)的化合物或用于感兴趣的反应的任何其他合适的氨基供体。在一些实施方案中,氨基供体是IPM。在一些实施方案中,合适的反应条件包括以至少约0.1M至约3.0M、0.2M至约2.5M、约0.5M至约2M或约1M至约2M的浓度存在的氨基供体,特别是IPM。在一些实施方案中,氨基供体以约0.1M、0.2M、0.3M、0.4M、0.5M、0.6M、0.7M、0.8M、1M、1.5M、2M、2.5M或3M的浓度存在。
该方法的合适的反应条件通常还包括在反应混合物中存在辅因子。因为工程化转氨酶通常使用维生素B6家族的成员,所以反应条件可以包括选自以下的辅因子:吡哆醛-5'-磷酸(也被称为磷酸吡哆醛、PLP、P5P)、吡哆醇(PN)、吡哆醛(PL)、吡多胺(PM)、和它们的磷酸化对应物磷酸吡哆醇(PNP)、和磷酸吡多胺(PMP)。在一些实施方案中,合适的反应条件可以包括选自PLP、PN、PL、PM、PNP和PMP的辅因子以约0.1g/L至约10g/L、约0.2g/L至约5g/L、约0.5g/L至约2.5g/L的浓度存在。在一些实施方案中,辅因子是PLP。相应地,在一些实施方案中,合适的反应条件可以包括辅因子PLP以约0.1g/L至约10g/L、约0.2g/L至约5g/L、约0.5g/L至约2.5g/L的浓度存在。在一些实施方案中,反应条件包括约10g/L或更少、约5g/L或更少、约2.5g/L或更少、约1.0g/L或更少、约0.5g/L或更少、或约0.2g/L或更少的PLP浓度。
在该方法(例如,其中使用完整细胞或裂解物)的一些实施方案中,辅因子天然存在于细胞提取物中并且不需要补充。在该方法(例如,利用部分纯化的、或纯化的转氨酶)的一些实施方案中,所述方法还可以包括将辅因子添加至酶反应混合物的步骤。在一些实施方案中,在反应开始时添加辅因子和/或在反应期间添加另外的辅因子。
在转氨基反应的过程期间,反应混合物的pH可以改变。反应混合物的pH可以保持在期望的pH或在期望的pH范围内。这可通过在反应过程之前和/或期间通过添加酸或碱来完成。可选择地,pH可通过使用缓冲剂来控制。相应地,在一些实施方案中,反应条件包括缓冲剂。用于保持期望的pH范围的合适的缓冲剂是本领域熟知的,并且包括,例如但不限于硼酸盐、碳酸盐、磷酸盐、三乙醇胺(TEA)缓冲剂等。在一些实施方案中,缓冲剂是TEA。在该方法的一些实施方案中,合适的反应条件包括TEA的缓冲溶液,其中TEA浓度为从约0.01M至约0.4M、0.05M至约0.4M、0.1M至约0.3M或约0.1M至约0.2M。在一些实施方案中,反应条件包括约0.01M、0.02M、0.03M、0.04M、0.05M、0.07M、0.1M、0.12M、0.14M、0.16M、0.18M、0.2M、0.3M或0.4M的TEA浓度。在一些实施方案中,反应条件包括水作为合适的溶剂而无缓冲剂存在。
在该方法的一些实施方案中,反应条件可以包括合适的pH。如上文提及的,期望的pH或期望的pH范围可以通过使用酸或碱、适当的缓冲剂、或缓冲和酸或碱添加的组合来保持。反应混合物的pH可以在反应过程之前和/或期间控制。在一些实施方案中,合适的反应条件包括约8至约12.5的溶液pH、约8至约12的pH、约9.0至约11.5的pH、或约9.5至约11.0的pH。在一些实施方案中,反应条件包括约8、8.5、9、9.5、10、10.5、11、11.5、12或12.5的溶液pH。
在本文的方法的一些实施方案中,例如,考虑到在较高的温度反应速率的增加、对于足够的反应持续时间的酶的活性、以及如以下进一步描述的,合适的温度可以被用于反应条件。例如,本公开内容的工程化多肽相对于天然存在的转氨酶多肽具有增加的稳定性,这允许本公开内容的工程化多肽在较高的温度使用,以增加转化速率及改进反应的底物溶解性特征。相应地,在一些实施方案中,合适的反应条件包括约10℃至约70℃、约10℃至约65℃、约15℃至约60℃、约20℃至约60℃、约20℃至约55℃、约30℃至约55℃、或约40℃至约50℃的温度。在一些实施方案中,合适的反应条件包括约10℃、15℃、20℃、25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃或70℃的温度。在一些实施方案中,酶促反应期间的温度可以在整个反应过程中保持在一定的温度。在一些实施方案中,酶促反应期间的温度可以在反应过程期间在温度曲线上进行调整。
在该方法的一些实施方案中,合适的反应条件还可以包括还原型辅因子烟酰胺腺嘌呤二核苷酸(NADH)的存在,其可起作用以限制转氨酶的失活(参见例如,van Ophem等人,Biochem.,37(9):2879-88[1998])。在其中存在NADH的此类实施方案中,辅因子再生系统诸如葡萄糖脱氢酶(GDH)和葡萄糖或甲酸脱氢酶和甲酸可以被用来使反应介质中的NADH再生。
使用工程化转氨酶的方法通常在溶剂中进行。合适的溶剂包括水、水性缓冲溶液、有机溶剂和/或共溶剂系统,共溶剂系统通常包括水性溶剂和有机溶剂。水性溶剂(水或水性共溶剂系统)可以是pH-缓冲的或非缓冲的。在一些实施方案中,使用工程化转氨酶多肽的方法通常在包含以下的水性共溶剂系统中进行:有机溶剂(例如,乙醇、异丙醇(IPA)、二甲基亚砜(DMSO)、乙酸乙酯、乙酸丁酯、1-辛醇、庚烷、辛烷、甲基叔丁基醚(MTBE)、甲苯等)、离子液体(例如,四氟硼酸1-乙基-4-甲基咪唑鎓、四氟硼酸1-丁基-3-甲基咪唑鎓、六氟磷酸1-丁基-3-甲基咪唑鎓等)。水性共溶剂系统中的有机溶剂组分可以与水性组分混溶而提供单一液相,或可以与水性组分部分地混溶或不混溶而提供双液相。示例性的水性共溶剂系统包含水和一种或多种有机溶剂。通常,选择水性共溶剂系统的有机溶剂组分使得其不会使转氨酶完全失活。通过利用酶活性测定,诸如本文描述的那些,在候选溶剂系统中测量指定的工程化转氨酶对限定的感兴趣的底物的酶活性,可以容易地鉴定适当的共溶剂系统。在该方法的一些实施方案中,合适的反应条件包括包含约1%至约80%(v/v)、约1%至约70%(v/v)、约2%至约60%(v/v)、约5%至约40%(v/v)、10%至约40%(v/v)、10%至约30%(v/v)或约10%至约20%(v/v)的浓度的DMSO的水性共溶剂。在该方法的一些实施方案中,合适的反应条件包括包含至少约1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%或80%(v/v)的浓度的DMSO的水性共溶剂。
合适的反应条件可以包括提供将底物化合物生物催化转化为其对应产物化合物的反应参数的组合。例如,在一些实施方案中,可以在包括以下的合适的反应条件下进行化合物(2)的制备:(a)约10g/L至300g/L的底物化合物(例如,50g/L或200g/L的化合物(1))的底物载量;(b)约0.5g/L至60g/L的工程化多肽;(c)约0.5M至2M的IPM浓度;(d)约0.1g/L至1g/L的PLP辅因子浓度;(e)约0%(v/v)至约20%(v/v)的DMSO浓度;(f)约8.5至11.5的pH;和(g)约45℃至65℃的温度。
在一些实施方案中,合适的反应条件包括:(a)约100g/L的底物化合物(例如化合物(1));(b)约1g/L的工程化多肽;(c)约1M异丙胺(IPM);(d)约0.5g/L磷酸吡哆醛(PLP);(e)约pH 9;和(f)约50℃。
另外的示例性反应条件包括实施例中提供的测定条件。在进行本文描述的转氨基反应时,工程化转氨酶多肽可以以部分纯化或纯化的酶、用编码酶的基因转化的完整细胞、和/或这些细胞的细胞提取物和/或裂解物的形式添加至反应混合物中。用编码工程化转氨酶的基因转化的完整细胞,或其细胞提取物、裂解物和分离的酶可以以多种不同的形式使用,包括固体(例如,冻干的、喷雾干燥的等)或半固体(例如,粗糊状物)。细胞提取物或细胞裂解物可以通过沉淀(例如,硫酸铵、聚乙烯亚胺、热处理等)来部分纯化,随后在冻干前进行脱盐程序(例如,超滤、透析等)。任何酶制品可以通过使用已知的交联剂诸如,例如戊二醛交联或固定至固相材料(例如,树脂、珠诸如壳聚糖、EupergitC、SEPABEAD等)而被稳定化。
在本文描述的转氨基反应的一些实施方案中,反应在本文描述的合适的反应条件下进行,其中工程化转氨酶多肽被固定至固体支持物。可用于固定工程化转氨酶以进行转氨基反应的固体支持物包括但不限于包含具有环氧化物官能团的聚甲基丙烯酸酯、具有氨基环氧化物官能团的聚甲基丙烯酸酯、具有十八烷基官能团的苯乙烯/DVB共聚物或聚甲基丙烯酸酯的珠或树脂。示例性固体支持物包括但不限于壳聚糖珠、EupergitC和SEPABEAD(Mitsubishi),包括以下不同类型的SEPABEAD:EC-EP、EC-HFA/S、EXA252、EXE119和EXE120。
在一些实施方案中,其中工程化多肽可以以分泌多肽的形式被表达,含有该分泌多肽的培养基可以被用于本文的方法中。
在一些实施方案中,固体反应物(例如,酶、盐等)可以被以多种不同形式提供至反应,包括粉末(例如,冻干的、喷雾干燥的等)、溶液、乳液、悬浮液等。反应物可以使用为本领域普通技术人员已知的方法和仪器容易地冻干或喷雾干燥。例如,蛋白溶液可以在-80℃以小等分试样冷冻,然后添加至预冷的冻干室中,随后应用真空。
在一些实施方案中,添加反应物的顺序不是关键的。反应物可以同时一起添加至溶剂(例如,单相溶剂、双相水性共溶剂系统等)中,或者可选择地,一些反应物可以分开添加,而一些反应物可以在不同的时间点一起添加。例如,辅因子、转氨酶和转氨酶底物可被首先添加至溶剂中。当使用水性共溶剂系统时,为了改进混合效率,可以先将转氨酶和辅因子添加并混合至水相中。然后可以添加并混合有机相,随后添加转氨酶底物。可选择地,转氨酶底物可以在添加至水相之前在有机相中预混合。
在一些实施方案中,当选择的氨基供体产生具有高于水的蒸汽压的羰基副产物(例如,低沸点副产物,诸如挥发性有机羰基化合物)时,羰基副产物可以通过用非反应性气体吹扫(sparging)反应溶液或通过应用真空以降低反应压力并去除气相中存在的羰基副产物来去除。非反应性气体是不与反应组分反应的任何气体。各种非反应性气体包括氮气和稀有气体(例如,惰性气体)。在一些实施方案中,非反应性气体是氮气。在一些实施方案中,该方法中使用的氨基供体是异丙胺(IPM),其在向氨基基团受体转移氨基基团后形成羰基副产物丙酮。丙酮可以通过用氮气吹扫反应溶液或对反应溶液应用真空,并通过丙酮捕集器,诸如冷凝器或其他冷捕集器从气相去除丙酮来去除。可选择地,丙酮可以通过使用酮还原酶还原为异丙醇来去除。
在其中去除羰基副产物的方法的一些实施方案中,在转氨基反应期间可以添加对应的氨基基团供体以补充氨基基团供体和/或维持反应的pH。补充氨基供体还将平衡向产物形成转移,从而增加底物向产物的转化。因此,在其中氨基基团供体是IPM并且丙酮产物被原位去除的一些实施方案中,该方法还可以包括以下步骤:向反应溶液添加IPM,以补充丙酮去除期间失去的氨基基团供体,并维持反应的pH(例如,在约8.5至约pH 11.5)。
在一些实施方案中,还设想了,包括使用本公开内容的转氨酶多肽将胺受体底物化合物生物催化转化为手性胺产物化合物的方法还可以包括以下步骤:形成药学上可接受的盐或酸、药学上可接受的制剂,产物检查(product work-up),提取,分离,纯化和/或结晶,其中每个步骤可以在一定范围的条件下进行。
在一些实施方案中,可以进行使用本文公开的工程化多肽的方法,其中氨基基团供体选自异丙胺、丙氨酸、3-氨基丁酸或甲基苄胺。在一些实施方案中,氨基基团供体是异丙胺。
用于从通过以上公开的方法产生的生物催化反应混合物提取、分离、形成其盐、纯化和/或结晶胺化产物化合物或环化化合物的方法、技术和方案是普通技术人员已知的和/或通过常规实验可获得的。另外,在以下实施例中提供了说明性的方法。
本发明的多种特征和实施方案在以下代表性实施例中进行了说明,这些实施例意图说明而非限制。
实验
本发明的各种特征和实施方案在以下代表性实施例中进行了说明,这些实施例旨在说明而非限制。
在以下实验公开内容中,应用了以下缩写:ppm(百万分率(parts per million));M(摩尔/升);mM(毫摩尔/升);uM和μΜ(微摩尔/升);nM(纳摩尔/升);mol(摩尔);gm和g(克);mg(毫克);ug和μg(微克);L和l(升);ml和mL(毫升);cm(厘米);mm(毫米);um和μm(微米);sec.(秒);min(s)(分钟);h(s)和hr(s)(小时);U(单位);MW(分子量);rpm(每分钟转数);℃(摄氏度);RT(室温);CDS(编码序列);DNA(脱氧核糖核酸);RNA(核糖核酸);aa(氨基酸);TB(Terrific肉汤;12g/L细菌用胰蛋白胨、24g/L酵母提取物、4mL/L甘油、65mM磷酸钾、pH 7.0、1mM MgSO4);LB(Luria肉汤);CAM(氯霉素);PMBS(硫酸多粘菌素B);IPTG(异丙基硫代半乳糖苷);ATA(ω-转氨酶);TFA(三氟乙酸);TEoA(三乙醇胺);硼酸盐(十水合四硼酸钠);乙腈(MeCN);二甲基亚砜(DMSO);HPLC(高效液相层析法);FIOP(相对于阳性对照的改进倍数);HTP(高通量);MWD(多波长检测器);UV(紫外线);Codexis(Codexis,Inc.,RedwoodCity,CA);Sigma-Aldrich(Sigma-Aldrich,St.Louis,MO);Millipore(Millipore,Corp.,Billerica MA);Difco(Difco Laboratories,BD Diagnostic Systems,Detroit,MI);Daicel(Daicel,West Chester,PA);Genetix(Genetix USA,Inc.,Beaverton,OR);Molecular Devices(Molecular Devices,LLC,Sunnyvale,CA);Applied Biosystems(Applied Biosystems,Life Technologies,Corp.的一部分,Grand Island,NY),Agilent(Agilent Technologies,Inc.,Santa Clara,CA);Thermo Scientific(Thermo FisherScientific的一部分,Waltham,MA);(Infors;Infors-HT,Bottmingen/Basel,Switzerland);Corning(Corning,Inc.,Palo Alto,CA);和Bio-Rad(Bio-RadLaboratories,Hercules,CA);Microfluidics(Microfluidics Corp.,Newton,MA);Waters(Waters Corp.,Milford,MA)。
实施例1
在pCK110900中产生工程化多肽
将编码来自河流弧菌的具有转氨酶活性的多肽(SEQ ID NO:2)的多核苷酸(SEQID NO:1)克隆到pCK110900载体系统(参见例如,美国专利第9,714,437号,其在此通过引用以其整体并入),并随后在大肠杆菌W3110fhuA中在lac启动子的控制下表达。
以96孔形式挑取单菌落并在190μL含有1%葡萄糖和30μg/mL氯霉素(CAM)的LB培养基中在30℃、200rpm和85%湿度生长。在过夜生长后,将20μL的生长培养物转移到含有380μL TB和30μg/mL CAM的深孔板中。使培养物在30℃、250rpm与85%湿度生长约2.5小时。当培养物的光密度(OD600)达到0.4-0.6时,通过添加终浓度为1mM的IPTG诱导转氨酶基因的表达。在诱导后,在30℃、250rpm与85%湿度继续生长18-20小时。通过在4℃以4000rpm离心10分钟来收获细胞,并弃去培养基。将细胞沉淀物储存于-80℃,直到准备使用。在进行测定之前,将细胞沉淀物重悬于400μL的含有50mM三乙醇胺-HCl,pH 7.5与1g/L PLP、1g/L溶菌酶和0.5g/L PMBS的裂解缓冲液中。将板在室温在微量滴定板振荡器上以中速振荡搅拌2小时。然后将板在4℃以4000rpm离心15分钟,并且澄清的上清液用于下文描述的HTP测定反应。
摇瓶程序可以用于产生工程化转氨酶多肽摇瓶粉末(SFP),其可用于二次筛选测定和/或用于本文所述的生物催化过程。与HTP测定中使用的细胞裂解物相比,酶的摇瓶粉末制品提供了更纯化的工程化酶的制品(例如,多达总蛋白的30%),并且还允许使用更浓缩的酶溶液。为了开始培养,将含有编码感兴趣的工程化多肽的质粒的大肠杆菌的单菌落接种到5mL的含30μg/mL CAM和1%葡萄糖的LB中。使培养物在培养箱中在37℃、250rpm振荡生长过夜(至少16小时)。然后将生长培养物加到1L摇瓶中的250mL的含30μg/mL CAM的TB中。使250mL培养物在30℃、250rpm生长3.5小时,直到OD600达到0.6-0.8。转氨酶基因的表达通过添加终浓度为1mM的IPTG诱导,并继续生长另外18-20小时。通过将培养物转移到预称重的离心瓶中,然后在4℃以4000rpm离心20分钟来收获细胞。弃去上清液,并对剩余细胞沉淀物称重。在一些实施方案中,将细胞储存于-80℃,直到准备使用。为了裂解,将细胞沉淀物重悬于6mL/g湿细胞重量的25mM三乙醇胺-HCl缓冲液,pH 7.5中,并使用110L处理机系统(Microfluidics)裂解。通过在4℃以10,000rpm离心60分钟来去除细胞残渣。收集澄清的裂解液,在-80℃冷冻,并且然后使用本领域已知的标准方法冻干。冻干冷冻的澄清裂解液提供了包含粗制的工程化多肽的干燥摇瓶粉末。
实施例2
为了改进化合物(2)的产生,对源自SEQ ID NO:4的工程化多肽进行的演化和筛选
编码具有转氨酶活性的多肽SEQ ID NO:4的工程化多核苷酸(SEQ ID NO:3)用于生成表2-1的工程化多肽。在所需条件下,这些多肽与起始多肽相比显示出改进的转氨酶活性,例如,从酮底物化合物(1)形成胺产物化合物(2)的改进。从“骨架”氨基酸序列SEQ IDNO:4产生具有偶数编号序列标识符的氨基酸序列的工程化多肽,如下文所述,以及HTP测定和表6-1和表6-2所述的分析方法。
从SEQ ID NO:3中列出的多核苷酸开始定向演化。使用各种熟知的技术(例如,饱和诱变、先前鉴定的有益氨基酸差异的重组)产生工程化多肽的文库,并使用HTP测定和测量多肽产生化合物(2)的能力的分析方法进行筛选。
酶测定在96孔浅孔(300μL体积/孔)板中以100μL总反应体积/孔进行。反应物含有55μL的64倍稀释的ATA裂解液(稀释于50mM三乙醇胺+1g/L PLP,pH 7.5中)、25μL的4M异丙胺-HCl,pH 9和20μL溶于DMSO的100g/L酮(1)。将反应板热密封并在50℃以600rpm振荡22小时。
在过夜孵育(~22小时)后,向反应板中添加100μL/孔的乙腈中的50%甲酸并充分混合。将板密封并以4000rpm离心10min。从猝灭的板中取出20μL/孔的等分试样,并稀释到180μL的1:1乙腈:水中,并通过HPLC分析以分别确定活性和选择性,如表6-1和表6-2所述。
使击中(hit)变体在250mL摇瓶中生长,如实施例1所述,以产生冻干酶粉末。酶粉末的活性以0-10g/L的ATA摇瓶粉末、20-100g/L酮,1M IPM(4M pH 9储备液)、0%-40%共溶剂(DMSO或甲醇)、pH~9,在50℃持续20-24小时,使用上述类似的测定来评价,并在表2-2列出了击中变体。
实施例3
为了改进化合物(2)的产生,对源自SEQ ID NO:8的工程化多肽进行的演化和筛选
编码具有转氨酶活性的多肽SEQ ID NO:8的工程化多核苷酸(SEQ ID NO:7)用于生成表3-1的工程化多肽。在所需条件下,这些多肽与起始多肽相比显示出改进的转氨酶活性,例如,从酮底物化合物(1)形成胺产物化合物(2)的改进。从“骨架”氨基酸序列SEQ IDNO:8产生具有偶数编号序列标识符的氨基酸序列的工程化多肽,如下文所述。
从SEQ ID NO:7中列出的多核苷酸开始定向演化。使用各种熟知的技术(例如,饱和诱变、先前鉴定的有益氨基酸差异的重组)产生工程化多肽的文库,并使用HTP测定和测量多肽产生化合物(2)的能力的分析方法进行筛选。
酶测定和分析如实施例2所述进行,不同的是在加入反应混合物之前将裂解物稀释512倍。
使击中变体在250mL摇瓶中生长,并产生酶粉末,如实施例1所述。酶粉末的活性以0-32g/L的ATA摇瓶粉末、20-200g/L酮,1-2.5M IPM(4M pH 9储备液)、0.5g/L PLP、0%-20%DMSO、pH~9,在40-60℃持续20-24小时,使用上述类似的测定来评价,并在表3-2列出了击中变体。
实施例4
为了改进化合物(2)的产生,对源自SEQ ID NO:366的工程化多肽进行的演化和筛选
编码具有转氨酶活性的多肽SEQ ID NO:366的工程化多核苷酸(SEQ ID NO:365)用于生成表4-1的工程化多肽。在所需条件下,这些多肽与起始多肽相比显示出改进的转氨酶活性,例如,从酮底物(化合物(1))形成化合物(2)(胺产物)的改进。从“骨架”氨基酸序列SEQ ID NO:366产生具有偶数编号序列标识符的氨基酸序列的工程化多肽,如下文所述,以及HTP测定和表6-1和表6-2所述的分析方法。
酶测定和分析如实施例2所述进行,不同的是在加入反应混合物之前将裂解物稀释1700倍。
使击中变体在250mL摇瓶中生长,并产生酶粉末,如实施例1所述。酶粉末的活性以0-60g/L的ATA摇瓶粉末、20-300g/L酮,1M IPM(4M pH 9储备液)、0.5g/L PLP、0%-20%DMSO、pH~9,在40-60℃持续20-24小时,使用上述类似的测定来评价,并在表4-2列出了击中变体。
实施例5
为了改进化合物(2)的产生,对源自SEQ ID NO:650的工程化多肽进行的演化和筛选
编码具有转氨酶活性的多肽SEQ ID NO:650的工程化多核苷酸(SEQ ID NO:649)用于生成表5-1的工程化多肽。在所需条件下,这些多肽与起始多肽相比显示出改进的转氨酶活性,例如,从酮底物(化合物(1))形成化合物(2)(胺产物)的改进。从“骨架”氨基酸序列SEQ ID NO:650产生具有偶数编号序列标识符的氨基酸序列的工程化多肽,如下文所述,以及HTP测定和表6-1和表6-2所述的分析方法。
从SEQ ID NO:649中列出的多核苷酸开始定向演化。使用各种熟知的技术(例如,饱和诱变、先前鉴定的有益氨基酸差异的重组)产生工程化多肽的文库,并使用HTP测定和测量多肽产生化合物(2)的能力的分析方法进行筛选。
酶测定和分析如实施例2所述进行,不同的是在加入反应混合物之前将裂解物稀释4000倍。
使击中变体在250mL摇瓶中生长,并产生酶粉末。酶粉末的活性以0-3g/L的ATA摇瓶粉末、20-100g/L酮,1M IPM(4M pH 9储备液)、0.5g/L PLP、0%-18%DMSO共溶剂、pH~9,在50℃持续24小时,使用上述类似的测定来评价,并在表5-2列出了击中变体。
实施例6
化合物(1)向化合物(2)转化的分析检测
实施例2至实施例5中描述的数据使用表6-1和表6-2中提供的分析方法采集。本文提供的方法可用于分析使用本发明产生的变体。然而,并不意图本发明限于本文所述的方法,因为本领域中存在可应用于分析本文提供的变体和/或使用本文提供的方法产生的变体的其他合适的已知方法。
为了所有目的,将本申请中引用的所有出版物、专利、专利申请和其他文件在此通过引用以其整体并入,其程度如同每个单独的出版物、专利、专利申请或其他文件被单独地指出为了所有目的通过引用并入。
虽然已经说明及描述了多种特定实施方案,但应理解,在不偏离本发明的精神和范围的情况下可以进行各种改变。
Claims (31)
1.一种工程化转氨酶,所述工程化转氨酶包含与SEQ ID NO:2、4、8、366和/或650具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列同一性的多肽序列或其功能片段,其中所述工程化转氨酶在所述多肽序列中包含至少一个取代或取代集,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:2、4、8、366和/或650编号。
2.根据权利要求1所述的工程化转氨酶,其中所述多肽序列与SEQ ID NO:4具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列同一性,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:21/163/286/291/314/316/323/383/388/408/414/416、18、20、21、21/23/56/146、21/23/56/146/432、21/23/146/417、21/23/395/417/432、21/53/56、21/53/417、21/56/395、21/417/432、23、23/53、23/53/56、23/53/56/146/395、23/53/395、23/53/417、23/53/432、23/56、23/56/395、23/56/395/417、23/395/417、23/417、23/417/432、53、53/56、53/146/417、53/395、56、56/74/241/286/314/316/323、56/86/163/314/316/383/414/416/422、56/86/286/314/414/416、56/86/314/316/323/394/414/422、56/146/417、56/146/432、56/147、56/163、56/163/286/316/323/383/394、56/286/314/316/323/422、56/286/383、56/323、56/323/383、56/323/383/394、56/383、56/395、74/81/286/316/323/383、74/85/86/163/286/316/323/394、74/85/314/316/414/416、74/86/163/316、74/86/316/323/383/394、74/88/286/316/323/383、74/88/323/383、74/163/286/316/383/394/416、74/163/314/316、74/163/314/316/323/394、74/163/314/323/383/414/416、74/286、74/286/316/323、74/286/394/416、74/314/323/383/394/414、74/316/323/394、85/86/88/163/323/383/394、85/86/163/314/323/394/414、85/286、85/286/323、86、86/88/163/323/383/414/422、86/383/394、88、88/163/286/383、88/286/316/323、88/286/316/323/383/414/416、88/316/323、146、146/147/395/417、146/395、146/395/417、146/417、147/395/417/432、147/417、149、157、163、163/222/286/316/323/383/394、163/286、163/286/314/316/323/414/416、163/286/314/323/394、163/286/316/323/394/416、163/286/414、163/314/316/394、163/314/323/394、163/314/383、163/314/414、163/316/323、163/323、163/383、164、199/417、259、260、284、286、286/314/323/383、286/314/394、286/316/323/383/414/416、286/316/383/394、286/316/394/414/416、286/323、286/323/383/414、286/323/416、286/383、286/416、314/316、314/316/323、314/316/323/383/422、314/316/323/394、314/316/394、314/323/383/394、314/383、314/383/414/422、315、316、316/323/383/394、316/323/394/414/416、316/414/422、323、323/383、323/383/394/414/416、323/394、383、395、395/417、395/417/432、400、401、403、404、405、406、408、415、417、417/432、420和422,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:4编号。
3.根据权利要求1所述的工程化转氨酶,其中所述多肽序列与SEQ ID NO:4具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列同一性,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:74/81/286/316/323/383、163/286/314/316/323/414/416、163/286/314/323/394、286/314/323/383、286/316/323/383/414/416、315和408,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:4编号。
4.根据权利要求1所述的工程化转氨酶,其中所述多肽序列与SEQ ID NO:8具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列同一性,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:5、18/23/149/260/383/395/401/416、18/23/149/383、18/163/164、21、21/163/315/316、21/163/323/408、21/408、23/56/86/149/163/164/383/401/416、23/86、23/149/260、23/149/284/383/395、23/163/164/383、23/163/164/401/416、24、42、42/110、42/187/272、42/187/324/363/366、42/187/353、42/272/291、42/272/291/363、42/272/324/363/366、42/272/363/410、42/272/410、42/291/313/363/410、42/291/363、42/291/363/366、42/353、42/363、46、66、77、86/149/163/164/383/395/401、86/149/395、86/163/164/260/383、86/383、107、110、110/187、110/187/253/410、134、138、149/164/260/383/395/401、149/260/383、149/416、163/259/323/408、163/259/408、163/315/316、164/260/401、164/316/383/401、167、186、187、187/253/363/366、187/272/324/363/410、187/272/363、187/272/363/366/410、187/291、189、191、195、199、203、210、211、248、259/307、260/395/401、272、272/353、272/363/366、272/410、277、291、305、309、315、342、343、351、354、358、361、362、363、363/366、365、367、383、383/401、383/416/422、385、388、389、392、395、396、401、404、405、408、410、416、417、439、443、447、450和451,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:8编号。
5.根据权利要求1所述的工程化转氨酶,其中所述多肽序列与SEQ ID NO:8具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列同一性,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:18/23/149/383、21/163/323/408、272、291和383,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:8编号。
6.根据权利要求1所述的工程化转氨酶,其中所述多肽序列与SEQ ID NO:366具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列同一性,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:24、24/42/66/291、24/42/291/362、24/66/163/191/362/383/388、24/66/191/199/260/291/351、24/66/191/199/291、24/66/191/260/408、24/66/260/291/383/388/408、24/66/291/342/383、24/66/291/365、24/66/342/365/388/408、24/77/291、24/107/163/191/291/351/383/388、24/107/291/351/365/388、24/163/351/383、24/191/291/365、24/199/260/351/362/383、24/199/260/362/383/388、24/260/362/383/388、24/291、24/291/342/351/383、24/291/362/388、24/291/408、24/383/388、24/388、25、28、33、42/191/408、42/199/291/383、42/291/351/362/365/383/388、42/291/351/362/383/408、42/291/383/388、66/82/291/383、66/163/191/365/383、66/199/351/383、66/291、66/291/362/365/383、66/291/383/388、66/383、77/291、77/383/388、86、107/191/199/365/383/388、107/191/291/383、148、153、163/291/362/365/383/388、163/291/383/388、163/383、191/199/365/383/388、191/260/388、191/291、191/291/342/362/365、191/351/383/388、199/260/383、199/291、260、260/291/365/383/408、260/365/383、291、291/351/383/388、291/351/383/388/408、291/362/365、291/365/388、291/383、314、315、316、319、342/362、351/383/388、362、362/388、383、383/388、396、397、405、406、413、419和423,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:366编号。
7.根据权利要求1所述的工程化转氨酶,其中所述多肽序列与SEQ ID NO:366具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:24/66/191/199/291、24/66/291/365、163/291/362/365/383/388、163/291/383/388、191/291/342/362/365、291和291/383,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:366编号。
8.根据权利要求1所述的工程化转氨酶,其中所述多肽序列与SEQ ID NO:650具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列同一性,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:10、13、13/24/108/163、13/24/108/163/311、13/24/133/199/311、13/24/163、13/24/199/311、13/108、13/108/199、13/108/311、13/199、13/311、14、14/24/108、14/24/108/133、14/24/108/199、14/24/199、14/108、14/108/133/311、14/108/311、14/311、24、24/163、24/163/199、35、72、73、78、95、101、108、108/199、114、154、163、169、175/316、199、199/311、226、293、311、316、382、383和386,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:650编号。
9.根据权利要求1所述的工程化转氨酶,其中所述多肽序列与SEQ ID NO:650具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%的序列同一性,其中所述工程化转氨酶在所述多肽序列中选自以下的一个或更多个位置处包含至少一个取代或取代集:14/108/133/311、24/163/199、72、78、316和383,并且其中所述多肽序列的氨基酸位置参考SEQ ID NO:650编号。
10.根据权利要求1所述的工程化转氨酶,其中所述工程化转氨酶包含与表2-1、表2-2、表3-1、表3-2、表4-1、表4-2、表5-1和/或表5-2中列出的至少一种工程化转氨酶变体的序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的多肽序列。
11.根据权利要求1所述的工程化转氨酶,其中所述工程化转氨酶是表2-1、表2-2、表3-1、表3-2、表4-1、表4-2、表5-1和/或表5-2中提供的变体工程化转氨酶。
12.根据权利要求1所述的工程化转氨酶,其中所述工程化转氨酶是SEQ ID NO:2、4、8、366和/或650中列出的变体工程化转氨酶。
13.根据权利要求1所述的工程化转氨酶,其中所述工程化转氨酶包含与SEQ ID NO:6-936中的偶数编号序列中列出的至少一种工程化转氨酶变体的序列至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%相同的多肽序列。
14.根据权利要求1所述的工程化转氨酶,其中所述工程化转氨酶包含SEQ ID NO:6-936中的偶数编号序列中列出的多肽序列。
15.根据权利要求1-14中任一项所述的工程化转氨酶,其中所述工程化转氨酶与野生型河流弧菌(V.fluvialis)转氨酶相比包括至少一种改进的特性。
16.根据权利要求15所述的工程化转氨酶,其中所述改进的特性包括改进的对底物的活性。
17.根据权利要求16所述的工程化转氨酶,其中所述底物包括化合物(1)。
18.根据权利要求15中任一项所述的工程化转氨酶,其中所述改进的特性包括改进的热稳定性。
19.根据权利要求1-18中任一项所述的工程化转氨酶,其中所述工程化转氨酶是纯化的。
20.一种组合物,所述组合物包含根据权利要求1-19中任一项所述的工程化转氨酶。
21.一种多核苷酸序列,所述多核苷酸序列编码至少一种根据权利要求1-19中任一项所述的工程化转氨酶。
22.一种多核苷酸序列,所述多核苷酸序列编码至少一种根据权利要求1-19中任一项所述的工程化转氨酶,其中所述多核苷酸序列包含与SEQ ID NO:1、3、7、365和/或649的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性,并且其中所述工程化转氨酶的多核苷酸序列包含一个或更多个位置处的至少一个取代。
23.一种多核苷酸序列,所述多核苷酸序列编码至少一种包含与SEQ ID NO:2、4、8、366和/或650的至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的序列同一性的工程化转氨酶或其功能片段。
24.根据权利要求21-23中任一项所述的多核苷酸序列,其中所述多核苷酸序列可操作地连接到控制序列。
25.根据权利要求21-24中任一项所述的多核苷酸序列,其中所述多核苷酸序列是密码子优化的。
26.一种表达载体,所述表达载体包含至少一种根据权利要求21-25中任一项所述的多核苷酸序列。
27.一种宿主细胞,所述宿主细胞包含至少一种根据权利要求26所述的表达载体。
28.一种宿主细胞,所述宿主细胞包含至少一种根据权利要求21-25中任一项所述的多核苷酸序列。
29.一种在宿主细胞中产生工程化转氨酶的方法,所述方法包括在合适的条件下培养根据权利要求27和/或28所述的宿主细胞,使得产生至少一种工程化转氨酶。
30.根据权利要求29所述的方法,所述方法还包括从培养物和/或所述宿主细胞回收至少一种工程化转氨酶。
31.根据权利要求29和/或30所述的方法,所述方法还包括纯化所述至少一种工程化转氨酶的步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202063008047P | 2020-04-10 | 2020-04-10 | |
US63/008,047 | 2020-04-10 | ||
PCT/US2021/025967 WO2021207200A2 (en) | 2020-04-10 | 2021-04-06 | Engineered transaminase polypeptides |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115427557A true CN115427557A (zh) | 2022-12-02 |
Family
ID=78005463
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202180027564.2A Pending CN115427557A (zh) | 2020-04-10 | 2021-04-06 | 工程化转氨酶多肽 |
Country Status (7)
Country | Link |
---|---|
US (2) | US11788071B2 (zh) |
EP (1) | EP4133064A4 (zh) |
JP (1) | JP2023521772A (zh) |
CN (1) | CN115427557A (zh) |
CA (1) | CA3179751A1 (zh) |
IL (1) | IL296841A (zh) |
WO (1) | WO2021207200A2 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114525265B (zh) * | 2022-04-21 | 2022-09-30 | 凯莱英医药集团(天津)股份有限公司 | 转氨酶突变体及其应用 |
Family Cites Families (89)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4600692A (en) | 1983-02-10 | 1986-07-15 | Purification Engineering, Inc. | Immobilized cells for preparing phenylalanine |
CA1338400C (en) | 1983-08-31 | 1996-06-18 | David H. Gelfand | Recombinant fungal cellulases |
US4518692A (en) | 1983-09-01 | 1985-05-21 | Genetics Institute, Inc. | Production of L-amino acids by transamination |
US4826766A (en) | 1985-09-23 | 1989-05-02 | Genetics Institute, Inc. | Production of amino acids using coupled aminotransferases |
US5316943A (en) | 1988-06-14 | 1994-05-31 | Kidman Gene E | Racemic conversion of using a transaminase |
US5300437A (en) | 1989-06-22 | 1994-04-05 | Celgene Corporation | Enantiomeric enrichment and stereoselective synthesis of chiral amines |
US5169780A (en) | 1989-06-22 | 1992-12-08 | Celgene Corporation | Enantiomeric enrichment and stereoselective synthesis of chiral amines |
US4950606A (en) | 1989-06-22 | 1990-08-21 | Celgene Corporation | Enantiomeric enrichment and stereoselective synthesis of chiral amines |
US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6995017B1 (en) | 1994-02-17 | 2006-02-07 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6165793A (en) | 1996-03-25 | 2000-12-26 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6117679A (en) | 1994-02-17 | 2000-09-12 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US6335160B1 (en) | 1995-02-17 | 2002-01-01 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US6406855B1 (en) | 1994-02-17 | 2002-06-18 | Maxygen, Inc. | Methods and compositions for polypeptide engineering |
US5928905A (en) | 1995-04-18 | 1999-07-27 | Glaxo Group Limited | End-complementary polymerase reaction |
US6309883B1 (en) | 1994-02-17 | 2001-10-30 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US5834252A (en) | 1995-04-18 | 1998-11-10 | Glaxo Group Limited | End-complementary polymerase reaction |
US5837458A (en) | 1994-02-17 | 1998-11-17 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
US20060257890A1 (en) | 1996-05-20 | 2006-11-16 | Maxygen, Inc. | Methods and compositions for cellular and metabolic engineering |
CN1192108C (zh) | 1994-06-03 | 2005-03-09 | 诺沃奇梅兹生物技术有限公司 | 纯化的毁丝霉属漆酶及编码该酶的核酸 |
AU2705895A (en) | 1994-06-30 | 1996-01-25 | Novo Nordisk Biotech, Inc. | Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein |
FI104465B (fi) | 1995-06-14 | 2000-02-15 | Valio Oy | Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö |
US6096548A (en) | 1996-03-25 | 2000-08-01 | Maxygen, Inc. | Method for directing evolution of a virus |
US6506602B1 (en) | 1996-03-25 | 2003-01-14 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
DE69835360T2 (de) | 1997-01-17 | 2007-08-16 | Maxygen, Inc., Redwood City | EVOLUTION Prokaryotischer GANZER ZELLEN DURCH REKURSIVE SEQUENZREKOMBINATION |
US7148054B2 (en) | 1997-01-17 | 2006-12-12 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
US6265201B1 (en) | 1997-01-17 | 2001-07-24 | Regents Of The University Of Minnesota | DNA molecules and protein displaying improved triazine compound degrading ability |
US6326204B1 (en) | 1997-01-17 | 2001-12-04 | Maxygen, Inc. | Evolution of whole cells and organisms by recursive sequence recombination |
EP0987332B1 (en) | 1997-04-23 | 2009-08-19 | Kaneka Corporation | DNA encoding a polypeptide having stereoselective transaminase activity, and transformants comprising said DNA |
US6197558B1 (en) | 1997-05-19 | 2001-03-06 | Nsc Technologies | Transaminase biotransformation process |
CA2313380C (en) | 1997-12-08 | 2008-12-30 | California Institute Of Technology | Method for creating polynucleotide and polypeptide sequences |
WO1999051774A2 (en) | 1998-04-02 | 1999-10-14 | Tellus Genetic Resources, Inc. | A method for obtaining a plant with a genetic lesion in a gene sequence |
KR20010082543A (ko) | 1998-05-01 | 2001-08-30 | 추후제출 | Dna 재편성을 이용한 내병충성 유전자의 최적화 방법 |
EP1090024A2 (en) | 1998-06-17 | 2001-04-11 | Maxygen, Inc. | Method for producing polynucleotides with desired properties |
US6365408B1 (en) | 1998-06-19 | 2002-04-02 | Maxygen, Inc. | Methods of evolving a polynucleotides by mutagenesis and recombination |
CA2332615A1 (en) | 1998-08-12 | 2000-02-24 | Maxygen Inc. | Dna shuffling of monooxygenase genes for production of industrial chemicals |
EA005682B1 (ru) | 1998-10-06 | 2005-04-28 | Марк Аарон Эмалфарб | Трансформированные грибы, в частности рода chrysosporium, способные к синтезу гетерологичных полипептидов |
EP1119616A2 (en) | 1998-10-07 | 2001-08-01 | Maxygen, Inc. | Dna shuffling to produce nucleic acids for mycotoxin detoxification |
EP1129184A1 (en) | 1998-11-10 | 2001-09-05 | Maxygen, Inc. | Modified adp-glucose pyrophosphorylase for improvement and optimation of plant phenotypes |
JP4221100B2 (ja) | 1999-01-13 | 2009-02-12 | エルピーダメモリ株式会社 | 半導体装置 |
US6376246B1 (en) | 1999-02-05 | 2002-04-23 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
US6436675B1 (en) | 1999-09-28 | 2002-08-20 | Maxygen, Inc. | Use of codon-varied oligonucleotide synthesis for synthetic shuffling |
US6917882B2 (en) | 1999-01-19 | 2005-07-12 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US6368861B1 (en) | 1999-01-19 | 2002-04-09 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
IL137868A0 (en) | 1999-01-19 | 2001-10-31 | Maxygen Inc | Oligonucleotide mediated nucleic acid recombination |
US7024312B1 (en) | 1999-01-19 | 2006-04-04 | Maxygen, Inc. | Methods for making character strings, polynucleotides and polypeptides having desired characteristics |
US8457903B1 (en) | 1999-01-19 | 2013-06-04 | Codexis Mayflower Holdings, Llc | Method and/or apparatus for determining codons |
US6961664B2 (en) | 1999-01-19 | 2005-11-01 | Maxygen | Methods of populating data structures for use in evolutionary simulations |
US7873477B1 (en) | 2001-08-21 | 2011-01-18 | Codexis Mayflower Holdings, Llc | Method and system using systematically varied data libraries |
US7702464B1 (en) | 2001-08-21 | 2010-04-20 | Maxygen, Inc. | Method and apparatus for codon determining |
US20070065838A1 (en) | 1999-01-19 | 2007-03-22 | Maxygen, Inc. | Oligonucleotide mediated nucleic acid recombination |
IL144657A0 (en) | 1999-02-11 | 2002-06-30 | Maxygen Inc | High throughput mass spectrometry |
EP1165757A1 (en) | 1999-03-05 | 2002-01-02 | Maxygen, Inc. | Encryption of traits using split gene sequences |
US6703240B1 (en) | 1999-04-13 | 2004-03-09 | Maxygar, Inc. | Modified starch metabolism enzymes and encoding genes for improvement and optimization of plant phenotypes |
US7430477B2 (en) | 1999-10-12 | 2008-09-30 | Maxygen, Inc. | Methods of populating data structures for use in evolutionary simulations |
US6519065B1 (en) | 1999-11-05 | 2003-02-11 | Jds Fitel Inc. | Chromatic dispersion compensation device |
US6686515B1 (en) | 1999-11-23 | 2004-02-03 | Maxygen, Inc. | Homologous recombination in plants |
SG121902A1 (en) | 2000-01-11 | 2006-05-26 | Maxygen Inc | Integrated systems for diversity generation and screening |
EP1272967A2 (en) | 2000-03-30 | 2003-01-08 | Maxygen, Inc. | In silico cross-over site selection |
ATE500323T1 (de) | 2000-04-03 | 2011-03-15 | Maxygen Inc | Subtilisin-variante |
US20050084907A1 (en) | 2002-03-01 | 2005-04-21 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
EP2390803B1 (en) | 2002-03-01 | 2013-11-20 | Codexis Mayflower Holdings, LLC | Methods, systems, and software for identifying functional biomolecules |
US7747391B2 (en) | 2002-03-01 | 2010-06-29 | Maxygen, Inc. | Methods, systems, and software for identifying functional biomolecules |
WO2003078583A2 (en) | 2002-03-09 | 2003-09-25 | Maxygen, Inc. | Optimization of crossover points for directed evolution |
US20050009151A1 (en) | 2003-07-10 | 2005-01-13 | Pharmacia Corporation | Methods for the stereospecific and enantiomeric enrichment of beta-amino acids |
WO2005017135A1 (en) | 2003-08-11 | 2005-02-24 | Codexis, Inc. | Improved ketoreductase polypeptides and related polynucleotides |
US8962298B2 (en) | 2006-05-02 | 2015-02-24 | Butamax Advanced Biofuels Llc | Recombinant host cell comprising a diol dehydratase |
EP2118281A2 (en) | 2007-02-12 | 2009-11-18 | Codexis, Inc. | Structure-activity relationships |
WO2008127646A2 (en) | 2007-04-11 | 2008-10-23 | Dsm Ip Assets B.V. | Transaminase-based processes for preparation of pregabalin |
US8768871B2 (en) | 2008-02-12 | 2014-07-01 | Codexis, Inc. | Method of generating an optimized, diverse population of variants |
HUE034642T2 (en) | 2008-02-12 | 2018-02-28 | Codexis Inc | A method for selecting an optimized diverse population of variants |
US8383346B2 (en) | 2008-06-13 | 2013-02-26 | Codexis, Inc. | Combined automated parallel synthesis of polynucleotide variants |
US20090312196A1 (en) | 2008-06-13 | 2009-12-17 | Codexis, Inc. | Method of synthesizing polynucleotide variants |
HUE029228T2 (en) | 2008-06-13 | 2017-02-28 | Codexis Inc | A method for the synthesis of polynucleotide variants |
HUE052297T2 (hu) * | 2009-01-08 | 2021-04-28 | Codexis Inc | Transzamináz polipeptidek |
JP5707344B2 (ja) | 2009-02-26 | 2015-04-30 | コデクシス, インコーポレイテッド | トランスアミナーゼ生体触媒 |
CN102597226B (zh) | 2009-06-22 | 2015-08-19 | 科德克希思公司 | 转氨酶反应 |
CA2769795C (en) | 2009-08-05 | 2020-01-07 | Infinity Pharmaceuticals, Inc. | Enzymatic transamination of cyclopamine analogs |
WO2011159910A2 (en) | 2010-06-17 | 2011-12-22 | Codexis, Inc. | Biocatalysts and methods for the synthesis of (s)-3-(1-aminoethyl)-phenol |
EP2606139B1 (en) | 2010-08-16 | 2015-07-15 | Codexis, Inc. | Biocatalysts and methods for the synthesis of (1r,2r)-2-(3,4-dimethoxyphenethoxy)cyclohexanamine |
MX348130B (es) | 2011-06-24 | 2017-05-26 | Merck Sharp & Dohme | Transaminasas inmovilizadas y procedimiento para la preparacion y uso de transaminasa inmovilizada. |
EP2726651B1 (en) | 2011-06-28 | 2018-11-07 | Codexis, Inc. | Protein variant generation by region shuffling |
WO2013142770A1 (en) * | 2012-03-23 | 2013-09-26 | Codexis, Inc. | Biocatalysts and methods for synthesizing derivatives of tryptamine and tryptamine analogs |
PT2828256T (pt) * | 2012-03-23 | 2019-10-18 | Novartis Ag | Processo químico para a preparação de espiroindolonas e dos seus intermediários |
US20150133698A1 (en) | 2012-04-20 | 2015-05-14 | Codexis, Inc. | Production of fatty alcohols from engineered microorganisms |
EP3638688A4 (en) * | 2017-06-14 | 2021-07-07 | Codexis, Inc. | MODIFIED TRANSAMINASE POLYPEPTIDES INTENDED FOR INDUSTRIAL BIOCATALYSIS |
WO2019055498A1 (en) * | 2017-09-12 | 2019-03-21 | Igc Bio, Inc. | PROSS OPTIMIZED ENZYMES |
CA3132365A1 (en) | 2019-04-11 | 2020-10-15 | Nicolas Cuniere | Novel synthetic options towards the manufacture of (6r,10s)-10- {4-[5-chloro-2-(4-chloro-1h-1,2,3-triazol-1-yl)phenyl]-6-oxo-1(6h)- pyrimidinyl}- 1-(difluoromethyl)-6-methyl-1,4,7 8,9,10-hexahydro-11,15-(metheno)pyrazolo [4,3-b][1,7]diazacyclotetradecin-5(6h)-one |
-
2021
- 2021-04-06 CN CN202180027564.2A patent/CN115427557A/zh active Pending
- 2021-04-06 WO PCT/US2021/025967 patent/WO2021207200A2/en unknown
- 2021-04-06 CA CA3179751A patent/CA3179751A1/en active Pending
- 2021-04-06 US US17/223,677 patent/US11788071B2/en active Active
- 2021-04-06 EP EP21785046.0A patent/EP4133064A4/en active Pending
- 2021-04-06 IL IL296841A patent/IL296841A/en unknown
- 2021-04-06 JP JP2022561487A patent/JP2023521772A/ja active Pending
-
2023
- 2023-09-01 US US18/459,797 patent/US20240002816A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US11788071B2 (en) | 2023-10-17 |
CA3179751A1 (en) | 2021-10-14 |
IL296841A (en) | 2022-11-01 |
EP4133064A2 (en) | 2023-02-15 |
EP4133064A4 (en) | 2024-07-24 |
US20210317421A1 (en) | 2021-10-14 |
JP2023521772A (ja) | 2023-05-25 |
WO2021207200A3 (en) | 2021-12-16 |
US20240002816A1 (en) | 2024-01-04 |
WO2021207200A2 (en) | 2021-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7212972B2 (ja) | 産業上の生体触媒作用のための操作されたトランスアミナーゼポリペプチド | |
CN115927231A (zh) | 用于工业生物催化的工程化转氨酶多肽 | |
CN109715817B (zh) | 用于化合物的羟基化的生物催化剂和方法 | |
US11845968B2 (en) | Engineered deoxyribose-phosphate aldolases | |
CN114127272A (zh) | 工程化亚胺还原酶和用于酮和胺化合物的还原胺化的方法 | |
US20240002816A1 (en) | Engineered transaminase polypeptides | |
EP4314264A1 (en) | Engineered cyclic gmp-amp synthase (cgas) variant enzymes | |
WO2022212828A1 (en) | Engineered guanylate kinase variant enzymes | |
WO2023150568A2 (en) | Engineered enone reductase and ketoreductase variant enzymes | |
EP4314261A1 (en) | Engineered acetate kinase variant enzymes | |
CN117813376A (zh) | 工程化核苷脱氧核糖基转移酶变体酶 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |