CN105296512A - 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法 - Google Patents

腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法 Download PDF

Info

Publication number
CN105296512A
CN105296512A CN201510514378.8A CN201510514378A CN105296512A CN 105296512 A CN105296512 A CN 105296512A CN 201510514378 A CN201510514378 A CN 201510514378A CN 105296512 A CN105296512 A CN 105296512A
Authority
CN
China
Prior art keywords
acid
polypeptide
sequence
residue
place
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510514378.8A
Other languages
English (en)
Inventor
G·德桑蒂斯
J·M·肖特
M·伯克
K·王
R·法韦尔
K·查特曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Enzymes LLC
Original Assignee
BASF Enzymes LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US10/146,772 external-priority patent/US7521216B2/en
Application filed by BASF Enzymes LLC filed Critical BASF Enzymes LLC
Publication of CN105296512A publication Critical patent/CN105296512A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/78Hydrolases (3) acting on carbon to nitrogen bonds other than peptide bonds (3.5)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/002Nitriles (-CN)
    • C12P13/004Cyanohydrins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P41/00Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture
    • C12P41/006Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture by reactions involving C-N bonds, e.g. nitriles, amides, hydantoins, carbamates, lactames, transamination reactions, or keto group formation from racemic mixtures

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及腈水解酶和编码腈水解酶的核酸。并且,也提供了设计新颖腈水解酶的方法和使用它们的方法。腈水解酶在增高的pH和温度下具有增加的活性和稳定性。

Description

腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法
本申请为分案申请,基于申请号为201210217394.7的分案申请,原申请的申请日为2003年5月15日,申请号为03816682.8(PCT/US03/15712),发明名称为“腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法”。
相关申请的交叉参考文献
本申请要求基于在2002年9月9日申请的美国专利申请序列号No.(USSN)10/241,742和在2002年5月15日申请的USSN10/146,772的优先权权益,这两个申请要求于2002年1月22日申请的USSN60/351,336,于2001年7月30日申请的USSN60/309,006,和于2001年6月21日申请的USSN60/300,189的优先权权益;并且,本申请是于2000年12月28日申请的USSN09/751,299的延续申请,该申请要求于2000年12月7日申请的USSN60/254,414和于1999年12月29日申请的USSN60/173,609的每一个申请的优先权权益。此处完整引入这些申请的所有目的是作为主题申请的参考。
版权宣告
依照37C.F.R.§1.71(e),本专利文件的一部分包括受版权保护的材料。对任意一份专利文件或专利公开的影印复制,如同它出现在专利商标局的专利文件或记录中时,版权所有人对其没有异议,但无论如何保留所有版权权利。
发明领域
本发明总的来说涉及分子生物学、生物化学和化学领域,尤其是涉及具有腈水解酶(nitrilase)活性的酶蛋白(enzymaticproteins)。本发明也涉及编码该酶的多核苷酸,涉及这些多核苷酸和酶的用途。
发明背景
天然存在的酶在将腈转化为大量有用的产品和中间产物的工业化学加工中具有极大应用潜力。这样的酶包括腈水解酶,该酶能将腈直接转化为羧酸。腈水解酶存在于大范围的嗜温微生物中,包括如下种类:芽孢杆菌(Bacillus)、诺卡氏菌(Norcardia)、Bacteridium、红球菌属(Rhodococcus);以及存在于包括如下物种的微生物中:芽孢杆菌、Norcardia、Bacteridium、红球菌属(Rhodococcus)、微球菌(Micrococcus)、短杆菌属(Brevibacterium)、产碱杆菌(Alcaligenes)、不动细菌属(Acinetobacter)、棒状杆菌(Corynebacterium)、镰刀菌(Fusarium)和克雷伯氏菌(Klebsiella)。此外,还有存在于细菌中的嗜热腈水解酶(thermophilicnitrilases)。
从腈到类似酸有两种主要途径:(1)腈水解酶催化腈直接水解为羧酸,同时伴随着释放氨;或者(2)腈水合酶通过碳氮键合体系添加水分子,以产生相应的酰胺,然后该酰胺能作为酰胺酶的底物,该酶水解碳-氮键以产生羧酸产物,同时伴随着释放氨。因此,腈水解酶提供了产生酸的更直接途径。
腈基团在合成途径的设计中有很多优点,它通常更容易被引入到分子结构中,而且作为掩蔽酸或酰胺基团,能被携带通过许多过程。然而,如果腈在合成中的相应步骤能被去掉掩蔽,这是反而有用的。氰化物代表具有广泛应用价值的C1-合成纤维(氰化物是少数几个在水中稳定的负碳离子之一),它可以在碳骨架的合成中被使用。然而,由于使用正常化学合成程序需要苛刻的反应条件来进行腈的水解,所以如此得到的腈的进一步转化受到了阻碍。使用酶来催化腈的反应是很有吸引力的,这是因为腈水解酶能完成反应,与许多传统化学方法相比较,该反应具有更少的对环境有害的试剂和副产物。实际上,腈的化学选择性的生物催化水解代表一个有价值的选择方案,原因在于它可以在室温(ambienttemperature)和接近生理pH的条件下发生。
药物设计和发现中的不对称有机合成的重要意义推动了对新合成方法和手性前体(chiralprecursors)的寻找,手性前体可以在具有生物学重要性的复杂分子开发中被使用。手性分子(chiralmolecules)的一个重要种类是α-取代的羧酸,其包括α-氨基酸。这些分子长期以来已经被公认是多种复杂的具有生物活性的分子的重要的手性前体,大量研究努力已经被投入到对映体纯的α-氨基酸和手性药物的合成方法的开发上。
对于制造手性药物的合成化学家来说,尤其有用的将是一种在未消毒条件下有用的酶系统,该系统在非生物实验室里有用,它可以以便于存储和使用的形式获得;该系统具有广泛的底物特异性,可以在水溶性极差的底物上发挥作用;该系统具有可预知的产物结构;该系统可以提供对酸或酰胺产物的选择;并且该系统能够手性区分(chiraldifferentiation)。因此,存在对于有效的、不昂贵的、高产量的合成方法的需求,该方法用于产生对映异构体纯的α-取代的羧酸,诸如,例如α-氨基酸和α-羟基酸。
此外,通常可以通过利用一种简便的高通量筛选或选择方法来帮助发现或演变进行特定转化的酶。尽管在不能得到有效的超高通量(ultrahighthroughout,UHTP)筛选之时,可以使用一种替代底物,但直接筛选一种特定地进行期望转化的酶还是需要的。设计UHTP筛选的前景是显然的,例如,当发现或演变计划的目的在于揭示立体选择性转化,以产生仅仅一种立体异构体或对映异构体时。在这种情况下,可以利用的高通量筛选方法是极其缺乏的。尽管最简单的方法是使用手性液相或气相分离法来分离两种正在讨论的对映异构体,但该方法通常不能提供所要求的极高通量容量。通过使用质谱学(MS)技术,极高通量筛选是可能的。然而,当以传统方式应用时,MS不能提供有关手性或对映体选择性的信息。
另一种方法是用一种单一对映异构体化合物化学方法衍生对映异构混合物,从而产生化合物的非对映体混合物,该混合物能在非手性固定相上分离的。而且,这是一种很麻烦的方法,不能很好地参与高通量筛选。
在整个申请中,作者参考了各种公开文献并且注明了日期。此处将这些公开文献的公开内容完整地引入本申请中,以便完整地描述本技术领域的技术人员所已知的现有技术的状况,其中现有技术至所描述的和所要求的本发明的日期为止。
发明概述
本发明关于一种分离核酸或重组核酸,包括核苷酸,具有一个与如下序列至少有大约50%相同的序列,如下序列为SEQIDNO:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,93,95,97,99,101,103,105,107,109,111,113,115,117,119,121,123,125,127,129,131,133,135,137,139,141,143,145,147,149,151,153,155,157,159,161,163,165,167,169,171,173,175,177,179,181,183,185,187,189,191,193,195,197,199,201,203,205,207,209,211,213,215,217,219,221,223,225,227,229,231,233,235,237,239,241,243,245,247,249,251,253,255,257,259,261,263,265,267,269,271,273,275,277,279,281,283,285,287,289,291,293,295,297,299,301,303,305,307,309,311,313,315,317,319,321,323,325,327,329,331,333,335,337,339,341,343,345,347,349,351,353,355,357,359,361,363,365,367,369,371,373,375,377,379,381,383,385,或其变体,其中核酸编码具有腈水解酶活性的多肽。在本发明的另一个方面,核酸包括核苷酸,具有一个与SEQIDNO:或其变体具有至少大约50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高,或完全同一性(100%相同)的序列。例证性的变体可能包括,例如,SEQIDNO:195,205,207,209或237的下述变体,在如下位点具有一个或更多突变:位点163-165AAA,AAG,GGT,GGC,GGA,GGG,CAA或CAG;位点178-180GAA或GAG;位点331-333TCT,TCC,TCA,TCG,AGT或AGC;位点568-570CAT,CAC,TCT,TCC,TCA,TCG,AGT,AGC,ACT,ACC,ACA,TCA,TAT,TAC,ATG或ACG;位点571-573TTA,TTG,CTT,CTC,CTA,CTG,GTT,GTC,GTA,GTG,ATG,ACT,ACC,ACA,GAT,GAC,GGT,GGC,GGA,GGG,GAA,GAG,TAT,TAC或ACG;位点595-597GAA,GAG,TTA,TTG,CTT,CTC,CTA或CTG;位点646-666TTA,TTG,CTT,CTC,CTA或CTG;或其任意组合。在本发明的一个方面,相比于由SEQIDNO编码的多肽,变体编码具有提高的或者降低的对映体选择性的多肽,例如,在3-羟基戊二酰基腈(3-hydroxyglutarylnitrile,HGN)到(R)-4-氰基-3-羟基丁酸酯的转化中。
在本发明的一个方面,核酸包括核苷酸,具有一个与SEQIDNO:或其变体基本上相同的序列。在另一个方面,本发明提供了一种分离核酸或重组核酸,该核酸包括连续核苷酸,该核苷酸具有一个与SEQIDNO:33具有至少79%同一性的序列,其中所述核酸编码具有腈水解酶活性的多肽。本发明提供了所述核酸的片段,其中所述片段编码具有腈水解酶活性的多肽。本发明也提供了与所述核酸中任何一个互补的分离核酸或重组核酸。本发明也提供了与所述核酸中任何一个在严格条件下杂交的分离核酸或重组核酸。一方面,严格条件包括至少50%甲酰胺,和大约37℃到大约42℃。
本发明提供了一个核酸探针,包括从大约15个核苷酸到大约10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95,100,150,200,250,300,350,400,450,500个或更多个核苷酸,其中至少10,11,12,13,14,15,16,17,18,19,20个或更多个连续核苷酸与如下序列所描述的核酸序列内的核酸靶区域有至少50%互补性:SEQIDNO:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,93,95,97,99,101,103,105,107,109,111,113,115,117,119,121,123,125,127,129,131,133,135,137,139,141,143,145,147,149,151,153,155,157,159,161,163,165,167,169,171,173,175,177,179,181,183,185,187,189,191,193,195,197,199,201,203,205,207,209,211,213,215,217,219,221,223,225,227,229,231,233,235,237,239,241,243,245,247,249,251,253,255,257,259,261,263,265,267,269,271,273,275,277,279,281,283,285,287,289,291,293,295,297,299,301,303,305,307,309,311,313,315,317,319,321,323,325,327,329,331,333,335,337,339,341,343,345,347,349,351,353,355,357,359,361,363,365,367,369,371,373,375,377,379,381,383,385,其变体,或它们的补体。一方面,核酸探针包括连续核苷酸,这些核苷酸与核酸靶区域具有至少55%的互补性。一方面,本发明提供了一个核酸探针,其中连续核苷酸与核酸靶区域具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高或者100%互补性。另一方面,核酸主要包括大约20到大约50个核苷酸。在其它方面,核酸的长度可以是至少大约20,25,30,35,40,45,50,75,100,150个核苷酸。
本发明提供了一种核酸载体,该核酸载体能在宿主细胞中复制,其中所述载体包括本发明的核酸。本发明也提供了包括所述核酸的宿主细胞。本发明也提供了一种包括该宿主细胞的宿主生物体。一方面,该宿主生物体包括革兰氏阴性细菌、革兰氏阳性细菌或真核生物。另一方面,革兰氏阴性细菌包括大肠杆菌(Escherichiacoli)或荧光假单胞菌(Pseudomonasfluorescens)。在进一步的一方面,革兰氏阳性细菌包括戴弗萨链霉菌(Streptomycesdiversa)、加氏乳杆菌(Lactobacillusgasseri)、乳酸乳球菌(Lactococcuslactis)、乳酸乳球菌乳脂亚种(Lactococcuscremoris)或枯草杆菌(Bacillussubtilis)。在进一步的一方面,真核生物包括酿酒酵母(Saccharomycescerevisiae)、非洲粟酒裂殖酵母(Schizosaccharomycepombe)、巴斯德毕赤酵母(Pichiapastoris)、乳酸克鲁维酵母(Kluyveromyceslactis)、Hansenulaplymorpha或黑曲霉(Aspergillusniger)。
本发明提供了一种分离核酸或重组核酸,该核酸编码多肽,该多肽包括氨基酸,所述氨基酸具有一个与如下序列具有至少50%同一性的序列,SEQIDNO:2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118,120,122,124,126,128,130,132,134,136,138,140,142,144,146,148,150,152,154,156,158,160,162,164,166,168,170,172,174,176,178,180,182,184,186,188,190,192,194,196,198,200,202,204,206,208,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,240,242,244,246,248,250,252,254,256,258,260,262,264,266,268,270,272,274,276,278,280,282,284,286,288,290,292,294,296,298,300,302,304,306,308,310,312,314,316,318,320,322,324,326,328,330,332,334,336,338,340,342,344,346,348,350,352,354,356,358,360,362,364,366,368,370,372,374,376,378,380,382,384,386或其变体,其中多肽具有腈水解酶活性。一方面,多肽包括与SEQIDNO或其变体具有至少大约50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高或100%同一性的氨基酸。例证性的变体可以包括,例如,SEQIDNO:196,206,208,210或238的下述变体,具有一个或多个突变:在残基55处赖氨酸、甘氨酸或谷氨酰胺;在残基60处谷氨酸;在残基111处丝氨酸;在残基190处丝氨酸、组氨酸、酪氨酸或苏氨酸;在残基191处亮氨酸、缬氨酸、蛋氨酸、天冬氨酸、甘氨酸、谷氨酸、酪氨酸或苏氨酸;在残基199处谷氨酸或亮氨酸;在残基222处亮氨酸;或其任意组合。
本发明也提供了一种分离核酸或重组核酸,该核酸编码包括至少10个连续氨基酸的多肽,所述氨基酸具有一个与如下序列的一个氨基酸序列的一部分相同的序列,SEQIDNO:2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118,120,122,124,126,128,130,132,134,136,138,140,142,144,146,148,150,152,154,156,158,160,162,164,166,168,170,172,174,176,178,180,182,184,186,188,190,192,194,196,198,200,202,204,206,208,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,240,242,244,246,248,250,252,254,256,258,260,262,264,266,268,270,272,274,276,278,280,282,284,286,288,290,292,294,296,298,300,302,304,306,308,310,312,314,316,318,320,322,324,326,328,330,332,334,336,338,340,342,344,346,348,350,352,354,356,358,360,362,364,366,368,370,372,374,376,378,380,382,384,386或其变体。
一种分离多肽或重组多肽,该多肽包括氨基酸,所述氨基酸具有一个序列,该序列至少大约50%与如下序列相同,SEQIDNO:2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118,120,122,124,126,128,130,132,134,136,138,140,142,144,146,148,150,152,154,156,158,160,162,164,166,168,170,172,174,176,178,180,182,184,186,188,190,192,194,196,198,200,202,204,206,208,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,240,242,244,246,248,250,252,254,256,258,260,262,264,266,268,270,272,274,276,278,280,282,284,286,288,290,292,294,296,298,300,302,304,306,308,310,312,314,316,318,320,322,324,326,328,330,332,334,336,338,340,342,344,346,348,350,352,354,356,358,360,362,364,366,368,370,372,374,376,378,380,382,384,386或其变体,其中所述多肽具有腈水解酶活性。在本发明的一方面,多肽包括氨基酸,所述氨基酸具有一个序列,该序列至少大约50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或更高或100%与SEQIDNO:或其变体相同。
本发明提供了一种分离核酸或重组核酸,该核酸包括核苷酸,所述核苷酸具有一个序列,所述序列以如下的SEQIDNO:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,93,95,97,99,101,103,105,107,109,111,113,115,117,119,121,123,125,127,129,131,133,135,137,139,141,143,145,147,149,151,153,155,157,159,161,163,165,167,169,171,173,175,177,179,181,183,185,187,189,191,193,195,197,199,201,203,205,207,209,211,213,215,217,219,221,223,225,227,229,231,233,235,237,239,241,243,245,247,249,251,253,255,257,259,261,263,265,267,269,271,273,275,277,279,281,283,285,287,289,291,293,295,297,299,301,303,305,307,309,311,313,315,317,319,321,323,325,327,329,331,333,335,337,339,341,343,345,347,349,351,353,355,357,359,361,363,365,367,369,371,373,375,377,379,381,383,385及其变体中的任何一个所阐明(下文称作“A组核酸”)。本发明也涉及与A组核酸序列中的任意序列具有具体说明的最小百分比的序列同一性的核酸。
另一方面,本发明提供了一种分离(纯化)多肽或重组多肽,该多肽包括氨基酸残基,该残基具有一个如下述序列中的任意一个序列所示的序列,如下述序列为SEQIDNO:2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118,120,122,124,126,128,130,132,134,136,138,140,142,144,146,148,150,152,154,156,158,160,162,164,166,168,170,172,174,176,178,180,182,184,186,188,190,192,194,196,198,200,202,204,206,208,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,240,242,244,246,248,250,252,254,256,258,260,262,264,266,268,270,272,274,276,278,280,282,284,286,288,290,292,294,296,298,300,302,304,306,308,310,312,314,316,318,320,322,324,326,328,330,332,334,336,338,340,342,344,346,348,350,352,354,356,358,360,362,364,366,368,370,372,374,376,378,380,382,384,386或其变体,(下文称作“B组氨基酸序列”)。本发明也涉及纯化的多肽,该多肽与B组氨基酸序列中的任意一个序列具有具体说明的最小百分比的序列同一性。
本发明提供了一个多肽片段,该片段的长度至少是50个氨基酸,并且其中所述片段具有腈水解酶活性。进一步,本发明提供了一种多肽或其片段的肽模拟体(peptidomimetic),该肽模拟体具有腈水解酶活性。本发明提供了一种密码子最优化的多肽或其片段,该片段具有腈水解酶活性,其中密码子使用被最优化,以适合特定生物或细胞。Narum等人Infect.Immun.2001年12月,69(12):7250-3描述了小鼠系统中的密码子最优化。Outchkourov等人ProteinExpr.Purif.2002年2月;24(1):18-24描述了酵母系统中的密码子最优化。Feng等人Biochemistry2000年12月19,39(50):15399-409描述了大肠杆菌(E.coli)中的密码子最优化。Humphreys等人ProteinExpr.Purif.2000年11月,20(2):252-64描述了密码子使用如何影响大肠杆菌中的分泌作用。
一方面,生物体或细胞包括革兰氏阴性细菌、革兰氏阳性细菌或真核生物。在本发明的另一个方面,革兰氏阴性细菌包括大肠杆菌(Escherichiacoli)或荧光假单胞菌(Pseudomonasfluorescens)。在本发明的另一个方面,革兰氏阳性细菌包括戴弗萨链霉菌(Streptomycesdiversa)、加氏乳杆菌(Lactobacillusgasseri)、乳酸乳球菌(Lactococcuslactis)、乳酸乳球菌乳脂亚种(Lactococcuscremoris)或枯草杆菌(Bacillussubtilis)。在本发明的进一步的一方面,真核生物包括酿酒酵母(Saccharomycescerevisiae)、非洲粟酒裂殖酵母(Schizosaccharomycepombe)、巴斯德毕赤酵母(Pichiapastoris)、乳酸克鲁维酵母(Kluyveromyceslactis)、Hansenulaplymorpha或黑曲霉(Aspergillusniger)。
另一方面,本发明提供了一种纯化抗体,该抗体与本发明的多肽或其具有腈水解酶活性的片段特定地结合。一方面,本发明提供了一个抗体片段,该抗体片段与具有腈水解酶活性的多肽特定地结合。
本发明提供了一种酶制剂,该酶制剂包括至少一种本发明的多肽,其中所述制剂是液体或干燥的。该酶制剂包括缓冲剂、辅因子或第二或额外的蛋白质。一方面,该制剂被固定在固体载体上。在本发明的一方面,该固体载体可以是凝胶、树脂、聚合物、陶瓷制品、玻璃、微电极及其任意组合。另一方面,该制剂可以被封装在凝胶或珠子中。
本发明进一步提供了一种组合物,该组合物包括至少一种本发明的核酸,所述核酸包括至少一种本发明的多肽或其具有腈水解酶的片段,或其肽模拟体,或其任意组合。
本发明提供了一种方法,用于将腈水解为羧酸,包括将该分子在适合腈水解酶活性的条件下与至少一种本发明的多肽或其具有腈水解酶活性的片段,或其肽模拟体接触。一方面,所述条件包括含水条件。另一方面,所述条件包括pH为大约8.0,和/或温度为大约37℃到大约45℃。
本发明提供了一种方法,用于水解一个分子的羟腈部分(cyanohydrinmoiety)或氨基腈部分(aminonitrilemoiety),所述方法包括在适合腈水解酶活性的条件下将该分子与本发明的至少一种多肽,或其具有腈水解酶活性的片段,或其肽模拟体接触。
本发明提供了一种方法,用于产生手性α-羟基酸分子、手性氨基酸分子、手性β-羟基酸分子、或手性γ-羟基酸分子,所述方法包括将具有羟腈部分或氨基腈部分的分子与至少一种具有对映体选择性的腈水解酶活性的多肽混和,所述多肽具有一个氨基酸序列,该序列与B组氨基酸序列或其片段具有至少50%的同一性,或其肽模拟体。一方面,手性分子是(R)-对映异构体。另一方面,手性分子是(S)-对映异构体。在本发明的一方面,特定酶可以对特定底物具有R-特异性,并且该酶可以对不同特定底物具有S-特异性。
本发明也提供了一种方法,用于产生组合物或其中间体,该方法包括将该组合物或中间体的前体与本发明的至少一种多肽,或其具有腈水解酶活性的片段或肽模拟体混和,其中所述前体包括羟腈部分或氨基腈部分;水解前体中的羟腈部分或氨基腈部分,从而制备其组合物或中间体。一方面,该组合物或中间体包括(S)-2-氨基-4-苯基丁酸。在进一步的一方面,其组合物或中间体包括L-氨基酸。在进一步的一方面,该组合物包括一种食品添加剂或药用药物。
本发明提供了一种方法,用于产生(R)-乙基-4-氰基-3-羟基丁酸,该方法包括将羟基戊二酰基腈与至少一种多肽,或其具有腈水解酶活性的片段或肽模拟体接触,选择性地产生(R)-对映异构体,从而制备(R)-乙基-4-氰基-3-羟基丁酸,所述多肽具有一个B组氨基酸序列的氨基酸序列。一方面,效率(ee)是至少95%或至少99%。另一方面,羟基戊二酰基腈包括1,3-二-氰基-2-羟基-丙烷或3-羟基戊二酰基腈。在进一步的一方面,多肽具有B组氨基酸序列的任意一个中的一个氨基酸序列,或其具有腈水解酶活性的片段或肽模拟体。
本发明也提供了一种方法,用于产生(S)-乙基-4-氰基-3-羟基丁酸,该方法包括将羟基戊二酰基腈与至少一种多肽,或其具有腈水解酶活性的片段或肽模拟体接触,选择性地产生(S)-对映异构体,从而产生(S)-乙基-4-氰基-3-羟基丁酸,所述多肽具有B组氨基酸序列的一个氨基酸序列。
本发明提供了一种方法,用于产生(R)-扁桃酸,该方法包括将扁桃腈与至少一种多肽,或其具有适当腈水解酶活性的任意片段或肽模拟体混和,所述多肽具有B组氨基酸序列的任意一个氨基酸序列。一方面,(R)-扁桃酸包括(R)-2-氯扁桃酸。另一方面,(R)-扁桃酸包括在邻-、间-或对-位的一个芳香环取代;(R)-扁桃酸的1-萘基衍生物,(R)-扁桃酸的吡啶基衍生物,或(R)-扁桃酸的噻吩基衍生物,或其任意组合。
本发明提供了一种方法,用于产生(S)-扁桃酸,该方法包括将扁桃腈与至少一种多肽,或其具有腈水解酶活性的任意片段或肽模拟体混和,所述多肽具有B组序列的氨基酸序列。一方面,(S)-扁桃酸包括(S)-甲基苄基氰化物,扁桃腈包括(S)-甲氧基-苄基氰化物。一方面,(S)-扁桃酸包括在邻-、间-或对-位的芳香环取代;(S)-扁桃酸的1-萘基衍生物,(S)-扁桃酸的吡啶基衍生物,或(S)-扁桃酸的噻吩基衍生物,或其任意组合。
本发明也提供了一种方法,用于产生(S)-苯基乳酸衍生物或(R)-苯基乳酸衍生物,该方法包括将苯基乳腈与至少一种多肽或其任意活性片段或肽模拟体混和,选择性地产生(S)-对映异构体或(R)-对映异构体,从而产生(S)-苯基乳酸衍生物或(R)-苯基乳酸衍生物,所述多肽选自B组氨基酸序列。
本发明提供了一种方法,用于产生本发明的多肽或其片段,该方法包括(a)在允许宿主细胞产生多肽的条件下将编码多肽的核酸引入宿主细胞,和(b)回收如此所产生的多肽。
本发明提供了一种方法,用于产生编码具有腈水解酶活性的多肽的核酸变体,其中所述变体具有相对于自然发生者具有改变了的生物活性,该方法包括(a)通过如下步骤修饰核酸:(i)用一个不同的核苷酸替换一个或多个核苷酸,其中核苷酸包括天然或非天然核苷酸;(ii)缺失一个或多个核苷酸,(iii)增加一个或多个核苷酸,或(iv)其任意组合。一方面,非天然核苷酸包括肌苷。另一方面,该方法进一步包括,分析由所修饰的核酸编码的多肽的腈水解酶活性改变,从而识别编码具有改变的腈水解酶活性的多肽的修饰核酸(或者多种核酸)。一方面,步骤(a)的修饰是由如下方法实现的:PCR、易错PCR(error-pronePCR)、改组(shuffling)、寡核苷酸指导的诱变(oligonucleotide-directedmutagenesis)、装配PCR(assemblyPCR)、有性PCR诱变(sexualPCRmutagenesis)、体内诱变(invivomutagenesis)、盒式诱变(cassettemutagenesis)、递归集合诱变(recursiveensemblemutagenesis)、指数集合诱变(exponentialensemblemutagenesis)、位点特异性诱变(site-specificmutagenesis)、基因重装配(genereassembly)、基因位点饱和诱变(genesitesaturatedmutagenesis)、连接酶链式反应(ligasechainreaction)、体外诱变(invitromutagenesis)、连接酶链式反应(ligasechainreaction)、寡核苷酸合成(oligonucleotidesynthesis)、任何产生DNA的技术及其任意组合。另一方面,该方法进一步包括至少重复一次修饰步骤(a)。
本发明进一步提供了一种方法,用于从两个或更多个核酸产生多核苷酸,该方法包括:(a)识别两个或更多个核酸之间的相同区域和不同区域,其中至少一个核酸包括本发明的核酸;(b)提供一组寡核苷酸,其与所述两个或更多个核酸中的至少两个核酸在序列上相符合;和(c)用聚合酶延伸该寡核苷酸,从而产生多核苷酸。
本发明进一步提供了一种用于鉴定腈水解酶的筛选分析法,该分析方法包括:(a)提供多个核酸或多肽,包括至少一种本发明的核酸,或至少一种本发明的多肽;(b)从上述多个之中,获得将要测试腈水解酶活性的多肽候选者;(c)测试候选者的腈水解酶活性;和(d)鉴定那些是腈水解酶的多肽候选者。一方面,该方法进一步包括在测试候选者的腈水解酶活性之前,修改至少一种核酸或多肽。另一方面,步骤(c)的测试进一步包括测试包括在宿主细胞或宿主生物中的改良表达。在进一步的一方面,步骤(c)的测试进一步包括在pH值为大约3到大约12的范围内测试腈水解酶活性。在进一步的一方面,步骤(c)的测试进一步包括在pH值为大约5到大约10的范围内测试腈水解酶活性。另一方面,步骤(c)的测试进一步包括在温度为大约4℃到大约80℃的范围内测试腈水解酶活性。另一方面,步骤(c)的测试进一步包括在温度为大约4℃到大约55℃的范围内测试腈水解酶活性。另一方面,步骤(c)的测试进一步包括测试腈水解酶活性,这导致产生了对映体选择性反应产物(enantioseletivereactionproduct)。另一方面,步骤(c)的测试进一步包括测试腈水解酶活性,这导致产生了区域选择性反应产物(regio-selectivereactionproduct)。
本发明提供了在如下的方法中使用本发明的核酸,或其具有腈水解酶活性的片段或肽模拟体,该方法是被设计用来优化基因的某一方面或由该基因编码的多肽的某一方面。一方面,该方法包括将修饰引入核酸的核苷酸序列。另一方面,修饰是由如下方法引入的:PCR、易错PCR、寡核苷酸指导的诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归集合诱变、指数集合诱变、位点特异性诱变、基因重装配、基因位点饱和诱变、连接酶链式反应、体外诱变、连接酶链式反应、寡核苷酸合成、任何其它产生DNA的技术及其任意组合。在进一步的一方面,该方法可以被重复。
本发明提供了在工业方法中使用本发明的多肽,或其具有将水解酶活性的片段或肽模拟体。一方面,该方法用来产生药物组合物,该方法用来产生化学制品,该方法用来产生食品添加剂,该方法用来催化废物的分解,或该方法用来产生药物中间体。在进一步的一方面,该方法包括使用所述多肽来水解羟基戊二酰基腈底物。在进一步的一方面,该方法用来产生LIPITORTM。另一方面,所用的多肽包括一个多肽,该多肽具有序列SEQIDNO:44,196,208,210或238或其具有腈水解酶活性的片段的连续氨基酸。另一方面,该方法用来产生洗涤剂。另一方面,该方法用来产生食物产品。
本发明提供了在制备转基因生物中使用本发明的核酸,或其编码具有腈水解酶活性的多肽的片段。
本发明提供了一个试剂盒,该试剂盒包括(a)本发明的核酸,或其编码具有腈水解酶活性的多肽的片段,或(b)本发明的多肽,或其具有腈水解酶活性的片段或肽模拟体,或其组合;盒(c)一种缓冲剂。
本发明提供了一种方法,用来修饰分子,该方法包括:(a)将本发明的多肽或其具有腈水解酶活性的片段或肽模拟体与起始分子混和,以产生一种反应混合物;(b)将起始分子与多肽反应,以产生修饰的分子。
本发明提供了一种方法,用来鉴定修饰的化合物,该方法包括:(a)将本发明的多肽或其具有腈水解酶活性的片段或肽模拟体与起始化合物混和,以产生一种反应混合物,然后产生修饰的起始化合物的文库;(b)测试该文库,以确定该文库中是否存在表现出期望活性的修饰的起始化合物;(c)鉴定表现出期望活性的修饰化合物。
本发明提供了一种筛选分析法,用来分析对映体选择性转化,该方法包括:(a)提供具有两个前手性或局部对映部分的分子;(b)标记该分子的至少一个前手性或局部对映部分;(b)通过选择性催化剂修饰两个部分中的至少一个;和(c)通过质谱分析检测结果。筛选分析法可以被用来确定或监控对映体过量百分比(ee),或确定非对映体过量百分比(de)。在该分析方法中有用的一个例证性标记是重同位素或轻(liter)同位素。在该分析方法中有用的选择性催化剂可以是酶。可以采用两个部分予以标记来完成筛选分析。筛选分析法可以在两个方向进行,即从反应物到产物,以及从产物到反应物。
本发明提供了一种可机读的存储介质,其上已经存储了本发明的核酸,例如包括至少一个核苷酸序列的核酸,选自如下序列:SEQIDNO:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,93,95,97,99,101,103,105,107,109,111,113,115,117,119,121,123,125,127,129,131,133,135,137,139,141,143,145,147,149,151,153,155,157,159,161,163,165,167,169,171,173,175,177,179,181,183,185,187,189,191,193,195,197,199,201,203,205,207,209,211,213,215,217,219,221,223,225,227,229,231,233,235,237,239,241,243,245,247,249,251,253,255,257,259,261,263,265,267,269,271,273,275,277,279,281,283,285,287,289,291,293,295,297,299,301,303,305,307,309,311,313,315,317,319,321,323,325,327,329,331,333,335,337,339,341,343,345,347,349,351,353,355,357,359,361,363,365,367,369,371,373,375,377,379,381,383,385及其变体,和/或至少一个选自如下序列的氨基酸序列,SEQIDNO:2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118,120,122,124,126,128,130,132,134,136,138,140,142,144,146,148,150,152,154,156,158,160,162,164,166,168,170,172,174,176,178,180,182,184,186,188,190,192,194,196,198,200,202,204,206,208,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,240,242,244,246,248,250,252,254,256,258,260,262,264,266,268,270,272,274,276,278,280,282,284,286,288,290,292,294,296,298,300,302,304,306,308,310,312,314,316,318,320,322,324,326,328,330,332,334,336,338,340,342,344,346,348,350,352,354,356,358,360,362,364,366,368,370,372,374,376,378,380,382,384,386或其变体。
本发明提供了一种计算机系统,该系统包括一个处理器和一个数据存储设备,其中数据存储设备上已经存储了本发明的核酸,例如包括至少一个核苷酸序列的核酸,选自如下序列:SEQIDNO:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,35,37,39,41,43,45,47,49,51,53,55,57,59,61,63,65,67,69,71,73,75,77,79,81,83,85,87,89,91,93,95,97,99,101,103,105,107,109,111,113,115,117,119,121,123,125,127,129,131,133,135,137,139,141,143,145,147,149,151,153,155,157,159,161,163,165,167,169,171,173,175,177,179,181,183,185,187,189,191,193,195,197,199,201,203,205,207,209,211,213,215,217,219,221,223,225,227,229,231,233,235,237,239,241,243,245,247,249,251,253,255,257,259,261,263,265,267,269,271,273,275,277,279,281,283,285,287,289,291,293,295,297,299,301,303,305,307,309,311,313,315,317,319,321,323,325,327,329,331,333,335,337,339,341,343,345,347,349,351,353,355,357,359,361,363,365,367,369,371,373,375,377,379,381,383,385,及其变体,和/或至少一个选自如下序列的氨基酸序列,SEQIDNO:2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42,44,46,48,50,52,54,56,58,60,62,64,66,68,70,72,74,76,78,80,82,84,86,88,90,92,94,96,98,100,102,104,106,108,110,112,114,116,118,120,122,124,126,128,130,132,134,136,138,140,142,144,146,148,150,152,154,156,158,160,162,164,166,168,170,172,174,176,178,180,182,184,186,188,190,192,194,196,198,200,202,204,206,208,210,212,214,216,218,220,222,224,226,228,230,232,234,236,238,240,242,244,246,248,250,252,254,256,258,260,262,264,266,268,270,272,274,276,278,280,282,284,286,288,290,292,294,296,298,300,302,304,306,308,310,312,314,316,318,320,322,324,326,328,330,332,334,336,338,340,342,344,346,348,350,352,354,356,358,360,362,364,366,368,370,372,374,376,378,380,382,384,386或其变体。一方面,计算机系统进一步包括一个序列比较算法和一个已经存储了至少一个参考序列的数据存储设备。另一方面,序列比较算法包括识别多态性的计算机程序。
本发明提供了一种方法,用于识别序列中的特征,该方法包括:(a)将序列输入到计算机中;(b)在计算机上运行序列特征识别程序,以便在序列中识别特征;和(c)识别序列中的特征,其中所述序列包括本发明的核酸,例如包括SEQIDNO:1-386中至少一个序列的核酸,它的变体,或其任意组合。
本发明提供了一种测定方法,用于识别多肽的功能片段,该方法包括:(a)获得本发明的至少一个多肽的片段;(b)将步骤(a)的至少一个片段与具有一个羟腈部分或氨基腈部分的底物接触,条件是适合腈水解酶活性;(c)测量由步骤(b)中至少一个片段中的每一个所产生的反应产物的量;和(d)识别能产生腈水解酶反应产物的至少一个片段;从而识别多肽的功能片段。一方面,步骤(a)的片段是通过合成片段得到的。另一方面,步骤(a)的片段是通过断裂多肽获得的。
本发明提供了一种测定方法,用于识别多肽的功能变体,该方法包括:(a)获得本发明的至少一个多肽的至少一个变体;(b)将步骤(a)的至少一个变体与具有一个羟腈部分或氨基腈部分的底物接触,条件是适合腈水解酶活性;(c)测量步骤(b)的至少一个变体中的每一个所产生的反应产物的量;和(d)识别能产生腈水解酶反应产物的至少一个变体;从而识别多肽的功能变体。
附图简述
图1显示了化学反应示意图,其中立体选择性腈水解酶水解羟腈或氨基腈,以产生手性α-羟基酸或α-氨基酸。
图2图解说明了一种基于OPA(邻苯二醛)的氰化物检测分析法,用于鉴定腈水解酶活性的存在。
图3是用于检测和量化α-羟基酸的光谱系统的图例,所述检测和量化基于立体选择性乳酸脱氢酶。
图4是用于检测和量化α-氨基酸的光谱系统的图例,所述检测和量化基于立体选择性氨基酸氧化酶。
图5是一个流程图,举例说明了腈水解酶筛选方法的步骤。
图6A-6E是用于D-苯基甘氨酸的底物和产物结合的色谱特征,显示了空白样品(图6A),酶反应样品(图6B);在缓冲液中包括细胞溶解产物的阴性对照组(图6C);苯基甘氨酸的手性分析(图6D);和具有D-对映异构体的腈峰的共洗脱(图6E)。
图7A-7E说明了色谱图,其表征(R)-2-氯扁桃酸的底物和产物结合。图7A显示了缓冲液中仅有2-氯扁桃腈;图7B显示了氯扁桃酸标准。图7C的色谱图显示出现了产物,并且底物峰值表现降低。
图8A-8B举例说明了(S)-苯基乳酸的底物和产物结合的色谱特征。
图9A-9B举例说明了L-2-甲基苯基甘氨酸的底物和产物结合的色谱特征。
图10A-10C举例说明了L-叔-亮氨酸的底物和产物结合的色谱特征。
图11A-11C举例说明了(S)-2-氨基-6-羟基己酸的底物和产物结合的色谱特征。
图12A-12D举例说明了4-甲基-D-亮氨酸和4-甲基-L-亮氨酸的底物和产物结合的色谱特征。
图13A-13B举例说明了(S)-环己基扁桃酸的底物和产物结合的色谱特征。
图14A-14B举例说明与本发明的筛选分析法有关的、用于定量的两个例证性标准曲线。
图15举例说明了所选择的化合物,所述化合物可以使用本发明的酶和/或方法从腈水解酶催化的反应产生。
图16举例说明了所选择的化合物,所述化合物可以使用本发明的酶和/或方法从腈水解酶催化的反应产生。
图17举例说明了本发明的例证性腈水解酶反应。
发明详述
本发明涉及腈水解酶、编码腈水解酶的核酸,及其用途。正如此处所用,术语“腈水解酶”包括具有任意腈水解酶活性的任意多肽,例如,能将腈催化为它们的相应羧酸和氨的能力。腈水解酶具有商业用途,如作为生物催化剂用于对映体选择性的芳族和脂族氨基酸或羟基酸的合成。
腈水解酶
腈水解酶化学如下所述:
制备羟基酸的腈水解酶反应如下:
腈水解酶或
制备氨基酸的腈水解酶反应如下:
腈水解酶或
此外,在前述水解反应的每一个反应中,消耗了两个水分子,释放了一个氨分子。
有几种类型的分析方法,用来测试样品中腈水解酶活性的存在,或者用来测试特定多肽是否表现出腈水解酶活性。例如,这些分析方法可以检测由腈水解酶催化的化学反应中存在还是不存在产物或副产物。例如,腈水解酶活性的存在可以通过分别从羟腈部分或氨基腈部分中产生α-羟基酸或α-氨基酸来检测,腈水解酶活性水平可以通过测量所产生的反应产物的相对量来量化。图1显示了化学反应示意图,使用立体选择性腈水解酶以高产量产生手性α-羟基酸或α-氨基酸。起始材料是醛或亚胺,亚胺是醛与氨反应产生的。醛或亚胺与氰化氢的反应产生了相应的羟腈和氨基腈的对映异构体混合物。然后可以用立体选择性腈来立体选择性地将一个对映异构体转化为相应的α-羟基酸或α-氨基酸。图3示意性地说明了α-羟基酸的立体选择性腈水解酶依赖性产生和分光光度测定,基于α-羟基酸乳酸脱氢酶转化α-羟基酸为相应的α-酮酸,和伴随的可检测染料的氧化-还原作用。图4示意性地说明了α-氨基酸的立体选择性腈水解酶依赖性产生和分光光度测定,基于氨基酸脱氢酶转化α-氨基酸为相应的α-酮酸,和伴随的可检测染料的氧化-还原作用。
考虑在本发明的实践中使用的腈水解酶包括,那些将腈或羟腈立体选择性地水解为它们的相应酸和氨的腈水解酶。一方面,本发明的腈水解酶可以立体选择性地将腈或羟腈水解为它们的相应酸和氨。腈水解酶包括,例如本发明的腈水解酶,如那些在B组氨基酸序列中所示的腈水解酶。下边的表中所示为一些立体选择性地水解它们的底物的腈水解酶。
本发明的腈水解酶共有下述额外的特征:
(1)大约333个氨基酸到大约366个氨基酸的全长氨基酸序列,
(2)作为由大约2个亚单位到大约16个亚单位的同多聚体的集合和活性,
(3)连续氨基酸谷氨酸-赖氨酸-半胱氨酸(Glu-Lys-Cys)的催化性三联体(catalytictriad)的存在,
(4)从大约pH5到大约pH9的最适pH,和
(5)从大约0℃到大约100℃,或者从大约40℃到大约50℃的最适温度。
在新腈水解酶中的共有序列
此处公开的腈水解酶是使用生物信息学和序列比较程序研究的,收集到下述共有序列信息。在腈水解酶多肽中鉴别到三个区域的保守基序(conservedmotifs)。这相当于腈水解酶中存在的催化性三联体(E-K-C)。(H.Pace和C.Brenner(2001年1月15日)“TheNitrilaseSuperfamily:classification,structureandfunction(腈水解酶超家族:分类,结构和功能)”GenomeBiology第2卷,第1期,第1-9页。)
此处所用的缩写是用于氨基酸的传统的单字母代码:A代表丙氨酸;B代表天冬酰胺或天冬氨酸;C代表半胱氨酸;D代表天冬氨酸;E代表谷氨酸盐,谷氨酸;F代表苯基丙氨酸;G代表甘氨酸;H代表组氨酸;I代表异亮氨酸;K代表赖氨酸;L代表亮氨酸;M代表蛋氨酸;N代表天冬酰胺;P代表脯氨酸;Q代表谷氨酰胺;R代表精氨酸;S代表丝氨酸;T代表苏氨酸;V代表缬氨酸;W代表色氨酸;Y代表酪氨酸;Z代表谷氨酰胺或谷氨酸。参见L.Stryer,Biochemistry(生物化学),1988,W.H.FreemanandCompany,纽约。
在本发明的腈水解酶多肽序列中所进行的计算机序列比较,导致在每一个氨基酸序列中鉴别到这些基序:
下述残基(那些带下划线的残基)在所有被鉴别的腈水解酶中是完全保守的:第一个基序或区域中的第三个氨基酸(E代表谷氨酸);第二个基序中的第二个残基(R代表精氨酸);第二个基序中的第三个残基(K代表赖氨酸);第三个基序中的第三个残基(C代表半胱氨酸);和第三个基序中的第五个残基(E代表谷氨酸)。
在这些方框中,大写字母表示本发明的腈水解酶中的90%或更高的共有性,而小写字母表示50%或更低的共有性。斜体字母表示在本发明的腈水解酶中具有30%或更高的共有性。方框中的圆点表示非保守的残基。
在Pace和Brenner文章中,腈水解酶超家族的腈水解酶分支中的腈水解酶序列被描述为具有催化性三联体(GenomeBiology,2001,第二卷,第一期,第1-9页)。然而,本发明的腈水解酶的催化性三联体区域与先前那些在Pace和Brenner参考文献中所鉴别的催化性三联体在下述方面不同:
在第一个基序中的区别:第一个基序的第一个方框中的F在本发明腈水解酶中保守性为90%,而不是那些先前所鉴别的腈水解酶所具有的仅仅50%。第一个基序的第四个残基是一个“t”,在本发明的腈水解酶中的苏氨酸,它被发现具有50%或更高的共有性。然而,该残基被Pace和Brenner鉴别为“a”(丙氨酸)。第一个基序的最后一个残基被鉴别是“f”(苯基丙氨酸),被表明以50%或更高的共有性发生。然而,本发明的腈水解酶仅显示“f”(苯基丙氨酸),以30%的共有性发生。
在第二个基序中的区别:在本发明的腈水解酶的第二个基序的第一个方框中有一个“r”(精氨酸)。然而,Pace和Brenner共有性表明在那个位置有一个“h”(组氨酸)。第二个方框中的“R”(精氨酸)在本发明的腈水解酶中是完全保守的,然而该残基在Pace和Brenner参考文献中仅表现出90%的共有性。第二个基序的第四个方框中的“L”(亮氨酸)在90%或更高百分比的本发明的腈水解酶中是保守的。然而,Pace和Brenner腈水解酶仅仅表明该残基在50%的序列中具有保守性。同样地,第二个基序的第六个方框中的“P”(脯氨酸)在90%或更高百分比的本发明的腈水解酶中是保守的。然而,Pace和Brenner腈水解酶仅仅表明该残基在50%的序列中具有保守性。
第三个基序中的区别:第一个方框中的“L”在90%或更高百分比的本发明的腈水解酶中是保守的。然而,Pace和Brenner参考文献仅表明该残基当时显示50%。最后,本发明的腈水解酶中的第三个基序中的第六个方框当时表明组氨酸为50%。然而,Pace和Brenner参考文献表明,该位置当时表明天冬酰胺为50%。
本发明提供了一种具有腈水解酶活性的分离多肽,该多肽包括三个区域,其中第一个区域包括五个氨基酸,其中第一个区域的第一个氨基酸是F,第一个区域的第四个氨基酸是T。本发明也提供了一种具有腈水解酶活性的分离多肽,该多肽包括三个区域,其中第二个区域包括七个氨基酸,其中第二个区域的第一个氨基酸是R,其中第二个区域的第二个氨基酸是R,其中第二个区域的第六个氨基酸是P。本发明也提供了一种具有腈水解酶活性的多肽,该多肽包括三个区域,其中第三个区域包括九个氨基酸,其中第三个区域的第一个氨基酸是L,第三个区域的第六个氨基酸是H。
本发明也提供了一种具有腈水解酶活性的分离多肽,该多肽包括三个共有子序列,其中第一个共有子序列是FPETF,其中第二个共有子序列是RRKLXPT,其中第三个共有子序列是LXCWEHXXP。
本发明也提供了一种具有腈水解酶活性的分离多肽,该多肽包括三个共有子序列,其中第一个共有子序列是FPEXX,其中第二个共有子序列是XRKLXPT,其中第三个共有子序列是LXCWEXXXP。
根据本发明,提供了产生对映体纯的α-取代羧酸的方法。由本发明的方法产生的对映体纯的α-取代羧酸具有如下结构:
其中:
R1≠R2,另外R1和R2独立地是-H,取代或未取代的烷基、烯基、炔基、芳基、杂芳基、环烷基或杂环,其中所述取代基是低级烷基、羟基、烷氧基、氨基、巯基、环烷基、杂环、芳基、杂芳基、芳氧基或卤素,或任意地R1和R2是直接或非直接共价结合,以形成一个功能环部分,E是-N(RX)2或-OH,其中每一个RX独立地是-H或低级烷基。
正如此处所用,术语“烷基”指1到24个碳原子的直链或支链或环烃基,包括甲基、乙基、n-丙基、异丙基、n-丁基、异丁基、叔-丁基、n-戊基、n-己基及其类似基团。术语“低级烷基”指1个到大约6个碳原子的单价直链或支链或环基。
正如此处所用,“烯基”指具有一个或多个碳碳双键,并且具有大约2个到大约24个碳原子的直链或支链或环烃基。
正如此处所用,“炔基”指具有至少一个碳碳三键,并且具有大约2个到大约24个碳原子的直链或支链或环烃基。
正如此处所用,“环烷基”指含有大约3到大约14个碳原子的环烃基。
正如此处所用,“杂环”指具有一个或多个杂环原子(例如N,O,S,P,Se,B等等)作为环结构的一部分,并且具有大约3个到大约14个碳原子的环状基团。
正如此处所用,“芳基”指具有大约6个到大约14个碳原子的芳香基团(即具有共轭双键系统的环状基团)。
正如此处所用,关于化学基团或部分,术语“取代的”指这样的一个基团或部分进一步具有一个或多个非氢取代基。这样的取代基的实例包括,但不限于,氧(例如在酮、醛、醚或酯中)、羟基、烷氧基(低级烷基的)、氨基、硫基、巯基(低级烷基的)、环烷基、取代的环烷基、杂环、取代的杂环、芳基、取代的芳基、杂芳基、取代的杂芳基、芳氧基、取代的芳氧基、卤素、三氟甲基、氰基、硝基、硝酮基、氨基、酰氨基、-C(O)H、酰基、氧酰基、羧基、氨基甲酸酯、磺酰基、磺酰胺、硫酰基及其类似基团。
在优选的方面,由本发明的方法所产生的对映体纯的α-取代的羧酸是α-氨基酸或α-羟基酸。在一些方面,对映体纯的α-氨基酸是D-苯基丙氨酸、D-苯基甘氨酸、L-甲基苯基甘氨酸、L-叔-亮氨酸、D-丙氨酸或D-羟基正亮氨酸((S)-2-氨基-6-羟基己酸)、R-泛内酯、2-氯扁桃酸或(S)-或(R)-扁桃酸,对映体纯的α-羟基酸是(S)-环己基扁桃酸。正如此处所用,“小分子”包括分子量为至少25道尔顿的任意分子。
此处所用的术语“大约”意思是大概、粗略地、左右或某一个范围内。当术语“大约”与数字范围联合使用时,它通过扩展所罗列的数值的上界和下界修改该范围。总的来说,此处使用术语“大约”在所标明的数值的上下修改该数值,范围是上下20%(更高或更低)。
正如此处所用,单词“或者”指特定列表中的任意一个成员,也包括该列表中的成员的任意组合。
此处所用的短语“核酸”指自然发生或合成的寡核苷酸或多核苷酸,是DNA或RNA或DNA-RNA杂交体,单链或双链,有义或反义,能通过沃森-克里克碱基配对(Watson-Crickbase-pairing)杂交到一个互补核酸上。本发明的核酸也包括核苷酸类似物(例如BrdU),非磷酸二酯核苷酸间键合(例如肽核酸(PNA)或硫二酯键合)。尤其是,核酸可以包括,但不限于,DNA,RNA,cDNA,gDNA,ssDNA或dsDNA或其任意组合。在一些方面,本发明的“核酸”包括,例如编码B组氨基酸序列中所示的多肽及其变体。此处所用的短语“核酸序列”指缩写词、字母、字符或单词的连续列表,其代表核苷酸。一方面,核酸可以是“探针”,其是相对短的核酸,其长度通常少于100个核苷酸。通常,核酸探针的长度通常是从大约50个核苷酸到大约10个核苷酸。核酸的“靶区域”是被鉴定为相关的核酸中的一部分。
核酸的“编码区”是核酸的一部分,所述核酸当被置于适当调节序列的控制之下时,以序列特异性方式被转录和翻译,以产生特定多肽或蛋白质。编码区指示编码这样的多肽或蛋白质。
术语“基因”指可操作性地连接到适当调节序列上的编码区,所述调节序列能以某种方式调节多肽的表达。基因包括DNA的非转录调节区(例如启动子、增强子、阻遏子等等),编码区(开放式阅读框,ORF)的前面区域(上游区)和后面区域(下游区),以及,如果适用,个体编码区(即外显子)之间的间插序列(即内含子)。
此处所用的“多肽”指如何肽、寡肽、多肽、基因产物、表达产物或蛋白质。多肽包括连续氨基酸。术语“多肽”包括自然发生分子或合成分子。
此处,正如此处所用,术语“多肽”指通过肽键或修饰的肽键互相结合的氨基酸,例如肽等排物,可以包括除了20个由基因编码的氨基酸以外的修饰氨基酸。多肽可以用天然方法来修饰,如翻译后加工,或通过本技术领域熟知的化学修饰技术进行修饰。修饰可以在多肽中的任意位置发生,包括肽骨架、氨基酸侧链和氨基或羧基末端。应该意识到,相同类型的修饰可以在给定多肽中的几个位点以相同或可变程度存在。而且,给定多肽可以有许多种类型的修饰。这些修饰包括,但不限于,乙酰化、酰化、ADP-核糖基化、酰胺化、共价交联或环化、黄素的共价连接、血红素部分的共价连接、核苷酸或核苷酸衍生物的共价连接、脂质或脂质衍生物的共价连接、磷脂酰肌醇(phosphytidylinositol)的共价连接、二硫键形成、去甲基化、半胱氨酸或焦谷氨酸酯的形成、甲酰化、γ-羧化、糖基化、GPI锚的形成、羧基化、碘化、甲基化、十四酰基化、氧化、pergylation、蛋白酶解加工、磷酸化、异戊二烯化、外消旋作用、硒化作用(selenoylation)、硫酸盐化、转运-RNA介导的添加氨基酸到蛋白质中的作用,如精氨酰化。(参考Proteins-StructureandMolecularProperties2ndEd.,T.E.Creighton,W.H.FreemanandCompany,Ed.,AcademicPress,NewYork,pp.1-12(1983))。
正如此处所用,术语“氨基酸序列”指代表氨基酸残基的缩略语、字母、字符或单词的列表。
正如此处所用,术语“分离的”指已经从其原始环境中离开的材料。例如,在活的动物体中存在的自然发生的多核苷酸或多肽就不是分离的,但从自然体系中的一些或所有共存材料中分离的相同多核苷酸或多肽就是分离的。这样的多核苷酸可以是载体的一部分,和/或这样的多核苷酸或多肽可以是组合物的一部分,多核苷酸是分离的,其原因在于这样的载体或组合物不是其原始环境的一部分。
关于核酸,正如此处所用,术语“重组的”指核酸与一个核酸是共价连接且邻接的,在其自然环境中,这两个核酸不是邻接的。此外,正如此处所用,关于核酸群体中的特定核酸,术语“富集的”指核酸代表分子群体中的核酸数量的5%或更多。典型地,富集核酸代表分子群中的15%或更多数量的核酸。更典型地,富集核酸代表分子群中的50%、90%或更多数量的核酸。
“重组的”多肽或蛋白指重组DNA技术产生的多肽或蛋白,即由编码目标多肽或蛋白的外源重组DNA构建物所转化的细胞产生的。“合成的”多肽或蛋白是用化学合成法制备的多肽或蛋白(例如固相肽合成法)。化学肽合成法在本技术领域是已知的(例如参见Merrifield(1963),Am.Chem.Soc.85:2149-2154;Geysen等人(1984),Proc.Natl.Acad.Sci.,USA81:3998),合成试剂盒以及自动肽合成仪可以通过商业途径获得(例如CambridgeResearchBiochemicals,Cleveland,UnitedKingdom;来自AppliedBiosystems,Inc.,FosterCity,CA的Model431A合成仪)。该设备提供了即刻得到本发明的肽的途径,或者通过直接合成,或者通过合成一系列用其它已知技术可以连接的片段。
正如此处所用,关于核酸或氨基酸序列对,“同一性”指两个序列在序列内的能够比对的位置上不予变化的程度。两个给定序列之间的同一性百分比可以使用算法来计算,如BLAST(Altschul等人(1990),J.Mol.Biol.215:403-410)。参见www.ncbi.nlm.nih.gov/Education/BLASTinfo。当使用BLAST算法时,对于不超过250个核苷酸或大约80个氨基酸的序列(“短查询”),搜索参数可以如下:过滤器为关闭,打分矩阵为PAM30,字符大小为3或2,E值为1000或更高,空位成本为11,1。对于长度超过250个核苷酸或80个氨基酸残基的序列,可以使用缺省搜索参数。BLAST网站提供了在这样的情况下遵循的用于特定情况的建议。
正如此处所用,“同源性”在核苷酸序列的上下文中与“同一性”代表相同的意思。然而,关于氨基酸序列,“同源性”包括同样的氨基酸取代和保守性氨基酸取代的百分比。同源性百分比可以根据Smith和Waterman(1981),Adv.Appl.Math.2:482计算。
正如此处所用,在两个或更多个核酸序列的情形中,两个序列是“基本上同一的”,是在当使用上面所描述的已知的序列比较算法进行测量,进行比较和比对,以达到最大对应时,它们具有至少99.5%的核苷酸同一性之时。此外,为了确定序列是否是基本上同一的,编码区中的同义密码子可以被认为是同一的,原因在于遗传密码子的简并性。典型地,确定基本上同一性的区域必须至少跨过20个残基,在最通常情况下,这些序列越过至少大约25-200个残基时是基本上同一的。
正如此处所用,在两个或更多个氨基酸序列的情形中,两个序列是“基本上同一的”,是在当使用上面所描述的已知的序列比较算法进行测量,比较和比对,以达到最大对应时,它们具有至少99.5%的同一性之时。此外,为了确定序列是否是基本上同一的,如果多肽基本上保持其生物学功能,那么保守性氨基酸取代可以被认为是同一的。
“杂交”指一种过程,通过该过程,核酸链通过氢键在互补碱基处与互补链结合。杂交分析法可以是灵敏的和有选择性的,以便相关的特定序列可以被鉴别,即使在以低浓度存在的样品中也可以被鉴别。严格条件是通过盐或者甲酰胺在预杂交和杂交溶液中的浓度,或者通过杂交温度来定义的,这些条件在本技术领域是已知的。可以通过降低盐的浓度,增加甲酰胺的浓度,或者升高杂交温度来增加严格性。尤其是,正如此处所用,“严格的杂交条件”包括42℃,在50%甲酰胺,5XSSPE,0.3%SDS,和200ng/ml剪接和变性鲑精DNA,及其等价物中。上述范围和条件的变化在本技术领域是已知的。
术语“变体”是指在一个或多个核苷酸或氨基酸残基上被修饰的本发明的多核苷酸或多肽(分别地),其中被编码的多肽或多肽保持了腈水解酶活性。变体可以通过任意数量的方法产生,例如易错PCR、改组、寡核苷酸指导的诱变、装配PCR、有性PCR诱变、体内诱变、盒式诱变、递归集合诱变、指数集合诱变、位点特异性诱变、基因重装配、基因位点饱和诱变或其任意组合。
对基于已知序列产生肽模拟体的方法已经有所描述,例如在美国专利号5,631,280;5,612,895;和5,579,250。肽模拟体的用途可以包括在给定位置引入一个具有非酰胺连接的非氨基酸残基。本发明的一方面是肽模拟体,其中该化合物具有一个键、一个肽骨架或一个氨基酸成分,被用一个合适的模拟型(mimic)替换。可以是合适的氨基酸模拟型的非天然氨基酸的实例包括β-丙氨酸、L-α-氨基丁酸、L-γ-氨基丁酸、L-α-氨基异丁酸、L-ε-氨基己酸、7-氨基庚酸、L-天冬氨酸、L-谷氨酸、N-ε-Boc-N-α-CBZ-L-赖氨酸、N-ε-Boc-N-α-Fmoc-L-赖氨酸、L-蛋氨酸砜、L-正亮氨酸、L-正缬氨酸、N-α-Boc-N-δCBZ-L-鸟氨酸、N-δ-Boc-N-α-CBZ-L-鸟氨酸、Boc-p-硝基-L-苯丙氨酸、Boc-羟基脯氨酸、Boc-L-硫代脯氨酸。
正如此处所用,“小分子”包括分子量在大约20道尔顿到大约1.5千道尔顿之间的分子。
分子生物学技术,如亚克隆,是使用常规方法进行的,这些方法对本技术领域的熟练技术人员是已知的。(Sambrook,J.Fritsch,EF,Maniatis,T.(1989)分子克隆:实验室手册(第二版)(MolecularCloning:ALaboratoryMannual(2nded.),ColdSpringHarborLaboratoryPress,PlainviewNY.)。
计算机系统
在本发明的一方面,本发明的任意核酸序列和/或多肽序列可以在任何可以通过计算机阅读和访问的介质上被保存、记录和操作。正如此处所用,单词“被记录”和“被保存”指在计算机介质上保存信息的过程。本发明的另一方面是一种计算机可读的介质,其上已经存储了至少2、5、10、15或20个如SEQIDNOS:1-386中所示的核酸序列,以及与其基本上同一的序列。在进一步的一方面,另一方面是通过计算机在本发明的核酸序列或多肽序列之中和之间进行的比较,以及在本发明的序列和其它序列之中和之间进行的比较。计算机可读的介质包括磁性可读介质、光学可读介质、电子可读介质和磁性/光学介质。例如,计算机可读介质可以是硬盘、软盘、磁带、CD-ROM、数字化视频光盘(DVD)、随机存取存储器(RAM)或只读存储区(ROM),以及本技术领域熟练技术人员已知的其它类型的其它介质。
本发明的一些方面包括一些系统(例如基于因特网的系统),尤其是存储和操作此处描述的序列信息的计算机系统。正如此处所用,“计算机系统”指硬件部分、软件部分和用于分析序列的数据存储部分(或者是核酸,或者是多肽),所述序列如SEQIDNOS:1-386中的至少任意一个序列,以及与其基本上同一的序列。计算机系统通常包括一个用于处理、访问和操作序列数据的处理器。处理器可以是任意已知类型的中央处理单元,例如英特尔公司的PentiumIII,或Sun、Motorola、Compaq、AMD或国际商用机器公司(InternationalBusinessMachines)的类似处理器。
通常计算机系统是一个普通目的的系统,该系统包括处理器和用于存储数据的一个或多个内部数据存储部件,和用于检索存储在数据存储部件上的数据的一个或多个数据检索设备。
在一个特定的方面,计算机系统包括一个连接到总线上的处理器,所述总线连接到主存储器上(优选地以RAM实现),和一个或多个内部数据存储设备,如硬盘驱动器和/或其它已经存储了数据的计算机可读介质。在一些方面,计算机系统进一步包括一个或多个数据检索设备,用于读取存储在内部数据存储设备上的数据。
数据检索设备可以代表,例如软盘驱动器、高密度磁盘驱动器、磁带驱动器或能够连接到远程数据存储系统上的调制解调器(例如通过因特网)等等。在一些方面,内部数据存储设备是一个可移动的计算机可读介质,如软盘、高密度磁盘、磁带等等,包括控制逻辑和/或其上存储的数据。计算机系统可以有利地包括适当的软件或通过适当的软件被编程,所述软件用于从已经插入到数据检索设备上的数据存储部件上阅读控制逻辑和/或数据。
计算机系统包括用于向计算机用户显示输出信号的显示器。也应该注意到,计算机系统可以被连接到网络或广域网中的其它计算机系统上,以提供到计算机系统的集中式访问。在一些方面,计算机系统可以进一步包括序列比较算法。“序列比较算法”指在计算机系统上执行(本地或远程)的一个或多个程序,以便将核苷酸序列与数据存储设备上存储的其它核苷酸序列和/或化合物进行比较。
腈水解酶的用途
腈水解酶已经被鉴别为产生手性α-羟基酸的关键酶,所述α-羟基酸在精细化学工业中是有用的中间体,并且可以作为药物中间体。本发明的腈水解酶可以用于催化羟腈或氨基腈的立体选择性水解,以分别产生手性α-羟基酸和α-氨基酸。
立体选择性酶相对于化学拆分方法(chemicalresolutionmethods)提供了一个主要优点,因为它们不需要苛刻的条件并且能更好地与环境兼容。尤其相关的腈水解酶的用途是产生手性氨基酸和α-羟基酸。使用立体选择性腈水解酶,可以构建动态拆分条件,这是由于在含水条件下底物的外消旋作用。从而可以获得100%的理论产量。
本发明涉及腈水解酶,所述腈水解酶已经被发现并且从天然存在的原料中分离出来。本发明也涉及从多种和极端环境来源中演变出新颖基因和基因途径。在开发最广泛种类的可以利用的酶的努力中,DNA是从样品中直接提取的,所述样品是从地球上的不同栖息地中收集的样品。依靠这些努力,开发了世界上最大的环境基因文库的集合。通过这些文库的广泛的高通量筛选,到目前为止已经发现了192种序列独特的新腈水解酶。在本发明之前,在文献和公开数据库中已经报道了不到20种微生物来源的腈水解酶。
生物催化剂,如腈水解酶在催化活的生物体中的代谢反应中起着重要作用。此外,已经发现生物催化剂在化学工业中有用,在这些化学工业中生物催化剂可以催化许多不同的反应。在腈水解酶用途中的优点的一些实例是:它们提供了高对映的、化学的和区域选择性;它们在温和的反应条件下起作用;它们提供对产物的直接获得途径-具有最小保护措施;它们具有高催化效率;与化学催化剂相比它们产生减少的废物;它们更容易以酶或细胞的形式被固定化;它们是可回收的、可循环的,能通过分子生物学技术被操纵;它们可以在整个细胞过程中被再生;它们可以忍受有机溶剂;重要地是,它们可以被进化或最优化。此处将这些最优化的腈水解酶展示在这里,作为本发明的工作实例。
腈水解酶催化产生相应羧酸的腈部分的水解。腈的传统化学水解需要强酸或强碱和高温。然而,本发明的一个优点是,提供了在温和条件下进行这一反应的腈水解酶。可以通过具有高对映的、化学的和区域选择性的腈水解酶转化宽范围的腈底物。
腈水解酶
表1-本发明的腈水解酶的一些特征
动态动力学拆分:腈水解酶的使用允许在两个快速平衡的对映异构体之间实现区别,以便产生单一产物,是以100%的理论产量产生。腈水解酶被用于关键的羟腈或氨基腈的动态拆分,以产生对映异构体纯的α-羧酸和α-氨基酸。此处公开的最新发现的腈水解酶产生了具有>95%对映异构体过量(ee)和具有>95%产量的产物。腈水解酶在含水溶液中或在存在有机溶剂的情况下,在温和的条件下,有效地进行这一转化。
腈水解酶
快速外消旋作用α-羟基酸
腈水解酶
α-氨基酸
上面所示的这些产物也包括相对的对映异构体,尽管它们没有被显示出来。一方面,本发明提供了一种分离的核酸,所述核酸具有一个如A组核酸序列中的任意一个序列所示的序列,具有一个与其基本上同一的序列,或具有一个与其互补的序列。
另一方面,本发明提供了一种分离的核酸,包括至少20个与如A组核酸序列中所示的核苷酸序列的一部分同一的连续核苷酸,具有一个与其基本上同一的序列,或具有一个与其互补的序列。
另一方面,本发明提供了一种分离的核酸,其编码具有一个如B组氨基酸序列中所示的序列的多肽,或具有一个与其基本上同一的序列。
另一方面,本发明提供了一种一种分离的核酸,其编码一个多肽,该多肽具有至少10个与B组氨基酸序列中所示的序列的一部分同一的连续氨基酸,具有一个与其基本上同一的序列。
仍然在另一方面,本发明提供了一个基本上纯化的多肽,所述多肽包括连续氨基酸残基,其具有一个如B组氨基酸序列中所示的序列,或具有一个与其基本上同一的序列。
另一方面,本发明提供了一种分离的抗体,该抗体与本发明的多肽特定地结合。本发明也提供了该抗体的一个片段,其保留了与多肽特定地结合的能力。
另一方面,本发明提供了一种方法,用于产生具有一个如B组氨基酸序列和与其基本上同一的序列中所示的序列的多肽。该方法包括引导编码多肽的核酸进入宿主细胞,其中该核酸可操作性地连接到启动子上,以及包括在允许核酸表达的条件下培养宿主细胞。
另一方面,本发明提供了一种方法,用于从B组氨基酸序列和与其基本上同一的序列中所示的序列,产生具有至少10个连续氨基酸的多肽。该方法包括引导编码多肽的核酸进入宿主细胞,其中核酸可操作性地连接到启动子上,以及包括在允许核酸表达的条件下培养宿主细胞,从而产生多肽。
另一方面,本发明提供了一种方法,用于产生腈水解酶的变体,包括选择如A组核酸序列中所示的核酸序列,并且将序列中的一个或多个核苷酸变化为另一个核苷酸,删除该序列中的一个或多个核苷酸,或将一个或多个核苷酸加入到该序列中。
另一方面,本发明提供了用于鉴别B组氨基酸序列的功能变体的分析方法,这些功能变体保留了B组氨基酸序列的多肽的酶功能。这些分析方法包括将包括连续氨基酸残基的多肽与底物分子在允许多肽发挥作用的条件下接触,所述残基具有一个与B组氨基酸序列或其部分的序列同一的序列,具有一个与B组氨基酸序列或其部分的序列基本上同一的序列,或具有一个是B组氨基酸序列的一个序列变体的序列,该变体保留了腈水解酶活性;检测底物水平的降低,或者多肽和底物之间反应的特定反应产物水平的增加;从而鉴别这些序列的功能变体。
本发明所述多肽的修饰
酶是高度选择性催化剂。它们的特点是催化具有精美的立体-选择性、区域-选择性和化学-选择性的反应,这一特点是传统合成化学方法所无法匹敌的。而且,这些酶是显著多用途的。它们可以被改装,以便在有机溶剂中发挥作用,在极端pH(例如酸性或碱性条件)、极端温度(例如高温和低温)、极端盐度水平(例如高盐度和低盐度)下操作,并且催化与它们的天然的、生理学底物在结构上没有关系的化合物的反应,但是在酶活性位点上无关的化合物除外。
本发明提供了一些方法,用于修饰具有腈水解酶活性的多肽,或编码这些多肽的多核苷酸,以便获得新颖多肽,所述新颖多肽保留了腈水解酶活性,但一些期望特征有所改进。这些改进可以包括:在有机溶剂中发挥作用的能力(即表现出腈水解酶活性),在极度或非典型pH下操作,在极端或非典型温度下操作,在极端或非典型盐度水平下操作,催化与不同底物的反应,等等。
本发明涉及使用腈水解酶以便利用这些酶的独特的催化特征的方法。尽管在化学转化中使用生物催化剂(即纯化或粗酶)通常需要鉴别与特定起始化合物反应的特定生物催化剂,但本发明使用了选择的生物催化剂和反应条件,它们对于许多起始化合物中存在的官能基团是特异的。每一种生物催化剂对于一种官能基团或者与其相关的官能基团是特异的,能与含有这一官能基团的许多起始化合物反应。
酶在起始化合物内的特定位点反应,而不影响分子的其余部分,这是一个用传统化学方法很难实现的过程。这一高度特异性提供了在化合物文库内鉴别单一活性化合物的方法。该文库的特征在于用于产生该文库的生物催化反应系列,即所谓的“生物合成历史(biosynthetichistory)”。筛选文库的生物学活性和跟踪生物合成历史鉴别产生活性化合物的特定反应序列。重复反应序列,并且确定合成的化合物的结构。不像其它合成和筛选方法,这种鉴别模式不需要固定化技术,并且几乎可以使用任何类型的筛选分析法,不需要溶液就可以合成和测试化合物。重要的是应该注意到,酶在官能基团反应的高度特异性允许“跟踪”形成生物催化产生的文库的特定酶反应。(关于分子的修饰的进一步教导,包括小分子,参见PCT申请号PCT/US94/09174,此处完整地引入作为参考)。
在一个例证中,本发明提供了相关腈水解酶基因家族,和它们的相关产物的编码家族的嵌合化作用(chimerization)。从而根据本发明的一方面,多个腈水解酶核酸的序列(例如A组核酸序列)作为腈水解酶“模板”,是用序列比较算法,如上面所描述的那些算法,进行比对的。然后,在比对的模板序列中,确定一个或多个分界点,这些分界点位于一个或多个同源区域。可以用这些分界点来勾画核酸结构单元(nucleicacidbuildingblocks)的边界,这些核酸结构单元被用来产生嵌合腈水解酶。因此,在腈水解酶模板分子中确定和选择的分界点作为嵌合腈水解酶分子装配中的潜在嵌合化作用点。
通常,有用的分界点是至少两个祖先模板之间的局部同一性区域,但优选地,分界点是由至少一半的模板,至少三分之二的模板,至少四分之三的模板,或几乎所有的模板共有的同一性区域。
然后,由分界点定义的结构单元,可以被混和(或者照字面意思在溶液中,或者理论上在纸上或计算机中),重装配以形成嵌合腈水解酶基因。一方面,基因重装配过程被彻底地进行,以便产生所有可能组合的完备文库。换句话说,在最终嵌合的核酸分子集合中,表达了核酸结构单元的所有可能的有序组合。然而,同时,设计每一组合中5’到3’方向上的每一结构单元的装配次序,以反映模板中的次序,并且降低不需要的、不可操作的产品的产生。
在一些方面,基因装配过程被系统地进行,以便产生区室化文库(compartmentalizedlibrary),所述区室化文库具有可以被系统地筛选的区室,例如逐个地筛选。换句话说,本发明提供了,通过有选择性地和明智地使用特定核酸结构单元,与有选择性地和明智地使用有序的分段装配反应相结合,可以在几个反应容器中的每一个中产生嵌合产物的特定集合情况下实现实验设计。这允许进行系统的检查和筛选程序。因此,这允许对潜在地非常大数量的嵌合分子在较小的小组中进行系统地检查。
在一些方面,产生或重装配结构单元的步骤的合成性质允许核苷酸序列的设计和引入(例如密码子或内含子或调节序列),随后这些核苷酸序列在体外过程(例如通过突变)或体内过程中(例如通过使用宿主生物体的基因剪接能力)能被任选地去除。引入这些核苷酸可能是有好处的,原因有很多,包括产生有用的分界点的潜在益处。
本发明的合成基因在组装方法使用了多个核酸结构单元,每一个结构单元有两个可连接末端。每一个核酸结构单元上的两个可连接末端的一些实例包括,但不限于,两个钝末端,或一个钝末端和一个粘末端,或两个粘末端。在一个进一步的非限定性实例中,粘末端可能包括一个碱基对,两个碱基对,三个碱基对,四个碱基对或更多碱基对。
双链核酸结构单元的大小是可以变化的。结构单元的优选大小范围在从大约1个碱基对(bp)(不包括任何粘末端)到大约100,000个碱基对(不包括任何粘末端)。也提供了其它优选的大小范围,其下限为大约1bp到大约10,000bp(包括其中的每一个整数数值),上限为大约2bp到大约100,000bp(包括其中的每一个整数数值)。
根据一个方面,产生了一个双链核酸结构单元,方法是首先产生两个单链核酸,允许它们退火从而形成双链核酸结构单元。双链核酸结构单元的两个链在除形成粘末端的任何核苷酸之外的每一个核苷酸上可以是互补的;这样除任何粘末端之外不会出现错配。可以选择地,双链核酸结构单元的两个链在少于除任何粘末端之外的每一个核苷酸的少数核苷酸上可以是互补的。尤其是,这些链之间的错配可以被用来引导密码子简并,使用的方法是,如此处描述的位点饱和诱变。
核苷酸的体内改组在提供变体中也是有用的,可以使用细胞的自然特性来进行,以重组多聚体。当体内重组已经提供了达到分子多样性的主要自然途径时,基因重组保持了相对复杂的过程,提供了(1)同源性的识别;(2)链分裂、链侵入和代谢步骤,导致产生重组交叉;和最后地,(3)交叉分解为离散的重组分子。交叉的形成需要识别同源序列。
因此,本发明包括一种方法,用于从至少第一个多核苷酸和第二个多核苷酸体内产生嵌合或重组多核苷酸。本发明可以被用来产生重组多核苷酸,通过引导至少第一个多核苷酸和第二个多核苷酸进入适当的宿主细胞,其中所述第一个多核苷酸和第二个多核苷酸共有具有部分序列同源性的至少一个区域(例如A组核酸序列,及其组合)。部分序列同源性区域促进了导致产生重组多核苷酸的序列再组织的过程。这样的杂交多核苷酸可以从分子间重组事件产生,这些事件促进了DNA分子之间的序列整合。此外,这样的杂交多核苷酸可以从分子内还原重配过程产生,这些过程使用重复序列来改变DNA分子内部的核苷酸序列。
本发明提供了一种方式,用于产生编码生物活性变体多肽(例如腈水解酶变体)的重组多核苷酸。例如,多核苷酸可以编码来自某种微生物的特定酶。由来自一种生物体的第一种多核苷酸编码的酶可以,例如在特定环境条件下有效地发挥作用,例如高盐度条件下。由来自另一种生物体的第二种多核苷酸编码的酶可以在另一种环境条件下有效地发挥作用,例如极度高温条件下。含有来自第一种和第二种原始多核苷酸的序列的重组多核苷酸编码变体酶,该变体酶表现出由原始多核苷酸编码的两种酶的特征。因此,由重组多核苷酸编码的酶可以在环境条件下有效地发挥作用,所述环境条件为由第一种和第二种多核苷酸编码的每一种酶共有的条件,例如高盐度和极高温。
变体多肽可以表现出原始酶中没有显示出的特定的酶活性。例如,在编码腈水解酶活性的多核苷酸的重组和/或还原重配,可以对所产生的由重组多核苷酸编码的变体多肽进行筛选,以筛选从原始酶的每一种获得的特定腈水解酶活性,即腈水解酶发挥作用的温度或pH。原始多核苷酸的来源可以从个体生物体(“分离物”)分离,从收集的已经在已知成分培养基中生长的生物体(“富集培养物”)分离,或者从未培养的生物体(“环境样品”)分离。使用不依赖培养基的方法来获得来自环境样品的编码新颖生物活性的多核苷酸是最优选的,原因是该方法允许人们使用具有生物多样性的未利用资源。制备多核苷酸的微生物体包括原核微生物,如黄色杆菌属(Xanthobacter)、真细菌(Eubacteria)和古细菌(Archaebacteria),和低级真核微生物,如真菌、一些藻类和原生动物。多核苷酸可以从环境样品分离,在这种情况下可以不培养生物体来回收核酸,或者从一个或多个培养的生物体中回收核酸。在一个方面,这样的微生物可以是极端条件生物(extremophiles),如超嗜热菌(hyperthermophiles),嗜冷微生物(psychrophiles),冷育微生物(psychrotrophs),喜盐植物、嗜压生物和嗜酸菌。编码从极端条件微生物分离的酶的多核苷酸是尤其优选的。这样的酶可以在如下条件下发挥作用,在温度高于100℃的陆地温泉和深海热出口,在温度低于0℃的北极水域中,在饱和盐环境的死海中,在pH值大约为0的煤沉淀物中和富硫的地热温泉中,或者在pH值大于11的污水污泥中。
可以被用来表达重组蛋白的哺乳动物表达系统的实例包括,COS-7、C127、3T3、CHO、HeLa和BHK细胞系。哺乳动物表达载体包括复制起点、适当的启动子和增强子,也包括任何必须的核糖体结合位点、聚腺苷酸位点、剪接供体和受体位点、转录终止序列和5’侧翼非转录序列。来自SV40剪接和聚腺苷酸位点的DNA序列可以被用来提供所需的非转录遗传元件。此处完整地引入美国专利号6,054,267作为参考。
含有相关多核苷酸的宿主细胞可以在传统的营养基中培养,这些传统营养培养基被修饰,以适合激活启动子、选择转化体或扩增基因。培养条件是先前选择用于表达的宿主细胞所使用的,如温度和pH等等,这些条件对于普通的熟练技术人员是显而易见的。然后,对被鉴别出具有期望的酶活性或其它特性的克隆进行测序,以识别编码具有期望活性或特性的酶的重组多核苷酸序列。
在一个方面,本发明提供了分离的腈水解酶,或者作为分离的核酸,或者作为分离的多肽,其中核酸或多肽是通过从DNA群体回收DNA,并且用回收的DNA转化宿主而制备的,从而产生用来筛选特定蛋白如腈水解酶活性的克隆文库,所述DNA群体来源于至少一种未培养的微生物。美国专利号6,280,926,Short提供了对这些方法的描述,此处将其完整地引入,其全部目的是作为参考。
因此,在一个方面,本发明涉及一种方法,用于产生生物活性的重组腈水解酶多肽,并且筛选具有期望活性或特性的这样的多肽,步骤如下:
1)引导至少第一种腈水解酶多核苷酸和第二种腈水解酶多核苷酸进入适当的宿主细胞,所述至少第一种腈水解酶多核苷酸和第二种腈水解酶多核苷酸共有至少一个序列同源性区域;
2)培养宿主细胞,条件是能促进导致重组腈水解酶多核苷酸的序列再组织;
3)表达由重组腈水解酶多核苷酸所编码的重组腈水解酶多肽;
4)筛选具有期望活性或特性的重组腈水解酶多肽;
5)分离编码重组腈水解酶多肽的重组腈水解酶多核苷酸。
可以使用的载体的实例包括病毒颗粒、杆状病毒、噬菌体、质粒、噬菌粒、粘粒、fosmid、细菌人工染色体、病毒DNA(例如牛痘病毒、腺病毒、禽痘病毒、假狂犬病和SV40的衍生物),基于P1的人工染色体、酵母质粒、酵母人工染色体和对相关宿主特异的任何其它载体(例如杆菌属(Bacillus)、曲霉菌(Aspergillus)和酵母)。大量合适的载体对本技术领域的普通技术人员是已知的,并且可以通过商业途径获得。细菌载体的实例包括pQE载体(Qiagen,Valencia,CA);pBluescript质粒、pNH载体和λ-ZAP载体(Stratagene,LaJolla,CA);和pTRC99a、pKK223-3、pDR540和pRIT2T载体(Pharmacia,Peapack,NJ)。真核载体的实例包括pXT1和pSG5载体(Stratagene,LaJolla,CA);和pSVK3、pBPV、pMSG和pSVLSV40载体(Pharmacia,Peapack,NJ)。然而,也可以使用任何其它质粒或其它载体,只要它们是可以复制的,并且可以在宿主中存活。
在本发明中使用的一种优选类型的载体含有f-因子(或致育因子)复制起点。大肠杆菌中的f-因子是质粒,该质粒能影响其本身在接合过程中的高频转移,和其本身的细菌染色体的低频转移。尤其优选的一个方面是使用被称作“fosmid”的克隆载体或细菌人工染色体(BAC)载体。这些是从大肠杆菌f-因子得到的,能稳定地整合大的基因组DNA片段。
表达载体中的DNA序列可操作性地连接到适当地表达控制序列上,包括启动子,以指导RNA合成。有用地细菌启动子包括lacI、lacZ、T3、T7、gpt、λPR、PL和trp。有用的真核启动子包括CMV立即早期启动子、HSV胸苷激酶、早期和晚期SV40、来自逆转录酶病毒的LTR和小鼠金属硫蛋白-I。适当载体和启动子的选择在本技术领域的普通技术人员的水平内。表达载体也含有翻译起始和转录终止子的核糖体结合位点。载体也包括用于扩增表达的适当序列。可以使用CAT(氯霉素转移酶)载体或具有选择性标记物的其它载体从任何期望的基因选择启动子区域。
此外,表达载体可以含有一个或多个选择性标记基因,以提供选择转化宿主细胞的表型特性。有用的选择性标记物包括对真核细胞培养物具有抗性的二氢叶酸还原酶或新霉素,或对大肠杆菌中有抗性的四环素或氨卡青霉素。
可以使用多种技术将载体引入宿主细胞,包括转化、转染、转导、病毒感染、基因枪或Ti介导的基因转移。特定方法包括磷酸钙转染、DEAE-葡聚糖介导的转染、脂质转染、或电穿孔。
还原重配-在其它方面,变体腈水解酶多核苷酸可以通过还原重配过程产生。尽管重组是一个“分子间”过程,该过程在细菌中通常被看作是“recA依赖的”现象,还原重配的过程通过“分子内”不依赖recA的过程发生。在这个方面,本发明依赖于细胞介导还原过程的能力,以通过删除降低细胞中的准重复序列的复杂性。该方法包括产生含有连续重复或准重复序列(原始编码序列)的构建物,将这些序列插入到适当的载体中,随后将载体引入适当的宿主细胞中。个体分子同一性的重配通过拥有构建物的同源性区域中的连续序列之间,或准重复单元之间的组合过程产生。重配过程重组和/或降低重复序列的复杂性或程度,并且导致产生新颖的分子种类。可以使用多种处理来增加重配率,如紫外线光或DNA损伤化学药品。此外,可以使用显示出增强水平的“遗传不稳定性”的宿主细胞系。
重复序列-重复或“准重复”序列在遗传不稳定性中起着重要作用。在本发明中,“准重复”是结构上不完全相同的重复,但代表一组具有高度相似性或同一性序列的连续序列。细胞中的还原重配或删除过程通过删除准重复序列内的位置之间的序列降低了所获得的构建物的复杂性。因为删除(和潜在地插入)事件可以事实上在准重复序列内的任何地方发生,所以这些序列提供了潜在变体的大量的全部组成成分。
当准重复序列被完全以相同方向连接时,例如头-到-尾连接或相反,对于大部分而言,删除的端点在准重复序列内的任何地方等概率地发生。相反,当这些单元以头-到-头或尾-到-尾存在时,所插入的准重复序列可以形成双链体,该双链体描绘了邻接单元的端点,从而有助于删除不连续的单元。因此,在本发明中优选的是准重复序列以相同方向被连接,这是因为准重复序列的随机方向导致重配效率的损失,而序列的一致方向将提供最高的效率。但是,尽管在相同方向具有较少的邻接序列降低了效率或还原重配,仍然可以为有效回收新颖分子提供足够的变化。
可以使用多种方法中的任意一种方法将序列以头-到-尾方向装配,包括如下:
a)可以使用引物,包括聚腺苷酸头和聚胸腺嘧啶核苷酸尾,当产生单链时,聚腺苷酸头和聚胸腺嘧啶核苷酸尾可以提供方向。这是通过具有从RNA产生的引物的最初少数几个碱基实现的,因此容易通过RNAseH去除。
b)可以使用引物,包括独特的限制性切割位点。需要多个位点、一组独特的序列、重复合成和连接步骤。
c)引物的内部少数几个碱基可以被硫醇化,核酸外切酶用来适当地产生有尾分子。
重配序列的恢复依赖于鉴别具有降低的重复指数(RI)的克隆载体。然后通过扩增恢复重配编码序列。再克隆和表达产物。具有降低的RI的克隆载体的回收,可以通过如下几点来实现:
1)使用仅仅当构建物的复杂性降低时能稳定地维持的载体。
2)通过物理方法物理回收缩短的载体。在这种情况下,将使用标准质粒分离方法回收克隆载体,然后使用标准方法对克隆载体进行大小分级(例如具有低分子量截断值的琼脂糖凝胶或柱)。
3)当插入物大小降低时,可以选择含有间断基因的载体予以回收。
4)使用直接选择技术,其中使用表达载体且进行适当的选择。
来自相关生物体的编码序列可能会展示出高度同源性,但编码变化相当多的蛋白质产物。这些类型的序列在本发明中作为准重复序列尤其有用。然而,虽然下面阐明的实例证实了具有高度同一性的编码序列(准重复)的重配,该过程不限于几乎同一的重复物。
下述实例举例说明了本发明的一个方法。获得了来自三个不同种类的准重复编码序列。每一序列编码具有一组独特特性的蛋白。这些序列中的每一个在序列中的独特位置上的一个或多个碱基对上不同,被称作“A”、“B”和“C”。准重复序列被独立地或共同地扩增并连接到随机组装物中,这样可以在连接分子群体中得到全部连接分子的所有可能的排列和组合。准重复单元的数量通过装配条件来控制。构建物中准重复单元的平均数量被定义为重复指数(repetitiveindex,RI)。
一旦形成,构建物可以根据已出版的规程,在琼脂糖凝胶上进行大小分级,被插入到克隆载体中,转染到适当的宿主细胞中。然后这些细胞被繁殖以允许还原重配的发生。如果期望,还原重配过程的速度可以通过引入DNA损伤来刺激。RI的降低是通过“分子内”机制,通过重复序列之间的缺失形成来介导的,或者是通过“分子间”机制,通过重组事件来介导的,是无关紧要的。最终的结果是分子重配到所有可能的组合中。
在另一个方面,在重组或重配之前或过程中,本方面的多核苷酸或由此处描述的方法产生的多核苷酸可以经受能促进将突变引入原始多核苷酸中的试剂或方法。引入这样的突变将增加所得到的杂交多核苷酸和由其编码的多肽的多样性。可以促进诱变的试剂或方法包括,但不限于:(+)-CC-1065,或合成类似物如(+)-CC-1065-(N3-腺嘌呤)(Sun等人,(1992),Biochemistry31(10):2822-9);能抑制DNA合成的N-乙酰或去乙酰4’-氟-氨基联苯加合物(例如参见vandePoll等人(1992),Carcinogenesis13(5):751-8);或能抑制DNA合成的N-乙酰或去乙酰4-氨基联苯加合物(同样参见VandePoll等人(1992),同上);三价铬,三价铬盐,能抑制DNA复制的多环芳烃(“PAH”)DNA加合物,如7-溴甲基-苯并蒽(“BMA”),三(2,3-二溴丙基)磷酸盐(“Tris-BP”),1,2-二溴-3-氯丙烷(“DBCP”),2-溴丙烯醛(2BA),苯并芘-7,8-,二氢二醇-9-10-环氧化物(“BPDE”),铂(II)卤素盐,N-羟基-2-氨基-3-甲基咪唑[4,5-f]-喹啉(“N-羟基-IO”),和N-羟基-2-氨基-1-甲基-6-苯基咪唑[4,5-f]-嘧啶(“N-羟基-PhIP”)。减缓或停止PCR扩增的尤其优选的方法包括UV光(+)-CC-1065-和(+)-CC-1065-(N3-腺嘌呤)。特别包括的方法是DNA加合物或含有来自多核苷酸或多核苷酸集合体的DNA加合物的多核苷酸,它们可以通过一种方法来释放或去除,该方法包括在进一步处理之前加热含有该多核苷酸的溶液。
GSSM TM -本发明也提供了使用含有简并N,N,G/T序列的密码子引物,将点突变引入多核苷酸,以产生一组后代多肽,其中在每一氨基酸位置表示了全部范围的单一氨基酸取代,该方法被称作基因位点饱和诱变(GSSMTM)。所用的寡核苷邻接地包括第一个同源序列,一个简并N,N,G/T序列,和可能的第二个同源序列。从使用这样的寡核苷酸得到的后代翻译产物包括沿着多肽的每一氨基酸位点的所有可能的氨基酸变化,这是因为N,N,G/T序列的简并性包括所有20个氨基酸的密码子。
在一个方面,用一个这样的简并寡核苷酸(包括一个简并N,N,G/T盒子)使亲代多核苷酸模板中的每一个原始密码子经受全部范围的密码子取代。在另一个方面,使用至少两个简并N,N,G/T盒子-或者在相同的寡核苷酸上或者不在相同的的寡核苷酸上,使亲代多核苷酸模板中的至少两个原始密码子经受全部范围的密码子取代。因此,一个寡核苷酸中可以包括不止一个N,N,G/T序列,以便在不止一个位点引入氨基酸突变。多数N,N,G/T序列可以是直接邻接的,或者是通过一个或多个其它核苷酸序列分离的。在另一个方面,可以单独或与含有N,N,G/T序列的密码子组合使用用于引入插入和删除的寡核苷酸,以便引入氨基酸插入、删除和/或取代的任何组合或排列。
在一个特定的例证中,使用含有连续N,N,G/T三联体,即简并(N,N,G/T)n序列的寡核苷酸,同时诱变两个或多个连续氨基酸位置是可能的。
在另一个方面,本方面提供了使用简并盒子,所述简并盒子的简并性低于N,N,G/T序列。例如,在一些情况下,使用仅包括一个N的简并三联体序列可能是令人期望的,其中所述N可以是三联体的第一第二或第三个位置。可以在三联体的剩余两个位置使用任何其它碱基,包括其任意组合和排列。另外,在一些情况下使用简并N,N,N三联体序列或N,N,G/C三联体序列可能是令人期望的。
然而,应该意识到,使用本发明所公开的简并三联体(如N,N,G/T或N,N,G/C)是有利的,原因有好几个。一方面,本发明提供了一种系统地且相当容易地产生完全范围的20个可能的氨基酸取代到多肽中每一个氨基酸位置的方法。因此,对于含有100个氨基酸的多肽,本发明提供了一种系统地且相当容易地产生2000个不同种类的途径(即每一位置的20个可能的氨基酸乘以100个氨基酸位置)。应该意识到,通过使用含有简并N,N,G/T或N,N,G/C三联体序列的寡核苷酸,提供了编码20个可能的氨基酸的32个个体序列。因此,在亲代多核苷酸序列使用一个这样的寡核苷酸进行饱和诱变的反应容器中,产生了编码20个不同多肽的32个不同的子代多核苷酸。相反,在定点诱变中使用非简并寡核苷酸导致每一反应容器仅仅只有一个子代多肽产物。
本发明也提供了使用非简并寡核苷酸,它们可以任选地与所公开的简并引物组合使用。应该意识到,在一些情况下,使用非简并寡核苷酸在工作多核苷酸中产生特异性点突变是有利的。这提供了一种方式,产生特异性沉默点突变,导致相应氨基酸变化的点突变,和产生终止密码子和相应的多肽片段表达的点突变。
因此,在一个方面,每一饱和诱变反应容器含有编码至少20个后代多肽分子的多核苷酸,这样在与亲代多核苷酸中诱变的密码子位置相应的特异性氨基酸位置上表达了所有20个氨基酸。从每一饱和诱变反应容器产生的32倍简并后代多肽可以进行克隆扩增(例如,使用表达载体克隆到合适的大肠杆菌宿主中),并且进行表达筛选。当通过筛选鉴别出个体后代多肽以显示有利的特性变化时(当与亲代多肽比较时),可以对其进行测序以鉴别其中所包括的相对有利的氨基酸取代。
应该意识到,一旦使用此处公开的饱和诱变诱变了亲代多肽中的每个氨基酸位置,可以在不止一个氨基酸位置鉴别出有利的氨基酸变化。可以产生一个或多个新颖后代分子,它们含有全部或部分这些有利的氨基酸取代的组合。例如,如果在多肽中的三个氨基酸位置中的每一个中鉴别出两个特异性有利的氨基酸变化,包括每一位置的三种可能性(与原始氨基酸没有变化,和两个有利变化中的每一个)和三个位置的排列。因此,总共有3×3×3或27种可能性,包括先前确定的7种可能性---6个单一点突变(即在三个位置中的每一个上有2个)和在任何位置没有变化。
仍然在另一个方面,位点饱和诱变可以连同筛选一起与改组、嵌合、重组和其它诱变过程一起使用。本发明提供了以重复方式使用任何诱变过程,包括饱和诱变。在一个例证中,任何诱变过程的重复使用是与筛选组合使用的。
因此,在一个非限定性例证中,本发明的多核苷酸和多肽可以通过饱和诱变与其它诱变过程组合使用得到,如两个或多个相关多核苷酸被引入适当的宿主细胞,从而通过重组和还原重配产生杂交多核苷酸的过程。
除了沿着基因的整个序列进行诱变之外,可以使用诱变来取代多核苷酸序列中的任意数量的碱基中的每一个碱基,其中将被诱变的碱基数量可以是大约15到大约100,000之间的每一个整数。因此,代替沿着分子的每一个位置诱变,可以对每一个或非连续数量(例如总数在大约15到大约100,000之间的子集)的碱基进行诱变。在一方面,分离的核苷酸被用来诱变沿着多核苷酸序列的每一位置或位置组。将被诱变的一组3个位置可以是一个密码子。一方面,使用含有异源盒子的诱变引物引入突变,其中异源盒子也被称作诱变盒子。例如,盒子可以具有大约1到大约500个碱基。在这样的异源盒子中的每一核苷酸位置可以是N,A,C,G,T,A/C,A/G,A/T,C/G,C/T,G/T,C/G/T,A/G/T,A/C/T,A/C/G,或E,其中E是非A,C,G或T的任何碱基。
在通常意义下,饱和诱变包括诱变欲被诱变的指定多核苷酸序列(例如,将被诱变序列的长度为大约15个到大约100,000个碱基)中的诱变盒子的完整集合(例如,每一盒子长度为大约1-500个碱基)。因此,一组突变(范围为大约1个到大约100个突变)被引入到将被诱变的每一盒子中。在应用一轮饱和诱变中,将被引入一个盒子中的突变的一个编组可以与将被引入第二个盒子的第二个编组突变不同或相同。这样的编组的例证是缺失、增加,特定密码子的编组,和特定核苷酸盒子的编组(该groupings)。
将被诱变的规定序列包括完整基因、途径、cDNA、完整的开放阅读框(ORF)、启动子、增强子、抑制子/反式激活蛋白、复制起点、内含子、操纵基因或任何多核苷酸官能基团。通常,用于这一目的的“规定序列”可以是任何多核苷酸,15个碱基多核苷酸序列,和长度在大约15个碱基到大约15,000个碱基之间的多核苷酸序列(本发明明确地指定为它们之间的每一整数)。考虑选择密码子编组,包括由简并诱变盒子编码的氨基酸类型。
在可以被引入诱变盒子的突变编组的一个特别优选的例证中,本发明特别地提供了在每一位置编码2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19和20个氨基酸的简并密码子取代(使用简并寡核苷酸),和由其编码的多肽文库。
本发明的一方面是一种分离核酸,该核酸含有A组核酸序列的一个序列,基本上与其同一的序列,与其互补的序列,或包括A组核酸序列的一个序列的至少10,15,20,25,30,35,40,50,75,100,150,200,300,400或500个连续碱基的片段。分离核酸可以包括DNA,包括cDNA、基因组DNA和合成DNA。DNA可以是双链或单链的,如果单链可以是编码链或非编码(反义)链。另外,分离核酸可以包括RNA。
正如下面更详细地所讨论的,本发明的分离核酸序列可以被用来制备B组氨基酸序列的多肽中的一个多肽,和与其基本上同一的序列,或包括B组氨基酸序列的多肽中的一个多肽的至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段,和与其基本上同一的序列。
另外,本发明的核酸序列可以使用传统技术来诱变,如定点诱变或本技术领域普通技术人员所熟知的其它技术,以便将沉默变化引入A组核酸序列和与其基本上同一的序列的多核苷酸中。正如此处所用,“沉默变化”包括,例如,不改变由多核苷酸编码的氨基酸序列的变化。为了通过引入在宿主生物体中频繁发生的密码子或密码子对,来增加由含有编码多肽的载体的宿主细胞产生的多肽的水平,这样的变化可能是令人期望的。
本发明也涉及具有核苷酸变化的多核苷酸,所述核苷酸变化导致本发明的多肽中(例如B组氨基酸序列)的氨基酸取代、插入、缺失、融合和平截。这样的核苷酸变化可以使用如下技术来引入:定点诱变、随机化学诱变、核酸外切酶III缺失和其它重组DNA技术。可选择地,这样的核苷酸变化可以是天然存在的等位基因变异体,所述等位基因变异体是通过鉴别特定地与包括如下碱基的探针杂交的核酸序列分离的:A组核酸序列和与其基本上同一的序列(或与其互补的序列)的一个序列的至少10,15,20,25,30,35,40,50,75,100,150,200,300,400或500个连续碱基,杂交条件是如此处提供的高度严格、中度严格或低度严格条件。
固定化酶固相支持体
酶、其片段和编码这些酶和片段的核酸可以被固定到固相支持体上。在工业过程中使用这些酶通常是经济的和有效的。例如,在特定化学反应中使用的酶(或其活性片段)的聚生体或混合物,可以被附着在固相支持体上,并且浸入到工艺桶中。酶反应可以发生。然后,从桶中取出固相支持体和附着在其上的酶,用于重复使用。在本发明的一个方面,分离的核酸被固定到固相支持体上。在本发明的另一个方面,固相支持体选自凝胶、树脂、聚合物、陶瓷制品、玻璃、微电极及其任意组合。
例如,在本发明中有用的固相支持体包括凝胶。凝胶的一些实例包括琼脂糖凝胶、白明胶、戊二醛、脱乙酰壳多糖处理的戊二醛、白蛋白-戊二醛、脱乙酰壳多糖-黄原胶、toyopearl凝胶(聚合物凝胶)、藻酸盐、藻酸盐-多熔素、角叉菜胶、琼脂糖、乙醛酰琼脂糖、磁性琼脂糖、葡聚糖-琼脂糖、聚(氨甲酰磺酸盐)水凝胶、BSA-PEG水凝胶、磷酸化聚乙烯醇(PVA)、单氨基乙基-N-氨基乙基(MANA)、氨基或其任意组合。
在本发明中有用的另一个固相支持体是树脂或聚合物。树脂或聚合物的一些实例包括纤维素、丙烯酰胺、尼龙、人造丝、聚酯、离子交换树脂、AMBERLITETMXAD-7、AMBERLITETMXAD-8、AMBERLITETMIRA-94、AMBERLITETMIRC-50、聚乙烯、聚丙烯酸、聚甲基丙烯酸酯或其任意组合。在本发明中有用的另一种类型的固相支持体是陶瓷制品。一些实例包括非多孔性陶瓷、多孔性陶瓷、SiO2、Al2O3。在本发明中有用的另一种类型的固相支持体是玻璃。一些实例包括非多孔性玻璃、多孔玻璃、氨丙基玻璃或其任意组合。可以使用的另一种类型的固相支持体是微电极。一个实例是聚乙烯胺涂覆的磁铁。石墨颗粒可以被用作固相支持体。固相支持体的另一个实例是细胞,如红血球。
固定化方法
有许多用于将酶或其片段或核酸固定到固相支持体上的方法,这些方法对本技术领域的普通技术人员是已知的。这些方法的一些实例包括静电小滴产生、电化学方法、通过吸附、通过共价结合、通过交联、通过化学反应或过程、通过封装、通过截留、通过藻酸钙或通过聚(2-羟乙基甲基丙烯酸)。在如下文献中描述了类似方法:MethodsinEnzymology,ImmobilizedEnzymesandCells,C卷.1987.AcademicPress.由S.P.Colowick和N.O.Kaplan编辑,第136卷;和ImmobilizationofEnzymesandCells.1997.HumanPress.由G.F.Bickerstaff编辑,Series:MethodsinBiotechnology,由J.M.Walker编辑。
探针-A组核酸序列、与其基本上同一的序列、互补序列或含有前述序列中的一个序列的至少10,15,20,25,30,35,40,50,75,100,150,200,300,400或500个连续碱基的片段的分离核酸也可以被用作探针,来确定生物样品如土壤样品,是否含有包括本发明的核酸序列的生物体,或可以得到该核酸的生物体。在这些方法中,得到了潜在地具有分离核酸的生物体的生物样品,并且从这些样品得到了核酸。将核酸与探针在允许探针与其中存在的任何互补序列特定地杂交的条件下接触。
在需要的时候,允许探针与互补序列特定地杂交的条件可以如下确定,将探针与来自样品的互补序列以及不含有互补序列的控制序列接触,所述样品已知含有互补序列。可以改变杂交条件,如杂交缓冲液的盐浓度、杂交缓冲液的甲酰胺浓度或杂交温度,以确定允许探针与互补核酸特定地杂交的条件。此处叙述了严格杂交条件。
可以通过用可检测试剂探针来检测杂交,如放射性同位素标记、荧光染料或能催化可检测产物形成的酶。使用已标记的探针来检测样品中互补核酸的存在的许多方法对本技术领域的普通技术人员是熟知的。这些方法包括Southern印迹、Northern印迹、克隆杂交方法和斑点印迹。这些方法中的每一个方法的规程在如下文献中有所提供:Ausubel等人,(1997),CurrentProtocolsinMolecularBiology,JohnWiley&Sons,Inc.,和Sambrook等人(1989),MolecularCloning:ALaboratoryManual第二版,ColdSpringHarborLaboratoryPress,此处将这些文献完整地引入作为参考。
在一个实例中,探针DNA是用特定结合对的一员(即配体)“标记”的,该对的另一员被结合到固体基质中,以便从靶物质来源容易地分离靶物质。例如,配体和特定结合对可以在每个方向选自如下:(1)抗原或半抗原和抗体或其特定结合片段;(2)生物素或亚氨基生物素和抗生物素蛋白或链霉抗生物素蛋白;(3)糖和对其特异的外源凝集素;(4)酶及其抑制剂;(5)脱辅基酶蛋白和辅因子;(6)互补同聚寡核苷酸;和(7)激素及其受体。在一个实例中,固相选自:(1)玻璃或聚合表面;(2)聚合玻珠的填充柱;和(3)磁性或顺磁性颗粒。
可以选择地,不止一个探针(其中至少一个探针能与核酸样品中存在的任何互补序列特定地杂交)可以被用于扩增反应中,以确定样品是否包括含有本发明的核酸序列的生物体(例如,从中分离核酸的生物体)。典型地,探针包括寡核苷酸。一方面,扩增反应包括PCR反应。PCR规程在Ausubel等人(1997)同上,和Sambrook等人(1989)同上中有所描述。另外,扩增可以包括连接酶链式反应,3SR,或链置换反应。(参见Barany(1991),PCRMethodsandApplication1:5-16;Fahy等人(1991),PCRMethodsandApplications1:25-33;和Walker等人(1992),NucleicAcidResearch20:1691-1696,将这些文献完整地引用于此作为参考)。
也可以在染色体步查方法中使用来自如下序列的末端附近的序列所衍生的探针:A组核酸序列和与其基本上同一的序列中所示的序列,以鉴别含有与上面所述的核酸序列邻接的基因组序列的克隆。这样的方法允许分离编码来自宿主生物体的其它蛋白的基因。
如如下序列中所示的分离核酸序列可以被用作探针来鉴别和分离相关核酸:A组核酸序列,与其基本上同一的序列,与其互补的序列,或含有前述序列中的一个序列的至少10,15,20,25,30,35,40,50,75,100,150,200,300,400或500个连续碱基的片段。在一些方面,相关核酸可以是来自生物体的cDNA或基因组DNA,从中分离核酸的生物体除外。例如,其它生物体可以是相关生物体。在一些方法中,核酸样品与探针在允许探针与相关序列特定地杂交的条件下接触。然后使用上面说明的任意一种方法来检测探针与来自相关生物体的核酸的杂交。
在核酸杂交反应中,用于获得特定严格水平的条件可以有所变化,这依赖于被杂交的核酸的性质。例如,在选择杂交类型时可以考虑核酸的长度、核酸之间的互补性数量、核苷酸序列组成(例如G-C富集与A-T富集程度)和核酸类型(例如RNA与DNA)。可以通过在低于探针的溶解温度的变化温度下进行杂交来改变严格性。溶解温度Tm是50%的靶序列与完全互补的探针杂交的温度(在已知离子强度和温度下)。对于特定探针,对严格条件进行选择使其等于Tm或比Tm低大约5℃。使用如下公式计算探针的溶解温度:
对于长度在14到70个核苷酸之间的探针,计算溶解温度(Tm)公式为:Tm=81.5+16.6(log[Na+]+0.4(组分G+C)-(600/N),其中N是探针的长度。
如果杂交是在含有甲酰胺的溶液中进行的,计算溶解温度的方程为:Tm=81.5+16.6(log[Na+]+0.4(组分G+C)-(0.63%甲酰胺)-(600/N),其中N是探针的长度。
表达文库-将本发明的多核苷酸与表达载体和适当的宿主细胞组合使用来产生表达文库。该文库允许由本发明的多核苷酸编码的多肽的体内表达。在这样的表达文库已经产生后,在通过细胞分选进行筛选之前,可以增加额外的步骤,即对这样的文库进行“生物淘选”的步骤。“生物淘选”方法是这样的一个过程,即通过筛选克隆文库中的序列特异性鉴别具有特定生物活性的克隆,所述克隆文库是通过如下步骤产生的:(i)选择性地分离来源于至少一种微生物体的靶DNA,通过使用至少一个探针DNA,该探针DNA包括编码具有特定生物活性(例如腈水解酶活性)的多肽的DNA序列的至少一部分;和(ii)任选地用分离的靶DNA转化宿主,以产生克隆文库,用于筛选特定生物活性。
探针DNA,是用于从来自至少一种微生物体的DNA中选择性地分离相关靶DNA的,可以是相对于已知活性的酶的DNA的全长编码区序列或部分编码区序列。使用探针的混合物来探测原始DNA文库,所述探针包括编码具有特定酶活性的酶的DNA序列的至少一部分。这些探针或探针文库是单链的,被探测的微生物DNA已经被转化为单链形式。特别合适的探针是那些来源于编码如下酶的DNA的探针,所述酶具有与被筛选的特定酶活性类似的活性或相同的活性。
已经从选择性地从生物体分离的DNA制备了克隆多重性,这样的克隆被筛选特定酶活性,以鉴别具有特定酶特性的克隆。
可以在个体表达克隆上影响酶活性的筛选,或者最初在表达文库的混合物上影响,以确定该混合物是否具有一种或多种特定酶活性。如果所述混合物具有特定酶活性,那么可以对个体克隆进行再次筛选,以筛选这样的酶活性或更特异的活性。因此,例如,如果克隆混合物具有腈水解酶活性,那么可以对个体克隆进行恢复和筛选,以确定这些克隆中的哪一个克隆具有腈水解酶活性。
正如对于上面的一个方面的描述,本发明提供了一种过程,用于含有选择的DNA的克隆的酶活性筛选,所述选择的DNA来源于微生物体,该过程包括:筛选文库,以筛选特定酶活性,所述文库包括多个克隆,所述克隆已经通过从所选择DNA的微生物体的基因组DNA中回收而产生,所述选择的DNA是通过与至少一个DNA序列杂交选择的,所述至少一个DNA序列是编码具有特定活性的酶的DNA序列的全部或一部分;和用选择的DNA转化宿主,以产生被用来筛选特定酶活性的克隆。
在一个方面,来自微生物体的DNA文库被进行一个选择程序,以从中选择DNA,该DNA与一个或多个探针DNA序列杂交,所述探针DNA序列是编码具有特定酶活性的酶的DNA序列的全部或一部分;
(a)将来自DNA文库的的单链DNA群体与结合到配体上的DNA探针在严格杂交条件下接触,以产生探针和DNA文库的一个成员之间的双链体;
(b)将双链体与配体的固相特异性结合成员接触,以产生固相复合体;
(c)从DNA文库的非双链体成员分离固相复合体;
(d)对复合体进行变性,以释放DNA文库的成员;
(e)产生来自步骤(d)的成员的互补DNA链,以使该成员形成双链DNA;
(f)将双链DNA引入适当的宿主,以表达由成员DNA编码的多肽;和
(g)确定所表达的多肽是否表现出特定酶活性。
在其它方面,该过程包括预选择,以回收包括信号或分泌序列的DNA。用这种方式,通过如上面所描述的仅仅杂交包括信号或分泌序列的DNA,从基因组DNA群体选择是可能的。下面的段落描述了本方面的这一方面的规程,分泌信号序列通常情况下的性质和功能,这些序列应用于分析或选择过程的特定的例证性应用。
在上面的步骤(a)之后但在(b)之前,这一方面的特别方面进一步包括如下步骤:
(i)将(a)的单链DNA群体与结合到配体上的寡核苷酸探针在严格杂交条件下接触,以形成双链DNA双链体,所述结合到配体上的寡核苷酸探针与对于给定的蛋白种类独特的分泌信号序列互补;
(ii)将(i)的双链体与所述配体的固相特异性结合成员接触,以产生固相复合体;
(iii)从(a)的单链DNA群体分离固相复合体;
(iv)对复合体进行变性,以释放基因组群体的单链DNA成员;
(v)从固相结合探针分离单链DNA成员。
然后,已经被选择和分离以包括信号序列的DNA被进行上面所描述的选择程序,以从中选择和分离DNA,该DNA结合到一个或多个探针DNA序列上,所述探针DNA来源于编码具有特定酶活性的酶的DNA。该程序在美国专利号6,054,267中有所描述和例证,此处将其完整地引入作为参考。
体内生物淘选可以使用基于FACS(荧光激活细胞分选仪)的仪器进行。用含有稳定转录的RNA的元件的载体构建复合基因文库。例如,内含导致二级结构如发夹结构的序列,将有助于增强它们的稳定性,从而增加它们在细胞中的半衰期,所述二级结构被设计在RNA的转录区域的侧翼。在生物淘选过程中使用的探针分子,包括用报道分子标记的寡核苷酸,该报道分子只有在探针与靶分子结合时才发出荧光。使用几种转化方法中的一种,将这些探针引入来自文库的重组细胞。探针分子结合到转录的靶mRNA上,导致DNA/RNA异源双链体分子。探针与靶物质的结合,将产生荧光信号,该信号在筛选过程中通过FACS仪器进行检测和分类。
在一些方面,编码如下序列的多肽之一的核酸以适当的相与前导序列装配,所述前导序列能指导翻译多肽或其片段的分泌,所述如下序列包括B组氨基酸序列,与其基本上同一的序列,或包括其至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。任选地,核酸可以编码融合多肽,其中如下序列的多肽之一被融合到异源肽或多肽上,如期望特性例如增强的稳定性或简化的纯化过程,异源肽或多肽例如是N-端识别肽,所述如下序列包括B组氨基酸序列,与其基本上同一的序列,或包括其至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。
宿主细胞可以是本技术领域的普通技术人员所熟悉的任何宿主细胞,包括原核细胞、真核细胞、哺乳动物细胞、昆虫细胞或植物细胞。正如适当宿主的代表性实例,可能提及到:细菌细胞,如大肠杆菌(E.coli.)、链霉菌(Streptomyces)、枯草杆菌(Bacillussubtilis)、鼠伤寒沙门氏菌(Salmonellatyphimurium)和如下属中的各种种类:假单胞菌属(Pseudomonas)、链霉菌属(Streptomyces)和葡萄球菌属(Staphylococcus),真菌细胞如酵母,昆虫细胞如果蝇S2(DrosophilaS2)和草地夜蛾Sf9(SpodopteraSf9),动物细胞如中国仓鼠卵巢细胞(CHO)、COS或黑色素瘤(Bowesmelanoma)和腺病毒。适当宿主的选择在本技术领域的普通技术人员的能力范围内。
在适当的时候,工程宿主细胞可以在传统的培养基中培养,该培养基被修饰以适合激活启动子,选择转化体或扩增本发明的基因。在合适的宿主菌株转化和宿主菌株生长到适当的细胞密度之后,可以用适当的方法(例如变温或化学诱导)诱导所选择的启动子,细胞被再次培养一段时间以允许它们产生期望的多肽或其片段。
细胞被特别地通过离心收获,通过物理或化学方法破坏,并且保留所得到的粗提取物用于进一步纯化。用于蛋白表达的微生物细胞可以通过任何传统方法来破坏,包括冻融循环、超声处理、机械破坏或使用细胞裂解试剂。这样的方法对本技术领域的普通技术人员是已知的。所表达的多肽或其片段可以通过如下方法从重组细胞培养物中回收和纯化:硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换色谱法、磷酸纤维素色谱法、疏水相互作用色谱法、亲和色谱法、羟磷灰石色谱法和外源凝集素色谱法。在必要时,在完成多肽的构型中,可以使用蛋白重折叠步骤。如果期望,可以将高效液相色谱(HPLC)用于最终的纯化步骤。
各种哺乳动物细胞培养系统也可以被用于表达重组蛋白。哺乳动物表达系统的实例包括猴肾纤维原细胞的COS-7系(由Gluzman描述(1981),Cell23:175),和其它能表达来自相容载体的蛋白的细胞系,如C127、3T3、CHO、海拉细胞(HeLa)和BHK细胞系。
本发明也涉及如下序列的多肽的变体:B组氨基酸序列,与其基本上同一的序列,或包括其至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。尤其是,这些变体可以通过如下方式在氨基酸序列上与B组氨基酸序列和与其基本上同一的序列不同,即通过一个或多个替代、增加、缺失、融合和平截,这些方式也可以以其任意组合存在。
这些变体可以是天然存在的或是体外产生的。尤其是,这样的变体可以使用基因工程技术来产生,如定点诱变、随机化学诱变、核酸外切酶III缺失方法和标准克隆技术。可以选择地,这样的变体、片段、类似物或衍生物可以使用化学合成或修饰方法来产生。
产生变体的其它方法对于本技术领域的普通技术人员是已知的。这些方法包括这样的方法,即其中从天然分离物得到的核酸序列被修饰,以产生编码多肽的核酸,所述核酸具有能增强它们在工业或实验室应用的特性。在这样的方法中,产生且表征了与来自天然分离物的序列具有一个或多个核苷酸差异的大量变体序列。典型地,这些核苷酸差异导致与由来自天然分离物的核酸编码的多肽的氨基酸变化。
易错PCR(ErrorPronePCR)
例如,可以使用易错PCR产生变体。在易错PCR中,PCR是在DNA聚合酶的拷贝保真度较低的条件下进行的,这样可以沿着PCR产物的整个长度获得较高的点突变率。易错PCR描述在Leung等人(1989),Technique1:11-15和Caldwell等人(1992),PCRMethodsApplic.2:28-33,将其公开内容完整地引用于此作为参考。简单来说,在这些方法中,将被诱变的核酸与PCR引物和试剂(例如反应缓冲液、MgCl2、MnCl2、Taq聚合酶和适当浓度的dNTP)混和,以沿着PCR产物的整个长度获得较高的点突变率。例如,可以使用将被诱变的20微微毫摩尔核酸,30皮摩尔每一种PCR引物,含有如下成分的反应缓冲液:50mMKCl、10mMTrisHCl(pH8.3)和0.01%明胶、7mMMgCl2、0.5mMMnCl2、5单位Taq聚合酶、0.2mMGTP、0.2mMdATP、1mMdCTP和1mMdTTP。PCR可以被进行30个循环:94℃1分钟,45℃1分钟,72℃1分钟。然而,应该意识到,这些参数在适当的时候可以改变。被诱变的核酸被克隆到适当的载体中,并且评价由被诱变的核酸编码的多肽的活性。
也可以使用寡核苷酸指导的诱变来产生变体,以便在相关的任何克隆DNA中产生位点特异性突变。寡核苷酸诱变描述在Reidhaar-Olson等人(1988),Science,241:53-57,将其公开内容完整地引用于此作为参考。简单来说,在这些方法中,合成了被引入克隆DNA的具有一个或多个突变的大量双链寡核苷酸,且被插入到将被诱变的克隆DNA中。回收含有诱变DNA的克隆,并且评价由它们所编码的多肽的活性。
装配PCR(AssemblyPCR)
另一种产生变体的方法是装配PCR。装配PCR涉及从小DNA片段的混合物装配PCR产物。大量不同的PCR反应在相同的小瓶中平行发生,一个反应的产物引导另一反应的产物。装配PCR描述在美国专利号5,965,408中,将其公开内容完整地引用于此作为参考。
有性PCR诱变(SexualPCRmutagenesis)
仍然,产生变体的另一个方法是有性PCR诱变。在有性PCR诱变中,由于基于序列同源性的DNA分子的随机断裂,随后是PCR反应中引物延伸的交换固定,强制同源重组在具有不同但高度相关的DNA序列的DNA分子之间体外发生。有性PCR诱变描述在Stemmer(1994),Proc.Natl.Acad.Sci.USA91:10747-10751中,将其公开内容完整地引用于此作为参考。简单来说,在这样的方法中,用DNAse消化大量将被重组的核酸,以产生平均大小为大约50-200核苷酸的片段。所需平均大小的片段被纯化,且重悬浮在PCR混合物中。PCR在有助于核酸片段之间的重组的条件下进行。例如,通过将纯化片段以10-30ng/μl的浓度重悬浮在包括如下成分的溶液中来进行:每种dNTP为0.2mM、2.2mMMgCl2、50mMKCl、10mMTrisHCl、pH9.0、和0.1%TritonX-100。每100μl反应混合物中加入2.5单位Taq聚合酶,使用如下时间段进行PCR:94℃60秒、94℃30秒、50-55℃30秒、72℃30秒(30-45次)和72℃5分钟。然而,应该意识到,这些参数在适当的时候可以变化。在一些方面,寡核苷酸可以被包括在PCR反应中。在其它方面,在第一组PCR反应中可以使用DNA聚合酶I的克列诺(Klenow)片段,在随后的PCR反应组中可以使用Taq聚合酶。分离重组序列,评价由这些重组序列所编码的多肽的活性。
体内诱变(InvivoMutagenesis)
也可以通过体内诱变产生变体。在一些情况下,通过在细菌菌株如大肠杆菌菌株中繁殖相关序列来产生相关序列中的随机突变,该菌株以一个或多个DNA修复途径进行突变。这样的“增变”菌株比野生型母体的菌株具有较高的随机突变率。在这些菌株中繁殖DNA,将最终在DNA中产生随机突变。适合在体内诱变中使用的增变菌株,描述在PCT出版物序列号WO91/16427中,将其公开内容完整地引用于此作为参考。
盒式诱变(CassetteMutagenesis)
也可以通过盒式诱变产生变体。在盒式诱变中,用与天然序列不同的合成寡核苷酸“盒子”取代双链DNA分子的一个小区域。寡核苷酸通常完全和/或部分地含有随机化的天然序列。
递归集合诱变(RecursiveEnsembleMutagenesis)
递归集合诱变也可以被用来产生变体。递归集合诱变是一种蛋白质工程(蛋白质诱变)算法,该算法是开发用来产生表型相关变体的不同群体的,所述群体的成员在氨基酸序列上不同。该方法使用回馈机制来控制组合盒式诱变的连续循环。递归集合诱变描述在Arkin等人(1992),Proc.Natl.Acad.Sci.USA,89:7811-7815中,将其公开内容完整地引用于此作为参考。
指数集合诱变(ExponentialEnsembleMutagenesis)
在一些情况下,使用指数集合诱变来产生变体。指数集合诱变是用来产生组合文库的一种方法,所述组合文库具有高百分比的独特和功能突变体,其中残基小组被平行地随机化,以便在每一改变的位置上鉴定导致功能蛋白质的氨基酸。指数集合诱变描述在Delegrave等人(1993),BiotechnologyResearch11:1548-1552,将其公开内容完整地引用于此作为参考。
随机和定点诱变(Randomandsite-directedMutagenesis)
随机和定点诱变描述在Arnold(1993),CurrentOpinionsinBiotechnology4:450-455,将其公开内容完整地引用于此作为参考。
改组方法(ShufflingProcedures)
在一些方面,使用改组方法来产生变体,其中编码不同多肽的大量核酸的部分被融合在一起,以产生编码嵌合多肽的嵌合核酸序列,正如美国专利号5,965,408和5,939,250中所描述的,将其公开内容完整地引用于此作为参考。
B组氨基酸序列的多肽的变体可以是这样的变体,其中B组氨基酸序列的多肽的一个或多个氨基酸残基被一个保守或非保守氨基酸残基(例如一个保守氨基酸残基)取代,这样取代的氨基酸残基可以由或者不由遗传密码编码。
保守取代是指多肽中的一个给定氨基酸被具有类似特性的另一个氨基酸取代。通常看作保守取代的是如下取代:一个脂族氨基酸如丙氨酸、缬氨酸、亮氨酸和异亮氨酸被另一个脂族氨基酸取代;丝氨酸被苏氨酸取代,或苏氨酸被丝氨酸取代;一个酸性残基如天冬氨酸和谷氨酸被另一个酸性残基取代;具有一个酰胺基因的残基,如天冬酰胺和谷氨酰胺,被另一个具有酰胺基团的残基取代;碱性残基如赖氨酸和精氨酸被另一个碱性残基置换;和一个芳族残基如苯丙氨酸和酪氨酸被另一个芳族残基取代。
其它变体是其中B族氨基酸序列的多肽的一个或多个氨基酸残基包括一个取代基团的变体。
仍然,其它变体是其中多肽与另一种化合物相关的变体,如增加多肽半衰期的化合物(例如聚乙二醇)。
其它变体是其中其它氨基酸被融合到多肽上的变体,如前导序列、分泌序列、前蛋白(proprotein)序列或有助于纯化、富集、或稳定多肽的序列。
在一些方面,片段、衍生物和类似物保留了与B族氨基酸序列和与其基本上同一的序列相同的生物功能或活性。在其它方面,片段、衍生物或类似物包括前蛋白,这样片段、衍生物或类似物可以通过裂解前蛋白部分以产生活性多肽来激活。
本发明的另一个方面是多肽或其片段,它们与B组氨基酸序列,与其基本上同一的序列,或包括其至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段具有至少大约85%、至少大约90%、至少大约95%、或高于大约95%的同源性。同一性百分比可以使用上面所描述的任意一种程序来确定,这些程序对比被比较的多肽或片段,并且确定氨基酸同源性的程度或它们之间的相似性。应该意识到,氨基酸“同源性”包括如上面所描述的那些保守氨基酸取代。在本发明的一个方面,片段可以被用来产生抗体。这些抗体可以被用来固定可用于工业过程中的腈水解酶。编码本发明的腈水解酶的多核苷酸可以以类似方式使用。
另外,同源的多肽或片段可以通过生物化学富集或纯化方法来获得。潜在同源的多肽或片段的序列通过蛋白酶消化、凝胶电泳和/或微量测序来确定。使用此处描述的任意一种程序将预期同源的多肽或片段的序列与如下序列的多肽之一进行比较:B组氨基酸序列,与其基本上同一的序列,或包括其至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。
本发明的另一个方面是一种分析方法,用于鉴别B组氨基酸序列或与其基本上同一的序列的变体或片段,这些变体或片段保留了与B组氨基酸序列和与其基本上同一的序列的多肽的酶功能。例如,多肽的片段或变体,可以被用来催化生物化学反应,这表明所述片段或变体保留了与B组氨基酸序列中的多肽的酶活性。
用于确定变体的片段是否保留了B组氨基酸序列和与其基本上同一的序列的多肽的酶活性的分析方法包括如下步骤:将多肽片段或变体与底物分子在允许多肽片段或变体发挥作用的条件下接触;检测,或者是底物水平有所增加,或者是多肽和底物之间反应的特定反应产物水平有所增加。
B组氨基酸序列,与其基本上同一的序列,或包括其至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段的多肽可以在多种应用中使用。例如,多肽或其片段可以被用来催化生物化学反应。根据本发明的一个方面,提供了一种方法,用于使用B组氨基酸和与其基本上同一的序列的多肽,或编码这样的多肽的多核苷酸来水解氨基腈。在这样的方法中,将含有卤代烷烃化合物的物质与B组氨基酸序列和与其基本上同一的序列的多肽之一在有助于该化合物水解的条件下接触。
抗体-B组氨基酸序列,与其基本上同一的序列,或包括其至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段的多肽,也可以被用来产生与酶多肽或片段特定地结合的抗体。所得到的抗体也可以被用于免疫亲和色谱法,来分离或纯化多肽或确定生物样品中是否存在多肽。在这样的方法中,将蛋白制剂,如提取物或生物样品,与能与如下序列的多肽之一特定地结合的抗体接触:B组氨基酸,与其基本上同一的序列,或前述序列的片段。
在免疫亲和方法中,抗体被结合到固相支持体上,如小珠或柱基质。将蛋白制剂在一定的条件下与抗体接触,在这样的条件下抗体与B组氨基酸序列、与其基本上同一的序列、或其片段的多肽之一特定地结合。在以去除非特定地结合的蛋白质的洗涤之后,洗脱特定地结合的多肽。
在生物样品中蛋白与抗体结合的能力可以使用本技术领域的技术人员所熟知的多种方法中的任意一种来确定。例如,可以通过用可检测的标记物标记抗体来确定结合,如荧光试剂、酶标记物、或放射性同位素。另外,抗体与样品的结合可以使用其上具有这样的可检测标记的二次抗体来检测。特定的测定方法包括ELISA测定法、夹心测定法、放射免疫测定法和蛋白质印迹测定法。
本发明的抗体可以被结合到固相支持体上,并且可以被用来固定本发明的腈水解酶。正如上面所描述的,在工业化学方法中可以使用这样固定的腈水解酶,用于将腈转化为大范围的有用的产品和中间产物。
通过将多肽直接注射到动物或通过将多肽施用给动物,可以获得针对如下序列的多肽产生的多克隆抗体:B组氨基酸序列,与其基本上同一的序列,或包括其至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。然后,如此获得的抗体将结合多肽本身。以这种方式,即使仅仅编码多肽片段的序列也可以被用来产生能结合到整个天然多肽上的抗体。然后,这样的抗体被用来从表达该多肽的细胞中分离多肽。
为了制备单克隆抗体,可以使用能通过连续细胞系培养物产生抗体的任何技术。实例包括杂交瘤技术(Kohler和Milstein(1975),Nature,256:495-497,将其公开内容完整地引用于此作为参考),三系杂交瘤(trioma)技术、人B-细胞杂交瘤技术(Kozbor等人(1983),ImmunologyToday4:72,将其公开内容完整地引用于此作为参考),和EBV-杂交瘤技术(Cole等人(1985),在MonoclonalAntibodiesandCancerTherapy,AlanR.Liss,Inc.,第77-96页中,将其公开内容完整地引用于此作为参考)。
所描述的用于产生单链抗体的技术(美国专利号4,946,778,将其公开内容完整地引用于此作为参考)适合用来产生针对多肽的单链抗体,例如B组氨基酸序列或其片段的多肽。另外,转基因大鼠可以被用来表达针对这些多肽或片段的人源化抗体。
所产生的针对如下序列的多肽的抗体可以被用来从其它生物体和样品筛选类似多肽:B组氨基酸序列,与其基本上同一的序列,或包括其至少5,10,15,20,25,30,35,40,50,75,100或150个连续氨基酸的片段。在这样的技术中,将来自生物体的多肽与抗体接触,并且检测那些与抗体特定地结合的多肽。上面所描述的任何技术可以被用来检测抗体结合。一个这样的筛选方法描述在“MethodsforMeasuringCellulaseActivities”,MethodsinEnzymology,160:87-116,将其公开内容完整地引用于此作为参考。
使用包括核酸的全细胞
本发明提供了使用已经用编码一个或多个本发明的腈水解酶的核酸(或其活性片段)转化的全细胞。本发明也提供了在底物上进行腈水解酶的反应中使用这样的全细胞。因此,本发明提供了使用包括此处公开的至少一个核酸或多肽(SEQIDNOS:1-386)的全细胞来水解羟腈或氨基腈键合的方法。例如,用编码腈水解酶的核酸稳定地转染(本发明也包括瞬时转染或转化全细胞)的全细胞是本发明的一个方面。这样的细胞是有用的,作为反应混合物中的试剂来作用于底物,并且表现出腈水解酶活性。
序列分析软件
两个或多个序列之间的同一性或同源性百分比通常是使用序列分析软件(例如位于UniversityofWisconsinBiotechnologyCenter,Madison,WI的遗传学计算机小组的序列分析软件包)来测量的。这样的软件通过将同一性或同源性百分比分配给各种缺失、替代和其它修饰来匹配相似序列。在两个或多个核酸或多肽序列的情形中,术语“同一性百分比”指,在指定区域或比较“窗口”,按照最大对应比对之后进行比较时,相同的核苷酸或氨基酸残基的百分比。在一些算法中,保守氨基酸取代可以被认为是“同一的”,在密码子的摆动位点上的变化可以被认为是“同一的”。
“比对”指将两个或多个序列排列起来以获得最大对应的过程,目的是为了评价同一性或同源性程度,正如相关比对算法的环境中所定义的。
对于序列比较,通常一个序列作为参考序列发挥作用,将试验序列与其进行比较。当使用序列比较算法时,试验序列和参考序列被输入到计算机中,如果必要,指定子序列坐标,并且为特定算法指定序列算法程序参数。可以使用缺省程序参数,或可以指定替换性参数。然后,基于程序参数,序列比较算法计算试验序列相对于参考序列的同一性百分比或同源性百分比。
正如此处所用,“比较窗口”是核酸或氨基酸序列中连续位置的一个片段,包括20个到600个,通常大约50个到大约200个,更通常地大约100个到大约150个核苷酸或残基,在两个序列被最优化地比对后,该片段可以与具有相同或不同数量的连续位置的参考序列进行比较。进行序列比较算法的方法在本技术领域是已知的。可以进行序列的最适比对,例如通过SmithandWaterman(1981),Adv.Appl.Math.2:482的局部同源性算法,通过NeedlemanandWunsch(1970),J.Mol.Biol48:443的同源性比对算法,通过PearsonandLipman(1988),Proc.Natl.Acad.Sci.USA85:2444-24448的相似性搜索方法,通过这些算法的计算机化实施,或通过人工比对和视觉观察。确定同源性或同一性的其它算法包括,例如BLAST程序(基本局部比对搜索工具,NationalCenterforBiologicalInformation),BESTFIT,FASTA和TFASTA(位于Madison,WI的遗传学计算机小组的威斯康星遗传学软件包(WisconsinGeneticsSoftwarePackage)),ALIGN,AMAS(多重比对序列分析,AnalysisofMultiplyAlignedSequences),AMPS(多重蛋白序列分析,AlignmentofMultipleProteinSequence),ASSET(比对片段统计学评估工具,AlignedSegmentStatisticalEvaluationTool),BANDS,BESTSCOR,BIOSCAN(生物学序列比较分析节点,BiologicalSequenceComparativeAnalysisNode),BLIMPS(BlocksIMProvedSearcher),IntervalsandPoints(间隔和点),BMB,CLUSTALV,CLUSTALW,CONSENSUS,LCONSENSUS,WCONSENSUS,Smith-Waterman算法,DARWIN,LasVegas算法,FNAT(强制核苷酸比对工具,ForcedNucleotideAlignmentTool),Framealign(框架比对),Framesearch(框架搜索),DYNAMIC,FILTER,FSAP(Fristensky序列分析软件包,FristenskySequnenceAnalysisPackage),GAP(全球比对程序,GlobalAlignmentProgram),GENAL,GIBBS,GenQuest,ISSC(敏感序列比较,SensitiveSequenceComparison),LALIGN(局部序列比对,LocalSequenceAlignment),LCP(局部含量程序,LocalContentProgram),MACAW(多重比对构造和分析工作平台,MultiplealignmentConstructionandAnalysisWorkbench),MAP(多重比对程序,MultipleAlignmentProgram),MBLKP,MBLKN,PIMA(模式诱导多序列比对,Pattern-InducedMulti-sequenceAlignment),SAGA(借助遗传学算法的序列比对)SequenceAlignmentbyGeneticAlgorithm)和WHAT-IF。这些比对算法也可以被用来筛选基因组数据库,以鉴别具有基本上同一的序列的多核苷酸序列。许多基因组数据库是可以获得的,例如作为人类基因组测序计划(HumanGenomeSequencingProject)的一部分,可以获得人基因组的重要部分(J.Roach,http://weber.u.Washington.edu/~roach/human_genome_progress2.html)(Gibbs,1995)。至少二十一个其它基因组已经被测序,例如包括生殖器支原体(M.genitalium)(Fraser等人,1995),甲烷球菌(M.jannaschii)(Bult等人,1996),流感嗜血菌(H.influenzae)(Fleischmann等人,1995),大肠杆菌(E.coli)(Blattner等人,1997),和酿酒酵母(S.cerevisiae)(Mewes等人,1997),和果蝇(D.melanogaster)(Adams等人,2000)。对生物体模型的基因组进行测序也已经取得了重大进步,如小鼠、线虫(C.elegans)和拟南芥(Arabadopsissp)。几个包括基因组信息的数据库由不同的组织保存,其中注释了一些功能信息,这些数据库可以通过因特网得到,例如http://wwwtigr.org/tdbhttp://www.genetics.wisc.eduhttp://genome-www.stanford.edu/~ballhttp://hiv-web.lanl.govhttp://www.ncbi.nlm.nih.govhttp://www.ebi.ac.ukhttp://Pasteur.fr/other/biology;和http://www.genome.wi.mit.edu
有用的算法的实例是BLAST和BLAST2.0算法,分别描述在Altschul等人(1997),Nuc.AcidsRes.25:3389-3402,和Altschul等人(1990),J.Mol.Biol.215:403-410中。进行BLAST分析的软件可以通过NationalCenterforBiotechnologyInformation(http://www.ncbi.nlm.nih.gov/)公开获得。该算法包括首先通过识别查询序列中短字符的长度W来识别高得分序列对(HSPs),当与数据库序列中相同长度的字符比对时,这或者匹配或者满足一些正值阈值得分T。T指相邻字符得分阈值(Altschul等人,同上)。这些初始相邻字符命中作为寻找含有它们的较长HSPs的初始搜索的种子。字符命中沿着每一序列在两个方向延伸,一直延伸到累积比对得分能被增加。使用参数M(一对匹配残基的奖赏得分;通常大于零)计算累积得分。对于氨基酸序列,用得分矩阵来计算累积得分。当出现如下情况时,中断字符命中在每一方向的延伸:累积比对得分从其所得到的最大值下降了数量X;由于一个或多个负得分残基比对的累积,累积得分等于或低于零;或者已经到达任一序列的末端。BLAST算法参数W、T和X确定比对的灵敏度和速度。对于核苷酸序列,BLASTN程序使用缺省值,字符长度(W)为11,期望值(E)为10,M=5,N=-4,并且比较双链。对于氨基酸序列,LASTP程序使用的缺省值为:字符长度(W)为3,期望值(E)为10和BLOSUM62得分矩阵(参见Henikoff和Henikoff(1989),Proc.Natl.Acad.Sci.USA89:10915)。
BLAST算法也可以进行两个序列之间相似性的统计分析(例如参见,Karlin和Altschul(1993),Proc.Natl.Acad.Sci.USA90:5873)。由BLAST算法提供的一个相似性测量是最小总和概率(P(N)),这提供了两个核苷酸或氨基酸序列之间的匹配偶然发生的概率指示。例如,如果在试验核酸与参考核酸的比较中,最小总和概率低于大约0.2,低于大约0.01,或低于大约0.001,核酸被认为与参考序列是相似的。
在一个方面,使用基本局部比对搜索工具(“BLAST”)来评价蛋白和核酸序列同源性。尤其是,五个特定的BLAST程序被用来完成如下任务:
(1)BLASTP和BLAST3将氨基酸查询序列与蛋白质序列数据库进行比较;
(2)BLASTN将核苷酸查询序列与核苷酸序列数据库进行比较;
(3)BLASTX将查询核苷酸序列(两个链)的六框架概念翻译产物与蛋白质序列数据库进行比较;
(4)TBLASTN将查询蛋白序列与在所有六个阅读框(两个链)中翻译的核苷酸序列数据库进行比较;
(5)TBLASTX将核苷酸查询序列的六框翻译与核苷酸序列数据库的六框翻译进行比较。
BLAST程序通过识别相似片段来识别同源序列,此处被称作查询氨基酸或核酸序列和试验序列之间对“高得分片段对”,所述试验序列可以从蛋白质或核酸序列数据库得到。高打分片段对通过打分矩阵方式来鉴别(即比对),许多这样的方式在本技术领域是已知的。在一个实例中,所用的打分矩阵是BLOSUM62矩阵(Gonnet等人(1992),Science256:1443-1445;Henikoff和Henikoff(1993),Proteins17:49-61)。在另一个实例中,也可以使用PAM或PAM250矩阵(例如参见,Schwartz和Dayhoff(1978),MatricesforDetectingDistanceRelationships:AtlasofProteinSequenceandStructure,Washington:NationalBiomedicalResearchFoundation)。BLAST程序可以通过美国国家医药图书馆(U.S.NationalLibraryofMedicine)获得,例如通过www.ncbi.nlm.nih.gov
可以对上述算法所用的参数进行调整,依赖于序列长度和所考虑的同源性程度。在一些方面,在没有用户说明书的情况下,这些参数可以是算法所用的缺省参数。
在一个特定的方面,本发明提供了一种方法,用于修饰小分子,包括将此处描述的多核苷酸编码的多肽或其酶活性片段与小分子接触,以产生修饰的小分子。对修饰的小分子的文库进行测试,以确定表现出期望活性的文库中是否存在修饰的小分子。产生具有期望活性的修饰小分子的特定生物催化反应是通过如下步骤来鉴别的:系统地除去用于产生文库的一部分的每一生物催化反应;然后测试文库部分中产生的小分子中存在还是不存在具有期望活性的修饰小分子。任选地重复产生具有期望活性的修饰小分子的特定生物催化反应。用一组生物催化剂完成生物催化反应,所述一组生物催化剂与小分子结构中发现的不同结构部分发生反应,每一生物催化剂对于一个结构部分或一组相关结构部分是特异的;和每一生物催化剂与含有不同结构部分的许多不同的小分子发生反应。
腈水解酶用途的一些方面是:
α-羟基酸-腈水解酶通过水解羟腈产生α-羟基酸。这种情况的一个实例是产生扁桃酸及其衍生物。这种类型的一个重要应用包括从扁桃腈以高产量和高对映选择性商业化地产生(R)-扁桃酸。已经发现扁桃酸及其衍生物作为产生许多手性药物和农用产品的中间产物和拆解试剂具有广泛的应用。先前将鲜为人知的腈水解酶应用于使用类似底物的方法中的尝试,已经为非常低的活性、生产率和选择性所困扰。
完全转化
苯基乳酸衍生物
另一个应用是以高产量和高对映体选择性产生(S)-苯基乳酸衍生物。已经发现苯基乳酸在产生许多手性药物和农用产品中具有广泛应用。
完全转化
β-羟基酸
出于重要的商业考虑,提供腈水解酶,产生4-氰基-3-羟基丁酸的任一对映异构体,其(R)-对映异构体是合成药物LIPITORTM(立普妥,斯达汀或阿伐他汀)中的一个关键性中间产物。
羟基戊二酰基腈(R)-3-羟基-4-氰基-丁酸
选择的腈水解酶
(S)-3-羟基-4-氰基-丁酸
下述腈水解酶是用于将羟基戊二酰基腈转化为(R)-3-羟基-4-氰基-丁酸中有用的腈水解酶的多个实例:SEQIDNOS:205,206,SEQIDNOS:207,208,SEQIDNOS:195,196,SEQIDNOS:43,44,SEQIDNOS:321,322,和SEQIDNOS:237,238。上述示意性实例表明“选择的腈水解酶”可以被用来将羟基戊二酰基腈转化为(S)-3-羟基-4-氰基-丁酸:SEQIDNOS:107,108,SEQIDNOS:109,110,SEQIDNOS:111,112,SEQIDNOS:127,128,SEQIDNOS:129,130,SEQIDNOS:133,134,SEQIDNOS:113,114,SEQIDNOS:145,146,SEQIDNOS:101,102,SEQIDNOS:179,180,SEQIDNOS:201,202,SEQIDNOS:159,160,SEQIDNOS:177,178,SEQIDNOS:181,182,SEQIDNOS:183,184,SEQIDNOS:185,186,SEQIDNOS:57,58,SEQIDNOS:197,198,SEQIDNOS:59,60,SEQIDNOS:67,68和SEQIDNOS:359,360。
参考下面实施例将对本发明做进一步的描述;然而,应该理解的是,本发明不限于这些实施例。由于本发明的公开内容描述了实施本发明的当前的最好方式,许多修改和变化将展现给本技术领域的普通技术人员,而不背离本发明的范围和精神。所有在与权利要求的等同之下的意思和范围内出现的变化、修改和变更被认为在权利要求的范围内。
实施例
实施例1:噬菌粒感染
对于被用来筛选腈水解酶的每一文库,感染物是按照如下所述准备的:将5mlSEL700细胞的OD600nm=1重悬浮液和1ml将被筛选的噬菌粒文库混和。将该组合物在37℃的水浴中温育45分钟。
使用该感染物,在10mMMgSO4中进行连续稀释,使用10μl等分试样的感染物。
将60μl每一下述稀释物放置到一个小的LB-Kan50平板上:
在台式离心机中,在4℃下,4.6krpm将感染物中的细胞离心10分钟,以形成沉淀。从所得到的沉淀中轻轻倒出上清液。将细胞重悬浮在剩余液体中。将所有重悬浮的细胞放置到一个单个的大LB-Kan50平板上。将所有平板在30℃培养过夜。
实施例2:选择性筛选
用~4毫升10mMMgSO4重悬浮每一感染平板上的细胞。将重悬浮液放置到试管中。用~3毫升10mMMgSO4重悬浮每一平板上剩余的细胞,并且与来自同一平板上的第一重悬浮液组合。用10mMMgSO4使每一试管的体积达到12ml,将试管进行剧烈涡流摇动。在台式离心机上,在4℃下,4.6k将试管离心10分钟,以形成沉淀。从每一重悬浮液中,轻轻倒出上清液。用10ml10mMMgSO4重悬浮每一试管中经过洗涤的细胞。将每一文库的重悬浮液在4℃保存,直到准备建立选择性培养物。
对于每一重悬浮液,使用如下过程建立选择性培养物:
1)制备腈水解酶选择性培养基,使用包括0.2%葡萄糖、不含氮和50μg/ml卡那霉素(仅仅对于pBK噬菌粒文库而言;对于pBS文库,使用氨苄青霉素)的1XM9培养基。
2)将5ml培养基等分到50ml螺旋口圆锥形试管中。
3)将25μl所保存的重悬浮液加入到试管中。
4)加入5μl脂肪腈,以使终浓度到达8.8mM。可以使用其它腈底物来代替脂肪腈。
5)将所得到的组合物在30℃培养。
对于每一腈底物重复步骤1-5。
实施例3:来自选择性培养物的阳性腈水解酶克隆的分离
将正在生长的十(10)μl选择性培养物,划线接种到一个小的LB-Kan50平板上,并且允许在30℃生长两个晚上。挑取五个分离的菌落形成单位(cfu),并使其中的每一个在30℃下、在2ml腈水解酶选择性培养基中生长。监控每一培养物(其中,生长表明阳性菌落形成单位被挑取),当监控表明它处于生长的稳定期时将其拿开。用一(1)ml培养物制备噬菌粒制剂,并且用40μl洗脱缓冲液洗脱。用PstI/XhoI或SacI/KpnI限制酶剪接五到八(5-80)μlDNA,以便从载体中去除插入物。完成限制性片段长度多态性(RFLP)测定,以鉴别插入物的大小。对插入物进行测序。
实施例4:腈水解酶的筛选和表征
筛选针对靶底物的本发明的腈水解酶。在初次筛选中显示出水解活性的那些酶中,选择其对映体选择性高于20%对映体过量(ee)的酶,用于进一步表征。对那些酶的选择基于:1)具有针对相关底物之一的活性和2)表现出大于35%ee(对映体过量)。这一筛选过程的结果如上面表1所示。用于筛选的产物是:D-苯基甘氨酸,L-苯基乳酸,(R)2-氯扁桃酸,(S)-环己基扁桃酸,L-2-甲基苯基甘氨酸,(S)-2-氨基-6-羟基己酸,和4-甲基-L-亮氨酸。
针对靶底物D-苯基甘氨酸的腈水解酶的筛选
苯基甘氨酸腈D-苯基甘氨酸
进行苯基甘氨酸腈的水解。这些酶中的一些酶显示出高于20%的ee值,它们被选择用于初步表征。
基于初步表征实验,鉴别关于苯基甘氨酸腈的许多推断命中,对这些酶积累了大量数据。该数据显示出许多一般的特性:大部分酶的活性最适pH为7,通常情况下,在较低pH值下,对映选择性有所提高。这些酶被发现在较高温度下更活跃,尤其是38℃,尽管这一温度通常导致较低的对映体选择性。在反应中,使用水混溶共溶剂显示出是一个实用的选择。在酶反应中,含有10-25%甲醇(v/v)基本上不影响酶活性,而且在许多情况下,导致对映选择性的增加。使用两相系统也已经显示出一些成功的征兆,通过加入高达70%(v/v)的己烷维持酶的活性水平,在一些情况下加入甲苯。然而,在两相系统中使用乙酸乙酯导致较低的活性。
对于已经鉴别出对于苯基甘氨酸腈有活性的酶,好几种酶的对映选择性显示出维持了高于35%ee的成功标准。初步表征数据表明一些酶对D-苯基甘氨酸显示出高对映选择性,相应地至产物的转化率为40-60%。进一步的研究提示,这些酶中的一些酶的活性速率比底物的外消旋速率更快。降低酶的浓度导致改进的对映选择性;因此,可以发现,通过控制化学外消旋作用和酶活性的相对速率来获得一些益处。
针对靶底物(R)-2-氯扁桃酸的腈水解酶的筛选
2-氯扁桃腈(R)-2-氯扁桃酸
已经鉴别出这些酶对于2-氯扁桃腈显示出活性。对于2-氯扁桃腈和苯基甘氨酸腈具有活性的酶之间,存在高度重叠。这些酶中的许多酶也形成一个不同的序列家族。
对于活性酶,较高的温度和中性pH显示出导致最高活性。对于绝大多数的腈水解酶,在较高的温度下,对映选择性也有所增加,尤其是在38℃。这些酶在存在高达25%甲醇或10%异丙醇的情况下保持了它们的活性;在这些情况中的许多情况下,对映选择性也有所提高。在两相系统中的活性,在很大程度上,是可以与含水条件相比较的,尤其是将己烷作为非水相时;在不同腈水解酶之间,观察到了对于甲苯的耐受性的变化。
表2.从2-氯扁桃腈的对映选择性水解的表征实验确定的最适条件的总结
针对靶底物(S)-苯基乳酸的腈水解酶的筛选:
苯乙醛羟腈(S)-苯基乳酸
所实验的许多腈水解酶对于苯乙醛羟腈表现出活性。这些酶中的许多酶是两个相关序列家族的一部分,与对于苯基甘氨酸腈和氯扁桃腈表现出活性的那些酶不同。
酶的最适pH通常高于7(即pH8或9),具有在这些水平将表现出的较高的对映选择性。许多酶在较高温度显示出较好的活性,尤其在38℃。温度对于酶的对映选择性的影响可以变化;在许多情况下,这一特性在较高温度下稍微低一些。当酶对于加入共溶剂具有耐受力时,尤其是10%(v/v)甲醇,加入这些共溶剂没有得到活性或对映选择性的改善。使用两相系统再次显示出是可行的。
表3.从苯乙醛羟腈的对映选择性水解的表征实验确定的最适条件的总结
针对靶底物L-2-甲基苯基甘氨酸的腈水解酶的筛选
2-甲基苯基甘氨酸腈L-2-甲基苯基甘氨酸
腈水解酶已经显示出对该底物的活性,优先产生了D-2-甲基苯基甘氨酸,而不是所需的L-2-甲基苯基甘氨酸。
相对于靶底物L-羟基正亮氨酸((S)-2-氨基-6-羟基己酸)的腈水解酶的筛选
5-羟基戊醛氨基腈L-羟基正亮氨酸
已经分离了许多对2-氨基-6-羟基己烷腈显示出活性的腈水解酶。所有这些酶对于产物的L-异构体显示出对映选择性。
这些酶在较高的pH都显示出较高的对映选择性,并且与所实验的其它腈水解酶相比,对加入溶剂似乎更敏感。尽管活性是在存在有机溶剂的情况下检测的,但通常低于含水对照组的活性。再一次地,酶的活性受到酸性产物和醛起始物质的负面影响。
表4.从2-氨基-6-羟基己烷腈的对映选择性水解的表征实验所确定的最适条件的总结
SEQ ID NOS: 最适pH 最适温度℃ 溶剂耐受性
217,218 9 38 10%MeOH
55,56 9 38
187,188 9 38 10%MeOH
167,168 9 38
221,222 9 38
在所确认的命中酶中,观察到的对于2-氨基-6-羟基己烷腈的水解活性范围
相对于靶底物4-甲基-D-亮氨酸和4-甲基-L-亮氨酸的腈水解酶的筛选
3,3-二甲基正丁醛氨基腈4-甲基-L-亮氨酸
4-甲基-D-亮氨酸
用好几种腈水解酶进行2-氨基-4,4-二甲基戊烷腈的水解。在这些腈水解酶中,一些显示出将腈水解为相应酸的L-异构体,选择这些腈水解酶用于进一步表征。
表5.从2-氨基-4,4-二甲基戊烷腈的对映选择性水解的表征实验确定的最适条件的总结
SEQ ID NOS: 最适pH 最适温度℃ 溶剂耐受性
103,104 7 23 25%MeOH,10%IPA
59,60 8 23 25%MeOH
221,222 6 38 25%MeOH,10%IPA
相对于靶底物(S)-环己基扁桃酸的腈水解酶的筛选
环己基扁桃腈(S)-环己基扁桃酸
相对于靶底物扁桃腈的腈水解酶的筛选
扁桃腈(R)-扁桃腈
在扁桃腈上也筛选腈水解酶收集物。腈水解酶活跃地水解苯基甘氨酸腈和氯扁桃腈。
确定对映选择性的酶促测定法
在确定手性α-羟基酸和α-氨基酸的光谱系统的设计中,开发并且使用了允许检测产物形成和对映选择性的基于酶的测定方法。
图6和7描述了基于乳酸脱氢酶(L-LDH和D-LDH)和氨基酸氧化酶(L-AA氧化酶(L-AAOxid)和D-AA氧化酶(D-AAOxid))检测α-羟基酸和α-氨基酸的光谱系统。选择这些酶的原因是,据报道它们具有相当广泛的底物范围,仍然保留了接近绝对对映特异性。
该系统的全部可行性已经被建立(表12)。既不是亲本羟基腈,也不是氨基腈被次生或检测酶代谢,因此起始材料没有受到干扰。未经过热处理的细胞裂解产物导致LDH系统的背景活性;然而,加热灭活消除了背景活性。细胞裂解产物似乎不干扰AA氧化酶测定。一个考虑因素是AA氧化酶的灭活,所述AA氧化酶通过残余的氰化物使用了FMN辅因子。然而,对照组研究表明,在2mMPGN(其能释放高达2mMHCN)灭活不是一个问题。该测定法适合于384孔(或可能更大密度)微量滴定平板。
表6.针对酸性产物的手性检测的次生酶鉴别总结
1.该测定法不适用于环己基扁桃酸和2-甲基苯基甘氨酸,原因在于叔醇不受这一特定氧化作用的影响。
实施例5:标准测定条件
制备下述溶液:
●底物储备溶液:溶解在0.1M磷酸盐缓冲液(pH7)中的50mM的氨基腈底物,或溶解在0.1M醋酸钠缓冲液(pH5)中的50mM的羟腈底物
●酶储备溶液:将3.33ml的0.1M磷酸盐缓冲液(pH7)加到每一小瓶中,其中含有20mg的冻干细胞裂解产物(终浓度为6mg蛋白质/ml)
程序:
●将100μl的50mM底物溶液加到96孔平板的适当数量的孔中
●将80μl缓冲液加到每一孔中
●将20μl酶溶液加到每一孔中
●通过用20μl缓冲液代替酶溶液建立空白对照组
●在许多实验中也包括阴性对照组,该对照组由在180μl缓冲液中的20μl酶溶液组成。该对照组一旦已经建立,细胞裂解产物不干扰产物的检测,就不包括这些对照组。
反应取样:
●通过从每一孔中取出等分试样(15-50μl),并且如下稀释样品,从而对反应进行取样:
●用于非手性HPLC分析的样品:
●苯基甘氨酸,2-氯扁桃酸和苯基乳酸:最初,用水稀释样品2倍,进一步用甲醇或乙腈稀释二倍(最终稀释:4倍)。发现对这些样品的8倍稀释导致改进的色谱分离
●(S)-2-氨基-6-羟基己酸,4-甲基亮氨酸,t-亮氨酸,2-甲基苯基甘氨酸和环己基扁桃酸:用甲醇或乙腈1:1稀释样品。溶剂的选择基于HPLC分析方法中所用的溶剂。
·手性HPLC分析的样品:
●苯基甘氨酸,2-氯扁桃酸和苯基乳酸:对于非手性分析,正如上面所描述的那样;手性分析的样品最初稀释两倍,在该项目的随后阶段,以4倍稀释。
●(S)-2-氨基-6-羟基己酸,4-甲基亮氨酸,t-亮氨酸,2-甲基苯基甘氨酸:用甲醇或乙腈以1:1稀释样品。
·对于每一实验,HPLC运行中包括产物的标准曲线。该曲线被描绘在X-Y轴上,根据这些曲线的斜率计算样品中产物的浓度。
·对于初步表征实验,如此取出样品,以致酶的活性处于线性相位;如此进行的目的是,可以确定参数对于反应速率影响的差异,而不是完全转化。取样时间表示在本文所包括的表中。
·使用表20和21中叙述的方法,通过HPLC分析样品。
实施例6:确定pH对于酶活性和对映选择性的影响
通过在不同的缓冲液范围内进行标准测定,研究pH对于酶活性和对映选择性的影响:
0.1M柠檬酸磷酸pH5
0.1M柠檬酸磷酸pH6
0.1M磷酸钠pH7
0.1MTris-HClpH8
MTris-HClpH9
通过非手性和手性HPLC方法分析样品,其结果的实例表示在此处的表5,8和11中。
实施例7:确定温度对于酶活性和对映选择性的影响
温度对于活性和对映选择性的影响是通过在室温,38℃和55℃进行标准测定法来研究的。样品是通过非手性和手性HPLC方法来分析的,所得结果的实例表示在此处的表5,8和11中。
实施例8:确定溶剂对于酶活性和对映选择性的影响
作为两相系统,为了研究水混溶性和非水混溶性溶剂对于酶的影响,酶反应是在存在共溶剂的情况下进行的。在存在共溶剂的情况下,反应在标准条件下进行,用甲醇或异丙醇代替缓冲液。反应中的溶剂终浓度为0,10,25和40%(v/v)。
两相反应也在标准条件下进行,使用形成非水相的非水混溶性有机溶剂层。溶剂以如下水平被加入:水相的0%,10%,40%和70%(v/v)。来自这些反应的样品在真空下通过离心蒸发,并且再次溶解在甲醇或乙腈和水的50:50混合物中。样品通过非手性和手性HPLC方法来分析。
实施例9:确定工艺成分对酶活性和对映选择性的影响
活性
通过在酶反应中加入单一成分,来建立工艺成分对于酶活性的影响。这些成分包括腈合成的起始材料、醛、氰化物和氨,以及三乙胺,三乙胺以催化量被加入到腈合成反应中。反应物的浓度用能够想到的可能的工艺条件进行选择,并且要适合酶测定法中所用的反应物水平。在一些情况下,醛和产物的溶解性相对较低;在这些情况下,将最高水平的溶解性加入到反应中,作为最高水平,该水平的10%作为较低值。
在标准条件下进行酶反应,加入一种或多种如下成分:苯甲醛、苯基甘氨酸、苯基乙醛、苯基乳酸、2-氯苯甲醛、2-氯扁桃酸、5-羟基戊醛、(S)-2-氨基-6-羟基己酸、4-甲基亮氨酸、KCN、三乙胺、NH4Cl。在标准条件下进行对照组反应,不加入添加剂。通过非手性HPLC分析样品。
稳定性
酶对工艺条件的稳定性,是通过在存在单一反应成分的情况下将酶温育预定时间期间来监控,这在标准条件下测定酶活性之前进行。在这些实验中,将酶以1.2mg蛋白质/ml的浓度,在存在下述反应成分的每一种的情况下进行温育,所述下述反应成分:甲醇、苯甲醛、苯基甘氨酸、苯乙醛、苯基乳酸、2-氯苯甲醛、2-氯扁桃酸、5-羟基戊醛、(S)-2-氨基-6-羟基己酸、KCN、NH4Cl。
测定条件:
在特定添加剂中温育0、2、6和24小时,取出50μl酶溶液,加入50μl的50mM底物储备溶液,在标准条件下测定酶活性。在加入底物后,在下述时间对反应进行取样:苯基甘氨酸腈:10分钟;苯乙醛羟腈:1小时;2-氯扁桃腈:2小时。通过仅仅在缓冲液中温育酶,进行对照组反应。使用非手性HPLC方法分析酶。
实施例10:推断命中酶的确认
当获得较高的转化时,在初步表征实验之后,在所确定的最适条件下,测定已经鉴别为推断命中的酶,以便评价它们的性能,尤其是对映选择性。用25mM底物对酶进行测定,pH和温度条件如本文中所包括的表中所记录的。除非另外说明,对于每一种酶所用的标准浓度为0.6mg/ml蛋白质。
实施例11:酶反应层析谱的选择实例
在这一部分中,所示为每一底物和产物组合的层析谱代表性实例,同时讨论了这些方法所遇到的一些挑战,以及如何解决这些挑战。
D-苯基甘氨酸
参见图8A-8E,非手性分析显示了在2.6分钟和3.2分钟洗脱的底物峰。这两个峰出现在所有含有较高浓度腈的样品中;第二个峰被认为是与腈相关的一个产物;该峰随着时间而降低,一旦已经发生了到产物的完全转化,该峰将不再出现。在图8A中所示的层析谱为空白对照组,仅仅含有腈和缓冲液;正如上面第1部分所解释的,用水和溶剂稀释所有样品。对于下面所讨论的所有样品,重复这一步骤。图8B中的层析谱中所示为酶反应样品,产物是在0.4分钟之时洗脱的。
在这些层析谱中,要注意的是在0.3分钟洗脱的小溶剂前峰。该峰进一步的表示在图8C所示的层析谱中给出,其中进行的是包括在缓冲液中的细胞裂解产物的阴性对照组。在0.4分钟,一个极小峰与产物进行共洗脱。在该方案的初始阶段,该峰被认为是有问题的,尽管对每一实验进行了适当的对照组,以便维持精确性。在这些实验中,将从细胞裂解产物得到的峰值面积从酶反应中的产物峰值面积中减去,尽管细胞裂解产物得到的峰值面积相对较小。通过进一步稀释样品以及在HPLC中使用较小注射体积,可以进一步改进该分析。在完成这些实验之后,该峰的干扰显示出达到了最小限度,正如图6C中举例说明的层析谱所示。
苯基甘氨酸的手性分析表示在图6D中的层析谱中,L-对映异构体在6分钟洗脱,D-对映异构体在11分钟洗脱。获得了这两个异构体之间的良好拆分。然而,所用的柱是非常敏感的,该柱的特征显示出随着时间有所变化,从而导致酸的洗脱时间的变化。尽管这通过使用适当的对照组和标准很容易检测,但在用D-对映异构体共洗脱腈峰中存在更大的问题(层析谱显示在图6E中)。该共洗脱的原因尚不清楚了;然而,通过使用适当的标准可以容易地检测出;此外,酸的UV光谱非常有特色,这使得使用该工具可以有效地检测共洗脱。该问题也可以通过调节流动相中的甲醇含量很容易地予以解决。
(R)-2-氯扁桃酸
氯扁桃酸和氯扁桃腈的HPLC分析,提供了许多与苯基甘氨酸样品相关的挑战。从图7A中所示的层析谱,该图仅在缓冲液中含有氯扁桃腈,显然在相同时间洗脱的峰作为图7B中所示层析谱中的产物,该峰表示扁桃酸标准。发现细胞溶解产物对该峰的贡献很小;对该峰的最大贡献似乎来自氯扁桃腈,或者来自分解产物或者来自腈制剂中的污染物。使用适当的对照组,峰值面积在整个实验过程中保持不变,发现将峰值面积从产物的峰值面积中减去得到了足够的精确度。已经进行了许多尝试来改变HPLC条件,以便在随后的时间洗脱产物峰;然而,这些尝试没有成功。图7C所示的层析谱,举例说明了产物的出现和底物峰的降低。
氯扁桃酸的手性分析几乎是没有问题的。在与(S)-对映异构体相同的时间洗脱小峰,表现出一些影响(在图7D所示的层析谱中,在2.4分钟处的峰)。然而,一旦已经建立,该峰在所有样品中以相同水平出现,包括空白对照组,并且该峰具有的UV光谱不同于氯扁桃酸峰的UV光谱,这被认为不是一个问题。因此,在每一样品中,从2.4分钟洗脱的峰值中减去该峰值。(R)-对映异构体在3分钟洗脱。
(S)-苯基乳酸
对苯基乳酸的分析,最初也为如关于苯基甘氨酸和2-氯扁桃酸的讨论中所述的相同问题所困扰。然而,在这种情况下,调节非手性HPLC方法中的溶剂浓度导致酸的保留时间有所改变,这样它不再与细胞溶解产物峰共洗脱。在这之后,或者非手性或者手性方法没有遇到问题。产物(1.9分钟)和羟腈底物(3.7分钟)的代表性非手性层析谱表示在图8A中,而酸的手性分析表示在图8B中,L-对映异构体在2分钟洗脱,相对的对映异构体在6分钟洗脱。
L-2-甲基苯基甘氨酸
甲基苯基甘氨酸的分析是不成问题的,尽管非手性方法不提供细胞溶解物峰和产物峰之间的基线分离,正如图9A中举例说明的层析谱中所示。在该项目的最后阶段,提供了该方法的氨基酸标准,从而缩短了该方法开发的时间。在图9A所示的层析谱中,氨基酸在0.7分钟洗脱,氨基腈在5.0分钟洗脱。达到了这两个初始峰之间的充分分离,以允许计算到产物的大约转化。
该化合物的手性分析提供了这两个对映异构体之间的良好分离,正如图9B中举例说明的层析谱中所示。L-对映异构体在5分钟洗脱,D-对映异构体在8分钟洗脱。
L-叔-亮氨酸
对于叔-亮氨酸的非手性分析,细胞溶解产物出现了该项目的产物组中最严重的问题。这是由于该氨基酸的低光谱特性所增加的问题,从而导致从细胞溶解产物中区分产物峰出现困难。通过图10A中所示的手性分析获得了单一产物对映异构体的良好分离。在初步筛选过程中,在某种样品中,在与L-氨基酸标准相同的时间洗脱小峰(参见图10B),并且该小峰被认为是氨基酸。然而,对该方法进一步的开发以及使用适当的对照组确认该峰实际上是细胞溶解产物峰。
两个t-亮氨酸峰值之间洗脱的氨基腈,正如图10C中所示,该层析谱也在4.8分钟显示了细胞溶解产物峰。腈的UV光谱与氨基酸的UV光谱不同,这样可以更容易地从酸峰中区分出腈。
L-羟基正亮氨酸((S)-2-氨基-6-羟基己酸)
(S)-2-氨基-6-羟基己酸的手性分析是一致且可靠的。相反,非手性方法出现了许多问题,主要是腈和酸峰之间没有分离。越接近该项目的后半部分,开发了一种方法,并且成功地用于确认活性。在此之前,使用手性方法进行了许多分析;绘制了产物的标准曲线,以便量化该反应。图11A所示为(S)-2-氨基-6-羟基己酸的代表性层析谱,(S)-2-氨基-6-羟基己酸在6分钟洗脱。该方法没有对氨基腈进行检测。
单一(S)-2-氨基-6-羟基己酸对映异构体的分离如图11B所示。首先在2分钟洗脱L-对映异构体,随后在3分钟洗脱D-对映异构体。在图11C中,表示了酶样品;需要轻微关注的唯一区域是洗脱L-对映异构体之前的阴性峰。然而,它似乎对于该对映异构体的洗脱没有显著性干扰;该方法的开发没有消除该负峰。
4-甲基-D-亮氨酸和4-甲基-L-亮氨酸
对于4-甲基亮氨酸的检测,手性HPLC方法再次证明更加可靠。该方法对于化合物的低活性和低敏感性的组合,导致使用非手性HPLC检测存在困难。图12A所示为氨基酸的2.5mM标准,峰高度为大约40mAU;这显著低于对于芳族化合物的检测值。图12B中的层析谱显示了酶样品,其中转化是使用手性HPLC方法检测的;尽管不清楚,但仍然显示出4-甲基亮氨酸峰在2.7分钟洗脱,峰高和峰面积都非常低。该峰没有出现在通过手性HPLC分析是负值的样品中。
4-甲基-L-亮氨酸和4-甲基-D-亮氨酸的手性分析没有表现出任何问题。L-对映异构体在5分钟洗脱,D-对映异构体在7分钟洗脱,尽管如(i)部分中对于苯基甘氨酸所做的描述,作为对柱的敏感性的结果,没有发生一些峰移动。在图14C-14D中所示的层析谱中,给出了这些氨基酸的分离;第一个样品表示产生了两种对映异构体的酶,在第二种样品中,酶优先水解L-对映异构体,形成了少量的D-氨基酸。
(S)-环己基扁桃酸
所示为环己基扁桃酸(图13A)的标准色谱图和相应的腈(图13B)。酸在1.3分钟洗脱,而在2.5分钟观察到了羟腈。在2.1分钟洗脱的峰被认为是环己基苯基甲酮,正如在该点上通过洗脱酮标准所示。
实施例12:生物催化的酶文库方法:开发用于对映选择性产生羧酸衍生物的腈水 解酶平台
生物催化过程可以在转化中提供独特的优势,这正在挑战通过传统化学方法实现转化(Wong,C.-H.;Whitesides,G.M.EnzymesinSyntheticOrganicChemistry;Pergamon,NewYork,1994;Drauz,K.;Waldmann,H.,Roberts,S.M.编著.EnzymeCatalysisinOrganicSynthesis;VCH:Weinheim,Germany,第二版,2002)。腈水解酶(EC3.5.5.1)促进了有机腈直接缓和水解转化为相应的羧酸(Kobayashi,M.;Shimizu,S.FEMSMicrobiol.Lett.1994,120,217;Bunch,A.W.InBiotechnology;Rehm,H.-J.;Reed,G.;Puhler,A.;Stadler,P.,编著;Wiley-VCH:Weinheim,Germany,8a卷,第六章,277-324页;Wieser,M.;Nagasawa,T.InstereoselectiveBiocatalysis;Patel,R.N.,编著;MarcelDekker:NewYork,2000,第17章,461-486章。)到目前为止已经表征和报道了不到15种微生物来源的腈水解酶。(Harper,D.B.Int.J.Biochem.1985,17,677;Levy-Schil,S.;Soubrier,F.;Crutz-LeCoq,A.M.;Faucher,D.;Crouzet,J.;Petre,D.Gene1995,161,15;Yu,F.1999,美国专利5872000;Ress-Loschke,M.;Friedrich,T.;Hauer,B.;Mattes,R.;Engels,D.PCT申请WO00/23577,2000年4月。)。先前已经开发了好几种腈水解酶用于制备单一对映异构体羧酸,但是在开发作为可行的合成工具的腈水解酶中所取得的进步是很小的。该申请描述了大量和不同种类的腈水解酶的发明,此处举例说明了该腈水解酶文库的用途,用于鉴别能催化有效的对映选择性、产生有价值的羟基羧酸衍生物的酶。
在获得最多样化范围的在自然界能发现的酶的尝试中,通过直接从环境样品中提取DNA,我们创立了大的基因组文库,其中环境样品是从业已从变化的全球生境中收集而来。(对于这些方法的描述,参见:Short,J.M.NatureBiotech.1997,15,1322;Handelsman,J.;Rondon,M.J.;Brady,S.F.;Clardy,J.;Goodman,R.M.Chem.Biol.1998,5,R245;Henne,A.;Daniel,R.;Schmitz,R.A.;Gottschalk,G.Appl.Environ.Microbiol.1999,65,3901.)。我们已经建立了多种通过筛选未培养的DNA的混和群体而用于鉴别新颖活性的方法。(Robertson,D.E.;Mathur,E.J.;Swanson,R.V.;Marrs,B.L.;Short,J.M.SIMNews1996,46,3;Short,J.M.美国专利5,958,672,1999;ShortJ.M.美国专利6,030,779,2000.)通过该方法,接近200种新颖腈水解酶已经被发现和表征。(对于该研究的简单描述,参见下面的材料和方法部分(MaterialsandMethodssection))所有腈水解酶被认为在序列水平是独特的,并且显示出拥有保守性催化三联体Glu-Lys-Cys,这是该酶类别所特有的。(Pace,H.;Brenner,C.GenomeBiology2001,2,0001.1-0001.9。)在我们的文库中的每一腈水解酶被过量表达,保存为冻干的细胞溶解产物,以便有助于加速该文库对特定生物催化功能的评价。
最初研究的重点在于腈水解酶的效力,该腈水解酶用于产生通过羟腈1的水解形成的α-羟基酸2。羟腈被很好地证明,容易在碱性条件下通过HCN的可逆损失发生外消旋作用。(Inagaki,M.;Hiratake,J.;Nishioka,T.;Oda,J.;J.Org.Chem1992,57,5643.(b)vanEikeren,P.美国专利5,241,087,1993。)因此,动态动力学拆分过程是可能的,从而酶选择性地仅水解对映异构体1,以100%理论产量和高水平地对映异构体纯度提供了2。
该类型的一个重要应用涉及商业性从扁桃腈产生(R)-扁桃酸。(Ress-Loschke,M.;Friedrich,T.;Hauer,B.;Mattes,R.;Engels,D.PCT申请WO00/23577,2000年4月;Yamamoto,K.;Oishi,K.;Fujimatsu,I.;Komatsu,K.Appl.Environ.Microbiol.1991,57,3028;Endo,T.;Tamura,K.美国专利5,296,373,1994年3月.)作为中间产物和拆解剂,扁桃酸和衍生物在用于产生许多药物和农业产品中存在广泛的用途。(Coppola,G.M.;Schuster,H.F.Chiralα-HydroxyAcidsinEnantioselectiveSyntheis(对映选择性合成中的手性α-羟基酸);Wiley-VCH:Weinheim,Germany:1997.)然而,来自培养的生物体的鲜为人知的腈水解酶还没有被发现用于类似底物的有效和选择性水解。
腈水解酶
以在扁桃腈(3a,Ar=苯基)水解为扁桃酸中的活性和对映选择性对腈水解酶文库进行筛选。
初步结果显示,27种酶提供了>90%ee的扁桃酸。一种酶,SEQIDNO:385,386,被进行了更详细的研究,并且被发现对于水解扁桃腈非常活跃。在使用处于10%MeOH(v/v)0.1M磷酸缓冲液中的25mM3a和0.12mg/mL酶,在37℃和pH8的标准条件下,在10分钟内,定量地形成了(R)-扁桃酸,具有98%ee。为了确认合成效用,使用1.0g3a(50mM)和9mg腈水解酶(0.06mg/mL腈水解酶I)进行反应;3小时后,以高产量(0.93g,86%)分离了(R)-扁桃酸,又一次地,具有98%ee。
(a)反应是在标准条件下进行的(参见正文)。到4的完全转化的反应时间为1-3小时。在pH9和5mM底物浓度下,进行项目8-9。(b)在5分钟转化时间点测量比活性,并且被表示为μmolmg-1min-1。(c)TOF=转换频率,mol产物/mol催化剂/秒。(d)通过手性HPLC分析确定对映选择性。分离羟基酸,在所有情况下绝对构型被确定为(R)。
接着研究SEQIDNO:385,386的底物范围。正如在表13中所示,可以通过该方法制备广泛范围的扁桃酸衍生物,以及芳族和杂芳族类似物(4)。SEQIDNO:385,386在扁桃腈衍生物的邻位-、间位-、对位-位置可以有芳香环取代基,并且产生了具有高选择性的类型4产物。在活性位点也容纳了其它大的芳香基团如1-萘基和2-萘基,再次提供了具有高选择性的酸4(表13,项目8-9)。最后,使用该过程容易地制备了扁桃酸的3-吡啶基和3-噻吩基类似物(表13,项目10-11)。这是最先报导的腈水解酶的论证,提供了一系列类型4的扁桃酸衍生物和杂芳族类似物。特别值得注目的是,在更空间位阻的邻位取代和1-萘基衍生物上的高活性。
我们接着研究了通过相应羟腈5的水解制备芳基乳酸衍生物6。苯基乳酸和衍生物作为制备许多生物活性化合物的通用结构单元。(Coppola,G.M.;Schuster,H.F.Chiralα-HydroxyAcidsinEnantioselectiveSynthesis(对映选择性合成中的手性α-羟基酸);Wiley-VCH:Weinheim,Germany:1997.)一旦针对亲本羟腈5a(Ar=苯基)筛选了我们的腈水解酶文库,我们发现了几种酶,提供了具有高对映体过量的6a。对一种酶,SEQIDNO:103,104,进行了进一步的表征。在最优化之后,SEQIDNO:103,104,显示出提供了在6小时内具有完全转化(50mM)和非常高的对映选择性(98%ee)的(S)-苯基乳酸(6a)。先前报道的5到6的生物催化转化的最高对映选择性是75%ee,是通过使用假单胞菌菌株的全细胞转化获得的。(Hashimoto,Y.;Kobayashi,E.;Endo,T.;Nishiyama,M.;Horinouchi,S.Biosci.Biotech.Biochem.1996,60,1279.)
表7.腈水解酶II催化产生芳基乳酸衍生物和类似物6a
项目 6中的Ar 比活性b TOFc %eed
1 C6H5 25 16 99
2 2-Me-C6H5 160 100 95
3 2-Br-C6H5 121 76 95
4 2-F-C6H5 155 97 91
5 3-Me-C6H5 21 13 95
6 3-F-C6H5 22 14 99
7 1-萘基 64 40 96
8 2-吡啶基 10.5 6.6 99
9 3-吡啶基 11.6 7.2 97
10 2-噻吩基 3.4 2.1 96
11 3-噻吩基 2.3 1.4 97
(a)除了使用了0.016mg/mL的腈水解酶之外,反应条件如表13所示。在6小时内观察到了到6的完全转化。(b)-(d)参见表13。苯基乳酸的绝对构型被确定为(S),项目2-11基于相同手性HPLC峰洗脱顺序而指定。
邻位和间位取代基显示出可以被腈水解酶II很好的耐受,相对于亲本底物5a,邻位取代的衍生物可以惊人地以较高比率被转化。新颖杂芳族衍生物,如2-吡啶基、3-吡啶基、2-噻吩基和3-噻吩基乳酸,以高转化和对映选择性被制备(项目8-11)。未预料到地,对位取代基大大地降低了这些反应的速率,在这些条件下完全转化需要两周时间。
我们检验的最终转化是容易获得的前手性底物3-羟基戊二酰基腈(7)的去对称化(Johnson,F.;Panella,J.P.;Carlson,A.A.J.Org.Chem.1962,27,2241),以提供羟基酸(R)-8,一旦被酯化为(R)-9,是在生产降低胆固醇的药物LIPITORTM中使用的中间产物。先前报道在该过程中使用酶的尝试没有成功,是以低选择性(最高:22%ee)和不期望的(S)-构型产生8的。(Crosby,J.A.;Parratt,J.S.;Turner,N.J.Tetrahedron:Asymmetry1992,3,1547;Beard,T.;Cohen,M.A.;Parratt,J.S.;Turner,N.J.Tetrahedron:Asymmetry1993,4,1085;Kakeya,H.;Sakai,N.;Sano,A.;Yokoyama,M.;Sugai,T.;Ohta,H.Chem.Lett.1991,1823.)
腈水解酶
筛选腈水解酶文库,发现并且分离了独特的酶,该酶提供了所要求的具有高转化率(>95%)和>90%ee的产物(R)-8。使用(R)-特异性腈水解酶中的一种,在1.0g等级上进行该过程(240mM7,30mg酶,22℃,pH7),在22小时后,以98%的产率和95%ee分离出(R)-8。有趣的是,相同的筛选程序也鉴别了以90-98%ee提供另外一种的对映异构体(S)-8的腈水解酶。因此,生物多样性的广泛筛选发现了以高对映选择性提供中间产物8的任一对映异构体的酶。我们发明了能提供(R)-8的第一种酶,强调了能使用大的和多样化的腈水解酶文库的这一优点。
通过探究我们的环境基因组文库,该文库是从未培养的DNA产生的,我们已经发明了大量新颖腈水解酶。该研究已经揭示了能提供扁桃酸和芳基乳酸衍生物的特异性腈水解酶,以及以高产率和对映体过量提供4-氰基-3-羟基丁酸的任一种对映异构体的腈水解酶。
程序和分析数据:
羟基戊二酰基腈是从TCIAmerica购买的,并且是刚刚购买到就使用的。用于制备芳基乳酸标准的氨基酸是从PepTech(Cambridge,MA)购买的。(R)-3-羟基-4-氰基丁酸是从GatewayChemicalTechnology(St.Louis,MO)得到的。(R)-和(S)-扁桃酸以及(R)-和(S)-苯基乳酸标准是从SigmaAldrich购买的。所有其它的试剂是从SigmaAldrich购买的,并且在使用时没有经过进一步的纯化。从Aldrich购买的硅胶(SilicaGel),70-230mesh(目),被用于色谱纯化。所有1HNMRs和13CNMRs是在BrukermodelAM-500仪器上运行的,设置为室温,对1H和13C分别为500MHz和125MHz。质谱分析和单位质量分辨率是通过流动注射分析(FIA)实现的,使用了Perkin-ElmerSciexAPI-4000TURBOIONTMSprayLC/MS/MS系统。LC流量是通过SchimadzuLC-10Advp泵提供的,具有0.05%醋酸和MeOH。注射是通过Valco注射阀实现的。HPLC分析是在具有Astec’sChirobioticR柱(100X4.6mm,目录编号(catno.)13022或150X4.6mm,目录编号(catno.)13023)或Daicel’sChiralcelOD柱(50X4.6mm,目录编号(catno.)14022)的Agilent1100HPLC上进行的,DAD探测器设置为210、220、230和250nm。对于比旋光,使用PerkinModel341Polarimeter,设置为589nm,钠灯,癌室温下,使用100mm路径长度的池。比旋光的浓度以克/100mL溶剂表示。微生物技术根据已公开的规程执行。(Sambrook,J.Fritsch,EF,Maniatis,T.(1989)MolecularCloning:ALaboratoryManual(第二版),ColdSpringHarborLaboratoryPress,PlainviewNY.)分离了羟基乙酸产物,通过与文献中除了(-)-3-吡啶基羟基乙酸之外的构型已定化合物的旋光数据的比较,确定了所有情况下的绝对构型为(R),根据我们的理解该化合物(-)-3-吡啶基羟基乙酸不是单一对映异构体。(对于扁桃酸、2-氯扁桃酸、2-甲基扁桃酸、3-氯扁桃酸、3-溴扁桃酸和4-氟扁桃酸参见Hoover,J.R.E.;Dunn,G.L.;Jakas,D.R.;Lam,L.L.;Taggart,J.J.;Guarini,J.R.;Philips,L.J.Med.Chem.1974,17(1),34-41;对于2-溴扁桃酸参见Collet,A.;Jacques,J.;Bull.Soc.Chem.Fr.1973,12,3330-3331;对于1-和2-萘基羟基乙酸参见Takahashi,I;Y.Aoyagi,I.Nakamura,Kitagawa,A.,Matsumoto,K.,Kitajima,H.Isa,K.Odashima,K.Koga,K.Heterocycles1999,51(6),1371-88;对于3-噻吩基羟基乙酸参见Gronowitz,S.Ark.Kemi,1957,11,519-525.)
对于芳基乳酸产物,通过与文献中的旋光数据的比较,建立了苯基乳酸的绝对构型为(S),对于所有其它苯基乳酸产物,使用手性HPLC基于洗脱次序预测绝对构型。通过衍生为(R)-(-)-甲基(3-O-[苯甲酰]-4-氰基)-丁酸酯,和与文献中的构型已定的化合物的旋光数据的比较,建立3-羟基-4-氰基-丁酸的绝对构型。(3.Beard,T.Cohen,M.A.Parratt,J.S.Turner,N.J.Tetrahedron:Asymm.4(6),1993,1085-1104.)
腈水解酶发现和表征方法:
1.腈水解酶选择
在腈底物上针对腈水解酶选择进行大肠杆菌(Escherichiacoli)筛选宿主菌株,SEL700的最优化。用卡那霉素抗性环境DNA文库对在10mMMgSO4中的Abs600nm=1,SEL700筛选宿主的重悬浮液进行感染,在37℃感染45分钟,这样可以获得文库的完全筛选覆盖度。被感染的细胞,现在指示为卡那霉素抗性,被平板于卡那霉素LB平板上,允许在30℃生长过夜。最小滴定量平板也被用来确定感染效率。第二天早晨用10mMMgSO4集中、洗涤和重悬浮细胞。将转化的克隆接种在M9培养基中(不含氮),含有10mM腈水解酶底物。M9培养基包括1XM9盐(省略NH4Cl)、0.1mMCaCl2、1mMMgSO4、0.2%葡萄糖和大约10mM腈选择底物。然后于30℃温育,以200rpm振荡选择培养物,时间直达五周。通过生长,鉴别阳性腈水解酶培养物,这是由于阳性克隆具有水解腈底物的能力。通过对生长的选择培养物划线接种,鉴别阳性克隆,随后在相同的合成培养基中,再次培养分离的群落。然后分离来自任何表现出再生长的阳性传代培养物的DNA,并且对其测序,以确认发现了腈水解酶基因,以及确定该基因的独特性质。
2.腈水解酶的生物淘选
传统过滤提升杂交筛选规程(tranditionalfilterlifthybridizationscreeningprotocols)限于具有大约106-107个成员的文库。尝试筛选一个文库,将需要大约5000个过滤提升。因此,已经开发了溶液相和其它生物淘选格式,用于基于超高通量顺序的筛选,允许快速筛选含有高达108个成员的环境文库。在溶液格式中,在促进杂交的条件下,将来自大量数目的文库克隆的DNA与相关标记的分子混和。然后,从溶液中,去除标记克隆和杂交DNA,并且在一定严格水平下洗涤,以去除与探针不具有序列同一性的克隆。然后,洗脱且回收杂交DNA。对相关克隆进行测序和克隆,以提供相关酶活性。对于相关序列,该方法已经被证明每一轮获得了高达1000倍的富集。
3.高通量腈水解酶活性测定
用在0.25mL测定溶液中的25mM(~3mg/mL)底物、0.1mg/mL腈水解酶进行活性测定。测定溶液包括0.1M磷酸钠缓冲液中的0-10%(v/v)MeOH,pH7-9,温度为37℃或22℃。除非另外说明,在5分钟转化时间点,测量比活性,单位表示为μmolmg-1min-1。通过将酶产物浓度与外消旋酸性产物的标准曲线比较,用高通量HPLC分析确定对映体过量和转化率。产物的分析条件列于下述表中。
分析方法:
羟腈(底物)合成:
扁桃腈合成方法A:将丙酮合氰化氢(685μl,7.5mmol),醛(5mmol)和催化性二异丙基乙胺(DIEA)(13μl,0.075mmol)在0℃混和。将反应物在冰上搅拌45分钟。为了推进向产物的平衡,在真空中去除丙酮。随后,用H2SO4(3μL)酸化粗反应物,并且于-20℃保存。用薄层层析(TLC)监控反应进展(3:1己烷/乙酸乙酯(EtOAc))。
扁桃酸合成方法B:将醛(5mmol)和乙酸(315μL,5.5mmol)加入到溶解在MeOH(1mL)中的KCN(358mg,5.5mmol)溶液中,温度0℃。在冰上搅拌1小时后,在真空中去除MeOH,用EtOAc和H2O分配粗反应物。保留有机组分,真空浓缩。用TLC分析监控反应进展(3:1己烷/EtOAc)。
芳基乙醛羟腈:,在氮(克)氛围下,将芳基乳酸(50mmol)溶解在放置在双颈500ml圆底烧瓶中的50ml无水四氢呋喃(THF)中。等到该溶液冷却到0℃,在剧烈混和下,缓慢地加入105mmol叔己基氯硼烷-二甲基硫醚(thexylchloroborane-dimethylsulfide)(2.55M,在二氯甲烷中)。允许反应继续到过夜。加入过量乙酸(10ml)猝灭反应,随后通过加入10ml水以酸化反应物。在室温下搅拌1小时后,真空中去除溶剂,将残余物溶解在100ml水中,用200mlEtOAc提取。在硫酸钠上干燥EtOAc层,过滤,然后在真空中浓缩。随后,将60mmolKCN加入到残余物中,接着加入100ml甲醇。然后将溶液冷却到0℃,加入乙酸(60mmol)。在所有KCN溶解后,将反应物搅拌1-2小时。在真空中去除溶剂,将残余物溶解在100ml水和200mlEtOAc中。用EtOAc将水层再次提取一次。混和EtOAc提取物,用饱和盐水洗涤,并且在硫酸钠上干燥,过滤,然后在真空中干燥,以得到粗羟腈产物。在必要的时候,通过二氧化硅-凝胶柱(己烷/EtOAc)纯化羟腈。
2-氯扁桃腈:1HNMR(CDCl3,500MHz)δ7.69(m,1H),7.41(m,1H),7.36(m,2H),5.84(s,1H),3.07(br,1H)。13CNMR(CDCl3,125MHz)δ132.89,132.73,131.22,130.19,128.48,127.84,118.24,60.87。对于[C8H6ClNO]167.01,用质谱计算得到实测值167.9(LC-MS+)。
2-溴扁桃腈:1HNMR(CDCl3,500MHz)δ7.72(d,1H,J=6.58),7.62(d,1H,J=8.35),7.43(t,1H,J=8.42),7.30(t,1H,J=7.00),5.85(s,1H)。13CNMR(CDCl3,125MHz)δ134.550,133.584,131.564,128.819,128.535,122.565,118.153,63.379。
2-甲基扁桃腈:1HNMR(CDCl3,500MHz)δ:7.60(d,1H,J=7.4),7.23-7.35(m,3H),5.66(s,1H),2.44(s,3H)。13CNMR(CDCl3,298K,125MHz)δ:136.425,133.415,131.450,130.147,127.204,126.894,118.952,18.916。对于[C9H9NO]147.07,用质谱计算得到147.2(ESI+)。
3-氯扁桃腈:1HNMR(CDCl3,500MHz)δ7.55(s,1H),7.43-7.37(m,3H),5.54(s,1H)。13CNMR(CDCl3,125MHz)δ137.183,135.480,130.718,130.303,127.047,124.891,118.395,63.156。对于[C8H6ClNO]167.01,用质谱(MS)计算得到167.9(LC-MS+)。
3-溴扁桃腈:1HNMR(CDCl3,500MHz)δ7.69(s,1H),7.56(d,J=6.2Hz,1H),7.45(d,J=5.5Hz,1H),7.32(t,J=6.4.Hz,1H),5.53(s,1H)。13CNMR(CDCl3,125MHz)δ137.376,133.201,130.934,129.208,125.359,123.380,118.458,63.006。对于[C8H6BrNO]212.0,用质谱计算得到211.9(LC-MS+)。
4-氟扁桃腈:1HNMR(CDCl3,500MHz)δ5.54(s,1H),7.13(m,2H),7.51-7.53(m,2H)。13CNMR(CDCl3,125MHz)δ63.02,116.44,118.97,128.90,131.54,132.51,162.575。
4-氯扁桃腈:1HNMR(CDCl3,500MHz)δ7.47(d,J=7.0Hz,2H),7.42(d,J=7.0Hz,2H),5.53(s,1H)。13CNMR(CDCl3,125MHz)δ136.209,133.845,129.647,128.232,118.630,63.154。对于[C8H6CINO]167.01,用质谱计算得到167.9(LC-MS+)。
1-萘基羟腈:1HNMR(CDCl3,500MHz)δ8.14(d,1H,J=8.5),7.92(t,2H,J=6.1),7.82(d,1H,J=5.7),7.62(t,1H,J=6.1),7.56(t,1H,J=6.1),7.50(t,1H,J=6.1),6.18(s,1H);13CNMR(CDCl3,125MHz)δ137.0,135.7,134.2,131.1,129.2,127.5,126.7,125.8,125.3,123.1,119.0,62.4;对于[C12H9O]183.21,用质谱计算得到183.2(ESI+)。
2-萘基羟腈:1HNMR(CDCl3,500MHz)δ8.03(s,1H),7.92(d,1H,J=8.6),7.87-7.91(m,2H),7.61(dd,1H,J=6.7,1.2),7.55-7.60(m,2H),5.72(s,1H);13CNMR(CDCl3,125MHz)δ134.9,133.9,132.7,129.6,128.6,128.0,127.4,127.2,126.4,123.9,118.9,64.1;对于[C12H9O]183.21,用质谱计算得到183.2(ESI+,电喷雾电离质谱+)。
3-吡啶基羟腈:1HNMR(CDCl3,500MHz)δ:8.62(d,1H,J=1.8),8.57(d,1H,J=5.1),7.94(d,1H,J=8.1),7.41(dd,1H,J=8.1,5.1),5.64(s,1H);13CNMR(CDCl3,125MHz)δ149.921,147.355,135.412,133.044,124.443,118.980,61.085。对于[C7H6N2O]134.05,用质谱计算得到135.2(ESI+)。
3-噻吩基羟腈:1HNMR(CDCl3,500MHz)δ7.45(d,J=2.2Hz1H),7.56(dd,J=6.2Hz,1H),7.45(d,J=5.5Hz,1H),7.32(t,J=6.4.Hz,1H),5.53(s,1H)。13CNMR(CDCl3,125MHz)δ137.376,133.201,130.934,129.208,125.359,123.380,118.458,63.006。对于[C6H5NOS]139.01,用质谱计算得到139.9(LC-MS+)。
苯基乙醛羟腈:1HNMR(CDCl3,500MHz)δ7.34(m,5H),4.64(t,J=6.75Hz,1H),3.11(d,J=6.75Hz,2H),2.75(br,1H):13CNMR(CDCl3,125MHz)δ133.96,129.91,129.16,128.08,119.47,62.33,41.55。
2-甲基苯基乙醛羟腈:1HNMR(CDCl3,500MHz)δ7.11(m,4H),4.61(t,J=6.62Hz,1H),3.12(d,J=6.62Hz,2H),2.14(s,3H):13CNMR(CDCl3,125MHz)δ136.94,136.47,132.57,130.48,127.61,125.75,120.11,62.95,44.73对于[C10H11NO]:161.08,用质谱计算得到162.2(M+Na,ESI+)
2-溴苯基乙醛羟腈:1HNMR(CDCl3,500MHz)δ7.20(m,4H),4.78(t,J=6.5Hz,1H),3.26(d,J=6.5Hz,2H)。13CNMR(CDCl3,100MHz)δ133.93,132.82,131.72,129.21,128.12,124.86,119.41,63.02,44.89。
2-氟苯基乙醛羟腈:1HNMR(CDCl3,500MHz)δ7.2(m,2H),7.02(m,2H),4.50(dd,J=4.62Hz,J=7.88Hz,1H),3.23(dd,J=4.62Hz,1J=14.12Hz,1H),2.97(dd,7.88Hz,14.12Hz,1H)。13CNMR(CDCl3,125MHz)δ132.18,131.52,129.66,129.03,128.07,124.05,115.8,63.02,44.79。对于[C9H8FNO]165.06,用质谱计算得到164.2(ESI+)。
3-甲基苯基乙醛羟腈:1HNMR(CDCl3,500MHz)δ7.18(m,1H),7.02(m,3H),4.54(dd,J=4.62Hz,J=8Hz,1H),3.06(dd,J=4.62Hz,J=14.38Hz,1H),2.83(dd,J=8Hz,J=14.38Hz,1H),2.36(s,3H)。13CNMR(CDCl3,125MHz)δ176.25,138.18,136.0,130.97,128.93,127.68,126.58,76.42,34.29,37.69。对于[C10H12O3]180.08,用质谱计算得到180.0(ESI+)。
3-氟苯基乙醛羟腈:1HNMR(CDCl3,500MHz)δ7.18(m,2H),6.95(m,2H),4.44(dd,1H),3.11(dd,1H)。13CNMR(CDCl3,125MHz)δ130.40,125.53,124.85,116.92,114.87,114.50,119.77,61.97,41.27。
1-萘基乙醛羟腈:1HNMR(CDCl3,500MHz)δ8.07(m,1H),7.86(m,1H),7.74(m,1H),7.41(m,4H),4.20(t,J=7Hz,1H),3.33(d,J=6.8Hz,2H)13CNMR(CDCl3,125MHz)δ177.7,140.31,129.74,129.24,128.92,128.26,127.84,125.63,124.53,124.05,123.42,70.58,38.0对于[C13H11NO]197.08,用质谱计算得到197.1(ESI+)。
2-吡啶基乙醛羟腈:1HNMR(CDCl3,500MHz)δ8.50(m,1H),7.85(m,1H),7.48(m,1H),7.34(m,1H),4.42(m,1H),3.19(dd,J=3.5Hz,J=13.7Hz,2H)。13CNMR(CDCl3,125MHz)δ157.44,145.69,140.24,126.96,126.16,122.99,60.30,42.60。对于[C8H8N2O]148.06,用质谱计算得到149.1(ESI+)。
3-吡啶基乙醛羟腈:1HNMR(CDCl3,500MHz)δ8.62(d,1H,J=1.8),8.57(d,1H,J=5.1),7.94(d,1H,J=8.1),7.41(dd,1H,J=8.1,5.1),5.64(s,1H)。13CNMR(CDCl3,125MHz)δ:149.921,147.355,135.412,133.044,124.443,118.980,61.085。对于[C7H6N2O]134.05,用精确质量(exactmass)计算得到135.2(ESI+)。
2-噻吩基乙醛羟腈:1HNMR(CDCl3,500MHz)δ7.1(m,1H),6.9(m,1H),6.8(m,1H),4.11(t,J=7.0Hz,1H),2.86(d,J=7.0Hz,2H)。13CNMR(CDCl3,125MHz)δ127.68,127.41,125.58,124.60,118.70,63.25,44.84。
3-噻吩基乙醛羟腈:1HNMR(CDCl3,500MHz)δ7.09(m,3H),4.60(t,J=6.25Hz,1H),3.12(d,J=6.25Hz,2H)。13CNMR(CDCl3,125MHz)δ129.05,127.16,125.27,122.65,119.87,61.58,44.90。
从相应的羟腈制备外消旋扁桃酸标准:(Stoughton,R.W.J.Am.Chem.Soc.1941,63,2376)将2-溴扁桃腈(230mg,1.08mmol)溶解在浓盐酸(1mL)中,在室温搅拌18小时,然后于70℃搅拌24小时。在冷却后,用乙醚(4x2mL)提取反应混合物。将有机提取物混和,在MgSO4上干燥,过滤,在真空中浓缩。分离出无色粉末2-溴扁桃酸(180mg,0.78mmol,70%产率)。
从相应的氨基酸制备外消旋扁桃酸标准:在室温下,在氮气(g)氛围下,将苯丙氨酸(10mmol,1.65g)溶解在30mL2NH2SO4中。在3-4小时的时间内,将亚硝酸钠(1.4g,在3ml水溶液中,2当量(eq))缓慢地加入到反应混合物中,在室温下,在氮气(g)氛围下,用力搅拌。将反应混合物搅拌过夜,然后将苯基乳酸提取到乙醚(3x30ml)中。在MgSO4上将混和的醚提取物干燥,然后过滤并且在真空中浓缩。(Kenji,I.;Susumu,A.;Masaru,M.;Yasuyoshi,U.;Koki,Y.;Koichi,K.专利号WO0155074,公开日期:2001-08-02)。
酶促制备α-羟基酸的一般方法:
(R)-(-)-扁桃酸在pH8,包括10%v/v甲醇的150mL磷酸钠(100mM)缓冲液中的扁桃腈(1.005g,7.56mmol)溶液中,于37℃加入9mg腈水解酶1(以腈水解酶含量进行标准化),所述溶液已经被氮气(g)搅动。反应在氮气(g)氛围下,在旋转的平板摇床上进行。通过取出等分试样,用于HPLC分析来监控反应进程。在温育3小时后,用1N盐酸将反应混合物酸化到pH2,用乙醚(4x50ml)提取。在真空中浓缩有机组分,然后将残余物吸收在10%碳酸氢钠溶液中。然后用乙醚(3x50ml)洗涤含水溶液,接着用1N盐酸将该溶液酸化到pH2,用乙醚(3x50ml)提取。混和有机组分,用盐水洗涤,在MgSO4上干燥,过滤,然后在真空中浓缩。分离出无色粉末(R)-(-)-扁桃酸,产率86%(933mg,6.22mmol)。1HNMR(DMSO-d6,500MHz)δ12.6(br,s,1H),7.41(m,2H),7.34(m,2H),7.28(m,1H),5.015(s,1H)。13CNMRDMSO-d6,125MHz)δ174.083,140.216,128.113,127.628,126.628,72.359。对于[C8H8O3]150.07,用质谱计算得到实测值150.9(ESI+);ee=98%[HPLC]。[α]20 598=-134.6(c=0.5,甲醇)。
(-)-2-氯扁桃酸1HNMR(DMSO-d6,500MHz)δ7.75(m,1H),7.44(m,1H),7.34(m,2H),5.34(s,1H)。13CNMR(DMSO,298K,125MHz)δ173.070,137.985,132.105,129.399,129.158,128.705,127.235。对于[C8H7ClO3]186.0,用质谱计算得到185.0(LC-MS-)。ee=96%[HPLC]。92%产率。[α]20 598=-137.6(c=0.5,乙醇)。
(-)-2-溴扁桃酸1HNMR(DMSO-d6,500MHz)δ7.60(d,J=7.93,1H),7.48(m,1H),7.40(m,1H),7.25(m,1H),5.30(s,1H)。13CNMRDMSO-d6,125MHz)δ172.994,139.61,132.355,129.652,128.753,127.752,122.681,71.644。对于[C8H7BrO3]230.0,用质谱计算得到230.9。ee=96%[HPLC]。92%产率。[α]20 598=-116.4(c=0.5,乙醇)。
(-)-2-甲基扁桃酸1HNMR(DMSO-d6,500MHz)δ11.78(bs,1H),7.38(m,1H),7.16-7.38(m,3H),5.18(s,1H),2.35(s,3H)。13CNMRDMSO-d6,125MHz)δ174.229,138.623,135.649,130.129,127.491,126.990,125.698,125.698,69.733,18.899。对于[C9H10O3]166.1,用质谱计算得到165.2。ee=91%[HPLC]。86%产率。[α]20 598=-164.4(c=0.5,乙醇)。
(-)-3-氯扁桃酸1HNMR(DMSO-d6,500MHz)δ7.46(s,1H),7.36(m,3H),5.07(s,1H)。13CNMR(DMSO,298K,125MHz)δ173.554,142.685,132.813,130.069,127.568,126.355,125.289,71.659。对于[C8H7ClO3]186.0,用质谱计算得到185.34(MALDITOF-)。ee=98%[HPLC]。70%产率。[α]20 598=-120.48(c=0.5,乙醇)。
(-)-3-溴扁桃酸1HNMR(DMSO-d6,500MHz)δ7.60(s,1H),7.49(m,1H),7.42(m,1H),7.31(m,1H),5.06(s,1H)。13CNMR(DMSO,298K,125MHz)δ173.551,142.917,130.468,130.379,129.237,125.687,121.404,71.605。对于[C8H7BrO3]229.98,用质谱计算得到229.1(LC-MS)。ee=98%[HPLC]。82%产率。[α]20 598=-84.8(c=0.5,甲醇)。
(-)-4-氟扁桃酸1HNMR(DMSO,298K,500MHz)δ12.65(s,1H),7.44(m,2H),7.17(m,2H),5.91(s,1H),5.03(s,1H)。13CNMR(DMSO,298K,125MHz)δ173.93,162.57,136.47,128.61,128.55,114.96,114.80,71.61。对于[C8H7FO3]170.0,用质谱计算得到168.8。ee=99%[HPLC]。81%产率。[α]20 598=-152.8(c=0.5,甲醇)。
(-)-1-萘基羟基乙酸1HNMR(DMSO-d6,500MHz)δ8.28-8.26(m,1H),7.87-7.93(m,2H),7.47-7.58(m,4H),5.66(s,1H)。13CNMRDMSO-d6,125MHz)δ174.288,136.284,133.423,130.654,128.353,128.192,125.926,125.694,125.613,125.266,124.558,70.940。对于[C12H10O3]:202.21,用质谱计算得到201.37(MALDITOF-,基体辅助激光解吸电离飞行时间质谱)。ee=95%[HPLC]。90%产率。[α]20 598=-115.4(c=0.5,乙醇)。
(-)-2-萘基羟基乙酸1HNMR(DMSO-d6,500MHz)δ12.6(bm,1H),7.88-7.93(m,4H),7.48-7.56(m,3H),5.20(s,1H)。13CNMR(DMSO-d6,125MHz)δ174.005,137.760,132.644,132.498,127.811,127.658,127.506,127.209,125.993,125.334,124.761,72.472。对于[C12H10O3]202.21,用质谱计算得到201.37(MALDITOF)。ee=98%[HPLC]。68%产率。[α]20 598=-115.4(c=0.5,乙醇)。
(-)-3-吡啶基羟基乙酸该反应在100mM甲酸铵缓冲液中进行,pH8。为了分离产物,通过10,000MWCO(分子量截留值)膜过滤反应混合物,以去除酶,然后在真空中浓缩。1HNMR(DMSO-d6,500MHz)δ8.56(s,1H),8.36(d,J=4.57Hz,1H),8.25(s,1H),7.71(m,1H),7.25(dd,J=4.98,4.80Hz,1H),5.45(s,1H)。13CNMRDMSO-d6,125MHz)δ165.911,147.862,147.251,139.118,133.381,122.746,71.508。对于[C7H7NO3]153.04,用质谱计算得到154.0(MALDITOF)。ee=92%[HPLC]。84%产率。[α]20 598=-65.2(c=0.5,水)。
(-)-3-噻吩基羟基乙酸1HNMR(DMSO-d6,500MHz)δ7.48(m,1H),7.45(d,J=2.81,1H),7.10(m,1H),5.09(s,1H),3.33(s,1H)。13CNMR(DMSO,298K,125MHz)δ173.704,141.109,126.446,126.042,122.247,68.915。对于[C6H6O3S]158.00,用质谱计算得到157.224(MALDITOF)。ee=95%[HPLC]。70%产率。[α]20 598=-123.28(c=0.5,甲醇)。
(S)-(-)-苯基乳酸1HNMR(DMSO-d6,500MHz)δ7.28(m,5H),4.17(dd,J=4.5Hz,J=8.3Hz,1H),2.98(dd,J=4.5Hz,J=13.7Hz,1H),2.79(dd,J=8.3Hz,J=13.7Hz,1H)。13CNMR(DMSO,298K,125MHz)δ178.16,133.4,129.27,128.6,127.3,70.45,44.12。ee=97%[HPLC],84%产率。[α]20 598=-17.8(c=0.5,甲醇)。
(-)-2-甲基苯基乳酸1HNMR(DMSO-d6,500MHz)δ7.16(m,4H),4.47(dd,J=3.9Hz,J=8.8Hz,1H),3.25(dd,J=3.9Hz,J=14.3Hz,1H),2.94(dd,J=8.8Hz,J=14.3Hz),2.35(s,3H)。13CNMR(DMSO,298K,125MHz)δ178.61,137.08,134.74,130.80,130.25,127.44,126.34,70.93,37.67,19.79。对于[C10H12O3]180.08,用质谱计算得到180.0(ESI+)。86%产率。ee=95%[HPLC]。[α]20 598=-13.2(c=0.5,甲醇)。
(-)-2-溴苯基乳酸1HNMR(DMSO-d6,500MHz)δ7.28(m,4H),4.60(dd,J=4.0Hz,J=9.1Hz,1H),3.45(dd,J=4.0Hz,J=14.1Hz,1H),3.04(dd,J=8.0Hz,J=14.1Hz,1H)。13CNMR(DMSO,298K,125MHz)δ178.70,136.05,133.21,132.10,128.99,127.72,125.0,70.04,40.76。对于[C9H9BrO3]243.9,用质谱计算得到243.3(ESI+)。91%产率。ee=93%[HPLC],[α]20 598=-17.6(c=0.5,甲醇)。
(-)-2-氟苯基乳酸1HNMR(DMSO-d6,500MHz)δ7.10(m,4H),4.64(t,J=6.8Hz,1H),3.11(d,J=6.8Hz,2H)。13CNMR(DMSO,298K,125MHz)δ132.18,131.52,129.66,129.03,128.07,124.05,115.8,63.02,44.79。对于[C9H8FNO]:165.06,用质谱计算得到164.2(ESI+)。91%产率。ee=88%[HPLC]。[α]20 598=-14.0(c=0.5,甲醇)。
(-)-3-甲基苯基乳酸1HNMR(DMSO-d6,500MHz)δ7.18(m,1H),7.02(m,3H),4.54(dd,J=4.6Hz,J=8.0Hz,1H),3.06(dd,J=4.54Hz,J=14.4Hz,1H),2.83(dd,J=8.0Hz,J=14.4Hz,1H),2.36(s,3H)。13CNMR(DMSO,298K,125MHz)δ175.88,163.80,130.33,130.09,125.7,116.68,113.75,71.31,34.28。对于[C10H11NO]161.08,用质谱计算得到162.2(ESI+)。80%产率。ee=98%[HPLC]。[α]20 598=-2.4(c=0.5,甲醇)。
(-)-3-氟苯基乳酸1HNMR(DMSO-d6,500MHz)δ7.2(m,1H),6.9(m,3H),4.56(dd,4.5Hz,J=7.9Hz,1H),3.09(dd,J=4.5Hz,J=14.1Hz,1H),2.86(dd,J=7.9Hz,J=14.1Hz,1H)。13CNMR(DMSO,298K,125MHz)δ175.88,163.80,130.33,130.09,125.7,116.68,113.75,71.31,34.28。对于[C9H9O3F]184.05,用质谱计算得到184.1(ESI+)。82%产率。ee=97%[HPLC]。[α]20 598=-5.2(c=0.5,甲醇)。
(-)-1-奈基乳酸1HNMR(DMSO-d6,500MHz)δ8.57(m,1H),8.21(m,1H),8.08(m,1H),7.61(m,4H),4.64(dd,3.5Hz,8.5Hz,1H),3.84(dd,J=3.5Hz,J=14.5Hz,1H),3.38(dd,J=8.5Hz,J=14.5Hz,1H)。13CNMR(DMSO,298K,125MHz)δ177.7,140.31,129.74,129.24,128.92,128.26,127.84,125.63,124.53,124.05,123.42,70.58,38.0。对于[C13H11NO]197.08,用质谱计算得到197.1(ESI+)。87%产率。ee=94%[HPLC]。[α]20 598=-16.2(c=0.5,甲醇)。
(-)-2-吡啶基乳酸1HNMR(DMSO-d6,500MHz)δ8.49(m,1H),7.62(m,1H),7.21(m,2H),4.50(t,J=5.0Hz,1H),3.01(d,J=5.0Hz,2H)。13CNMR(DMSO,298K,125MHz)δ178.8,159.79,148.84,136.89,124.35,121.75,71.14,44.09。对于[C8H9NO3]:167.06,用质谱计算得到167.0(ESI+)。62%产率。ee=94%[HPLC]。[α]20 598=-3.6(c=0.5,甲醇)。
(-)-3-吡啶基乳酸1HNMR(DMSO-d6,500MHz)δ8.43(m,2H),7.62(m,1H),7.28(m,1H),4.57(t,5.37Hz,1H),2.85(d,5.37Hz,2H)。13CNMR(DMSO,298K,125MHz)δ176.6,150.03,147.12,136.41,129.45,123.26,61.56,31.46。对于[C8H9NO3]167.06,用质谱计算得到167.0(ESI+)。59%产率。ee=94%[HPLC]。[α]20 598=-4.0(c=0.5,甲醇)。
(-)-2-噻吩基乳酸1HNMR(DMSO-d6,500MHz)δ7.18(m,1H),6.94(m,1H),6.90(m,1H),4.49(dd,J=4.1Hz,J=6.25Hz,1H),3.36(dd,J=4.1Hz,J=15.0Hz,1H),3.26(dd,J=6.25Hz,J=15.0Hz,1H)。13CNMR(DMSO,298K,125MHz)δ127.68,127.41,125.58,124.60,118.70,63.25,44.84。对于[C7H7NOS]153.02,用质谱计算得到153.0(ESI+)。85%产率。ee=95%[HPLC]。[α]20 598=-13.0(c=0.5,甲醇)。
(-)-3-噻吩基乳酸1HNMR(DMSO-d6,500MHz)δ7.30(m,1H),7.13(m,1H),7.01(m,1H),4.50(dd,J=4.25Hz,J=6.5Hz,1H),3.21(dd,J=4.25Hz,J=15.0Hz,1H),3.10(dd,J=6.5Hz,J=15.0Hz,1H)。13CNMR(DMSO,298K,125MHz)δ127.50,136.09,128.83,126.24,123.32,70.65,34.84。对于[C7H8O3S]172.02,用质谱计算得到172.1(ESI+)。81%产率。ee=96%[HPLC]。[α]20 598=-18.8(c=0.5,甲醇)。
3-羟基戊二酰基腈的酶促水解:
在室温下,将3-羟基戊二酰基腈(1.0g,9.0mmol,240mM)悬浮在氮气(g)搅动的磷酸钠缓冲液(37.5mL,pH7,100mM)中。加入细胞溶解产物(30mg,以腈水解酶含量进行标准化),使浓度达到0.8mg/ml酶,在100rpm和室温下震荡该反应物。通过TLC(1:1EtOAc:己烷,Rf=0.32,腈;Rf=0.0,酸)监控反应进程。22小时后,用1MHCl酸化反应物。用乙醚连续提取反应混合物。分离出黄色油状酸性产物(1.15g,98%产率)。1HNMR(DMSO,298K,500MHz)δ12.32(s,1H),5.52(s,1H),4.10(m,1H),2.70(dd,1H,J=16.8,4.1Hz),2.61(dd,1H,J=16.9,6.3Hz),2.44(dd,1H,J=15.4,5.3Hz),2.37(dd,1H,J=15.6,7.8Hz)。13CNMR(DMSO,298K,125MHz)δ171.9,118.7,63.4,41.2,25.2。对于[C5H7NO3]:129.0,用质谱计算得到130.0[M+H+],(ESI+)。
制备(R)-(-)-甲基(3-O-[苯甲酰]-4-氰基)-丁酸酯
在室温下,将苯甲酰氯(0.068ml,0752mmol)加入到溶解在嘧啶(2.0ml)中的(R)-甲基-(3-羟基-4-氰基)-丁酸酯(71.7mg,0.501mmol)的搅拌溶液中。19小时后,加入另外的0.5当量苯甲酰氯(0.023ml,0.251mmol)。在23小时完成反应,这正如通过TLC所确定的。加入1ml水(H2O),用醚提取(3x10ml)。用盐水洗涤(2x10ml)。用MgSO4干燥混和的含水提取物。过滤掉干燥剂,通过旋转蒸发去除溶剂。通过柱层析(己烷:乙酸乙酯[2:1])纯化。组分的旋转蒸发产生了黄色油状产物(46mg,0.186mmol,37%)。1HNMR(DMSO,298K,500MHz)δ7.96(d,2H,J=7.8),7.70(t,1H,J=7.25),7.56(t,2H,J=7.8),5.55(m,1H),3.59(s,3H),3.13(m,2H),2.90(m,2H)。13CNMR(DMSO,298K,125MHz)δ169.6,164.5,133.8,129.3,128.9,128.5,117.3,66.0,51.8,37.5,22.2。对于[C13H13NO4]:247.25,用质谱计算得到270.3。[M+Na+]ee=95%[HPLC]。[α]20 598=-32.4(c=0.5,CHCl3)。
(R)-乙基-(3-羟基-4氰基)-丁酸酯的合成
制备溶解在无水乙醇(1.94mL)中的(R)-3-羟基-4-氰基-丁酸的0.2M溶液。将乙醇溶液滴加到过筛的1.0ml的无水1M盐酸醚溶液和无水乙醇的50:50(v/v)混合物中。在室温和氮气(g)氛围下,将反应物搅拌过夜。通过TLC监控反应,(1:1EtOAc:己烷,Rf=0.45,酯;Rf=0.0,酸,用p-茴香醛染色)。30小时后,通过旋转蒸发去除溶剂。将粗产物放入到25mL醚中,洗涤,是用5mL饱和碳酸氢盐和然后用5mL盐水进行洗涤。在MgSO4上干燥有机提取物,过滤,然后在真空中浓缩,产生了清澈油状产物。1HNMR(DMSO,298K,500MHz)δ5.60(d,1H,J=5.58Hz),4.12(m,1H),4.07(q,2H,J=7.1),2.66(m,2H),2.47(m,2H),1.87(t,3H,J=7.0)。13CNMR(DMSO,298K,125MHz)δ170.21,118.60,63.40,59.98,41.10,25.14,14.02。对于[C7H11NO3]:157.1,用质谱计算得到158.2[M+H+]。
实施例13:用于对映选择性产生(R)-2-氯扁桃酸的腈水解酶的最优化
氯扁桃酸具有如下结构:
鉴别从(R,S)-2-氯扁桃腈选择性地产生(R)-2-氯扁桃酸的腈水解酶。鉴别出腈水解酶,其有助于提高这些酶的对映选择性,并且确定了工艺条件对酶的影响。完成对酶促腈水解的反应条件的检验,以便提高产物的对映体过量。另外,进行工艺条件对酶的影响的进一步研究。
2-氯扁桃腈(R)-2-氯扁桃酸
在这一方面,对映选择性产生(R)-2-氯扁桃酸是目的。选择一种酶,SEQIDNOS:385,386,用于进一步确认其针对2-氯扁桃腈的对映选择性。SEQIDNOS:385,386显示出对于工艺成分是稳定的,具有8小时的半衰期。酶受到2-氯苯甲醛和羟腈底物中的一种污染物,2-氯苯甲酸的抑制。酶反应按比例逐步增加,直到底物浓度为45mM2-氯扁桃腈。获得了大于90%的转化,以及97%的ee。改进了手性HPLC方法,以去除底物中存在的污染峰。使用该方法在确定对映选择性中获得了改进的准确度。
筛选针对2-氯扁桃腈的腈水解酶,具有31种腈水解酶在该底物上表现出活性。9种酶显示出高对映选择性。对这些酶中的5种进行最优化,其中一种被鉴别为下一阶段开发的候选者。
在改进所选择的用于(R)-2-氯扁桃酸的酶的对映选择性的尝试中,对大量因素进行了研究,已知这些因素对这一特性以及酶的活性有所影响。这些因素包括pH,温度,缓冲强度和反应中所加入的溶剂。最初,选择了5种酶用于这些研究,选择是基于这些酶所获得的高对映选择性。这些酶是:SEQIDNOS:385,386,SEQIDNOS:197,198,SEQIDNOS:217,218,SEQIDNOS:55,56和SEQIDNOS:167,168。
pH的影响
在一系列pH值范围内进行酶促反应,从pH5到pH9。对于所有酶,观察到随着pH值的增加,活性和对映选择性有所增加。除了SEQIDNOS:385,386,pH9(0.1MTris-HCl缓冲液)被确定为活性和对映选择性的最适pH。SEQIDNOS:385,386的最适pH为pH8(0.1M磷酸钠缓冲液)。
温度的影响
这些酶表现出类似的温度曲线,在37℃和45℃测量出最高活性。尽管后面的温度导致较高的转化,但大部分酶的对映选择性显示出明显的偏爱较低温度,当温度升高至高于37℃时,ee值降低了10-20%。在SEQIDNOS:385,386的情况下,对映选择性的娇气的最适温度明显在37℃。因此,这一温度被确定为通过这些酶水解2-氯扁桃腈的最适温度。
酶浓度的影响
在同时进行的苯乙醛羟腈对映选择性水解为L-苯基乳酸的研究过程中,发现酶在反应过程中的浓度对反应的对映选择性有重大影响。这表明酶水解速度快于反应中剩余羟腈的外消旋作用速度。基于这一点,研究了酶浓度对于酶针对(R)-2-氯扁桃腈的对映选择性的影响。用标准酶浓度(0.6mg蛋白/ml),标准浓度的一半和标准浓度的四分之一进行了酶促反应。
下述表格表明反应所达到的最高转化率,用相应的ee表示。除了SEQIDNOS:385,386,似乎观察到,如果存在的话,对映选择性有所增加也非常小。因此,似乎剩余氯扁桃腈的外消旋速率不是获得较高对映选择性的限制因素。
其它阳性酶的研究
除了上述表中的酶,对大量其它腈水解酶针对2-氯扁桃腈的对映选择性进行了筛选。一些酶是最新发现的酶。一些酶进行了再次研究了,是在已经被发现对这些酶最适的条件下(pH8和37℃)进行。该筛选的结果如下述表中所示。
共溶剂浓度的影响
在酶促反应中,加入作为共溶剂的甲醇,显示出增加了ee值。为了确定能被加入到反应物中的最低水平的甲醇,在变化的甲醇浓度下进行了酶反应,变化范围为0-20%(v/v)。各种甲醇浓度之间,很明显,对映选择性没有显著性差异。然而,这些反应中的ee值是97-98%,而没有加入甲醇的对照组反应的ee值是95-96%。尽管在ee值上的差异较小,在研究过程中,甲醇的影响在不止一组实验中都有显示,因此认为该影响是显著的。
反应成分对SEQIDNOS:385,386的活性的影响
对酶的过程最优化的研究中的一个关键部分,涉及确定酶促反应中可能存在的任何化合物的影响。对于SEQIDNOS:385,386,这些成分被建立为起始材料,和羟腈的平衡产物,2-氯苯甲醛;产物,2-氯扁桃酸和底物中检测到的污染物,2-氯苯甲酸。发现,反应中加入氰化物对酶活性没有影响。也发现酶可以容忍微量三乙胺的存在。
各种反应成分对于SEQIDNOS:385,386的活性的影响,是通过在酶反应中加入各种水平的可能抑制剂来评价的。从这些实验中,显示出醛及其氧化产物,2-氯苯甲酸都对酶活性有所损害。在反应中加入5mM2-氯苯甲醛或5mM2-氯苯甲酸,对SEQIDNOS:385,386的活性分别有大约70%和40%的损失。
2-氯扁桃腈的按比例放大的水解
为了确认在用于产生(R)-2-氯扁桃酸中、由SEQIDNOS:385,386所获得的转化和对映选择性,进行了大规模反应,并从含水混合物中分离了产物。反应在20mL反应体积中进行,底物浓度为45mM2-氯扁桃腈。实现了羟腈的完全转化,所形成产物为30mM。产物的ee值是97%,酶的比活性是0.13mmol产物/mg腈水解酶/小时。
从该实验以及所进行的其它实验,显而易见,产物的形成不能说明底物的完全损失。在所有实验中,进行了含有腈的对照组样品,以便确定羟腈的分解程度。总的来说,在37℃,在4小时的时间段内,似乎损失了大约50%的底物。可以预期到,分解将一直到其平衡产物,氰化物和2-氯苯甲醛,该化合物将能进行进一步氧化。以90mM2-氯扁桃腈的底物浓度,也进行了较大规模的反应。然而,在反应中没有检测到产物。应该预期到,在较高底物浓度下,平衡产物的浓度,2-氯苯甲醛和污染物,2-苯甲酸将以较高量存在。基于上述结果,很可能在这样的条件下,酶将被完全抑制。
两相条件下的反应
使用两相系统,将有助于在酶反应步骤后回收产物。这些系统也被用于去除对酶具有抑制作用的产物或副产物。在使用多种溶剂的两相条件下,腈水解酶显示出具有活性。在上述较高底物浓度下所得的低转化率之后,进一步使用命中酶,SEQIDNOS:385,386,进行了两相系统的研究。重要的是,确定任意抑制因子是否能被溶剂相去除,以及使用两相系统是否能获得任何过程优势。
用己烷作为有机相,获得了有希望的结果。因此,进一步的研究涉及以两个不同水平使用该溶剂:水相体积的100%和70%,随着底物浓度的增加,高达90mM。将底物溶解在有机相中。己烷水平似乎对产物形成的水平没有影响,尤其是在2-氯扁桃腈浓度较高下。
再一次,在两相系统中,观察到了高转化,在5小时后观察到了76%的产物产量。产物形成率似乎比相应的单相系统中略微低一些,在相应的单相系统中反应是在1小时内完成的。在两相系统中,观察到了较低的对映选择性。导致这些结果的一些可能性是:(i)传质速率低于酶活性的速率或(ii)非极性溶剂直接影响酶。
在较高的底物浓度下,观察到了非常低的转化,从90mM2-氯扁桃腈形成了7mM2-氯扁桃酸。虽然这一转化水平较低,但仍然高于使用了相同底物浓度的单相系统中观察到的水平。这些结果暗示,在非极性有机溶剂中保留了一些抑制性的2-氯苯甲醛或2-氯苯甲酸。
标准测定条件:
制备下述溶液:
-底物储备溶液:50mM羟腈底物,在0.1M磷酸盐缓冲液中(pH8)。
-酶储备溶液:将3.33mL0.1M磷酸盐缓冲液(pH8)加到每一小瓶中,其中含有20mg冻干细胞溶解产物(终浓度6mg蛋白质/ml)
反应体积在不同实验之间有所变化,这依赖于所采用的时间点的数量。除非另外说明,所有反应包括25mM2-氯扁桃腈和10%(v/v)的酶储备溶液(终浓度6mg蛋白/ml)。除非另外说明,反应在37℃进行。对每一实验,进行了对照组,来监控腈降解。这些包括溶解在0.1M磷酸盐缓冲液(pH8)中的25mM2-氯扁桃腈。
反应取样:通过从每一反应中取出等分试样,并且按照因数8稀释这些样品,对反应进行取样。通过手性和非手性HPLC方法,对双重复样品进行分析。除非如上述图中所示,反应在0.5,1,1.5,2,3和4小时进行取样。
HPLC方法
使用10mM磷酸钠缓冲液(pH2.5)的流动相,在SYNERGI-EPTM柱(4μm;50x2mm)上进行非手性HPLC方法。在3.5分钟引入甲醇梯度,并且在1.5分钟内增加到50%,随后将甲醇减少到0%。2-氯扁桃酸和2-氯扁桃腈的洗脱时间是2.5和6.1分钟,腈在5.9分钟出现了另一个峰。
如上所述,在研究过程中,对手性HPLC方法进行最优化,以改善2-氯苯甲酸和(S)-2-氯扁桃酸之间的分离。在研究的后半部分,使用优化的方法,并且在CHIROBIOTIC-RTM柱上进行。流动相是80%乙腈:20%的0.5%(v/v)乙酸。(S)-2-氯扁桃酸和(R)-2-氯扁桃酸的洗脱时间分别是2.4和3.5分钟。2-氯苯甲酸的峰在1.9分钟洗脱。对于每一实验,在HPLC运行中包括产物的标准曲线。产物在样品中的浓度,是用这些曲线的斜率计算的。
pH的影响
通过在不同缓冲液范围内进行标准测定研究pH对酶活性和对映选择性的影响:0.1M柠檬酸磷酸盐,pH5;0.1M柠檬酸磷酸盐,pH6;0.1M磷酸钠,pH6;0.1M磷酸钠,pH7;0.1M磷酸钠,pH8;0.1MTris-HCl,pH8;和0.1MTris-HCl,pH9。除了SEQIDNO:385,386使用标准浓度的一半之外(5%v/v酶储备溶液),对所有酶使用标准酶浓度。
温度的影响
温度对于活性和对映选择性的影响,是通过在一系列不同的温度范围内进行标准测定分析来研究的:室温,37℃,45℃,50℃和60℃。除了SEQIDNO:385,386使用标准浓度的一半之外(5%v/v酶储备溶液),对所有酶使用标准酶浓度。
酶浓度的影响
在标准条件下进行反应,使用变化的酶浓度:1%,5%和10%(v/v)的酶储备溶液。用适当的缓冲液将反应体积标准化。
溶剂的加入
在存在作为共溶剂的甲醇的情况下,进行酶反应。以下述水平将甲醇加入到标准反应混合物中:0,5,10,15和20%(v/v)。
也对具有己烷的两相系统进行了研究。水相包括处于0.1M磷酸盐缓冲液(pH8)中的10%(v/v)的酶储备溶液。在加入到反应物中之前,将羟腈溶解到己烷中。使用了两个水平的有机相:与水相体积等值,和水相体积的0.7。此外,对一系列腈浓度进行了研究:25,45和90mM。这些反应是在室温下进行的。
这些反应的样品来自水相和有机相。在真空下离心蒸发己烷,并且再次溶解在甲醇和水的50:50混合物中,这样样品与含水样品处于相同的稀度。对样品的分析,是通过非手性和手性HPLC进行的。
工艺成分的影响
(i)活性:通过将单一成分2-氯苯甲醛,2-氯苯甲酸或2-氯扁桃酸加入到酶反应中,建立工艺成分对于酶活性的影响。酶反应在标准条件下进行,在存在2种可能的抑制剂之一的情况下,如下所述:5,10,20和25mM2-氯苯甲醛;1.5和5mM2-氯苯甲酸;和10,20,40和80mM2-氯扁桃酸。对照组反应在标准条件下进行,不加入添加剂。在每一取样时间,将样品以十分之一的水平稀释。使用含有反应成分但不含有酶的对照组样品,并且稀释到相同水平。通过非手性HPLC分析样品。
(ii)稳定性:在标准条件下鉴定酶活性之前,在存在反应成分,2-氯苯甲醛和2-氯扁桃酸的情况下,通过将酶温育预定时间期间,来监控酶对工艺条件的稳定性。在这些实验中,在存在下述反应成分的每一种的情况下,以3mg蛋白/ml的浓度温育酶,所述下述反应成分为:5,10,20和25mM2-氯苯甲醛;和10,20,40和80mM2-氯扁桃酸。通过仅仅在缓冲液中温育酶进行对照组反应。
检测条件:在特定添加剂中,在0,4,8和24小时的温育时间下,移出20μl酶溶液,并且加入60μl的41.6mM底物储备溶液和20μl缓冲液。从而在标准条件下检测酶活性。在加入底物后90分钟,对反应取样,用非手性HPLC方法进行分析。
酶促反应的按比例放大
在两个不同的浓度下进行酶反应:45mM和90mM底物。在标准条件下进行反应,即pH8(0.1M磷酸钠缓冲液),37℃和10%(v/v)的酶储备溶液。在加入缓冲液之前,将底物溶解在10%(v/v)甲醇中。最终的反应体积是20ml,用磁力搅拌进行反应。
实施例14:用于对映选择性产生L-2-氨基-6,6-二甲氧基己酸的腈水解酶的最优化
5,5-二甲氧基戊醛5,5-二甲氧基戊醛L-2-氨基-6,6-二甲氧基己酸
氨基腈
四种分离的酶显示出将2-氨基-6-羟基己烷腈水解为(S)-2-氨基-6-羟基己酸,其具有朝向L-对映异构体的选择性。鉴别出一种新颖靶物质,该物质与(S)-2-氨基-6-羟基己酸具有类似结构。针对该靶物质,5,5-二甲氧基戊醛氨基腈,筛选了一组分离的腈水解酶。对阳性酶在该底物上进行表征。使用实验室进化技术,优化这些酶针对特定靶物质的改进的对映选择性。使用初步筛选鉴别推定的高表达突变型,这是使用HPLC确认的。
酶的优化:GSSMTM和GeneReassemblyTM可以在选择出的腈水解酶上进行,以便提高用于产生L-2-氨基-6,6-二甲氧基己酸的酶的对映选择性和活性。鉴别出四种能够对映选择性地将2-氨基-6-羟基己烷腈水解为L-(S)-2-氨基-6-羟基己酸的酶。然而,在新颖靶分子L-2-氨基-6,6-二甲氧基己酸中,存在微小的结构差异。为了确定该差异对酶的活性和对映选择性是否有影响,针对该新颖靶物质筛选具有完全谱的腈水解酶。
选择对于产生L-2-氨基-6,6-二甲氧基己酸表现出活性和对映选择性的最高组合的酶用于GSSMTM。在靶酶突变后,使用高通量筛选技术,在5,5-二甲氧基戊醛氨基腈上,筛选所得到的突变型。在通过HPLC分析确认高表达突变型之后,单一高表达突变型将被结合,以便进一步提高突变酶的性质。
与GSSMTM平行,GeneReassemblyTM也可以在亲本酶的组合上进行,可以对其中至少一种,选择针对L-2-氨基-6,6-二甲氧基己酸的活性和对映选择性。至少两种具有高度同源性的其它腈水解酶,可以与前述酶进行重装配;对这些酶进行选择,以便对重装配序列提供多样性。
开发用于对映选择性的高通量检测方法是该演化努力取得成功的关键。这样的检测方法是基于新颖酶的对映选择性的检测方法,该检测方法允许在比传统使用的HPLC方法显著更短的时间期间内筛选>30,000种突变型。
一方面,用一种非随机方法来产生变体,所述非随机方法被称作合成连接重装配(syntheticligationreassembly),该方法与随机改组有关,除了核酸结构单元不是被改组或连接或随机嵌合,而是被非随机地装配,可以被用于产生变异体。该方法不需要在被改组的核酸之间存在高度同源性。可以用连接重装配方法非随机地产生具有至少10100或至少101000不同嵌合体的后代分子文库(或集合)。连接重装配方法提供了一种非随机方法,用于产生一组最终的嵌合核酸,该核酸具有通过设计所选择的总装配次序,该方法包括通过设计产生多个特异性核酸结构单元,这些核酸结构单元具有有用的相互相容可连接末端,这样在装配这些核酸结构单元时,可以实现设计的总装配次序。
将被装配的核酸结构单元的相互相容可连接末端,如果它们能使得结构单元以预定次序被结合,就被认为对这一类型的有序装配是“有用的(serviceable)”。因此,一方面,其中核酸结构单元可以被结合的总装配次序是通过可连接末端的设计指定的,如果使用不止一个装配步骤,那么其中核酸结构单元可以被结合的总装配次序也可以通过装配步骤的顺序次序来指定。在本发明的一个方面,用酶,如连接酶(例如,T4DNA连接酶)来处理退火的结构片段,以获得结构片段的共价连接。
在另一个方面,在对一组祖先核酸模板的序列分析上,获得核酸结构单元的设计,该祖先核酸模板被作为产生一组后代最终嵌合核酸分子的基础。这些祖先核酸模板因此作为序列信息来源,有助于被诱变,即嵌合,重组或改组的的核酸结构单元的设计。
在一个例证中,本发明提供了嵌合相关基因家族和它们的相关产物的编码家族。在一个特别的例证中,被编码的产物是腈水解酶。编码本发明的腈水解酶的核酸可以根据此处描述的方法被诱变。
因此,根据本发明的一个方面,编码腈水解酶的大量祖先核酸模板的序列被比对,以便选择一个或多个分界点,这些分界点可以位于一个同源性区域中。分界点可以被用来描述将要产生的核酸结构单元的边界。因此,在祖先分子中鉴别和选择的分界点,作为后代分子装配中的潜在的嵌合点。
典型地,有用的分界点是由至少两个祖先模板共有的同源性区域(包括至少一个同源的核苷酸碱基),但分界点可以是由至少一半的祖先模板,至少三分之二的祖先模板,至少四方之三的祖先模板,和优选地至少所有祖先模板共有的同源性区域。仍然,甚至更优选地,有用的分界点是由所有祖先模板共有的同源性区域。
一方面,连接重装配过程被彻底地进行,以便产生详尽的文库。换句话说,核酸结构单元的所有可能的有序组合被表示在最终嵌合的核酸分子的集合中。同时,设计(或非随机的,非无规则的)每一组合中的装配次序(即在每一最终嵌合核酸的5’到3’序列上的每一结构单元的装配次序)。由于该方法的非随机特性,大大降低了不受欢迎的副产物的可能性。
在另一个方面,该方法提供了,连接重装配过程被系统地进行,例如以便产生系统地区室化文库,具有可以被系统地筛选的区室,例如,一个接着一个。每一区室(或部分)拥有具有已知特性的嵌合体或重组体。换句话说,本发明提供了,通过选择性和明智地使用特定核酸结构单元,结合选择性和明智地使用连续步骤的装配反应,可以实现实验设计,其中在几个反应容器中的每一个中产生后代产物的特定集合。这允许进行系统的检验和筛选程序。因此,这允许潜在的非常大量的后代分子以较小群体被系统地检验。
由于其以高度灵活但仍然彻底且系统的方式进行嵌合作用的能力,尤其当祖先分子之间存在低水平同源性时,此处描述的本发明提供了产生包括大量后代分子的文库(或集合)。由于连接重装配方法的非随机性质,所产生的后代分子优选地包括具有通过设计所选择的总装配次序的最终嵌合核酸分子的文库。在一个特定的方面,这样产生的文库包括大于103到大于101000不同后代分子种类。
在另一个例证中,其中产生结构单元的步骤的合成性质,允许设计和引入核苷酸(例如一个或多个核苷酸,例如可以是密码子或内含子或调节序列),所述核苷酸随后被任选地在体外过程中被去除(例如通过诱变)或在体内过程中被去除(例如通过使用宿主生物的基因剪接能力)。应该预期到,在许多情况下,引入这些核苷酸也是期望的,除了产生有用的分界点的潜在益处外,还有许多其它原因。
本发明的合成连接重装配方法使用了多个核酸结构单元,这些结构单元中的每一个优选地具有两个可连接末端。在每一核酸结构单元上的两个可连接末端,可以是钝末端(即每一个末端具有零个核苷酸的突出端),或优选地一个钝末端和一个突出端,或更优选地仍然是两个突出端。在一个双链核酸上,有用的突出端可以是3’突出端,或5’突出端。核酸结构单元可以具有一个3’突出端,一个5’突出端,两个3’突出端,或两个5’突出端。其中核酸结构单元被装配形成最终嵌合核酸分子的总次序,是通过有目的的实验设计确定的(例如基于5’和3’突出端的序列,设计结构单元核酸之间的粘末端),并且不是无规则的。
根据一个优选的方面,核酸结构单元是如下产生的:化学合成两个单链核酸(也被称作单链寡核苷酸),并且在杂交条件下将其接触以允许它们退火形成双链核酸结构单元。双链核酸结构单元的大小是可以变化的。这些结构单元的大小可以小或大。结构单元的优选大小范围,是从1个碱基对(不包括任何突出端)到100,000个碱基对(不包括任何突出端)。也提供了其它优选的大小范围,下限为1bp到10,000bp(包括在此之间的每一个整数数值),上限为2bp到100,100bp(包括在此之间的每一个整数数值)。
根据一个方面,首先通过产生两个单链核酸,然后允许它们退火以形成双链核酸结构单元,从而产生双链核酸结构单元。在双链核酸结构单元的两个链中,除了在任何形成突出端的核苷酸上,在每一个核苷酸可以是互补的;因此不含有错配,除了任何突出端。根据另一个方面,双链核酸结构单元的两个链在比除了任何形成突出端的核苷酸的每一个核苷酸少的情形下,是互补的。因此,根据这一方面,双链核酸结构单元可以被用来引入密码子简并。优选地,使用此处描述的位点饱和诱变引入密码子简并,使用一个或多个N,N,GIT盒子或可选择地使用一个或多个N,N,N盒子。
实施例15:评价腈水解酶活性和对映选择性的分析方法
描述了一种测定方法,该方法可以适合高通量自动装置,以便增加对于腈水解酶的发现和演化尝试的筛选通量。理想的测定方法是,即允许量化产物形成或底物转化,以及对映体过量的测定方法。开发了适合高通量筛选的两种非手性和两种手性比色测定法。
所开发的非手性比色测定:
用于残余底物的OPA测定.邻苯二醛测定(OPA测定)适用于α-氨基或α-羟基腈底物。全细胞的裂解是不必要的。针对2-氯扁桃腈和苯基乙醛羟腈,这些结果通过HPLC得到了验证。测定工作最好使用芳族腈。脂族化合物表现出线性标准曲线,荧光性被降低,从而降低了测定的效率。
所形成的羟基酸的量化和ee确定的LDH测定
LDH测定适用于苯基乳酸,但不适用于2-氯扁桃酸。使用刃天青检测系统增加灵敏度,并且降低背景。在进行测定之前,全细胞的背景荧光或者通过离心或者通过热灭活来克服。
所形成的氨基酸的量化和ee确定的AAO测定
AAO测定适用于苯基丙氨酸,和(S)-2-氨基-6-羟基己酸。使用AmplexRed检测系统增加灵敏度。显示出细胞裂解是不必要的。细胞在确定成分培养基中生长,以便防止背景荧光。
OPA测定
使用基于腈水解酶测定的邻苯二醛(OPA)荧光来量化剩余的α-羟基腈底物的量。α-羟基腈在pH控制的分解中形成相应的醛和氰化物,OPA与其中释放的氰化物反应,产生发荧光的、可以计量的产物。OPA与α-羟基腈在pH控制的、形成相应的醛和氰化物的降解中所释放的氰化物反应,产生发荧光的1-氰基-2-R-苯并异吲哚。
腈水解酶
羟基腈羟基酸
氨基腈氨基酸
R=烷基,芳基
荧光1-氰基-2-取代的苯并异吲哚
建立针对下述底物的标准曲线:2-氯扁桃腈(CMN,0.998),环己基扁桃腈(CHMN,0.99),乙酰苯基氨基腈(APA,0.99),和苯乙醛羟腈(PAC,0.97),(图5),(圆括号中为R2值)。也建立了苯基甘氨酸的标准曲线(PGN,0.93)。三种所实验的底物,二甲基正丁醛氨基腈(DMB)(2-氨基-4,4-二甲基戊烷腈),羟基新戊醛氨基腈(Hydroxypivaldehydeaminonitrile,HPA),和新戊醛氨基腈(pivaldehydeaminonitrile,PAH),在最初的测定条件下,给出非常低的荧光读数和不可靠的结果。然而,对于这些化合物,其中许多参数被调整,但是通过这些操作没有增加这些化合物的荧光信号强度。
在增加这三种化合物的荧光信号的尝试中,用萘二羧醛(NDA)代替OPA。构建了使用OPA或者NDA的PAH,HPA和DMB的标准曲线。为了确定灵敏度和背景荧光,加入对底物中的每一种具有疑似催化活性的冻干腈水解酶溶解产物(SEQIDNOS:189,190)。在四种化合物中的三种化合物中检测水解。NDA急剧地增强了信号,通常以一个数量级增加,尽管这一降低的线性大概是由于信号的饱和。
NDA被确定作为脂族化合物的可替代的检测试剂。然而,对于该测定,期望的是对于所有底物使用相同的检测系统,原因在于这将有助于自动化评价多个腈水解酶底物。对于分析PAC,CMN,CHMN,APA,MN和PGN,当前基于OPA的测定是有效的。尽管已经开发了针对脂族化合物PAH,HPA和DMB的标准曲线。
全细胞最优化
评价将冻干腈水解酶溶解产物加入到测定成分中的影响,或者是未处理的,或者是热灭活的。在任一种情况下,没有观察到干涉性背景荧光。接着评价OPA测定,并且以全细胞格式最优化针对腈水解酶活性检测的OPA测定。评价表达腈水解酶的全细胞和原位溶解细胞。评价冻干细胞溶解产物,同时它们各自的全细胞克隆作为对照组。对于这一最优化研究,选择扁桃腈(MN)作为模型底物。
与表达SEQIDNOS:187,188的全细胞,和表达SEQIDNOS:187,188的原位溶解细胞一起,评价SEQIDNOS:187,188的冻干细胞溶解产物。加入全细胞不会影响荧光,也不会导致荧光猝灭。加入三种细胞溶解溶液中的任一种可以提高全细胞系统中扁桃腈的渗透性(以及因此的转化)。评价三种细胞溶解溶液:B-PER(Pierce),BugBuster(Novagen)和CelLyticB-II(Sigma),发现对OPA测定没有有害影响。加入产物α-羟基酸或α-氨基酸不会影响OPA测定的检测。
对测定的需要几个液体转移步骤的原始格式进行修改,修改到一个平板过程中,其中细胞生长、腈水解和OPA测定反应在同一微量滴定平板中发生。使用该单一孔格式试验扁桃腈。在这种情况下,评价大肠杆菌基因位点饱和诱变(GSSMTM)细胞宿主。对三种克隆进行试验:SEQIDNOS:101,102,SEQIDNOS:187,188,和一个用作对照组的空白载体。在四个时间点评价水解,在10和20mM下,也使用0mM对照组。在一个早期的实验中,针对苯乙醛羟腈底物(对于该化合物,该酶没有表现出活性)评价克隆SEQIDNOS:187,188,没有观察到活性。
OPA测定被发现可以检测α-羟基和α-氨基腈底物的存在。用该测定可以容易地检测芳族化合物,而对于脂族化合物在检测上有一些挑战。当使用冻干细胞溶解产物、原位溶解全细胞或未溶解全细胞时,没有明显的背景问题。该测定适用于单平板分析,其中细胞生长、用底物温育、和测定是在同一平板上进行:不需要液体转移,易于实现自动化。尽管所有被试验的腈产生了线性响应,但脂族化合物显示出低荧光响应。
手性LDH测定(手性乳酸脱氢酶测定)
开发了基于乳酸脱氢酶(L-LDH)的光谱系统,用于分析通过腈水解酶催化水解羟腈所产生的手性α-羟基酸。羟基腈底物没有被次级或检测酶代谢,从而没有干扰起始材料。未经过热处理的细胞溶解产物导致LDH系统的背景活性;然而,细胞溶解产物的热灭活或造粒消除了背景活性。(参见图4)
评价此处公开的针对腈水解酶的可以商购的D-和L-乳酸脱氢酶的活性和对映体异构特异性。鉴别出LDH,其既适合于D-苯基乳酸分析,也适合于L-苯基乳酸分析。没有发现适合于2-氯扁桃酸分析的酶。所选择的LDH酶表现出实质上绝对的立体选择性。建立使用冻干细胞溶解产物检测从PAC产生的D-和L-LDH的测定的可行性。
最初,评价了三种比色染料,所有这些是四唑盐:NBT(3,3’-二甲氧基-4,4’-亚联苯基)双[2,(4-硝基苯基)-5-苯基-2H]-,氯化物)MTT(3-(4,5-二甲基噻唑-2-基)-2,5-二苯基溴化四唑)INT(2-(4-碘苯基)-3-(4-硝基苯基)-5-2H-氯化四唑)。这些检测系统的产物不溶解性在分析上具有挑战。为了说明这一点,评价了另一种已报导的具有可溶性产物的四唑盐,XTT(2,3-双-(2-甲氧基-4-硝基-5-磺苯基)-2H-四唑-5-羧基腈)。尽管XTT产生了一种可溶性大红色的产物,但底物是不可溶的,从而导致相同的分析挑战。作为四唑染料族的一种可选择性,评价了双重性的比色/荧光染料刃天青。刃天青的氧化产生了resourfin。底物和产物都是可溶的,颜色变化可以比色或使用荧光测定法量化,从而增加了准确性。由于刃天青的灵敏度,可以量化0.05mM乳酸。当使用与底物相同范围的染料时,获得了最适结果,例如0.5mM刃天青可以量化0.05到0.5范围内的乳酸(及其类似物),尽管最好的线性处于该数值范围的较下端。resourfin在28小时内是稳定的,并且具有线性荧光响应。
在存在LDH测定成分的情况下,冻干酶显示出背景荧光/吸收。为了说明这一问题,将溶解产物煮沸10分钟,然后离心。这导致背景信号降低了90%。有趣的是,单独离心(5分钟14.1rcf)或离心后煮沸(5分钟100℃)可以将荧光降低到背景水平。由于煮沸将增加蒸发(8μl孔大小),并且潜在地挥发(volatize)腈底物,所以在高通量格式中,如1536孔平板中,旋转相对于煮沸是优选的。从生长培养基(LB和TB和M9)或细胞溶解溶液(B-PER,CelLytic和BugBuster)中没有记录到背景信号。
手性AAO测定
开发了基于氨基酸氧化酶(AAO)的光谱系统,用于分析腈水解酶催化水解氨基腈所产生的手性α-氨基酸。
测定开发和确认
最初的测定确认,使用了如上面所描述的2,2’-连氮基-双-{3-乙基苯并噻吡咯啉-6-磺酸(ABTS)检测系统。然而,由于颜色不稳定,进一步的研究使用了苯酚氨基安替比林(PAAP)检测系统,是在λmax510nm分析的。对4-甲基-亮氨酸、苯丙氨酸、(S)-2-氨基-6-羟基己酸和叔亮氨酸的每一对映异构体发现了具有适当活性的酶。该测定不适合于甲基苯基甘氨酸,与苯基甘氨酸不能很好地工作。
对于苯丙氨酸产生了从0-15mM的标准曲线。当浓度保持在低于1mM时,该曲线更加线性。只要保持黑暗,颜色在好几天内都能保持稳定。三种细胞溶解溶液BugBuster(BB),细菌蛋白提取试剂(BacterialProteinExtractingReagent,BPER),和细胞溶解试剂(CellLyticReagent,CLR)被加入到标准曲线中,没有显示出对显色的影响。加入细胞溶解产物(celllysate,cl)没有表现出形成背景颜色。加入苯基乙醛氨基腈硫酸盐(PAS),起始材料也没有显示出对颜色形成的影响。
AAO系统在直至高达1mM的底物下表现出更强的线性。调节AAO酶和酸性底物的浓度,以试图去除L-AAO和D-AAO曲线在接近图表中间时的交叉。预先混和PAAP,HRP和AAO证明是有效的,并且没有引起所观察的活性的变化,这确定了测定成分可以被加入到混和格式的测定中。
对全细胞的AAO测定观察到了高水平的背景,这归因于TB和LB生长培养基中存在的L-氨基酸。在M9培养基中洗涤和重悬浮细胞消除了背景。对于所有未来的实验,细胞在具有0.2%葡萄糖的M9培养基中培养。与未溶解细胞相比,溶解细胞仅仅显示出略微好的响应。因此,细胞溶解是不必要的。SEQIDNOS:187,188在基于HPLC分析的初步筛选中表现出对HPA的活性。
研究了荧光检测系统的用途,该系统允许以超高通量方式执行测定,如1536孔或千兆矩阵格式。最适合我们的系统的荧光试剂是来自MolecularProbes的AmplexRed,该试剂产生了高度荧光的试卤灵(resorufin)(λex545nm;λem590nm)。建立苯丙氨酸和(S)-氨基-6-羟基己酸的标准曲线(0-100μM)。
在测定自动化的准备中,通过荧光激活细胞分选(FACS)将表达腈水解酶的细胞加入到含有M90.2%葡萄糖,0.25mMIPTG培养基的微量滴定平板中。评价三种表达亚克隆的腈水解酶,和空白载体对照组:SEQIDNOS:101,102,SEQIDNOS:187,188,SEQIDNOS:29,30,和空白载体。细胞分选之后,证明细胞生存能力是不一致的。因此目前评价了菌落挑取,作为一种可选的方法,将细胞加入到微量滴定平板中。未覆盖的1536孔微量滴定平板的蒸发损失在自动培养箱中每天大约是30%(培养条件:85%相对湿度(RH),温度为37℃)。在95%RH培养箱中培养,将每天的蒸发损失降低到了1%。
使用HPA腈,建立三种亚克隆在存在高达3.5mM腈的情况下的生长能力。生长速度仅仅略微受到了影响(低于30%)。在存在HPA的情况下,生长的亚克隆显示出表达能催化羟基正亮氨酸(hydroxynorleucine,HNL)形成的腈水解酶,正如使用AmplexRed检测系统所建立的。当酶是S-选择性时,仅仅评价了S。在10分钟时间间隔下,读取反应平板,在40分钟显示出最好的线性。尽管当细胞在pH7生长时,高于5mM的HPA极大地抑制了细胞生长,但对于细胞在pH8的生长,高于0.1mMHPA抑制了生长。
为了使用HPLC验证AAO结果,使用高浓度HPA,高达40mM(由于对于(S)-2-氨基-6-羟基己酸的HPLC检测挑战),和冻干细胞溶解产物SEQIDNOS:187,188进行反应。
比较对于HNL的AAO和HPLC数据
为了确定与基于HPLC筛选所用的20mM底物范围相比,以较低浓度进行筛选是否会引起结果的偏差,使用三个浓度范围用SEQIDNOS:187,188进行实验。每一实验被进行三个重复,以便去除任何非系统误差。
AAO测定可以在384或1536孔格式上进行,细胞被分拣到M90.2%葡萄糖,0.25mMIPTG培养基中。在存在腈的情况下培养细胞(在这种情况下是HPA),或者允许细胞达到一定浓度,然后加入腈。尽管细胞溶解试剂不干扰测定,当测定HPA时,发现加入溶解试剂是不必要的。或者在之前加入腈,或者在之后加入腈,母板将必须被拆分为子板,然后分别对L-和D-对映异构体含量进行测定。用AAO/AmplexRed试剂调节温育时间,以便在不同时间读取D-和L-平板。
实施例16:鉴别、开发和产生强劲、新颖酶
靶向一系列高数值对映选择性生物过程
本发明提供了通过定向进化(directedevolution)开发腈水解酶,该腈水解酶为下述化学靶物质的工艺制造提供了极大的技术和商业优势:
L-2-氨基-6,6-二甲氧基己酸
5,5-二甲氧基戊醛5,5-二甲氧基戊醛氨基腈L-2-氨基-6,6-二甲氧基己酸
腈水解酶显示出将2-氨基-6-羟基己烷腈水解为(S)-2-氨基-6-羟基己酸,具有针对L-对映异构体的选择性。针对靶物质5,5-二甲氧基戊醛氨基腈,筛选一系列腈水解酶。在该底物上,对阳性酶进行表征。使用初步筛选来鉴别推定的高表达突变型,然后使用HPLC来确认。
在所选择的腈水解酶上进行GSSMTM和GeneReassemblyTM,以便提高用于产生L-2-氨基-6,6-二甲氧基己酸的酶的对映选择性和活性。鉴别将2-氨基-6-羟基己烷腈对映选择性水解为L-(S)-2-氨基-6-羟基己酸的腈水解酶。然而,新颖靶分子L-2-氨基-6,6-二甲氧基己酸表现出微小的结构差异。为了确定该差异是否影响酶的活性和对映选择性,针对该新颖靶物质筛选腈水解酶的完整谱。
首先,通过更详细的表征产生L-2-氨基-6,6-二甲氧基己酸的命中酶,进行用于GSSM的正确靶基因的鉴别。该尝试涉及更广泛地研究pH和温度对于活性和对映选择性的影响,以及更深入地分析酶对工艺条件的稳定性。在最初筛选之前,完成烷基氨基腈的单一对映异构体的合成;在理解该因素和酶的对映选择性之间的关系的尝试中,研究腈的外消旋作用。
选择用于产生L-2-氨基-6,6-二甲氧基己酸的表现出活性和对映选择性的高度组合的酶用于GSSM。在靶酶突变后,使用高通量筛选技术,针对5,5-二甲氧基戊醛氨基腈筛选所得到的突变体。在通过HPLC分析确认高表达突变型之后,达到了决策点,以便评价GSSM针对靶物质的结果。
与GSSMTM平行,GeneReassemblyTM也可以在亲本酶的组合上进行,其中至少一种是选择针对L-2-氨基-6,6-二甲氧基己酸的活性和对映选择性。至少两种其它腈水解酶可以与前述酶进行重装配;对这些酶进行选择,以便对重装配序列提供多样性。
本发明提供了开发针对原始底物氨基腈的外消旋条件。此外,本发明提供了通过动态动力学拆分来鉴别能将这些氨基腈转化为靶α-氨基酸的酶。本发明也提供了筛选和开发用于产生(R)-2-氨基-6,6-二甲氧基己酸(ε-醛基赖氨酸)的腈水解酶催化的动力学拆分方法。(S)-2-氨基-6-羟基己酸将被用作模型底物,用于开发动力学拆分。靶α-氨基酸如下所示:
(i)D-4-氟苯基甘氨酸
腈水解酶
4-氟苯甲醛4-氟苯基甘氨酸腈(FPGN)D-4-氟苯基甘氨酸
(ii)L-2-氨基-6,6-二甲氧基己酸(ε-醛基赖氨酸)
腈水解酶
5,5-二甲氧基戊醛5,5-二甲氧基戊醛L-2-氨基-6,6-二甲氧基
氨基腈(DMPAN)己酸
开发了用于腈水解酶催化产生D-4-氟苯基甘氨酸和2-氨基-4,4-二甲基戊烷腈(ε-醛基赖氨酸)的氨基腈底物的外消旋作用的条件。两种模型底物,最初使用苯基甘氨酸腈和戊醛氨基腈,在不存在酶的情况下研究外消旋作用。进行了在多种可能的外消旋作用条件下同时确定一种或多种可利用的腈水解酶的性能。此外,针对用于产生(S)-2-氨基-6-羟基己酸的羟基戊醛氨基腈筛选腈水解酶,并且最优化有希望的酶。一旦建立了外消旋作用条件,筛选腈水解酶的活性。进行对产物的动力学拆分的进一步最优化。
鉴别用于将α-氨基腈水解为α-氨基酸的大量对映选择性腈水解酶。尽管这些酶显示出优先选择某些氨基腈的所需对映异构体,在进一步筛选、开发和比较候选腈水解酶中的一个限制因素,是氨基腈底物在反应条件下的外消旋作用的速率。
芳族氨基腈外消旋作用
第一个步骤是使用模型底物,苯基甘氨酸腈,建立芳族氨基腈外消旋发生的条件。外消旋作用策略包括,但不限于下述列表所示。根据它们商业适用性,粗略地区分选项的优先次序。
(1)控制反应的pH。既然显示出外消旋在高pH时比较快,该方法需要发现和最优化在pH>10时具有活性和选择性的腈水解酶。
(2)加入已知化学外消旋试剂,如醛、酮、弱碱、树脂、金属离子、路易斯酸等等,这些试剂在较低pH下可以增加外消旋作用。
(3)合成N-酰化氨基腈衍生物,例如N-乙酰基苯基甘氨酸腈,该化合物更容易被外消旋。在N-乙酰基苯基甘氨酸腈的情况中,去除乙酰基的选择性D-酰基转移酶将能增加腈水解酶产物的光学纯度。
(4)使用两相系统,其中碱催化的外消旋发生在疏水有机相中,酶促水解发生在水相中。
(5)使用2-酶系统,该系统包括腈水解酶和氨基腈消旋酶。目前可以通过商业途径获得一种氨基酸消旋酶,该氨基酸消旋酶将被用来试验针对苯基和氟苯基甘氨酸腈的活性。搜索基因文库,以搜索与已知氨基酸酰胺消旋酶、乙内酰脲消旋酶或可以被鉴别的任何其它消旋酶表现出同源性的基因。
一旦已经建立外消旋作用的条件,就可以为开发靶芳族底物,4-氟苯基甘氨酸腈(FPGN)的外消旋条件提供基础。FPGN被认为稳定性低于模型底物;因此,可以更快地发生外消旋作用,但降解反应同样也比较快。评价样品酶忍受和/或在该条件下良好地发挥作用的能力。最终最优化筛选方法包括靶底物、样品腈水解酶和底物外消旋条件。
所进行的研究已经显示出,苯基甘氨酸腈在pH10.8易于发生外消旋。然而,似乎现有酶中的任一种酶没有显示出能忍受这样苛刻的pH条件。筛选来自高度碱性环境的样品,筛选是否存在能忍受这样的条件的腈水解酶。一旦发现,对这些酶进行测序和亚克隆,并且这些酶被以冻干细胞溶解产物形式产生,以备筛选使用。
脂族氨基腈外消旋作用
一种模型脂族氨基腈,戊醛氨基腈,被以其外消旋形式合成。然而,使用下述方法,制备旋光富集的样品:(i)制备性手性HPLC;(ii)非对映体盐拆分;(iii)非对映体衍生或柱色谱;(iv)从L-N-BOC正亮氨酸合成。用HPLC分析检测这些化合物。
HPLC测定
使用HPLC测定来检测(S)-2-氨基-6-羟基己酸。使用包括柱衍生之前的测定。
筛选/表征:
针对2-氨基-6-羟基己烷腈筛选腈水解酶。对于在大于25mM的底物下能很好地发挥作用的酶,进行按比例放大的反应。研究其它酶的底物/产物耐受性和稳定性曲线。
筛选腈水解酶,并且对命中酶进行表征,重点在于反应条件下的最适pH和最适温度,对映选择性和稳定性。
酶进化
选择表现出期望特性的靶酶用于GSSMTM。在靶酶突变后,使用高通量筛选技术在底物上筛选所得到的突变体。一旦已经通过HPLC分析确认了高表达突变型,组合能增加性能的单一突变,并且评价可能的加性或协同效应。
此外,可以在先导酶(leadenzymes)的组合上进行GeneReassemblyTM,选择期望特性,包括在反应中的活性、对映选择性和稳定性。
实施例17:用于对映选择性产生(S)-苯基乳酸的腈水解酶的最优化
鉴别用于对映选择性水解5种不同的腈底物的腈水解酶。分离这些腈水解酶,并且针对所选择的靶物质进行最优化。最优化包括过程最优化和定向进化或定向演化(directedevolution)。尤其是,表征和最优化对于产生(S)-苯基乳酸特异的酶。这样做的目的主要在于提高酶的活性,同时保持高对映选择性。也进行了工艺条件对酶的影响的研究。
腈水解酶
苯乙醛苯乙醛羟腈(S)-苯基乳酸
用于从潜在的定向演化尝试中筛选突变体的高通量测定的开发取得了成功。开发了适合于高通量筛选的两种非手性和两种手性比色测定,并且用于腈水解酶定向进化。
鉴别作为用于产生(S)-苯基乳酸的高对映选择性腈水解酶的SEQIDNOS:103,104。SEQIDNOS:103,104的表征显示出最适反应pH和温度,分别是pH8和37℃;分别高达5mM和30mM水平的反应起始材料,苯乙醛,和产物,苯基乳酸显示出对酶活性没有影响。按比例放大的酶促反应具有95%的对映体过量(ee)。
实施例18:编码腈水解酶的核酸的定向进化
对nitB基因进行基因位点饱和诱变TM或GSSMTM,以产生覆盖整个酶的单一氨基酸取代突变体的文库。定向进化中所用的“亲本”nitB基因的序列是SEQIDNOS:103,104。通过执行GSSMTM产生nitB突变体文库。然后筛选nitB突变体文库,筛选具有增加的全细胞羟甲基硫代丁基腈(hydroxymethylthiobutryonitrile,HMTBN,是一种腈水解酶底物)活性的克隆。腈水解酶反应在该底物上的产物是羟甲基硫代丁酸(hydroxymethylthiobutyricacid,HMTBA)。
在35℃下,用100mMHMTBN和100mMK3PO4,pH7进行测定,大约30-40%转化率。使用两种方法定量表示HMTBN转化,一个方法是由HPLC分析所产生的关于HMTBS的直接测量值,另一个方法使用使用荧光氰化物测定的针对残余HMTBN的间接检测,该测定先前已经进行了描述。
对推定的nitB高表达突变体进行二次测定,以确认所增加的活性。在二次测定中,在摇瓶中在表达培养基中,诱导高表达突变型和野生型对照组。然后用100mMK3PO4,pH7洗涤摇瓶培养基,并且重悬浮到相同的光学密度,在660nm下。然后用标准化细胞重悬浮液,在与初始测定中所用的条件相同的条件下,进行动力学测定。对已经确认的具有增加的HMTBN活性的推定高表达突变型进行测序,并且在转化回相同表达菌株后,试验增加的活性,以确保活性的增加不是由于宿主突变。
所确认的nitBGSSMTM高表达突变型是nitBG46P,其在氨基酸46上具有甘氨酸(GGT)到脯氨酸(CCG)的取代。在25℃和35℃下,该突变体的全细胞HMTBN活性比野生型NitB均大约高50%。一旦鉴别了有利的G46P突变,再次使用nitBG46P模板,用GSSMTM来产生双重突变体的集合。这些突变体都含有G46P突变,以及在一个随机位点具有额外的单一氨基酸取代。测定双重突变体的HMTBN活性,其高于nitBG46P的HMTBN活性。产生双重、三重和四重突变体,以便加速突变过程,更快地鉴别有利的突变。在鉴别和分离了最初几个有利的突变之后,将它们组合以产生双重突变体,其中最好的是DM18。DM18被用作模板来产生三重突变体。最有活性的三重突变体是TM3,其被用作模板来产生四重突变体。最有活性的四重突变体是QM2。该表概括了这些突变。
首先通过研究这些突变体的全细胞HMTBN活性表征这些突变体。在100mMHMTBN,QM2的HMTBS生产率比亲本基因的HMTBS生产率高1.2倍。然而,在200mMHMTBN,QM2的HMTBS生产率是亲本基因的3.6倍。当HMTBN浓度从100mM增加到300mM时,这些突变体的生产率有相应增加。对于转化率,在270分钟后,TM3完全地转化了底物,在该时间之后,DM18和SM均显示出高于75%的转化率。为了进一步着手于HMTBN浓度影响NitB的活性/生产率的问题,在400mM和528mMHMTBN下,测定了好几种突变体。NitB在这些底物浓度下实质上没有活性,然而突变体在这些浓度下保留了显著的活性。尤其是,这些高浓度下的活性与它们在200mM底物下的活性实质上相同。因此,这些突变体可以在广泛的底物浓度范围内使用,并且可以在使用上提供比NitB亲本基因更好的灵活性。
突变体显示出比亲本基因具有更高的表达水平,而且,正如SDS-PAGE分析中所看到的,似乎QM2和TM3突变体比野生型含有更大比例的可溶性酶。至于稳定性,所有酶在25℃和35℃显示出实质上相同的稳定性模式。
最后,对突变体进行密码子最优化。该方法的目的在于最优化密码子,从而增加特定宿主细胞中的表达水平。这反过来又增加酶的每个细胞的活性。与对照组相比,这导致密码子最优化的突变体中全细胞活性的增加。活性的增加量大约是该活性的两倍。使用大肠杆菌表达系统。
实施例19:从腈水解酶催化剂的反应所产生的化合物的选择实施例
图15中所列出的化合物是所选择的、可以使用本发明的酶和/或方法从腈水解酶催化的反应中产生的化合物。
此外,下面是可以通过腈水解酶斯特雷克尔格式(Streckerformat)产生的潜在的化合物。可以使用本发明的腈水解酶从它们各自的醛或酮产生多于100种氨基酸和许多新颖药物。例如,可以使用本发明的腈水解酶合成的具有很大市场的药物包括:同聚苯丙氨酸(homophenylalanine),VASOTECTM,VASOTERICTM,TECZEMTM,PRINIVILTM,PRINZIDETM,ZESTRILTM,ZESTORETICTM,RAMACETM,TARKATM,MAVIKTM,TRANDOAPRILTM,TRANDOLAPRILATTM,ALTACETM,ODRIKTM,UNIRETICTM,LOTENSINTM,LOTRELTM,CAPOTENTM,MONOPRILTM,TANATRILTM,ACECOLTM,LONGESTM,SPIRAPRILTM,QUINAPRILTM和CILAZAPRILTM。其它手性药物包括DEMSERTM(α-甲基-L-酪氨酸),ALDOCHLORTM,LEVOTHROIDTM,SYNTHROIDTM,CYTOMELTM,THYOLARTM,HYCODANTM,CUPRIMINETM,DEPENTM,PRIMAXINTM,MIGRANOLTM,D.H.E.-45,DIOVANTM,CEFOBIDTM,L-DOPA,D-DOPA,D-α-甲基-DOPA,L-α-甲基-DOPA,L-γ-羟基谷氨酸,D-γ-羟基谷氨酸,3-(2-萘基)-L-丙氨酸,D-高丝氨酸和L-高丝氨酸。
此外,本发明的腈水解酶可以用于合成下述氨基酸。这些氨基酸中的许多氨基酸具有药物应用。D-苯基甘氨酸,L-苯基甘氨酸,D-羟基苯基甘氨酸,L-羟基苯基甘氨酸,L-叔亮氨酸,D-叔亮氨酸,D-异亮氨酸,L-异亮氨酸,D-正亮氨酸,L-正亮氨酸,D-正缬氨酸,L-正缬氨酸,D-2-噻吩基甘氨酸,L-2-噻吩基甘氨基,L-2-氨基丁酸酯,D-2-氨基丁酸酯,D-环亮氨酸,L-环亮氨酸,D-2-甲基苯基甘氨酸,L-2-甲基苯基甘氨酸,L-噻吩基丙氨酸和D-噻吩基丙氨酸。
本发明的腈水解酶的酶能用于合成下述天然氨基酸:甘氨酸,L-丙氨酸,L-缬氨酸,L-亮氨酸,L-异亮氨酸,L-苯基丙氨酸,L-酪氨酸,L-色氨酸,L-半胱氨酸,L-甲硫氨酸,L-丝氨酸,D-丝氨酸,L-苏氨酸,L-赖氨酸,L-精氨酸,L-组氨酸,L-天冬氨酸,L-谷氨酸,L-天冬酰胺,L-谷氨酰胺和L-脯氨酸。下面是可以使用本发明的腈水解酶产生的非天然氨基酸的实例。D-丙氨酸,D-缬氨酸,D-亮氨酸,D-异亮氨酸,D-苯基丙氨酸,D-酪氨酸,D-色氨酸,D-半胱氨酸,D-甲硫氨酸,D-苏氨酸,D-赖氨酸,D-精氨酸,D-组氨酸,D-天冬氨酸,D-谷氨酸,D-天冬酰胺,D-谷氨酰胺和D-脯氨酸。
进一步,本发明的腈水解酶可以在非斯特雷克尔化学反应(non-Strecherchemicalreactions)中使用,包括更多手性药物的合成,如TAXOTERETM,以及含有3-羟基-戊二腈($5.5B的市场);LIPITORTM,BAYCOLTM和LESCOLTM的手性药物。不是药物的手性产物靶物质包括PANTENOLTM,L-膦丝菌素(L-phosphinothricin),D-膦丝菌素(D-phosphinothricin),D-氟苯基丙氨酸和L-氟苯基丙氨酸。最后,腈水解酶可以被用来产生缺乏手性中心的非天然氨基酸化合物,如肌氨酸,亚氨基二乙酸,乙二胺四乙酸(EDTA),α-氨基丁酸和β-丙氨酸。
图16是本发明的腈水解酶和/或本发明的方法所产生的底物和产物的实例。所示为底物和产物的化学结构。此处所示的化学反应是本发明的腈水解酶活性的非限定性实例。
实施例20:使用SEQIDNO:210的变体的多肽的例证性制备
变体,腈水解酶1506-83-H7A,是在残基190处用His取代Ala的SEQIDNO:210。在密码子水平,所发生的突变是GCT到CAT。该变体在3-羟基戊二酰基腈(HGN)转化为(R)-4-氰基-3-羟基丁酸中表现出改进的对映选择性。
该变体已经被证明,在室温下,在100mMpH7磷酸钠缓冲液中进行该转化。该突变体可以在其它缓冲液系统和温度下进行,以及具有提供额外的改变特性的潜力。例证性特性包括,但不限于,改变的反应速率,%ee和稳定性。尤其是,改变的特性可以是较高的反应速率,较高的%ee和较高的稳定性。改变的特性可以是高于野生型至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%或95%。
该变体显示出通过以10mM到3M底物(HGN)的高对映体过量产生产物来进行转换。较高或较低底物浓度也是可能的。已经达到了大于或等于95%的对映体过量。然而,对映体过量可以是高于野生型的至少25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%或90%。
本发明的SEQIDNOS:的变体可以被克隆到表达载体中。例如,核酸序列SEQIDNO:195,205,207,209或237的变体,和编码氨基酸序列SEQIDNO:210的变体的核苷酸可以被克隆到例证性载体中,包括但不限于,pSE420(大肠杆菌表达载体)和pMYC(假单胞菌属表达载体)。
实施例21:使用本发明的变体的制备:
在室温下,~22℃,将3-羟基戊二酰基腈(1g,9mmol)滴加到在2.12mL的100mMpH7磷酸钠缓冲液中的腈水解酶细胞溶解产物的搅拌溶液中(标准化为150mg蛋白含量)。在室温下,用磁力搅拌棒将该3M溶液搅拌24小时。通过TLC(薄层色谱)和GC(气相色谱)监控反应进程。反应应该在24小时内完成。
此处预期的其它变体包括,但不限于下述:N111S;A190H,S,Y或T;F191L,V,M,D,G,E,Y或T;M199E,或L;D222L;A55K,G或Q;I60E,或其任意组合。
实施例22:对映选择性转化的筛选测定分析
公开了一种新颖方法,用于筛选对映选择性转化,例如将前手性底物对映选择性地转化为手性底物,该方法可以提供监控所得到的产物的对映体过量(%ee)的能力。该方法也适用于确定非对映体过量(%de)。
例如,通过标记一个分子中的两个前手性或互变性(enantiotopic)部分之一,例如通过使用重同位素或轻同位素,可以通过质谱(MS)建立由选择性催化剂例如酶对两个部分中的一个进行修饰。
通过在15N-(R)-HGN(R)(如图17所示)或15N-(S)-HGN上进行例证性腈水解酶反应,可以通过分析被形成的两个可能标记产物与未标记酸性产物的每一种的量,确定酶的对映选择性。
proR选择性腈水解酶
(R)-4-氰基-3-羟基丁酸
15N-(R)-羟基戊二酰基腈(15NR-HGN)
proS选择性腈水解酶
15N-(S)-4-氰基-3-羟基丁酸
筛选实验可以在任一个方向进行。筛选实验可以被用于15N-(R)-和(S)-HGN部分。事实上,为了确保标记物不招致任何人为假象变化,开始时应该对两个都进行研究。
proR选择性腈水解酶
15N(R)-4-氰基-3-羟基丁酸
proS选择性腈水解酶
(S)-4-氰基-3-羟基丁酸
为了使所观察的腈水解酶转化所得到的对映体过量相等,可以使用下述例证性公式:
%ee={[130]-[129]}/{[130]+[129]},其中轻酸(129)和重酸(130)的每一浓度通过质谱仪上的峰面积与标准曲线的相关性确定,或者通过直接比较129和130质谱峰中的每一个的面积来确定。用于确定两个对映异构体中的每一个的相对量(标记的和未标记的)的实际质量单位(actualmassunits)依赖于质谱仪是如何调整的。
在一些情况下,通过质谱观察到的%ee可能与另一个替代性分析技术如液相色谱观察到的不同,具有一个因数的不同,这是由于天然同位素丰度所产生的背景或污染峰。然而,这不影响筛选过程的最终结果。量化重酸和轻酸的例证性标准曲线如图14A和B所示。
下述反应是可能的合成路线,例如用于制备15N(R)-HGN,使用了可商购的起始材料和本技术领域已知的化学技术。
通过以任一种阳性模式、阴性模式,使用MS,并且或者从亲本质量或者从任何碎裂质量的分析中,可以建立两种可能的立体结果中的每个结果的量。
实施例23:本发明的例证性酶的稳定性和活性
酶稳定性:
将野生型酶(SEQIDNOS:209和210)与SEQIDNOS:209和210的突变体A190H比较。在实验中,在两种不同的底物:己二腈和羟基戊二酰基腈上,在4℃和21℃,在水中以10mg/ml将每一种酶温育1、25、50、75和150小时。在所有情况下,发现两种酶可以将活性保持150小时。正如通过NitroprussideBertholit测定所评价的那样,野生型酶在己二腈上显示出较好的活性,而突变(A190H)的酶在羟基戊二酰基腈上显示出较好的活性(例如参见,Fawcett,J.K.&Scott,J.(1960);J.Clin.Path.;第13卷,第156页)。
GSSM突变体具有增强的对映选择性
在全细胞格式中,用从大肠杆菌表达的腈水解酶进行100mM反应,用36小时完成该反应。用腈水解酶作为冻干澄清细胞溶解产物,进行2.25M反应。所有报道的%ee数据是三次测量值的平均值,并给出平均数标准差。反应完成的时间是通过TLC大概估计的。
特异性:
腈水解酶活性测定,100mMHGN:
对推定腈水解酶高表达突变型进行三重测定。将每一转化体,于37℃和220rpm下,在5mLLB(100μg/mL氨苄青霉素)中培养18小时。将过夜培养物进行2倍稀释,用0.1mMIPTG于37℃和220rpm下诱导水解酶表达6小时。通过离心收获细胞,在100mMpH7磷酸钠缓冲液中洗涤,然后重悬浮在1mL的处于100mMpH7磷酸钠缓冲液中的100mMHGN中。轻轻地搅拌,在22℃允许反应至少继续进行36小时。反应进程通过TLC(1:1EtOAc:己烷,Rf=0.5,腈;Rf=0.0,酸)监控。通过离心,去除细胞和其它碎片,在冻干之前用1体积甲醇处理。将冻干物质重新悬浮在甲醇中,用四甲基硅烷(TMS)-重氮甲烷处理(10当量,溶解在己烷中的2M溶液),直到气体形成停止,黄色持续,以便制备用于GC分析的甲基酯。然后评价所选择的产生具有95%ee或更高ee的(R)-(-)-3-羟基-4-氰基丁酸的腈水解酶变体在2.25MHGN上的性能。
在2.25M3-HGN下的腈水解酶活性测定
将3-HGN(0.2g,1.8mmol,3M)于22℃悬浮在磷酸钠缓冲液(0.6mL,pH7,100mM)中。加入细胞溶解产物(6mg,标准化为腈水解酶含量),使浓度达到11mg/ml酶,振荡反应物(100rpm,22℃)。反应进程通过TLC(1:1乙酸乙酯:己烷,Rf=0.32,腈;Rf=0.0,酸)监控。在冻干之前,用1份甲醇处理反应混合物。将冻干物质重悬浮在甲醇中,用10当量TMS-重氮甲烷处理(10当量,溶解在己烷中的2M溶液),以便制备甲基酯,并且通过GC分析。
用于筛选高数量样品的新颖高流通量LC/MS方法的描述:
超高流通量(UltraHigh-throughput)初步手性活性筛选:
通过自动化菌落分选仪将GSSM文库的不同成员分配到含有40μL(Luria-Bertani)LB培养基(100μg/mL氨苄青霉素)的384孔平板中,然后于37℃,85%湿度下,将其温育。用0.1mMIPTG于37将腈水解酶表达诱导24小时。复制每一平板,制备20%甘油原种,归档保存在-80℃下。将10mM15N-(R)-1底物加入到每一个384孔平板中。于37℃、85%湿度下,将平板温育3天。通过离心去除细胞和其它碎片,在进行质谱分析之前,将上清液稀释17,576倍。
LC/MS离子喷雾以下述方式适用于高流通量(through-put)分析。通过使用CTCPAL自动取样器(LeapTechnologies,Carrboro,N.C.),从384孔平板流动注射样品实现了高流通量筛选。使用71%乙腈、29%水等度混合物,带有0.1%的甲酸,通过LC-10Advp泵(Shimadzu,Kyoto,Japan)以2.2mL/分钟通过LC-18滤筒(Supelco,Bellefonte,PA)予以提供。样品适用于API4000TurboIon喷雾三联四级质谱仪(AppliedBiosystems,FosterCity,CA)。以负离子模式,对分析物进行离子喷雾和多重反应监控(MRM),每一分析需要60秒。
用野生型酶(SEQIDNOS:209和210)转化的大肠杆菌被用作阳性活性对照组,用空载体(emptyvector)转化的大肠杆菌被用作阴性活性对照组。或者用15N-(R)-1或者用15N-(S)-1通过质谱确定的野生型(WT)酶阳性对照组的%ee是相同的,从而证明了不存在显著的同位素影响。
反应参数对具有A190H突变的SEQIDNOS:209和210的作用
反应使用150mg/ml蛋白(~49mg/ml酶),在3MHGN浓度下进行。%ee是通过三份重复运行的GC分析确定的。
尽管本发明已经参考某些优选的方面进行了详细的描述,但应该理解到,修改和变化也在所描述和权利要求所要求的范围和精神内。

Claims (12)

1.一种分离的或重组的核酸序列,其编码具有腈水解酶活性的多肽,所述核酸序列包括:与SEQIDNO:195、205、207、209或237、或者SEQIDNO:195、205、207、209或237的变体具有至少50%同一性的序列,具有如下一个或多个突变:位点163-165AAA,AAG,GGT,GGC,GGA,GGG,CAA或CAG;位点178-180GAA或GAG;位点331-333TCT,TCC,TCA,TCG,AGT或AGC;位点568-570CAT,CAC,TCT,TCC,TCA,TCG,AGT,AGC,ACT,ACC,ACA,TCA,TAT,TAC,ATG或ACG;位点571-573TTA,TTG,CTT,CTC,CTA,CTG,GTT,GTC,GTA,GTG,ATG,ACT,ACC,ACA,GAT,GAC,GGT,GGC,GGA,GGG,GAA,GAG,TAT,TAC或ACG;位点595-597GAA,GAG,TTA,TTG,CTT,CTC,CTA或CTG;和位点664-666TTA,TTG,CTT,CTC,CTA或CTG;或其任意组合,或其片段,其中所述核酸或片段编码具有腈水解酶活性的多肽,或其互补体。
2.一种分离的或重组的核酸,其与SEQIDNO:195、205、207、209或237或SEQIDNO:195、205、207、209或237的变体的核酸杂交,具有如下一个或多个突变:位点163-165AAA,AAG,GGT,GGC,GGA,GGG,CAA或CAG;位点178-180GAA或GAG;位点331-333TCT,TCC,TCA,TCG,AGT或AGC;位点568-570CAT,CAC,TCT,TCC,TCA,TCG,AGT,AGC,ACT,ACC,ACA,TCA,TAT,TAC,ATG或ACG;位点571-573TTA,TTG,CTT,CTC,CTA,CTG,GTT,GTC,GTA,GTG,ATG,ACT,ACC,ACA,GAT,GAC,GGT,GGC,GGA,GGG,GAA,GAG,TAT,TAC或ACG;位点595-597GAA,GAG,TTA,TTG,CTT,CTC,CTA或CTG;位点664-666TTA,TTG,CTT,CTC,CTA或CTG;或其任意组合,具有腈水解酶活性的片段,或其互补体。
3.一种核酸探针,包括约15个核苷酸至约50个核苷酸,其中至少15个连续核苷酸与SEQIDNO:195、205、207、209或237或SEQIDNO:195、205、207、209或237的变体的核酸序列内的核酸靶区域至少50%互补,具有如下一个或多个突变:位点163-165AAA,AAG,GGT,GGC,GGA,GGG,CAA或CAG;位点178-180GAA或GAG;位点331-333TCT,TCC,TCA,TCG,AGT或AGC;位点568-570CAT,CAC,TCT,TCC,TCA,TCG,AGT,AGC,ACT,ACC,ACA,TCA,TAT,TAC,ATG或ACG;位点571-573TTA,TTG,CTT,CTC,CTA,CTG,GTT,GTC,GTA,GTG,ATG,ACT,ACC,ACA,GAT,GAC,GGT,GGC,GGA,GGG,GAA,GAG,TAT,TAC或ACG;位点595-597GAA,GAG,TTA,TTG,CTT,CTC,CTA或CTG;位点664-666TTA,TTG,CTT,CTC,CTA或CTG;或其任意组合,或其互补体。
4.一种分离的或重组的核酸,其编码多肽,所述多肽包括具有与SEQIDNO:196、206、208、210或238或SEQIDNO:196、206、208、210或238的变体具有至少50%同一性的序列的氨基酸,具有如下一个或多个突变:在残基55处,赖氨酸,甘氨酸或谷氨酰胺;在残基60处,谷氨酸;在残基111处,丝氨酸;在残基190处,丝氨酸,组氨酸,酪氨酸或苏氨酸;在残基191处,亮氨酸,缬氨酸,甲硫氨酸,天冬氨酸,甘氨酸,谷氨酸,酪氨酸或苏氨酸;在残基199处,谷氨酸或亮氨酸;在残基222处,亮氨酸;或其任意组合,多肽编码片段,其中所述多肽具有腈水解酶活性,或其互补体。
5.一种组合物,包括至少一种权利要求1至3所述的核酸或包括至少一种权利要求7所述的多肽、或具有腈水解酶活性的其片段、或其肽模拟体、或其任意组合。
6.一种用于将腈分子水解为羧酸的方法,所述方法包括将该分子与至少一种权利要求5所述的多肽、或具有腈水解酶活性的其片段或其肽模拟体在适合腈水解酶活性的条件下接触。
7.一种用于制备手性α-羟基酸分子或手性氨基酸分子的方法,所述方法包括将具有羟腈部分或氨基腈部分的分子与具有对映选择性腈水解酶活性的至少一种多肽或其片段或其肽模拟体混合,所述多肽具有至少权利要求7所述的氨基酸序列。
8.一种用于制备(R)-乙基4-氰基-3-羟基丁酸的方法,所述方法包括将羟基戊二酰基腈与下列接触:至少一种多肽,所述多肽由核酸编码,所述核酸具有SEQIDNO:195、205、207、209或237或SEQIDNO:195、205、207、209或237的变体的序列,具有如下一个或多个突变:位点163-165AAA,AAG,GGT,GGC,GGA,GGG,CAA或CAG;位点178-180GAA或GAG;位点331-333TCT,TCC,TCA,TCG,AGT或AGC;位点568-570CAT,CAC,TCT,TCC,TCA,TCG,AGT,AGC,ACT,ACC,ACA,TCA,TAT,TAC,ATG或ACG;位点571-573TTA,TTG,CTT,CTC,CTA,CTG,GTT,GTC,GTA,GTG,ATG,ACT,ACC,ACA,GAT,GAC,GGT,GGC,GGA,GGG,GAA,GAG,TAT,TAC或ACG;位点595-597GAA,GAG,TTA,TTG,CTT,CTC,CTA或CTG;位点664-666TTA,TTG,CTT,CTC,CTA或CTG;或其任意组合,或其编码具有腈水解酶活性的多肽的片段,所述腈水解酶活性选择性地产生了(R)-对映异构体,从而制备(R)-乙基4-氰基-3-羟基丁酸。
9.一种用于制备(S)-乙基4-氰基-3-羟基丁酸的方法,所述方法包括将羟基戊二酰基腈与下列接触:至少一种多肽,所述多肽具有SEQIDNO:196、206、208、210或238或SEQIDNO:196、206、208、210或238的变体中任一个的氨基酸序列,具有如下一个或多个突变:在残基55处,赖氨酸,甘氨酸或谷氨酰胺;在残基60处,谷氨酸;在残基111处,丝氨酸;在残基190处,丝氨酸,组氨酸,酪氨酸或苏氨酸;在残基191处,亮氨酸,缬氨酸,甲硫氨酸,天冬氨酸,甘氨酸,谷氨酸,酪氨酸或苏氨酸;在残基199处,谷氨酸或亮氨酸;在残基222处,亮氨酸;或其任意组合,或具有腈水解酶活性的其片段或肽模拟体,所述腈水解酶活性选择性地产生(S)-对映异构体,从而制备(S)-乙基4-氰基-3-羟基丁酸。
10.一种用于制备(R)-扁桃酸的方法,所述方法包括将扁桃腈与下列混合:至少一种多肽,所述多肽具有SEQIDNO:196、206、208、210或238或SEQIDNO:196、206、208、210或238的变体中任一个的氨基酸序列,具有如下一个或多个突变:在残基55处,赖氨酸,甘氨酸或谷氨酰胺;在残基60处,谷氨酸;在残基111处,丝氨酸;在残基190处,丝氨酸,组氨酸,酪氨酸或苏氨酸;在残基191处,亮氨酸,缬氨酸,甲硫氨酸,天冬氨酸,甘氨酸,谷氨酸,酪氨酸或苏氨酸;在残基199处,谷氨酸或亮氨酸;在残基222处,亮氨酸;或其任意组合,或具有腈水解酶活性的其片段,或其肽模拟体。
11.一种用于制备(S)-扁桃酸的方法,所述方法包括将扁桃腈与下列混合:至少一种多肽,所述多肽具有SEQIDNO:196、206、208、210或238或SEQIDNO:196、206、208、210或238的变体的氨基酸序列,具有一个或多个突变:在残基55处,赖氨酸,甘氨酸或谷氨酰胺;在残基60处,谷氨酸;在残基111处,丝氨酸;在残基190处,丝氨酸,组氨酸,酪氨酸或苏氨酸;在残基191处,亮氨酸,缬氨酸,甲硫氨酸,天冬氨酸,甘氨酸,谷氨酸,酪氨酸或苏氨酸;在残基199处,谷氨酸或亮氨酸;在残基222处,亮氨酸;或其任意组合,或具有腈水解酶活性的其任何片段或肽模拟体。
12.一种用于制备(S)-苯基乳酸衍生物或(R)-苯基乳酸衍生物的方法,所述方法是将苯基乳氰腈与下列混合:至少一种多肽,所述多肽选自SEQIDNO:196、206、208、210或238或SEQIDNO:196、206、208、210或238的变体,具有如下一个或多个突变:在残基55处,赖氨酸,甘氨酸或谷氨酰胺;在残基60处,谷氨酸;在残基111处,丝氨酸;在残基190处,丝氨酸,组氨酸,酪氨酸或苏氨酸;在残基191处,亮氨酸,缬氨酸,甲硫氨酸,天冬氨酸,甘氨酸,谷氨酸,酪氨酸或苏氨酸;在残基199处,谷氨酸或亮氨酸;在残基222处,亮氨酸;或其任意组合,或具有腈水解酶活性的其任何片段或肽模拟体,或其任何活性片段或肽模拟体,所述腈水解酶活性选择性地产生了(S)-对映异构体或(R)-对映异构体,从而产生(S)-苯基乳酸衍生物或(R)-苯基乳酸衍生物。
CN201510514378.8A 2002-05-15 2003-05-15 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法 Pending CN105296512A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US10/146,772 US7521216B2 (en) 1999-12-29 2002-05-15 Nitrilases and methods for making and using them
US10/146,772 2002-05-15
US10/241,742 US20040002147A1 (en) 1999-12-29 2002-09-09 Nitrilases
US10/241,742 2002-09-09
CN03816682.8A CN1849391B (zh) 2002-05-15 2003-05-15 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN03816682.8A Division CN1849391B (zh) 2002-05-15 2003-05-15 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法

Publications (1)

Publication Number Publication Date
CN105296512A true CN105296512A (zh) 2016-02-03

Family

ID=29552719

Family Applications (3)

Application Number Title Priority Date Filing Date
CN03816682.8A Expired - Fee Related CN1849391B (zh) 2002-05-15 2003-05-15 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法
CN201210217394.7A Expired - Fee Related CN102796750B (zh) 2002-05-15 2003-05-15 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法
CN201510514378.8A Pending CN105296512A (zh) 2002-05-15 2003-05-15 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法

Family Applications Before (2)

Application Number Title Priority Date Filing Date
CN03816682.8A Expired - Fee Related CN1849391B (zh) 2002-05-15 2003-05-15 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法
CN201210217394.7A Expired - Fee Related CN102796750B (zh) 2002-05-15 2003-05-15 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法

Country Status (8)

Country Link
US (1) US20040002147A1 (zh)
EP (1) EP1576108B1 (zh)
JP (2) JP4384594B2 (zh)
CN (3) CN1849391B (zh)
AU (2) AU2003231789C1 (zh)
CA (2) CA2857899A1 (zh)
DK (1) DK1576108T3 (zh)
WO (1) WO2003097810A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106636044A (zh) * 2017-03-07 2017-05-10 东莞东阳光药物研发有限公司 腈水解酶突变体及其编码基因和应用
WO2019157921A1 (zh) * 2018-02-14 2019-08-22 浙江工业大学 腈水解酶突变体及其应用
WO2021147558A1 (zh) * 2020-01-21 2021-07-29 浙江工业大学 一种腈水解酶突变体及其在制备抗癫痫药物中间体中的应用
CN113755477A (zh) * 2021-08-30 2021-12-07 上海晖胧生物医药有限公司 腈水解酶突变体及其在制备苯乙酮酸类化合物中的应用
CN114908075A (zh) * 2022-04-02 2022-08-16 浙江工业大学 一种酶法合成布瓦西坦手性中间体的方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7521216B2 (en) 1999-12-29 2009-04-21 Verenium Corporation Nitrilases and methods for making and using them
US7300775B2 (en) 1999-12-29 2007-11-27 Verenium Corporation Methods for producing α-substituted carboxylic acids using nitrilases and strecker reagents
US20040002147A1 (en) * 1999-12-29 2004-01-01 Desantis Grace Nitrilases
US7435562B2 (en) 2000-07-21 2008-10-14 Modular Genetics, Inc. Modular vector systems
AU2003251523A1 (en) 2002-06-13 2003-12-31 Diversa Corporation Processes for making (r)-ethyl 4-cyano-3-hydroxybutyric acid
EP1817413B1 (en) 2004-11-11 2012-01-04 Modular Genetics, Inc. Oligonucleotide ladder assembly and system for generating molecular diversity
US7671231B2 (en) * 2006-01-18 2010-03-02 Lloyd Michael C Process for making amino acids
DK2115153T3 (da) 2007-03-01 2013-09-08 Bp Corp North America Inc Nitrilaser, nucleinsyrer som koder for dem og fremgangsmåder til at fremstille og anvende disse
CN109688817B (zh) * 2016-10-03 2022-02-22 Illumina公司 胺和肼的荧光检测及其分析方法
CN112058241B (zh) * 2020-09-15 2022-11-15 太原科技大学 一种含大豆蛋白的复合吸附材料的制备方法
CN112063607B (zh) * 2020-10-09 2021-12-07 浙江工业大学 一种腈水解酶突变体及其在催化合成2-氯烟酸中的应用
CN113151233B (zh) * 2021-04-13 2022-08-12 浙江工业大学 腈水合酶赖氨酸突变体hba-k2h2、编码基因及应用
CN113151234B (zh) * 2021-04-13 2022-08-12 浙江工业大学 腈水合酶赖氨酸突变体hba-k2h2r、编码基因及应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1133341A (zh) * 1994-12-28 1996-10-16 日东化学工业株式会社 腈水解酶基因表达的调控因子及其基因
WO2001013105A1 (en) * 1999-07-30 2001-02-22 Agy Therapeutics, Inc. Techniques for facilitating identification of candidate genes

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
US5331573A (en) 1990-12-14 1994-07-19 Balaji Vitukudi N Method of design of compounds that mimic conformational features of selected peptides
US5631280A (en) 1995-03-29 1997-05-20 Merck & Co., Inc. Inhibitors of farnesyl-protein transferase
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
JPH0937788A (ja) * 1995-07-31 1997-02-10 Nitto Chem Ind Co Ltd 新規なニトリラーゼ遺伝子
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
DE19848129A1 (de) * 1998-10-19 2000-04-20 Basf Ag Verfahren zur Herstellung chiraler Carbonsäuren aus Nitrilen mit Hilfe einer Nitrilase oder Mikroorganismen, die ein Gen für die Nitrilase enthalten
US7300775B2 (en) * 1999-12-29 2007-11-27 Verenium Corporation Methods for producing α-substituted carboxylic acids using nitrilases and strecker reagents
WO2003000840A2 (en) * 2001-06-21 2003-01-03 Diversa Corporation Nitrilases
US20040002147A1 (en) * 1999-12-29 2004-01-01 Desantis Grace Nitrilases
WO2014205447A2 (en) 2013-06-21 2014-12-24 Bio-Rad Laboratories, Inc. Microfluidic system with fluid pickups

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1133341A (zh) * 1994-12-28 1996-10-16 日东化学工业株式会社 腈水解酶基因表达的调控因子及其基因
WO2001013105A1 (en) * 1999-07-30 2001-02-22 Agy Therapeutics, Inc. Techniques for facilitating identification of candidate genes

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JOHN DEVEREUX ET AL.: "A comprehensive set of sequence analysis programs for the VAX", 《NUCLEIC ACIDS RESEARCH》 *
娄文勇等: "微生物腈水合酶的研究进展", 《分子催化》 *

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106636044A (zh) * 2017-03-07 2017-05-10 东莞东阳光药物研发有限公司 腈水解酶突变体及其编码基因和应用
CN106636044B (zh) * 2017-03-07 2019-10-18 东莞东阳光药物研发有限公司 腈水解酶突变体及其编码基因和应用
WO2019157921A1 (zh) * 2018-02-14 2019-08-22 浙江工业大学 腈水解酶突变体及其应用
US11001823B2 (en) 2018-02-14 2021-05-11 Zhejiang University Of Technology Nitrilase mutants and application thereof
US11525131B2 (en) 2018-02-14 2022-12-13 Zhejiang University Of Technology Recombinant vector constructed from an encoding gene of a nitrilase mutant, a recombinant genetic engineered strain and application thereof
US11535839B2 (en) 2018-02-14 2022-12-27 Zhejiang University Of Technology Encoding genes of nitrilase mutants and application thereof
WO2021147558A1 (zh) * 2020-01-21 2021-07-29 浙江工业大学 一种腈水解酶突变体及其在制备抗癫痫药物中间体中的应用
US11987826B2 (en) 2020-01-21 2024-05-21 Zhejiang University Of Technology Nitrilase mutant and application thereof in the synthesis of an anti-epileptic drug intermediate
CN113755477A (zh) * 2021-08-30 2021-12-07 上海晖胧生物医药有限公司 腈水解酶突变体及其在制备苯乙酮酸类化合物中的应用
CN113755477B (zh) * 2021-08-30 2023-08-18 上海晖胧生物医药有限公司 腈水解酶突变体及其在制备苯乙酮酸类化合物中的应用
CN114908075A (zh) * 2022-04-02 2022-08-16 浙江工业大学 一种酶法合成布瓦西坦手性中间体的方法
CN114908075B (zh) * 2022-04-02 2024-03-26 浙江工业大学 一种酶法合成布瓦西坦手性中间体的方法

Also Published As

Publication number Publication date
CA2486062A1 (en) 2003-11-27
WO2003097810A2 (en) 2003-11-27
EP1576108A4 (en) 2008-01-09
EP1576108A2 (en) 2005-09-21
CN1849391B (zh) 2014-06-11
AU2003231789C1 (en) 2010-02-25
CN102796750A (zh) 2012-11-28
AU2003231789B8 (en) 2009-05-14
JP4384594B2 (ja) 2009-12-16
JP2006511195A (ja) 2006-04-06
CN102796750B (zh) 2015-09-16
CA2486062C (en) 2014-10-14
US20040002147A1 (en) 2004-01-01
JP4528872B2 (ja) 2010-08-25
WO2003097810A3 (en) 2006-03-23
AU2009203078A2 (en) 2009-10-08
CA2857899A1 (en) 2003-11-27
DK1576108T3 (en) 2015-10-05
AU2003231789B2 (en) 2009-04-30
AU2003231789A1 (en) 2003-12-02
AU2009203078A1 (en) 2009-08-20
CN1849391A (zh) 2006-10-18
JP2009279005A (ja) 2009-12-03
EP1576108B1 (en) 2015-07-08

Similar Documents

Publication Publication Date Title
CN102796750B (zh) 腈水解酶、编码腈水解酶的核酸,以及制备和使用它们的方法
JP4405528B2 (ja) ニトリラーゼ
US9828594B2 (en) Nitrilases, nucleic acids encoding them and methods for making and using them
US9217164B2 (en) Nitrilases, nucleic acids encoding them and methods for making and using them
US20040014195A1 (en) Nitrilases, nucleic acids encoding them and methods for making and using them
US20030124698A1 (en) Nitrilases
US7608445B1 (en) Nitrilases, nucleic acids encoding them and methods for making and using them
AU2002350008A1 (en) Nitrilases

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160203

WD01 Invention patent application deemed withdrawn after publication