CN101641438A - 经修饰的蛋白酶 - Google Patents

经修饰的蛋白酶 Download PDF

Info

Publication number
CN101641438A
CN101641438A CN200880007877A CN200880007877A CN101641438A CN 101641438 A CN101641438 A CN 101641438A CN 200880007877 A CN200880007877 A CN 200880007877A CN 200880007877 A CN200880007877 A CN 200880007877A CN 101641438 A CN101641438 A CN 101641438A
Authority
CN
China
Prior art keywords
polynucleotide
modified
bacillus
seq
enzyme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200880007877A
Other languages
English (en)
Other versions
CN101641438B (zh
Inventor
D·A·埃斯特尔
E·费拉里
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Danisco USA Inc
Danisco US Inc
Original Assignee
Danisco USA Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=39743046&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN101641438(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Danisco USA Inc filed Critical Danisco USA Inc
Priority to CN201310559596.4A priority Critical patent/CN103667323B/zh
Publication of CN101641438A publication Critical patent/CN101641438A/zh
Application granted granted Critical
Publication of CN101641438B publication Critical patent/CN101641438B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • C07K14/08RNA viruses
    • C07K14/18Togaviridae; Flaviviridae
    • C07K14/19Rubella virus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • C12N9/54Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea bacteria being Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21062Subtilisin (3.4.21.62)

Abstract

本发明涉及经修饰的多核苷酸,其编码经修饰的蛋白酶,本发明还涉及改变微生物中蛋白酶生产的方法。具体地,本发明涉及改变蛋白酶在微生物(例如芽孢杆菌种)中的表达的方法。本发明公开了经修饰的多核苷酸、载体、经修饰的多肽和增强蛋白酶生产的方法。

Description

经修饰的蛋白酶
发明领域
本发明提供了编码经修饰的蛋白酶的经修饰的多核苷酸以及改变微生物中蛋白酶生产的方法。具体地,本发明涉及改变蛋白酶在微生物(例如芽孢杆菌种)中的表达的方法。本发明公开了经修饰的多核苷酸、载体、经修饰的多肽和增强蛋白酶生产的方法。
背景技术
微生物,例如是芽孢杆菌属成员的革兰氏阳性微生物,已被用于大规模的工业发酵,这部分是因为它们能将其发酵产物分进其培养基。分泌的蛋白穿过细胞膜和细胞壁被输出,随后再释放进外部培养基。多肽分泌进周质空间或其培养基依赖于多个参数,在工业发酵中需要对它们详加考虑。
事实上,异源多肽的分泌是工业界广泛使用的技术。典型地,用编码待表达且待分泌的目的异源多肽的核酸转化细胞,以生产大量的想要的多肽。该技术已用于生产大量的多肽。已可通过对编码想要的蛋白质的多核苷酸进行遗传操作,来控制想要的多肽的表达和分泌。虽然蛋白质生产方法已有若干进展,但是本领域中仍需要提供细胞外蛋白质分泌的有效方法。
发明概述
本发明涉及经修饰的多核苷酸,其编码经修饰的蛋白酶,本发明还涉及改变微生物中蛋白酶生产的方法。特别地,本发明涉及改变蛋白酶在微生物(例如芽孢杆菌种)中的生产的方法。本发明公开了经修饰的多核苷酸、载体、经修饰的多肽和增强蛋白酶生产的方法。
本发明涉及经过遗传操作以增强经修饰蛋白质生产的多核苷酸、多肽和细胞。特别地,本发明涉及具有引入其中的外源核酸序列的革兰氏阳性微生物以及在此类宿主细胞(例如芽孢杆菌属的成员)中生产蛋白质的方法。更具体地,本发明涉及蛋白酶的生产以及经过遗传操作从而具有改变的生产表达的蛋白质的能力的细胞。特别地,本发明提供了微生物对蛋白酶的增强的生产。
在一些实施方式中,本发明提供了分离的经修饰的多核苷酸,其编码经修饰的全长蛋白酶,其中,多核苷酸序列中编码全长前体蛋白酶的前区域(pro region)的部分包含编码选自下述位置的至少一处氨基酸位置上的取代的突变,所述位置等同于SEQ ID NO:5、13和244的氨基酸位置28-108和109。在一些实施方式中,经修饰的全长蛋白酶是丝氨酸蛋白酶,其中,多核苷酸序列中编码全长前体蛋白酶的前区域的部分包含编码选自下述位置的至少一处氨基酸位置上的取代的突变,所述位置等同于SEQ ID NO:5、13和244的氨基酸位置28-108和109。在其他实施方式中,全长蛋白酶是源于野生型或变体前体碱性丝氨酸蛋白酶的碱性丝氨酸蛋白酶,其中,多核苷酸序列中编码全长前体蛋白酶的前区域的部分包含编码选自下述位置的至少一处氨基酸位置上的取代的突变,所述位置等同于SEQ ID NO:5、13和244的氨基酸位置28-108和109。在其它一些实施方式中,全长蛋白酶是源于野生型或变体前体碱性丝氨酸蛋白酶(其是克劳氏芽孢杆菌(B.Clausii)或缓慢葡萄球菌(S.lentus)碱性丝氨酸蛋白酶)的碱性丝氨酸蛋白酶,其中,多核苷酸序列中编码全长前体蛋白酶的前区域的部分包含编码选自下述位置的至少一处氨基酸位置上的取代的突变,所述位置等同于SEQ ID NO:5、13和244的氨基酸位置28-108和109。在一些实施方式中,经分离的经修饰的多核苷酸包含SEQ ID NOS:1、9或240所示的多核苷酸序列。
在一些实施方式中,本发明提供了经分离的经修饰的多核苷酸,其编码经修饰的全长蛋白酶,其中,多核苷酸序列中编码全长前体蛋白酶的前区域的部分包含编码选自下述位置的至少一处氨基酸位置上的取代的突变,所述位置等同于SEQ ID NO:5、13和244的氨基酸位置28-108和109,其中,所述至少一处取代是在选自SEQ ID NO:5、13或244的E33、E43、A44、E47、V49、E57、A59、E63、E70、E74、E84和E88的一处氨基酸位置进行的。在其它一些实施方式中,E33的氨基酸取代选自E33D、E33I、E33S、E33N、E33K、E33H、E33Q和E33R。在其它一些实施方式中,E57的氨基酸取代选自E57F、E57W、E57K、E57R、E57D、E57M、E57C、E57Q、E57S、E57H和E57N。
在一些实施方式中,本发明提供了经分离的经修饰的多核苷酸,其包含已被突变为编码选自下述位置的至少一处氨基酸位置上的取代的前体前序列,所述位置等同于SEQ ID NO:5、13或244的氨基酸位置28-108和109。在另外一些实施方式中,经分离的经修饰的多核苷酸还包含编码包含成熟区域的全长蛋白酶的多核苷酸,其中,编码蛋白酶成熟区域的多核苷酸与SEQ ID NOS:8、16或247有至少大约70%同一性。
在一些实施方式中,本发明提供了包含经修饰的多核苷酸的至少一种载体,所述多核苷酸编码经修饰的全长蛋白酶,其中,多核苷酸序列中编码全长前体蛋白酶的前区域的部分包含编码选自下述位置的至少一处氨基酸位置上的取代的突变,所述位置等同于SEQ ID NO:5、13和244的氨基酸位置28-108和109,或者,提供了包含经分离的经修饰的多核苷酸的至少一种载体,所述多核苷酸包含已被突变为编码选自下述位置的至少一处氨基酸位置上的取代的前体前序列,所述位置等同于SEQ ID NO:5、13或244的氨基酸位置28-108和109。
在其它一些实施方式中,本发明提供了经包含本发明的经修饰的多核苷酸的载体转化的宿主相比。在一些优选的实施方式中,经转化的宿主细胞是微生物。例如,在一些实施方式中,本发明提供了下述宿主细胞,所述宿主细胞经包含经修饰的下述多核苷酸的至少一种载体转化,所述多核苷酸编码经修饰的全长蛋白酶,其中,多核苷酸序列中编码全长前体蛋白酶的前区域的部分包含编码选自下述位置的至少一处氨基酸位置上的取代的突变,所述位置等同于SEQ ID NO:5、13和244的氨基酸位置28-108和109,或者,所述宿主细胞经分离的经修饰的下述多核苷酸转化,所述多核苷酸包含已被突变为编码选自下述位置的至少一处氨基酸位置上的取代的前体前序列,所述位置等同于SEQ ID NO:5、13或244的氨基酸位置28-108和109。在一些实施方式中,经本发明的多核苷酸转化的宿主细胞是选自芽孢杆菌属(Bacillus sp).、链霉菌属(Streptomyces sp.)、埃希氏菌属(Escherichia sp.)和曲霉属(Aspergillus sp.)构成的组的微生物。在一些其它实施方式中,宿主细胞是枯草芽孢杆菌(B.subtilis)。
在一些实施方式中,本发明提供了通过本发明的经转化的宿主细胞生产的蛋白酶。
本发明还提供了在微生物中生产异源蛋白酶的方法,其中所述方法包含下述步骤:(a)在合适的条件下培养芽孢杆菌宿主细胞,其中,所述芽孢杆菌宿主细胞包含经修饰的多核苷酸,所述多核苷酸编码经修饰的蛋白酶;以及(b)通过所述微生物来生产蛋白酶。在一些实施方式中,通过芽孢杆菌宿主生产的蛋白酶被回收。本文提供的经修饰的多核苷酸中任何一种都可用于本发明的方法。
在一些实施方式中,本发明提供了在微生物中生产异源碱性丝氨酸蛋白酶的方法,其中,所述方法包括下述步骤:(a)在合适的条件下培养芽孢杆菌宿主细胞,其中,所述芽孢杆菌宿主细胞包含经修饰的多核苷酸,所述多核苷酸编码经修饰的蛋白酶;以及(b)通过所述微生物来生产蛋白酶。本发明还提供了在微生物中生产异源蛋白酶的下述方法,其中,所述方法包括下述步骤:(a)在合适的条件下培养芽孢杆菌宿主细胞,其中,所述芽孢杆菌宿主细胞包含经修饰的多核苷酸,所述多核苷酸编码经修饰的蛋白酶,所述经修饰的蛋白酶包含与SEQ ID NOS:8、16或247有至少大约70%同一性的成熟区域;以及(b)通过所述微生物来生产蛋白酶。在一些实施方式中,芽孢杆菌宿主生产的蛋白质被回收。
在一些实施方式中,本发明提供了在微生物中生产异源蛋白酶的下述方法,其中,所述方法包括下述步骤:(a)在合适的条件下培养芽孢杆菌宿主细胞,其中,所述芽孢杆菌宿主细胞包含经修饰的多核苷酸,所述多核苷酸编码经修饰的蛋白酶,所述经修饰的蛋白酶包含下述前区域,所述前区域包含编码选自下述位置的至少一处氨基酸位置上的取代的突变,所述位置等同于SEQ ID NO:5、13或244的氨基酸位置28-108和109;以及(b)通过所述微生物来生产蛋白酶。在其它一些实施方式中,所述至少一处氨基酸取代选自E33D、E33I、E33S、E33N、E33K、E33H、E33Q、E33R、E57F、E57W、E57K、E57R、E57D、E57M、E57C、E57Q、E57S、E57H和E57N。
本发明还提供了在微生物中生产是克劳氏芽孢杆菌或迟缓芽孢杆菌(B.lentus)蛋白酶的异源蛋白酶的方法,其中,所述方法包括下述步骤:(a)在合适的条件下培养芽孢杆菌宿主细胞,其中,所述芽孢杆菌宿主细胞包含经修饰的多核苷酸,所述多核苷酸编码经修饰的蛋白酶;以及(b)通过所述微生物来生产蛋白酶。
本发明还提供了在微生物中生产异源蛋白酶的下述方法,其中,所述方法包括下述步骤:(a)在合适的条件下培养选自地衣芽孢杆菌(B.licheniformis)、迟缓芽孢杆菌、枯草芽孢杆菌(B.subtilis)、解淀粉芽孢杆菌(B.Amyloliquefaciens)、短芽孢杆菌(B.brevis)、嗜热脂肪杆菌(B.stearothermophilus)、克劳氏芽孢杆菌、嗜碱芽孢杆菌(B.alkalophilus)、耐盐芽孢杆菌(B.halodurans)、凝固芽孢杆菌(B.coagulans)、环状芽孢杆菌(B.circulans)、短小芽孢杆菌(B.pumilus)和苏云金芽孢杆菌(B.thuringiensis)的芽孢杆菌宿主细胞,其中,所述芽孢杆菌宿主细胞包含经修饰的多核苷酸,所述多核苷酸编码经修饰的蛋白酶;以及(b)通过所述微生物来生产蛋白酶。在一些实施方式中,所述宿主细胞是枯草芽孢杆菌宿主细胞。
本发明还提供了在微生物中生产异源蛋白的下述方法,其中,所述方法包括下述步骤:(a)在合适的条件下培养芽孢杆菌宿主细胞,其中,所述芽孢杆菌宿主细胞包含经修饰的多核苷酸,所述多核苷酸编码经修饰的蛋白酶;以及(b)通过所述微生物来生产蛋白酶,并且,其中,所述异源蛋白酶展示出至少1的生产比例。
附图简述
图1A显示了来自克劳氏芽孢杆菌的野生型蛋白酶的全长多核苷酸序列(SEQ ID NO:1)。该序列中编码蛋白酶的前区域的部分以粗体字母显示。
图1B、C和D显示了多核苷酸序列(SEQ ID NO:2、3和4),它们分别编码SEQ ID NO:5的全长克劳氏芽孢杆菌蛋白酶的信号肽(SEQ IDNO:6)、前区域(SEQ ID NO:7)和成熟形式(SEQ ID NO:8)。
图2A显示了来自克劳氏芽孢杆菌的野生型蛋白酶的全长多肽序列(SEQ ID NO:5)。该序列中编码蛋白酶的前区域的部分以粗体字母显示。
图2B、C和D显示了分别编码SEQ ID NO:5的全长克劳氏芽孢杆菌蛋白酶的信号肽(SEQ ID NO:6)、前区域(SEQ ID NO:7)和成熟形式(SEQ ID NO:8)的多肽序列。
图3A显示了来自克劳氏芽孢杆菌的变体蛋白酶V049的全长多核苷酸序列(SEQ ID NO:9)。该序列中编码蛋白酶的前区域的部分以粗体字母显示。
图3B、C和D显示了多核苷酸序列(SEQ ID NO:10、11和12),它们分别编码SEQ ID NO:13的全长变体克劳氏芽孢杆菌蛋白酶的信号肽(SEQ ID NO:14)、前区域(SEQ ID NO:15)和成熟形式(SEQ ID NO:16)。
图4A显示了来自克劳氏芽孢杆菌的变体蛋白酶V049的全长多肽序列(SEQ ID NO:13)。该序列中编码蛋白酶的前区域的部分以粗体字母显示。
图4B、C和D显示了分别编码SEQ ID NO:13的全长变体克劳氏芽孢杆菌蛋白酶的信号肽(SEQ ID NO:14)、前区域(SEQ ID NO:15)和成熟形式(SEQ ID NO:16)的多肽序列。
图5显示了对SEQ ID NO:5的克劳氏芽孢杆菌野生型丝氨酸蛋白酶、SEQ ID NO:13的克劳氏芽孢杆菌变体丝氨酸蛋白酶和SEQ ID NO:244的迟缓芽孢杆菌丝氨酸蛋白酶的氨基酸序列的比对。氨基酸的区别被下划线示出。
图6提供了包含SEQ ID NO:9的变体丝氨酸蛋白酶的pXX-049质粒载体的图谱。
图7A-D显示了用于本发明的pXX-049质粒载体的多核苷酸序列(SEQ ID NO:17)。
图8A显示了来自迟缓芽孢杆菌的蛋白酶的全长多核苷酸序列(SEQID NO:240)。该序列中编码蛋白酶的前区域的部分以粗体字母显示。
图8B、C和D显示了多核苷酸序列(SEQ ID NO:241、242和243),它们分别编码SEQ ID NO:244的迟缓芽孢杆菌前体蛋白酶的信号肽(SEQID NO:245)、前区域(SEQ ID NO:246)和成熟形式(SEQ ID NO:247)。
图9A显示了来自克劳氏芽孢杆菌的变体蛋白酶GG36的全长多肽序列(SEQ ID NO:244)。该序列中编码蛋白酶的前区域的部分以粗体字母显示。
图9B、C和D显示了分别编码SEQ ID NO:244的全长迟缓芽孢杆菌蛋白酶的信号肽(SEQ ID NO:245)、前区域(SEQ ID NO:246)和成熟形式(SEQ ID NO:247)的多肽序列。
发明描述
本发明涉及经修饰的多核苷酸,其编码经修饰的蛋白酶,本发明还涉及改变微生物中蛋白酶生产的方法。特别地,本发明涉及改变蛋白酶在微生物(例如芽孢杆菌的种)中的表达的方法。本发明公开了经修饰的多核苷酸、载体、经修饰的多肽和增强蛋白酶生产的方法。
本发明提供了经修饰的多核苷酸,其编码具有经突变的前区域的蛋白酶,本发明还提供了所述经修饰的多核苷酸编码的经修饰的蛋白酶以及用于生产它们的方法。经修饰的蛋白酶多核苷酸适于在微生物中表达经修饰的蛋白酶以及以比相应前体蛋白酶更高的水平对成熟形式进行加工。产生的蛋白酶可用于对适用于多种工业(包括但不限于:清洁、动物饲料和纺织品加工工业)的酶的工业生产。本发明还提供了生产这些酶的手段。在一些优选的实施方式中,本发明的蛋白酶是纯的或相对纯的形式。
除非另有指明,本发明的实践涉及分子生物学、微生物学、蛋白质纯化、蛋白质工程、蛋白质和DNA测序以及重组DNA领域通常所用的常规技术,它们在本领域技术范围内。此类技术是本领域技术人员已知的,它们被描述于大量的教材和参考文献中(见,例如Sambrook et al.,″Molecular Cloning:A Laboratory Manual″,Second Edition(Cold SpringHarbor),[1989]和Ausubel et al.,″Current Protocols in MolecularBiology″[1987])。本文中(包括上文和下文中)提到的所有专利、专利申请、文章和出版物都通过引用明确并入本文。
除非另有指明,本文使用的所有技术和科学术语都具有与本发明所属领域的普通技术人员通常的理解相同的含义。例如,Singleton andSainsbury,Dictionary of Microbiology and Molecular Biology,2d Ed.,John Wiley and Sons,NY(1994);和Hale and Markham,The HarperCollins Dictionary of Biology,Harper Perennial,NY(1991)为本领域技术人员提供了本发明所用的很多术语的一般性词典解释。虽然与本文的描述相似或等同的任何方法和材料都可用于本发明的实施,但本文描述了优选的方法和材料。因此,通过参考说明书整体能更完整地理解下文即将定义的术语。此外,在本文中使用时,除非上下文另有清楚指示,单数术语“一个/种”和“这个/种”(“a”、“an”和“the”)也包括复数指代。数值范围包括界定该范围的数字。除非另有指明,分别地,核酸是按照5’至3’的方向从左到右书写的;氨基酸是按照氨基到羧基的方向从左到右书写的。应当理解,本发明并不限于所述的特定的方法、方案和试剂,它们可根据本领域技术人员使用它们的背景而有所改变。
此外,本文提供的标题并非是对本发明的多个方面或实施方式的限制,它们可参照说明书整体而得到。因此,通过参考说明书整体能更完整地理解下文即将定义的术语。但是,为了协助理解本发明,下文定义了多个术语。
定义
“经修饰的蛋白酶”是具有下述氨基酸序列的全长蛋白酶,所述氨基酸序列源于全长“前体蛋白酶”的氨基酸序列。前体蛋白酶也可被称为“未经修饰的蛋白酶”。经修饰的蛋白酶在前区域与其前体蛋白酶有所不同。前体蛋白酶可以是天然存在的,即野生型的蛋白酶,或者其可以是变体蛋白酶。野生型或变体蛋白酶的前区域经过修饰,以产生经修饰的蛋白酶。经修饰的蛋白酶的氨基酸序列被认为是通过对前体氨基酸序列的前区域中一个或多个氨基酸的取代、缺失或插入而“源于”所述前体蛋白酶氨基酸序列。在一些优选的实施方式中,前体蛋白酶的前区域的一个或多个氨基酸被取代,以产生经修饰的蛋白酶。此类修饰是对编码前体蛋白酶氨基酸序列的“前体DNA序列”的修饰,而非对前体蛋白酶本身进行的操作。本文中,经修饰的蛋白酶包括在前体蛋白酶的前区域的任何一处氨基酸残基处用19种天然存在的氨基酸中的任何一种进行的取代。在本文上下文中,“经修饰的”和“前体”蛋白酶都是包含信号肽、前区域和成熟区域的全长蛋白酶。编码经修饰的序列的多核苷酸被称为“经修饰的多核苷酸”,编码前体蛋白酶的多核苷酸被称为“前体多核苷酸”。“前体多肽”和“前体多核苷酸”可分别互换地称作“未经修饰的前体多肽”或“未经修饰的前体多核苷酸”。
“天然存在的”或“野生型”指具有与自然界中所发现的相同的未经修饰的氨基酸序列的蛋白酶或编码所述蛋白酶的多核苷酸。天然存在的酶包括天然的酶,即在特定微生物中天然表达或发现的那些酶。野生型的或天然存在的序列指变体所源自的序列。野生型序列可编码同源或异源蛋白质。
在本文中使用时,“变体”指通过在C-末端和N-末端中任一或两者添加一个或多个氨基酸,在氨基酸中的一个或多个不同位点取代一个或多个氨基酸,在蛋白质的任一末端或两个末端或氨基酸序列的一个或多个位点缺失一个或多个氨基酸,和/或在氨基酸序列的一个或多个位点插入一个或多个氨基酸,而与其相应野生型蛋白质有所不同的前体蛋白质。本发明上下文中,通过克劳氏芽孢杆菌蛋白酶V049(SEQ ID NO:13)来示例变体蛋白质,其是天然存在的蛋白质Maxacal(SEQ ID NO:5)的变体。变体的前体蛋白可以是野生型或变体蛋白。
在本文中使用时,“等同于”指蛋白质或肽的列举的位置上的残基或者与蛋白质或肽的列举残基类似、同源或相应的残基。
在提到蛋白酶时,术语“生产”包括对全长蛋白酶的两个加工步骤,包括:1.除去信号肽,这已知在蛋白质分泌期间发生,和2.除去前区域,这产生了酶的活性成熟形式,并且已知在成熟过程期间发生(Wang et al.,Biochemistry 37:3165-3171(1998);Power et al.,Proc Natl Acad Sci USA83:3096-3100(1986))。
在提到成熟蛋白酶时,术语“经加工的”指全长蛋白质(例如蛋白酶)所经历以成为活性成熟酶的成熟过程。
术语“活性比例”和“生产比例”可互换使用,用于表示从经修饰的蛋白酶加工的成熟蛋白酶的酶促活性与从未经修饰的蛋白酶加工的成熟蛋白酶的酶促活性之比。
术语“全长蛋白质”在本文中表示基因的一级基因产物,其包含信号肽、前序列和成熟序列。
术语“信号序列”或“信号肽”指可参与蛋白质的成熟或前体形式分泌的核苷酸和/或氨基酸的任何序列。信号序列的该定义是功能性定义,其意欲包括参与实现蛋白质分泌的蛋白质基因N-末端部分编码的所有那些氨基酸序列。
术语“前序列”或“前区域”是信号序列和成熟序列之间的氨基酸序列,其对于蛋白酶的分泌/生产来说是必要的。将前序列切割掉将产生成熟活性蛋白酶。举例而言,本发明的蛋白酶的前区域至少包括与SEQ IDNO:5、13或244的28-111位残基相同的氨基酸序列。
术语“成熟形式”或“成熟区域”指蛋白质的最终功能性部分。举例而言,本发明的蛋白酶的成熟形式至少包括与SEQ ID NO:5、13或244的112-380位残基相同的氨基酸序列。在本文上下文中,“成熟形式”“加工自”全长蛋白酶,其中,对全长蛋白酶的加工包括除去信号肽和除去前区域。
在本文中使用时,术语“异源蛋白”指不在宿主细胞中天然存在的蛋白质或多肽。相似地,“异源多核苷酸”指不在宿主细胞中天然存在的多核苷酸。
在本文中使用时,“同源蛋白”指在细胞中是天然的或天然存在的蛋白质或多肽。相似地,“同源多核苷酸”指在细胞中是天然的或天然存在的多核苷酸。
在本文中使用时,术语“启动子”指指导下游基因转录的核酸序列。在一些优选的实施方式中,启动子适合于其中将要表达靶基因的宿主细胞。启动子与其它转录和翻译调控核酸序列(也称为“控制序列”)一起,是表达给定基因所必需的。通常,转录和翻译调控序列包括但不限于:启动子序列、核糖体结合位点、转录起始和终止序列、翻译起始和终止序列以及增强子或活化序列。
当核酸相对另一核酸序列以功能性关系放置时,其被称为“有效连接的”。例如,如果启动子或增强子能影响编码序列的转录,它们就是与编码序列有效连接的;或者,如果核糖体结合位点被放置为能协助翻译,它就是与编码序列有效连接的。通常,“有效连接的”指相连的DNA序列是毗邻的。
在本文中使用时,术语“蛋白酶”和“蛋白水解活性”指展示出能水解肽或具有肽键的底物的能力的蛋白质或肽。已有很多公知方法用于测量蛋白质水解活性(Kalisz,″Microbial Proteinases,″In:Fiechter(ed.),Advances in Biochemical Engineering/Biotechnology,[1988])。例如,可通过比较检验(分析产生的蛋白酶水解商业底物的能力)来确定蛋白水解活性。可用于此类蛋白酶或蛋白水解活性分析中的示例性底物包括但不限于:二甲基酪蛋白(Sigma C-9801)、牛胶原蛋白(Sigma C-9879)、牛弹性蛋白(Sigma E-1625)和牛角蛋白(ICN Biomedical 902111)。利用这些底物的比色检验是本领域公知的(见,例如,WO 99/34011和美国专利号6,376,450,它们都通过引用并入本文)。AAPF检验(见,例如Del Maret al.,Anal.Biochem.,99:316-320[1979])也可用于测定成熟蛋白酶的生产。该检验测量该酶水解可溶的合成底物——琥珀酰丙氨酸-丙氨酸-脯氨酸-苯丙氨酸-对硝基苯胺(sAAPF-pNA)时释放对硝基苯胺的速率。在分光光度计上于410nm测量从水解反应产生黄色的速率,其与活性酶浓度成比例。
在本文中使用时,“芽孢杆菌属”包括本领域技术人员已知的“芽孢杆菌”属中的所有种,其包括但不限于,枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪杆菌、嗜碱芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、耐盐芽孢杆菌、巨大芽孢杆菌(B.megaterium)、凝固芽孢杆菌、环状芽孢杆菌、灿烂芽孢杆菌(B.lautus)和苏云金芽孢杆菌。应当认识到,芽孢杆菌属还将继续经历分类重构。因此,该属包括已经被重新分类的物种,这包括但不限于嗜热脂肪杆菌等生物,其现在被称为“Geobacillus stearothermophilus”。存在氧时产生抗性内生孢子被认为是芽孢杆菌属的界定特征,虽然该特征也适用于近来命名的脂环酸杆菌属(Alicyclobacillus)、双芽孢杆菌属(Amphibacillus)、Aneurinibacillus、Anoxybacillus、Brevibacillus、Filobacillus、Gracilibacillus、Halobacillus、类芽孢杆菌属(Paenibacillus)、Salibacillus、热杆菌属(Thermobacillus)、Ureibacillus和Virgibacillus。
术语“多核苷酸”和“核酸”在本文中可互换使用,它们指任何长度的核苷酸聚合形式。这些术语包括但不限于,单链DNA、双链DNA、基因组DNA、cDNA或包含嘌呤和嘧啶碱基或其它天然的、经化学修饰的、经生化修饰的、非天然的或衍生的核苷酸碱基的聚合物。多核苷酸的非限制性例子包括基因、基因片段、染色体片段、ESTs、外显子、内含子、mRNA、tRNA、rRNA、核糖体、cDNA、重组多核苷酸、带分支的多核苷酸、质粒、载体、任何序列的经分离DNA、任何序列的经分离RNA、核酸探针和引物。
在本文中使用时,术语“DNA构建体”和“转化DNA”可互换使用,以表示用于将序列引入宿主细胞或生物的DNA。DNA可通过PCR或本领域技术人员已知的任何其它合适技术体外产生。在一些特别优选的实施方式中,DNA构建体包含目的序列(例如,经修饰的序列)。在一些实施方式中,所述序列与另外的元件,例如,控制元件(例如启动子等)有效连接。在一些实施方式中,DNA构建体包含与宿主细胞染色体同源的序列。在其它一些实施方式中,DNA构建体包含非同源序列。一旦DNA构建体被体外装配,其即可用于突变宿主细胞染色体的区域(即,用异源序列代替内源序列)。
在本文中使用时,术语“载体”指设计来向一种或多种细胞类型中引入核酸的多核苷酸构建体。载体包括克隆载体、表达载体、穿梭载体和质粒。在一些实施方式中,多核苷酸构建体包含编码全长蛋白酶的DNA序列(例如,经修饰的蛋白酶或未经修饰的前体蛋白酶)。
在本文中使用时,术语“质粒”指用作为克隆载体的环状双链(ds)DNA构建体,其在一些真核生物或原核生物中形成染色体外的自主复制遗传元件,或整合进宿主染色体。
在本文中使用时,在向细胞中引入核酸序列的上下文中,术语“引入”表示适用于将核酸序列转入细胞的任何方法。用于引入的此类方法包括但不限于原生质体融合、转染、转化、接合和转导(见,例如,Ferrari et al.,″Genetics,″in Hardwood et al,(eds.),Bacillus.Plenum Publishing Corp.,pages 57-72,[1989])。
在本文中使用时,术语“经转化的”和“稳定转化的”指这样的细胞,它们具有整合进其基因组中的或作为保持了至少两代的游离型质体存在的非天然(异源)多核苷酸序列。
本发明提供了经分离的经修饰的编码氨基酸序列的多核苷酸,其编码经修饰的蛋白酶。通过对前体蛋白酶的多核苷酸序列加以突变,获得经修饰的蛋白酶。具体地,对编码前体蛋白酶的前区域的多核苷酸序列进行一处或多处突变,以提供本发明的经修饰的多核苷酸。
发明详述
本发明涉及经修饰的多核苷酸,其编码经修饰的蛋白酶,本发明还涉及改变微生物中蛋白酶生产的方法。特别地,本发明涉及改变蛋白酶在微生物(例如芽孢杆菌属的种)中的表达的方法。本发明公开了经修饰的多核苷酸、载体、经修饰的多肽和增强蛋白酶生产的方法。
在一些实施方式中,本发明提供了编码经修饰的蛋白酶的经修饰的多核苷酸,所述经修饰的蛋白酶源于动物、植物或微生物来源的野生型或变体前体蛋白酶。编码源于微生物的前体蛋白酶的多核苷酸是优选的,其包含编码野生型前体蛋白酶和变体前体蛋白酶(源于野生型形式)的多核苷酸。在一些实施方式中,本发明的经修饰的多核苷酸源于编码微生物来源的前体蛋白酶的多核苷酸。本发明还包括源于编码蛋白工程化的前体的多核苷酸的、编码经修饰蛋白酶的多核苷酸。编码丝氨酸蛋白酶的多核苷酸是优选的前体蛋白酶多核苷酸,其中碱性微生物蛋白酶多核苷酸是特别优选的。丝氨酸蛋白酶是催化其中在活性位点有关键丝氨酸残基的肽键水解的酶。丝氨酸蛋白酶具有大约25,000至30,000范围内的分子量(见Priest,Bacteriol.Rev.,41:711-753[1977])。在一些优选的实施方式中,编码枯草杆菌蛋白酶(subtilisin)和枯草杆菌蛋白酶变体的多核苷酸是优选的前体丝氨酸蛋白酶多核苷酸。在一些实施方式中,本发明包括编码经修饰的蛋白酶的下述多核苷酸,它们源于微生物,例如地衣芽孢杆菌、枯草芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、迟缓芽孢杆菌和耐盐芽孢杆菌的多核苷酸。编码枯草杆菌蛋白酶的多种芽孢杆菌多核苷酸已被鉴定和测序,例如,枯草杆菌蛋白酶168、枯草杆菌蛋白酶BPN’、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶DY、枯草杆菌蛋白酶147和枯草杆菌蛋白酶309(见,例如EP 414279B;WO 89/06279和Stahl et al.,J.Bacteriol.,159:811-818[1984],它们每篇都通过引用整体并入本文)。在本发明的一些实施方式中,突变体(例如变体)蛋白酶多核苷酸作为编码本发明的经修饰的蛋白酶所源自的蛋白质的前体多核苷酸。多篇参考文献提供了变体蛋白酶的例子(见,例如,WO 99/20770;WO 99/20726;WO 99/20769;WO 89/06279;RE 34,606;美国专利号4,914,031;美国专利号4,980,288;美国专利号5,208,158;美国专利号5,310,675;美国专利号5,336,611;美国专利号5,399,283;美国专利号5,441,882;美国专利号5,482,849;美国专利号5,631,217;美国专利号5,665,587;美国专利号5,700,676;美国专利号5,741,694;美国专利号5,858,757;美国专利号5,880,080;美国专利号6,197,567和美国专利号6,218,165;它们每篇都通过引用整体并入本文)。在其它一些实施方式中,本发明所包括的多核苷酸包括:源于编码可商业获得的蛋白酶的多核苷酸的经修饰的多核苷酸。例如,可商业获得的蛋白酶包括但不限于:ALCALASETM、SAVINASETM、PRIMASETM、DURALASETM、ESPERASETM和KANNASETM(Novo Nordisk AJS)、MAXATASETM、MAXACALTM、MAXAPEMTM、PROPERASETM、PURAFECTTM和PURAFECT OXPTM(Genencor International Inc.)。在一些实施方式中,本发明包括源于编码来自克劳氏芽孢杆菌的前体蛋白酶的多核苷酸的经修饰的多核苷酸。在其它一些实施方式中,本发明包括源于编码来自迟缓芽孢杆菌的前体蛋白酶的多核苷酸的经修饰的多核苷酸。
在一些实施方式中,本发明的经修饰的全长多核苷酸包含编码已突变的前体蛋白酶前区域的序列。编码任何合适的前体蛋白酶的前区域的多核苷酸序列可用于产生本发明的一种或多种经修饰的多核苷酸。在一些优选的实施方式中,前体多核苷酸序列的编码前区域的部分被突变,以编码位于下述位置的一处或多处氨基酸取代,所述位置等同于SEQ ID NO:5、13或244的1-109位。在一些实施方式中,经修饰的前体多核苷酸编码前区域中位于下述位置的至少一处氨基酸取代,所述位置等同于SEQ ID NO:5、13或244的E33、E43、A44、E47、V49、E57、A59、E63、E70、E74、E84和E88。在一些实施方式中,编码等同于E33的位置处的氨基酸的多核苷酸序列被突变为编码取代E33D、E33I、E33S、E33N、E33K、E33H、E33Q或E33R中的至少一种。在一些其它实施方式中,编码等同于E57的位置处的氨基酸的多核苷酸序列被突变为编码取代E57F、E57W、E57K、E57R、E57D、E57M、E57C、E57Q、E57S、E57H和/或E57N之一。
在一些实施方式中,前体克劳氏芽孢杆菌蛋白酶多核苷酸(例如SEQID NO:1)编码野生型蛋白酶(MAXACALTM;SEQ ID NO:5)。
(SEQ ID NO:1)
ATGAAGAAACCGTTGGGGAAAATTGTCGCAAGCACCGCACTACTCATTTCTGTTGCTTTTA
GTTCATCGATCGCATCGGCTGCTGAAGAAGCAAAAGAAAAATATTTAATTGGCTTTAATGA
GCAGGAAGCTGTCAGTGAGTTTGTAGAACAAGTAGAGGCAAATGACGAGGTCGCCATTCT
CTCTGAGGAAGAGGAAGTCGAAATTGAATTGCTTCATGAATTTGAAACGATTCCTGTTTTAT
CCGTTGAGTTAAGCCCAGAAGATGTGGACGCGCTTGAACTCGATCCAGCGATTTCTTATAT
TGAAGAGGATGCAGAAGTAACGACAATGGCGCAATCAGTGCCATGGGGAATTAGCCGTGT
GCAAGCCCCAGCTGCCCATAACCGTGGATTGACAGGTTCTGGTGTAAAAGTTGCTGTCCT
CGATACAGGTATTTCCACTCATCCAGACTTAAATATTCGTGGTGGCGCTAGCTTTGTACCA
GGGGAACCATCCACTCAAGATGGGAATGGGCATGGCACGCATGTGGCTGGGACGATTGC
TGCTTTAAACAATTCGATTGGCGTTCTTGGCGTAGCACCGAACGCGGAACTATACGCTGTT
AAAGTATTAGGGGCGAGCGGTTCAGGTTCGGTCAGCTCGATTGCCCAAGGATTGGAATGG
GCAGGGAACAATGGCATGCACGTTGCTAATTTGAGTTTAGGAAGCCCTTCGCCAAGTGCC
ACACTTGAGCAAGCTGTTAATAGCGCGACTTCTAGAGGCGTTCTTGTTGTAGCGGCATCTG
GGAATTCAGGTGCAGGCTCAATCAGCTATCCGGCCCGTTATGCGAACGCAATGGCAGTCG
GAGCTACTGACCAAAACAACAACCGCGCCAGCTTTTCACAGTATGGCGCAGGGCTTGACA
TTGTCGCACCAGGTGTAAACGTGCAGAGCACATACCCAGGTTCAACGTATGCCAGCTTAA
ACGGTACATCGATGGCTACTCCTCATGTTGCAGGTGCAGCAGCCCTTGTTAAACAAAAGAA
CCCATCTTGGTCCAATGTACAAATCCGCAATCATCTAAAGAATACGGCAACGAGCTTAGGA
AGCACGAACTTGTATGGAAGCGGACTTGTCAATGCAGAAGCGGCAACACGCTAA
(SEQ ID NO:5)
MKKPLGKIVASTALLISVAFSSSIASAAEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEE
VEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTMRVQAPAAHNRGLTGSGVKVA
VLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPNAELYAVKV
LGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSG
AGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMA
TPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR
在其它一些实施方式中,前体克劳氏芽孢杆菌蛋白酶多核苷酸(例如SEQ ID NO:9)编码变体蛋白酶(例如,SEQ ID NO:13)
(SEQ ID NO:13)
VRSKKLWIVASTALLISVAFSSSIASAAEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEE
VEIELLHEFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTMAQSVPWGISRVQAPAAHNRG
LTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAP
NAELYAVKVLGASGSGSVSSIAQGLEWAGNNVMHVANLSLGLQAPSATLEQAVNSATSRGVL
VVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTY
ASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR
在其它实施方式中,前体蛋白酶多核苷酸是迟缓芽孢杆菌的多核苷酸(例如SEQ ID NO:240),其编码SEQ ID NO:244的蛋白酶GG36。
(SEQ ID NO:240)
GTGAGAAGCAAAAAATTGTGGATCGTCGCGTCGACCGCACTACTCATTTCTGTTGCTTTTAGTTCAT
CGATCGCATCGGCTGCTGAAGAAGCAAAAGAAAAATATTTAATTGGCTTTAATGAGCAGGAAGCTGT
CAGTGAGTTTGTAGAACAAGTAGAGGCAAATGACGAGGTCGCCATTCTCTCTGAGGAAGAGGAAGT
CGAAATTGAATTGCTTCATGAATTTGAAACGATTCCTGTTTTATCCGTTGAGTTAAGCCCAGAAGATG
TGGACGCGCTTGAACTCGATCCAGCGATTTCTTATATTGAAGAGGATGCAGAAGTAACGACAATGGC
GCAATCAGTGCCATGGGGAATTAGCCGTGTGCAAGCCCCAGCTGCCCATAACCGTGGATTGACAGG
TTCTGGTGTAAAAGTTGCTGTCCTCGATACAGGTATTTCCACTCATCCAGACTTAAATATTCGTGGTG
GCGCTAGCTTTGTACCAGGGGAACCATCCACTCAAGATGGGAATGGGCATGGCACGCATGTGGCC
GGGACGATTGCTGCTCTAAACAATTCGATTGGCGTTCTTGGCGTAGCGCCGAGCGCGGAACTATAC
GCTGTTAAAGTATTAGGGGCGAGCGGTTCAGGCTCGGTCAGCTCGATTGCCCAAGGATTGGAATGG
GCAGGGAACAATGGCATGCACGTTGCTAATTTGAGTTTAGGAAGCCCTTCGCCAAGTGCCACACTT
GAGCAAGCTGTTAATAGCGCGACTTCTAGAGGCGTTCTTGTTGTAGCGGCATCTGGAAATTCAGGT
GCAGGCTCAATCAGCTATCCGGCCCGTTATGCGAACGCAATGGCAGTCGGAGCTACTGACCAAAAC
AACAACCGCGCCAGCTTTTCACAGTATGGCGCAGGGCTTGACATTGTCGCACCAGGTGTAAACGTG
CAGAGCACATACCCAGGTTCAACGTATGCCAGCTTAAACGGTACATCGATGGCTACTCCTCATGTTG
CAGGTGCAGCAGCCCTTGTTAAACAAAAGAACCCATCTTGGTCCAATGTACAAATCCGCAATCATCT
AAAGAATACGGCAACGAGCTTAGGAAGCACGAACTTGTATGGAAGCGGACTTGTCAATGCAGAAGC
TGCAACTCGT
(SEQ ID NO:244)
MRSKKLWIVASTALLISVAFSSSIASAAEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLH
EFETIPVLSVELSPEDVDALELDPAISYIEEDAEVTTMAQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDT
GISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAALNNSIGVLGVAPSAELYAVKVLGASGSGSVS
SIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYANAMAV
GATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNV
QIRNHLKNTATSLGSTNLYGSGLVNAEAATR
在一些实施方式中,本发明提供了源于SEQ ID NO:9的全长前体多核苷酸的经修饰的全长多核苷酸。
(SEQ ID NO:9)
GTGAGAAGCAAAAAATTGTGGATCGTCGCGTCGACCGCACTACTCATTTCTGTTGCTTTTA
GTTCATCGATCGCATCGGCTGCTGAAGAAGCAAAAGAAAAATATTTAATTGGCTTTAATGA
GCAGGAAGCTGTCAGTGAGTTTGTAGAACAAGTAGAGGCAAATGACGAGGTCGCCATTCT
CTCTGAGGAAGAGGAAGTCGAAATTGAATTGCTTCATGAATTTGAAACGATTCCTGTTTTAT
CCGTTGAGTTAAGCCCAGAAGATGTGGACGCGCTTGAACTCGATCCAGCGATTTCTTATAT
TGAAGAGGATGCAGAAGTAACGACAATGGCGCAATCGGTACCATGGGGAATTAGCCGTGT
GCAAGCCCCAGCTGCCCATAACCGTGGATTGACAGGTTCTGGTGTAAAAGTTGCTGTCCT
CGATACAGGTATTTCCACTCATCCAGACTTAAATATTCGTGGTGGCGCTAGCTTTGTACCA
GGGGAACCATCCACTCAAGATGGGAATGGGCATGGCACGCATGTGGCTGGGACGATTGC
TGCTTTAAACAATTCGATTGGCGTTCTTGGCGTAGCACCGAACGCGGAACTATACGCTGTT
AAAGTATTAGGGGCGAGCGGTTCAGGTTCGGTCAGCTCGATTGCCCAAGGATTGGAATGG
GCAGGGAACAATGTTATGCACGTTGCTAATTTGAGTTTAGGACTGCAGGCACCAAGTGCC
ACACTTGAGCAAGCTGTTAATAGCGCGACTTCTAGAGGCGTTCTTGTTGTAGCGGCATCTG
GGAATTCAGGTGCAGGCTCAATCAGCTATCCGGCCCGTTATGCGAACGCAATGGCAGTCG
GAGCTACTGACCAAAACAACAACCGCGCCAGCTTTTCACAGTATGGCGCAGGGCTTGACA
TTGTCGCACCAGGTGTAAACGTGCAGAGCACATACCCAGGTTCAACGTATGCCAGCTTAA
ACGGTACATCGATGGCTACTCCTCATGTTGCAGGTGCAGCAGCCCTTGTTAAACAAAAGAA
CCCATCTTGGTCCAATGTACAAATCCGCAATCATCTAAAGAATACGGCAACGAGCTTAGGA
AGCACGAACTTGTATGGAAGCGGACTTGTCAATGCAGAAGCGGCAACACGTTAA
SEQ ID NO:9的多核苷酸序列包含序列(SEQ ID NO:10),当其表达时,被用来编码信号序列肽(SEQ ID NO:14),其跨越SEQ ID NO:13的1-27位氨基酸;N-末端前序列(SEQ ID NO:11),其编码前区域序列(SEQ ID NO:15),其跨越SEQ ID NO:13的28-111位氨基酸残基;以及成熟的丝氨酸蛋白酶序列(SEQ ID NO:12),其编码SEQ ID NO:13的112-380位氨基酸残基(即,SEQ ID NO:16)。编码SEQ ID NO:13的蛋白酶的信号肽的前8个氨基酸的多核苷酸序列是编码枯草芽孢杆菌AprE蛋白酶的前8个氨基酸的序列。
(SEQ ID NO:10)
GTGAGAAGCAAAAAATTGTGGATCGTCGCGTCGACCGCACTACTCATTTCTGTTGCTTTTA
GTTCATCGATCGCATCGGCT
(SEQ ID NO:15)
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDAL
ELDPAISYIEEDAEVTTM
(SEQ ID NO:14)
VRSKKLWIVASTALLISVAFSSSIASA
(SEQ ID NO:11)
GCTGAAGAAGCAAAAGAAAAATATTTAATTGGCTTTAATGAGCAGGAAGCTGTCAGTGAGT
TTGTAGAACAAGTAGAGGCAAATGACGAGGTCGCCATTCTCTCTGAGGAAGAGGAAGTCG
AAATTGAATTGCTTCATGAATTTGAAACGATTCCTGTTTTATCCGTTGAGTTAAGCCCAGAA
GATGTGGACGCGCTTGAACTCGATCCAGCGATTTCTTATATTGAAGAGGATGCAGAAGTAA
CGACAATG
(SEQ ID NO:12)
GCGCAATCGGTACCATGGGGAATTAGCCGTGTGCAAGCCCCAGCTGCCCATAACCGTGG
ATTGACAGGTTCTGGTGTAAAAGTTGCTGTCCTCGATACAGGTATTTCCACTCATCCAGAC
TTAAATATTCGTGGTGGCGCTAGCTTTGTACCAGGGGAACCATCCACTCAAGATGGGAATG
GGCATGGCACGCATGTGGCTGGGACGATTGCTGCTTTAAACAATTCGATTGGCGTTCTTG
GCGTAGCACCGAACGCGGAACTATACGCTGTTAAAGTATTAGGGGCGAGCGGTTCAGGTT
CGGTCAGCTCGATTGCCCAAGGATTGGAATGGGCAGGGAACAATGTTATGCACGTTGCTA
ATTTGAGTTTAGGACTGCAGGCACCAAGTGCCACACTTGAGCAAGCTGTTAATAGCGCGA
CTTCTAGAGGCGTTCTTGTTGTAGCGGCATCTGGGAATTCAGGTGCAGGCTCAATCAGCT
ATCCGGCCCGTTATGCGAACGCAATGGCAGTCGGAGCTACTGACCAAAACAACAACCGCG
CCAGCTTTTCACAGTATGGCGCAGGGCTTGACATTGTCGCACCAGGTGTAAACGTGCAGA
GCACATACCCAGGTTCAACGTATGCCAGCTTAAACGGTACATCGATGGCTACTCCTCATGT
TGCAGGTGCAGCAGCCCTTGTTAAACAAAAGAACCCATCTTGGTCCAATGTACAAATCCGC
AATCATCTAAAGAATACGGCAACGAGCTTAGGAAGCACGAACTTGTATGGAAGCGGACTT
GTCAATGCAGAAGCGGCAACACGTTAA
(SEQ ID NO:16)
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGH
GTHVAGTIAALNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNVMHVANLSLG
LQAPSATLEQAVNSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYG
AGLDIVAPGVNVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATS
LGSTNLYGSGLVNAEAATR
在其它一些实施方式中,本发明提供了源于SEQ ID NO:1的野生型全长前体多核苷酸的经修饰的全长多核苷酸。SEQ ID NO:1的多核苷酸包含:序列SEQ ID NO:2,当表达时,其用于编码信号序列肽(SEQ ID NO:6),其编码SEQ ID NO:5的1-27位氨基酸;N-末端前序列(SEQ ID NO:3),其编码SEQ ID NO:5的28-111位氨基酸残基(即,SEQ ID NO:7)和野生型成熟丝氨酸蛋白酶序列(SEQ ID NO:4),其编码SEQ ID NO:5的112-380位氨基酸残基(即,SEQ ID NO:8)。
(SEQ ID NO:2)
ATGAAGAAACCGTTGGGGAAAATTGTCGCAAGCACCGCACTACTCATTTCTGTTGCTTTTA
GTTCATCGATCGCATCGGCT
(SEQ ID NO:6)
MKKPLGKIVASTALLISVAFSSSIASA
(SEQ ID NO:3)
GCTGAAGAAGCAAAAGAAAAATATTTAATTGGCTTTAATGAGCAGGAAGCTGTCAGTGAGT
TTGTAGAACAAGTAGAGGCAAATGACGAGGTCGCCATTCTCTCTGAGGAAGAGGAAGTCG
AAATTGAATTGCTTCATGAATTTGAAACGATTCCTGTTTTATCCGTTGAGTTAAGCCCAGAA
GATGTGGACGCGCTTGAACTCGATCCAGCGATTTCTTATATTGAAGAGGATGCAGAAGTAA
CGACAATG
(SEQ ID NO:7)
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDAL
ELDPAISYIEEDAEVTTM
(SEQ ID NO:4)
GCGCAATCAGTGCCATGGGGAATTAGCCGTGTGCAAGCCCCAGCTGCCCATAACCGTGG
ATTGACAGGTTCTGGTGTAAAAGTTGCTGTCCTCGATACAGGTATTTCCACTCATCCAGAC
TTAAATATTCGTGGTGGCGCTAGCTTTGTACCAGGGGAACCATCCACTCAAGATGGGAATG
GGCATGGCACGCATGTGGCTGGGACGATTGCTGCTTTAAACAATTCGATTGGCGTTCTTG
GCGTAGCACCGAACGCGGAACTATACGCTGTTAAAGTATTAGGGGCGAGCGGTTCAGGTT
CGGTCAGCTCGATTGCCCAAGGATTGGAATGGGCAGGGAACAATGGCATGCACGTTGCTA
ATTTGAGTTTAGGAAGCCCTTCGCCAAGTGCCACACTTGAGCAAGCTGTTAATAGCGCGAC
TTCTAGAGGCGTTCTTGTTGTAGCGGCATCTGGGAATTCAGGTGCAGGCTCAATCAGCTAT
CCGGCCCGTTATGCGAACGCAATGGCAGTCGGAGCTACTGACCAAAACAACAACCGCGC
CAGCTTTTCACAGTATGGCGCAGGGCTTGACATTGTCGCACCAGGTGTAAACGTGCAGAG
CACATACCCAGGTTCAACGTATGCCAGCTTAAACGGTACATCGATGGCTACTCCTCATGTT
GCAGGTGCAGCAGCCCTTGTTAAACAAAAGAACCCATCTTGGTCCAATGTACAAATCCGCA
ATCATCTAAAGAATACGGCAACGAGCTTAGGAAGCACGAACTTGTATGGAAGCGGACTTGT
CAATGCAGAAGCGGCAACACGCTAA
(SEQ ID NO:8)
RVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAGTIAA
LNNSIGVLGVAPNAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQ
AVNSATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGV
NVQSTYPGSTYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTAT
SLGSTNLYGSGLVNAEAATR
在其它一些实施方式中,本发明提供了源于SEQ ID NO:240的变体全长前体多核苷酸的经修饰的全长多核苷酸。SEQ ID NO:240的多核苷酸包含:SEQ ID NO:241的序列,当表达时,其用于编码信号序列肽(SEQ IDNO:245),编码SEQ ID NO:244的1-27位氨基酸;N-末端前序列(SEQID NO:242),其编码SEQ ID NO:244的28-111位氨基酸残基(即,SEQID NO:246);和野生型成熟丝氨酸蛋白酶序列(SEQ ID NO:243),其编码SEQ ID NO:244的112-380位氨基酸残基(即,SEQ ID NO:247)。编码SEQ ID NO:244的前体蛋白酶的信号肽的前8个氨基酸的多核苷酸序列是编码枯草芽孢杆菌AprE蛋白酶的前8个氨基酸的序列。前体GG36的前蛋白和成熟部分由GG36野生型序列编码。
(SEQ ID NO:241)
GTGAGAAGCAAAAAATTGTGGATCGTCGCGTCGACCGCACTACTCATTTCTGTTGCTTTTAGTTCAT
CGATCGCATCGGCT
(SEQ ID NO:245)MRSKKLWIVASTALLISVAFSSSIASA
(SEQ ID NO:242)
GCTGAAGAAGCAAAAGAAAAATATTTAATTGGCTTTAATGAGCAGGAAGCTGTCAGTGAGTTTGTAG
AACAAGTAGAGGCAAATGACGAGGTCGCCATTCTCTCTGAGGAAGAGGAAGTCGAAATTGAATTGC
TTCATGAATTTGAAACGATTCCTGTTTTATCCGTTGAGTTAAGCCCAGAAGATGTGGACGCGCTTGAA
CTCGATCCAGCGATTTCTTATATTGAAGAGGATGCAGAAGTAACGACAATG
(SEQ ID NO:246)
AEEAKEKYLIGFNEQEAVSEFVEQVEANDEVAILSEEEEVEIELLHEFETIPVLSVELSPEDVDALELDPAIS
YIEEDAEVTTM
(SEQ ID NO:243)
GCGCAATCAGTGCCATGGGGAATTAGCCGTGTGCAAGCCCCAGCTGCCCATAACCGTGGATTGACA
GGTTCTGGTGTAAAAGTTGCTGTCCTCGATACAGGTATTTCCACTCATCCAGACTTAAATATTCGTGG
TGGCGCTAGCTTTGTACCAGGGGAACCATCCACTCAAGATGGGAATGGGCATGGCACGCATGTGG
CCGGGACGATTGCTGCTCTAAACAATTCGATTGGCGTTCTTGGCGTAGCGCCGAGCGCGGAACTAT
ACGCTGTTAAAGTATTAGGGGCGAGCGGTTCAGGCTCGGTCAGCTCGATTGCCCAAGGATTGGAAT
GGGCAGGGAACAATGGCATGCACGTTGCTAATTTGAGTTTAGGAAGCCCTTCGCCAAGTGCCACAC
TTGAGCAAGCTGTTAATAGCGCGACTTCTAGAGGCGTTCTTGTTGTAGCGGCATCTGGAAATTCAGG
TGCAGGCTCAATCAGCTATCCGGCCCGTTATGCGAACGCAATGGCAGTCGGAGCTACTGACCAAAA
CAACAACCGCGCCAGCTTTTCACAGTATGGCGCAGGGCTTGACATTGTCGCACCAGGTGTAAACGT
GCAGAGCACATACCCAGGTTCAACGTATGCCAGCTTAAACGGTACATCGATGGCTACTCCTCATGTT
GCAGGTGCAGCAGCCCTTGTTAAACAAAAGAACCCATCTTGGTCCAATGTACAAATCCGCAATCATC
TAAAGAATACGGCAACGAGCTTAGGAAGCACGAACTTGTATGGAAGCGGACTTGTCAATGCAGAAG
CTGCAACTCGTTA
(SEQ ID NO:247)
AQSVPWGISRVQAPAAHNRGLTGSGVKVAVLDTGISTHPDLNIRGGASFVPGEPSTQDGNGHGTHVAG
TIAALNNSIGVLGVAPSAELYAVKVLGASGSGSVSSIAQGLEWAGNNGMHVANLSLGSPSPSATLEQAVN
SATSRGVLVVAASGNSGAGSISYPARYANAMAVGATDQNNNRASFSQYGAGLDIVAPGVNVQSTYPGS
TYASLNGTSMATPHVAGAAALVKQKNPSWSNVQIRNHLKNTATSLGSTNLYGSGLVNAEAATR
在一些优选的实施方式中,本发明的经修饰的全长多核苷酸包含编码已被突变的前体蛋白酶前区域的序列。编码任何合适的前体蛋白酶的前区域的多核苷酸序列可用于产生本发明的一种或多种经修饰的多核苷酸。在一些优选的实施方式中,前体多核苷酸序列的编码前区域的部分被突变,以编码位于下述位置的一处或多处氨基酸取代,所述位置等同于SEQ IDNO:13的蛋白酶的1-109位。在其它一些实施方式中,在等同于SEQ IDNO:5的蛋白酶的1-109位的位置进行取代。在其它一些实施方式中,在等同于SEQ ID NO:244的蛋白酶的1-109位的位置进行取代。在一些实施方式中,经修饰的前体多核苷酸编码位于下述位置的至少一处氨基酸取代,所述位置等同于SEQ ID NO:5、13或244的E33、E43、A44、E47、V49、E57、A59、E63、E70、E74、E84和E88。在一些实施方式中,编码等同于E33的位置的氨基酸的多核苷酸序列被突变,以编码取代E33D、E33I、E33S、E33N、E33K、E33H、E33Q或E33R中的至少一种。在一些其它实施方式中,编码等同于E57的位置的氨基酸的多核苷酸序列被突变,以编码取代E57F、E57W、E57K、E57R、E57D、E57M、E57C、E57Q、E57S、E57H和/或E57N中的一种。
如上文所讨论的,在一些实施方式中,编码任何前体蛋白酶的多核苷酸被突变,以产生至少一种经修饰的多核苷酸,其编码具有突变的前区域的至少一种经修饰的蛋白酶。在一些特别优选的实施方式中,编码丝氨酸蛋白酶的全长多核苷酸可用于产生本发明的经修饰的多核苷酸。在一些备选的特别优选的实施方式中,可使用编码碱性丝氨酸蛋白酶的全长多核苷酸。如上文所讨论的,编码前体蛋白酶的多核苷酸来自微生物,包括但不限于:地衣芽孢杆菌、枯草芽孢杆菌、解淀粉芽孢杆菌、克劳氏芽孢杆菌、迟缓芽孢杆菌和耐盐芽孢杆菌。本发明提供了任何一种。
在一些实施方式中,编码全长经修饰蛋白酶的本发明的经修饰的多核苷酸包含编码蛋白酶的成熟形式的序列,所述成熟形式与前体蛋白酶的成熟形式的氨基酸序列有至少大约65%的氨基酸序列同一性,优选至少大约70%的氨基酸序列同一性,更优选至少大约75%的氨基酸序列同一性,还更优选至少大约80%的氨基酸序列同一性,更优选至少大约85%的氨基酸序列同一性,进一步更优选至少大约90%的氨基酸序列同一性,更优选至少大约92%的氨基酸序列同一性,还更优选至少大约95%的氨基酸序列同一性,更优选至少大约97%的氨基酸序列同一性,还更优选至少大约98%的氨基酸序列同一性,以及最优选至少大约99%的氨基酸序列同一性,并且较之前体多肽而言具有相当的或增强的生产活性。在一些实施方式中,编码全长经修饰蛋白酶的本发明的经修饰的多核苷酸包含编码蛋白酶的成熟形式的序列,所述成熟形式与SEQ ID NO:8、SEQ ID NO:16或SEQ IDNO:247的氨基酸序列有至少大约65%的氨基酸序列同一性,优选至少大约70%的氨基酸序列同一性,更优选至少大约75%的氨基酸序列同一性,还更优选至少大约80%的氨基酸序列同一性,更优选至少大约85%的氨基酸序列同一性,进一步更优选至少大约90%的氨基酸序列同一性,更优选至少大约92%的氨基酸序列同一性,还更优选至少大约95%的氨基酸序列同一性,更优选至少大约97%的氨基酸序列同一性,还更优选至少大约98%的氨基酸序列同一性,以及最优选至少大约99%的氨基酸序列同一性。
在一些实施方式中,经修饰的多核苷酸编码的全长氨基酸序列与前体蛋白酶的氨基酸序列有高达65%的氨基酸序列同一性,优选高达大约70%的氨基酸序列同一性,更优选高达大约75%的氨基酸序列同一性,还更优选高达大约80%的氨基酸序列同一性,更优选高达大约85%的氨基酸序列同一性,进一步更优选高达大约90%的氨基酸序列同一性,更优选高达大约92%的氨基酸序列同一性,还更优选高达大约95%的氨基酸序列同一性,更优选高达大约97%的氨基酸序列同一性,还更优选高达大约98%的氨基酸序列同一性,以及最优选高达大约99%的氨基酸序列同一性,并且较之前体多肽而言具有相当的或增强的生产活性。
如技术人员将理解的,由于遗传密码的简并性,多种经修饰的多核苷酸编码经修饰的蛋白。在本发明的一些其它实施方式中,提供了包含下述核苷酸序列的多核苷酸,所述核苷酸序列与SEQ ID NOS:4、12或243的多核苷酸序列具有至少大约70%的序列同一性,至少大约75%的序列同一性,至少大约80%的序列同一性,至少大约85%的序列同一性,至少大约90%的序列同一性,至少大约92%的序列同一性,至少大约95%的序列同一性,至少大约97%的序列同一性,至少大约98%的序列同一性以及至少大约99%的序列同一性。
在一些实施方式中,多核苷酸序列具有的百分比同一性是通过本领域已知的方法比对序列并确定同一性,从而对分子之间的序列信息直接加以比较来测定的。在一些实施方式中,百分比同一性(例如氨基酸序列、核酸序列和/或基因序列)是这样测定的:通过比对序列,计算被比对的两条序列间的精确匹配数量,除以较短序列的长度并将所得结果乘以100,从而对两条分子间进行序列信息的直接比较。容易获得的计算机程序可用于这些分析,包括上文所述的那些。用于测定核苷酸序列同一性的程序是Wisconsin Sequence Analysis Package,Version 8(Genetics ComputerGroup,Madison,Wl)中可获得的,例如,BESTFIT、FASTA和GAP程序,它们也依赖于Smith和Waterman算法。采用制造商推荐的以及上文提到的Wisconsin Sequence Analysis Package中描述的默认参数,易于利用这些程序。
适用于测定序列相似性的一种算法的例子是BLAST算法,其被描述于Altschul,et al.,J.Mol.Biol.,215:403-410(1990)中。用于进行BLAST分析的软件是公众可通过National Center for Biotechnology Information获得的。该算法包括:首先通过在查询序列中鉴定出长度为W的短字(其与数据库序列中同样长度的字比对时匹配或满足一定的正值阈值分数T时)来鉴定高得分序列对(HSPs)。这些初始相邻字命中作为起点以寻找含有它们的更长的HSPs。只要累积比对分数得以增加,字命中就一直沿着被比较的两条序列每条的两个方向扩展。当累积比对分数从获得的最大值降低了数量X;累积分数达到零或更低;或者到达了任一序列的末端时,字命中延伸停止。BLAST算法参数W、T和X决定了比对的灵敏性和速度。BLAST程序采用字长(W)=11,BLOSUM62计分矩阵(见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989)),比对(B)=50,期望(E)=10,M’5、N’-4和两条链的比较作为默认设置。
然后,BLAST算法进行两条序列间相似性的统计分析(见,例如,Karlin and Altschul,Proc.Natl Acad.Sci.USA 90:5873-5787[1993])。BLAST算法提供的一种相似性测量是最小和概率(P(N)),这提供了对两条核苷酸或氨基酸序列间偶然发生匹配的概率的指示。例如,如果测试核酸与本发明的丝氨酸蛋白酶核酸的比较中最小和概率小于大约0.1,更优选小于大约0.01,最优选小于大约0.001,那么该核酸序列就被认为与本发明的丝氨酸蛋白酶核酸相似。当测试核酸编码丝氨酸蛋白酶核酸时,如果比较产生了小于大约0.5,更优选小于大约0.2的最小和概率,那么就认为所述测试核酸与指定的丝氨酸蛋白酶核酸相似。
在本发明的一些实施方式中,通过BLAST和蛋白翻译序列工具来分析序列。在一些实验中,优选的版本是BLAST(Basic BLAST版本2.0)。选择的程序是“BlastX”,选择的数据库是“nr”。使用标准/默认参数值。
本领域已知若干方法适于产生本发明的经修饰的多核苷酸序列,其包括但不限于位点饱和诱变、扫描诱变、插入诱变、缺失诱变、随机诱变、位点定向诱变和定向进化以及多种其它重组方法。
在一些实施方式中,本发明的经修饰的多核苷酸序列包含对编码蛋白酶前区域的序列的修饰,其是采用位点定向诱变在至少一个密码子处产生的。在其它一些优选的实施方式中,位点定向诱变是针对两个或多个密码子进行的。在另一些实施方式中,编码经修饰蛋白酶的前区域的经修饰的多核苷酸序列具有与编码前体多肽的前区域的多核苷酸(例如SEQ IDNOS:3、11或242)高达大约40%,高达大约45%,高达大约50%,高达大约55%,高达大约60%,高达大约65%,高达大约70%,高达大约75%,高达大约80%,高达大约85%,高达大约90%,高达大约95%,高达大约98%或高达大约99%的同源性。在一些备选的实施方式中,经修饰的多核苷酸是使用任何已知的诱变方法(例如放射、亚硝基胍等)在体内产生的。然后想要的经修饰的多核苷酸被分离,并被用于本文提供的方法。
在一些优选的实施方式中,通过使用包含诱变引物的组合物来完成对前体蛋白酶多核苷酸前区域的位点饱和诱变。诱变引物并不精确匹配前体多核苷酸,引物的一处或多处错配被用于向模板多核苷酸中引入想要的突变。精确匹配前体多核苷酸的非诱变引物也包括在引物组合物内。通过加入诱变引物和对应于诱变引物中至少一条的非诱变引物的混合物,产生了核酸文库,其中存在多种突变模式。例如,如果需要突变核酸文库成员中的一些在某些位置保持其前体序列,而其它成员在此此类位点是突变的话,非诱变引物就提供了针对给定残基在核酸文库内获得特定水平的非突变成员的能力。本发明的方法利用通常长度为大约10至大约50个,更优选长度为大约15至大约45个碱基的诱变和非诱变寡核苷酸。在相应诱变和非诱变引物的方面,相应寡核苷酸无须相同长度,只要在对应于待添加突变的区域重叠即可。
在一些实施方式中,引物以预先确定的比例添加。例如,如果想要得到的文库某特定突变水平显著而在相同或不同的位点处的不同的突变的量较小,可通过调节加入的引物的量,来产生具有想要的偏好的文库。或者,通过加入更少或更多量的非诱变引物,对突变体核酸文库中产生相应突变的频率加以调节。包含用于位点定向诱变的引物的组合物的试剂盒是可商业获得的,其包括
Figure G2008800078776D00261
位点定向诱变试剂盒(Stratagene,SanDiego,CA)。在一些实施方式中,还进一步对前体多核苷酸加以修饰,以编码在前区域包含两处或多处氨基酸取代的经修饰的蛋白酶。用于进行多位点定向诱变的试剂盒也是可商业获得的(例如
Figure G2008800078776D00262
Multisite,Stratagene,San Diego,CA)。
在一些实施方式中,使用位点饱和方法来产生本发明的经修饰的多核苷酸。在其它一些实施方式中,每种经修饰的多核苷酸在前区域包含至少一处氨基酸取代。
本发明提供了本发明的任一种经修饰的多核苷酸编码的经修饰的全长前体蛋白酶。本发明提供了下述蛋白酶的成熟形式,当从经修饰的前体蛋白酶加工而来时,它们能够以比对未经修饰的前体蛋白进行加工获得的水平更高的水平产生。
本发明包括已通过在前体蛋白酶前区域突变至少一处氨基酸进行过修饰的全长蛋白酶。在一些实施方式中,在前区域中与SEQ ID NO:13的全长前体蛋白酶的前区域(SEQ ID NO:15)、SEQ ID NO:5的全长前体蛋白酶的前区域(SEQ ID NO:7)或SEQ ID NO:244的全长前体蛋白酶的前区域(SEQ ID NO:246)的28-109位氨基酸等同的前区域的一处或多处氨基酸处对前体蛋白酶加以突变。在一些实施方式中,在与克劳氏芽孢杆菌V049前体蛋白酶(SEQ ID NO:13)、克劳氏芽孢杆菌野生型蛋白酶(SEQID NO:5)或野生型迟缓芽孢杆菌蛋白酶(SEQ ID No:244)的E33、E43、A44、E47、V49、E57、A59、E63、E70、E74、E84和/或E88等同的位置进行氨基酸取代。
在一些实施方式中,等同于E33的位置的氨基酸的取代包括但不限于:E33D、E33I、E33S、E33N、E33K、E33H、E33Q或E33R。在其它一些实施方式中,E57的取代包括但不限于E57F、E57W、E57K、E57R、E57D、E57M、E57C、E57Q、E57G、E57S、E57H或E57N。本发明包括下述经修饰的蛋白酶,其中,在位于等同于SEQ ID NO:5、13或244的氨基酸位置28-109的氨基酸位置中的每一处进行的任一氨基酸取代是用19种天然存在的L-氨基酸中的任一种来进行的,以增强经修饰的蛋白酶较之前体蛋白酶而言的生产/分泌(见,表2和实施例4)。本文中采用通常使用和理解的单字母代码来表示氨基酸(见,例如,Dale,M.W.(1989),Molecular Genetics of Bacteria.John Wiley&Sons,Ltd.)。
在一些实施方式中,经修饰的前体蛋白酶多肽包含成熟区域,其与SEQ ID NO:8、16和247所示的氨基酸序列有至少大约65%的氨基酸序列同一性,优选至少大约70%的氨基酸序列同一性,更优选至少大约75%的氨基酸序列同一性,还更优选至少大约80%的氨基酸序列同一性,更优选至少大约85%的氨基酸序列同一性,进一步更优选至少大约90%的氨基酸序列同一性,更优选至少大约92%的氨基酸序列同一性,还更优选至少大约95%的氨基酸序列同一性,更优选至少大约97%的氨基酸序列同一性,还更优选至少大约98%的氨基酸序列同一性,最优选至少大约99%的氨基酸序列同一性,并且具有较之前体多肽而言相当或增强的生产活性。
如上文所述,在一些实施方式中,本发明提供了包含前述多核苷酸的载体。在一些优选的实施方式中,载体是表达载体,其中,编码本发明蛋白酶的DNA序列与DNA转录所需的额外片段有效连接。在一些优选的实施方式中,表达载体源于质粒或病毒DNA,或者在一些备选的实施方式中,表达载体含有这两者的元件。示例性的载体包括但不限于pXX、pC194、pJH101、pE194、pHP13(Harwood and Cutting(eds),Molecular Biological Methods for Bacillus,John Wiley&Sons,[1990],特别是第3章;针对枯草芽孢杆菌的合适复制质粒包括第92页列出的那些;Perego,M.(1993)Integrational Vectors for Genetic Manipulations in Bacillus subtilis,p.615-624;A.L.Sonenshein,J.A.Hoch,and R.Losick(ed.),Bacillus subtilisand other Gram-positive bacteria:biochemistry,physiology and moleculargenetics,American Society for Microbiology,Washington,D.C)
在一些优选的实施方式中,载体pXX可用于构建包含本文所述的多核苷酸的载体(例如pXX-049;见,图6)。必须注意,本文所述的每种载体都可用于本发明。在一些实施方式中,构建体存在于复制质粒(例如pHP13)上,而在其它一些实施方式中,其以一个或多个拷贝整合进染色体。用于整合的示例性位点包括但不限于aprE、amyE、veg或pps区域。事实上,本领域技术人员已知的其它位点也可用于本发明。在一些实施方式中,启动子是所选择的前体蛋白酶的野生型启动子。在其它一些实施方式中,启动子是前体蛋白酶异源的,但是在宿主细胞中有功能性。具体地,适用于细菌宿主细胞的启动子的例子包括但不限于pSPAC、pAprE、pAmyE、pVeg、pHpall启动子,嗜热脂肪杆菌麦芽糖淀粉酶基因、解淀粉芽孢杆菌(BAN)淀粉酶基因、枯草芽孢杆菌碱性蛋白酶基因、克劳氏芽孢杆菌碱性蛋白酶基因、短小芽孢杆菌木糖苷酶基因、苏云金芽孢杆菌cryIIIA和地衣芽孢杆菌α-淀粉酶基因的启动子。其它启动子包括但不限于A4启动子以及噬菌体λPR或PL启动子以及大肠杆菌lac、trp或tac启动子。
在一些优选的实施方式中,表达载体含有多个克隆位点,其优选包含载体所特有的至少一种限制性内切酶位点,以协助核酸操作易于进行。在一些进一步优选的实施方式中,载体还包含一种或多种选择标记(例如,抗微生物标记,例如,红霉素、放线菌素、氯霉素和/或四环素)。还在其它一些实施方式中,可使用本领域已知的方法,用多拷贝复制质粒来将质粒整合进芽孢杆菌基因组DNA。
为在细胞中表达和生产目的蛋白质,例如蛋白酶,在适于表达所述蛋白质的条件下,向细胞中转化进至少一种表达载体,所述表达载体包含编码经修饰蛋白酶的多核苷酸的至少一个拷贝,优选包含多个拷贝。在一些特别优选的实施方式中,编码目的蛋白(例如蛋白酶)的序列(以及载体中包括的其它序列)被整合进宿主细胞的基因组,而在其它一些实施方式中,质粒作为自主染色体外元件保持在细胞中。因此,本发明既提供了染色体外元件又提供了整合进宿主细胞基因组的进入序列。
前体蛋白酶和经修饰的蛋白酶在任何合适的革兰氏阳性微生物(包括细菌和真菌)的宿主细胞中生产。例如,在一些实施方式中,在真菌和/或细菌来源的宿主细胞中生产经修饰的蛋白酶。在一些实施方式中,宿主细胞是芽孢杆菌、链霉菌(Streptomyces sp.)、埃希氏菌(Escherichia sp.)或曲霉(Aspergillus sp.)。在一些优选的实施方式中,经修饰的蛋白酶是芽孢杆菌属的宿主细胞生产的。可用于生产本发明的经修饰的蛋白质的芽孢杆菌宿主细胞的例子包括但不限于地衣芽孢杆菌、迟缓芽孢杆菌、枯草芽孢杆菌、解淀粉芽孢杆菌、迟缓芽孢杆菌、短芽孢杆菌、嗜热脂肪杆菌、嗜碱芽孢杆菌、凝固芽孢杆菌、环状芽孢杆菌、短小芽孢杆菌、苏云金芽孢杆菌、克劳氏芽孢杆菌和巨大芽孢杆菌以及芽孢杆菌属中的其它生物。在一些特别优选的实施方式中,可使用枯草芽孢杆菌宿主细胞。美国专利5,264,366和4,760,025(RE 34,606)描述了可用于本发明的多种芽孢杆菌宿主菌株,但是其它合适的菌株也可用于本发明。
可用于本发明的工业菌株包括非重组的(即野生型)芽孢杆菌菌株以及天然存在的菌株和/或重组菌株的变体。在一些优选的实施方式中,宿主菌株是重组菌株,其中,编码目的多肽的多核苷酸已被引入宿主。在一些优选的实施方式中,宿主菌株是枯草芽孢杆菌宿主菌株,特别是重组的芽孢杆菌宿主菌株。已知大量枯草芽孢杆菌菌株,这包括但不限于1A6(ATCC 39085)、168(1A01)、SB19、W23、Ts85、B637、PB1753至PB1758、PB3360、JH642、1A243(ATCC 39,087)、ATCC 21332、ATCC 6051、MI113、DE100(ATCC 39,094)、GX4931、PBT 110和PEP 211菌株(见,例如Hoch et al.,Genetics,73:215-228[1973])(还见美国专利号4,450,235;美国专利号4,302,544和EP 0134048,每篇都通过引用整体并入本文)。用枯草芽孢杆菌作为表达宿主细胞是本领域公知的(见,例如,见Palva etal.,Gene 19:81-87[1982];Fahnestock and Fischer,J.Bacteriol.,165:796-804[1986]和Wang et al.,Gene 69:39-47[1988])。
在一些实施方式中,一种优选的芽孢杆菌宿主是在下述基因中的至少一种中包括突变或缺失的芽孢杆菌,所述基因是:degU、degS、degR和degQ。优选地,所述突变处于degU基因中,更优选地,所述突变是degU(Hy)32(见,例如,Msadek et al.,J.Bacteriol.,172:824-834[1990]和Olmos et al.,Mol.Gen.Genet.,253:562-567[1997])。一种更特别优选的宿主菌株是携带degU32(Hy)突变的枯草芽孢杆菌。在另一些实施方式中,芽孢杆菌宿主在scoC4(见,例如Caldwell et al.,J.Bacteriol.,183:7329-7340[2001])、spoIIE(见,例如Arigoni et al.,Mol.Microbiol.,31:1407-1415[1999])和/或oppA或opp操纵子的其它基因中包含突变或缺失(见,例如Perego et al.,Mol.Microbiol.,5:173-185[1991])。事实上,opp操纵子中导致与oppA基因中突变相同的表型的任何突变可用于本发明的改变的芽孢杆菌菌株的一些实施方式。在一些实施方式中,这些突变单独存在,而在其它一些实施方式中,存在突变的组合。在一些实施方式中,可用于产生本发明的经修饰蛋白酶的经改变的芽孢杆菌是已经在一种或多种上述基因中包括突变的芽孢杆菌宿主菌株(在一些实施方式中,还存在其它基因中的突变)。在一些备选的实施方式中,可使用这样的经改变的芽孢杆菌,其被进一步改造,以包括一种或多种上文所述基因的突变。
使用本领域已知的任何合适方法,用编码本发明的经修饰蛋白酶的经修饰的多核苷酸来转化宿主细胞。经修饰的多核苷酸整合进载体或在没有质粒DNA的情况下使用,其被引入微生物中,在一些实施方式中,优选引入大肠杆菌细胞或感受态芽孢杆菌细胞。将DNA引入芽孢杆菌细胞的方法(涉及质粒构建体和质粒向大肠杆菌中的转化)是公知的。在一些实施方式中,随后从大肠杆菌分离质粒,并将其转化进芽孢杆菌。但是,并不必须使用中介微生物(例如大肠杆菌),在一些实施方式中,DNA构建体或载体被直接引入芽孢杆菌宿主。
本领域技术人员熟知将多核苷酸序列引入芽孢杆菌细胞的方法(见,例如,Ferrari et al.,″Genetics,″in Harwood et al.,(ed.),芽孢杆菌,PlenumPublishing Corp.[1989],pages 57-72;Saunders et al.,J.Bacteriol.,157:718-726[1984];Hoch et al.,J.Bacteriol.,93:1925-1937[1967];Mannet al.,Current Microbiol.,13:131-135[1986]和Holubova,Folia Microbiol.,30:97[1985];Chang et al.,MoI.Gen.Genet.,168:11-115[1979];Vorobjevaet al.,FEMS Microbiol.Lett.,7:261-263[1980];Smith et al.,Appl.Env.Microbiol.,51:634[1986];Fisher et al.,Arch.Microbiol.,139:213-217[1981]和McDonald,J.Gen.Microbiol.,130:203[1984])。事实上,此类方法,例如转化,包括原生质体转化和中板集合(congression),转导和原生质体融合是已知的,并且适用于本发明。转化的方法对于将本发明提供的DNA构建体引入宿主细胞来说是特别优选的。
除了通常使用的方法之外,在一些实施方式中,直接转化宿主细胞(即,在引入宿主细胞之前,不用中间细胞来扩增或加工DNA构建体)。将DNA构建体引入宿主细胞包括本领域已知用来将DNA引入宿主细胞而不插入质粒或载体的那些物理和化学方法。此类方法包括但不限于氯化钙沉淀、电穿孔、裸DNA、脂质体等。在另一些实施方式中,DNA构建体与质粒共转化,而不插入质粒中。在另外一些实施方式中,通过本领域已知的方法从经改变的芽孢杆菌菌株缺失选择性标记(见,例如,Stahl et al.,J.Bacteriol.,158:411-418[1984]和Palmeros et al.,Gene 247:255-264[2000])。
如上文所述,在本发明的一些实施方式中,编码至少一种经修饰的目的多肽的核酸经由能在宿主细胞中复制的表达载体被引入宿主细胞。用于芽孢杆菌的合适的复制和整合质粒是本领域已知的(见,例如,Harwoodand Cutting(eds),Molecular Biological Methods for Bacillus,John Wiley&Sons,[1990],特别是第3章,用于枯草芽孢杆菌的合适的质粒包括第92页列出的那些)。虽然存在技术困难,但是本领域技术人员知道有若干种策略可用于在芽孢杆菌中直接克隆DNA。
本领域中已知用于转化芽孢杆菌的方法包括质粒标记挽救转化等方法,其涉及由携带有部分同源的常驻质粒的感受态细胞摄入供体质粒(Contente et al.,Plasmid 2:555-571[1979];Haima et al.,Mol.Gen.Genet.,223:185-191[1990];Weinrauch et al.,J.Bacteriol.,154:1077-1087[1983]和Weinrauch et al.,J.Bacteriol.,169:1205-1211[1987])。在该方法中,进入供体质粒在模拟染色体转化的过程中与常驻的“辅助”质粒的同源区重组。
涉及通过原生质体转化进行的转化的其它方法是本领域已知的(见,例如,Chang and Cohen,Mol.Gen.Genet.,168:111-115[1979];Vorobjevaet al.,FEMS Microbiol.Lett.,7:261-263[1980];Smith et al.,Appl.Env.Microbiol.,51:634[1986];Fisher et al.,Arch.Microbiol.,139:213-217[1981];McDonald[1984]J.Gen.Microbiol.,130:203[1984]和Bakhiet et al.,49:577[1985])。此外,Mann et al.(Mann et al.,Curr.Microbiol.,13:131-135[1986])描述了芽孢杆菌原生质体的转化,Holubova(Holubova,Microbiol.,30:97[1985])描述了使用含DNA的脂质体将DNA引入原生质体的方法。在一些优选的实施方式中,使用标记基因,以指示目的基因是否存在于宿主细胞中。
除了这些方法之外,在其它一些实施方式中,宿主细胞被直接转化。在“直接转化”中,在引入宿主(如芽孢杆菌)细胞之前,不用中间细胞来扩增或加工经修饰的多核苷酸。将经修饰的多核苷酸引入宿主细胞包括本领域已知用来将经修饰的多核苷酸引入细胞而不插入质粒或载体的那些物理和化学方法。此类方法包括但不限于使用感受态细胞以及使用“人工手段”例如氯化钙沉淀、电穿孔等,以将DNA引入细胞。因此,本发明可使用裸DNA、脂质体等。还在其它一些实施方式中,经修饰的多核苷酸与质粒一起共转化而不被插入质粒。
更具体地,本发明提供了包含本文所述的多核苷酸的构建体、载体,经此类载体转化的宿主细胞,此类宿主细胞表达的蛋白酶,表达方法以及用于生产源于微生物(特别地,芽孢杆菌属的成员)的同源或异源丝氨酸蛋白酶的系统。在一些实施方式中,编码经修饰的丝氨酸蛋白酶的经修饰的多核苷酸被用于生产适于表达经修饰的丝氨酸蛋白酶的重组宿主细胞。在一些优选的实施方式中,表达宿主能增强经修饰的蛋白酶的成熟形式的分泌,由此增加蛋白酶的商业生产。
在一些实施方式中,本发明的宿主细胞和经转化的细胞被培养于常规的营养培养基中。合适的特定培养条件,例如温度、pH等是本领域技术人员已知的。此外,可在科学文献,例如Hopwood(2000)PracticalStreptomvces Genetics.John lnnes Foundation,Norwich UK;Hardwood etal.,(1990)Molecular Biological Methods for Bacillus,John Wiley and fromthe American Type Culture Collection(ATCC)中找到一些优选的培养条件。
在一些实施方式中,在适于被编码蛋白表达以及从细胞培养物中对其加以回收的条件下,培养被编码经修饰蛋白酶的多核苷酸序列转化过的宿主细胞。包含本发明的经修饰蛋白酶的重组宿主细胞生产的蛋白质被分泌进培养基。在一些实施方式中,其它一些重组构建将异源或同源多核苷酸序列连接至编码蛋白酶多肽结构域的核苷酸序列,其方便纯化可溶蛋白(Kroll DJ et al(1993)DNA Cell Biol 12:441-53)。
此类纯化协助结构域包括但不限于:金属螯合肽,例如,允许在被固定的金属上进行纯化的组氨酸-色氨酸模块(Porath J(1992)Protein ExprPurif 3:263-281)、允许在被固定的免疫球蛋白上进行纯化的A蛋白结构域以及用于FLAGS延伸/亲和纯化系统的结构域(Immunex Corp,SeattleWA)。将可切割的接头序列,例如Factor XA或肠激酶(Invitrogen,SanDiego CA)包括到纯化结构域和异源蛋白之间也可用于协助纯化。
在一些优选的实施方式中,在适于表达被编码蛋白和从细胞培养基中对其回收的条件下,培养用编码异源或同源蛋白的多核苷酸序列转化的细胞或内源具有所述蛋白质的细胞。在一些实施方式中,其它一些重组构建将异源或同源核苷酸序列包括至编码协助纯化可溶蛋白的多肽结构域的核苷酸序列(例如,多种标记)(Kroll et al.,DNA Cell.Biol.,12:441-53[1993])。
此类纯化协助结构域包括但不限于:金属螯合肽,例如,允许在被固定的金属上进行纯化的组氨酸-色氨酸模块(Porath J(1992)Protein ExprPurif 3:263-281)、允许在被固定的免疫球蛋白上进行纯化的A蛋白结构域以及用于FLAGS延伸/亲和纯化系统的结构域(Immunex Corp,SeattleWA)。将可切割的接头序列,例如Factor XA或肠激酶(Invitrogen,SanDiego CA)包括到纯化结构域和异源蛋白质之间也可用于协助纯化。
在一些优选的实施方式中,在允许表达本发明蛋白酶的条件下,在合适的营养培养基中培养本发明的经转化的宿主细胞,之后从培养物中回收得到的蛋白酶。用于培养细胞的培养基包含适于宿主细胞生长的任何常规培养基,例如基本培养基或含有合适补充物的复杂培养基。合适的培养基可从商业供应者获得,或者可以按照公开的配方(例如,在American TypeCulture Collection的目录中)来制备。在一些实施方式中,通过常规方法从细胞培养基中回收细胞生产的蛋白酶,这包括但不限于:通过离心或过滤从培养基分离宿主细胞,通过盐(例如硫酸铵)沉淀上清液或滤液的蛋白质性组分,层析纯化(例如,离子交换、凝胶过滤、亲和等)。因此,适于回收本发明蛋白酶的任何方法都可用于本发明。事实上,本发明不受任何特定纯化方法的限制。
如上文所述,本发明的多肽以比从其相应的未经修饰的前体多肽加工的成熟酶更高的水平作为成熟酶产生。在本发明的一些优选实施方式中,较之从在相同条件下芽孢杆菌菌株生产的前体蛋白酶加工得到的相应成熟蛋白酶而言,前体多肽的前区域中的突变增强了成熟多肽的分泌/表达。
增强的一种量度可作为活性比例来测量,这可表示为从经修饰的蛋白酶加工来的成熟形式的酶促活性与从前体蛋白酶加工来的成熟形式的酶促活性之比。等于或高于1的比例表明经修饰的蛋白酶的成熟形式以等于或高于前体蛋白酶成熟形式产生的水平产生。例如,1.5的活性比例表示:从经修饰的蛋白酶加工得到的成熟蛋白酶的生产水平是从前体蛋白酶加工得到成熟蛋白酶的水平的1.5倍,即,经修饰的蛋白酶比未经修饰的前体蛋白酶产生多50%的成熟蛋白酶。在一些实施方式中,活性比例为至少1,至少大约1.05,大约至少大约1.1,至少大约1.2,至少大约1.3,至少大约1.4,至少大约1.5,至少大约1.6,至少大约1.7,至少大约1.8,至少大约1.9,以及至少大约2。在其它一些实施方式中,活性比例为至少大约2.1,至少大约2.2,至少大约2.3,至少大约2.4,至少大约2.5,至少大约2.6,至少大约2.7,至少大约2.8,至少大约2.9以及至少大约3。在其它一些实施方式中,活性比例为至少大约3.5,至少大约4.0以及至少大约5。因此,在一些实施方式中,较之从未经修饰的前体蛋白酶加工来的相应成熟蛋白酶,从经修饰的蛋白酶加工来的成熟蛋白酶的生产增强了至少大约0.5%,大约1.0%,大约1.5%,大约2.0%,大约2.5%,大约3.0%,大约4.0%,大约5.0%,大约8.0%,大约10%,大约15%,大约20%,大约25%,大约30%,大约40%,大约50%,至少大约60%,至少大约70%,至少大约80%,至少大约90%,至少大约100%或更多。在其它一些实施方式中,较之从未经修饰的前体蛋白酶加工来的蛋白酶成熟形式的相应生产而言,从经修饰的蛋白酶加工来的蛋白酶成熟形式的生产增强了至少大约110%、120%、130%、140%、150%、160%、170%、180%、190%以及多至至少大约200%或者更多。在一些实施方式中,经修饰的蛋白酶的增强的生产是基于从经修饰的蛋白酶加工来的成熟形式的蛋白水解活性较之相应未经加工的前体蛋白酶的成熟形式的蛋白水解活性的比例来确定的。
用于测定异源或同源蛋白在宿主细胞中的分泌水平以及检测分泌的蛋白质的其它手段包括但不限于:使用特异于该蛋白质的多克隆或单克隆抗体的方法。例子包括但不限于酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、荧光免疫测定(FIA)和荧光激活细胞分选(FACS)。这些和其它一些测定法是本领域公知的(见,例如Maddox et al.,J.Exp.Med.,158:1211[1983])。在本发明的一些优选的实施方式中,使用本文提供的方法和组合物时,分泌比使用同样的方法或组合物但没有引入肽转运蛋白或肽转运操纵子的基因产物的情况下更高。
本领域技术人员已知多种测定法,用于检测和测量本发明的多肽活性。特别地,可获得下述测定法来检测蛋白酶活性,所述测定法基于酸可溶性肽从酪蛋白或血红蛋白的释放,这是使用Folin方法通过作为280nm处的吸光度或比色方式来测量的(见,例如,Bergmeyer et al.,″Methods ofEnzymatic Analysis″vol.5,Peptidases,Proteinases and their Inhibitors,Verlag Chemie,Weinheim[1984])。一些其它测定法涉及生色底物的溶解(见,例如,Ward,″Proteinases,″in Fogarty(ed.).,Microbial Enzymes and Biotechnology,Applied Science,London,[1983],pp 251-317)。其它一些示例性的测定法包括但不限于琥珀酰-Ala-Ala-Pro-Phe-对硝基苯胺测定法(SAAPFpNA)和2,4,6-三硝基苯磺酸钠盐测定(TNBS测定)。本领域已知的许多其它参考文献提供了合适的方法(见,例如,Wells et al.,NucleicAcids Res.11:7911-7925[1983];Christianson et al.,Anal.Biochem.,223:119-129[1994]和Hsia et al.,Anal Biochem.,242:221-227[1999])。这并不意味着本发明受限于任何特定的测定方法。
在一些实施方式中,使用从经修饰的前体蛋白酶加工来的成熟蛋白酶的活性与从未经修饰的前体蛋白酶加工来的成熟蛋白酶的活性的比例,来测定微生物对经修饰的蛋白酶的生产。在一些特别优选的实施方式中,1或更高的比例是想要的。
用于测定目的蛋白(例如蛋白酶)在宿主细胞中的生产水平以及用于检测表达的蛋白质的其它手段包括用特异于该蛋白质的多克隆或单克隆抗体进行免疫测定。例子包括但不限于酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、荧光免疫测定(FIA)和荧光激活细胞分选(FACS)。但是,本领域已知其它一些方法,它们也可用于评估目的蛋白(见,例如,Hampton et al.,Serological Methods,A Laboratory Manual,APS Press,St.Paul,MN[1990]和Maddox et al.,J.Exp.Med.,158:1211[1983])。在一些优选的实施方式中,在使用本发明获得的经改变的菌株中,目的蛋白的分泌要比在相应未经改变的宿主中更高。如本领域中所知的,在适于表达和从细胞培养物中回收目的多肽的条件下,保持和培养使用本发明生产的经改变的芽孢杆菌细胞(见,例如,Hardwood and Cutting(eds.)Molecular Biological Methods for Bacillus,John Wiley&Sons[1990])。这并不意味着本发明受限于任何特定的测定方法。
本文提到的所有出版物和专利都通过引用并入本文。本领域技术人员将显而易见对描述的本发明的方法和系统的多种修改和变动,而不偏离本发明的范围和宗旨。虽然已经参照特定的优选实施方式对本发明进行了描述,但是应当理解,本发明不应被不恰当地限定为这些具体的实施方式。事实上,本领域和/或相关领域技术人员显而易见的用于实施本发明的所描述模式的多种修改都将在本发明的范围内。
实验
提供下述实施例来展示和进一步阐述本发明的某些优选的实施方式和方面,并不应被解释为限制其范围。
在下文实验公开的内容中,应用了下述缩写:ppm(每百万分之);M(摩尔的);mM(毫摩尔的);μM(微摩尔的);nM(纳摩尔的);mol(摩尔);mmol(毫摩尔);μmol(微摩尔);nmol(纳摩尔);gm(克);mg(毫克);μg(微克);pg(皮克);L(升);ml和mL(毫升);μl和μL(微升);cm(厘米);mm(毫米);μm(微米);nm(纳米);U(单位);V(伏特);MW(分子量);sec(秒);min(s)(分钟/分钟);h(s)和hr(s)(小时/小时);℃(摄氏度);QS(足够量);ND(未进行);NA(不适用);rpm(每分钟转数);H2O(水);dH2O(去离子水);HCl(氢氯酸);aa(氨基酸);bp(碱基对);kb(千碱基对);kD(千道尔顿);cDNA(拷贝或互补DNA);DNA(脱氧核糖核酸);ssDNA(单链DNA);dsDNA(双链DNA);dNTP(三磷酸脱氧核糖核苷酸);RNA(核糖核酸);MgCl2(氯化镁);NaCl(氯化钠);w/v(质量体积比);v/v(体积体积比);g(重力);OD(光密度);Dulbecco′s磷酸盐缓冲液(DPBS);OD280(280nm处的光密度);OD600(600nm处的光密度);A405(405nm处的吸光度);PAGE(聚丙烯酰胺凝胶电泳);PBS(磷酸缓冲盐水[150mM NaCl,10mM磷酸钠缓冲液,pH 7.2]);PBST(PBS+0.25%
Figure G2008800078776D00381
-20);PEG(聚乙二醇);PCR(聚合酶链式反应);SDS(十二烷基硫酸钠);Tris(三(羟甲基)氨基甲烷);HEPES(N-[2-羟乙基]哌嗪-N-[2-乙磺酸]);HBS(HEPES缓冲盐水);SDS(十二烷基硫酸钠);bME、BME和βME(β-巯基乙醇或2-巯基乙醇);Tris-HCI(三[羟甲基]氨基甲烷-盐酸盐);Tricine(N-[三-(羟甲基)-甲基]-甘氨酸);DMSO(二甲亚砜);Taq(水生栖热菌(Thermus aquaticus)DNA聚合酶);Klenow(DNA聚合酶I大(Klenow)片段);rpm(每分钟转数);EGTA(乙二醇-双(β-氨基乙醚)N,N,N′,N′-四乙酸);EDTA(乙二胺四乙酸);bla(β-内酰胺酶或氨苄青霉素抗性基因);DNA2.0(DNA2.0,Menlo Park,CA);OXOID(Oxoid,Basingstoke,Hampshire,UK);Corning(Corning Life Sciences,Coming,NY);ATCC(American Type Culture Collection,Rockville,MD);Gibco/BRL(Gibco/BRL,Grand Island,NY);Sigma(Sigma Chemical Co.,St.Louis,MO);Pharmacia(Pharmacia Biotech,Pisacataway,NJ);NCBI(NationalCenter for Biotechnology Information);Applied Biosystems(AppliedBiosystems,Foster City,CA);Clontech(CLONTECH Laboratories,PaloAlto,CA);Operon Technologies(Operon Technologies,Inc.,Alameda,CA);Bachem(Bachem Bioscience,Inc.,King of Prussia,PA);Difco(Difco Laboratories,Detroit,Ml);GIBCO BRL或Gibco BRL(LifeTechnologies,Inc.,Gaithersburg,MD);Millipore(Millipore,Billerica,MA);Bio-Rad(Bio-Rad,Hercules,CA);Invitrogen(Invitrogen Corp.,San Diego,CA);NEB(New England Biolabs,Beverly,MA);Sigma(SigmaChemical Co.,St.Louis,MO);Pierce(Pierce Biotechnology,Rockford,IL);Takara(Takara Bio Inc.Otsu,Japan);Roche(Hoffmann-La Roche,Basel,Switzerland);EM Science(EM Science,Gibbstown,NJ);Qiagen(Qiagen,Inc.,Valencia,CA);Molecular Devices(Molecular Devices,Corp.,Sunnyvale,CA);R&D Systems(R&D Systems,Minneapolis,MN);Stratagene(Stratagene Cloning Systems,La JoIIa,CA)和Microsoft(Microsoft,Inc.,Redmond,WA)。
实施例1
对克劳氏芽孢杆菌碱性蛋白酶V049的SigP和前序列的位点扫描诱变
使用
Figure G2008800078776D00391
位点定向诱变试剂盒(QC;Stratagene),按照厂商提供的说明书,进行对克劳氏芽孢杆菌碱性蛋白酶V049前体蛋白酶的前序列的位点饱和诱变。产生位点饱和文库,以包括编码克劳氏芽孢杆菌蛋白酶变体V049的前体多核苷酸的经修饰的多核苷酸序列。pXX-V049质粒中含有的编码V049多核苷酸的前区域的序列(图5和6;SEQ IDNO:17)被突变,以产生多核苷酸文库,其每种包含前体蛋白酶前区域的一个密码子的突变。V049的前区域的每种密码子(例如NNG/C)被突变,以被编码20种天然存在的氨基酸的32种可能的核苷酸三联体取代。针对每种目的密码子,设计互补重叠引物(其中NNS密码子侧翼有18个碱基),表1中给出了引物的序列(SEQ ID NO:18-239)。
表1
  引物   引物序列 左边的碱基** 右边的碱基***   SEQ IDNO
V049-1F   TTAAAAGGAGAGGGTAAAGANNSAGAAGCAAAAAATTGTG 20 17 18
V049-2F   GGAGAGGGTAAAGAGTGNNSAGCAAAAAATTGTGGATC 17 18 19
V049-3F   GAGGGTAAAGAGTGAGANNSAAAAAATTGTGGATCGTC 17 18 20
V049-4F   GGTAAAGAGTGAGAAGCNNSAAATTGTGGATCGTCGC 17 17 21
V049-5F   GTAAAGAGTGAGAAGCAAANNSTTGTGGATCGTCGCGTC 19 17 22
V049-6F   GAGTGAGAAGCAAAAAANNSTGGATCGTCGCGTCGAC 17 17 23
V049-7F   GTGAGAAGCAAAAAATTGNNSATCGTCGCGTCGACCGC 18 17 24
V049-8F   GAAGCAAAAAATTGTGGNNSGTCGCGTCGACCG CACTAC 17 19 25
V049-9F   GCAAAAAATTGTGGATCNNSGCGTCGACCGCACTACTC 17 18 26
V049-10F   CAAAAAATTGTGGATCGTCNNSTCGACCGCACTACTCATTTC 19 20 27
V049-11F   AAAAATTGTGGATCGTCGCGNNSACCGCACTACTCATTTC 20 17 28
V049-12F   AATTGTGGATCGTCGCGTCGNNSGCACTACTCATTTCTGTTG 20 19 29
V049-13F   GGATCGTCGCGTCGACCNNSCTACTCATTTCTGTTGC 17 17 30
V049-14F   GATCGTCGCGTCGACCGCANNSCTCATTTCTGTTGCTTTTAG 19 20 31
V049-15F   GTCGCGTCGACCGCACTANNSATTTCTGTTGCTTTTAG 18 17 32
V049-16F   CGTCGACCGCACTACTCNNSTCTGTTGCTTTTAGTTC 17 17 33
V049-17F   CGACCGCACTACTCATTNNSGTTGCTTTTAGTTCATC 17 17 34
V049-18F   CCGCACTACTCATTTCTNNSGCTTTTAGTTCATCGATC 17 18 35
V049-19F   CACTACTCATTTCTGTTNNSTTTAGTTCATCGATCGC 17 17 36
V049-20F   CTACTCATTTCTGTTGCTNNSAGTTCATCGATCGCATC 18 17 37
V049-21F   CTCATTTCTGTTGCTTTTNNSTCATCGATCGCATCGGC 18 17 38
V049-22F   CATTTCTGTTGCTTTTAGTNNSTCGATCGCATCGGCTGC 19 17 39
V049-23F   CTGTTGCTTTTAGTTCANNSATCGCATCGGCTGCTGAAG 17 19 40
V049-24F   GTTGCTTTTAGTTCATCGNNSGCATCGGCTGCTGAAGAAG 18 19 41
V049-25F   CTTTTAGTTCATCGATCNNSTCGGCTGCTGAAGAAGC 17 17 42
V049-26F   CTTTTAGTTCATCGATCGCANNSGCTGCTGAAGAAGCAAAAG 20 19 43
V049-27F   GTTCATCGATCGCATCGNNSGCTGAAGAAGCAAAAGAAAA 17 20 44
V049-28F   CATCGATCGCATCGGCTNNSGAAGAAGCAAAAGAAAAATA 17 20 45
V049-29F   CGATCGCATCGGCTGCTNNSGAAGCAAAAGAAAAATATTT 17 20 46
V049-30F   GATCGCATCGGCTGCTGAANNSGCAAAAGAAAAATATTTAAT 19 20 47
V049-31F   CATCGGCTGCTGAAGAANNSAAAGAAAAATATTTAATTG 17 19 48
V049-32F   CGGCTGCTGAAGAAGCANNSGAAAAATATTTAATTGG 17 17 49
V049-33F   CTGCTGAAGAAGCAAAANNSAAATATTTAATTGGCTTTAA 17 20 50
V049-34F   CTGAAGAAGCAAAAGAANNSTATTTAATTGGCTTTAATG 17 19 51
V049-35F   GAAGAAGCAAAAGAAAAANNSTTAATTGGCTTTAATGAG 18 18 52
V049-36F   GAAGCAAAAGAAAAATATNNSATTGGCTTTAATGAGCAG 18 18 53
V049-37F   CAAAAGAAAAATATTTANNSGGCTTTAATGAGCAGGAAG 17 19 54
V049-38F   CAAAAGAAAAATATTTAATTNNSTTTAATGAGCAGGAAGC 20 17 55
V049-39F   GAAAAATATTTAATTGGCNNSAATGAGCAGGAAGCTGTC 18 18 56
V049-40F   AAAAATATTTAATTGGCTTTNNSGAGCAGGAAGCTGTCAG 20 17 57
V049-41F   AATATTTAATTGGCTTTAATNNSCAGGAAGCTGTCAGTGAG 20 18 58
V049-42F   ATTTAATTGGCTTTAATGAGNNSGAAGCTGTCAGTGAGTTTG 20 19 59
V049-43F   TAATTGGCTTTAATGAGCAGNNSGCTGTCAGTGAGTTTGTAG 20 19 60
V049-44F   GCTTTAATGAGCAGGAANNSGTCAGTGAGTTTGTAGAAC 17 19 61
V049-45F   CTTTAATGAGCAGGAAGCTNNSAGTGAGTTTGTAGAACAAG 19 19 62
V049-46F   TTAATGAGCAGGAAGCTGTCNNSGAGTTTGTAGAACAAGTAG 20 19 63
V049-47F   GAGCAGGAAGCTGTCAGTNNSTTTGTAGAACAAGTAGAG 18 18 64
V049-48F   CAGGAAGCTGTCAGTGAGNNSGTAGAACAAGTAGAGGC 18 17 65
V049-49F   GAAGCTGTCAGTGAGTTTNNSGAACAAGTAGAGGCAAATG 18 19 66
V049-50F   CTGTCAGTGAGTTTGTANNSCAAGTAGAGGCAAATGAC 17 18 67
V049-51F   GTCAGTGAGTTTGTAGAANNSGTAGAGGCAAATGACGAG 18 18 68
V049-52F   GTGAGTTTGTAGAACAANNSGAGGCAAATGACGAGGTC 17 18 69
V049-53F   GAGTTTGTAGAACAAGTANNSGCAAATGACGAGGTCGC 18 17 70
V049-54F   GTTTGTAGAACAAGTAGAGNNSAATGACGAGGTCGCCATTC 19 19 71
V049-55F   GTAGAACAAGTAGAGGCANNSGACGAGGTCGCCATTCTC 18 18 72
V049-56F   GAACAAGTAGAGGCAAATNNSGAGGTCGCCATTCTCTC 18 17 73
V049-57F   CAAGTAGAGGCAAATGACNNSGTCGCCATTCTCTCTGAG 18 18 74
V049-58F   GTAGAGGCAAATGACGAGNNSGCCATTCTCTCTGAGGAAG 18 19 75
V049-59F   GAGGCAAATGACGAGGTCNNSATTCTCTCTGAGGAAGAG 18 18 76
V049-60F   CAAATGACGAGGTCGCCNNSCTCTCTGAGGAAGAGGAAG 17 19 77
V049-61F   CAAATGACGAGGTCGCCATTNNSTCTGAGGAAGAGGAAGTC 20 18 78
V049-62F   GACGAGGTCGCCATTCTCNNSGAGGAAGAGGAAGTCGAAAT 18 20 79
V049-63F   GAGGTCGCCATTCTCTCTNNSGAAGAGGAAGTCGAAATTG 18 19 80
V049-64F   GTCGCCATTCTCTCTGAGNNSGAGGAAGTCGAAATTGAATT 18 20 81
V049-65F   CCATTCTCTCTGAGGAANNSGAAGTCGAAATTGAATTG 17 18 82
V049-66F   CATTCTCTCTGAGGAAGAGNNSGTCGAAATTGAATTGCTTC 19 19 83
V049-67F   CTCTCTGAGGAAGAGGAANNSGAAATTGAATTGCTTCATG 18 19 84
V049-68F   CTGAGGAAGAGGAAGTCNNSATTGAATTGCTTCATGAATT 17 20 85
V049-69F   GAGGAAGAGGAAGTCGAANNSGAATTGCTTCATGAATTTG 18 19 86
V049-70F   GAAGAGGAAGTCGAAATTNNSTTGCTTCATGAATTTGAAAC 18 20 87
V049-71F   GAGGAAGTCGAAATTGAANNSCTTCATGAATTTGAAAC 18 17 88
V049-72F   GAAGTCGAAATTGAATTGNNSCATGAATTTGAAACGATTC 18 19 89
V049-73F   GTCGAAATTGAATTGCTTNNSGAATTTGAAACGATTCC 18 17 90
V049-74F   GAAATTGAATTGCTTCATNNSTTTGAAACGATTCCTGTTTT 18 20 91
V049-75F   AAATTGAATTGCTTCATGAANNSGAAACGATTCCTGTTTTATC 20 20 92
V049-76F   GAATTGCTTCATGAATTTNNSACGATTCCTGTTTTATC 18 17 93
V049-77F   AATTGCTTCATGAATTTGAANNSATTCCTGTTTTATCCGTTG 20 19 94
V049-78F   CTTCATGAATTTGAAACGNNSCCTGTTTTATCCGTTGAG 18 18 95
V049-79F   CATGAATTTGAAACGATTNNSGTTTTATCCGTTGAGTTAAG 18 20 96
V049-80F   GAATTTGAAACGATTCCTNNSTTATCCGTTGAGTTAAG 18 17 97
V049-81F   AATTTGAAACGATTCCTGTTNNSTCCGTTGAGTTAAGCCC 20 17 98
V049-82F   GAAACGATTCCTGTTTTANNSGTTGAGTTAAGCCCAGAAG 18 19 99
V049-83F   CGATTCCTGTTTTATCCNNSGAGTTAAGCCCAGAAGATG 17 19 100
V049-84F   GATTCCTGTTTTATCCGTTNNSTTAAGCCCAGAAGATGTG 19 18 101
V049-85F   CTGTTTTATCCGTTGAGNNSAGCCCAGAAGATGTGGAC 17 18 102
V049-86F   GTTTTATCCGTTGAGTTANNSCCAGAAGATGTGGACGC 18 17 103
V049-87F   TTTTATCCGTTGAGTTAAGCNNSGAAGATGTGGACGCGCTTG 20 19 104
V049-88F   CCGTTGAGTTAAGCCCANNSGATGTGGACGCGCTTGAAC 17 19 105
V049-89F   GTTGAGTTAAGCCCAGAANNSGTGGACGCGCTTGAACTC 18 18 106
V049-90F   GAGTTAAGCCCAGAAGATNNSGACGCGCTTGAACTCGATC 18 19 107
V049-91F   GTTAAGCCCAGAAGATGTGNNSGCGCTTGAACTCGATCC 19 17 108
V049-92F   GCCCAGAAGATGTGGACNNSCTTGAACTCGATCCAGC 17 17 109
V049-93F   CAGAAGATGTGGACGCGNNSGAACTCGATCCAGCGATTTC 17 20 110
V049-94F   GAAGATGTGGACGCGCTTNNSCTCGATCCAGCGATTTC 18 17 111
V049-95F   GATGTGGACGCGCTTGAANNSGATCCAGCGATTTCTTATAT 18 20 112
V049-96F   GTGGACGCGCTTGAACTCNNSCCAGCGATTTCTTATATTG 18 19 113
V049-97F   GACGCGCTTGAACTCGATNNSGCGATTTCTTATATTGAAG 18 19 114
V049-98F   CGCTTGAACTCGATCCANNSATTTCTTATATTGAAGAG 17 18 115
V049-99F   CTTGAACTCGATCCAGCGNNSTCTTATATTGAAGAGGATG 18 19 116
V049-100F   GAACTCGATCCAGCGATTNNSTATATTGAAGAGGATGC 18 17 117
V049-101F   CTCGATCCAGCGATTTCTNNSATTGAAGAGGATGCAGAAG 18 19 118
V049-102F   GATCCAGCGATTTCTTATNNSGAAGAGGATGCAGAAGTAAC 18 20 119
V049-103F   CAGCGATTTCTTATATTNNSGAGGATGCAGAAGTAAC 17 17 120
V049-104F   CGATTTCTTATATTGAANNSGATGCAGAAGTAACGAC 17 17 121
V049-105F   GATTTCTTATATTGAAGAGNNSGCAGAAGTAACGACAATG 19 18 122
V049-106F   CTTATATTGAAGAGGATNNSGAAGTAACGACAATGGC 17 17 123
V049-107F   CTTATATTGAAGAGGATGCANNSGTAACGACAATGGCGCAATC 20 20 124
V049-108F   ATATTGAAGAGGATGCAGAANNSACGACAATGGCGCAATC 20 17 125
V049-109F   GAAGAGGATGCAGAAGTANNSACAATGGCGCAATCGGTAC 18 19 126
V049-110F   GAGGATGCAGAAGTAACGNNSATGGCGCAATCGGTACC 18 17 127
V049-111F   GATGCAGAAGTAACGACANNSGCGCAATCGGTACCATG 18 17 128
V049-1R   CACAATTTTTTGCTTCTSNNTCTTTACCCTCTCCTTTTAA 17 20 129
V049-2R   GATCCACAATTTTTTGCTSNNCACTCTTTACCCTCTCC 18 17 130
V049-3R   GACGATCCACAATTTTTTSNNTCTCACTCTTTACCCTC 18 17 131
V049-4R   GCGACGATCCACAATTTSNNGCTTCTCACTCTTTACC 17 17 132
V049-5R   GACGCGACGATCCACAASNNTTTGCTTCTCACTCTTTAC 17 19 133
V049-6R   GTCGACGCGACGATCCASNNTTTTTTGCTTCTCACTC 17 17 134
V049-7R   GCGGTCGACGCGACGATSNNCAATTTTTTGCTTCTCAC 17 18 135
V049-8R   GTAGTGCGGTCGACGCGACSNNCCACAATTTTTTGCTTC 19 17 136
V049-9R   GAGTAGTGCGGTCGACGCSNNGATCCACAATTTTTTGC 18 17 137
V049-10R   GAAATGAGTAGTGCGGTCGASNNGACGATCCACAATTTTTTG 20 19 138
V049-11R   GAAATGAGTAGTGCGGTSNNCGCGACGATCCACAATTTTT 17 20 139
V049-12R   CAACAGAAATGAGTAGTGCSNNCGACGCGACGATCCACAATT 19 20 140
V049-13R   GCAACAGAAATGAGTAGSNNGGTCGACGCGACGATCC 17 17 141
V049-14R   CTAAAAGCAACAGAAATGAGSNNTGCGGTCGACGCGACGATC 20 19 142
V049-15R   CTAAAAGCAACAGAAATSNNTAGTGCGGTCGACGCGAC 17 18 143
V049-16R   GAACTAAAAGCAACAGASNNGAGTAGTGCGGTCGACG 17 17 144
V049-17R   GATGAACTAAAAGCAACSNNAATGAGTAGTGCGGTCG 17 17 145
V049-18R   GATCGATGAACTAAAAGCSNNAGAAATGAGTAGTGCGG 18 17 146
V049-19R   GCGATCGATGAACTAAASNNAACAGAAATGAGTAGTG 17 17 147
V049-20R   GATGCGATCGATGAACTSNNAGCAACAGAAATGAGTAG 17 18 148
V049-21R   GCCGATGCGATCGATGASNNAAAAGCAACAGAAATGAG 17 18 149
V049-22R   GCAGCCGATGCGATCGASNNACTAAAAGCAACAGAAATG 17 19 150
V049-23R   CTTCAGCAGCCGATGCGATSNNTGAACTAAAAGCAACAG 19 17 151
V049-24R   CTTCTTCAGCAGCCGATGCSNNCGATGAACTAAAAGCAAC 19 18 152
V049-25R   GCTTCTTCAGCAGCCGASNNGATCGATGAACTAAAAG 17 17 153
V049-26R   CTTTTGCTTCTTCAGCAGCSNNTGCGATCGATGAACTAAAAG 19 20 154
V049-27R   TTTTCTTTTGCTTCTTCAGCSNNCGATGCGATCGATGAAC 20 17 155
V049-28R   TATTTTTCTTTTGCTTCTTCSNNAGCCGATGCGATCGATG 20 17 156
V049-29R   AAATATTTTTCTTTTGCTTCSNNAGCAGCCGATGCGATCG 20 17 157
V049-30R   ATTAAATATTTTTCTTTTGCSNNTTCAGCAGCCGATGCGATC 20 19 158
V049-31R   CAATTAAATATTTTTCTTTSNNTTCTTCAGCAGCCGATG 19 17 159
V049-32R   CCAATTAAATATTTTTCSNNTGCTTCTTCAGCAGCCG 17 17 160
V049-33R   TTAAAGCCAATTAAATATTTSNNTTTTGCTTCTTCAGCAG 20 17 161
V049-34R   CATTAAAGCCAATTAAATASNNTTCTTTTGCTTCTTCAG 19 17 162
V049-35R   CTCATTAAAGCCAATTAASNNTTTTTCTTTTGCTTCTTC 18 18 163
V049-36R   CTGCTCATTAAAGCCAATSNNATATTTTTCTTTTGCTTC 18 18 164
V049-37R   CTTCCTGCTCATTAAAGCCSNNTAAATATTTTTCTTTTG 19 17 165
V049-38R   GCTTCCTGCTCATTAAASNNAATTAAATATTTTTCTTTTG 17 20 166
V049-39R   GACAGCTTCCTGCTCATTSNNGCCAATTAAATATTTTTC 18 18 167
V049-40R   CTGACAGCTTCCTGCTCSNNAAAGCCAATTAAATATTTTT 17 20 168
V049-41R   CTCACTGACAGCTTCCTGSN NATTAAAGCCAATTAAATATT 18 20 169
V049-42R   CAAACTCACTGACAGCTTCSNNCTCATTAAAGCCAATTAAAT 19 20 170
V049-43R   CTACAAACTCACTGACAGCSNNCTGCTCATTAAAGCCAATTA 19 20 171
V049-44R   GTTCTACAAACTCACTGACSNNTTCCTGCTCATTAAAGC 19 17 172
V049-45R   CTTGTTCTACAAACTCACTSNNAGCTTCCTGCTCATTAAAG 19 19 173
V049-46R   CTACTTGTTCTACAAACTCSNNGACAGCTTCCTGCTCATTAA 19 20 174
V049-47R   CTCTACTTGTTCTACAAASNNACTGACAGCTTCCTGCTC 18 18 175
V049-48R   GCCTCTACTTGTTCTACSNNCTCACTGACAGCTTCCTG 17 18 176
V049-49R   CATTTGCCTCTACTTGTTCSNNAAACTCACTGACAGCTTC 19 18 177
V049-50R   GTCATTTGCCTCTACTTGSNNTACAAACTCACTGACAG 18 17 178
V049-51R   CTCGTCATTTGCCTCTACSNNTTCTACAAACTCACTGAC 18 18 179
V049-52R   GACCTCGTCATTTGCCTCSNNTTGTTCTACAAACTCAC 18 17 180
V049-53R   GCGACCTCGTCATTTGCSNNTACTTGTTCTACAAACTC 17 18 181
V049-54R   GAATGGCGACCTCGTCATTSNNCTCTACTTGTTCTACAAAC 19 19 182
V049-55R   GAGAATGGCGACCTCGTCSNNTGCCTCTACTTGTTCTAC 18 18 183
V049-56R   GAGAGAATGGCGACCTCSNNATTTGCCTCTACTTGTTC 17 18 184
V049-57R   CTCAGAGAGAATGGCGACSNNGTCATTTGCCTCTACTTG 18 18 185
V049-58R   CTTCCTCAGAGAGAATGGCSNNCTCGTCATTTGCCTCTAC 19 18 186
V049-59R   CTCTTCCTCAGAGAGAATSNNGACCTCGTCATTTGCCTC 18 18 187
V049-60R   CTTCCTCTTCCTCAGAGAGSNNGGCGACCTCGTCATTTG 19 17 188
V049-61R   GACTTCCTCTTCCTCAGASNNAATGGCGACCTCGTCATTTG 18 20 189
V049-62R   ATTTCGACTTCCTCTTCCTCSNNGAGAATGGCGACCTCGTC 20 18 190
V049-63R   CAATTTCGACTTCCTCTTCSNNAGAGAGAATGGCGACCTC 19 18 191
V049-64R   AATTCAATTTCGACTTCCTCSNNCTCAGAGAGAATGGCGAC 20 18 192
V049-65R   CAATTCAATTTCGACTTCSNNTTCCTCAGAGAGAATGG 18 17 193
V049-66R   GAAGCAATTCAATTTCGACSNNCTCTTCCTCAGAGAGAATG 19 19 194
V049-67R   CATGAAGCAATTCAATTTCSNNTTCCTCTTCCTCAGAGAG 19 18 195
V049-68R   AATTCATGAAGCAATTCAATSNNGACTTCCTCTTCCTCAG 20 17 196
V049-69R   CAAATTCATGAAGCAATTCSNNTTCGACTTCCTCTTCCTC 19 18 197
V049-70R   GTTTCAAATTCATGAAGCAASNNAATTTCGACTTCCTCTTC 20 18 198
V049-71R   GTTTCAAATTCATGAAGSNNTTCAATTTCGACTTCCTC 17 18 199
V049-72R   GAATCGTTTCAAATTCATGSNNCAATTCAATTTCGACTTC 19 18 200
V049-73R   GGAATCGTTTCAAATTCSNNAAGCAATTCAATTTCGAC 17 18 201
V049-74R   AAAACAGGAATCGTTTCAAASNNATGAAGCAATTCAATTTC 20 18 202
V049-75R   GATAAAACAGGAATCGTTTCSNNTTCATGAAGCAATTCAATTT 20 20 203
V049-76R   GATAAAACAGGAATCGTSNNAAATTCATGAAGCAATTC 17 18 204
V049-77R   CAACGGATAAAACAGGAATSNNTTCAAATTCATGAAGCAATT 19 20 205
V049-78R   CTCAACGGATAAAACAGGSNNCGTTTCAAATTCATGAAG 18 18 206
V049-79R   CTTAACTCAACGGATAAAACSNNAATCGTTTCAAATTCATG 20 18 207
V049-80R   CTTAACTCAACGGATAASNNAGGAATCGTTTCAAATTC 17 18 208
V049-81R   GGGCTTAACTCAACGGASNNAACAGGAATCGTTTCAAATT 17 20 209
V049-82R   CTTCTGGGCTTAACTCAACSNNTAAAACAGGAATCGTTTC 19 18 210
V049-83R   CATCTTCTGGGCTTAACTCSNNGGATAAAACAGGAATCG 19 17 211
V049-84R   CACATCTTCTGGGCTTAASNNAACGGATAAAACAGGAATC 18 19 212
V049-85R   GTCCACATCTTCTGGGCTSNNCTCAACGGATAAAACAG 18 17 213
V049-86R   GCGTCCACATCTTCTGGSNNTAACTCAACGGATAAAAC 17 18 214
V049-87R   CAAGCGCGTCCACATCTTCSNNGCTTAACTCAACGGATAAAA 19 20 215
V049-88R   GTTCAAGCGCGTCCACATCSNNTGGGCTTAACTCAACGG 19 17 216
V049-89R   GAGTTCAAGCGCGTCCACSNNTTCTGGGCTTAACTCAAC 18 18 217
V049-90R   GATCGAGTTCAAGCGCGTCSNNATCTTCTGGGCTTAACTC 19 18 218
V049-91R   GGATCGAGTTCAAGCGCSNNCACATCTTCTGGGCTTAAC 17 19 219
V049-92R   GCTGGATCGAGTTCAAGSNNGTCCACATCTTCTGGGC 17 17 220
V049-93R   GAAATCGCTGGATCGAGTTCSNNCGCGTCCACATCTTCTG 20 17 221
V049-94R   GAAATCGCTGGATCGAGSNNAAGCGCGTCCACATCTTC 17 18 222
V049-95R   ATATAAGAAATCGCTGGATCSNNTTCAAGCGCGTCCACATC 20 18 223
V049-96R   CAATATAAGAAATCGCTGGSNNGAGTTCAAGCGCGTCCAC 19 18 224
V049-97R   CTTCAATATAAGAAATCGCSNNATCGAGTTCAAGCGCGTC 19 18 225
V049-98R   CTCTTCAATATAAGAAATSNNTGGATCGAGTTCAAGCG 18 17 226
V049-99R   CATCCTCTTCAATATAAGASNNCGCTGGATCGAGTTCAAG 19 18 227
V049-100R   GCATCCTCTTCAATATASNNAATCGCTGGATCGAGTTC 17 18 228
V049-101R   CTTCTGCATCCTCTTCAATSNNAGAAATCGCTGGATCGAG 19 18 229
V049-102R   GTTACTTCTGCATCCTCTTCSNNATAAGAAATCGCTGGATC 20 18 230
V049-103R   GTTACTTCTGCATCCTCSNNAATATAAGAAATCGCTG 17 17 231
V049-104R   GTCGTTACTTCTGCATCSNNTTCAATATAAGAAATCG 17 17 232
V049-105R   CATTGTCGTTACTTCTGCSNNCTCTTCAATATAAGAAATC 18 19 233
V049-106R   GCCATTGTCGTTACTTCSNNATCCTCTTCAATATAAG 17 17 234
V049-107R   GATTGCGCCATTGTCGTTACSNNTGCATCCTCTTCAATATAAG 20 20 235
V049-108R   GATTGCGCCATTGTCGTSNNTTCTGCATCCTCTTCAATAT 17 20 236
V049-109R   GTACCGATTGCGCCATTGTSNNTACTTCTGCATCCTCTTC 19 18 237
V049-110R   GGTACCGATTGCGCCATSNNCGTTACTTCTGCATCCTC 17 18 238
V049-111R   CATGGTACCGATTGCGCSNNTGTCGTTACTTCTGCATC 17 18 239
提供的引物名反映了取代的氨基酸位置;“R”表示引物是反向引物,“F”表示引物是正向引物。例如,V049-108F是用于取代V049前体蛋白酶的第108位氨基酸的正向引物。
**“左边的碱基”和***“右边的碱基”表示引物中存在的突变密码子左边和右边的碱基的数量。这些碱基与模板前体多核苷酸碱基(即,V049)的碱基互补。
SEQ ID NO:17-载体pXX-049的多核苷酸序列
AATTCCTCCATTTTCTTCTGCTATCAAAATAACAGACTCGTGATTTTCCAAACGAGCTTTCAA
AAAAGCCTCTGCCCCTTGCAAATCGGATGCCTGTCTATAAAATTCCCGATATTGGCTTAAA
CAGCGGCGCAATGGCGGCCGCATCTGATGTCTTTGCTTGGCGAATGTTCATCTTATTTCTT
CCTCCCTCTCAATAATTTTTTCATTCTATCCCTTTTCTGTAAAGTTTATTTTTCAGAATACTTT
TATCATCATGCTTTGAAAAAATATCACGATAATATCCATTGTTCTCACGGAAGCACACGCAG
GTCATTTGAACGAATTTTTTCGACAGGAATTTGCCGGGACTCAGGAGCATTTAACCTAAAA
AAGCATGACATTTCAGCATAATGAACATTTACTCATGTCTATTTTCGTTCTTTTCTGTATGAA
AATAGTTATTTCGAGTCTCTACGGAAATAGCGAGAGATGATATACCTAAATAGAGATAAAAT
CATCTCAAAAAAATGGGTCTACTAAAATATTATTCCATCTATTACAATAAATTCACAGAATAG
TCTTTTAAGTAAGTCTACTCTGAATTTTTTTAAAAGGAGAGGGTAAAGAGTGAGAAGCAAAA
AATTGTGGATCGTCGCGTCGACCGCACTACTCATTTCTGTTGCTTTTAGTTCATCGATCGC
ATCGGCTGCTGAAGAAGCAAAAGAAAAATATTTAATTGGCTTTAATGAGCAGGAAGCTGTC
AGTGAGTTTGTAGAACAAGTAGAGGCAAATGACGAGGTCGCCATTCTCTCTGAGGAAGAG
GAAGTCGAAATTGAATTGCTTCATGAATTTGAAACGATTCCTGTTTTATCCGTTGAGTTAAG
CCCAGAAGATGTGGACGCGCTTGAACTCGATCCAGCGATTTCTTATATTGAAGAGGATGCA
GAAGTAACGACAATGGCGCAATCGGTACCATGGGGAATTAGCCGTGTGCAAGCCCCAGCT
GCCCATAACCGTGGATTGACAGGTTCTGGTGTAAAAGTTGCTGTCCTCGATACAGGTATTT
CCACTCATCCAGACTTAAATATTCGTGGTGGCGCTAGCTTTGTACCAGGGGAACCATCCAC
TCAAGATGGGAATGGGCATGGCACGCATGTGGCTGGGACGATTGCTGCTTTAAACAATTC
GATTGGCGTTCTTGGCGTAGCACCGAACGCGGAACTATACGCTGTTAAAGTATTAGGGGC
GAGCGGTTCAGGTTCGGTCAGCTCGATTGCCCAAGGATTGGAATGGGCAGGGAACAATGT
TATGCACGTTGCTAATTTGAGTTTAGGACTGCAGGCACCAAGTGCCACACTTGAGCAAGCT
GTTAATAGCGCGACTTCTAGAGGCGTTCTTGTTGTAGCGGCATCTGGGAATTCAGGTGCA
GGCTCAATCAGCTATCCGGCCCGTTATGCGAACGCAATGGCAGTCGGAGCTACTGACCAA
AACAACAACCGCGCCAGCTTTTCACAGTATGGCGCAGGGCTTGACATTGTCGCACCAGGT
GTAAACGTGCAGAGCACATACCCAGGTTCAACGTATGCCAGCTTAAACGGTACATCGATG
GCTACTCCTCATGTTGCAGGTGCAGCAGCCCTTGTTAAACAAAAGAACCCATCTTGGTCCA
ATGTACAAATCCGCAATCATCTAAAGAATACGGCAACGAGCTTAGGAAGCACGAACTTGTA
TGGAAGCGGACTTGTCAATGCAGAAGCGGCAACACGTTAATCAATAAAAAAACGCTGTGC
GGTTAAAGGGCACAGCGTTTTTTTGTGTATGAATCGGGATCCTCGATCGAGACTAGAGTCG
ATTTTTACAAGAATTAGCTTTATATAATTTCTGTTTTTCTAAAGTTTTATCAGCTACAAAAGAC
AGAAATGTATTGCAATCTTCAACTAAATCCATTTGATTCTCTCCAATATGACGTTTAATAAAT
TTCTGAAATACTTGATTTCTTTGTTTTTTCTCAGTATACTTTTCCATGTTATAACACATAAAAA
CAACTTAGTTTTCACAAACTATGACAATAAAAAAAGTTGCTTTTTCCCCTTTCTATGTATGTT
TTTTACTAGTCATTTAAAACGATACATTAATAGGTACGAAAAAGCAACTTTTTTTGCGCTTAA
AACCAGTCATACCAATAACTTAAGGGTAACTAGCCTCGCCGGCAATAGTTACCCTTATTAT
CAAGATAAGAAAGAAAAGGATTTTTCGCTACGCTCAAATCCTTTAAAAAAACACAAAAGACC
ACATTTTTTAATGTGGTCTTTATTCTTCAACTAAAGCACCCATTAGTTCAACAAACGAAAATT
GGATAAAGTGGGATATTTTTAAAATATATATTTATGTTACAGTAATATTGACTTTTAAAAAAG
GATTGATTCTAATGAAGAAAGCAGACAAGTAAGCCTCCTAAATTCACTTTAGATAAAAATTT
AGGAGGCATATCAAATGAACTTTAATAAAATTGATTTAGACAATTGGAAGAGAAAAGAGATA
TTTAATCATTATTTGAACCAACAAACGACTTTTAGTATAACCACAGAAATTGATATTAGTGTT
TTATACCGAAACATAAAACAAGAAGGATATAAATTTTACCCTGCATTTATTTTCTTAGTGACA
AGGGTGATAAACTCAAATACAGCTTTTAGAACTGGTTACAATAGCGACGGAGAGTTAGGTT
ATTGGGATAAGTTAGAGCCACTTTATACAATTTTTGATGGTGTATCTAAAACATTCTCTGGT
ATTTGGACTCCTGTAAAGAATGACTTCAAAGAGTTTTATGATTTATACCTTTCTGATGTAGA
GAAATATAATGGTTCGGGGAAATTGTTTCCCAAAACACCTATACCTGAAAATGCTTTTTCTC
TTTCTATTATTCCATGGACTTCATTTACTGGGTTTAACTTAAATATCAATAATAATAGTAATTA
CCTTCTACCCATTATTACAGCAGGAAAATTCATTAATAAAGGTAATTCAATATATTTACCGCT
ATCTTTACAGGTACATCATTCTGTTTGTGATGGTTATCATGCAGGATTGTTTATGAACTCTAT
TCAGGAATTGTCAGATAGGCCTAATGACTGGCTTTTATAATATGAGATAATGCCGACTGTA
CTTTTTACAGTCGGTTTTCTAATGTCACTAACCTGCCCCGTTAGTTGAAGAAGGTTTTTATA
TTACAGCTCCAGATCCATATCCTTCTTTTTCTGAACCGACTTCTCCTTTTTCGCTTCTTTATT
CCAATTGCTTTATTGACGTTGAGCCTCGGAACCCTTAACAATCCCAAAACTTGTCGAATGG
TCGGCTTAATAGCTCACGCTATGCCGACATTCGTCTGCAAGTTTAGTTAAGGGTTCTTCTC
AACGCACAATAAATTTTCTCGGCATAAATGCGTGGTCTAATTTTTATTTTTAATAACCTTGAT
AGCAAAAAATGCCATTCCAATACAAAACCACATACCTATAATCGACCTGCAGGAATTAATTC
CTCCATTTTCTTCTGCTATCAAAATAACAGACTCGTGATTTTCCAAACGAGCTTTCAAAAAA
GCCTCTGCCCCTTGCAAATCGGATGCCTGTCTATAAAATTCCCGATATTGGCTTAAACAGC
GGCGCAATGGCGGCCGCATCTGATGTCTTTGCTTGGCGAATGTTCATCTTATTTCTTCCTC
CCTCTCAATAATTTTTTCATTCTATCCCTTTTCTGTAAAGTTTATTTTTCAGAATACTTTTATC
ATCATGCTTTGAAAAAATATCACGATAATATCCATTGTTCTCACGGAAGCACACGCAGGTCA
TTTGAACGAATTTTTTCGACAGGAATTTGCCGGGACTCAGGAGCATTTAACCTAAAAAAGC
ATGACATTTCAGCATAATGAACATTTACTCATGTCTATTTTCGTTCTTTTCTGTATGAAAATA
GTTATTTCGAGTCTCTACGGAAATAGCGAGAGATGATATACCTAAATAGAGATAAAATCATC
TCAAAAAAATGGGTCTACTAAAATATTATTCCATCTATTACAATAAATTCACAGAATAGTCTT
TTAAGTAAGTCTACTCTGAATTTTTTTATCAAGCTAGCTTGGCGTAATCATGGTCATAGCTG
TTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAA
AGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACT
GCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGC
GGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGC
GCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTAT
CCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCC
AGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAG
CATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATAC
CAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACC
GGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGT
AGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCC
GTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGA
CACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTA
GGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGGACAGTA
TTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGAT
CCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGC
GCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTG
GAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAG
ATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCT
GACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATC
CATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGG
CCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAAT
AAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCA
TCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCG
CAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCA
TTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAG
CGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACT
CATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTG
TGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCT
CTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCAT
CATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGT
TCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTC
TGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGA
AATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTC
TCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCAC
ATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATA
AAAATAGGCGTATCACGAGGCCCTTTCGTCTCGCGCGTTTCGGTGATGACGGTGAAAACC
TCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGC
AGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTA
TGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAG
ATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTG
GGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTG
CTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGA
CGGCCAGTG
QC反应物由40.25μL灭菌蒸馏H2O、5μL PfuTurbo 10x缓冲液(来自试剂盒)、1μL dNTPs(来自试剂盒)、1.25μL正向引物(100ng/μL)、1.25μL反向引物(100ng/μL)、0.25μL pMSAT-NcoI小量制备DNA作为模板(~50ng)和1μL PfuTurbo(来自试剂盒)总共50μL构成。循环条件为:95℃1分钟,一次,接着是95℃1分钟、55℃1分钟和68℃12分钟的19-20个循环。为分析反应体系,完成后在1.2%E-凝胶(Invitrogen)上运行5μL的反应物。
接着,依次进行两次DpnI消化,用1μL和1μL的酶在37℃进行2至8小时。使用相似条件进行阴性对照,但是不用任何引物。然后,使用BioRad电穿孔仪,将1μL经DpnI消化的反应产物转化进50μL一次性TOP10电感受态细胞(Invitrogen)。然后向经电穿孔的细胞中加入其中提供有TOP10细胞(Invitrogen)的1ml SOC,在振荡下温育1小时,之后接种到含有5ppm氯霉素的LA板上。平板在37℃温育过夜。该温育之后,来自每种文库(即每个位点)的96个菌落被接种进96孔微量滴定板中含有10-50ppm氯霉素的200μL LB中,在37℃培养过夜。第二天加入甘油至20%终浓度后,将平板冷冻于-80℃,它们被用于用V049SEQ-R2引物进行的高通量测序。
相似地,使用多位点定向诱变(QCMS;Stratagene),来对编码前体蛋白酶V049的前区域的两个或多个氨基酸的密码子进行突变。使用19.25μL灭菌蒸馏H2O、2.5μL 10x缓冲液(来自试剂盒)、1μLdNTPs(来自试剂盒)、1μL 5’磷酸化正向引物(100ng/μL)、0.25μLpMSAT-NcoI小量制备DNA作为模板(~50ng)以及1μL酶混合物(来自试剂盒),总共25μL来进行QCMS反应。循环条件是95℃1分钟,一次,接着是95℃1分钟,55℃1分钟和65℃12分钟的30个循环。为分析反应产物,完成后在1.2%E-凝胶(Invitrogen)上运行2.5μL的反应物。接着,依次进行两次DpnI消化,用1μL和接着是0.5μL的酶在37℃进行2至8小时。对照、转化和测序按照上文针对QC方法所述来进行。
实施例2
宿主细胞转化和经修饰蛋白酶的表达
在37℃,用DpnI对质粒pXX-049(含有编码经修饰的目的蛋白质的多核苷酸)进行2次消化(3-5小时)。
在大肠杆菌中的转化和筛选
通过电穿孔,用1ul经DpnI消化质粒DNA来转化大肠杆菌Top10细胞。将经转化的细胞接种到含有5ppm CMP(氯霉素)的LB琼脂平板上,让菌落生长过夜。挑出96个单独的菌落,将其转入含有LB+5ppm CMP+50ppm羧苄青霉素的96孔微量滴定板的对应孔中。在37℃对培养物培养过夜,同时以250rpm摇动。向培养物中加入甘油贮液至10%的终浓度。从96份大肠杆菌培养物制备质粒DNA,对一部分质粒DNA制备物加以测序(Cogenics,Morrisville,NC)。使用Phrep,Phrap,Consed,Custal W软件来进行自动序列分析。
转化进枯草芽孢杆菌
第二部分的质粒DNA被用于转化枯草芽孢杆菌宿主细胞。用来自96份大肠杆菌培养物中每种的2微升质粒DNA(携带有合适的突变)转化100ul枯草芽孢杆菌ComK感受态细胞。细胞在37℃温育45分钟,同时以250rpm振荡。将来自96种转化混合物的细胞接种在含有1.6%脱脂奶和5ppm CMP的LA上,在37℃培养箱中培养过夜。
从96种转化的每种挑出4个菌落,各自转移到每孔含有150ul LB和5ppm CMP的微量滴定板中。微量滴定板的许多孔含有合适的对照。然后在37℃对微量滴定板进行4小时的温育,同时以250rpm旋转。将10ul每种培养物转移到含有140ul Grant II培养基+5ppm CMP,pH 7.3的新的微量滴定板中。如下文所述来制备GrantII培养基:溶液I:将10g大豆蛋白胨(Soytone)溶解于500ml水中,高压灭菌20-25分钟;溶液II:3ml 1M K2HPO4、75g葡萄糖、3.6g尿素、100ml Grant′s 10X MOPS稀释进400ml水。混合溶液I和溶液II,用HCl/NaOH将pH调节至pH 7.3。将终体积调节为1L,终溶液经0.22-um PES过滤器过滤灭菌。
微量滴定板培养物在摇床中于37℃,250rpm培养。以规律间隔取样(多至40小时),用于检验分析。
实施例3
测量经修饰的蛋白酶生产:蛋白酶活性的AAPF测定
针对经修饰蛋白酶的生产,对按照实施例2中所述获得的每种枯草芽孢杆菌培养物进行测定。测定产生的酶对底物(琥珀酰-L-Ala-L-Ala-L-Pro-L-Phe-对硝基苯胺,AAPF)的活性。该测定法将经修饰的蛋白酶的生产测量为水解和对硝基苯胺的释放导致的405nm/分钟的吸光度的增加(Estell et al.,J Biol Chem.,260:6518-6521(1985))。测量使用Sofmax Pro软件来进行,特定条件如下设定:类型:Kinetic;降低:Vmax点(读取最佳15/28点);Lm1:405nm;时间:5分钟以及间隔:11秒。将每种枯草芽孢杆菌培养物取10微升,稀释至100ul Tris缓冲液(含有10mMTris+0.005%-80,pH 8.6);和25ul 100mg/ml AAPF。每种经修饰蛋白酶的相对活性被计算,每种氨基酸取代对相应经修饰蛋白酶的生产的影响被测定为从每种经修饰蛋白酶加工来的成熟蛋白酶的活性与从未经修饰的V049前体蛋白酶加工来的成熟蛋白酶的活性的比例。结果在表2中给出。
一旦DNA构建体被稳定整合进感受态枯草芽孢杆菌菌株,在微量滴定测定中测量经修饰的蛋白酶的活性,将该活性与相应前体蛋白酶的活性相比较。
将过夜Grant II培养基细胞培养物取10微升,稀释至100ul Tris缓冲液(含有10mM Tris+0.005%
Figure G2008800078776D00582
-80,pH 8.6);25ul 100mg/mlAAPF被用于检验蛋白酶活性。测定在微量滴定板中进行,使用SoftmaxPro软件。
结果显示,前体V049蛋白酶的大多数氨基酸的氨基酸取代导致蛋白酶成熟形式的生产增强。此外,每种经取代的氨基酸的位点饱和表明每个氨基酸可在同一位置被两个或多个氨基酸取代,以使得成熟形式的生产相对从具有未经修饰的前区域的前体蛋白酶获得的成熟形式而言得到增强。
表2
  位置   变体编号   变体氨基酸   蛋白质浓度   活性比例#
  1   V001D   D   102.37   1.02
  1   V001Q   Q   98.52   0.99
  1   V001F   F   96.85   0.97
  1   V001L   L   58.70   0.59
  1   V001A   A   58.67   0.59
  1   V001H   H   36.54   0.37
  1   V001I   I   35.67   0.36
  1   V001G   G   29.93   0.30
  1   V001Y   Y   14.97   0.15
  1   V001E   E   9.30   0.09
  1   V001T   T   6.99   0.07
  1   V001C   C   6.75   0.07
  1   V001W   W   6.61   0.07
  1   V001S   S   5.54   0.06
  1   V001R   R   5.19   0.05
  2   R002M   M   122.01   1.22
  2   R002W   W   104.55   1.05
  2   R002K   K   103.46   1.03
  2   R002C   C   101.20   1.01
  2   R002S   S   101.19   1.01
  2   R002L   L   98.36   0.98
  2   R002F   F   93.71   0.94
  2   R002H   H   93.65   0.94
  2   R002N   N   89.23   0.89
  2   R002A   A   82.16   0.82
  2   R002G   G   73.95   0.74
  2   R002D   D   60.97   0.61
  2   R002V   V   53.99   0.54
  2   R002T   T   40.33   0.40
  2   R002Y   Y   13.66   0.14
  3   S003F   F   133.20   1.33
  3   S003M   M   127.94   1.28
  3   S003R   R   121.00   1.21
  3   S003T   T   116.45   1.16
  3   S003Q   Q   114.41   1.14
  3   S003N   N   105.57   1.06
  3   S003I   I   104.04   1.04
  3   S003V   V   101.09   1.01
  3   S003W   W   99.63   1.00
  3   S003G   G   99.50   0.99
  3   S003D   D   98.94   0.99
  3   S003H   H   98.52   0.99
  3   S003A   A   97.60   0.98
  3   S003P   P   93.74   0.94
  3   S003Y   Y   65.38   0.65
  3   S003L   L   48.58   0.49
  3   S003C   C   10.43   0.10
  4   K004T   T   121.17   1.21
  4   K004V   V   116.61   1.17
  4   K004Y   Y   111.33   1.11
  4   K004I   I   109.36   1.09
  4   K004C   C   109.34   1.09
  4   K004R   R   107.32   1.07
  4   K004F   F   103.89   1.04
  4   K004H   H   96.72   0.97
  4   K004A   A   95.03   0.95
  4   K004Q   Q   92.30   0.92
  4   K004P   P   91.49   0.91
  4   K004N   N   86.73   0.87
  4   K004S   S   78.31   0.78
  4   K004G   G   53.68   0.54
  4   K004E   E   29.18   0.29
  4   K004L   L   7.86   0.08
  5   K005W   W   123.75   1.24
  5   K005N   N   118.59   1.19
  5   K005Q   Q   114.87   1.15
  5   K005Y   Y   112.41   1.12
  5   K005V   V   112.29   1.12
  5   K005H   H   111.16   1.11
  5   K005G   G   110.84   1.11
  5   K005S   S   109.37   1.09
  5   K005D   D   108.39   1.08
  5   K005C   C   103.96   1.04
  5   K005R   R   100.76   1.01
  5   K005T   T   99.54   1.00
  5   K005A   A   91.66   0.92
  5   K005L   L   90.96   0.91
  5   K005P   P   49.40   0.49
  5   K005F   F   6.26   0.06
  5   K005M   M   5.65   0.06
  6   L006M   M   122.55   1.23
  6   L006S   S   118.01   1.18
  6   L006G   G   116.94   1.17
  6   L006N   N   115.98   1.16
  6   L006V   V   115.39   1.15
  6   L006P   P   115.11   1.15
  6   L006H   H   114.99   1.15
  6   L006D   D   114.30   1.14
  6   L006K   K   111.33   1.11
  6   L006E   E   109.38   1.09
  6   L006A   A   109.11   1.09
  6   L006T   T   105.11   1.05
  6   L006I   I   105.10   1.05
  6   L006R   R   103.58   1.04
  6   L006F   F   101.84   1.02
  6   L006C   C   101.69   1.02
  6   L006W   W   77.03   0.77
  6   L006Y   Y   7.99   0.08
  7   W007V   V   125.70   1.26
  7   W007M   M   121.99   1.22
  7   W007S   S   121.49   1.21
  7   W007R   R   121.42   1.21
  7   W007P   P   113.12   1.13
  7   W007T   T   112.42   1.12
  7   W007N   N   111.62   1.12
  7   W007Q   Q   110.40   1.10
  7   W007F   F   109.54   1.10
  7   W007K   K   99.28   0.99
  7   W007C   C   99.28   0.99
  7   W007G   G   98.93   0.99
  7   W007H   H   95.65   0.96
  7   W007A   A   92.24   0.92
  7   W007L   L   80.60   0.81
  7   W007Y   Y   61.72   0.62
  7   W007I   I   6.21   0.06
  8   I008F   F   114.74   1.15
  8   I008S   S   111.06   1.11
  8   I008P   P   107.32   1.07
  8   I008L   L   106.57   1.07
  8   I008V   V   105.39   1.05
  8   I008T   T   105.22   1.05
  8   I008Y   Y   103.53   1.04
  8   I008M   M   100.20   1.00
  8   I008E   E   99.53   1.00
  8   I008A   A   95.64   0.96
  8   I008D   D   75.18   0.75
  8   I008R   R   4.60   0.05
  9   V009R   R   130.14   1.30
  9   V009P   P   122.65   1.23
  9   V009M   M   114.91   1.15
  9   V009I   I   114.34   1.14
  9   V009Y   Y   111.23   1.11
  9   V009S   S   107.52   1.08
  9   V009C   C   105.80   1.06
  9   V009T   T   105.04   1.05
  9   V009E   E   100.29   1.00
  9   V009W   W   98.90   0.99
  9   V009L   L   97.67   0.98
  9   V009A   A   93.84   0.94
  9   V009H   H   86.35   0.86
  9   V009N   N   85.33   0.85
  9   V009K   K   6.32   0.06
  10   A010M   M   127.85   1.28
  10   A010R   R   106.71   1.07
  10   A010I   I   106.36   1.06
  10   A010S   S   106.34   1.06
  10   A010Q   Q   106.33   1.06
  10   A010P   P   105.05   1.05
  10   A010C   C   104.29   1.04
  10   A010H   H   103.11   1.03
  10   A010N   N   101.39   1.01
  10   A010G   G   100.93   1.01
  10   A010W   W   97.00   0.97
  10   A010T   T   96.44   0.96
  10   A010K   K   59.66   0.60
  10   A010D   D   45.09   0.45
  10   A010L   L   30.80   0.31
  10   A010F   F   8.41   0.08
  11   S011G   G   124.00   1.24
  11   S011M   M   114.00   1.14
  11   S011P   P   113.00   1.13
  11   S011C   C   112.00   1.12
  11   S011F   F   112.00   1.12
  11   S011V   V   104.16   1.04
  11   S011N   N   104.00   1.04
  11   S011A   A   100.00   1.00
  11   S011Y   Y   96.00   0.96
  11   S011D   D   95.00   0.95
  11   S011T   T   95.00   0.95
  11   S011L   L   92.00   0.92
  11   S011Q   Q   92.00   0.92
  11   S011I   I   90.00   0.90
  11   S011W   W   88.00   0.88
  11   S011K   K   66.00   0.66
  11   S011R   R   43.00   0.43
  12   T012A   A   142.37   1.42
  12   T012G   G   134.84   1.35
  12   T012H   H   131.21   1.31
  12   T012C   C   131.00   1.31
  12   T012W   W   127.05   1.27
  12   T012S   S   126.74   1.27
  12   T012V   V   125.13   1.25
  12   T012M   M   123.79   1.24
  12   T012P   P   120.33   1.20
  12   T012I   I   117.21   1.17
  12   T012Q   Q   111.02   1.11
  12   T012F   F   105.34   1.05
  12   T012N   N   97.46   0.97
  12   T012E   E   82.85   0.83
  12   T012K   K   76.37   0.76
  12   T012R   R   51.07   0.51
  12   T012D   D   50.05   0.50
  12   T012L   L   7.07   0.07
  13   A013G   G   127.43   1.27
  13   A013V   V   119.50   1.20
  13   A013S   S   106.50   1.07
  13   A013Q   Q   105.87   1.06
  13   A013F   F   101.75   1.02
  13   A013C   C   100.86   1.01
  13   A013T   T   95.70   0.96
  13   A013M   M   91.53   0.92
  13   A013N   N   86.10   0.86
  13   A013W   W   85.59   0.86
  13   A013E   E   83.94   0.84
  13   A013P   P   72.98   0.73
  13   A013D   D   50.95   0.51
  13   A013R   R   27.55   0.28
  13   A013H   H   7.61   0.08
  13   A013L   L   7.22   0.07
  14   L014S   S   150.94   1.51
  14   L014V   V   144.29   1.44
  14   L014A   A   141.26   1.41
  14   L014F   F   129.64   1.30
  14   L014W   W   125.51   1.26
  14   L014M   M   117.13   1.17
  14   L014G   G   107.37   1.07
  14   L014I   I   95.68   0.96
  14   L014H   H   89.97   0.90
  14   L014N   N   78.82   0.79
  14   L014Q   Q   67.18   0.67
  14   L014Y   Y   62.88   0.63
  14   L014K   K   41.53   0.42
  14   L014E   E   40.85   0.41
  14   L014R   R   32.05   0.32
  14   L014P   P   8.63   0.09
  15   L015G   G   144.04   1.44
  15   L015T   T   134.29   1.34
  15   L015M   M   128.01   1.28
  15   L015C   C   125.90   1.26
  15   L015V   V   119.25   1.19
  15   L015Y   Y   118.30   1.18
  15   L015W   W   116.98   1.17
  15   L015A   A   109.90   1.10
  15   L015F   F   102.58   1.03
  15   L015S   S   98.62   0.99
  15   L015P   P   84.79   0.85
  15   L015Q   Q   53.19   0.53
  15   L015K   K   49.84   0.50
  15   L015N   N   43.69   0.44
  15   L015H   H   41.81   0.42
  15   L015E   E   41.21   0.41
  15   L015R   R   10.80   0.11
  16   I016W   W   153.84   1.54
  16   I016S   S   129.21   1.29
  16   I016G   G   122.70   1.23
  16   I016A   A   116.84   1.17
  16   I016C   C   109.27   1.09
  16   I016V   V   103.40   1.03
  16   I016Y   Y   101.35   1.01
  16   I016T   T   88.85   0.89
  16   I016H   H   75.02   0.75
  16   I016N   N   71.58   0.72
  16   I016F   F   57.93   0.58
  16   I016E   E   38.94   0.39
  16   I016P   P   23.34   0.23
  16   I016R   R   18.70   0.19
  16   I016L   L   11.62   0.12
  17   S017M   M   129.94   1.30
  17   S017A   A   129.04   1.29
  17   S017R   R   126.92   1.27
  17   S017L   L   118.09   1.18
  17   S017H   H   116.37   1.16
  17   S017K   K   114.85   1.15
  17   S017V   V   112.73   1.13
  17   S017D   D   112.49   1.12
  17   S017C   C   110.18   1.10
  17   S017G   G   108.87   1.09
  17   S017E   E   108.53   1.09
  17   S017Y   Y   104.68   1.05
  17   S017I   I   91.72   0.92
  17   S017T   T   88.65   0.89
  17   S017F   F   86.66   0.87
  17   S017P   P   83.37   0.83
  18   V018M   M   141.00   1.41
  18   V018T   T   118.00   1.18
  18   V018A   A   117.48   1.17
  18   V018W   W   112.69   1.13
  18   V018E   E   110.30   1.10
  18   V018S   S   104.38   1.04
  18   V018R   R   102.00   1.02
  18   V018C   C   99.00   0.99
  18   V018D   D   92.82   0.93
  18   V018F   F   90.00   0.90
  18   V018   8   86.00   0.86
  18   V018P   P   80.92   0.81
  18   V018H   H   76.00   0.76
  18   V018L   L   53.62   0.54
  18   V018I   I   50.32   0.50
  18   V018G   G   49.92   0.50
  18   V018Y   Y   42.71   0.43
  19   A019E   E   142.51   1.43
  19   A019M   M   121.02   1.21
  19   A019C   C   114.96   1.15
  19   A019S   S   113.37   1.13
  19   A019L   L   112.60   1.13
  19   A019W   W   109.73   1.10
  19   A019V   V   109.69   1.10
  19   A019G   G   108.40   1.08
  19   A019T   T   103.33   1.03
  19   A019I   I   91.94   0.92
  19   A019K   K   91.82   0.92
  19   A019F   F   84.12   0.84
  19   A019R   R   81.36   0.81
  19   A019P   P   80.92   0.81
  20   F020N   N   123.06   1.23
  20   F020Q   Q   118.20   1.18
  20   F020M   M   115.31   1.15
  20   F020V   V   107.59   1.08
  20   F020S   S   107.24   1.07
  20   F020T   T   104.65   1.05
  20   F020L   L   100.66   1.01
  20   FD20G   G   99.06   0.99
  20   F020D   D   94.64   0.95
  20   F020I   I   93.21   0.93
  20   F020E   E   89.45   0.89
  20   F020K   K   89.03   0.89
  20   F020R   R   71.76   0.72
  20   F020A   A   6.86   0.07
  21   S021T   T   98.31   0.98
  21   S021E   E   90.76   0.91
  21   S021Q   Q   86.03   0.86
  21   S021M   M   82.73   0.83
  21   S021G   G   81.75   0.82
  21   S021A   A   81.13   0.81
  21   S021W   W   80.36   0.80
  21   S021V   V   79.71   0.80
  21   S021R   R   79.66   0.80
  21   S021K   K   77.77   0.78
  21   S021L   L   72.62   0.73
  21   S021N   N   71.73   0.72
  21   S021I   I   66.14   0.66
  21   S021C   C   39.26   0.39
  21   S021Y   Y   39.16   0.39
  21   S021P   P   30.33   0.30
  21   S021F   F   8.13   0.08
  21   S021H   H   7.67   0.08
  22   S022M   M   154.51   1.55
  22   S022V   V   121.71   1.22
  22   S022D   D   119.67   1.20
  22   S022W   W   116.41   1.16
  22   S022G   G   115.06   1.15
  22   S022T   T   109.16   1.09
  22   S022R   R   108.79   1.09
  22   S022P   P   108.47   1.08
  22   S022Y   Y   106.89   1.07
  22   S022A   A   102.30   1.02
  22   S022L   L   97.24   0.97
  22   S022F   F   95.17   0.95
  22   S022E   E   93.31   0.93
  22   S022H   H   92.95   0.93
  22   S022C   C   89.96   0.90
  23   S023K   K   128.31   1.28
  23   S023G   G   119.02   1.19
  23   S023E   E   114.55   1.15
  23   S023H   H   113.30   1.13
  23   S023R   R   113.12   1.13
  23   S023T   T   112.61   1.13
  23   S023A   A   91.93   0.92
  23   S023M   M   91.58   0.92
  23   S023P   P   91.42   0.91
  23   S023V   V   88.72   0.89
  23   S023C   C   86.61   0.87
  23   S023Q   Q   83.15   0.83
  23   S023L   L   77.16   0.77
  23   S023I   I   74.48   0.74
  23   S023W   W   36.43   0.36
  23   S023D   D   7.46   0.07
  24   I024T   T   140.91   1.41
  24   I024V   V   128.01   1.28
  24   I024N   N   110.91   1.11
  24   I024R   R   110.89   1.11
  24   I024L   L   105.32   1.05
  24   I024H   H   102.41   1.02
  24   I024P   P   101.05   1.01
  24   I024S   S   100.69   1.01
  24   I024C   C   98.49   0.98
  24   I024A   A   95.72   0.96
  24   I024W   W   94.63   0.95
  24   I024K   K   94.07   0.94
  24   I024M   M   93.64   0.94
  24   I024Y   Y   8.75   0.09
  24   I024E   E   6.70   0.07
  25   A025V   V   88.01   0.88
  25   A025T   T   63.92   0.64
  25   A025G   G   63.07   0.63
  25   A025S   S   57.55   0.58
  25   A025I   I   51.29   0.51
  25   A025L   L   43.81   0.44
  25   A025E   E   32.21   0.32
  25   A025M   M   31.37   0.31
  25   A025P   P   29.29   0.29
  25   A025K   K   27.25   0.27
  25   A025N   N   25.98   0.26
  25   A025H   H   23.74   0.24
  25   A025D   D   19.49   0.19
  25   A025F   F   16.89   0.17
  25   A025W   W   11.14   0.11
  26   S026Y   Y   129.81   1.30
  26   S026L   L   120.14   1.20
  26   S026A   A   112.01   1.12
  26   S026R   R   111.71   1.12
  26   S026T   T   107.06   1.07
  26   S026N   N   101.40   1.01
  26   S026K   K   99.57   1.00
  26   S026M   M   94.81   0.95
  26   S026D   D   93.37   0.93
  26   S026G   G   90.33   0.90
  26   S026W   W   87.38   0.87
  26   S026V   V   82.41   0.82
  26   S026H   H   81.00   0.81
  26   S026I   I   76.78   0.77
  26   S026P   P   47.45   0.47
  27   A027G   G   67.18   0.67
  27   A027S   S   44.42   0.44
  27   A027K   K   40.64   0.41
  27   A027C   C   39.47   0.39
  27   A027P   P   39.46   0.39
  27   A027R   R   37.92   0.38
  27   A027H   H   36.42   0.36
  27   A027E   E   31.42   0.31
  27   A027F   F   30.21   0.30
  27   A027T   T   21.37   0.21
  27   A027V   V   20.42   0.20
  27   A027W   W   11.82   0.12
  27   A027Q   Q   11.60   0.12
  27   A027L   L   4.86   0.05
  28   A028Q   Q   109.07   1.09
  28   A028T   T   107.38   1.07
  28   A028S   S   83.96   0.84
  28   A028R   R   80.35   0.80
  28   A028M   M   79.43   0.79
  28   A028E   E   71.65   0.72
  28   A028G   G   68.05   0.68
  28   A028D   D   61.77   0.62
  28   A028N   N   57.89   0.58
  28   A028L   L   55.70   0.56
  28   A028V   V   51.81   0.52
  28   A028F   F   31.30   0.31
  28   A028P   P   27.66   0.28
  28   A028W   W   24.87   0.25
  29   E029T   T   133.40   1.33
  29   E029Y   Y   124.28   1.24
  29   E029V   V   117.64   1.18
  29   E029Q   Q   115.48   1.15
  29   E029K   K   114.06   1.14
  29   E029M   M   113.42   1.13
  29   E029P   P   111.96   1.12
  29   E029N   N   111.04   1.11
  29   E029S   S   107.45   1.07
  29   E029G   G   107.33   1.07
  29   E029A   A   107.09   1.07
  29   E029C   C   87.77   0.88
  29   E029L   L   85.82   0.86
  29   E029I   I   80.97   0.81
  29   E029H   H   72.39   0.72
  29   E029W   W   65.30   0.65
  29   E029F   F   58.62   0.59
  30   E030Q   Q   125.96   1.26
  30   E030K   K   120.69   1.21
  30   E030M   M   117.64   1.18
  30   E030A   A   112.55   1.13
  30   E030G   G   104.25   1.04
  30   E030R   R   103.70   1.04
  30   E030S   S   103.37   1.03
  30   E030H   H   103.05   1.03
  30   E030N   N   100.98   1.01
  30   E030T   T   100.94   1.01
  30   E030V   V   99.31   0.99
  30   E030L   L   97.86   0.98
  30   E030F   F   87.10   0.87
  30   E030C   C   71.99   0.72
  30   E030W   W   69.05   0.69
  30   E030P   P   6.54   0.07
  31   A031R   R   123.14   1.23
  31   A031G   G   118.11   1.18
  31   A031S   S   110.90   1.11
  31   A031K   K   108.32   1.08
  31   A031P   P   105.73   1.06
  31   A031T   T   99.73   1.00
  31   A031M   M   96.10   0.96
  31   A031V   V   95.95   0.96
  31   A031L   L   75.13   0.75
  31   A031N   N   67.25   0.67
  31   A031W   W   64.44   0.64
  31   A031H   H   10.14   0.10
  32   K032C   C   67.52   0.68
  32   K032H   H   55.09   0.55
  32   K032T   T   54.10   0.54
  32   K032W   W   50.65   0.51
  32   K032N   N   47.14   0.47
  32   K032L   L   44.25   0.44
  32   K032R   R   37.80   0.38
  32   K032F   F   37.58   0.38
  32   K032V   V   33.13   0.33
  32   K032S   S   30.77   0.31
  32   K032P   P   27.44   0.27
  32   K032I   I   15.39   0.15
  32   K032G   G   12.63   0.13
  32   K032Y   Y   10.28   0.10
  33   E033R   R   197.92   1.98
  33   E033Q   Q   194.17   1.94
  33   E033G   G   146.63   1.47
  33   E033H   H   132.79   1.33
  33   E033N   N   129.84   1.30
  33   E033S   S   128.25   1.28
  33   E033D   D   125.01   1.25
  33   E033I   I   124.33   1.24
  33   E033K   K   116.99   1.17
  33   E033M   M   105.94   1.06
  33   E033L   L   94.42   0.94
  33   E033T   T   89.95   0.90
  33   E033Y   Y   72.82   0.73
  33   E033F   F   71.77   0.72
  33   E033P   P   38.46   0.38
  34   K034R   R   111.00   1.11
  34   K034H   H   86.37   0.86
  34   K034Q   Q   64.00   0.64
  34   K034N   N   56.38   0.56
  34   K034P   P   55.00   0.55
  34   K034T   T   55.00   0.55
  34   K034M   M   52.00   0.52
  34   K034C   C   48.00   0.48
  34   K034V   V   46.00   0.46
  34   K034L   L   35.00   0.35
  34   K034G   G   34.00   0.34
  34   K034D   D   27.00   0.27
  34   K034F   F   25.00   0.25
  34   K034Y   Y   24.00   0.24
  34   K034S   S   5.00   0.05
  35   Y035F   F   92.05   0.92
  35   Y035W   W   29.00   0.29
  35   Y035V   V   23.00   0.23
  35   Y035L   L   11.96   0.12
  35   Y035C   C   11.74   0.12
  35   Y035A   A   9.31   0.09
  35   Y035R   R   8.51   0.09
  35   Y035K   K   8.00   0.08
  35   Y035S   S   7.60   0.08
  35   Y035Q   Q   7.00   0.07
  35   Y035P   P   6.25   0.06
  35   Y035D   D   6.15   0.06
  35   Y035E   E   6.10   0.06
  35   Y035N   N   6.00   0.06
  35   Y035T   T   6.00   0.06
  35   Y035G   G   5.85   0.06
  36   L036M   M   97.00   0.97
  36   L036G   G   33.00   0.33
  36   L036T   T   33.00   0.33
  36   L036Y   Y   25.04   0.25
  36   L036C   C   24.00   0.24
  36   L036N   N   20.00   0.20
  36   L036F   F   19.00   0.19
  36   L036V   V   17.00   0.17
  36   L036W   W   9.00   0.09
  36   L036R   R   8.00   0.08
  36   L036A   A   7.00   0.07
  36   L036S   S   7.00   0.07
  36   L036Q   Q   6.21   0.06
  36   L036H   H   6.08   0.06
  36   L036P   P   5.71   0.06
  36   L036D   D   3.67   0.04
  37   I037V   V   59.70   0.60
  37   I037H   H   22.95   0.23
  37   I037C   C   9.56   0.10
  37   I037S   S   9.48   0.09
  37   I037N   N   8.54   0.09
  37   I037A   A   8.15   0.08
  37   I037F   F   7.80   0.08
  37   I037P   P   7.57   0.08
  37   I037L   L   7.27   0.07
  37   I037Y   Y   7.00   0.07
  37   I037T   T   6.86   0.07
  37   I037G   G   6.86   0.07
  37   I037W   W   6.53   0.07
  37   I037D   D   6.46   0.06
  37   I037Q   Q   6.45   0.06
  37   I037R   R   5.83   0.06
  38   G038A   A   56.00   0.56
  38   G038H   H   34.76   0.35
  38   G038I   I   32.00   0.32
  38   G038S   S   31.00   0.31
  38   G038V   V   31.00   0.31
  38   G038T   T   24.00   0.24
  38   G038M   M   21.00   0.21
  38   G038L   L   15.10   0.15
  38   G038N   N   15.00   0.15
  38   G038R   R   13.00   0.13
  38   G038K   K   12.55   0.13
  38   G038C   C   12.00   0.12
  38   G038P   P   10.00   0.10
  38   G038W   W   9.87   0.10
  38   G038D   D   8.00   0.08
  38   G038E   E   8.00   0.08
  38   G038Y   Y   7.09   0.07
  39   F039L   L   14.25   0.14
  39   F039M   M   14.10   0.14
  39   F039W   W   10.45   0.10
  39   F039Y   Y   9.72   0.10
  39   F039S   S   8.78   0.09
  39   F039R   R   8.71   0.09
  39   F039P   P   8.06   0.08
  39   F039D   D   7.82   0.08
  39   F039E   E   7.79   0.08
  39   F039V   V   7.59   0.08
  39   F039C   C   7.51   0.08
  39   F039A   A   6.77   0.07
  39   F039K   K   6.00   0.06
  39   F039H   H   5.90   0.06
  39   F039G   G   5.87   0.06
  39   F039N   N   5.76   0.06
  39   F039Q   Q   5.54   0.06
  39   F039T   T   5.39   0.05
  40   N040V   V   126.00   1.26
  40   N040K   K   118.87   1.19
  40   N040E   E   110.47   1.10
  40   N040Q   Q   109.00   1.09
  40   N040H   H   107.23   1.07
  40   N040Y   Y   106.81   1.07
  40   N040T   T   106.00   1.06
  40   N040A   A   104.00   1.04
  40   N040L   L   104.00   1.04
  40   N040W   W   102.81   1.03
  40   N040F   F   102.53   1.03
  40   N040R   R   102.00   1.02
  40   N040C   C   98.00   0.98
  40   N040P   P   98.00   0.98
  40   N040I   I   88.00   0.88
  40   N040G   G   82.00   0.82
  40   N040D   D   72.46   0.72
  40   N040M   M   70.39   0.70
  40   N040S   S   19.00   0.19
  41   E041A   A   142.97   1.43
  41   E041S   S   125.74   1.26
  41   E041N   N   113.99   1.14
  41   E041T   T   113.64   1.14
  41   E041H   H   108.25   1.08
  41   E041R   R   104.86   1.05
  41   E041G   G   97.74   0.98
  41   E041Y   Y   95.99   0.96
  41   E041Q   Q   92.70   0.93
  41   E041F   F   63.24   0.63
  41   E041L   L   60.52   0.61
  41   E041I   I   52.81   0.53
  41   E041V   V   45.47   0.45
  41   E041W   W   32.22   0.32
  41   E041P   P   9.27   0.09
  42   Q042M   M   148.09   1.48
  42   Q042R   R   130.84   1.31
  42   Q042P   P   121.40   1.21
  42   Q042W   W   113.30   1.13
  42   Q042S   S   95.75   0.96
  42   Q042Y   Y   86.74   0.87
  42   Q042K   K   83.66   0.84
  42   Q042F   F   75.21   0.75
  42   Q042H   H   74.84   0.75
  42   Q042L   L   73.83   0.74
  42   Q042A   A   73.23   0.73
  42   Q042I   I   67.65   0.68
  42   Q042E   E   58.12   0.58
  42   Q042D   D   57.23   0.57
  42   Q042T   T   57.19   0.57
  42   Q042V   V   42.92   0.43
  42   Q042C   C   42.91   0.43
  42   Q042N   N   27.71   0.28
  43   E043S   S   163.96   1.64
  43   E043R   R   124.40   1.24
  43   E043D   D   120.22   1.20
  43   E043H   H   105.43   1.05
  43   E043A   A   104.90   1.05
  43   E043L   L   95.08   0.95
  43   E043N   N   91.28   0.91
  43   E043G   G   90.19   0.90
  43   E043F   F   69.79   0.70
  43   E043Y   Y   66.91   0.67
  43   E043C   C   66.68   0.67
  43   E043W   W   64.35   0.64
  43   E043V   V   53.37   0.53
  43   E043P   P   42.96   0.43
  43   E043M   M   8.82   0.09
  43   E043T   T   5.27   0.05
  44   A044D   D   136.49   1.36
  44   A044Q   Q   113.72   1.14
  44   A044E   E   108.45   1.08
  44   A044S   S   102.67   1.03
  44   A044N   N   90.51   0.91
  44   A044R   R   82.63   0.83
  44   A044G   G   82.29   0.82
  44   A044C   C   80.18   0.80
  44   A044L   L   79.49   0.79
  44   A044H   H   69.28   0.69
  44   A044V   V   50.75   0.51
  44   A044Y   Y   44.57   0.45
  44   A044T   T   42.35   0.42
  44   A044I   I   29.22   0.29
  44   A044P   P   16.75   0.17
  44   A044F   F   8.08   0.08
  45   V045L   L   128.46   1.28
  45   V045A   A   122.17   1.22
  45   V045C   C   117.75   1.18
  45   V045R   R   89.35   0.89
  45   V045T   T   83.00   0.83
  45   V045I   I   81.29   0.81
  45   V045Q   Q   69.47   0.69
  45   V045F   F   42.91   0.43
  45   V045Y   Y   38.60   0.39
  45   V045S   S   31.46   0.31
  45   V045D   D   30.61   0.31
  45   V045H   H   15.52   0.16
  45   V045P   P   13.16   0.13
  45   V045N   N   8.45   0.08
  46   S046H   H   180.17   1.80
  46   S046R   R   163.56   1.64
  46   S046T   T   145.04   1.45
  46   S046A   A   134.77   1.35
  46   S046Q   Q   133.68   1.34
  46   S046Y   Y   126.03   1.26
  46   S046W   W   108.60   1.09
  46   S046V   V   99.68   1.00
  46   S046L   L   95.29   0.95
  46   S046G   G   94.57   0.95
  46   S046D   D   94.34   0.94
  46   S046E   E   80.44   0.80
  46   S046F   F   68.99   0.69
  46   S046P   P   46.63   0.47
  47   E047D   D   161.68   1.62
  47   E047R   R   127.01   1.27
  47   E047K   K   105.12   1.05
  47   E047Q   Q   103.73   1.04
  47   E047H   H   102.20   1.02
  47   E047A   A   99.30   0.99
  47   E047Y   Y   93.27   0.93
  47   E047N   N   88.69   0.89
  47   E047S   S   82.06   0.82
  47   E047T   T   81.19   0.81
  47   E047V   V   78.37   0.78
  47   E047L   L   68.89   0.69
  47   E047G   G   55.86   0.56
  47   E047F   F   50.48   0.50
  47   E047C   C   49.85   0.50
  47   E047W   W   41.91   0.42
  47   E047P   P   22.22   0.22
  48   F048W   W   100.77   1.01
  48   F048M   M   20.43   0.20
  48   F048L   L   16.60   0.17
  48   F048I   I   11.37   0.11
  48   F048V   V   10.65   0.11
  48   F048R   R   9.36   0.09
  48   F048C   C   9.30   0.09
  48   F048P   P   8.69   0.09
  48   F048S   S   8.60   0.09
  48   F048K   K   8.47   0.08
  48   F048H   H   8.40   0.08
  48   F048N   N   8.39   0.08
  48   F048E   E   8.29   0.08
  48   F048D   D   7.97   0.08
  48   F048G   G   7.50   0.07
  49   V049G   G   135.00   1.35
  49   V049C   C   95.00   0.95
  49   V049R   R   87.00   0.87
  49   V049K   K   58.91   0.59
  49   V049M   M   58.41   0.58
  49   V049A   A   54.56   0.55
  49   V049W   W   46.00   0.46
  49   V049T   T   38.00   0.38
  49   V049S   S   25.00   0.25
  49   V049Y   Y   20.00   0.20
  49   V049Q   Q   17.26   0.17
  49   V049P   P   15.00   0.15
  49   V049L   L   14.00   0.14
  49   V049F   F   13.93   0.14
  49   V049E   E   10.00   0.10
  49   V049N   N   9.00   0.09
  49   V049D   D   8.00   0.08
  49   V049H   H   8.00   0.08
  49   V049I   I   8.00   0.08
  50   E050H   H   112.00   1.12
  50   E050A   A   96.00   0.96
  50   E050S   S   83.00   0.83
  50   E050D   D   82.58   0.83
  50   E050Q   Q   77.00   0.77
  50   E050R   R   77.00   0.77
  50   E050K   K   73.00   0.73
  50   E050M   M   71.98   0.72
  50   E050T   T   64.00   0.64
  50   E050G   G   61.95   0.62
  50   E050Y   Y   52.00   0.52
  50   E050L   L   49.00   0.49
  50   E050F   F   47.00   0.47
  50   E050I   I   46.83   0.47
  50   E050W   W   42.01   0.42
  50   E050N   N   32.42   0.32
  50   E050V   V   29.83   0.30
  50   E050P   P   6.00   0.06
  51   Q051M   M   119.81   1.20
  51   Q051R   R   108.69   1.09
  51   Q051K   K   97.54   0.98
  51   Q051A   A   84.10   0.84
  51   Q051T   T   83.15   0.83
  51   Q051E   E   75.80   0.76
  51   Q051N   N   75.33   0.75
  51   Q051H   H   69.22   0.69
  51   Q051S   S   68.17   0.68
  51   Q051G   G   66.07   0.66
  51   Q051L   L   65.45   0.65
  51   Q051D   D   52.77   0.53
  51   Q051I   I   45.84   0.46
  51   Q051F   F   44.57   0.45
  51   Q051C   C   43.93   0.44
  51   Q051V   V   43.56   0.44
  51   Q051P   P   5.94   0.06
  52   V052L   L   108.19   1.08
  52   V052W   W   104.92   1.05
  52   V052M   M   88.46   0.88
  52   V052I   I   79.27   0.79
  52   V052A   A   72.78   0.73
  52   V052H   H   52.94   0.53
  52   V052F   F   52.32   0.52
  52   V052C   C   46.72   0.47
  52   V052T   T   39.52   0.40
  52   V052G   G   39.28   0.39
  52   V052Q   Q   34.36   0.34
  52   V052R   R   18.76   0.19
  52   V052N   N   15.55   0.16
  52   V052S   S   15.02   0.15
  52   V052E   E   7.54   0.08
  52   V052P   P   6.39   0.06
  52   V052D   D   5.86   0.06
  53   E053A   A   140.37   1.40
  53   E053K   K   127.20   1.27
  53   E053R   R   119.65   1.20
  53   E053H   H   109.57   1.10
  53   E053N   N   98.87   0.99
  53   E053L   L   98.50   0.98
  53   E053P   P   97.72   0.98
  53   E053V   V   94.43   0.94
  53   E053F   F   94.05   0.94
  53   E053S   S   89.81   0.90
  53   E053Y   Y   86.04   0.86
  53   E053T   T   83.88   0.84
  53   E053C   C   81.12   0.81
  53   E053W   W   77.76   0.78
  53   E053D   D   68.39   0.68
  53   E053G   G   67.56   0.68
  53   E053Q   Q   13.97   0.14
  54   A054L   L   137.74   1.38
  54   A054S   S   136.79   1.37
  54   A054R   R   97.90   0.98
  54   A054D   D   97.17   0.97
  54   A054G   G   90.30   0.90
  54   A054T   T   88.68   0.89
  54   A054C   C   83.34   0.83
  54   A054N   N   83.10   0.83
  54   A054I   I   81.67   0.82
  54   A054K   K   81.00   0.81
  54   A054H   H   77.17   0.77
  54   A054Y   Y   74.93   0.75
  54   A054F   F   60.70   0.61
  54   A054V   V   60.08   0.60
  54   A054P   P   23.50   0.24
  55   N055H   H   85.10   0.85
  55   N055A   A   72.93   0.73
  55   N055M   M   69.99   0.70
  55   N055Q   Q   63.43   0.63
  55   N055E   E   59.81   0.60
  55   N055R   R   53.48   0.53
  55   N055G   G   46.03   0.46
  55   N055K   K   45.82   0.46
  55   N055S   S   41.16   0.41
  55   N055Y   Y   38.86   0.39
  55   N055I   I   35.72   0.36
  55   N055V   V   29.77   0.30
  55   N055F   F   28.77   0.29
  55   N055L   L   26.96   0.27
  55   N055P   P   22.56   0.23
  56   D056G   G   124.69   1.25
  56   D056S   S   116.41   1.16
  56   D056K   K   112.18   1.12
  56   D056R   R   101.95   1.02
  56   D056N   N   100.33   1.00
  56   D056H   H   98.12   0.98
  56   D056A   A   86.03   0.86
  56   D056T   T   68.54   0.69
  56   D056Y   Y   56.65   0.57
  56   D056F   F   49.98   0.50
  56   D056P   P   47.08   0.47
  56   D056V   V   46.58   0.47
  56   D056L   L   38.46   0.38
  56   D056I   I   31.73   0.32
  56   D056W   W   30.14   0.30
  57   E057N   N   252.24   2.52
  57   E057H   H   157.45   1.57
  57   E057S   S   145.56   1.46
  57   E057G   G   145.37   1.45
  57   E057Q   Q   143.17   1.43
  57   E057C   C   139.04   1.39
  57   E057M   M   128.97   1.29
  57   E057D   D   128.47   1.28
  57   E057R   R   120.64   1.21
  57   E057K   K   118.25   1.18
  57   E057W   W   116.28   1.16
  57   E057F   F   107.79   1.08
  57   E057V   V   100.08   1.00
  57   E057L   L   99.38   0.99
  57   E057P   P   65.08   0.65
  57   E057I   I   61.84   0.62
  57   E057T   T   26.62   0.27
  58   V058R   R   129.15   1.29
  58   V058Y   Y   123.00   1.23
  58   V058H   H   123.00   1.23
  58   V058M   M   112.92   1.13
  58   V058K   K   110.16   1.10
  58   V058C   C   109.43   1.09
  58   V058L   L   106.58   1.07
  58   V058A   A   104.97   1.05
  58   V058F   F   102.77   1.03
  58   V058N   N   95.69   0.96
  58   V058S   S   93.83   0.94
  58   V058I   I   93.50   0.94
  58   V058T   T   91.46   0.91
  58   V058G   G   87.22   0.87
  58   V058D   D   74.09   0.74
  58   V058E   E   67.17   0.67
  58   V058P   P   61.56   0.62
  58   V058Q   Q   6.39   0.06
  59   A059R   R   187.27   1.87
  59   A059Y   Y   172.73   1.73
  59   A059V   V   159.93   1.60
  59   A059I   I   136.28   1.36
  59   A059F   F   135.64   1.36
  59   A059W   W   125.18   1.25
  59   A059M   M   123.19   1.23
  59   A059L   L   121.10   1.21
  59   A059H   H   110.74   1.11
  59   A059S   S   91.95   0.92
  59   A059T   T   87.06   0.87
  59   A059Q   Q   73.05   0.73
  59   A059G   G   71.74   0.72
  59   A059D   D   69.29   0.69
  59   A059N   N   66.70   0.67
  59   A059E   E   64.01   0.64
  59   A059P   P   59.36   0.59
  59   A059K   K   33.09   0.33
  60   I060L   L   103.80   1.04
  60   I060V   V   97.35   0.97
  60   I060R   R   96.55   0.97
  60   I060M   M   90.48   0.90
  60   I060K   K   75.87   0.76
  60   I060Y   Y   73.84   0.74
  60   I060Q   Q   72.24   0.72
  60   I060N   N   67.92   0.68
  60   I060E   E   65.70   0.66
  60   I060D   D   65.27   0.65
  60   I060A   A   61.85   0.62
  60   I060G   G   61.08   0.61
  60   I060S   S   51.51   0.52
  60   I060T   T   46.40   0.46
  60   I060H   H   36.92   0.37
  60   I060P   P   19.01   0.19
  60   I060W   W   5.42   0.05
  61   L061M   M   129.95   1.30
  61   L061T   T   124.71   1.25
  61   L061A   A   123.36   1.23
  61   L061I   I   110.37   1.10
  61   L061V   V   108.74   1.09
  61   L061G   G   108.57   1.09
  61   L061P   P   102.67   1.03
  61   L061D   D   102.28   1.02
  61   L061S   S   97.83   0.98
  61   L061K   K   95.81   0.96
  61   L061Q   Q   95.57   0.96
  61   L061E   E   91.81   0.92
  61   L061R   R   85.77   0.86
  61   L061H   H   66.88   0.67
  61   L061N   N   35.28   0.35
  62   S062V   V   161.32   1.61
  62   S062W   W   157.12   1.57
  62   S062M   M   150.12   1.50
  62   S062P   P   139.57   1.40
  62   S062N   N   134.16   1.34
  62   S062H   H   133.29   1.33
  62   S062Q   Q   124.88   1.25
  62   S062D   D   120.10   1.20
  62   S062G   G   118.35   1.18
  62   S062I   I   116.17   1.16
  62   S062A   A   115.62   1.16
  62   S062L   L   107.95   1.08
  62   S062C   C   107.34   1.07
  62   S062R   R   107.31   1.07
  62   S062T   T   105.80   1.06
  62   S062K   K   96.88   0.97
  62   S062F   F   77.46   0.77
  63   E063A   A   151.93   1.52
  63   E063G   G   151.54   1.52
  63   E063D   D   143.23   1.43
  63   E063R   R   138.35   1.38
  63   E063T   T   133.00   1.33
  63   E063Q   Q   126.78   1.27
  63   E063C   C   122.66   1.23
  63   E063K   K   114.56   1.15
  63   E063H   H   107.55   1.08
  63   E063I   I   103.97   1.04
  63   E063S   S   101.87   1.02
  63   E063Y   Y   96.83   0.97
  63   E063L   L   94.72   0.95
  63   E063W   W   72.62   0.73
  63   E063V   V   68.49   0.68
  63   E063F   F   54.52   0.55
  64   E064T   T   118.91   1.19
  64   E064R   R   110.53   1.11
  64   E064S   S   109.23   1.09
  64   E064A   A   102.92   1.03
  64   E064H   H   93.59   0.94
  64   E064Q   Q   91.03   0.91
  64   E064C   C   90.99   0.91
  64   E064Y   Y   88.33   0.88
  64   E064G   G   79.36   0.79
  64   E064F   F   67.32   0.67
  64   E064V   V   66.57   0.67
  64   E064L   L   62.47   0.62
  64   E064W   W   60.29   0.60
  64   E064P   P   44.81   0.45
  64   E064K   K   6.18   0.06
  64   E064I   I   5.10   0.05
  65   E065M   M   123.46   1.23
  65   E065R   R   116.00   1.16
  65   E065Q   Q   109.80   1.10
  65   E065A   A   107.63   1.08
  65   E065V   V   104.79   1.05
  65   E065Y   Y   104.29   1.04
  65   E065K   K   100.28   1.00
  65   E065C   C   94.55   0.95
  65   E065S   S   93.73   0.94
  65   E065T   T   89.80   0.90
  65   E065L   L   89.07   0.89
  65   E065I   I   87.89   0.88
  65   E065G   G   80.18   0.80
  65   E065D   D   71.30   0.71
  65   E065W   W   70.97   0.71
  65   E065P   P   56.54   0.57
  66   E066S   S   135.22   1.35
  66   E066A   A   128.91   1.29
  66   E066T   T   127.73   1.28
  66   E066P   P   123.84   1.24
  66   E066R   R   121.88   1.22
  66   E066Y   Y   115.52   1.16
  66   E066K   K   108.25   1.08
  66   E066G   G   105.02   1.05
  66   E066V   V   104.05   1.04
  66   E066M   M   103.51   1.04
  66   E066Q   Q   100.84   1.01
  66   E066W   W   99.26   0.99
  66   E066L   L   93.75   0.94
  66   E066F   F   91.41   0.91
  66   E066N   N   87.34   0.87
  66   E066D   D   71.95   0.72
  66   E066H   H   36.85   0.37
  67   V067I   I   113.21   1.13
  67   V067M   M   73.82   0.74
  67   V067L   L   72.32   0.72
  67   V067Y   Y   70.71   0.71
  67   V067F   F   58.59   0.59
  67   V067C   C   56.98   0.57
  67   V067R   R   55.35   0.55
  67   V067A   A   54.90   0.55
  67   V067T   T   41.46   0.41
  67   V067P   P   34.73   0.35
  67   V067S   S   28.45   0.28
  67   V067E   E   20.66   0.21
  67   V067K   K   20.54   0.21
  67   V067N   N   17.25   0.17
  67   V067G   G   15.25   0.15
  67   V067D   D   13.59   0.14
  67   V067H   H   6.18   0.06
  68   E068K   K   102.16   1.02
  68   E068Q   Q   101.87   1.02
  68   E068S   S   85.61   0.86
  68   E068D   D   83.72   0.84
  68   E068R   R   80.31   0.80
  68   E068N   N   80.22   0.80
  68   E068P   P   74.49   0.74
  68   E068T   T   71.78   0.72
  68   E068G   G   68.18   0.68
  68   E068A   A   68.12   0.68
  68   E068C   C   67.44   0.67
  68   E068Y   Y   58.18   0.58
  68   E068M   M   48.30   0.48
  68   E068V   V   46.31   0.46
  68   E068I   I   25.39   0.25
  68   E068L   L   20.98   0.21
  69   I069V   V   123.93   1.24
  69   I069L   L   79.94   0.80
  69   I069N   N   42.27   0.42
  69   I069S   S   27.06   0.27
  69   I069F   F   22.49   0.22
  69   I069A   A   19.56   0.20
  69   I069T   T   10.74   0.11
  69   I069Y   Y   9.65   0.10
  69   I069W   W   9.01   0.09
  69   I069P   P   7.84   0.08
  69   I069R   R   7.15   0.07
  69   I069Q   Q   7.13   0.07
  69   I069G   G   6.86   0.07
  69   I069D   D   6.38   0.06
  70   E070T   T   135.22   1.35
  70   E070R   R   127.41   1.27
  70   E070N   N   119.02   1.19
  70   E070S   S   118.79   1.19
  70   E070V   V   102.83   1.03
  70   E070G   G   92.33   0.92
  70   E070D   D   89.84   0.90
  70   E070C   C   87.77   0.88
  70   E070A   A   80.65   0.81
  70   E070I   I   77.03   0.77
  70   E070Y   Y   73.97   0.74
  70   E070L   L   73.91   0.74
  70   E070P   P   64.34   0.64
  70   E070F   F   60.29   0.60
  70   E070W   W   43.57   0.44
  70   E070K   K   6.39   0.06
  71   L071V   V   127.43   1.27
  71   L071I   I   122.69   1.23
  71   L071D   D   77.31   0.77
  71   L071M   M   31.70   0.32
  71   L071T   T   25.45   0.25
  71   L071P   P   24.11   0.24
  71   L071R   R   15.22   0.15
  71   L071K   K   14.69   0.15
  71   L071S   S   13.41   0.13
  71   L071W   W   11.88   0.12
  71   L071Q   Q   10.19   0.10
  71   L071E   E   9.80   0.10
  71   L071C   C   9.52   0.10
  71   L071G   G   9.32   0.09
  71   L071H   H   7.50   0.08
  72   L072V   V   98.37   0.98
  72   L072C   C   73.50   0.73
  72   L072K   K   72.20   0.72
  72   L072R   R   61.79   0.62
  72   L072H   H   47.06   0.47
  72   L072M   M   44.46   0.44
  72   L072N   N   43.42   0.43
  72   L072T   T   38.32   0.38
  72   L072G   G   34.67   0.35
  72   L072Q   Q   30.17   0.30
  72   L072Y   Y   29.73   0.30
  72   L072W   W   28.66   0.29
  72   L072D   D   27.32   0.27
  72   L072E   E   24.56   0.25
  72   L072S   S   23.76   0.24
  72   L072A   A   8.70   0.09
  72   L072P   P   6.61   0.07
  73   H073W   W   75.35   0.75
  73   H073S   S   63.17   0.63
  73   H073F   F   60.20   0.60
  73   H073K   K   32.91   0.33
  73   H073C   C   31.74   0.32
  73   H073R   R   27.97   0.28
  73   H073T   T   25.37   0.25
  73   H073G   G   24.90   0.25
  73   H073Q   Q   24.68   0.25
  73   H073V   V   22.30   0.22
  73   H073N   N   20.69   0.21
  73   H073M   M   20.67   0.21
  73   H073I   I   19.80   0.20
  73   H073L   L   19.63   0.20
  73   H073D   D   16.98   0.17
  73   H073P   P   6.69   0.07
  73   H073Y   Y   6.36   0.06
  73   H073A   A   5.49   0.05
  74   E074Q   Q   161.32   1.61
  74   E074R   R   142.60   1.43
  74   E074V   V   136.24   1.36
  74   E074K   K   127.86   1.28
  74   E074A   A   116.09   1.16
  74   E074I   I   105.81   1.06
  74   E074S   S   97.24   0.97
  74   E074T   T   86.73   0.87
  74   E074C   C   86.04   0.86
  74   E074H   H   63.24   0.63
  74   E074W   W   59.27   0.59
  74   E074L   L   51.36   0.51
  74   E074Y   Y   41.17   0.41
  74   E074F   F   37.16   0.37
  74   E074G   G   33.60   0.34
  74   E074D   D   30.16   0.30
  74   E074P   P   29.71   0.30
  75   F075Y   Y   103.89   1.04
  75   F075W   W   16.17   0.16
  75   F075M   M   16.15   0.16
  75   F075P   P   9.44   0.09
  75   F075L   L   9.32   0.09
  75   F075H   H   7.78   0.08
  75   F075C   C   7.76   0.08
  75   F075T   T   7.40   0.07
  75   F075K   K   7.11   0.07
  75   F075S   S   6.90   0.07
  75   F075R   R   6.89   0.07
  75   F075N   N   6.79   0.07
  75   F075G   G   6.63   0.07
  75   F075E   E   6.57   0.07
  76   E076K   K   125.00   1.25
  76   E076S   S   111.17   1.11
  76   E076T   T   110.72   1.11
  76   E076H   H   110.48   1.10
  76   E076N   N   110.33   1.10
  76   E076D   D   100.51   1.01
  76   E076R   R   95.92   0.96
  76   E076Y   Y   78.30   0.78
  76   E076L   L   68.68   0.69
  76   E076C   C   62.01   0.62
  76   E076M   M   60.90   0.61
  76   E076G   G   60.13   0.60
  76   E076A   A   58.13   0.58
  76   E076F   F   56.00   0.56
  76   E076V   V   53.16   0.53
  76   E076I   I   41.46   0.41
  76   E076W   W   36.12   0.36
  76   E076P   P   12.90   0.13
  77   T077N   N   137.52   1.38
  77   T077H   H   121.65   1.22
  77   T077Y   Y   89.82   0.90
  77   T077S   S   86.50   0.87
  77   T077R   R   86.26   0.86
  77   T077W   W   76.37   0.76
  77   T077E   E   68.68   0.69
  77   T077C   C   56.68   0.57
  77   T077M   M   53.12   0.53
  77   T077F   F   52.13   0.52
  77   T077A   A   48.97   0.49
  77   T077G   G   43.04   0.43
  77   T077K   K   38.82   0.39
  77   T077I   I   28.21   0.28
  77   T077V   V   25.58   0.26
  77   T077L   L   21.11   0.21
  77   T077P   P   5.57   0.06
  78   I078T   T   105.05   1.05
  78   I078F   F   86.64   0.87
  78   I078L   L   48.68   0.49
  78   I078V   V   42.29   0.42
  78   I078H   H   32.83   0.33
  78   I078C   C   14.99   0.15
  78   I078Y   Y   13.55   0.14
  78   I078S   S   10.19   0.10
  78   I078W   W   9.59   0.10
  78   I078A   A   8.51   0.09
  78   I078G   G   8.10   0.08
  78   I078K   K   7.77   0.08
  78   I078P   P   7.76   0.08
  78   I078R   R   6.63   0.07
  79   P079S   S   18.58   0.19
  79   P079Q   Q   10.04   0.10
  79   P079M   M   9.48   0.09
  79   P079K   K   9.48   0.09
  79   P079R   R   8.79   0.09
  79   P079G   G   8.40   0.08
  79   P079E   E   8.01   0.08
  79   P079T   T   7.60   0.08
  79   P079V   V   7.38   0.07
  79   P079L   L   6.94   0.07
  79   P079C   C   6.59   0.07
  79   P079A   A   6.54   0.07
  79   P079I   I   5.84   0.06
  80   V080C   C   57.46   0.57
  80   V080I   I   21.08   0.21
  80   V080T   T   20.20   0.20
  80   V080S   S   10.00   0.10
  80   V080L   L   9.00   0.09
  80   V080E   E   7.00   0.07
  80   V080M   M   7.00   0.07
  80   V080Y   Y   7.00   0.07
  80   V080N   N   6.44   0.06
  80   V080W   W   6.32   0.06
  80   V080P   P   6.04   0.06
  80   V080D   D   6.00   0.06
  80   V080G   G   6.00   0.06
  80   V080H   H   6.00   0.06
  80   V080K   K   6.00   0.06
  80   V080R   R   6.00   0.06
  81   L081V   V   49.01   0.49
  81   L081A   A   41.20   0.41
  81   L081M   M   26.29   0.26
  81   L081T   T   15.28   0.15
  81   L081F   F   11.66   0.12
  81   L081W   W   9.72   0.10
  81   L081Y   Y   8.23   0.08
  81   L081S   S   7.53   0.08
  81   L081P   P   7.23   0.07
  81   L081D   D   6.93   0.07
  81   L081G   G   6.62   0.07
  81   L081E   E   6.60   0.07
  81   L081H   H   5.90   0.06
  81   L081R   R   5.68   0.06
  82   S082L   L   129.13   1.29
  82   S082Q   Q   128.15   1.28
  82   S082V   V   103.94   1.04
  82   S082H   H   97.35   0.97
  82   S082Y   Y   91.12   0.91
  82   S082W   W   88.77   0.89
  82   S082A   A   87.22   0.87
  82   S082E   E   85.81   0.86
  82   S082F   F   81.39   0.81
  82   S082C   C   79.80   0.80
  82   S082N   N   61.37   0.61
  82   S082R   R   58.97   0.59
  82   S082G   G   54.28   0.54
  82   S082T   T   54.07   0.54
  82   S082D   D   18.02   0.18
  82   S082P   P   6.19   0.06
  83   V083N   N   109.58   1.10
  83   V083Y   Y   102.00   1.02
  83   V083L   L   97.61   0.98
  83   V083G   G   42.23   0.42
  83   V083H   H   33.13   0.33
  83   V083K   K   11.63   0.12
  83   V083C   C   10.69   0.11
  83   V083T   T   7.51   0.08
  83   V083Q   Q   7.00   0.07
  83   V083D   D   6.61   0.07
  83   V083I   I   6.32   0.06
  83   V083M   M   6.20   0.06
  83   V083R   R   6.04   0.06
  83   V083E   E   5.77   0.06
  83   V083P   P   5.67   0.06
  83   V083S   S   4.97   0.05
  83   V083W   W   4.69   0.05
  83   V083F   F   4.62   0.05
  83   V083A   A   4.61   0.05
  84   E084L   L   153.83   1.54
  84   E084K   K   150.95   1.51
  84   E084V   V   148.36   1.48
  84   E084M   M   139.82   1.40
  84   E084S   S   135.46   1.35
  84   E084A   A   127.39   1.27
  84   E084G   G   124.12   1.24
  84   E084T   T   123.30   1.23
  84   E084R   R   116.66   1.17
  84   E084F   F   111.03   1.11
  84   E084Q   Q   101.46   1.01
  84   E084N   N   100.11   1.00
  84   E084W   W   98.81   0.99
  84   E084I   I   98.06   0.98
  84   E084C   C   95.71   0.96
  84   E084Y   Y   89.76   0.90
  84   E084H   H   75.48   0.75
  84   E084D   D   50.64   0.51
  84   E084P   P   7.96   0.08
  85   L085F   F   100.71   1.01
  85   L085V   V   87.45   0.87
  85   L085A   A   66.38   0.66
  85   L085G   G   41.13   0.41
  85   L085T   T   27.10   0.27
  85   L085Q   Q   12.11   0.12
  85   L085N   N   11.63   0.12
  85   L085R   R   10.96   0.11
  85   L085W   W   8.95   0.09
  85   L085H   H   7.59   0.08
  85   L085E   E   6.71   0.07
  85   L085K   K   6.71   0.07
  86   S086R   R   133.45   1.33
  86   S086D   D   124.54   1.25
  86   S086K   K   120.11   1.20
  86   S086N   N   118.58   1.19
  86   S086A   A   114.90   1.15
  86   S086C   C   94.83   0.95
  86   S086L   L   80.83   0.81
  86   S086M   M   77.93   0.78
  86   S086Q   Q   77.62   0.78
  86   S086E   E   61.08   0.61
  86   S086I   I   45.96   0.46
  86   S086G   G   43.12   0.43
  86   S086P   P   40.52   0.41
  87   P087K   K   89.04   0.89
  87   P087R   R   62.86   0.63
  87   P087T   T   58.88   0.59
  87   P087H   H   58.22   0.58
  87   P087S   S   56.23   0.56
  87   P087N   N   51.90   0.52
  87   P087V   V   47.19   0.47
  87   P087Q   Q   46.90   0.47
  87   P087I   I   38.44   0.38
  87   P087G   G   35.49   0.35
  87   P087M   M   32.83   0.33
  87   P087D   D   27.06   0.27
  87   P087L   L   25.98   0.26
  87   P087W   W   15.17   0.15
  88   E088P   P   128.01   1.28
  88   E088D   D   103.64   1.04
  88   E088G   G   98.73   0.99
  88   E088I   I   76.72   0.77
  88   E088Y   Y   73.31   0.73
  88   E088R   R   71.94   0.72
  88   E088T   T   71.19   0.71
  88   E088V   V   69.78   0.70
  88   E088W   W   59.58   0.60
  88   E088S   S   57.12   0.57
  88   E088Q   Q   45.20   0.45
  88   E088N   N   32.31   0.32
  88   E088H   H   31.97   0.32
  88   E088L   L   28.70   0.29
  88   E088K   K   24.60   0.25
  89   D089K   K   110.11   1.10
  89   D089H   H   101.55   1.02
  89   D089A   A   97.39   0.97
  89   D089N   N   88.63   0.89
  89   D089C   C   86.69   0.87
  89   D089S   S   68.40   0.68
  89   D089M   M   60.16   0.60
  89   D089T   T   57.25   0.57
  89   D089R   R   56.85   0.57
  89   D089F   F   56.61   0.57
  89   D089Q   Q   56.61   0.57
  89   D089G   G   50.16   0.50
  89   D089V   V   49.23   0.49
  89   D089E   E   38.22   0.38
  89   D089L   L   10.85   0.11
  89   D089P   P   7.52   0.08
  90   V090K   K   93.59   0.94
  90   V090A   A   77.43   0.77
  90   V090L   L   74.46   0.74
  90   V090R   R   70.69   0.71
  90   V090I   I   68.15   0.68
  90   V090C   C   56.98   0.57
  90   V090T   T   51.24   0.51
  90   V090S   S   23.79   0.24
  90   V090M   M   23.60   0.24
  90   V090H   H   21.17   0.21
  90   V090Y   Y   14.44   0.14
  90   V090F   F   13.27   0.13
  90   V090W   W   11.98   0.12
  90   V090G   G   10.52   0.11
  90   V090P   P   7.80   0.08
  90   V090N   N   7.52   0.08
  90   V090D   D   7.09   0.07
  91   D091E   E   148.69   1.49
  91   D091P   P   144.01   1.44
  91   D091A   A   142.94   1.43
  91   D091T   T   136.68   1.37
  91   D091N   N   124.34   1.24
  91   D091K   K   118.47   1.18
  91   D091W   W   108.37   1.08
  91   D091R   R   107.58   1.08
  91   D091F   F   104.13   1.04
  91   D091M   M   98.03   0.98
  91   D091C   C   97.38   0.97
  91   D091V   V   87.03   0.87
  91   D091L   L   81.60   0.82
  91   D091G   G   18.66   0.19
  91   D091S   S   5.81   0.06
  92   A092R   R   139.58   1.40
  92   A092K   K   135.47   1.35
  92   A092T   T   134.11   1.34
  92   A092M   M   132.58   1.33
  92   A092V   V   130.35   1.30
  92   A092Q   Q   121.93   1.22
  92   A092I   I   119.20   1.19
  92   A092L   L   117.04   1.17
  92   A092S   S   105.71   1.06
  92   A092E   E   97.94   0.98
  92   A092C   C   89.25   0.89
  92   A092H   H   88.18   0.88
  92   A092Y   Y   84.08   0.84
  92   A092D   D   83.51   0.84
  92   A092F   F   76.69   0.77
  92   A092W   W   70.16   0.70
  92   A092P   P   8.53   0.09
  92   A092G   G   7.42   0.07
  93   L093F   F   60.69   0.61
  93   L093I   I   53.14   0.53
  93   L093M   M   51.15   0.51
  93   L093V   V   44.68   0.45
  93   L093Y   Y   12.17   0.12
  93   L093W   W   11.12   0.11
  93   L093A   A   11.07   0.11
  93   L093T   T   9.55   0.10
  93   L093N   N   7.93   0.08
  93   L093R   R   7.73   0.08
  93   L093Q   Q   7.40   0.07
  93   L093K   K   7.36   0.07
  93   L093G   G   7.31   0.07
  93   L093E   E   7.18   0.07
  93   L093P   P   7.17   0.07
  93   L093H   H   6.92   0.07
  93   L093S   S   6.62   0.07
  93   L093C   C   6.43   0.06
  94   E094A   A   130.00   1.30
  94   E094M   M   127.00   1.27
  94   E094T   T   125.00   1.25
  94   E094R   R   115.00   1.15
  94   E094S   S   111.00   1.11
  94   E094L   L   103.00   1.03
  94   E094F   F   96.41   0.96
  94   E094V   V   94.00   0.94
  94   E094C   C   88.52   0.89
  94   E094N   N   86.00   0.86
  94   E094D   D   76.35   0.76
  94   E094G   G   71.00   0.71
  94   E094P   P   15.00   0.15
  94   E094I   I   6.00   0.06
  94   E094K   K   6.00   0.06
  95   L095E   E   144.50   1.44
  95   L095R   R   143.47   1.43
  95   L095K   K   132.53   1.33
  95   L095S   S   127.82   1.28
  95   L095C   C   126.67   1.27
  95   L095A   A   123.21   1.23
  95   L095T   T   119.38   1.19
  95   L095D   D   112.59   1.13
  95   L095G   G   107.90   1.08
  95   L095V   V   101.75   1.02
  95   L095H   H   101.25   1.01
  95   L095Y   Y   72.15   0.72
  95   L095I   I   66.43   0.66
  95   L095F   F   55.60   0.56
  95   L095W   W   54.88   0.55
  95   L095M   M   49.85   0.50
  95   L095P   P   43.73   0.44
  95   L095N   N   7.87   0.08
  96   D096Y   Y   154.21   1.54
  96   D096H   H   154.17   1.54
  96   D096C   C   131.97   1.32
  96   D096S   S   125.64   1.26
  96   D096L   L   122.29   1.22
  96   D096E   E   115.11   1.15
  96   D096I   I   111.95   1.12
  96   D096W   W   111.27   1.11
  96   D096V   V   103.05   1.03
  96   D096T   T   91.78   0.92
  96   D096F   F   81.46   0.81
  96   D096G   G   66.73   0.67
  96   D096R   R   54.25   0.54
  96   D096P   P   30.89   0.31
  96   D096K   K   24.76   0.25
  96   D096M   M   7.93   0.08
  96   D096N   N   7.71   0.08
  97   P097E   E   73.24   0.73
  97   P097S   S   66.40   0.66
  97   P097D   D   63.49   0.63
  97   P097A   A   58.83   0.59
  97   P097K   K   57.21   0.57
  97   P097Q   Q   54.30   0.54
  97   P097N   N   47.24   0.47
  97   P097G   G   46.89   0.47
  97   P097T   T   45.56   0.46
  97   P097R   R   45.09   0.45
  97   P097M   M   33.57   0.34
  97   P097C   C   29.31   0.29
  97   P097V   V   22.34   0.22
  97   P097Y   Y   21.56   0.22
  97   P097F   F   20.98   0.21
  97   P097L   L   19.17   0.19
  97   P097I   I   18.76   0.19
  97   P097W   W   15.10   0.15
  98   A098R   R   132.47   1.32
  98   A098K   K   131.64   1.32
  98   A098D   D   102.97   1.03
  98   A098L   L   102.06   1.02
  98   A098T   T   91.56   0.92
  98   A098G   G   89.92   0.90
  98   A098V   V   70.86   0.71
  98   A098M   M   48.09   0.48
  98   A098F   F   40.13   0.40
  98   A098E   E   36.13   0.36
  99   I099V   V   77.11   0.77
  99   I099F   F   13.83   0.14
  99   I099L   L   13.75   0.14
  99   I099T   T   10.36   0.10
  99   I099P   P   7.86   0.08
  99   I099Q   Q   7.27   0.07
  99   I099E   E   7.21   0.07
  99   I099K   K   6.92   0.07
  99   I099A   A   6.85   0.07
  99   I099H   H   6.53   0.07
  99   I099D   D   6.44   0.06
  99   I099S   S   6.42   0.06
  99   I099G   G   6.26   0.06
  99   I099W   W   6.22   0.06
  99   I099R   R   5.85   0.06
  99   I099Y   Y   5.59   0.06
  100   S100A   A   103.00   1.03
  100   S100V   V   97.27   0.97
  100   S100R   R   91.59   0.92
  100   S100E   E   87.00   0.87
  100   S100T   T   81.00   0.81
  100   S100C   C   75.00   0.75
  100   S100L   L   61.00   0.61
  100   S100H   H   59.00   0.59
  100   S100I   I   53.00   0.53
  100   S100W   W   43.04   0.43
  100   S100G   G   35.00   0.35
  100   S100Q   Q   21.00   0.21
  100   S100F   F   13.00   0.13
  100   S100M   M   7.00   0.07
  101   Y101F   F   79.08   0.79
  101   Y101H   H   34.40   0.34
  101   Y101R   R   8.50   0.09
  101   Y101T   T   7.52   0.08
  101   Y101C   C   7.50   0.08
  101   Y101Q   Q   7.46   0.07
  101   Y101S   S   7.43   0.07
  101   Y101L   L   7.42   0.07
  101   Y101N   N   7.33   0.07
  101   Y101G   G   7.03   0.07
  101   Y101E   E   6.76   0.07
  101   Y101P   P   6.39   0.06
  102   I102L   L   32.85   0.33
  102   I102T   T   12.31   0.12
  102   I102A   A   11.19   0.11
  102   I102F   F   7.57   0.08
  102   I102P   P   7.53   0.08
  102   I102G   G   6.21   0.06
  102   I102K   K   5.78   0.06
  102   I102S   S   5.77   0.06
  102   I102R   R   5.60   0.06
  102   I102Y   Y   5.40   0.05
  102   I102H   H   5.15   0.05
  102   I102E   E   5.10   0.05
  102   I102Q   Q   4.91   0.05
  103   E103T   T   113.38   1.13
  103   E103P   P   111.36   1.11
  103   E103S   S   86.19   0.86
  103   E103G   G   81.52   0.82
  103   E103D   D   56.43   0.56
  103   E103H   H   33.35   0.33
  103   E103Q   Q   10.36   0.10
  103   E103I   I   8.00   0.08
  103   E103A   A   7.62   0.08
  103   E103K   K   7.55   0.08
  103   E103L   L   7.25   0.07
  103   E103W   W   7.22   0.07
  103   E103C   C   7.10   0.07
  103   E103F   F   6.98   0.07
  103   E103V   V   6.88   0.07
  103   E103R   R   6.04   0.06
  104   E104P   P   124.98   1.25
  104   E104Q   Q   98.83   0.99
  104   E104L   L   95.33   0.95
  104   E104Y   Y   91.66   0.92
  104   E104H   H   87.15   0.87
  104   E104S   S   81.74   0.82
  104   E104A   A   76.42   0.76
  104   E104F   F   71.58   0.72
  104   E104T   T   69.53   0.70
  104   E104C   C   64.06   0.64
  104   E104V   V   57.67   0.58
  104   E104N   N   48.45   0.48
  104   E104W   W   43.19   0.43
  104   E104G   G   33.84   0.34
  105   D105M   M   25.47   0.25
  105   D105T   T   16.88   0.17
  105   D105E   E   14.77   0.15
  105   D105P   P   7.10   0.07
  105   D105C   C   6.97   0.07
  105   D105G   G   6.51   0.07
  105   D105S   S   6.19   0.06
  105   D105F   F   5.83   0.06
  105   D105L   L   5.71   0.06
  105   D105W   W   5.66   0.06
  105   D105Y   Y   5.36   0.05
  106   A106F   F   108.54   1.09
  106   A106K   K   106.67   1.07
  106   A106V   V   106.21   1.06
  106   A106L   L   105.12   1.05
  106   A106M   M   102.59   1.03
  106   A106C   C   95.21   0.95
  106   A106S   S   94.82   0.95
  106   A106I   I   88.65   0.89
  106   A106E   E   84.86   0.85
  106   A106N   N   80.65   0.81
  106   A106G   G   66.53   0.67
  106   A106D   D   44.78   0.45
  107   E107Q   Q   112.74   1.13
  107   E107P   P   102.05   1.02
  107   E107V   V   99.68   1.00
  107   E107S   S   99.06   0.99
  107   E107T   T   93.40   0.93
  107   E107H   H   89.38   0.89
  107   E107R   R   87.40   0.87
  107   E107L   L   82.19   0.82
  107   E107G   G   65.90   0.66
  107   E107C   C   34.35   0.34
  107   E107D   D   6.32   0.06
  107   E107Y   Y   5.97   0.06
  107   E107I   I   5.76   0.06
  108   V108I   I   96.87   0.97
  108   V108A   A   81.56   0.82
  108   V108L   L   73.95   0.74
  108   V108C   C   73.59   0.74
  108   V108T   T   54.76   0.55
  108   V108G   G   34.72   0.35
  108   V108E   E   13.15   0.13
  108   V108S   S   6.94   0.07
  108   V108H   H   6.42   0.06
  108   V108P   P   6.03   0.06
  108   V108Q   Q   6.03   0.06
  108   V108R   R   5.94   0.06
  109   T109Y   Y   151.13   1.51
  109   T109E   E   140.77   1.41
  109   T109G   G   135.65   1.36
  109   T109N   N   135.23   1.35
  109   T109S   S   125.47   1.25
  109   T109M   M   123.65   1.24
  109   T109R   R   121.74   1.22
  109   T109Q   Q   105.15   1.05
  109   T109W   W   102.35   1.02
  109   T109K   K   98.87   0.99
  109   T109L   L   95.89   0.96
  109   T109A   A   31.57   0.32
  110   T110V   V   117.34   1.17
  110   T110L   L   113.17   1.13
  110   T110P   P   112.26   1.12
  110   T110M   M   110.23   1.10
  110   T110C   C   98.41   0.98
  110   T110K   K   97.01   0.97
  110   T110E   E   80.71   0.81
  110   T110G   G   80.05   0.80
  110   T110R   R   79.50   0.80
  110   T110N   N   74.55   0.75
  110   T110Q   Q   57.23   0.57
  110   T110S   S   5.27   0.05
  110   T110W   W   4.82   0.05
  111   M111N   N   145.51   1.46
  111   M111T   T   138.47   1.38
  111   M111Q   Q   134.85   1.35
  111   M111L   L   134.45   1.34
  111   M111W   W   132.12   1.32
  111   M111E   E   130.67   1.31
  111   M111C   C   113.25   1.13
  111   M111G   G   101.14   1.01
  111   M111I   I   100.83   1.01
  111   M111V   V   93.69   0.94
  111   M111R   R   74.46   0.74
  111   M111K   K   70.17   0.70
  111   M111P   P   31.70   0.32
“位置”指SEQ ID NO:13的全长V049前体蛋白酶中编号的氨基酸位置。1-27位指位于V049前体酶的信号肽部分中的位置上的氨基酸,28-111位指位于V049前体酶的前区域中的位置上的氨基酸。
#活性比例是从经修饰的蛋白酶加工得到的成熟蛋白酶的活性除以从未经修饰的前体蛋白酶加工得到的成熟蛋白酶的活性。
实施例4
在该实施例中,使用与上述实施例中所述相同的实验方案,在来自迟缓芽孢杆菌的枯草杆菌蛋白酶的前区域(被称为GG36)中在第33位和第59位进行诱变。按照上文所述,突变了前体多核苷酸序列(SEQ IDNO:240),制备了构建体,并测试了修饰对蛋白酶表达的增加。
结果显示,较之未经修饰的前体,氨基酸取代E33G、E33Q和E33V全部都将野生型成熟GG36蛋白酶的生产增加了至少50%。突变H32K将野生型成熟蛋白酶的生产增加了20%。
这些结果显示,在全长蛋白酶的前区域中的突变不仅可提高变体前体蛋白的表达,还可提高天然存在的酶的表达。

Claims (26)

1.分离的经修饰的多核苷酸,其编码经修饰的全长蛋白酶,其中所述经修饰的多核苷酸中编码所述全长蛋白酶的前区域的部分包含编码选自下述位置的至少一个氨基酸位置上的取代的突变,所述位置等同于SEQ IDNO:5、13或244的氨基酸位置28-108和109。
2.权利要求1的分离的经修饰的多核苷酸,其中所述经修饰的全长蛋白酶是丝氨酸蛋白酶。
3.权利要求1的分离的经修饰的多核苷酸,其中所述经修饰的全长蛋白酶是源于野生型或变体前体碱性丝氨酸蛋白酶的碱性丝氨酸蛋白酶。
4.权利要求3的分离的经修饰的多核苷酸,其中所述前体碱性丝氨酸蛋白酶是克劳氏芽孢杆菌或迟缓芽孢杆菌碱性丝氨酸蛋白酶。
5.权利要求1的分离的经修饰的多核苷酸,其中所述分离的经修饰的多核苷酸包含SEQ ID NOS:1、9或240所示的多核苷酸序列。
6.权利要求1的分离的经修饰的多核苷酸,其中所述经修饰的多核苷酸中编码所述前区域的所述部分包含编码选自SEQ ID NO:5、13或244的E33、E43、A44、E47、V49、E57、A59、E63、E70、E74、E84和E88的至少一个氨基酸位置上的取代的突变。
7.权利要求6的分离的多核苷酸,其中所述E33的取代选自E33D、E33I、E33S、E33N、E33K、E33H、E33Q和E33R。
8.权利要求6的分离的多核苷酸,其中所述E57的取代选自E57F、E57W、E57K、E57R、E57D、E57M、E57C、E57Q、E57S、E57H和E57N。
9.分离的经修饰的多核苷酸,其包含已被突变为编码选自下述位置的至少一个氨基酸位置上的取代的前体前序列,所述位置等同于SEQ IDNO:5、13或244的氨基酸位置28-108和109。
10.权利要求9的分离的经修饰的多核苷酸,其还包含编码包含成熟区域的全长蛋白酶的多核苷酸,其中编码所述成熟区域的所述多核苷酸序列与SEQ ID NOS:8、16或247有至少大约70%同一性。
11.包含权利要求1或9的经修饰的多核苷酸的载体。
12.用权利要求11的载体转化的宿主细胞。
13.权利要求12的宿主细胞,其中所述宿主细胞是微生物。
14.权利要求12的宿主细胞,其中所述宿主细胞是选自芽孢杆菌属、链霉菌属、埃希氏菌属和曲霉属的微生物。
15.权利要求12的宿主细胞,其中所述宿主细胞是枯草芽孢杆菌细胞。
16.权利要求12的宿主细胞产生的蛋白酶。
17.在微生物中产生异源蛋白酶的方法,所述方法包括步骤:
(a)在合适的条件下培养芽孢杆菌宿主细胞,其中,所述芽孢杆菌宿主细胞包含编码经修饰蛋白酶的经修饰的多核苷酸;以及
(b)允许所述微生物产生所述蛋白酶。
18.权利要求17的方法,其中回收所述芽孢杆菌宿主产生的所述异源蛋白酶。
19.权利要求17的方法,其中所述蛋白酶是碱性丝氨酸蛋白酶。
20.权利要求17的方法,其中所述经修饰的多核苷酸编码包含与SEQID NOS:8、16或247有至少大约70%同一性的成熟区的蛋白酶。
21.权利要求17的方法,其中所述编码经修饰蛋白酶的多核苷酸包含前区域,所述前区域包含编码选自下组的至少一个氨基酸位置上的取代的突变,所述组由等同于SEQ ID NO:5、13或240的氨基酸位置28-108和109组成。
22.权利要求21的方法,其中所述至少一个氨基酸取代选自E33D、E33I、E33S、E33N、E33K、E33H、E33Q、E33R、E57F、E57W、E57K、E57R、E57D、E57M、E57C、E57Q、E57S、E57H和E57N。
23.权利要求17的方法,其中所述宿主细胞选自地衣芽孢杆菌、迟缓芽孢杆菌、枯草芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、嗜热脂肪杆菌、克劳氏芽孢杆菌、嗜碱芽孢杆菌、耐盐芽孢杆菌、凝固芽孢杆菌、环状芽孢杆菌、短小芽孢杆菌和苏云金芽孢杆菌。
24.权利要求17的方法,其中所述异源蛋白酶是克劳氏芽孢杆菌或迟缓芽孢杆菌蛋白酶。
25.权利要求17的方法,其中所述宿主细胞是枯草芽孢杆菌宿主细胞。
26.权利要求17的方法,其中所述异源蛋白酶显示出至少为1的生产比例。
CN2008800078776A 2007-03-12 2008-03-12 经修饰的蛋白酶 Expired - Fee Related CN101641438B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310559596.4A CN103667323B (zh) 2007-03-12 2008-03-12 经修饰的蛋白酶

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US90673407P 2007-03-12 2007-03-12
US60/906,734 2007-03-12
PCT/US2008/003291 WO2008112258A2 (en) 2007-03-12 2008-03-12 Modified proteases

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201310559596.4A Division CN103667323B (zh) 2007-03-12 2008-03-12 经修饰的蛋白酶

Publications (2)

Publication Number Publication Date
CN101641438A true CN101641438A (zh) 2010-02-03
CN101641438B CN101641438B (zh) 2013-12-25

Family

ID=39743046

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2008800078776A Expired - Fee Related CN101641438B (zh) 2007-03-12 2008-03-12 经修饰的蛋白酶
CN201310559596.4A Expired - Fee Related CN103667323B (zh) 2007-03-12 2008-03-12 经修饰的蛋白酶

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201310559596.4A Expired - Fee Related CN103667323B (zh) 2007-03-12 2008-03-12 经修饰的蛋白酶

Country Status (10)

Country Link
US (2) US8779112B2 (zh)
EP (1) EP2129779B2 (zh)
JP (1) JP5867984B2 (zh)
KR (1) KR20090129425A (zh)
CN (2) CN101641438B (zh)
AU (1) AU2008226792B2 (zh)
CA (1) CA2680563A1 (zh)
HK (1) HK1139982A1 (zh)
RU (1) RU2496875C2 (zh)
WO (1) WO2008112258A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106795507A (zh) * 2014-10-30 2017-05-31 诺维信公司 蛋白酶变体以及对其进行编码的多核苷酸
CN107922934A (zh) * 2015-06-17 2018-04-17 丹尼斯科美国公司 具有经修饰的前肽区域的蛋白酶
CN109055288A (zh) * 2018-06-30 2018-12-21 浙江工业大学 一种重组枯草芽孢杆菌及其应用
CN114836408A (zh) * 2022-05-28 2022-08-02 湖北大学 含有前肽突变体的碱性蛋白酶及应用

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2496875C2 (ru) * 2007-03-12 2013-10-27 ДАНИСКО ЮЭс ИНК. Мoдифицированные протеазы
EP2362902B1 (en) * 2008-11-11 2012-10-24 Danisco US, Inc., Genencor Division Compositions and methods comprising a subtilisin variant
CN105238801A (zh) * 2009-04-24 2016-01-13 丹尼斯科美国公司 具有修饰的原区的蛋白酶
IN2012DN00312A (zh) * 2009-07-31 2015-05-08 Danisco Us Inc
GB0915572D0 (en) * 2009-09-07 2009-10-07 Reckitt Benckiser Nv Detergent composition
JP6018044B2 (ja) * 2010-04-15 2016-11-02 ダニスコ・ユーエス・インク プロテアーゼ変異体を含む組成物及び方法
KR102316445B1 (ko) * 2019-11-29 2021-10-26 씨제이제일제당 주식회사 신규 세린 프로테아제 변이체
CN116075593A (zh) * 2020-06-03 2023-05-05 分子组装公司 用于聚脱氧核苷酸合成的经修饰的非模板依赖性酶
WO2023192953A1 (en) 2022-04-01 2023-10-05 Danisco Us Inc. Pro-region mutations enhancing protein production in gram-positive bacterial cells
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4302544A (en) * 1979-10-15 1981-11-24 University Of Rochester Asporogenous mutant of B. subtilis for use as host component of HV1 system
US4450235A (en) * 1982-04-21 1984-05-22 Cpc International Inc. Asporogenic mutant of bacillus subtilis useful as a host in a host-vector system
US4760025A (en) * 1984-05-29 1988-07-26 Genencor, Inc. Modified enzymes and methods for making same
US5310675A (en) * 1983-06-24 1994-05-10 Genencor, Inc. Procaryotic carbonyl hydrolases
EP0134048B2 (en) 1983-07-06 1996-08-14 Gist-Brocades N.V. Molecular cloning and expression in industrial microorganism species
US5801038A (en) * 1984-05-29 1998-09-01 Genencor International Inc. Modified subtilisins having amino acid alterations
US5264366A (en) * 1984-05-29 1993-11-23 Genencor, Inc. Protease deficient bacillus
JP2599946B2 (ja) * 1986-01-15 1997-04-16 アムジェン,インコーポレイテツド ズブチリシン類似体
US4980288A (en) * 1986-02-12 1990-12-25 Genex Corporation Subtilisin with increased thermal stability
JP3026567B2 (ja) 1987-02-27 2000-03-27 ジェネンコー インターナショナル インコーポレイテッド 分子のクローニング及びタンパク分解酵素をコードする遺伝子の発現
US4914031A (en) * 1987-04-10 1990-04-03 Amgen, Inc. Subtilisin analogs
DK6488D0 (da) 1988-01-07 1988-01-07 Novo Industri As Enzymer
PT89702B (pt) * 1988-02-11 1994-04-29 Gist Brocades Nv Processo para a preparacao de novos enzimas proteoliticos e de detergentes que os contem
US5665587A (en) * 1989-06-26 1997-09-09 Novo Nordisk A/S Modified subtilisins and detergent compositions containing same
DK97190D0 (da) * 1990-04-19 1990-04-19 Novo Nordisk As Oxidationsstabile detergentenzymer
US5482849A (en) * 1990-12-21 1996-01-09 Novo Nordisk A/S Subtilisin mutants
DK0583339T3 (da) * 1991-05-01 1999-04-19 Novo Nordisk As Stabiliserede enzymer og detergentsammensætninger
DE4411223A1 (de) * 1994-03-31 1995-10-05 Solvay Enzymes Gmbh & Co Kg Verwendung alkalischer Proteasen in gewerblichen Textilwaschverfahren
WO1998055634A1 (en) 1997-06-04 1998-12-10 The Procter & Gamble Company Protease enzymes for tough cleaning and/or spot and film reduction and compositions incorporating same
RU2252254C2 (ru) * 1997-10-23 2005-05-20 Джененкор Интернэшнл, Инк. Вариант субтилизина bacillus (варианты), кодирующая его днк, экспрессирующий вектор и очищающая композиция
MA25044A1 (fr) 1997-10-23 2000-10-01 Procter & Gamble Compositions de lavage contenant des variants de proteases multisubstituees.
AU2207099A (en) 1997-12-24 1999-07-19 Genencor International, Inc. An improved method of assaying for a preferred enzyme and/or preferred detergentcomposition
US6835550B1 (en) * 1998-04-15 2004-12-28 Genencor International, Inc. Mutant proteins having lower allergenic response in humans and methods for constructing, identifying and producing such proteins
US6376450B1 (en) * 1998-10-23 2002-04-23 Chanchal Kumar Ghosh Cleaning compositions containing multiply-substituted protease variants
US7109016B2 (en) * 2000-08-21 2006-09-19 Novozymes A/S Subtilase enzymes
AU7961401A (en) * 2000-08-21 2002-03-04 Novozymes As Subtilase enzymes
DE10162728A1 (de) * 2001-12-20 2003-07-10 Henkel Kgaa Neue Alkalische Protease aus Bacillus gibsonii (DSM 14393) und Wasch-und Reinigungsmittel enthaltend diese neue Alkalische Protease
DE10163883A1 (de) * 2001-12-22 2003-07-10 Henkel Kgaa Neue Alkalische Protease aus Bacillus sp. (DSM 14390) und Wasch- und Reinigungsmittel enthaltend diese neue Alkalische Protease
WO2003062380A2 (en) * 2002-01-16 2003-07-31 Genencor International, Inc. Multiply-substituted protease variants
EP2339017A3 (en) * 2002-03-29 2011-10-12 Genencor International, Inc. Enhanced protein expression in bacillus
JP4210548B2 (ja) * 2002-06-26 2009-01-21 花王株式会社 アルカリプロテアーゼ
CN101454452B (zh) * 2003-08-06 2014-01-01 马里兰大学生物技术研究所 用于亲和纯化的工程蛋白酶及融合蛋白的加工
CN104232365A (zh) * 2006-07-18 2014-12-24 丹尼斯科美国公司 在宽温度范围内具有活性的蛋白酶变体
RU2496875C2 (ru) * 2007-03-12 2013-10-27 ДАНИСКО ЮЭс ИНК. Мoдифицированные протеазы
CN105238801A (zh) * 2009-04-24 2016-01-13 丹尼斯科美国公司 具有修饰的原区的蛋白酶

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106795507A (zh) * 2014-10-30 2017-05-31 诺维信公司 蛋白酶变体以及对其进行编码的多核苷酸
CN107922934A (zh) * 2015-06-17 2018-04-17 丹尼斯科美国公司 具有经修饰的前肽区域的蛋白酶
CN109055288A (zh) * 2018-06-30 2018-12-21 浙江工业大学 一种重组枯草芽孢杆菌及其应用
CN114836408A (zh) * 2022-05-28 2022-08-02 湖北大学 含有前肽突变体的碱性蛋白酶及应用
CN114836408B (zh) * 2022-05-28 2023-09-19 湖北大学 含有前肽突变体的碱性蛋白酶及应用

Also Published As

Publication number Publication date
US8779112B2 (en) 2014-07-15
WO2008112258A3 (en) 2008-11-20
AU2008226792B2 (en) 2013-06-06
CN103667323B (zh) 2016-02-03
RU2496875C2 (ru) 2013-10-27
RU2009137600A (ru) 2011-04-20
EP2129779B2 (en) 2018-12-26
HK1139982A1 (zh) 2010-09-30
US20090075332A1 (en) 2009-03-19
KR20090129425A (ko) 2009-12-16
CA2680563A1 (en) 2008-09-18
CN101641438B (zh) 2013-12-25
JP2010521152A (ja) 2010-06-24
JP5867984B2 (ja) 2016-02-24
CN103667323A (zh) 2014-03-26
AU2008226792A1 (en) 2008-09-18
WO2008112258A2 (en) 2008-09-18
US20140295526A1 (en) 2014-10-02
EP2129779B1 (en) 2016-03-09
EP2129779A2 (en) 2009-12-09
US9523088B2 (en) 2016-12-20

Similar Documents

Publication Publication Date Title
CN101641438B (zh) 经修饰的蛋白酶
US9593320B2 (en) Proteases with modified pro regions
US10731144B2 (en) Proteases with modified propeptide regions
CN102575242B (zh) 具有经修饰的前原区域的蛋白酶
JP6585602B2 (ja) タンパク質発現の増大

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1139982

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1139982

Country of ref document: HK

CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131225

Termination date: 20170312

CF01 Termination of patent right due to non-payment of annual fee