CN111670244B - 突变的和遗传修饰的芽孢杆菌属细胞及其用于增加蛋白质产生的方法 - Google Patents

突变的和遗传修饰的芽孢杆菌属细胞及其用于增加蛋白质产生的方法 Download PDF

Info

Publication number
CN111670244B
CN111670244B CN201880088437.1A CN201880088437A CN111670244B CN 111670244 B CN111670244 B CN 111670244B CN 201880088437 A CN201880088437 A CN 201880088437A CN 111670244 B CN111670244 B CN 111670244B
Authority
CN
China
Prior art keywords
seq
glct
cell
protein
bacillus licheniformis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880088437.1A
Other languages
English (en)
Other versions
CN111670244A (zh
Inventor
S·德尔蔡斯
C·M·菲奥雷西
R·L·弗里希
H·O·马森
A·范齐蒙耐德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Danisco US Inc
Original Assignee
Danisco US Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Danisco US Inc filed Critical Danisco US Inc
Publication of CN111670244A publication Critical patent/CN111670244A/zh
Application granted granted Critical
Publication of CN111670244B publication Critical patent/CN111670244B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Abstract

本公开总体上涉及能够产生增加量的工业相关目的蛋白的新颖的芽孢杆菌属物种突变体。本公开的某些实施例涉及经修饰的芽孢杆菌属物种细胞,所述经修饰的芽孢杆菌属物种细胞包含引入的编码变体GlcT蛋白质的多核苷酸。其他实施例涉及在经修饰的芽孢杆菌属物种(子代)细胞中产生内源和/或异源目的蛋白的方法和组合物,而某些其他实施例涉及编码本公开的变体GlcT蛋白质的核酸序列,特别是多核苷酸可读框(ORF)序列,其载体及其DNA表达构建体。

Description

突变的和遗传修饰的芽孢杆菌属细胞及其用于增加蛋白质产 生的方法
相关申请的交叉引用
本申请要求2018年1月03日提交的美国临时申请号62/613,339的权益,该临时申请通过引用以其全文特此并入。
技术领域
本公开总体上涉及细菌学、微生物学、遗传学、分子生物学、酶学、工业蛋白质生产等领域。更特别地,本公开的某些实施例涉及能够产生增加量的工业相关目的蛋白的新颖芽孢杆菌属物种(Bacillus sp.)突变体。本公开的其他实施例涉及经修饰的芽孢杆菌属物种细胞,所述经修饰的芽孢杆菌属物种细胞包含引入的编码变体GlcT蛋白质的多核苷酸。其他实施例涉及在经修饰的芽孢杆菌属物种(子代)细胞中产生内源和/或异源目的蛋白的方法和组合物,而某些其他实施例涉及编码本公开的变体GlcT蛋白质的核酸序列,特别是多核苷酸可读框(ORF)序列,其载体及其DNA表达构建体。
序列表的引用
命名为“NB41301_WO_PCT_SEQ.txt”的文本文件序列表的电子提交的内容创建于2018年12月11日,并且大小为137KB,将其通过引用以其全文特此并入。
背景技术
革兰氏阳性细菌如枯草芽孢杆菌、地衣芽孢杆菌(Bacillus licheniformis)和解淀粉芽孢杆菌(Bacillus amyloliquefaciens)等由于其优异的发酵特性和高产率(例如,高达25克/升培养物;Van Dijl和Hecker,2013年)经常被用作用于产生工业相关蛋白质的微生物工厂。例如,枯草芽孢杆菌因其产生食品、纺织品、洗衣、医疗器械清洁、制药工业等所必需的α-淀粉酶(Jensen等人,2000;Raul等人,2014)和蛋白酶(Brode等人,1996)而为人熟知(Westers等人,2004)。由于这些非致病性革兰氏阳性细菌产生完全不含毒性副产物(例如脂多糖;LPS,也称为内毒素)的蛋白质,因此它们已经获得了欧洲食品安全局的“安全资格认定”(QPS)状态,并且其许多产品获得了美国食品和药品管理局的“通常认为安全”(GRAS)状态(Olempska-Beer等人,2006;Earl等人,2008;Caspers等人,2010)。
因此,微生物宿主细胞中蛋白质(例如,酶、抗体、受体等)的产生在生物技术领域中是特别有意义的。同样,用于产生和分泌一种或多种目的蛋白的芽孢杆菌属宿主细胞的优化具有高度相关性,特别是在如下工业生物技术环境中,其中当蛋白质以大的工业产量生产时所述蛋白质产率的微小改善具有重大意义。更特别地,地衣芽孢杆菌(B.licheniformis)和枯草芽孢杆菌(B.subtilis)是具有高工业重要性的示例性芽孢杆菌属物种宿主细胞,因此,对于构建新的和改善的芽孢杆菌属物种产生菌株,高度希望具有遗传修饰和工程化芽孢杆菌属物种宿主细胞以获得增强的/增加的蛋白质表达/产生的能力。因此,本文所述的公开涉及对于获得和构建具有增加的蛋白质产生能力、增加的次级代谢产物产生等的芽孢杆菌属宿主细胞(例如蛋白质产生宿主细胞、细胞工厂)的高度希望和未满足的需求。
发明内容
本公开总体上涉及用于产生和构建具有增加的蛋白质产生能力、增加的次级代谢产物产生能力等的芽孢杆菌属物种(宿主)细胞(例如蛋白质产生宿主细胞、细胞工厂)的组合物和方法。
更特别地,本公开的某些实施例涉及包含glcT基因的亲本地衣芽孢杆菌细胞的突变体,所述glcT基因编码变体GlcT蛋白质,所述变体GlcT蛋白质在SEQ ID NO:55的氨基酸位置67(F67)处包含苯丙氨酸(F)。在某些实施例中,编码SEQ ID NO:55的变体GlcT蛋白质的基因包含核酸序列,所述核酸序列包含与SEQ ID NO 22、SEQ ID NO:81或SEQ ID NO:56的至少90%序列同一性。在其他实施例中,突变体地衣芽孢杆菌细胞进一步包含编码SEQID NO:84的RghR2蛋白质的恢复的rghR2基因(rghR2恢复的)。在其他实施例中,突变体细胞包含引入的编码目的蛋白(POI)的多核苷酸。在某些实施例中,POI是淀粉酶或蛋白酶。在其他实施例中,引入的编码POI的多核苷酸包含有效地连接并且在编码POI的多核苷酸的上游(5′)的SEQ ID NO:63的mod-5′-UTR序列。
在其他实施例中,本公开涉及源自亲本芽孢杆菌属细胞的经遗传修饰的芽孢杆菌属细胞,所述亲本芽孢杆菌属细胞包含编码SEQ ID NO:82的野生型GlcT蛋白质的野生型glcT基因,其中所述经修饰的芽孢杆菌属细胞包含编码GlcT蛋白质的经修饰的glcT基因,所述GlcT蛋白质包含与SEQ ID NO:55的至少90%序列同一性,并且在SEQ ID NO:55的位置67处包含苯丙氨酸(F)。在某些实施例中,用glcT-Cas9靶向载体修饰亲本细胞中编码SEQID NO:82的野生型GlcT蛋白质的野生型glcT基因,其中所述glcT-Cas9靶向载体修饰野生型glcT基因的密码子67,其中经修饰的glcT基因编码GlcT蛋白质,所述GlcT蛋白质包含与SEQ ID NO:55的至少90%序列同一性,并且在SEQ ID NO:55的位置67处包含苯丙氨酸(F)。
因此,在其他实施例中,本公开涉及经遗传修饰的芽孢杆菌属细胞,所述经遗传修饰的芽孢杆菌属细胞包含引入的编码变体GlcT蛋白质的多核苷酸,所述变体GlcT蛋白质包含与SEQ ID NO:55的至少90%序列同一性,并且在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)。在某些实施例中,经修饰的细胞进一步包含灭活的编码GlcT蛋白质的内源染色体glcT基因,所述GlcT蛋白质包含与SEQ ID NO:82的至少90%序列同一性,并且在SEQ ID NO:82的氨基酸位置67处包含亮氨酸(L)(L67)。在其他实施例中,经修饰的芽孢杆菌属细胞是地衣芽孢杆菌属细胞,其中经修饰的地衣芽孢杆菌进一步包含编码SEQ ID NO:84的RghR2蛋白质的恢复的rghR2基因(rghR2恢复的)。在相关实施例中,本公开的经修饰的细胞包含引入的编码异源POI的多核苷酸。在某些实施例中,POI是淀粉酶或蛋白酶。在另一个实施例中,引入的多核苷酸整合到靶向的芽孢杆菌属细胞染色体基因基因座中。在某些其他实施例中,引入的编码POI的多核苷酸包含有效地连接并且在编码POI的多核苷酸序列的上游(5′)的SEQ ID NO:63的mod-5′-UTR序列。
在其他实施例中,本公开涉及源自亲本芽孢杆菌属细胞的经修饰的芽孢杆菌属细胞,所述亲本芽孢杆菌属细胞包含编码野生型GlcT蛋白质的glcT基因,所述野生型GlcT蛋白质在SEQ ID NO:82的氨基酸位置67处包含亮氨酸(L)(L67),其中所述经修饰的芽孢杆菌属细胞包含编码变体GlcT蛋白质的经修饰的glcT基因,所述变体GlcT蛋白质在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67),其中所述经修饰的芽孢杆菌属细胞(相对于产生相同的POI的亲本细胞)产生增加量的目的蛋白(POI)。因此,在某些实施例中,经修饰的细胞包含引入的编码异源POI的DNA构建体,其中所述经修饰的芽孢杆菌属细胞(相对于产生相同的异源POI的亲本细胞)产生增加量的异源POI。在其他实施例中,经修饰的细胞进一步包含编码SEQ ID NO:84的RghR2蛋白质的恢复的rghR2基因。在某些实施例中,POI是淀粉酶或蛋白酶。在某些其他实施例中,引入的编码POI的DNA构建体包含有效地连接的在DNA构建体的上游(5′)的SEQ ID NO:63的经修饰的5′-UTR序列。
在其他实施例中,本公开涉及编码变体芽孢杆菌属物种GlcT(抗终止)蛋白质的分离的多核苷酸可读框(ORF),所述变体GlcT蛋白质在SEQ ID NO:55的氨基酸位置67处包含亮氨酸(L)至苯丙氨酸(F)的取代(L67F)。在某些实施例中,变体蛋白质与SEQ ID NO:55具有95%或更大序列同一性,并且在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)。在其他实施例中,ORF包含与SEQ ID NO:56具有至少95%序列同一性的核酸序列。
因此,某些实施例涉及包含多核苷酸的载体,所述多核苷酸编码SEQ ID NO:55的变体GlcT蛋白质。在其他实施例中,载体包含有效地连接(5′)至ORF序列的上游(5′)同源区(5′-HR)和/或有效地连接(3′)至ORF序列的下游(3′)同源区(3′-HR),其中所述5′-HR和/或3′-HR与芽孢杆菌属物种宿主细胞的靶向的基因组基因座具有足够的同源性,当载体被转化到感受态芽孢杆菌属物种宿主细胞中时,以通过同源重组实现将载体整合到靶向的基因组基因座中。
在其他实施例中,本公开涉及包含多核苷酸ORF的表达构建体,所述多核苷酸ORF编码SEQ ID NO:55的变体GlcT蛋白质。在某些实施例中,构建体包含在芽孢杆菌属物种细胞中起作用的启动子核酸序列,其中所述启动子序列有效地连接并且在ORF序列的上游(5′)。在其他实施例中,构建体进一步包含SEQ ID NO:63的经修饰的枯草芽孢杆菌aprE5′-非翻译区序列(5′-UTR),其中所述经修饰的5′-UTR在启动子序列下游(3′)并有效地连接至启动子序列,以及在ORF序列上游(5′)并有效地连接至ORF序列。在某些其他实施例中,构建体进一步包含在ORF序列下游(3′)并有效地连接至ORF序列的终止子序列。
在其他实施例中,本公开涉及在亲本地衣芽孢杆菌细胞的突变体中产生增加量的目的蛋白(POI)的方法,所述方法包括(a)获得包含glcT基因的亲本地衣芽孢杆菌细胞的突变体,所述glcT基因编码GlcT蛋白质,所述GlcT蛋白质在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67),并且向突变体细胞中引入编码异源POI的多核苷酸构建体,(b)在适于产生POI的培养基中培养步骤(a)的突变体细胞,以及(c)从培养基回收POI,其中,当在相同条件下培养时,所述突变体地衣芽孢杆菌细胞相对于产生相同的POI的亲本地衣芽孢杆菌细胞,产生增加量的POI。
其他实施例涉及在经修饰的芽孢杆菌属细胞(源自未经修饰的芽孢杆菌属亲本细胞)中产生增加量的目的蛋白(POI)的方法,所述方法包括(a)获得包含内源染色体glcT基因的亲本芽孢杆菌属细胞,所述内源染色体glcT基因编码野生型GlcT蛋白质,所述野生型GlcT蛋白质在SEQ ID NO:82的氨基酸位置67处包含亮氨酸(L)(L67)并通过引入(i)编码变体GlcT蛋白质的多核苷酸和(ii)编码POI的多核苷酸来修饰亲本细胞,其中所述变体GlcT蛋白质包含与SEQ ID NO:55的至少90%序列同一性并在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67),(b)在适于产生POI的培养基中培养步骤(a)的细胞,以及(c)从培养基回收POI,其中,当在相同条件下培养时,所述经修饰的芽孢杆菌属细胞相对于产生相同的POI的亲本细胞,产生增加量的POI。在某些其他实施例中,引入的编码GlcT变体蛋白质的多核苷酸通过同源重组整合到染色体glcT基因基因座中,从而置换和消除编码SEQ IDNO:82的GlcT蛋白质的内源染色体glcT基因。
在另一个实施例中,本公开涉及在经修饰的芽孢杆菌属细胞(源自未经修饰的芽孢杆菌属亲本细胞)中产生增加量的目的蛋白(POI)的方法,所述方法包括(a)获得包含内源染色体glcT基因的亲本芽孢杆菌属细胞,所述内源染色体glcT基因编码野生型GlcT蛋白质,所述野生型GlcT蛋白质在SEQ ID NO:82的氨基酸位置67处包含亮氨酸(L)(L67),(b)用glcT-Cas9靶向载体修饰步骤(a)的亲本细胞,其中所述glcT-Cas9靶向载体修饰野生型glcT基因的密码子67,其中经修饰的glcT基因编码GlcT蛋白质,所述GlcT蛋白质包含与SEQID NO:55的至少90%序列同一性并在SEQ ID NO:55的位置67处包含苯丙氨酸(F),(c)在适于产生POI的培养基中培养步骤(b)的经修饰的细胞,以及(c)从培养基回收POI,其中,当在相同条件下培养时,所述经修饰的芽孢杆菌属细胞相对于产生相同的POI的亲本细胞,产生增加量的POI。在某些实施例中,POI是内源POI或异源POI。在特定的实施例中,POI是异源POI。
附图说明
图1展示了glcT野生型(SEQ ID NO:22)和glcT突变体(SEQ ID NO:56)核酸序列(分别编码GlcT野生型(SEQ ID NO:82)和GlcT变体(SEQ ID NO:55)蛋白质序列)的核酸序列比对(图1A)和氨基酸序列比对(图1B)。更特别地,图1A示出了编码野生型GlcT蛋白质(SEQ ID NO:82)的地衣芽孢杆菌ORF(SEQ ID NO:22)相对于编码变体GlcT蛋白质(SEQ IDNO:55)的突变体地衣芽孢杆菌ORF(SEQ ID NO:56)的核酸序列比对。例如,如图1A中所示,两个比对的ORF序列(SEQ ID NO:22对比SEQ ID NO:56)差别在于在核苷酸位置199处的单一核苷酸多态性(SNP),其中SEQ ID NO:22的位置199处包含胞嘧啶(C)并且SEQ ID NO:56的位置199处包含胸腺嘧啶(T);例如,参见图1A在位置199处黑框的核苷酸(C)和(T)。类似地,图1B示出了编码的野生型GlcT蛋白质(SEQ ID NO:82)和编码的变体GlcT蛋白质(SEQID NO:55)的比对,其中在SEQ ID NO:56的位置199处的(C)至(T)SNP(参见图1A)导致在SEQID NO:55的氨基酸残基位置67处的亮氨酸(L)至苯丙氨酸(F)取代(例如,参见图1B,分别在SEQ ID NO:22和SEQ ID NO:55的残基位置67处的黑框的(L)和(F)氨基酸)。
图2示出了在微量滴定板中的标准化α-淀粉酶Ceralpha活性(图2A)和α-淀粉酶比生产力(图2B),其中筛选出芽孢杆菌宿主细胞BF117(WT glcT+mod-5′-UTR)、BF134(WTglcT+WT-5′-UTR)、HM150-1(变体glcT1+mod-5′-UTR)和HM151(变体glcT1+WT-5′-UTR)。如图2B中所呈现的,宿主细胞HM151(变体glcT1+WT-5′-UTR)的标准化α-淀粉酶Qp,相对于宿主细胞BF134(WT glcT+WT-5′-UTR)或BF117(WT glcT+mod-5′-UTR)的α-淀粉酶Qp,增加了大约4%-5%。此外,如图2B中所呈现的,芽孢杆菌宿主细胞HM150-1(变体glcT1+mod-5′-UTR)的α-淀粉酶Qp,相对于宿主细胞BF134(WT glcT+WT-5′-UTR)或BF117(WT glcT+mod-5′-UTR)的α-淀粉酶Qp增加了大约9%,并且相对于宿主细胞HM151(变体glcT1+WT-5′-UTR)的α-淀粉酶Qp增加了大约4%-5%。
生物学序列简述
SEQ ID NO:1是编码Cas9蛋白质的合成的核酸序列。
SEQ ID NO:2是N-末端核定位信号(NLS)序列的氨基酸序列。
SEQ ID NO:3是C-末端NLS序列的氨基酸序列。
SEQ ID NO:4是包含十-组氨酸(10-H)标签的氨基酸序列。
SEQ ID NO:5是包含枯草芽孢杆菌aprE启动子的核酸序列。
SEQ ID NO:6是Cas9正向引物核酸序列。
SEQ ID NO:7是Cas9反向引物核酸序列。
SEQ ID NO:8是质粒pKB320主链的核酸序列。
SEQ ID NO:9是质粒pKB320的核酸序列。
SEQ ID NO:10是pKB320正向引物核酸序列。
SEQ ID NO:11是pKB320反向引物核酸序列。
SEQ ID NO:12是Cas9“反向测序引物1”核酸序列。
SEQ ID NO:13是Cas9“反向测序引物2”核酸序列。
SEQ ID NO:14是Cas9“正向测序引物1”核酸序列。
SEQ ID NO:15是Cas9“正向测序引物2”核酸序列。
SEQ ID NO:16是Cas9“正向测序引物3”核酸序列。
SEQ ID NO:17是Cas9“正向测序引物4”核酸序列。
SEQ ID NO:18是Cas9“正向测序引物5”核酸序列。
SEQ ID NO:19是Cas9“正向测序引物6”核酸序列。
SEQ ID NO:20是Cas9“正向测序引物7”核酸序列。
SEQ ID NO:21是pRF694的核酸序列。
SEQ ID NO:22是地衣芽孢杆菌野生型glcT ORF序列。
SEQ ID NO:23是地衣芽孢杆菌glcT基因靶位点的核酸序列。
SEQ ID NO:24是编码glcT VT结构域的合成的核酸序列。
SEQ ID NO:25(AGG)是地衣芽孢杆菌glcT靶位点的三核苷酸PAM序列。
SEQ ID NO:26是编码Cas9核酸内切酶识别结构域的合成的核酸序列。
SEQ ID NO:27是包含glcT指导RNA(gRNA)核酸序列的合成的RNA序列
SEQ ID NO:28是编码glcT gRNA的合成的DNA序列。
SEQ ID NO:29是包含rrnIp2启动子序列的枯草芽孢杆菌核酸序列。
SEQ ID NO:30是λ噬菌体t0终止子核酸序列。
SEQ ID NO:31是包含glcT gRNA表达盒的核酸序列。
SEQ ID NO:32是包含500bp(同源臂)的地衣芽孢杆菌核酸序列,其在编码氨基酸残基位置67处的亮氨酸(L)(L67)的核苷酸位置199的上游(5')。
SEQ ID NO:33是glcT 5′正向引物核酸序列。
SEQ ID NO:34是glcT 5′反向引物核酸序列。
SEQ ID NO:35是包含500bp(同源臂)的地衣芽孢杆菌核酸序列,其在编码氨基酸残基位置67处的亮氨酸(L)(L67)的核苷酸位置199的下游(3')。
SEQ ID NO:36是glcT 3′正向引物核酸序列。
SEQ ID NO:37是glcT 3′反向引物核酸序列。
SEQ ID NO:38是pRF731的核酸序列。
SEQ ID NO:39是pRF724的核酸序列。
SEQ ID NO:40是包含rghR2基因密码子24-29的重复的地衣芽孢杆菌核酸序列。
SEQ ID NO:41是包含具有重复的rghR2基因的地衣芽孢杆菌rghR2核酸序列
SEQ ID NO:42是pRF694的8.3kb PCR产物。
SEQ ID NO:43是pRF694正向引物。
SEQ ID NO:44是pRF694反向引物。
SEQ ID NO:45是合成的rghR2编辑模板gRNA盒。
SEQ ID NO:46是合成的rghR2核酸序列编辑模板。
SEQ ID NO:47是rghR2 gRNA表达盒。
SEQ ID NO:48是rghR2盒正向引物。
SEQ ID NO:49是rghR2盒反向引物。
SEQ ID NO:50是包含质粒pBL.comK的核酸序列。
SEQ ID NO:51是地衣芽孢杆菌glcT基因基因座。
SEQ ID NO:52是合成的glcT基因座正向引物。
SEQ ID NO:53是合成的glcT基因座反向引物。
SEQ ID NO:54是合成的glcT基因座正向测序引物。
SEQ ID NO:55是由SEQ ID NO:56的glcT ORF编码的变体GlcT(L67F)蛋白质的氨基酸序列。
SEQ ID NO:56是包含突变体glcT ORF(C199T)的合成的核酸序列,所述突变体glcT ORF(C199T)编码SEQ ID NO:55的变体GlcT(L67F)蛋白质。
SEQ ID NO:57是包含rghr2基因座的地衣芽孢杆菌核酸序列。
SEQ ID NO:58是合成的rghR2基因座正向引物。
SEQ ID NO:59是合成的rghR2基因座反向引物。
SEQ ID NO:60是合成的rghR2基因座测序引物。
SEQ ID NO:61是包含rghR2恢复的基因座的地衣芽孢杆菌核酸序列。
SEQ ID NO:62是包含aprE 5′-UTR的枯草芽孢杆菌核酸序列。
SEQ ID NO:63是包含经修饰的aprE 5′-UTR的合成的核酸序列,下文称为“aprEmod-5'UTR”
SEQ ID NO:64是包含野生型5′-UTR(WT 5′-UTR)表达构建体的合成的核酸序列。
SEQ ID NO:65是包含经修饰的5'-UTR表达构建体的合成的核酸序列。
SEQ ID NO:66是包含5′catH同源臂的地衣芽孢杆菌核酸序列。
SEQ ID NO:67是包含catH基因的地衣芽孢杆菌核酸序列。
SEQ ID NO:68是包含spoVGrrnIp杂合启动子的合成的核酸序列。
SEQ ID NO:69是包含lat信号序列的地衣芽孢杆菌核酸序列。
SEQ ID NO:70是编码变体嗜热脂肪土芽孢杆菌(G.stearothermophilus)α-淀粉酶的嗜热脂肪土芽孢杆菌核酸序列。
SEQ ID NO:71是包含lat终止子的地衣芽孢杆菌核酸序列。
SEQ ID NO:72是包含3′catH同源臂的地衣芽孢杆菌核酸序列。
SEQ ID NO:73是变体嗜热脂肪土芽孢杆菌α-淀粉酶的氨基酸序列。
SEQ ID NO:74是包含野生型catH基因座构建体的合成的核酸序列。
SEQ ID NO:75是包含经修饰的5'-UTR catH基因座构建体的合成的核酸序列。
SEQ ID NO:76是合成的catH基因座正向引物。
SEQ ID NO:77是合成的catH基因座反向引物。
SEQ ID NO:78是合成的catH正向测序引物1。
SEQ ID NO:79是合成的catH正向测序引物2。
SEQ ID NO:80是合成的catH正向测序引物3。
SEQ ID NO:81是包含地衣芽孢杆菌野生型glcT基因(其编码SEQ ID NO:82的野生型GlcT蛋白质)的核酸序列。
SEQ ID NO:82是地衣芽孢杆菌野生型GlcT蛋白质的氨基酸序列,其由SEQ ID NO:22的地衣芽孢杆菌glcT ORF或SEQ ID NO:81的地衣芽孢杆菌glcT基因编码。
SEQ ID NO:83是地衣芽孢杆菌变体RghR2蛋白质的氨基酸序列,所述地衣芽孢杆菌变体RghR2蛋白质包含六个氨基酸(AAAISR)的重复:A32A33A34I35S36R37-A38A39A40I41S42R43
SEQ ID NO:84是恢复的(天然)地衣芽孢杆菌RghR2蛋白质的氨基酸序列。
具体实施方式
本公开总体上涉及用于产生和构建具有增加的蛋白质产生能力、增加的次级代谢产物产生能力等的芽孢杆菌属物种(宿主)细胞(例如蛋白质产生宿主细胞、细胞工厂)的组合物和方法。更特别地,本公开的某些实施例涉及包含glcT基因的突变体芽孢杆菌属物种细胞,所述glcT基因编码变体GlcT(转录抗终止)蛋白质,所述变体GlcT(转录抗终止)蛋白质在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)。某些其他实施例涉及包含引入的多核苷酸的遗传修饰的芽孢杆菌属物种细胞,所述引入的多核苷酸编码变体GlcT蛋白质,所述体GlcT蛋白质在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)。
本公开的其他实施例涉及包含经编辑的(经修饰的)glcT基因的经修饰的芽孢杆菌属物种细胞,所述编辑的(经修饰的)glcT基因编码变体GlcT蛋白质,所述变体GlcT蛋白质在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)。例如,本公开的某些实施例(实例2)涉及包含经Cas9编辑的(经修饰的)glcT基因的glcT Cas9靶向载体和其经修饰的芽孢杆菌属细胞,所述Cas9编辑的(经修饰的)glcT基因编码变体GlcT蛋白质,所述变体GlcT蛋白质在SEQ ID NO:55的氨基酸位置67(F67)处包含苯丙氨酸(F)。
在某些其他实施例中,本公开涉及经修饰的芽孢杆菌属(子代)细胞,其包含灭活的(内源)天然染色体glcT基因(即,编码野生型GlcT蛋白质,所述野生型GlcT蛋白质在SEQID NO:82的氨基酸位置67处包含亮氨酸(L)(L67))并且包含编码变体GlcT蛋白质的引入的多核苷酸,所述变体GlcT蛋白质在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)。因此,在某些实施例中,本公开涉及此类经修饰的芽孢杆菌属细胞(例如,包含编码GlcT蛋白质的经修饰的glcT基因,所述GlcT蛋白质在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)),其中所述经修饰的芽孢杆菌属细胞相对于其源自的亲本细胞(即,表达/产生相同的POI),产生增加量的目的蛋白(POI)。
在某些其他实施例中,本公开涉及包含可读框(ORF)的分离的多核苷酸,所述可读框(ORF)编码变体芽孢杆菌属物种GlcT(抗终止)蛋白质,所述变体GlcT蛋白质在SEQ IDNO:55的氨基酸位置67处包含亮氨酸(L)至苯丙氨酸(F)的取代(L67F)。在相关实施例中,多核苷酸ORF编码变体GlcT蛋白质,所述变体GlcT蛋白质包含与SEQ ID NO:55或SEQ ID NO:82的至少约80%、85%、90%、95%、96%、97%、98%或99%序列同一性,并且在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)。在另一个实施例中,多核苷酸包含核酸序列,所述核酸序列与SEQ ID NO:22、SEQ ID NO:81或SEQ ID NO:56具有至少约80%、85%、90%、95%、96%、97%、98%或99%序列同一性,其中所述多核苷酸编码变体GlcT蛋白质,所述变体GlcT蛋白质在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)。
在其他实施例中,本公开涉及包含编码本公开的变体GlcT蛋白质的多核苷酸的载体、DNA表达构建体等。例如,在某些实施例中,包含编码变体GlcT蛋白质的ORF的载体进一步包含有效地连接(5′)至ORF序列的上游(5′)同源区(5′-HR)和/或有效地连接(3′)至ORF序列的下游(3′)同源区(3′-HR),其中所述5′-HR和/或3′-HR与芽孢杆菌属(宿主)细胞的靶向的基因组基因座具有足够的同源性,以通过同源重组实现将载体整合到靶向的基因组基因座中(即,当载体被转化到感受态芽孢杆菌属细胞中时)。例如,在某些实施例中,将此类载体引入到包含具有可读框(ORF)的glcT基因的亲本芽孢杆菌属细胞中,所述可读框(ORF)编码SEQ ID NO:82的野生型GlcT蛋白质(即,在SEQ ID NO:82的氨基酸位置67处包含亮氨酸(L)(L67)),其中所述引入的载体包含ORF,所述ORF编码SEQ ID NO:55的变体GlcT蛋白质(即,在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)),将所述ORF以5′-HR和/或3′-HR为侧翼,所述5′-HR和/或3′-HR与紧邻glcT基因ORF染色体基因座的上游(5′)和/或紧邻glcT基因ORF染色体基因座的下游(3′)的亲本芽孢杆菌(内源)核酸序列具有足够的同源性,以通过同源重组实现将载体整合,从而缺失编码SEQ ID NO:82的GlcT蛋白质的ORF并且置换编码SEQ ID NO:55的GlcT蛋白质的ORF。
因此,如上所述,本公开的某些实施例涉及此类产生增加量的一种或多种目的蛋白的遗传修饰的芽孢杆菌属(子代)细胞(即,相对于产生相同目的蛋白的芽孢杆菌属亲本细胞,其中在相似条件下培养所述子代和亲本细胞)。更特别地,如本公开的实例部分中所述(例如,参见实例1),申请人进行常规NTG诱变以创建地衣芽孢杆菌突变体库(即,芽孢杆菌属子代细胞),随后筛选NTG修饰的(突变体)子代细胞以鉴定地衣芽孢杆菌(突变体)子代细胞突变,其可以增加工业相关目的蛋白(例如,淀粉酶、蛋白酶等)的产生。如实例1中所呈现的,鉴定出了能够产生增加量的淀粉酶蛋白质的具体地衣芽孢杆菌(突变体)子代细胞,其中所述(突变体)子代细胞与其亲本的不同之处在于在编码变体GlcT蛋白质的基因中的单一核苷酸多态性(SNP)。更特别地,亲本地衣芽孢杆菌细胞包含glcT基因,所述glcT基因编码SEQ ID NO:82的野生型GlcT蛋白质(在SEQ ID NO:82的位置67处包含亮氨酸(L)氨基酸),而地衣芽孢杆菌(突变体)子代细胞包含glcT基因,所述glcT基因编码SEQ ID NO:55的变体GlcT蛋白质(在SEQ ID NO:55的位置67处包含苯丙氨酸(F)氨基酸)。
此外,如实例2中所呈现的,申请人构建某些glcT Cas9靶向载体,其将密码子67的第一位置从CTC改变至TTC(即,glcT基因的密码子67),从而将密码子67从亮氨酸(L)转化为苯丙氨酸(F)。如实例3中呈现并描述的,将此类glcT Cas9靶向载体转化到感受态(亲本)地衣芽孢杆菌细胞中以产生并选择包含Cas9编辑的glcT基因的经修饰的地衣芽孢杆菌(子代)细胞,经其修饰的细胞编码包含L67F取代的变体GlcT蛋白质。例如,如在实例3中所述,将测序数据与野生型glcT基因座进行比较的序列比对揭示了一些回收的菌落含有所希望的引起GlcT蛋白质(SEQ ID NO:55)的L67F突变的基因组编辑。更特别地,含有编码L67FGlcT蛋白质(SEQ ID NO:55)的经修饰的/编辑的glcT基因(SEQ ID NO:56)(在本文中称为等位基因“glcT1”)的地衣芽孢杆菌菌落以菌株BF63(glcT1 pBL.comK)存储。
在某些其他实施例中,本公开的包含编码变体GlcT蛋白质的经修饰的glcT基因(例如,等位基因glcT1)的经修饰的地衣芽孢杆菌(子代)细胞进一步包含恢复突变/变体rghr2基因的遗传修饰。例如,于2017年2月24日提交的申请人的未决的美国临时专利申请序列号62/463,268(通过引用以其整体并入本文)充分描述了此类包含恢复的rghr2基因(下文称为“rghr2恢复的”)的经修饰的地衣芽孢杆菌(宿主)细胞以及产生其的方法。更特别地,如以上引用的临时申请中所述,将某些地衣芽孢杆菌菌株/宿主细胞的基因组进行测序,其揭示了这些测序的菌株在rghr2基因中包含18核苷酸(18-bp)的重复(即,重复),其中此18-核苷酸(重复)序列编码氨基酸“AAAISR”,使得变体RghR2蛋白质包含AAAISR氨基酸序列的重复(即,AAAISR-AAAISR)。此外,如以上引用的申请中所述,经遗传修饰以去除18-bp重复的地衣芽孢杆菌(子代)细胞(称为rghr2恢复的)与(相对比)包含18-bp重复的亲本地衣芽孢杆菌细胞(非恢复的rghr2)相比,能够产生增加量的工业相关蛋白质。
因此,在某些实施例中,本公开的经修饰的地衣芽孢杆菌细胞包含编码变体GlcT蛋白质的经修饰的glcT基因。在某些其他实施例中,本公开的经修饰的地衣芽孢杆菌细胞包含经修饰的glcT基因和经修饰的rghr2基因(即,rghr2恢复的)。更特别地,如本公开的实例4-6中所呈现的,申请人进一步构建了rghr2 Cas9靶向载体(实例4),并产生了经修饰的地衣芽孢杆菌(子代)细胞(包含恢复的rghr2等位基因(即,rghr2恢复的;实例5,BF62细胞))和经修饰的芽孢杆菌属(子代)细胞(包含恢复的rghr2等位基因和经修饰的glcT等位基因(即,rghr2恢复的和经修饰的glcT等位基因;实例6,BF169细胞))。
如本公开的实例7中所述,将异源α-淀粉酶表达盒引入到亲本和经修饰的地衣芽孢杆菌(子代)细胞BF62、BF63和BF169中(例如,参见表17)。更特别地,构建实例7中呈现的α-淀粉酶表达盒,从而另外测试有效地连接的“野生型-5′-UTR序列”相比于有效地连接的“经修饰的-5′-UTR序列”对异源α-淀粉酶的表达/产生的作用。因此,α-淀粉酶表达盒包含有效地连接至上游(5′)启动子和编码α-淀粉酶的下游(3′)可读框的野生型枯草芽孢杆菌aprE 5′-UTR(SEQ ID NO:62)或经修饰的-5′-UTR(SEQ ID NO:63)。因此,筛选出在实例7中构建的亲本和经修饰的地衣芽孢杆菌细胞(包含并表达异源α-淀粉酶表达盒)用于产生实例8中的α-淀粉酶。
如实例8(表18)中所呈现的,筛选出以下地衣芽孢杆菌细胞用于α-淀粉酶产生:(i)地衣芽孢杆菌细胞,其包含引入的“WT-5′-UTRα-淀粉酶表达盒”(SEQ ID NO:62),在本文中称为菌株/细胞“BF134”,(ii)地衣芽孢杆菌细胞,其包含引入的“经修饰的-5′-UTRα-淀粉酶表达盒”(SEQ ID NO:63),在本文中称为菌株/细胞“BF117”,(iii)地衣芽孢杆菌细胞,其包含等位基因glcT1和引入的“WT-5′-UTRα-淀粉酶表达盒”(SEQ ID NO:62),在本文中称为菌株/细胞“HM151”,以及(iv)地衣芽孢杆菌细胞,其包含等位基因glcT1和引入的“经修饰的-5′-UTRα-淀粉酶表达盒”(SEQ ID NO:63),在本文中称为菌株/细胞“HM150-1”。此外,如图2A和图2B中所呈现的,来自包含等位基因glcT1的芽孢杆菌宿主细胞(即,HM150-1和HM151细胞)相对于包含野生型glcT基因的芽孢杆菌宿主细胞(即,BF117和BF134细胞),在α-淀粉酶活性和比生产力方面具有显著增加。
如上简述,本公开的某些其他实施例涉及经修饰的地衣芽孢杆菌细胞,其包含等位基因glcT1并进一步包含恢复的rghr2基因(rghr2恢复的)。例如,如本公开的实例9中所呈现的,筛选出经修饰的芽孢杆菌属细胞BF118(rghr2恢复的+mod-5′-UTR淀粉酶盒)、BF171(rghr2恢复的+glcT1+mod-5′-UTR淀粉酶盒)、BF169(rghr2恢复的+WT-5′-UTR淀粉酶盒)和BF260(rghr2恢复的+glcT1+WT-5′-UTR淀粉酶盒)用于小规模淀粉酶产生,其中相关的芽孢杆菌属细胞BF171和BF260的淀粉酶产生与芽孢杆菌属细胞BF118和BF169的淀粉酶产生相比显著地增加。
因此,在本公开的某些其他实施例中涉及包含本公开的ORF的DNA表达构建体,其中所述DNA构建体进一步包含在芽孢杆菌属物种细胞中起作用的启动子核酸序列,其中所述启动子序列有效地连接并在ORF序列的上游(5′)。在某些实施例中,DNA构建体进一步包含SEQ ID NO:63的经修饰的枯草芽孢杆菌aprE 5′-非翻译区序列(mod-5′-UTR),其中所述mod-5′-UTR在启动子序列下游(3′)并有效地连接至启动子序列,以及在ORF序列上游(5′)并有效地连接至ORF序列。在另一个实施例中,DNA构建体进一步包含在ORF序列下游(3′)并有效地连接至ORF序列终止子序列。
本公开的其他实施例涉及用于在本公开的经修饰的芽孢杆菌(宿主)细胞中产生增加量的内源目的蛋白(POI)和/或异源POI的组合物和方法。例如,在某些实施例中,在本公开的经修饰的芽孢杆菌属(宿主)细胞中产生增加量的内源目的蛋白(POI)的方法包括(a)在适于产生内源POI的培养基中培养包含glcT基因的经修饰的芽孢杆菌属(宿主)细胞,所述glcT基因编码GlcT蛋白质,所述GlcT蛋白质在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67),以及(b)从培养基中回收内源POI,其中,当在相同条件下培养时,所述经修饰的芽孢杆菌属细胞相对于产生相同的内源POI的未经修饰的(亲本)芽孢杆菌属细胞,产生增加量的内源POI。
在某些其他实施例中,本公开涉及在本公开的经修饰的芽孢杆菌属(宿主)细胞中产生增加量的异源POI的方法,所述方法包括(a)在适于产生异源POI的培养基中培养包含经修饰的glcT基因的经修饰的芽孢杆菌属(宿主)细胞,所述经修饰的glcT基因编码变体GlcT蛋白质(即,在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)),其中所述修饰的细胞和亲本细胞包含引入的多核苷酸序列,所述多核苷酸序列指导异源POI的合成,以及(b)从培养基中回收异源POI,其中,当在相同条件下培养时,所述经修饰的芽孢杆菌属细胞相对于亲本芽孢杆菌属细胞(即,包含编码SEQ ID NO:82的野生型GlcT蛋白质的野生型glcT基因)产生增加量的异源POI。
因此,本公开的某些其他实施例涉及用于构建此类能够产生增加量的异源和/或内源目的蛋白的经修饰的芽孢杆菌属细胞的组合物和方法。例如,某些组合物和方法涉及经修饰的芽孢杆菌属(子代)细胞(源自未经修饰的芽孢杆菌属(亲本)细胞),所述方法包括(a)获得包含内源染色体野生型glcT基因的亲本芽孢杆菌属细胞,所述内源染色体野生型glcT基因编码GlcT蛋白质,所述GlcT蛋白质包含与SEQ ID NO:82的至少90%序列同一性并且在SEQ ID NO:82的氨基酸位置67处包含亮氨酸(L)(L67),(b)通过引入多核苷酸序列来修饰步骤(a)的亲本细胞,所述多核苷酸序列指导变体GlcT蛋白质的合成,所述变体GlcT蛋白质包含与SEQ ID NO:55的90%序列同一性,在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67),以及(c)在适于产生POI的培养基中培养经修饰的地衣芽孢杆菌(子代)细胞,其中所述经修饰的地衣芽孢杆菌(子代)细胞,当在相同条件下培养子代和亲本细胞时,相对于产生相同的POI的亲本地衣芽孢杆菌细胞,产生增加量的POI。因此,在某些其他实施例中,本公开的经修饰的芽孢杆菌属(子代)细胞源自未经修饰的芽孢杆菌属(亲本)细胞,其中将亲本细胞中的内源染色体野生型glcT基因(即,在SEQ ID NO:82的氨基酸位置67处包含亮氨酸(L)(L67))通过Cas9靶向载体的方式进行修饰,其中编辑的(经修饰的)glcT基因编码变体GlcT蛋白质,所述变体GlcT蛋白质在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)。因此,本公开的某些实施例涉及Cas9编辑的基因,其包括但不限于Cas9编辑的glcT基因、Cas9编辑的rghr2基因、其组合等。
在某些实施例中,POI是异源POI,其中将指导异源POI的合成的多核苷酸序列引入到子代和亲本细胞中。在其他实施例中,POI是内源或异源酶。
I.定义
鉴于产生一种或多种异源和/或内源目的蛋白的经修饰的芽孢杆菌属物种细胞和其本文所述的方法,定义了以下术语和短语。在此未定义的术语应当符合本领域中所使用的常规含义。
除非另有定义,本文使用的所有技术和科学术语具有与本发明组合物和方法所属领域的普通技术人员通常理解的相同含义。虽然类似于或等同于本文描述的那些的任何方法和材料也可以用于本发明组合物和方法的实践或测试中,但现在将对代表性示例方法和材料进行描述。在本文中引用的所有公开物和专利均通过引用以其整体特此结合。
进一步注意的是,权利要求书可以撰写以排除任何可选择的要素。因此,此陈述旨在作为使用与权利要求要素的叙述有关的排他性术语如“单独”、“仅”、“排除”、“不包括”等或使用“否定型”限定的前提基础(或其条件是)。
如将对于本领域技术人员显而易见的是,在阅读本公开时,本文描述和展示的单独实施例中的每一个具有离散的组分和特征,这些组分和特征可以在不偏离本文所述的本发明组合物和方法的范围或精神的情况下容易地与任何其他若干个实施例的任何一个的特征分离或组合。可以按照所叙述的事件的顺序或按照逻辑上可行的任何其他顺序来进行任何叙述的方法。
如本文所使用的,“宿主细胞”是指具有作为新引入的DNA的宿主或表达载体的能力的细胞。因此,在本公开的某些实施例中,宿主细胞是芽孢杆菌属物种细胞或大肠杆菌(E.coli)细胞。
如本文所定义的,“亲本细胞”、“亲本(宿主)细胞”可以互换地使用,并且是指“未经修饰的”亲本细胞。例如,“亲本”细胞是指其中“亲本”细胞的基因组被改变(例如,经由引入亲本细胞中的一个或多个突变/修饰)以产生其经修饰的“子代”细胞的微生物的任何细胞或菌株。
如本文所使用的,“经修饰的细胞”、“经修饰的(宿主)细胞”可以互换地使用并且是指包含至少一个遗传修饰的重组(宿主)细胞,所述遗传修饰不存在于源自经修饰的细胞的“亲本”宿主细胞中。
在某些实施例中,“未经修饰的”(亲本)细胞可以被称为“对照细胞”,特别是当与“经修饰的”的芽孢杆菌属物种(子代)细胞进行比较或相对于“经修饰的”的芽孢杆菌属物种(子代)细胞时。如本文所使用的,当将“未经修饰的”(亲本)细胞(例如,对照细胞)中的目的蛋白(POI)的表达和/或产生与“经修饰的”(子代)细胞中的相同POI的表达和/产生相比较时,应该理解的是,在相同的条件下(例如,相同的条件如培养基、温度、pH等)生长/培养/发酵“经修饰的”和“未经修饰的”细胞。
如本文所使用的,“芽孢杆菌属”或“芽孢杆菌属物种”包括如本领域技术人员已知的“芽孢杆菌”属内的所有物种,包括但不限于:枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌(B.lentus)、短芽孢杆菌(B.brevis)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、嗜碱芽孢杆菌(B.alkalophilus)、解淀粉芽孢杆菌、克劳氏芽孢杆菌(B.clausii)、耐盐芽孢杆菌(B.halodurans)、巨大芽孢杆菌(B.megaterium)、凝结芽孢杆菌(B.coagulans)、环状芽孢杆菌(B.circulans)、灿烂芽孢杆菌(B.lautus)和苏云金芽孢杆菌(B.thuringiensis)。应认识到,芽孢杆菌属不断进行分类学重组。因此,该属旨在包括已重新分类的物种,包括但不限于:例如嗜热脂肪芽孢杆菌(现在称为“嗜热脂肪土芽孢杆菌”)的生物体。
如本文所使用的,SEQ ID NO:22的多核苷酸序列编码SEQ ID NO:82的野生型GlcT蛋白质,并且SEQ ID NO:56的多核苷酸序列编码SEQ ID NO:55的变体GlcT蛋白质。例如,如本公开的图1A中所呈现的,两个比对的多核苷酸(ORF)序列(SEQ ID NO:22对比SEQ ID NO:56)的差别在于核苷酸位置199处的SNP,其中SEQ ID NO:22的位置199处包含胞嘧啶(C)并且SEQ ID NO:56的位置199处包含胸腺嘧啶(T)(例如,参见图1A位置199处的黑框的核苷酸(C)和(T))。类似地,图1B示出了编码的野生型GlcT蛋白质(SEQ ID NO:82)和编码的变体GlcT蛋白质(SEQ ID NO:55)的比对,其中在SEQ ID NO:56的位置199处的(C)至(T)SNP(参见图1A)导致在SEQ ID NO:55的氨基酸残基位置67处的亮氨酸(L)至苯丙氨酸(F)取代(例如,参见图1B,分别在SEQ ID NO:22和SEQ ID NO:55的残基位置67处的黑框的(L)和(F)氨基酸)。
如本文所使用的,术语“glcT1”或“等位基因glcT1”特别是指芽孢杆菌属物种细胞,其包含编码SEQ ID NO:55的L67F GlcT蛋白质的突变的、经修饰的、编辑的或引入的glcT基因(即,等位基因glcT1;SEQ ID NO:56)。在某些实施例中,等位基因glcT1编码GlcT蛋白质,其与SEQ ID NO:55具有约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性并且在SEQ ID NO:55的氨基酸位置67处包含L67F取代。
如本文所使用的,“野生型枯草芽孢杆菌aprE 5′-UTR”(下文中缩写为“WT-5′-UTR”)包含SEQ ID NO:62,并且“经修饰的aprE 5′-UTR”(下文中缩写为“mod-5′-UTR”)包含SEQ ID NO:63。例如,构建实例7中所述的α-淀粉酶表达盒(即,SEQ ID NO:64和SEQ ID NO:65),从而另外测试有效地连接的“WT-5′-UTR序列”相比于有效地连接的“mod-5′-UTR序列”对异源α-淀粉酶的表达/产生的作用。因此,α-淀粉酶表达盒包含有效地连接至上游(5′)启动子和编码α-淀粉酶的下游(3′)可读框的WT-5′-UTR序列(SEQ ID NO:62)或mod-5′-UTR序列(SEQ ID NO:63)。
如本文所使用的,命名为“BF134”的“芽孢杆菌属(子代)细胞/菌株”包含引入的SEQ ID NO:64的淀粉酶表达构建体。
如本文所使用的,命名为“BF117”的“芽孢杆菌属(子代)细胞/菌株”包含引入的SEQ ID NO:65的淀粉酶表达构建体。
如本文所使用的,命名为“BF63”的“芽孢杆菌属(子代)细胞/菌株”包含编码SEQID NO:55的L67F GlcT蛋白质的等位基因glcT1(glcT1(L67F)/pBL.comK,和编码/表达ComK蛋白质的质粒pBL.comK。
如本文所使用的,命名为“HM151”的“芽孢杆菌属(子代)细胞/菌株”包含等位基因glcT1和引入的SEQ ID NO:64的淀粉酶表达构建体。
如本文所使用的,命名为“HM150-1”的“芽孢杆菌属(子代)细胞/菌株”包含等位基因glcT1和引入的SEQ ID NO:65的淀粉酶表达构建体。
如本文所使用的,命名为“BF62”的“芽孢杆菌属(子代)细胞/菌株”包含恢复的rghr2基因(下文中称为“rghr2恢复的”)。以下进一步描述了rghr2基因和其恢复的形式“rghr2恢复的”。
如本文所使用的,命名为“BF165”的“芽孢杆菌属(子代)细胞/菌株”包含rghr2恢复的和引入的SEQ ID NO:64的淀粉酶表达构建体。
如本文所使用的,命名为“BF118”的“芽孢杆菌属(子代)细胞/菌株”包含rghr2恢复的和引入的SEQ ID NO:65的淀粉酶表达构建体。
如本文所使用的,命名为“BF260”的“芽孢杆菌属(子代)细胞/菌株”包含等位基因glcT1和rghr2恢复的;以及引入的SEQ ID NO:64的淀粉酶表达构建体。
如本文所使用的,命名为“BF171”的“芽孢杆菌属(子代)细胞/菌株”包含等位基因glcT1和rghr2恢复的;以及引入的SEQ ID NO:65的淀粉酶表达构建体。
如本文所使用的,SEQ ID NO:41的“变体地衣芽孢杆菌染色体rghR2基因”包含编码六(6)氨基酸的连续重复的18核苷酸(18-bp)重复,所述六氨基酸是“Ala-Ala-Ala-Ile-Ser-Arg”(下文中“AAAISR”),其中编码的SEQ ID NO:83的变体RghR2蛋白质的一级(1°)氨基酸序列包含如以下的这些六(6)氨基酸的线性(连续的)重复:“Ala-Ala-Ala-Ile-Ser-Arg-Ala-Ala-Ala-Ile-Ser-Arg”;下文中,“AAAISRAAAISR”。例如,SEQ ID NO:83的RghR2蛋白质中存在的六氨基酸重复示于下表1中,其中这140个氨基酸蛋白质的重复的氨基酸残基包含SEQ ID NO:83的位置38-43处的粗体文本氨基酸。
相反,本公开的“恢复的地衣芽孢杆菌染色体rghR2基因”(SEQ ID NO:61)不包含这一18核苷酸(18-bp)重复。因此,SEQ ID NO:61的恢复的rghR2基因编码SEQ ID NO:84的天然RghR2蛋白质(即,其不包含连续重复“AAAISR”)。
表1
变体和恢复的(天然)RghR2蛋白质
因此,如本文所使用的,短语“缺失18核苷酸重复”、或“缺失18-bp重复”或“通过缺失18核苷酸重复来修饰细胞”特别是指包含含有18核苷酸重复的变体rghR2基因的亲本芽孢杆菌属细胞的遗传修饰,其重复编码在变体RghR2蛋白质(例如,参见表1,SEQ ID NO:83,其中SEQ ID NO:83的位置32-37处的氨基酸“AAAISR”在SEQ ID NO:83的位置38-43处连续重复)中氨基酸“AAAISR”的重复。因此,在某些实施例中,本公开的经修饰的芽孢杆菌属细胞源自包含变体染色体rghR2基因的亲本芽孢杆菌属细胞,所述变体染色体rghR2基因包含编码“AAAISR”重复序列的18-核苷酸重复,其中所述经修饰的芽孢杆菌属细胞是通过“缺失18-核苷酸重复”来修饰的,从而生成包含编码SEQ ID NO:84的天然rghR2蛋白质的“恢复的”rghR2基因(rghR2恢复型)序列的经修饰的芽孢杆菌属细胞。为了rghR2基因、其(18-bp重复)rghR2变体(SEQ ID NO:83)更详细的描述,并且将rghR2变体恢复至天然rghR2基因(rghR2恢复型;SEQ ID NO:84),参见申请人于2017年2月24日提交的美国临时专利申请序列号62/463,268,通过引用以其整体并入本文。
如本文所定义的,术语“增加的表达”、“增强的表达”、“增加的POI表达”、“增加的产生”、“增加的POI产生”等是指“经修饰的”芽孢杆菌属(子代)细胞,其中“增加”总是相对(相对比)于表达/产生相同的POI的“未经修饰的”芽孢杆菌属(亲本)细胞而言的。
如本文所使用的,术语“表达”是指源自本公开的核酸分子的正义(mRNA)或反义RNA的转录和稳定积累。表达也可指将mRNA翻译成多肽。因此,术语“表达”包括涉及多肽的生产的任何步骤,这些步骤包括但不限于转录、转录后修饰、翻译、翻译后修饰、分泌等。
如本文所定义的,组合术语“表达/产生”(如在短语如“相对于(未经修饰的)亲本宿主细胞,经修饰的宿主细胞表达/产生增加量的目的蛋白”中使用的),术语(“表达/产生”)意指包括涉及在本公开的宿主细胞中表达和产生目的蛋白的任何步骤。
同样地,如本文所使用的,当在短语如“相对于(未经修饰的)亲本宿主细胞,经修饰的宿主细胞‘表达/产生增加的量’的一种或多种目的蛋白”中使用时,“增加的量”特别是指在经修饰的宿主细胞中表达/产生的任何“增加的量”目的蛋白(POI),所述“增加的量”总是相对于表达/产生相同的POI的(未经修饰的)亲本芽孢杆菌属细胞,其中经修饰的和未经修饰的细胞在相同的条件(例如,相同的条件,如培养基、温度、pH等)下生长/培养/发酵。例如,增加量的POI可以是在本公开的经修饰的芽孢杆菌属细胞中表达的内源芽孢杆菌POI或异源POI。
因此,如本文所使用的,“增加”蛋白质产生或“增加的”蛋白质产生意指产生的蛋白质(例如,目的蛋白)的量增加。蛋白质可以在宿主细胞内产生,或分泌(或转运)到培养基中。在某些实施例中,目的蛋白被产生(分泌)到培养基中。如与亲本宿主细胞相比,增加的蛋白质产生可以被检测为蛋白质或酶活性(例如像蛋白酶活性、淀粉酶活性、纤维素酶活性、半纤维素酶活性等)、或产生的总的细胞外蛋白质的更高的最大水平。
如本文所使用的,“核酸”是指核苷酸或多核苷酸序列、及其片段或部分,以及可能是双链或单链的基因组或合成来源的DNA、cDNA、和RNA,无论其代表正义或反义链。应该理解,由于遗传密码的简并性,许多核苷酸序列可以编码给定的蛋白质。
应该理解本文所述的多核苷酸(或核酸分子)包括“基因”、“载体”或“质粒”。
因此,术语“基因”是指编码氨基酸具体序列的多核苷酸,其包括所有或部分蛋白质编码序列,并且可以包括调控(非转录的)DNA序列,如启动子序列,该启动子序列决定例如基因在其下表达的条件。基因的转录区可以包括非翻译区(UTR)(所述非翻译区包括内含子、5'-非翻译区(UTR)、和3'-UTR),以及编码序列。
如本文所使用的,术语“编码序列”是指直接确定其(编码的)蛋白质产物氨基酸序列的核苷酸序列。编码序列的边界一般由通常以ATG起始密码子开始的可读框(在下文中称为“ORF”)确定的。编码序列通常包括DNA、cDNA和重组核苷酸序列。
如本文所定义的,术语“可读框”(下文称为“ORF”)意指包含不间断阅读框的核酸或核酸序列(无论是天然存在的、非天然存在的、或合成的),不间断阅读框由以下组成:(i)起始密码子,(ii)一系列代表氨基酸的两(2)个或更多个密码子,和(iii)终止密码子,该ORF以5'至3'方向阅读(或翻译)。
如本文所使用的术语“启动子”是指能够控制编码序列或功能性RNA表达的核酸序列。通常,编码序列位于启动子序列3'(下游)。启动子能以其整体来自天然基因,或者由来自自然界中发现的不同启动子的不同元件构成,或甚至包含合成的核酸区段。本领域技术人员应该理解,不同启动子可以在不同细胞类型中、或在不同发育阶段、或响应于不同环境条件或生理条件来指导基因表达。引起基因在大多数细胞类型中表达的启动子大多数时候通常被称为“组成型启动子”。进一步认识到,由于在大多数情况下还不能完全确定调控序列的确切边界,不同长度的DNA片段可具有相同的启动子活性。
如本文所使用的术语“有效地连接”是指核酸序列在单个核酸片段上的缔合,这样使得一个核酸片段的功能受到另一个影响。例如,当能够实现该编码序列的表达(即编码序列在启动子的转录控制下)时,启动子与该编码序列(例如ORF)有效地连接。编码序列可以在正义或反义方向上有效地连接到调控序列上。
当核酸置于与另一个核酸序列的功能关系时,所述核酸与另一个核酸序列“有效地连接”。例如,如果编码分泌性前导子(即信号肽)的DNA表达为参与多肽分泌的前蛋白质,那么所述编码分泌性前导子的DNA有效地连接到所述多肽的DNA;如果启动子或增强子影响编码序列的转录,那么所述启动子或增强子有效地连接到所述序列;或者如果核糖体结合位点被定位以便促进翻译,那么所述核糖体结合位点有效地连接到编码序列。通常,“有效地连接”意指被连接的DNA序列是连续的,并且在分泌性前导子的情况下,是连续的并且处于阅读相中。然而,增强子不必需是连续的。通过在方便的限制位点处连接来实现连接。如果这样的位点不存在,则按照常规实践使用这些合成的寡核苷酸衔接子或接头。
如本文所使用的,“控制与目的基因的蛋白质编码序列连接的目的基因(或其可读框)的表达的功能性启动子序列”是指控制芽孢杆菌属中编码序列的转录和翻译的启动子序列。例如,在某些实施例中,本公开涉及包含5′启动子(或5′启动子区、或串联5′启动子等)的多核苷酸,其中启动子区有效地连接到编码目的蛋白的核酸序列。因此,在某些实施例中,功能性启动子序列控制编码目的蛋白的目的基因的表达。在其他实施例中,功能性启动子序列控制编码目的蛋白的异源基因或内源基因在芽孢杆菌属细胞中的表达。
如本文所定义的,“适合的调控序列”是指位于编码序列的上游(5’非编码序列)、内部或下游(3’非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性、或者翻译的核苷酸序列。调控序列可以包括启动子、翻译前导序列、RNA加工位点、效应子结合位点和茎环结构。
如本文所定义的,术语“引入”,如短语中所使用的,如“向细菌细胞中引入”或“向芽孢杆菌属细胞中引入”至少一种多核苷酸可读框(ORF)、或其基因、或其载体,包括本领域已知用于将多核苷酸引入细胞的方法,这些方法包括但不限于原生质体融合、自然或人工转化(例如,氯化钙、电穿孔)、转导、转染、缀合等(例如,参见Ferrari等人,1989)。
如本文所使用的,“转化的”或“转化”意指已经通过使用重组DNA技术转化的细胞。转化典型地通过将一个或多个核苷酸序列(例如,多核苷酸、ORF或基因)插入细胞中而发生。所插入的核苷酸序列可以是异源的核苷酸序列(即在待转化的细胞中不是天然存在的序列)。如本文所使用的,“转化”是指将外源DNA引入宿主细胞中,使得DNA保持为染色体整合体或自我复制的染色体外载体。如本文所使用的,“转化DNA”、“转化序列”、和“DNA构建体”是指用于将序列引入宿主细胞或生物体的DNA。转化DNA是用于将序列引入宿主细胞或生物体的DNA。通过PCR或通过任何其他适合的技术可以在体外产生DNA。在一些实施例中,转化DNA包含输入序列,而在其他实施例中,其进一步包含同源盒侧翼的输入序列。在还另外的实施例中,转化DNA包含其他非同源序列,添加到末端(即,填充序列或侧翼)。末端可以闭合,这样使得转化DNA形成闭环,例如像,插入载体中。
如本文所使用的,“输入序列”是指引入芽孢杆菌属染色体中的DNA序列。在一些实施例中,输入序列是DNA构建体的一部分。在其他实施例中,输入序列编码一种或多种目的蛋白。在一些实施例中,输入序列包含可以或可以不存在于待转化的细胞的基因组中的序列(即,它可以是同源或异源序列)。在一些实施例中,输入序列编码一种或多种目的蛋白、基因、和/或突变的或经修饰的基因。在可替代的实施例中,该输入序列编码功能性野生型基因或操纵子、功能性突变基因或操纵子、或非功能基因或操纵子。在一些实施例中,可以将非功能序列插入基因中以破坏基因的功能。在另一个实施例中,输入序列包括选择性标记。在另一个实施例中,输入序列包括两个同源盒(例如,上游和下游同源臂)。
如本文所使用的,“同源盒”是指核酸序列,其与芽孢杆菌属染色体中的序列同源。更特别地,根据本发明,同源盒是上游或下游区,所述上游或下游区与被缺失、破坏、灭活的、下调等的基因或基因的一部分的直接侧翼编码区具有约80%与100%之间的序列同一性、约90%与100%之间的序列同一性、或约95%与100%之间的序列同一性。这些序列指导在芽孢杆菌属染色体中,DNA构建体被整合,并且指导哪一部分芽孢杆菌属染色体被输入序列替代。尽管不意味着限制本公开,但同源盒可包括约1碱基对(bp)至200千碱基(kb)。优选地,同源盒包括约1bp与10.0kb之间;1bp与5.0kb之间;1bp与2.5kb之间;1bp与1.0kb之间、和0.25kb与2.5kb之间。同源盒还可以包括约10.0kb、5.0kb、2.5kb、2.0kb、1.5kb、1.0kb、0.5kb、0.25kb和0.1kb。在一些实施例中,选择性标记的5′和3′端在同源盒(同源臂)侧翼,其中所述同源盒包含紧密位于基因的编码区侧翼的核酸序列。
在本公开的还其他实施例中,如通过DNA阵列分析(例如,如本文所述的转录组分析)确定的,在不适当时间基因活性的缺失、破坏、灭活或下调提供了增强的目的蛋白表达。如本文所使用的,“转录组分析”是指基因转录的分析。
如本文所使用的,术语“编码可选择性标记的核苷酸序列”是指核苷酸序列,所述核苷酸序列能够在宿主细胞中表达并且其中可选择性标记的表达赋予含有表达的基因的细胞在不存在对应的选择性试剂或缺乏必需营养素的情况下生长的能力。
如本文所使用的,术语“可选择性标记”和“选择性标记”是指能够在宿主细胞中表达的核酸(例如,基因),其允许容易地选择包含所述载体的那些宿主。这些可选择性标记的实例包括但不限于抗微生物剂。因此,术语“可选择性标记”是指提供宿主细胞已经摄取了感兴趣的输入DNA,或者已经发生了一些其他反应的指示。通常,可选择性标记是赋予宿主细胞抗微生物抗性或代谢优势的基因,以允许在转化期间将包含外源DNA的细胞与未接受任何外源序列的细胞区分开来。
“残留可选择性标记”是位于待转化微生物的染色体上的标记。残留可选择性标记编码与转化DNA构建体上的可选择性标记不同的基因。选择性标记是本领域技术人员所熟知的。如上所述,标记可以是抗微生物抗性标记(例如,ampR、phleoR、specR、kanR、eryR、tetR、cmpR和neoR(参见例如,Guerot-Fleury,1995;Palmeros等人,2000;和Trieu-Cuot等人,1983)。在一些实施例中,本发明提供氯霉素抗性基因(例如,存在于pC194上的基因,以及存在于地衣芽孢杆菌基因组中的抗性基因)。所述抗性基因在本发明中以及涉及染色体整合的盒和整合质粒的染色体扩增的实施例中特别有用(参见例如,Albertini和Galizzi,1985;Stahl和Ferrari,1984)。根据本发明有用的其他标记包括但不限于营养缺陷型标记,如丝氨酸、赖氨酸、色氨酸;和检测标记,如β-半乳糖苷酶。
如本文所定义的,宿主细胞“基因组”、细菌(宿主)细胞“基因组”、或芽孢杆菌属(宿主)细胞“基因组”包括染色体基因和染色体外基因。
如本文所使用的,术语“质粒”、“载体”和“盒”是指染色体外元件,其通常携带典型地不是细胞的中心代谢的一部分的基因,并且通常处于环状双链DNA分子的形式。此类元件可以是来源于任何来源的单链或双链DNA或RNA的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中许多核苷酸序列已连接或重组到单一结构中,该单一结构能够将针对选定基因产物的启动子片段和DNA序列连同适当3'未翻译序列引入到细胞中。
如本文所使用的,“转化盒”是指包含基因(或其ORF),并且除了促进具体宿主细胞的转化的外源基因之外,还具有元件的特定载体。
如本文所使用的,术语“载体”是指可以在细胞中复制(传播)并且可以携带新基因或DNA片段到细胞中的任何核酸。因此,该术语是指设计用于在不同宿主细胞之间转移的核酸构建体。载体包括为“附加体”的病毒、噬菌体、前病毒、质粒、噬菌粒、转座子、和人造染色体如YAC(酵母人工染色体)、BAC(细菌人工染色体)、PLAC(植物人工染色体)等(即,其自主复制或可以整合到宿主生物体的染色体中)。
“表达载体”是指具有在细胞中并入并表达异源DNA的能力的载体。许多原核和真核表达载体可商购获得并且是本领域技术人员熟知的。适合的表达载体的选择是在本领域技术人员的知识范围内。
如本文所使用的,术语“表达盒”和“表达载体”是指重组或合成产生的具有允许特定核酸在靶细胞中转录的一系列特定核酸元件的核酸构建体(即,这些是载体或载体元件,如上所述)。重组表达盒可以整合在质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。典型地,表达载体的重组表达盒部分包括,除了其他序列之外,待转录的核酸序列和启动子。在一些实施例中,DNA构建体还包括一系列允许靶细胞中特定核酸转录的特定核酸元件。在某些实施例中,本公开的DNA构建体包含如本文所定义的选择性标记和灭活的染色体或基因或DNA区段。
如本文所使用的,“靶向载体”是载体,所述载体包括与所述靶向载体转化的宿主细胞的染色体中的区同源的多核苷酸序列并且可以驱动该区的同源重组。例如,靶向载体可用于通过同源重组将突变引入宿主细胞染色体中。在一些实施例中,靶向载体包含其他非同源序列,例如添加到末端(即,填充序列或侧翼序列)。末端可以闭合,这样使得靶向载体形成闭环,例如像,插入载体中。适当载体的选择和/或构建完全在本领域技术人员的知识内。
如本文所使用的,术语“质粒”是指用作克隆载体的环状双链(ds)DNA构建体,并且其在许多细菌和一些真核生物中形成额外的染色体自复制遗传元件。在一些实施例中,质粒被合并入宿主细胞的基因组中。
如本文所使用的,术语“目的蛋白”或“POI”是指期望在经修饰的芽孢杆菌属(子代)细胞中表达的目的多肽,其中所述POI优选地以增加的水平表达(即,相对于“未经修饰的”(亲本)细胞)。因此,如本文所使用的,POI可以是酶、底物结合蛋白、表面活性蛋白、结构蛋白、受体蛋白、抗体等。
类似地,如本文所定义的,“目的基因”或“GOI”是指编码POI的核酸序列(例如,多核苷酸、基因或ORF)。编码“目的蛋白”的“目的基因”可以是天然存在的基因、突变的基因或合成的基因。
在某些实施例中,相对于亲本细胞,本公开的经修饰的细胞产生增加量的异源POI或内源POI。在特定的实施例中,由本公开的经修饰的细胞产生的POI的增加量是相对于亲本细胞,至少0.05%增加、至少0.10%增加、至少1.0%增加、至少5.0%增加、或超过5.0%增加。作为非限制性实例,在某些实施例中,POI是酶(例如,淀粉酶、蛋白酶等),其中通过经修饰的细胞(即,相对于其未经修饰的亲本)产生的POI的增加的水平被检测或测量为酶活性的增加和/或增加比生产力(Qp)。
如本文所使用的,术语“多肽”和“蛋白质”可互换地使用,并且是指包含通过肽键连接的氨基酸残基的任何长度的聚合物。本文中使用,用于氨基酸残基的常规单(1)字母或三(3)字母代码。多肽可以是线性的或支化的,它可以包含经修饰的氨基酸,并且它可以被非氨基酸中断。术语多肽还涵盖已经天然地或通过干预被经修饰的氨基酸聚合物;例如,通过二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作或修饰,如与标记组分偶联。所述定义内还包括例如含有一种或多种氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。
在某些实施例中,本公开的基因编码商业上相关的工业目的蛋白,例如酶(例如乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白质、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合)。
如本文所使用的,“变体”多肽是指通过取代、添加或缺失一个或多个氨基酸,通常通过重组DNA技术衍生自亲本(或参考)多肽的多肽。变体多肽与亲本多肽可以相差小数量的氨基酸残基,并且可以通过它们与亲本(参比)多肽在一级氨基酸序列同源性/同一性的水平来定义。
优选地,变体多肽与亲本(参比)多肽序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%氨基酸序列同一性。如本文所使用的,“变体”多核苷酸是指编码变体多肽的多核苷酸,其中“变体多核苷酸”与亲本多核苷酸具有特定程度的序列同源性/同一性,或与亲本多核苷酸(或其补体)在严格的杂交条件下杂交。优选地,变体多核苷酸与亲本(参比)多核苷酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或甚至至少99%核苷酸序列同一性。
如本文所使用的,“突变”是指核酸序列中的任何变化或改变。存在若干种类型的突变,包括点突变、缺失突变、沉默突变、框位移突变、剪接突变等。可以特异性地进行突变(例如,经由定点诱变)或随机地进行突变(例如,经由化学试剂、通过修复减去的细菌菌株)。
如本文所使用的,在多肽或其序列的上下文中,术语“取代”意指一个氨基酸被另一个氨基酸替代(即,取代)。
如本文所定义的,“内源基因”是指位于生物体基因组的其天然位置中的基因。
如本文所定义的,“异源”基因、“非内源”基因、或“外源”基因是指通常不在宿主生物体中被发现,但通过基因转移引入宿主生物体中的基因(或ORF)。如本文所使用的,术语一个或多个“外来”基因包含插入非天然生物体中的天然基因(或ORF)和/或插入天然或非天然生物体中的嵌合基因。
如本文所定义的,“异源”核酸构建体或“异源”核酸序列具有不是其被表达的细胞的天然的序列的一部分。
如本文所定义的,“异源控制序列”是指基因表达控制序列(例如,启动子或增强子),其本质上不起作用以调控(控制)目的基因的表达。通常,异源的核酸序列对于它们存在的细胞或部分基因组不是内源(天然)的,并且已经通过感染、转染、转化、显微注射、电穿孔等添加到细胞中。“异源的”核酸构建体可以包含与在天然宿主细胞中发现的控制序列/DNA编码(ORF)序列组合相同或不同的控制序列/DNA编码序列组合。
如本文所使用的,术语“信号序列”和“信号肽”是指可以参与蛋白质的成熟蛋白质或前体形式的分泌或定向转运的氨基酸残基序列。通常,信号序列位于前体或成熟蛋白序列的N-末端。信号序列可以是内源的或外源的。成熟蛋白中一般不存在信号序列。通常,在蛋白质转运后,信号序列通过信号肽酶从蛋白质切割。
术语“衍生的”涵盖术语“起源的”、“获得的”“可获得的”和“创建的”,并且通常表示一种指定的材料或组合物在另一种指定的材料或组合物中找到它的起源或具有可以参考另一种指定材料或组合物描述的特征。
如本文所使用的,术语“同源性”涉及同源多核苷酸或多肽。如果两个或更多个多核苷酸或两个或更多个多肽是同源的,则这意味着同源多核苷酸或多肽具有至少60%、更优选至少70%、甚至更优选至少85%、还更优选至少90%、更优选至少95%、并且最优选至少98%的“同一性的程度”。两个多核苷酸或多肽序列是否具有如本文所定义的同源程度足够高的同一性,可以通过使用本领域已知的计算机程序,例如GCG程序包(Program Manualfor the Wisconsin Package[威斯康星程序包手册],版本8,1994年8月,遗传学计算机集团(Genetics Computer Group),575科学驱动,麦迪逊,威斯康星州,美国53711)(Needleman和Wunsch,1970)中提供的“GAP”比对两个序列来适合地研究。使用GAP和以下设置进行DNA序列比较:空位产生罚分5.0和空位扩展罚分0.3。
如本文所使用的,术语“百分比(%)同一性”是指当使用序列比对程序进行比对时,编码多肽或多肽的氨基酸序列的核酸序列之间的核酸或氨基酸序列同一性的水平。
如本文所使用的,“比生产力”是在给定时间段内生产的蛋白质的总量/细胞/时间。
如本文所定义的,术语“纯化的”或“分离的”或“富集的”意指生物分子(例如,多肽或多核苷酸)通过将其与它在自然界中相关联的天然存在的成分中的一些或所有分离而被从其天然状态改变。这种分离或纯化可以通过本领域公认的分离技术如离子交换层析、亲和层析、疏水分离、透析、蛋白酶处理、硫酸铵沉淀或其他蛋白质盐沉淀、离心、尺寸排阻层析、过滤、微量过滤、凝胶电泳或梯度分离进行,以去除最终组合物中所不希望的全细胞、细胞碎片、杂质、外来蛋白质或酶。随后可以进一步向纯化或分离的生物分子组合物中添加成分,该成分提供了额外的益处,例如是活化剂、抗抑制剂、期望的离子、控制pH的化合物或其他酶或化学品。
如本文所使用的,“变体嗜热脂肪土芽孢杆菌淀粉酶”是国际PCT公开号WO 2009/149130中公开的变体嗜热脂肪土芽孢杆菌α-淀粉酶。
如本文所使用的,术语“ComK多肽”定义为comK基因的产物;该基因是转录因子,在感受态发展之前作为最终的自动调控控制开关;涉及激活参与DNA结合和摄取以及重组的晚期感受态基因的表达(Liu和Zuber,1998,Hamoen等人,1998)。SEQ ID NO:50示出了包含和表达comK核酸序列的质粒(pBL.comK)。
如本文所使用的,“同源基因”是指来自不同的、但通常相关的物种的基因对,这些基因彼此对应并且彼此相同或非常相似。所述术语涵盖通过物种形成(即,新物种的发育)(例如,直系同源基因)分离的基因、以及通过遗传重复分离的基因(例如,旁系同源基因)。
如本文所使用的,“直系同源物”和“直系同源基因”是指通过物种形成从共同祖先基因(即,同源基因)演化的不同物种中的基因。通常,直系同源物在进化过程中保持相同的功能。直系同源物的鉴定可用于新测序基因组中基因功能的可靠预测。
如本文所使用的,“旁系同源物”和“旁系同源基因”是指与基因组内重复相关的基因。虽然直系同源物在进化过程中保持相同的功能,但旁系同源物发展新功能,即使一些功能通常与原始功能相关。旁系同源基因的实例包括但不限于编码胰蛋白酶、胰凝乳蛋白酶、弹性蛋白酶、和凝血酶的基因,上述酶都是丝氨酸蛋白酶并且在同一物种内一起发生。
如本文所使用的,“同源性”是指序列相似性或同一性,同一性优先。使用本领域已知的标准技术来确定这种同源性(参见,例如,Smith和Waterman,1981;Needleman和Wunsch,1970;Pearson和Lipman,1988;程序如在Wisconsin Genetics Software Package[威斯康星州遗传学软件包]中的GAP、BESTFIT、FASTA、和TFASTA(Genetics ComputerGroup,Madison,WI[遗传学计算机组,麦迪逊,威斯康星州])和Devereux等人,1984)。
如本文所使用的,“类似的序列”是其中基因的功能与衍生自芽孢杆菌属细胞的基因基本上相同的序列。另外,类似的基因与芽孢杆菌属物种细胞的序列包括至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。类似的序列由已知的序列比对方法确定。通常使用的比对方法是BLAST,尽管存在也可用于比对序列的其他方法。
如本文所使用的,术语“杂交”是指通过碱基配对将核酸链与互补链连接的过程,如本领域已知的。如果两个序列在中至高严格杂交和洗涤条件下彼此特异性杂交,则认为核酸序列可与参考核酸序列“选择性杂交”。杂交条件是基于核酸结合复合物或探针的解链温度(Tm)。例如,“最大严格”典型地发生在约Tm-5℃(低于探针的Tm 5℃);“高严格”发生在低于Tm约5℃-10℃;“中等严格”发生在低于探针的Tm约10℃-20℃;并且“低严格”发生在低于Tm约20℃-25℃。在功能上,最大严格条件可以用于鉴定与杂交探针具有严格同一性或近乎严格同一性的序列;而中或低严格杂交可用于鉴定或检测多核苷酸序列同源物。中等和高严格杂交条件是本领域公知的。高严格条件的实例包括以下杂交:在约42℃下,在50%甲酰胺、5X SSC、5X登哈特溶液、0.5%SDS和100pg/ml变性载体DNA中进行,随后在室温(RT)下在2X SSC和0.5%SDS中洗涤两次,并在42℃下在另外的0.1X SSC和0.5%SDS下再洗涤两次。中严格条件的实例包括在37℃下在包含20%甲酰胺、5x SSC(150mM NaCl、15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5x登哈特溶液、10%葡聚糖硫酸盐和20mg/ml变性剪切的鲑鱼精子DNA的溶液中过夜孵育,然后在约37℃-50℃下以1x SSC洗涤滤器来进行。如果需要,本领域技术人员知道如何调控温度、离子强度等以适应因素如探针长度等等。
如本文所使用的,“重组体”包括提及细胞或载体,其已经通过引入异源核酸序列而被修饰,或者所述细胞衍生自已如此修饰的细胞。因此,例如,重组细胞表达在细胞的天然形式(非重组)内相同形式的未发现的基因或表达以其他方式异常表达的、低表达的或根本不表达的天然基因(由于故意的人为干预)。“重组(recombination、recombining)”或产生“重组的(recombined)”核酸通常是两个或更多个核酸片段的组装,其中组装产生嵌合基因。
如本文所使用的,“侧翼序列”是指正在讨论的序列的上游或下游的任何序列(例如,针对基因A-B-C,基因B以A和C基因序列为侧翼)。在某些实施例中,输入序列每侧侧翼有同源盒。在另一个实施例中,输入序列和同源盒包括在每侧侧翼有填充序列的单元。在一些实施例中,侧翼序列仅存在于单侧(3’或5’),但在优选的实施例中,序列的每侧均有侧翼序列。每个同源盒的序列与芽孢杆菌属染色体中的序列同源。这些序列指导在芽孢杆菌属染色体中,新构建体被整合,并且部分芽孢杆菌属染色体将被输入序列替代。在其他实施例中,选择性标记的5’和3’端侧翼有包含灭活染色体区段的部分的多核苷酸序列。在一些实施例中,侧翼序列仅存在于单侧(3’或5’),而在其他实施例中,其存在于所侧翼序列的每侧。
如本文所使用的,术语“填充序列”是指侧翼同源盒(通常为载体序列)的任何额外的DNA。然而,所述术语涵盖任何非同源DNA序列。不受任何理论的限制,填充序列为细胞启动DNA摄取提供非关键的靶。
II.GlcT抗终止蛋白质
如以下实例部分所述,申请人进行常规全宿主诱变(NTG)以创建地衣芽孢杆菌突变体库(即,经修饰的地衣芽孢杆菌子代细胞)并且使用常规筛选程序以鉴定此类能够产生增加量的工业相关目的蛋白(例如,异源酶、内源酶)的经修饰的地衣芽孢杆菌子代细胞。更特别地,申请人鉴定了经修饰的地衣芽孢杆菌(子代)细胞,经修饰的地衣芽孢杆菌(子代)细胞在编码变体GlcT蛋白质的基因中包含单一核苷酸多态性(SNP),所述经修饰的地衣芽孢杆菌(子代)细胞相对于包含编码野生型GlcT蛋白质的基因的亲本地衣芽孢杆菌细胞(即,当在相似条件下培养经修饰的和亲本地衣芽孢杆菌细胞时)能够产生增加量的淀粉酶蛋白质。
如Schmalisch等人(2003)一般描述的,枯草芽孢杆菌GlcT蛋白质是转录抗终止子的BglG家族的成员,其抗终止子包含N-末端RNA结合结构域(约60个氨基酸),以及两个重复的磷酸转移酶系统(PTS)调节结构域(PRD;PRD-I和PRD-II),其调节响应于诱导物的可用性的蛋白质的调节输出(Manival等人,1997;Ilmen等人,1998)。例如,在大肠杆菌(Escherichia coli)、枯草芽孢杆菌和一些其他细菌中,葡萄糖被摄取并同时通过磷酸烯醇丙酮酸盐:糖磷酸转移酶系统(PTS)被磷酸化(Postma等人,1993)。磷酸转移酶系统(PTS)由两个普通的能量耦合蛋白质、酶I(EI)和HPr以及几个多结构域糖特异性通透酶(例如,酶II,(EII))组成,其可以以个体蛋白质或融合于单一多肽而存在。
例如,在枯草芽孢杆菌中,将葡萄糖通透酶(EII)的所有结构域融合以形成单一多肽,其具有结构域排列(EIIC)-(EIIB)-(EIIA)(例如,参见Postma等人,1993;Stulke和Hillen,2000)。此外,长期以来认为,编码葡萄糖PTS组分的基因在细菌中组成性表达。尽管对于编码一般蛋白质的ptsI和ptsH基因是这样的,编码葡萄糖-特异性通透酶(EIIGlc)的ptsG基因是由葡萄糖在大肠杆菌和枯草芽孢杆菌中诱导的(Postma等人,1993;Stulke和Hillen,2000;Plumbridge,2002.)。在枯草芽孢杆菌中,ptsG表达的葡萄糖诱导是通过转录抗终止介导的。例如,在缺失葡萄糖的情况下,在ptsG启动子处启动的转录终止于mRNA的前导区。如果存在葡萄糖,GlcT抗终止蛋白具有活性(即,二聚体),并通过与RNA抗终止子(RAT)序列(其与终止子重叠)结合来防止转录终止。认为GlcT与RAT的结合可以稳定RAT结构并防止终止子的形成(Stulke等人,1997;Ilmen等人,1999)。
不希望受任何特定理论、机制或作用方式的束缚,申请人出乎意料地发现本公开的经修饰的地衣芽孢杆菌(子代)细胞(包含编码变体GlcT蛋白质的基因或其ORF)能够产生增加量的工业相关目的蛋白。更特别地,申请人鉴定了经修饰的地衣芽孢杆菌(子代)细胞,经修饰的地衣芽孢杆菌(子代)细胞在编码变体GlcT蛋白质的基因中包含单一核苷酸多态性(SNP),所述经修饰的地衣芽孢杆菌(子代)细胞相对于包含编码野生型GlcT蛋白质的基因的亲本地衣芽孢杆菌细胞(即,当在相同条件下培养经修饰的和亲本地衣芽孢杆菌细胞时)能够产生增加量的淀粉酶蛋白质。
例如,图1A示出了编码野生型GlcT蛋白质(SEQ ID NO:82)的亲本地衣芽孢杆菌ORF(SEQ ID NO:22)相对于编码变体GlcT蛋白质(SEQ ID NO:55)的经修饰的地衣芽孢杆菌ORF(SEQ ID NO:56)的核酸序列比对。如图1A中所示,两个比对的ORF序列(SEQ ID NO:22对比SEQ ID NO:56)的差别在于核苷酸位置199处的SNP,其中SEQ ID NO:22的位置199处包含胞嘧啶(C)并且SEQ ID NO:56的位置199处包含胸腺嘧啶(T)(例如,参见图1A位置199处的黑框的核苷酸(C)和(T))。类似地,图1B示出了编码的野生型GlcT蛋白质(SEQ ID NO:82)和编码的变体GlcT蛋白质(SEQ ID NO:55)的比对,其中在SEQ ID NO:56的位置199处的(C)至(T)SNP(参见图1A)导致在SEQ ID NO:55的氨基酸残基位置67处的亮氨酸(L)至苯丙氨酸(F)取代(例如,参见图1B,分别在SEQ ID NO:22和SEQ ID NO:55的残基位置67处的黑框的(L)和(F)氨基酸)。
申请人进一步使用SEQ ID NO:82的野生型GlcT蛋白质序列进行了BLAST蛋白质序列搜索、比对及其分析,此分析揭示了在SEQ ID NO:82的位置67处的亮氨酸(L)氨基酸在芽孢杆菌属物种细胞中高度保守。同样地,全长GlcT蛋白质序列的序列同一性在芽孢杆菌属物种细胞中高度保守(例如,80%-100%氨基酸序列同一性)。因此,在某些实施例中,等位基因glcT1编码GlcT蛋白质,其与SEQ ID NO:55包含约90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性并且在SEQ ID NO:55的氨基酸残基位置67处包含苯丙氨酸(F)。
III.RghR2恢复的地衣芽孢杆菌细胞
如以上部分II中一般所述,本公开的某些实施例涉及经修饰的芽孢杆菌属(宿主)细胞(即,包含编码变体GlcT蛋白质的经修饰的glcT基因,例如在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)),其中所述经修饰的细胞相对于产生相同POI的亲本芽孢杆菌属细胞,产生增加量的目的蛋白(POI)。在某些相关实施例中,本公开的经修饰的芽孢杆菌属细胞是经修饰的地衣芽孢杆菌细胞,其包含在美国临时专利申请序列号62/463,268中描述或所示的恢复的rghR2基因(rghR2恢复的)。
例如,在本公开的某些实施例中,经修饰的地衣芽孢杆菌细胞包含恢复的rghR2基因,所述恢复的rghR2基因与SEQ ID NO:61的rghR2基因包含90%序列同一性。在其他实施例中,经修饰的地衣芽孢杆菌细胞包含恢复的rghR2基因,所述恢复的rghR2基因与SEQ IDNO:61的rghR2基因包含95%序列同一性。在又其他实施例中,经修饰的地衣芽孢杆菌细胞包含SEQ ID NO:61的恢复的rghR2基因。
在其他实施例中,经修饰的地衣芽孢杆菌细胞包含编码RghR2蛋白质的恢复的rghR2基因,所述RghR2蛋白质包含与SEQ ID NO:84的RghR2蛋白质的90%序列同一性。在某些其他实施例中,经修饰的地衣芽孢杆菌细胞包含编码RghR2蛋白质的恢复的rghR2基因,所述RghR2蛋白质包含与SEQ ID NO:84的RghR2蛋白质的95%序列同一性。在又其他实施例中,经修饰的地衣芽孢杆菌细胞包含编码SEQ ID NO:84的RghR2蛋白质的恢复的rghR2基因。因此,本公开的某些实施例涉及经修饰的地衣芽孢杆菌细胞,其包含恢复的rghR2(rghR2恢复的)基因和等位基因glcT1。
IV.经修饰的枯草芽孢杆菌APRE 5′-UTR核酸序列
如以上一般所述,本公开的某些实施例涉及包含等位基因glcT1的经修饰的芽孢杆菌属(宿主)细胞,其中所述经修饰的芽孢杆菌属细胞相对于包含天然/野生型glcT基因的亲本芽孢杆菌属细胞能够产生增加量的内源和/或异源目的蛋白。因此,在某些相关实施例中,用编码目的蛋白的表达构建体来转化芽孢杆菌属亲本细胞及其经修饰的子代细胞(例如,包含等位基因glcT1)。例如,在某些实施例中,用编码POI(例如,淀粉酶、蛋白酶、脂肪酶等)的表达构建体来转化亲本和经修饰的芽孢杆菌属细胞。
因此,在某些相关实施例中,将编码POI的核酸序列(例如,ORF)有效地连接至经修饰的枯草芽孢杆菌aprE 5′-非翻译区(mod-5′-UTR)序列(SEQ ID NO:63)。例如,申请人于2017年9月13日提交的美国临时专利申请序列号62/558,304(通过引用以其整体并入本文)公开并充分描述了此类mod-5′-UTR序列、其载体、其经修饰的宿主细胞等。
更特别地,如本公开的实例7中所呈现的,申请人测试了经修饰的aprE 5′非翻译区(mod-5′-UTR)序列对编码目的蛋白的基因在芽孢杆菌属细胞中表达的作用,(例如,通过构建α-淀粉酶表达盒,其包含野生型枯草芽孢杆菌aprE 5′-UTR(SEQ ID NO:62)或经修饰的aprE 5′-UTR(SEQ ID NO:63))。因此,实例7描述了用于评估各种(经修饰的)5′-UTR构建体的芽孢杆菌属宿主细胞的创建,以及当此类经修饰的5′-UTR构建体有效地连接到上游(5′)启动子和编码目的蛋白的下游(3′)可读框时,其对所述目的蛋白的产生的影响/作用。
例如,构建了亲本和经修饰的地衣芽孢杆菌(子代)细胞BF63、BF62和BF169(参见表17和表18),其包含携带木糖诱导的comK表达盒(SEQ ID NO:50)的质粒(pBL.ComK)。更特别地,如以下实例部分中所述,构建并测试了野生型(WT)5′-UTR表达构建体(SEQ ID NO:64)或经修饰的5′-UTR表达构建体(SEQ ID NO:65),其中每个表达盒(即,SEQ ID NO:64或SEQ ID NO:65)包含(按5′至3′方向)相同的5′catH同源臂(SEQ ID NO:66)、catH基因(SEQID NO:67)和spoVGrrnIp杂合启动子(SEQ ID NO:68),有效地连接至WT-5′-UTR(SEQ IDNO:62)或mod-5′-UTR(SEQ ID NO:63)。另外,将5′-UTR有效地连接至编码lat信号序列(SEQID NO:69)的DNA,所述DNA后是编码变体嗜热脂肪土芽孢杆菌α-淀粉酶(SEQ ID NO:70)的DNA(ORF)。将编码变体嗜热脂肪土芽孢杆菌α-淀粉酶(SEQ ID NO:70)的DNA(ORF)的3′端有效地连接至lat终止子(SEQ ID NO:71),所述lat终止子有效地连接至3′catH同源臂(SEQID NO:72)。
V.分子生物学
如上一般所述,本公开的某些实施例涉及经修饰的源自亲本芽孢杆菌属细胞的芽孢杆菌属(子代)细胞。更特别地,本公开的某些实施例涉及经修饰的芽孢杆菌属(子代)细胞及其用于产生和构建此类具有增加的蛋白质产生能力、增加的次级代谢产物产生能力等的经修饰的芽孢杆菌属(宿主)细胞(例如,蛋白质产生宿主细胞、细胞工厂)的方法。
更特别地,本公开的某些实施例涉及包含glcT基因的亲本芽孢杆菌属细胞的突变体,所述glcT基因编码变体GlcT蛋白质,所述变体GlcT蛋白质在SEQ ID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)。本公开的某些其他实施例涉及源自亲本芽孢杆菌属细胞的经修饰的芽孢杆菌属细胞,所述亲本芽孢杆菌属细胞包含编码GlcT蛋白质的野生型glcT基因,所述GlcT蛋白质在SEQ ID NO:82的氨基酸位置67处包含亮氨酸(L)(F67),其中所述经修饰的芽孢杆菌属细胞包含编码SEQ ID NO:55的变体GlcT蛋白质的编辑的(经修饰的)glcT基因。某些其他实施例涉及包含引入的多核苷酸的经修饰的芽孢杆菌属(子代)细胞,所述引入的多核苷酸编码变体GlcT蛋白质,所述变体GlcT蛋白质包含SEQ ID NO:55,在SEQID NO:55的氨基酸位置67处包含苯丙氨酸(F)(F67)。在其他实施例中,本公开的经修饰的芽孢杆菌属细胞包含灭活的(内源)天然染色体glcT基因(即,编码GlcT蛋白质,所述GlcT蛋白质包含与SEQ ID NO:82的至少95%序列同一性并在SEQ ID NO:55的氨基酸位置67处包含亮氨酸(L)(L67))。
在某些其他实施例中,包含并表达编码变体GlcT蛋白质的多核苷酸的本公开的经修饰的地衣芽孢杆菌细胞进一步包含rghR2基因的修饰,所述rghR2基因编码RghR2蛋白质,所述RghR2蛋白质与SEQ ID NO:84包含90%序列同一性。在其他实施例中,本公开涉及衍生自亲本地衣芽孢杆菌细胞的经修饰的地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码SEQ ID NO:83的RghR2蛋白质的rghR2基因,其中所述经修饰的细胞包含编码SEQ IDNO:84的RghR2蛋白质的复原型rghR2基因。
因此,本公开的某些实施例提供了用于遗传修饰(改变)本公开的亲本芽孢杆菌属细胞以产生其经修饰的芽孢杆菌属细胞的组合物和方法,并且更特别地,经修饰的芽孢杆菌属细胞相对于(未经修饰的)亲本地衣芽孢杆菌细胞,产生增加量的内源和/或异源目的蛋白。
因此,本公开的某些实施例涉及用于遗传修饰芽孢杆菌属细胞的方法,其中所述修饰包括(a)引入、取代、或去除基因(或其ORF)中的一个或多个核苷酸,或者引入、取代、或去除基因或其ORF的转录或翻译所需要的调控元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)下调基因,(f)位点特异性诱变,和/或(g)随机诱变。
在某些实施例中,通过使用本领域熟知的方法(例如,插入、破坏、替换、或缺失)减少或消除上述基因的表达来构建本公开的经修饰的芽孢杆菌属细胞。待修饰或灭活的基因的部分可以是,例如,编码区或编码区表达所需的调控元件。此类调控或控制序列的实例可以是启动子序列或其功能部分(即,足以影响核酸序列表达的部分)。用于修饰的其他控制序列包括但不限于前导序列、前肽序列、信号序列、转录终止子、转录激活子等。
在某些其他实施例中,通过基因缺失构建经修饰的芽孢杆菌属细胞以消除或减少本公开的至少一种前述基因的表达。基因缺失技术能够部分或完全去除一个或多个基因,从而消除它们的表达、或表达非功能性(或活性降低的)蛋白质产物。在此类方法中,一个或多个基因的缺失可以通过使用质粒进行同源重组来完成,所述质粒已构建成连续含有基因侧翼的5'和3'区。可以将连续的5'和3'区引入芽孢杆菌属细胞中,例如,在温度敏感的质粒(如pE194)上,在允许温度下与第二可选择性标记结合以允许质粒在细胞中建立。然后将细胞移至非允许温度,以选择在同源侧翼区之一处具有整合到染色体中的质粒的细胞。通过选择第二可选择性标记来实现质粒整合的选择。整合后,通过将细胞移至允许温度持续若干代而不进行选择来在刺激第二同源侧翼区的重组事件。将细胞铺板以获得单菌落,并检查菌落是否损失两种可选择性标记(参见例如,Perego,1993)。因此,本领域的技术人员可以容易地鉴定在所述基因的编码序列和/或所述基因的非编码区的核苷酸区(适于全部或部分缺失)。
在其他实施例中,通过引入、取代、或去除基因或其转录或翻译所需的调控元件中的一个或多个核苷酸来构建本公开的经修饰的芽孢杆菌属细胞。例如,可以插入或去除核苷酸,以便导致引入终止密码子的、去除起始密码子、或移码可读框。可以根据本领域已知的方法,通过定点诱变或PCR产生的诱变来完成这种修饰(例如参见,Botstein和Shortle,1985;Lo等人,1985;Higuchi等人,1988;Shimada,1996;Ho等人,1989;Horton等人,1989以及Sarkar和Sommer,1990)。因此,在某些实施例中,通过完全或部分缺失灭活本公开的基因。
在另一个实施例中,通过基因转换的过程构建经修饰的芽孢杆菌属细胞(例如,参见Iglesias和Trautner,1983)。例如,在基因转换方法中,对应于一个或多个基因的核酸序列在体外诱变以产生缺陷核酸序列,然后将所述核酸序列转化到亲本芽孢杆菌属细胞中以产生缺陷基因。通过同源重组,缺陷核酸序列替换内源基因。可能是需要的,缺陷基因或基因片段也编码可用于选择含有缺陷基因的转化体的标记。例如,可以将缺陷基因与可选择性标记结合引入非复制或温度敏感的质粒上。通过在不允许质粒复制的条件下选择标记来实现质粒整合的选择。选择导致基因替换的第二次重组事件是通过检查菌落损失可选择性标记和获得突变基因来实现的(Perego,1993)。可替代地,缺陷核酸序列可以含有基因的一个或多个核苷酸的插入、取代、或缺失,如下所述。
在其他实施例中,通过建立的反义技术使用与基因的核酸序列互补的核苷酸序列来构建经修饰的芽孢杆菌属细胞(Parish和Stoker,1997)。更特别地,可以通过引入与基因的核酸序列互补的核苷酸序列来减少(下调)或消除芽孢杆菌属细胞的基因的表达,所述核苷酸序列可以在细胞中转录并且能够与细胞中产生的mRNA杂交。在允许互补的反义核苷酸序列与mRNA杂交的条件下,由此降低或消除了所翻译的蛋白质的量。此类反义方法包括但不限于RNA干扰(RNAi)、小干扰RNA(siRNA)、微小RNA(miRNA)、反义寡核苷酸等,所有这些都是本领域技术人员熟知的。
在其他实施例中,经由CRISPR-Cas9编辑产生/构建经修饰的芽孢杆菌属细胞。例如,编码GlcT蛋白的基因可以通过核酸指导的内切核酸酶的方式编辑或破坏(或缺失或下调),所述核酸指导的内切核酸酶通过结合指导RNA(例如,Cas9)和Cpf1或指导DNA(例如,NgAgo)发现其靶DNA,这将内切核酸酶募集到DNA上的靶序列上,其中所述内切核酸酶可以在DNA中产生单链或双链断裂。这种靶向DNA断裂成为DNA修复的底物,并且可以与提供的编辑模板重组以破坏或缺失该基因。例如,编码核酸指导的内切核酸酶(出于此目的,来自化脓链球菌的Cas9)的基因或编码Cas9核酸酶的密码子优化的基因有效地连接到在芽孢杆菌属细胞中有活性的启动子和在芽孢杆菌属细胞中有活性的终止子,从而产生芽孢杆菌Cas9表达盒。同样地,本领域技术人员容易鉴定目的基因特有的一个或多个靶位点。例如,为了构造编码gRNA的DNA构建体-指向目的基因内的靶位点,可变的靶向结构域(VT)将包含靶位点的核苷酸,所述核苷酸为(PAM)前间区序列邻近基序(TGG)的5′,所述核苷酸与编码化脓链球菌Cas9的Cas9核酸内切酶识别结构域(CER)的DNA融合。组合编码VT结构域的DNA和编码CER结构域的DNA,从而产生编码gRNA的DNA。因此,通过将编码gRNA的DNA有效连接到在芽孢杆菌属细胞中有活性的启动子和在芽孢杆菌属细胞中有活性的终止子来产生gRNA的芽孢杆菌属的表达盒。
在某些实施例中,由内切核酸酶诱导的DNA断裂用输入序列修复/替换。例如,为了精确修复由上述Cas9表达盒和gRNA表达盒产生的DNA断裂,提供核苷酸编辑模板,使得细胞的DNA修复机器可以利用编辑模板。例如,靶基因的约500bp 5'可以与靶基因的约500bp 3'融合以产生编辑模板,所述模板由芽孢杆菌宿主的机器用于修复由RGEN产生的DNA断裂。
可以使用许多不同的方法(例如,原生质体融合、电穿孔、自然感受态或诱导感受态)将Cas9表达盒、gRNA表达盒、和编辑模板共同递送至丝状真菌细胞。通过用正向和反向引物扩增基因座,通过PCR扩增靶基因座来筛选转化的细胞。这些引物可以扩增野生型基因座或已经由RGEN编辑的经修饰基因座。然后使用测序引物对这些片段进行测序以鉴定编辑的菌落。
在又其他实施例中,使用本领域已知的方法(包括但不限于,化学诱变(参见例如,Hopwood,1970)和转座(参见例如,Youngman等人,1983)),通过随机或特异性诱变构建经修饰的芽孢杆菌属细胞。可以通过对亲本细胞进行诱变并筛选其中基因表达已经减少或消除的突变细胞来进行基因的修饰。诱变可以是特异性的或随机的,可以通过例如使用适合的物理或化学诱变剂进行、通过使用适合的寡核苷酸进行、或通过将所述DNA序列经受PCR产生的诱变来进行。此外,诱变可通过使用这些诱变方法的任意组合来进行。
适用于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N’-硝基-N-亚硝基胍(MNNG)、N-甲基-N'-亚硝基胍(NTG)、邻甲基羟胺、亚硝酸、乙基甲磺酸(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,通常通过如下方法来进行诱变:在适合的条件下在选择的诱变剂的存在下孵育待诱变的亲本细胞,并选择表现出基因表达降低或无基因表达的突变细胞。
在某些其他实施例中,经修饰的芽孢杆菌属细胞包含内源基因的缺失。在其他实施例中,经修饰的芽孢杆菌属细胞包含内源基因的破坏。在某些实施例中,本公开的多核苷酸破坏盒包含标记基因。
在其他实施例中,经修饰的芽孢杆菌属细胞包含内源基因的下调。例如,在某些实施例中,下调上述一个或多个基因包含缺失或破坏基因的上游或下游调控元件。
PCT公开号WO 2003/083125公开了用于修饰芽孢杆菌属细胞的方法,如使用PCR融合来产生芽孢杆菌属缺失菌株和DNA构建体以绕过大肠杆菌。
PCT公开号WO 2002/14490公开了用于修饰芽孢杆菌属细胞的方法,所述方法包括(1)构建和转化整合的质粒(pComK),(2)随机诱变编码序列、信号序列和前肽序列,(3)同源重组,(4)通过向转化DNA添加非同源侧翼增加转化效率,(5)优化双交叉整合,(6)定向诱变和(7)无标记缺失。
本领域技术人员充分意识到用于将多核苷酸序列引入细菌细胞(例如,大肠杆菌和芽孢杆菌属物种)中的适合方法(例如,Ferrari等人,1989;Saunders等人,1984;Hoch等人,1967;Mann等人,1986;Holubova,1985;Chang等人,1979;Vorobjeva等人,1980;Smith等人,1986;Fisher等人,1981和McDonald,1984)。实际上,包括原生质体转化和中板集合、转导、和原生质体融合在内的转化方法是已知的并且适合用于本公开。转化方法特别优选地是将本公开的DNA构建体引入宿主细胞。
除了通常使用的方法之外,在一些实施例中,直接转化宿主细胞(即,在引入宿主细胞之前,中间细胞不用于扩增或以其他方式处理DNA构建体)。将DNA构建体引入宿主细胞包括本领域已知的将DNA插入宿主细胞而不插入质粒或载体中的那些物理和化学方法。此类方法包括但不限于氯化钙沉淀、电穿孔、裸DNA、脂质体等。在另外的实施例中,DNA构建体与质粒一起共转化而不插入该质粒。在另外的实施例中,通过本领域已知的方法,将选择性标记从经修饰的芽孢杆菌属菌株中缺失或基本上切除(例如,Stahl等人,1984和Palmeros等人,2000)。在一些实施例中,来自宿主染色体的载体的分辨离开染色体中的侧翼区域,同时去除了固有的染色体区域。
用于在芽孢杆菌属细胞中表达基因、其可读框(ORF)和/或其变体序列的启动子和启动子序列区通常是本领域技术人员已知的。通常选择本公开的启动子序列,使得它们在芽孢杆菌属细胞(例如,地衣芽孢杆菌细胞、枯草芽孢杆菌属细胞等)中起作用。某些示例性芽孢杆菌属启动子序列呈现于表6中。同样地,用于驱动芽孢杆菌属细胞中基因表达的启动子包括但不限于枯草芽孢杆菌碱性蛋白酶(aprE)启动子(Stahl等人,1984)、枯草芽孢杆菌的α-淀粉酶启动子(Yang等人,1983)、解淀粉芽孢杆菌的α-淀粉酶启动子(Tarkinen等人,1983)、来自枯草芽孢杆菌的中性蛋白酶(nprE)启动子(Yang等人,1984)、突变体aprE启动子(PCT公开号WO 2001/51643)或来自地衣芽孢杆菌或其他相关的芽孢杆菌属的任何其他启动子。在某些其他实施例中,启动子是美国专利公开号2014/0329309中公开的核糖体蛋白质启动子或核糖体RNA启动子(例如,rrnI启动子)。在PCT公开号WO 2003/089604中描述了用于在芽孢杆菌属细胞中筛选和产生具有一系列活性(启动子强度)的启动子文库的方法。
VI.培养用于产生目的蛋白的芽孢杆菌属细胞
在其他实施例中,本公开提供了与未经修饰的(亲本)细胞相比(即,相对于),用于提高经修饰的细菌细胞的蛋白质生产力的方法。在某些实施例中,本公开内容针对产生目的蛋白(POI)的方法,这些方法包括发酵培养经修饰的细菌细胞,其中经修饰的细胞将POI分泌到培养基中。本领域熟知的发酵方法可用于发酵本公开的经修饰的和未经修饰的芽孢杆菌属细胞。
在一些实施例中,将细胞在分批或连续发酵条件下培养。经典的分批发酵是封闭的系统,其中在发酵开始时设定培养基的组成,并且该组成在发酵期间不改变。在发酵开始时,用一种或多种所需生物体接种培养基。在这种方法中,允许发酵发生而不向系统添加任何组分。通常,分批发酵符合关于添加碳源的“分批”的资格,并且经常对控制因素(例如pH和氧浓度)进行尝试。分批系统的代谢物和生物质组成不断变化直到发酵停止时。在典型分批培养中,细胞可以通过静态停滞期进展到高生长对数期,最后进入生长速率减少或停止的稳定期。如果不经处理,处于稳定期的细胞最终死亡。通常,在对数期的细胞负责产物的大量生产。
标准分批系统的合适的变体是“补料分批发酵”系统。在典型的分批系统的这种变化中,随着发酵的进展,将底物以增量添加。当分解代谢物抑制可能抑制细胞的代谢时并且在培养基中希望具有有限量的底物的情况下,补料分批系统是有用的。在补料分批系统中实际底物浓度的测量是困难的,并且因此基于可测量因素(例如pH、溶解的氧和废气(例如CO2)的分压)的变化对其进行估计。分批和补料分批发酵是常用的并且在本领域中是已知的。
连续发酵是开放的系统,在所述系统中,将定义的发酵培养基连续添加到生物反应器中,同时去除等量的条件培养基以用于处理。连续发酵通常将培养物保持在恒定的高密度,其中细胞主要处于对数期生长。连续发酵允许对一种或多种影响细胞生长和/或产物浓度的因素进行调节。例如,在一个实施例中,将限制营养素(例如碳源或氮源)保持在固定的速率,并且允许调控所有其他参数。在其他系统中,影响生长的许多因素可以不断改变,而通过培养基浊度测量的细胞浓度保持不变。连续系统努力保持稳定态的生长条件。因此,由于转移培养基而引起的细胞损失应当与发酵中的细胞生长速率相平衡。调节用于连续发酵过程的营养素和生长因子的方法以及最大化产物形成速率的技术在工业微生物学领域中是熟知的。
因此,在某些实施例中,可以通过常规程序从培养基中回收由转化的(修饰的)宿主细胞产生的POI,所述常规程序包括通过离心或过滤从培养基中分离宿主细胞,或者如果需要,破坏细胞并从细胞部分和碎片中去除上清液。通常经过澄清后,上清液或滤液的蛋白质性组分通过盐(例如硫酸铵)沉淀。然后沉淀的蛋白质被溶解,并且可以通过各种色谱法进行纯化,例如离子交换色谱法、凝胶过滤。
VII.经修饰的(宿主)细胞产生的目的蛋白
本公开的目的蛋白(POI)可以是任何内源或异源蛋白质,并且它可以是这种POI的变体。蛋白质可以包含一个或多个二硫键,或者是其功能形式是单体或多聚体的蛋白质,即蛋白质具有四级结构并且由多个相同(同源的)或不相同的(异源的)亚基构成,其中POI或其变体POI优选是具有目的特性的POI。
例如,如在以下实例中所述,本公开的经修饰的芽孢杆菌属细胞产生增加量的内源和/或异源目的蛋白。因此,在某些实施例中,本公开的经修饰的细胞表达内源POI、异源POI或一种或多种此类POI的组合。例如,在某些实施例中,本公开的经修饰的芽孢杆菌属(子代)细胞相对于亲本芽孢杆菌属细胞产生增加量的内源POI。在其他实施例中,本公开的经修饰的芽孢杆菌属(子代)细胞相对于亲本芽孢杆菌属细胞产生增加量的异源POI。
因此,在某些实施例中,本公开的经修饰的芽孢杆菌属(子代)细胞相对于亲本芽孢杆菌(对照)细胞产生增加量的POI,其中所述增加量的POI是至少约0.01%增加、至少约0.10%增加、至少约0.50%增加、至少约1.0%增加、至少约2.0%增加、至少约3.0%增加、至少约4.0%增加、至少约5.0%增加、或超过5.0%增加。在某些实施例中,增加量的POI通过测定其酶活性和/或通过测定/定量其比生产力(Qp)来确定。同样地,本领域技术人员可以利用本领域已知的其它规方法和技术来检测、测定、测量等一种或多种目的蛋白的表达或产生。
在某些实施例中,相对于(未经修饰的)亲本芽孢杆菌属细胞,本公开的经修饰的芽孢杆菌属细胞展示POI的增加的比生产力(Qp)。例如,比生产力(Qp)的检测是用于评估蛋白质生产的适合的方法。比生产力(Qp)可以使用以下公式确定:
“Qp=gP/gDCW·hr”
其中,“gP”是罐中产生的蛋白质的克数,“gDCW”是罐中的干细胞重量(DCW)的克数,并且“hr”是从接种时间开始的几小时内的发酵时间,其包括生产时间以及生长时间。
因此,在某些其他实施例中,相比于未经修饰的(亲本)细胞,本公开的经修饰的芽孢杆菌属细胞包含至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多的比生产力(Qp)增加。
在某些实施例中,POI或其变体POI选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、阿拉伯糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂解酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡萄糖醛酸酶、糖苷水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂解酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂解酶、果胶乙酰酯酶、果胶解聚酶、果胶甲酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白质、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。
因此,在某些实施例中,POI或其变体POI是选自酶学委员会编号(EC)编号EC 1、EC2、EC 3、EC 4、EC 5或EC 6的酶。
例如,在某些实施例中,POI是包括但不限于选自以下的EC 1(氧化还原酶)酶的氧化还原酶:EC 1.10.3.2(例如,漆酶)、EC 1.10.3.3(例如,L-抗坏血酸氧化酶)、EC 1.1.1.1(例如,醇脱氢酶)、EC 1.11.1.10(例如,氯化物过氧化物酶)、EC 1.11.1.17(例如,过氧化物酶)、EC 1.1.1.27(例如,L-乳酸脱氢酶)、EC 1.1.1.47(例如,葡萄糖1-脱氢酶)、EC1.1.3.X(例如,葡萄糖氧化酶)、EC 1.1.3.10(例如,吡喃糖氧化酶)、EC 1.13.11.X(例如,加双氧酶)、EC 1.13.11.12(例如,亚油酸13S-脂氧合酶(lineolate 13S-lipozygenase))、EC 1.1.3.13(例如,醇氧化酶)、EC 1.14.14.1(例如,单加氧酶)、EC 1.14.18.1(例如,单酚单加氧酶(monophenol monooxigenase))、EC 1.15.1.1(例如,超氧化物歧化酶)、EC1.1.5.9(先前,EC 1.1.99.10,例如,葡萄糖脱氢酶)、EC 1.1.99.18(例如,纤维二糖脱氢酶)、EC 1.1.99.29(例如,吡喃糖脱氢酶)、EC 1.2.1.X(例如,脂肪酸还原酶)、EC 1.2.1.10(例如,乙醛脱氢酶)、EC 1.5.3.X(例如,果糖基胺还原酶)、EC 1.8.1.X(例如,二硫还原酶)和EC 1.8.3.2(例如,硫醇氧化酶)。
在某些实施例中,POI是包括但不限于EC 2(转移酶)酶的转移酶,所述EC 2(转移酶)酶选自EC 2.3.2.13(例如,转谷氨酰胺酶)、EC 2.4.1.X(例如,己糖基转移酶)、EC2.4.1.40(例如,交替蔗糖酶(alternasucrase))、EC 2.4.1.18(例如,1,4α-葡聚糖分支酶)、EC 2.4.1.19(例如,环麦芽糖糊精葡聚糖转移酶)、EC 2.4.1.2(例如,糊精葡聚糖酶)、EC 2.4.1.20(例如,纤维二糖磷酸化酶)、EC 2.4.1.25(例如,4-α-葡聚糖转移酶)、EC2.4.1.333(例如,1,2-β-低聚葡糖磷酸转移酶)、EC 2.4.1.4(例如,淀粉蔗糖酶)、EC2.4.1.5(例如,葡聚糖蔗糖酶)、EC 2.4.1.69(例如,半乳糖苷2-α-L-岩藻糖基转移酶)、EC2.4.1.9(例如,菊粉蔗糖酶(inulosucrase))、EC 2.7.1.17(例如,木酮糖激酶)、EC2.7.7.89(原名EC 3.1.4.15,例如,[谷氨酰氨合成酶]-腺苷-L-酪氨酸磷酸化酶)、EC2.7.9.4(例如,α葡聚糖激酶)和EC 2.7.9.5(例如,磷酸葡聚糖激酶)。
在其他实施例中,POI是包括但不限于选自以下的EC 3(水解酶)酶的水解酶:EC3.1.X.X(例如,酯酶)、EC 3.1.1.1(例如,果胶酶)、EC 3.1.1.14(例如,叶绿素酶)、EC3.1.1.20(例如,丹宁酸酶)、EC 3.1.1.23(例如,甘油酯酰基水解酶)、EC 3.1.1.26(例如,半乳糖脂酶)、EC 3.1.1.32(例如,磷脂酶A1)、EC 3.1.1.4(例如,磷脂酶A2)、EC 3.1.1.6(例如,乙酰酯酶)、EC 3.1.1.72(例如,乙酰木聚糖酯酶)、EC 3.1.1.73(例如,阿魏酸酯酶)、EC 3.1.1.74(例如,角质酶)、EC 3.1.1.86(例如,多聚鼠李半乳糖醛酸乙酰酯酶)、EC3.1.1.87(例如,fumosin B1酯酶)、EC 3.1.26.5(例如,核糖核酸酶P)、EC 3.1.3.X(例如,磷酸单酯水解酶)、EC 3.1.30.1(例如,曲霉属核酸酶S1)、EC 3.1.30.2(例如,粘质沙雷氏菌(Serratia marcescens)核酸酶)、EC 3.1.3.1(例如,碱性磷酸酶)、EC 3.1.3.2(例如,酸性磷酸酶)、EC 3.1.3.8(例如,3-植酸酶)、EC 3.1.4.1(例如,磷酸二酯酶I)、EC 3.1.4.11(例如,磷酸肌醇磷脂酶C)、EC 3.1.4.3(例如,磷脂酶C)、EC 3.1.4.4(例如,磷脂酶D)、EC3.1.6.1(例如,芳基硫酸酯酶(arylsufatase))、EC 3.1.8.2(例如,二异丙基-氟磷酸酯酶)、EC 3.2.1.10(例如,寡聚-1,6-葡萄糖苷酶)、EC 3.2.1.101(例如,甘露聚糖内切-1,6-α-甘露糖苷酶)、EC 3.2.1.11(例如,α-1,6-葡聚糖-6-葡聚糖水解酶)、EC 3.2.1.131(例如,木聚糖α-1,2-葡糖醛酸糖苷酶)、EC 3.2.1.132(例如,壳聚糖N-乙酰氨基葡萄糖水解酶)、EC 3.2.1.139(例如,α-葡萄糖醛酸酶)、EC 3.2.1.14(例如,几丁质酶)、EC 3.2.1.151(例如,木葡聚糖-特异性内切-β-1,4-葡聚糖酶)、EC 3.2.1.155(例如,木葡聚糖-特异性内切-β-1,4-葡聚糖酶)、EC 3.2.1.164(例如,半乳糖内切-1,6-β-半乳糖苷酶)、EC 3.2.1.17(例如,溶解酵素)、EC 3.2.1.171(例如,鼠李半乳糖醛酸聚糖水解酶)、EC 3.2.1.174(例如,鼠李半乳糖醛酸聚糖鼠李水解酶)、EC 3.2.1.2(例如,β-淀粉酶)、EC 3.2.1.20(例如,α-葡萄糖苷酶)、EC 3.2.1.22(例如,α-半乳糖苷酶)、EC 3.2.1.25(例如,β-甘露糖苷酶)、EC 3.2.1.26(例如,β-呋喃果糖苷酶)、EC 3.2.1.37(例如,木聚糖1,4-β-木糖苷酶)、EC3.2.1.39(例如,葡聚糖内切-1,3-β-D-葡萄糖苷酶)、EC 3.2.1.40(例如,α-L-鼠李糖苷酶)、EC 3.2.1.51(例如,α-L-岩藻糖苷酶)、EC 3.2.1.52(例如,β-N-乙酰己糖胺酶)、EC3.2.1.55(例如,α-N-阿拉伯呋喃糖酶)、EC 3.2.1.58(例如,葡聚糖1,3-β-葡萄糖苷酶)、EC3.2.1.59(例如,葡聚糖内切-1,3-α-葡萄糖苷酶)、EC 3.2.1.67(例如,半乳糖1,4-α-葡萄糖醛酸酶)、EC 3.2.1.68(例如,异淀粉酶)、EC 3.2.1.7(例如,1-β-D-果聚糖果聚糖水解酶)、EC 3.2.1.74(例如,葡聚糖1,4-β-葡萄糖苷酶)、EC 3.2.1.75(例如,葡聚糖内切-1,6-β-葡萄糖苷酶)、EC 3.2.1.77(例如,甘露聚糖1,2-(1,3)-α-甘露糖苷酶)、EC 3.2.1.80(例如,果聚糖β-果糖苷酶)、EC 3.2.1.82(例如,外切-聚-α-半乳糖醛酸酶)、EC 3.2.1.83(例如,κ-卡拉胶酶)、EC 3.2.1.89(例如,阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶)、EC3.2.1.91(例如,纤维素1,4-β-纤维二糖糖苷)、EC 3.2.1.96(例如,甘露糖-糖蛋白内切-β-N-乙酰基氨基葡萄糖苷酶)、EC 3.2.1.99(例如,阿拉伯聚糖内切-1,5-α-L-树胶醛醣(arabinan endo-1,5-alpha-L-arabinanase))、EC 3.4.X.X(例如,肽酶)、EC 3.4.11.X(例如,氨基肽酶)、EC 3.4.11.1(例如,亮氨酰氨基肽酶)、EC 3.4.11.18(例如,甲硫氨酰基氨基肽酶)、EC 3.4.13.9(例如,Xaa-Pro二肽酶)、EC 3.4.14.5(例如,二肽-肽酶IV)、EC3.4.16.X(例如,丝氨酸型羧基肽酶)、EC 3.4.16.5(例如,羧肽酶C)、EC 3.4.19.3(例如,焦谷氨酰-肽酶I)、EC 3.4.21.X(例如,丝氨酸肽链内切酶)、EC 3.4.21.1(例如,糜蛋白酶)、EC 3.4.21.19(例如,谷酰基内切肽酶)、EC 3.4.21.26(例如,脯氨酰寡聚肽酶)、EC3.4.21.4(例如,胰蛋白酶)、EC 3.4.21.5(例如,凝血酶)、EC 3.4.21.63(例如,水稻素(oryzin))、EC 3.4.21.65(例如,嗜热霉菌素(thermomycolin))、EC 3.4.21.80(例如,链霉菌素(streptogrisin)A)、EC 3.4.22.X(例如,半胱氨酸内肽酶)、EC 3.4.22.14(例如,猕猴桃蛋白酶)、EC 3.4.22.2(例如,木瓜蛋白酶)、EC 3.4.22.3(例如,无花果蛋白酶(ficain))、EC 3.4.22.32(例如,有树干蛋白酶(stem bromelain))、EC 3.4.22.33(例如,菠萝果蛋白酶(fruit bromelain))、EC 3.4.22.6(例如,木瓜凝乳蛋白酶)、EC 3.4.23.1(例如,胃蛋白酶A)、EC 3.4.23.2(例如,胃蛋白酶B)、EC 3.4.23.22(例如,壳室囊菌蛋白酶(endothiapepsin))、EC 3.4.23.23(例如,mucorpepsin)、EC 3.4.23.3(例如,胃亚蛋白酶(gastricsin))、EC 3.4.24.X(例如,金属内肽酶(metalloendopeptidase))、EC 3.4.24.39(例如,deuterolysin)、EC 3.4.24.40(例如,serralysin)、EC 3.5.1.1(例如,天冬酰胺酶)、EC 3.5.1.11(例如,青霉素酰胺酶)、EC 3.5.1.14(例如,N-酰基-脂肪族-L-氨基酸氨基水解酶)、EC 3.5.1.2(例如,L-谷氨酰胺氨基水解酶)、EC 3.5.1.28(例如,N-乙酰胞壁酸-L-丙氨酸酰胺酶)、EC 3.5.1.4(例如,酰胺酶)、EC 3.5.1.44(例如,蛋白-L-谷氨酰胺氨基水解酶)、EC 3.5.1.5(例如,脲酶)、EC 3.5.1.52(例如,肽-N(4)-(N-乙酰基-β-葡糖胺)天冬酰胺酰胺酶)、EC 3.5.1.81(例如,N-酰基-D-氨基-酸脱酰基酶)、EC 3.5.4.6(例如,AMP脱氨酶)和EC 3.5.5.1(例如,腈水解酶)。
在其他实施例中,POI是包括但不限于选自以下的EC 4(裂解酶)酶的裂解酶:EC4.1.2.10(例如,苯乙醇腈裂解酶)、EC 4.1.3.3(例如,N-乙酰神经氨酸裂解酶)、EC4.2.1.1(例如,碳酸脱水酶)、EC 4.2.2.-(例如,鼠李半乳糖醛酸聚糖裂解酶)、EC4.2.2.10(例如,果裂解酶)、EC 4.2.2.22(例如,果胶三糖-裂解酶)、EC 4.2.2.23(例如,鼠李半乳糖醛酸聚糖内切裂解酶)和EC 4.2.2.3(例如,甘露糖醛特异性海藻酸裂解酶)。
在某些其他实施例中,POI是包括但不限于选自以下的EC 5(异构酶)酶的异构酶:EC 5.1.3.3(例如,醛糖1-差向异构酶)、EC 5.1.3.30(例如,D-阿洛酮糖3-差向异构酶)、EC5.4.99.11(例如,异麦芽酮糖合酶)和EC 5.4.99.15(例如,(1→4)-α-D-葡聚糖1-α-D-葡萄糖基变位酶((1→4)-α-D-glucan 1-α-D-glucosylmutase))。
在又其他实施例中,POI是包括但不限于选自以下的EC 6(连接酶)酶的连接酶:EC6.2.1.12(例如,4-香豆酸:辅酶A连接酶)和EC 6.3.2.28(例如,L-氨基酸α-连接酶)9。
因此,在某些实施例中,产生工业蛋白酶的芽孢杆菌属宿主细胞提供特别优选的表达宿主。同样地,在某些其他实施例中,产生工业淀粉酶的芽孢杆菌属宿主细胞提供特别优选的表达宿主。
例如,存在两种一般类型的蛋白酶通常由芽孢杆菌属物种分泌,即中性(或“金属蛋白酶”)和碱性(或“丝氨酸”)蛋白酶。例如,芽孢杆菌枯草杆菌蛋白酶蛋白质(酶)是可用于在本公开中使用的示例性丝氨酸蛋白酶。已经鉴定并测序了多种枯草芽孢杆菌蛋白酶,例如枯草杆菌蛋白酶168、枯草杆菌蛋白酶BPN’、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶DY、枯草杆菌蛋白酶147和枯草杆菌蛋白酶309(例如,WO 1989/06279和Stahl等人,1984)。在本公开的一些实施例中,经修饰的芽孢杆菌属细胞产生突变体(即,变体)蛋白酶。许多参考文献提供变体蛋白酶的实例,如PCT公开号WO 1999/20770;WO 1999/20726;WO1999/20769;WO 1989/06279;U.S.RE34,606;美国专利号4,914,031;4,980,288;5,208,158;5,310,675;5,336,611;5,399,283;5,441,882;5,482,849;5,631,217;5,665,587;5,700,676;5,741,694;5,858,757;5,880,080;6,197,567和6,218,165。因此,在某些实施例中,本公开的经修饰的芽孢杆菌属细胞包含编码蛋白酶的表达构建体。
在某些其他实施例中,本公开的经修饰的芽孢杆菌属细胞包含编码淀粉酶的表达构建体。多种淀粉酶及其变体是本领域技术人员已知的。例如,国际PCT公开号WO 2006/037484和WO 2006/037483描述了具有改善的溶剂稳定性的变体α-淀粉酶,公开号WO 1994/18314公开了氧化稳定的α-淀粉酶变体,公开号WO 1999/19467、WO 2000/29560和WO 2000/60059公开了Termamyl-样α-淀粉酶变体,公开号WO 2008/112459公开了衍生自芽孢杆菌属物种编号707的α-淀粉酶变体,公开号WO 1999/43794公开了麦芽生成的α-淀粉酶变体,公开号WO 1990/11352公开了超热稳定的(hyper-thermostable)α-淀粉酶变体,公开号WO2006/089107公开了具有颗粒淀粉水解活性的α-淀粉酶变体。
在其他实施例中,在本公开的经修饰细胞中表达和产生的POI或变体POI是肽、肽激素、生长因子、凝血因子、趋化因子、细胞因子、淋巴因子、抗体、受体、粘附分子、微生物抗原(例如,HBV表面抗原、HPV E7等)、其变体、其片段等。其他类型的目的蛋白(或其变体)可以是能够为食品或作物提供营养价值的蛋白质或变体。非限制性实例包括可以抑制抗营养因子形成的植物蛋白质和具有更理想的氨基酸组成的植物蛋白质(例如比非转基因植物具有更高的赖氨酸含量)。
本领域普通技术人员已知有用于检测和测量细胞内和细胞外所表达的蛋白质的活性的各种测定。特别地,对于蛋白酶,存在基于来自酪蛋白或血红蛋白的酸溶性肽的释放的测定,其作为280nm下的吸光度测量或使用Folin方法进行比色测定(例如Bergmeyer等人,1984)。其他测定涉及生色底物的溶解(参见例如,Ward,1983)。其他示例性测定包括琥珀酰-Ala-Ala-Pro-Phe-对-硝基苯胺测定(SAAPFpNA)和2,4,6-三硝基苯磺酸钠盐测定(TNBS测定)。本领域技术人员已知的许多另外的参考文献提供了适合的方法(参见例如,Wells等人,1983;Christianson等人,1994和Hsia等人,1999)。
国际PCT公开号WO 2014/164777公开了可用于本文所述淀粉酶活性的Ceralphaα-淀粉酶活性测定。
用于确定宿主细胞中目的蛋白的分泌水平并且检测所表达的蛋白质的手段包括使用对蛋白质具有特异性的多克隆或单克隆抗体的免疫测定。实例包括酶联免疫吸附测定(ELISA)、放射免疫测定(RIA)、荧光免疫测定(FIA)以及荧光激活细胞分选术(FACS)。
实例
根据以下实例可以进一步理解本发明的某些方面,所述实例不应被解释为限制性的。材料和方法的修改对本领域技术人员而言是显而易见的。
实例1
在编码变体GlcT蛋白质的基因中包含单一核苷酸多态性(SNP)的突变体地衣芽孢杆菌子代细胞
如以上在具体实施方式中简要阐述的,本公开的申请人进行了常规NTG(N-甲基-N′-硝基-N-亚硝基胍)诱变以创建地衣芽孢杆菌突变体库(即,地衣芽孢杆菌子代细胞),随后筛选NTG修饰的子代细胞以鉴定可以增加工业相关目的蛋白(例如,淀粉酶、蛋白酶等)的产生的地衣芽孢杆菌子代细胞突变。更特别地,经由常规Ceralphaα-淀粉酶测定,申请人鉴定了在编码变体GlcT蛋白质的基因(即,等位基因glcT1;SEQ ID NO:56)中包含SNP的突变体地衣芽孢杆菌(子代)细胞,其变体地衣芽孢杆菌细胞相对于包含编码野生型GlcT蛋白质的基因的亲本地衣芽孢杆菌细胞能够产生增加量的异源淀粉酶蛋白质(例如,参见以下实例8),其中在相同条件下培养所述变体和亲本细胞。以下在实例8中进一步描述的Ceralphaα-淀粉酶测定一般涉及在确定的条件下将全培养液与底物混合物一起孵育,其中通过添加碱溶液终止反应(并显色)(例如,如PCT公开号WO 2014/164777中所述)。
因此,如以上在具体实施方式中一般所述,野生型地衣芽孢杆菌glcT基因编码SEQID NO:82的野生型GlcT蛋白质(在SEQ ID NO:82的氨基酸位置67处包含亮氨酸(L)),所述野生型GlcT蛋白质是转录抗终止子蛋白质(例如,参见Schmalisch等人,2003;Manival等人,1997;Stulke等人,1998;Postma等人,1993;Stulke和Hillen,2000;Plumbridge,2002;Stulke等人,1997以及Langbein等人,1999)。突变型glcT基因(即,等位基因glcT1;SEQ IDNO:56)编码SEQ ID NO:55的变体GlcT蛋白质,所述变体GlcT蛋白质在氨基酸位置67处包含亮氨酸(L)至苯丙氨酸(F)氨基酸取代(F67;SEQ ID NO:55;例如,参见图1A和图1B)。
实例2
glcT Cas9靶向载体的构建
将编码来自化脓链球菌的Cas9蛋白(SEQ ID NO:1)(包含N-末端核定位序列(NLS;“APKKKRKV”;SEQ ID NO:2)、C-末端NLS(“KKKKLK”;SEQ ID NO:3)和十-组氨酸标签(“HHHHHHHHHH”;SEQ ID NO:4))的合成多核苷酸有效地连接至来自枯草芽孢杆菌的aprE启动子(SEQ ID NO:5),并使用Q5 DNA聚合酶(NEB)(按照制造商的说明书)用下面表2中列出的正向(SEQ ID NO:6)/反向(SEQ ID NO:7)引物对进行扩增。
表2
正向和反向引物对
正向 ATATATGAGTAAACTTGGTCTGACAGAATTCCTCCATTTTCTTCTGCTAT SEQ ID NO:6
反向 TGCGGCCGCGAATTCGATTACGAATGCCGTCTCCC SEQ ID NO:7
使用Q5 DNA聚合酶(NEB)(按照制造商的说明书)用下面表3中所列出的正向(SEQID NO:10)/反向(SEQ ID NO:11)引物对扩增质粒pKB320(SEQ ID NO:9)的主链(SEQ IDNO:8)。
表3
正向和反向引物对
正向 GGGAGACGGCATTCGTAATCGAATTCGCGGCCGCA SEQ ID NO:10
反向 ATAGCAGAAGAAAATGGAGGAATTCTGTCAGACCAAGTTTACTCATATAT SEQ ID NO:11
按照制造商的说明书用Zymo清洁和浓缩(Zymo clean and concentrate)5柱纯化PCR产物。随后,用Q5聚合酶(NEB)与等摩尔比的两个片段混合,使用延长重叠延伸PCR(POE-PCR)组装PCR产物。POE-PCR反应循环进行:98℃持续五(5)秒,64℃持续十(10)秒,72℃持续四(4)分钟十五(15)秒,持续30个循环。将五(5)μl POE-PCR(DNA)按照制造商的说明书转化进入Top10大肠杆菌(英杰公司(Invitrogen)),并在包含五十(50)μg/ml硫酸卡那霉素并用1.5%琼脂固化的溶源性(L)液体培养基汤(米勒配方;1%(w/v)胰蛋白胨、0.5%酵母提取物(w/v),1%NaCl(w/v))中选择。允许菌落在37℃下生长十八(18)小时。挑取菌落,并使用Qiaprep DNA迷你制备试剂盒(按照制造商的说明书)制备质粒DNA,并用五十(55)μl ddH2O进行洗脱。使用下面表4中所列出的测序引物(SEQ ID NO:12-20)对质粒DNA进行桑格测序以验证正确组装。
表4
测序引物
反向 CCGACTGGAGCTCCTATATTACC SEQ ID NO:12
反向 GCTGTGGCGATCTGTATTCC SEQ ID NO:13
正向 GTCTTTTAAGTAAGTCTACTCT SEQ ID NO:14
正向 CCAAAGCGATTTTAAGCGCG SEQ ID NO:15
正向 CCTGGCACGTGGTAATTCTC SEQ ID NO:16
正向 GGATTTCCTCAAATCTGACG SEQ ID NO:17
正向 GTAGAAACGCGCCAAATTACG SEQ ID NO:18
正向 GCTGGTGGTTGCTAAAGTCG SEQ ID NO:19
正向 GGACGCAACCCTCATTCATC SEQ ID NO:20
使用正确组装质粒,pRF694(SEQ ID NO:21)以组装质粒用于引入L67F glcT突变。更特别地,地衣芽孢杆菌的glcT基因(SEQ ID NO:22)含有覆盖L67密码子(SEQ ID NO:23)的Cas9靶位点。通过去除PAM序列(SEQ ID NO:25),将靶位点转化为编码可变靶向(VT)结构域的DNA序列(SEQ ID NO:24)。可以将编码VT结构域的DNA序列(SEQ ID NO:24)有效地融合到编码Cas9内切核酸酶识别结构域(CER,SEQ ID NO:26)的DNA序列,使得当被细胞中RNA聚合酶转录时,它产生功能性gRNA(SEQ ID NO:27)。可以将编码gRNA的DNA(SEQ ID NO:28)有效地连接至在芽孢杆菌属物种细胞中有效的启动子(例如,来自枯草芽孢杆菌的rrnIp2启动子;SEQ ID NO:29)和在芽孢杆菌属物种细胞中有效的终止子(例如,λ噬菌体的t0终止子;SEQ ID NO:30),使得所述启动子位于编码gRNA的DNA的5',并且所述终止子位于编码gRNA的DNA的3′,以创建gRNA表达盒(SEQ ID NO:31)。
可以通过创建两个片段,从地衣芽孢杆菌基因组DNA(gDNA)扩增在glcT中创建L67F突变的编辑模板。首先,使用Q5 DNA聚合酶(按照制造商的说明书)以及下面表5中所列出的正向(SEQ ID NO:33)和反向(SEQ ID NO:34)引物对扩增glcT的密码子67的第一位置的500bp上游(5′)(SEQ ID NO:32),其中在这种情况下的反向引物含有密码子67的第一位置从CTC至TTC的改变,从而将密码子67从亮氨酸转化为苯丙氨酸。
表5
正向和反向引物对
正向 TGAGTAAACTTGGTCTGACATAAGCTGTGACAACCAGC SEQ ID NO:33
反向 CCATTTTTTCATCGACATAAGTGAAGAGCTTCTTATACTGCGATT SEQ ID NO:34
使用Q5 DNA聚合酶(按照制造商的说明书)以及下面表6中所列出的正向(SEQ IDNO:36)和反向(SEQ ID NO:37)引物对从地衣芽孢杆菌gDNA扩增含有glcT的密码子67的第一位置的500bp下游(3′)的第二片段(SEQ ID NO:35)。
表6
正向和反向引物对
正向 AATCGCAGTATAAGAAGCTCTTCACTTATGTCGATGAAAAAATGG SEQ ID NO:36
反向 CAGAAGAAAATGGAGGAATTCCAACATTAATTTTTCCGGTTCCTGA SEQ ID NO:37
可以使用产生质粒pRF731(SEQ ID NO:38)的标准分子生物学技术,将含有gRNA表达盒的DNA片段和两个同源臂组装成pRF694,从而产生大肠杆菌-地衣芽孢杆菌穿梭质粒,所述大肠杆菌-地衣芽孢杆菌穿梭质粒含有Cas9表达盒、编码靶向glcT的gRNA的gRNA表达盒和1001bp glcT编辑模板,所述glcT编辑模板将在glcT基因中创建L67F突变并消除glcTts1并减轻Cas9介导的靶位点切割。
实例3
包含glcTL67F突变的地衣芽孢杆菌细胞的产生
在本实例中,使用滚环扩增(Sygnis)(按照制造商的说明书)将以上所述的pRF731质粒(SEQ ID NO:38)扩增18小时。将滚环扩增的pRF731(SEQ ID NO:38)转化到感受态(亲本)地衣芽孢杆菌细胞中,所述细胞包含(具有)pBL.comK质粒(SEQ ID NO:50),如国际PCR公开号WO 2017/075195、WO 2002/14490和WO 2008/7989中一般描述的。将细胞/DNA转化混合物铺板到含有20μg/ml卡那霉素并用1.5%琼脂固化的L-液体培养基(米勒配方)上。允许菌落在37℃下形成。将生长在含有卡那霉素的L琼脂板上的菌落挑出,并在含有100μg/ml壮观霉素的L琼脂板上划线以针对pBL.comK质粒(SEQ ID NO:50)进行选择。使用Q5(NEB)DNA聚合酶和标准PCR反应,使用表7中所列出的反向(SEQ ID NO:52)和正向(SEQ ID NO:53)引物对,从转化的细胞扩增glcT基因座(SEQ ID NO:51)。
表7
正向和反向引物对
正向 CGGCATCAAGTGGATATTCC SEQ ID NO:52
反向 TGTAACACAGCGGATATTCC SEQ ID NO:53
使用以下步骤进行菌落PCR:(1)98℃持续3分钟,(2)98℃持续5秒,(3)63℃持续10秒,(4)72℃持续30秒,以及(5)重复步骤2-4 29次,72℃持续3分钟。成功的PCR将从glcT基因座(SEQ ID NO:50)扩增1,069bp多核苷酸。通过与5μl的Exo-SAP-IT混合来纯化二(2)μl的PCR,并将其在37℃下孵育15分钟,然后在80℃下孵育15分钟。将纯化的PCR反应用40μl的ddH2O稀释并用正向引物“TGAGGATCGTGAACAGATCC”(SEQ ID NO:54)进行桑格测序。
测序数据与WT glcT基因座(SEQ ID NO:51)比较的序列比对揭示了一些回收的菌落含有所希望的引起GlcT蛋白质的L67F突变(SEQ ID NO:55)的基因组编辑。将含有编码L67F GlcT蛋白质(SEQ ID NO:55)的glcT基因(SEQ ID NO:56)(现在命名为等位基因glcT1,其对100μg/ml壮观霉素仍具有抗性)的菌落,(包含pBL.comK)以菌株BF63(glcT1pBL.comK)存储。
实例4
rghR2 Cas9靶向载体的构建
使用Q5(按照制造商的说明书)以及表8中所列出的正向(SEQ ID NO:43)和反向(SEQ ID NO:44)引物对,通过扩增来自质粒pRF694的8.3kb DNA片段(SEQ ID NO:42),创建质粒pRF724(SEQ ID NO:39),所述质粒靶向地衣芽孢杆菌rghR2基因(SEQ ID NO:41)的密码子24-29(SEQ ID NO:40)的重复。
表8
正向和反向引物对
正向 GAATTCGCGGCCGCACG SEQ ID NO:43
反向 GATTACGAATGCCGTCTCCCGGTATCAGG SEQ ID NO:44
从IDT订购含有rghR2编辑模板(SEQ ID NO:46)、rrnIp2-gRNA表达盒(SEQ ID NO:47)的合成DNA片段(SEQ ID NO:45),并使用Q5 DNA聚合酶和标准PCR技术,使用表9中列出的正向(SEQ ID NO:48)和反向(SEQ ID NO:49)引物对将其进行扩增。
表9
正向和反向引物对
正向 GGCGGCGTTTTCCTGATACCGGGAG SEQ ID NO:48
反向 ACCCGCGGGGATCCCCATGG SEQ ID NO:49
编辑模板gRNA表达盒片段(SEQ ID NO:47)与从pRF694扩增的片段(SEQ ID NO:42)具有5′和3′同源性。使用延长重叠延伸PCR组装这两个部分,并将其转化到大肠杆菌中。经序列验证的分离物以质粒pRF724存储(SEQ ID NO:39)。
实例5
包含rghR2恢复的等位基因的地衣芽孢杆菌细胞的产生
使用滚环扩增(RCA)(Sygnis)(按照制造商的说明书)将质粒pRF724(SEQ ID NO:39)扩增18小时。将滚环扩增的pRF724(SEQ ID NO:39)转化到感受态(亲本)地衣芽孢杆菌细胞中,所述细胞包含(具有)pBL.comK质粒(SEQ ID NO:50),如国际PCR公开号WO 2017/075195、WO 2002/14490和WO 2008/7989中一般描述的。将细胞/DNA转化混合物铺板到含有二十(20)μg/ml卡那霉素并用1.5%(w/v)琼脂固化的L-液体培养基(miller)上。允许菌落在37℃下形成。
将生长在含有卡那霉素的L琼脂上的菌落挑出,并在含有一百100μg/ml壮观霉素的琼脂板上划线以针对质粒pBL.comK(SEQ ID NO:50)进行选择。使用Q5 DNA聚合酶(NEB)和标准PCR反应,使用表10中所列出的正向(SEQ ID NO:58)和反向(SEQ ID NO:59)引物对,从转化子扩增rghR2基因座(SEQ ID NO:57)。
表10
正向和反向引物对
正向 GCGAATCGAAAACGGAAAGC SEQ ID NO:58
反向 TCATCGCGATCGGCATTACG SEQ ID NO:59
如实例4中所述进行PCR循环,其中所述PCR反应扩增了rghR2基因座(SEQ ID NO:57)。如实例4中所述将PCR产物进行纯化,并用表11中所列出的测序引物(SEQ ID NO:60)使用桑格法进行测序。
表11
测序引物
正向 TTTCGACTTTCTCGTGCAGG SEQ ID NO:60
数据与亲本rghR2基因座(SEQ ID NO:57)比较的测序比对揭示了大部分回收的菌落含有rghR2恢复的等位基因(SEQ ID NO:61),所述rghR2恢复的等位基因包含密码子24-29的串联重复(SEQ ID NO:40)的缺失。将含有对一百(100)μg/ml的壮观霉素仍具有抗性的rghR2恢复的等位基因的菌落(包含pBL.comK)以菌株BF62(rghR2恢复的pBL.comK)存储。
实例6
包含rghR2恢复的和glcT1等位基因的地衣芽孢杆菌细胞的产生
使用RCA(Sygnis)(按照制造商的说明书)将质粒pRF724(SEQ ID NO:39)扩增18小时。将滚环扩增的pRF724(SEQ ID NO:39)转化到感受态BF63(glcT1)地衣芽孢杆菌细胞中(参见,实例3),所述细胞包含(具有)pBL.comK(SEQ ID NO:50)质粒。将细胞/DNA转化混合物铺板到含有二十(20)μg/ml卡那霉素并用1.5%(w/v)琼脂固化的L-液体培养基(miller)上。允许菌落在37℃下形成。
将生长在含有卡那霉素的L琼脂上的菌落挑出,并在含有一百100μg/ml壮观霉素的琼脂板上划线。使用Q5 DNA聚合酶(NEB)和标准PCR反应,使用表12中所列出的正向(SEQID NO:58)和反向(SEQ ID NO:59)引物对,从转化子扩增rghR2基因座(SEQ ID NO:57)。
表12
正向和反向引物对
正向 GCGAATCGAAAACGGAAAGC SEQ ID NO:58
反向 TCATCGCGATCGGCATTACG SEQ ID NO:59
如实例4中所述进行PCR循环,其中所述PCR反应扩增了rghR2基因座(SEQ ID NO:57)。如实例4中所述将PCR产物进行纯化,并用表13中所列出的测序引物(SEQ ID NO:60)使用桑格法进行测序。
表13
测序引物
正向 TTTCGACTTTCTCGTGCAGG SEQ ID NO:60
数据与亲本rghR2基因座(SEQ ID NO:57)比较的测序比对揭示了大部分回收的菌落含有rghR2恢复的等位基因(SEQ ID NO:61),所述rghR2恢复的等位基因包含密码子24-29的串联重复(SEQ ID NO:40)的缺失。将含有对一百(100)μg/ml的壮观霉素仍具有抗性的rghR2恢复的等位基因(SEQ ID NO:61)的菌落(包含pBL.comK)以菌株BF169(宿主rghR2恢复的glcT1 pBL.comK)存储。
实例7
将异源淀粉酶表达盒插入到亲本和经修饰的地衣芽孢杆菌细胞BF62、BF63和BF169中
在本实例中,申请人将异源α-淀粉酶表达盒引入亲本和经修饰的地衣芽孢杆菌细胞BF62、BF63和BF169中。更特别地,将以下所述的α-淀粉酶表达盒引入到亲本和经修饰的地衣芽孢杆菌细胞BF63、BF62和BF169中,其中经修饰的地衣芽孢杆菌(子代)细胞“BF63”包含引入的等位基因“glcT1”(即,编码变体GlcT蛋白质),经修饰的地衣芽孢杆菌(子代)细胞“BF62”包含恢复的rghr2基因(rghr2恢复的),并且经修饰的地衣芽孢杆菌(子代)细胞“BF169”包含引入的等位基因glcT1和恢复的(rghr2恢复的)基因两者,如下表14中所呈现的。
表14
地衣芽孢杆菌(子代)细胞修饰
细胞/菌株名称 遗传修饰
地衣芽孢杆菌(亲本)细胞 n/a
BF63(子代)细胞 glcT1(L67F)
BF62(子代)细胞 rghr2恢复的
BF169(子代)细胞 glcT1(L67F)+rghr2恢复的
更特别地,关于异源α-淀粉酶表达盒,申请人通过创建α-淀粉酶表达盒进一步测试了经修饰的5′非翻译区(mod-5′-UTR)序列对编码目的蛋白的基因在芽孢杆菌属细胞中表达的作用,所述α-淀粉酶表达盒包含野生型枯草芽孢杆菌aprE 5′-UTR(WT-5′-UTR;SEQID NO:62)或经修饰的5′-UTR(mod-5′-UTR;SEQ ID NO:63)。因此,本实例描述了用于评估各种(经修饰的)5′-UTR构建体的芽孢杆菌属宿主细胞的创建,以及当此类经修饰的5′-UTR构建体有效地连接到上游(5′)启动子和编码目的蛋白的下游(3′)可读框时,其对所述目的蛋白的产生的影响/作用。
因此,在本实例中,包含携带木糖诱导的comK表达盒(SEQ ID NO:50)的质粒的亲本地衣芽孢杆菌细胞和经修饰的地衣芽孢杆菌(子代)细胞BF62、BF63和BF169(表14)在125ml挡板的烧瓶中在含有一百(100)μg/ml壮观霉素二盐酸盐的十五(15)ml的L液体培养基(1%(w/v)胰蛋白胨、0.5%酵母提取物(w/v)、1%NaCl(w/v))中在37C和250RPM下生长过夜。将过夜培养物在两百五十(250)ml挡板烧瓶中在含有一百(100)μg/ml壮观霉素二盐酸盐的25ml新鲜L肉汤中稀释至0.7(OD600单位)。将细胞在37℃(250RPM)下生长一(1)小时。将D-木糖添加至来自50%(w/v)原料的0.1%(w/v)。使细胞在37℃(250RPM)下再生长四(4)小时,并在1700x g下沉淀七(7)分钟。
使用用过的培养基将细胞重悬于四分之一(1/4)体积的原始培养物中。将一百(100)μl浓缩的细胞与大约一(1)μg野生型(WT)5′-UTR表达构建体(WT-5′-UTR;SEQ ID NO:64)或经修饰的5′-UTR表达构建体(mod-5′-UTR;SEQ ID NO:65)混合。例如,每个表达盒包含(按5′至3′方向)相同的5′catH同源臂(SEQ ID NO:66)、catH基因(SEQ ID NO:67)和spoVGrrnIp杂合启动子(SEQ ID NO:68),有效地连接到野生型枯草芽孢杆菌aprE 5′-UTR(SEQ ID NO:62)或经修饰的aprE 5′-UTR(SEQ ID NO:63)。另外,将5′-UTR有效地连接至编码lat信号序列(SEQ ID NO:69)的DNA,所述DNA后是编码变体嗜热脂肪土芽孢杆菌α-淀粉酶(SEQ ID NO:70)的DNA(ORF)。将编码变体嗜热脂肪土芽孢杆菌α-淀粉酶(SEQ ID NO:70)的DNA(ORF)的3′端有效地连接至lat终止子(SEQ ID NO:71),所述lat终止子有效地连接至3′catH同源臂(SEQ ID NO:72)。将转化反应在37℃、1000RPM下孵育大约九十(90)分钟。
将转化混合物铺板在填充有L-肉汤的培养皿上,所述L-肉汤含有用1.5%(w/v)琼脂固化的十(10)μg/ml氯霉素。将板在37℃下孵育两(2)天。将菌落在用含有用1.5%(w/v)琼脂固化的1%(w/v)不溶性玉米淀粉的L-肉汤满充的培养皿上进行条纹纯化。将平板在37℃下孵育二十四(24)小时直至形成菌落。通过清除菌落周围的不溶性淀粉(形成晕圈)来指示淀粉水解,并用于选择表达变体嗜热脂肪土芽孢杆菌α-淀粉酶蛋白质(SEQ ID NO:73)的转化体。使用标准技术以及表15中所列出的正向(SEQ ID NO:76)和反向(SEQ ID NO:77)引物对,将菌落PCR用于扩增来自产生晕圈的菌落的catH基因座(WT构建体;SEQ ID NO:74;经修饰的构建体,SEQ ID NO:75)。
表15
正向和反向引物对
正向 TGTGTGACGGCTATCATGCC SEQ ID NO:76
反向 TTGAGAGCCGGCGTTCC SEQ ID NO:77
使用标准技术将PCR产物从过量的引物和核苷酸中纯化,并使用桑格法和表16中所列出的测序引物进行测序。
表16
测序引物
正向 AACGAGTTGGAACGGCTTGC SEQ ID NO:78
正向 GGCAACACCTACTCCAGCTT SEQ ID NO:79
正向 GATCACTCCGACATCATCGG SEQ ID NO:80
将包含WT-5′UTR表达盒(SEQ ID NO:64)的经序列验证的地衣芽孢杆菌(子代)细胞或包含经修饰的5′-UTR(mod-5′-UTR)表达盒(SEQ ID NO:65)的经序列验证的地衣芽孢杆菌(子代)细胞如表17中所示存储。
表17
包含WT-5′-UTR表达盒或MOD-5′-UTR表达盒的亲本和经修饰的地衣芽孢杆菌细胞
/>
实例8
在经修饰的地衣芽孢杆菌细胞中产生淀粉酶
在本实例中,在补充有1%不溶性淀粉的Luria琼脂板上划线经修饰的地衣芽孢杆菌细胞(包含编码变体GlcT蛋白质(即,L67F取代)的(突变体)等位基因glcT1(SNP C199T))和野生型(亲本)地衣芽孢杆菌细胞。更特别地,用上文实例7,表17中所述的淀粉酶构建体转化表18中所列出的亲本和经修饰的地衣芽孢杆菌(子代)细胞(即,WT-5′-UTR表达盒SEQID NO:64或mod-5′-UTR表达盒SEQ ID NO:65),将其如表18中所示进行测试并存储。
表18
筛选的地衣芽孢杆菌宿主细胞
更特别地,指示淀粉分解活性的清除区在包含所整合的淀粉酶表达盒的菌落周围清晰可见。因此,通过使用MOPS基础培养基MBD培养基在微量滴定板中使细胞生长,来对由地衣芽孢杆菌细胞的淀粉酶产生进行实验测试,所述培养基基本上按照本领域已知的进行制备(参见Neidhardt等人,1974),除了以下:从基础培养基中省略NH4Cl2、FeSO4和CaCl2,使用三(3)mM K2HPO4,并在基础培养基中补充六十(60)mM尿素、七十五(75)g/L葡萄糖和百分之一(1%)的大豆蛋白。将微量营养素制成一升100X储备溶液:400mg FeSO4 7H2O、100mgMnSO4 H2O、100mg ZnSO4 7H2O、50mg CuCl2 2H2O、100mg CoCl2 6H2O、100mg NaMoO4 2H2O、100mg Na2B4O7 10H2O、10ml的1M CaCl2、和10ml的0.5M柠檬酸钠。将CaCl2添加至五(5)mM,并将pH调节至6.8。
在Infors培养箱(37℃,270rpm)中生长七十(70)小时后,使用α-淀粉酶Ceralpha测定试剂盒(梅格泽姆公司(Megazyme),爱尔兰威克洛)确定全细胞培养液中的淀粉酶酶浓度。Ceralphaα-淀粉酶测定涉及在确定的条件下将全培养液与底物混合物一起孵育,并通过添加碱溶液终止反应(并显色)。底物是限定的寡糖“非还原端封闭的对硝基苯基麦芽七糖苷”(BPNPG7底物)和过量水平的葡糖淀粉酶和β-葡糖苷酶(由于存在“阻断基团”,其对天然底物没有作用)的混合物。当通过内切作用α-淀粉酶(或C6淀粉酶)水解寡糖时,混合物中存在的过量的α-葡糖苷酶和葡糖淀粉酶使对硝基苯基麦芽糖片段瞬时和定量水解成葡萄糖和游离的对硝基苯酚。测量405nm处的吸光度,并且直接与分析的样品中的淀粉酶的水平相关。用于这组测定的设备包括Biomek FX机械臂(贝克曼库尔特公司(BeckmanCoulter));SpectraMAX MTP读数器(340型-分子器件公司)和iEMS培养箱/振荡器(赛默飞世尔科技公司(Thermo Scientific))。在此测定系统中,所使用的试剂和溶液是:(1)对硝基苯基麦芽七糖苷(BPNPG7)底物(Megazyme Ceralpha试剂盒);(2)稀释缓冲液:50mMMOPS、0.1mM CaCl2、0.005%80缓冲液,pH 7.15;和(3)200mM硼酸/NaOH缓冲液,pH 10.2(STOP缓冲液)。
因此,将含有54.5mg BPNPG7底物的小瓶溶解于十(10)ml的milliQ水中。用稀释缓冲液将淀粉酶样品(全细胞培养液)稀释1600倍。通过将二十五(25)μl稀释的淀粉酶溶液添加到MTP的孔中,随后添加三十五(35)μl的5.45mg/ml BPNPG7底物溶液来进行测定。将溶液混合并将MTP用平板密封件密封并置于25℃的培养箱/振荡器(iEMS-赛默科技公司(ThermoScientific))中八(8)分钟。通过添加一百(100)μl STOP缓冲液终止反应,并在MTP读数器中在405nm处读取吸光度。使用非酶对照来校正背景吸光度值。为了计算变体淀粉酶酶浓度(mg/l),将纯化的变体淀粉酶酶标准对照样品的稀释系列并入实验中。
图2A和图2B中分别示出了淀粉酶的淀粉酶活性和比生产力。例如,如图2B中所呈现的,BF134细胞(BF134:WT-5′-UTR和WT-GlcT)的标准化比生产力相对于BF117细胞(BF117:mod-5′-UTR和WT-GlcT)表现出相似的淀粉酶生产力。相比之下,如图2B中所呈现的,HM151细胞(HM151:WT-5′-UTR和等位基因GlcT1)的标准化比生产力相对于BF134细胞或BF117细胞(即,包含野生型GlcT基因的BF134和BF117细胞两者)表明HM151细胞的比生产力大约5%的增加,从而证明包含等位基因glcT1的经修饰的芽孢杆菌属细胞相对于包含天然野生型glcT基因的芽孢杆菌属细胞能够产生增加量的目的蛋白。
此外,如图2B中所呈现的,HM150-1细胞(HM150-1:mod-5′-UTR和等位基因GlcT1)的标准化比生产力相对于BF134细胞或BF117细胞(即,包含野生型GlcT基因)表明HM150-1细胞的比生产力大约9%的增加,进一步证明包含等位基因glcT1的经修饰的芽孢杆菌属细胞相对于包含野生型glcT基因的芽孢杆菌属细胞能够产生增加量的目的蛋白。同样地,HM150-1细胞(HM150-1:mod-5′-UTR和等位基因GlcT1)的标准化比生产力相对于HM151细胞(HM151:WT-5′-UTR和等位基因GlcT1)表明HM150-1相对于HM151细胞的比生产力大约4%的增加,这证明存在于淀粉酶构建体中的“mod-5'-UTR”序列进一步有助于观察到的HM150-1细胞比生产力的增加。
实例9
小规模生产α-淀粉酶
在本实例中,评估四种命名为BF118、BF165、BF171和BF260的芽孢杆菌属宿主菌株(包含带有WT-5'-UTR(SEQ ID NO:64)或mod-5'UTR(SEQ ID NO:65)的α-淀粉酶表达盒)在小规模条件下α-淀粉酶的产生。在含有1%(w·v-1)不溶性淀粉的L琼脂平板上对四种菌株进行条纹纯化,并在37℃下生长大约二十四(24)小时。将单个晕圈阳性菌落接种到15ml的胰蛋白酶大豆肉汤(1.7%(w·v-1)胰蛋白胨、0.3%(w·v-1)大豆胨、0.25%(w·v-1)葡萄糖、0.5%(w·v-1)氯化钠、0.25%(w·v-1)磷酸氢二钾)中并在37℃(250RPM)下生长6小时。随后,将0.025ml的此种子培养物接种到25ml的烧瓶生长培养基(4%(w·v-1)MES、0.1%(w·v-1)磷酸二氢钾、0.05%(w·v-1)氯化钠、0.03%(w·v-1)大豆胨,含有微量金属,pH6.8,具有氢氧化铵)中。添加单个高葡萄糖释放进料珠(Kuhner公司)(进料速率57mg/L.hr)。使培养物在42℃(250RPM)下生长90小时。使用具有BSA标准的布拉福德(Bradford)方法确定总分泌的蛋白质生产。对于每种菌株,从至少两个独立烧瓶的重复测量平均的相对α-淀粉酶生产显示在以下表19中。
表19
α-淀粉酶的小规模生产
因此,如表19中所呈现的,当与芽孢杆菌属宿主细胞BF118和BF169(包含恢复的rghR2基因(rghR2恢复的)和野生型glcT基因)相比(相对比)时,芽孢杆菌属宿主细胞BF171和BF260(包含恢复的rghR2基因(rghR2恢复的)和等位基因glcT1)表明,在相对α-淀粉酶产生方面的大约9%增加。
参考文献
PCT International Publication No.WO 1989/06279
PCT International Publication No.WO 1999/20726
PCT International Publication No.WO 1999/20769
PCT International Publication No.WO 1999/20770
PCT International Publication No.WO2002/14490
PCT International Publication No.WO2003/083125
PCT International Publication No.WO2003/089604
PCT International Publication No.WO2008/024372
PCT International Publication No.WO2009/149130
PCT International Publication No.WO2014/164777
U.S.Patent No.4,914,031
U.S.Patent No.4,980,288
U.S.Patent No.5,208,158
U.S.Patent No.5,310,675
U.S.Patent No.5,336,611
U.S.Patent No.5,399,283
U.S.Patent No.5,441,882
U.S.Patent No.5,482,849
U.S.Patent No.5,631,217
U.S.Patent No.5,665,587
U.S.Patent No.5,700,676
U.S.Patent No.5,741,694
U.S.Patent No.5,858,757
U.S.Patent No.5,880,080
U.S.Patent No.6,197,567
U.S.Patent No.6,218,165
U.S.Patent Publication No.2014/0329309
U.S.RE 34,606
Albertini and Galizzi,Bacteriol.,162:1203-1211,1985.
Bergmeyer et al.,"Methods of Enzymatic Analysis"vol.5,Peptidases,Proteinases and their Inhibitors,Verlag Chemie,Weinheim,1984.
Botstein and Shortle,Science 229:4719,1985.
Brode et al.,“Subtilisin BPN'variants:increased hydrolytic activityon surface-bound substrates via decreased surface activity”,Biochemistry,35(10):3162-3169,1996.
Caspers et al.,“Improvement of Sec-dependent secretion of aheterologous model protein in Bacillus subtilis by saturation mutagenesis ofthe N-domain of the AmyE signal peptide”,Appl.Microbiol.Biotechnol.,86(6):1877-1885,2010.
Chang et al.,Mol.Gen.Genet.,168:11-115,1979.
Christianson et al.,Anal.Biochem.,223:119-129,1994.
Devereux et a/.,Nucl.Acid Res.,12:387-395,1984.
Earl et al.,“Ecology and genomics of Bacillus subtilis”,Trends inMicrobiology.,16(6):269-275,2008.
Ferrari et al.,"Genetics,"in Harwood et al.(ed.),Bacillus,PlenumPublishing Corp.,1989.
Fisher et.al.,Arch.Microbiol.,139:213-217,1981.
Guerot-Fleury,Gene,167:335-337,1995.
Hamoen et al.,“Controlling competence in Bacillus subtilis:sharedused of regulators”,Microbiology,149:9-17,2003.
Hamoen et al.,Genes Dev.12:1539-1550,1998.
Hampton et al.,Seroloαical Methods,A Laboratory Manual,APS Press,St.Paul,MN,1990.
Hardwood and Cutting(eds.)Molecular Biological Methods for Bacillus,John Wiley&Sons,1990.
Hayashi et al.,Mol.Microbiol.,59(6):1714-1729,2006
Higuchi et al.,Nucleic Acids Research 16:7351,1988.
Ho et al.,Gene 77:61,1989.
Hoch et al.,J.Bacteriol.,93:1925-1937,1967.
Holubova,Folia Microbiol.,30:97,1985.
Hopwood,The Isolation of Mutants in Methods in Microbiology(J.R.Norris and D.W.Ribbons,eds.)pp 363-433,Academic Press,New York,1970.
Horton et al.,Gene 77:61,1989.
Hsia et al.,Anal Biochem.,242:221-227,1999.
Iglesias and Trautner,Molecular General Genetics 189:73-76,1983.
Jensen et al.,“Cell-associated degradation affects the yield ofsecreted engineered and heterologous proteins in the Bacillus subtilisexpression system”Microbiology,146(Pt 10:2583-2594,2000.
Langbein et al.,J.Mol.Biol.,293,795-805,1999.
Liu and Zuber,1998,
Lo et al.,Proceedings of the National Academy of Sciences USA 81:2285,1985.
Maddox et al.,J.Exp.Med.,158:1211,1983.
Manival et al.,EMBO J.,16,5019-5029,1997.
Mann et al.,Current Microbiol.,13:131-135,1986.
McDonald,J.Gen.Microbiol.,130:203,1984.
Needleman and Wunsch,J.Mol.Biol.,48:443,1970.
Neidhardt et al.,“Culture medium for enterobacteria”,J.Bacteriol.,119(3):736-747,1974.
Ogura&Fujita,FEMS Microbiol Lett.,268(1):73-80.2007.
Olempska-Beer et al.,“Food-processing enzymes from recombinantmicroorganisms--a review”’Regul.Toxicol.Pharmacol.,45(2):144-158,2006.
Palmeros et al.,Gene 247:255-264,2000.
Parish and Stoker,FEMS Microbiology Letters 154:151-157,1997.
Pearson and Lipman,Proc.Natl.Acad.Sci.USA 85:2444,1988.
Perego,1993,In A.L.Sonneshein,J.A.Hoch,and R.Losick,editors,Bacillussubtilis and Other Gram-Positive Bacteria,Chapter 42,American Society ofMicrobiology,Washington,D.C.
Plumbridge,Curr.Opin.Microbiol.5,187-193,2002.
Postma et al.,Microbiol.Rev.57,543-594,1993.
Raul et al.,“Production and partial purification of alpha amylasefrom Bacillus subtilis(MTCC 121)using solid state fermentation”,BiochemistryResearch International,2014.
Sarkar and Sommer,BioTechniques 8:404,1990.
Saunders et al.,J.Bacteriol.,157:718-726,1984.
Schmalisch et al.,“Control of the Bacillus subtilis AntiterminatorProtein GlcT by Phosphorylation;Elucidation of The Phosphorylation ChainLeading To Inactivation Of Glct”;JBC,278(51),51108-51115,2003.
Shimada,Meth.Mol.Biol.57:157;1996
Smith and Waterman,Adv.Appl.Math.,2:482,1981.
Smith et al.,Appl.Env.Microbiol.,51:634 1986.
Stahl and Ferrari,J.Bacteriol.,158:411-418,1984.
Stahl et al,J.Bacteriol.,158:411-418,1984.
Stulke and Hillen,Annu.Rev.Microbiol.,54,849-880,2000.
Stulke et al.,Mol.Microbiol.28,865-874,1998.
Stulke et al.,Mol.Microbiol.,25,65-78,1997.
Tarkinen,et al,J.Biol.Chem.258:1007-1013,1983.
Trieu-Cuot et al.,Gene,23:331-341,1983.
Van Dijl and Hecker,“Bacillus subtilis:from soil bacterium to super-secreting cell factory”,Microbial Cell Factories,12(3).2013.
Vorobjeva et al.,FEMS Microbiol.Lett.,7:261-263,1980.
Ward,"Proteinases,"in Fogarty(ed.).,Microbial Enzymes andBiotechnology.Applied Science,London,pp 251-317,1983.
Wells et al.,Nucleic Acids Res.11:7911-7925,1983.
Westers et al.,“Bacillus subtilis as cell factory for pharmaceuticalproteins:a biotechnological approach to optimize the host organism”,Biochimica et Biophysica Acta.,1694:299-310,2004.
Yang et al,J.Bacteriol.,160:15-21,1984.
Yang et al.,Nucleic Acids Res.11:237-249,1983.
Youngman et al.,Proc.Natl.Acad.Sci.USA 80:2305-2309,1983.

Claims (24)

1.一种亲本地衣芽孢杆菌(Bacillus licheniformis)细胞的突变体,所述突变体包含编码变体GlcT蛋白质的glcT基因,
其中,所述变体GlcT蛋白质为亲本GlcT蛋白质的变体,其中所述亲本GlcT蛋白质来源于地衣芽孢杆菌且与SEQ ID NO:82具有至少90%序列同一性并且在SEQ ID NO:82的氨基酸位置67处为亮氨酸(L)(L67),且
其中,相对于所述亲本GlcT蛋白质,所述变体GlcT蛋白质的差异在于在SEQ ID NO:55的氨基酸位置67处亮氨酸(L)至苯丙氨酸(F)的取代(L67F)。
2.如权利要求1所述的突变体细胞,其中所述glcT基因编码SEQ ID NO:55的变体GlcT蛋白质,且包含核酸序列,所述核酸序列与SEQ ID NO:22、SEQ ID NO:81或SEQ ID NO:56具有至少90%序列同一性。
3.如权利要求1所述的突变体细胞,所述突变体细胞包含引入的编码目的蛋白(POI)的多核苷酸。
4.如权利要求3所述的突变体细胞,其中所述引入的编码所述POI的多核苷酸包含有效地连接的并且在编码所述POI的多核苷酸的上游(5′)的SEQ ID NO:63的mod-5′-UTR序列。
5.一种遗传修饰的地衣芽孢杆菌细胞,其中所述遗传修饰的地衣芽孢杆菌细胞源自亲本地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码SEQ ID NO:82的野生型GlcT蛋白质的野生型glcT基因,其中所述遗传修饰的地衣芽孢杆菌细胞包含编码根据权利要求1定义的变体GlcT蛋白质的经修饰的glcT基因。
6.如权利要求5所述的遗传修饰的地衣芽孢杆菌细胞,其中用glcT-Cas9靶向载体修饰亲本细胞中编码SEQ ID NO:82的野生型GlcT蛋白质的野生型glcT基因,其中所述glcT-Cas9靶向载体修饰野生型glcT基因的密码子67,其中经修饰的glcT基因编码所述变体GlcT蛋白质。
7.一种遗传修饰的地衣芽孢杆菌细胞,其中所述遗传修饰的地衣芽孢杆菌细胞包含引入的编码根据权利要求1定义的变体GlcT蛋白质的多核苷酸。
8.如权利要求7所述的遗传修饰的地衣芽孢杆菌细胞,其中所述遗传修饰的地衣芽孢杆菌细胞进一步包含灭活的编码GlcT蛋白质的内源染色体glcT基因,所述GlcT蛋白质为地衣芽孢杆菌GlcT蛋白质且与SEQ ID NO:82具有至少90%序列同一性并且在SEQ ID NO:82的氨基酸位置67处为亮氨酸(L)(L67)。
9.如权利要求7所述的遗传修饰的地衣芽孢杆菌细胞,其中所述遗传修饰的地衣芽孢杆菌细胞进一步包含编码SEQ ID NO:84的RghR2蛋白质的恢复的rghR2基因(rghR2恢复的)。
10.如权利要求7所述的遗传修饰的地衣芽孢杆菌细胞,所述经修饰的细胞包含引入的编码POI的多核苷酸。
11.如权利要求10所述的遗传修饰的地衣芽孢杆菌细胞,其中引入的编码所述POI的多核苷酸包含有效地连接的并且在编码所述POI的多核苷酸的上游(5′)的SEQ ID NO:63的mod-5′-UTR序列。
12.一种经修饰的地衣芽孢杆菌细胞,所述经修饰的地衣芽孢杆菌细胞源自亲本地衣芽孢杆菌细胞,所述亲本地衣芽孢杆菌细胞包含编码野生型GlcT蛋白质的glcT基因,所述野生型GlcT蛋白质在SEQ ID NO:82的氨基酸位置67处为亮氨酸(L)(L67),其中所述经修饰的地衣芽孢杆菌细胞包含编码根据权利要求1定义的变体GlcT蛋白质的经修饰的glcT基因,
其中所述经修饰的地衣芽孢杆菌细胞相对于产生相同目的蛋白(POI)的亲本细胞产生增加量的POI。
13.如权利要求12所述的经修饰的地衣芽孢杆菌细胞,所述经修饰的地衣芽孢杆菌细胞包含引入的编码异源POI的DNA构建体,其中所述经修饰的地衣芽孢杆菌细胞相对于产生相同的异源POI的亲本地衣芽孢杆菌细胞,产生增加量的所述异源POI。
14.如权利要求12所述的经修饰的地衣芽孢杆菌细胞,所述经修饰的地衣芽孢杆菌细胞进一步包含编码SEQ ID NO:84的RghR2蛋白质的恢复的rghR2基因。
15.如权利要求13所述的经修饰的地衣芽孢杆菌细胞,其中引入的编码所述POI的DNA构建体包含有效地连接在所述DNA构建体的上游(5′)的SEQ ID NO:63的经修饰的5′-UTR序列。
16.一种分离的多核苷酸可读框(ORF),所述分离的多核苷酸可读框(ORF)编码变体地衣芽孢杆菌GlcT蛋白质,
其中,所述变体地衣芽孢杆菌GlcT蛋白质为亲本GlcT蛋白质的变体,其中所述亲本GlcT蛋白质来源于地衣芽孢杆菌且与SEQ ID NO:82具有至少90%序列同一性并且在SEQID NO:82的氨基酸位置67处为亮氨酸(L)(L67),且
其中,相比于所述亲本GlcT蛋白质,所述变体地衣芽孢杆菌GlcT蛋白质的差异在于在SEQ ID NO:55的氨基酸位置67处亮氨酸(L)至苯丙氨酸(F)的取代(L67F)。
17.如权利要求16所述的ORF,其中所述变体地衣芽孢杆菌蛋白质与SEQ ID NO:55具有95%或更大序列同一性,并且在SEQ ID NO:55的氨基酸位置67处为亮氨酸(L)至苯丙氨酸(F)的取代(L67F)。
18.一种载体,所述载体包含如权利要求16所述的多核苷酸ORF。
19.如权利要求18所述的载体,所述载体进一步包含有效地连接至ORF序列5′的上游同源区(5′-HR)或有效地连接至ORF序列3′的下游同源区(3′-HR),其中所述5′-HR或所述3′-HR与芽孢杆菌属物种宿主细胞的靶向的基因组基因座具有足够的同源性,以当所述载体被转化到感受态芽孢杆菌属物种宿主细胞中时,通过同源重组实现将所述载体整合到所述靶向的基因组基因座中。
20.一种表达构建体,所述表达构建体包含如权利要求16所述的ORF,其中所述构建体进一步包含在芽孢杆菌属物种细胞中起作用的启动子核酸序列,其中所述启动子序列有效地连接并且在所述ORF序列的上游(5′)。
21.如权利要求20所述的构建体,所述构建体进一步包含SEQ ID NO:63的经修饰的枯草芽孢杆菌aprE 5′-非翻译区序列(5′-UTR),其中所述经修饰的5′-UTR在所述启动子序列下游(3′)并有效地连接至所述启动子序列,以及在所述ORF序列上游(5′)并有效地连接至所述ORF序列。
22.一种在亲本地衣芽孢杆菌细胞的突变体中产生增加量的目的蛋白(POI)的方法,所述方法包括:
(a)获得包含glcT基因的亲本地衣芽孢杆菌细胞的突变体,所述glcT基因编码根据权利要求1定义的变体GlcT蛋白质,并向突变体细胞中引入编码异源POI的DNA构建体,
(b)在适于产生POI的培养基中培养步骤(a)的突变体细胞,以及
(c)从培养基中回收所述POI,
其中,当在相同条件下培养时,所述突变体地衣芽孢杆菌细胞相对于产生相同POI的亲本地衣芽孢杆菌细胞产生增加量的所述POI。
23.一种在源自未经修饰的地衣芽孢杆菌亲本细胞的经修饰的地衣芽孢杆菌细胞中产生增加量的目的蛋白(POI)的方法,所述方法包括:
(a)获得包含内源染色体glcT基因的亲本地衣芽孢杆菌细胞,所述内源染色体glcT基因编码野生型GlcT蛋白质,所述野生型GlcT蛋白质在SEQ ID NO:82的氨基酸位置67处为亮氨酸(L)(L67),并且通过引入(i)编码根据权利要求1定义的变体GlcT蛋白质的多核苷酸和(ii)编码POI的多核苷酸来修饰所述亲本细胞,
(b)在适于产生POI的培养基中培养步骤(a)的经修饰的细胞,以及
(c)从培养基中回收所述POI,
其中,当在相同条件下培养时,所述经修饰的地衣芽孢杆菌细胞相对于产生相同POI的亲本细胞产生增加量的POI,
其中,所述引入的编码所述变体GlcT蛋白质的多核苷酸通过同源重组整合到染色体glcT基因基因座中,从而置换和消除编码SEQ ID NO:82的GlcT蛋白质的内源染色体glcT基因。
24.一种在源自未经修饰的地衣芽孢杆菌亲本细胞的经修饰的地衣芽孢杆菌细胞中产生增加量的目的蛋白(POI)的方法,所述方法包括:
(a)获得包含内源染色体glcT基因的亲本地衣芽孢杆菌细胞,所述内源染色体glcT基因编码野生型GlcT蛋白质,所述野生型GlcT蛋白质在SEQ ID NO:82的氨基酸位置67处为亮氨酸(L)(L67),
(b)用glcT-Cas9靶向载体来修饰步骤(a)的亲本细胞,其中所述glcT-Cas9靶向载体修饰野生型glcT基因的密码子67,其中经修饰的glcT基因编码根据权利要求1定义的变体GlcT蛋白质,
(c)在适于产生POI的培养基中培养步骤(b)的经修饰的细胞,以及
(d)从培养基中回收所述POI,
其中,当在相同条件下培养时,所述经修饰的地衣芽孢杆菌细胞相对于产生相同POI的亲本细胞产生增加量的POI。
CN201880088437.1A 2018-01-03 2018-12-12 突变的和遗传修饰的芽孢杆菌属细胞及其用于增加蛋白质产生的方法 Active CN111670244B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201862613339P 2018-01-03 2018-01-03
US62/613,339 2018-01-03
PCT/US2018/065150 WO2019135868A1 (en) 2018-01-03 2018-12-12 Mutant and genetically modified bacillus cells and methods thereof for increased protein production

Publications (2)

Publication Number Publication Date
CN111670244A CN111670244A (zh) 2020-09-15
CN111670244B true CN111670244B (zh) 2023-08-01

Family

ID=65139113

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880088437.1A Active CN111670244B (zh) 2018-01-03 2018-12-12 突变的和遗传修饰的芽孢杆菌属细胞及其用于增加蛋白质产生的方法

Country Status (8)

Country Link
US (1) US11414643B2 (zh)
EP (1) EP3735478B1 (zh)
JP (1) JP7280269B2 (zh)
KR (1) KR20200105879A (zh)
CN (1) CN111670244B (zh)
DK (1) DK3735478T3 (zh)
FI (1) FI3735478T3 (zh)
WO (1) WO2019135868A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FI3735478T3 (fi) 2018-01-03 2023-10-26 Danisco Us Inc Mutantit ja geneettisesti modifioidut bacillus-solut ja niihin liittyvät menetelmät proteiinituotannon lisäämiseksi
EP3947662A1 (en) * 2019-04-05 2022-02-09 Danisco US Inc. Methods for integrating a donor dna sequence into the genome of bacillus using linear recombinant dna constructs and compositions thereof
KR20220041928A (ko) * 2019-08-14 2022-04-01 다니스코 유에스 인크. 바실러스 리체니포르미스에서 단백질 생산을 증가시키기 위한 조성물 및 방법
JP2021052725A (ja) * 2019-10-02 2021-04-08 花王株式会社 モノアシルグリセロールリパーゼ変異体及びその製造方法
CN116121214B (zh) * 2022-12-13 2023-11-21 广州美神生物科技有限公司 Sod突变体及其在重组芽孢杆菌的表达方法和在制备美白化妆品中的应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102803290A (zh) * 2009-06-11 2012-11-28 丹尼斯科美国公司 用于增加蛋白质产生的芽孢杆菌属菌株
CN110520520A (zh) * 2017-02-24 2019-11-29 丹尼斯科美国公司 用于增加地衣芽孢杆菌中蛋白质产生的组合物和方法
CN111094576A (zh) * 2017-09-13 2020-05-01 丹尼斯科美国公司 用于增加芽胞杆菌属中蛋白质产生的经修饰的5′-非翻译区(utr)序列

Family Cites Families (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4760025A (en) 1984-05-29 1988-07-26 Genencor, Inc. Modified enzymes and methods for making same
US5310675A (en) 1983-06-24 1994-05-10 Genencor, Inc. Procaryotic carbonyl hydrolases
US5801038A (en) 1984-05-29 1998-09-01 Genencor International Inc. Modified subtilisins having amino acid alterations
WO1987004461A1 (en) 1986-01-15 1987-07-30 Amgen THERMALLY STABLE AND pH STABLE SUBTILISIN ANALOGS AND METHOD FOR PRODUCTION THEREOF
US4980288A (en) 1986-02-12 1990-12-25 Genex Corporation Subtilisin with increased thermal stability
US4914031A (en) 1987-04-10 1990-04-03 Amgen, Inc. Subtilisin analogs
DK6488D0 (da) 1988-01-07 1988-01-07 Novo Industri As Enzymer
PT89702B (pt) 1988-02-11 1994-04-29 Gist Brocades Nv Processo para a preparacao de novos enzimas proteoliticos e de detergentes que os contem
DE3909096A1 (de) 1989-03-20 1990-09-27 Garabed Antranikian Alpha-amylase
US5665587A (en) 1989-06-26 1997-09-09 Novo Nordisk A/S Modified subtilisins and detergent compositions containing same
DK97190D0 (da) 1990-04-19 1990-04-19 Novo Nordisk As Oxidationsstabile detergentenzymer
US5482849A (en) 1990-12-21 1996-01-09 Novo Nordisk A/S Subtilisin mutants
EP0583339B1 (en) 1991-05-01 1998-07-08 Novo Nordisk A/S Stabilized enzymes and detergent compositions
KR100322793B1 (ko) 1993-02-11 2002-06-20 마가렛 에이.혼 산화안정성알파-아밀라아제
DE4411223A1 (de) 1994-03-31 1995-10-05 Solvay Enzymes Gmbh & Co Kg Verwendung alkalischer Proteasen in gewerblichen Textilwaschverfahren
EP2206768B1 (en) 1997-10-13 2015-04-01 Novozymes A/S Alpha-amylase mutants
MA24811A1 (fr) 1997-10-23 1999-12-31 Procter & Gamble Compositions de lavage contenant des variantes de proteases multisubstituees
WO1999043794A1 (en) 1998-02-27 1999-09-02 Novo Nordisk A/S Maltogenic alpha-amylase variants
US6835550B1 (en) 1998-04-15 2004-12-28 Genencor International, Inc. Mutant proteins having lower allergenic response in humans and methods for constructing, identifying and producing such proteins
US6197565B1 (en) 1998-11-16 2001-03-06 Novo-Nordisk A/S α-Amylase variants
ES2496568T3 (es) 1999-03-30 2014-09-19 Novozymes A/S Variantes de alfa-amilasa
US6518052B1 (en) * 1999-10-22 2003-02-11 Bristol-Myers Squibb Company Human homologue of yeast helicase and uses thereof
US6509185B1 (en) 2000-01-07 2003-01-21 Genencor International, Inc. Mutant aprE promotor
WO2002014490A2 (en) 2000-08-11 2002-02-21 Genencor International, Inc. Bacillus transformation, transformants and mutant libraries
AU2003228393A1 (en) 2002-03-29 2003-10-13 Genencor International, Inc. Ehanced protein expression in bacillus
WO2003087148A2 (en) * 2002-04-10 2003-10-23 Novozymes A/S Bacillus licheniformis mutant host cell
CA2483006C (en) 2002-04-22 2013-10-29 Genencor International, Inc. Methods of creating modified promoters resulting in varying levels of gene expression
EP2287179A3 (en) * 2004-01-09 2011-05-18 Novozymes A/S Increased bacillus YweA expression
DE102004047777B4 (de) 2004-10-01 2018-05-09 Basf Se Alpha-Amylase-Varianten mit erhöhter Lösungsmittelstabilität, Verfahren zu deren Herstellung sowie deren Verwendung
DE102004047776B4 (de) 2004-10-01 2018-05-09 Basf Se Gegen Di- und/oder Multimerisierung stabilisierte Alpha-Amylase-Varianten, Verfahren zu deren Herstellung sowie deren Verwendung
CA2597980C (en) 2005-02-18 2016-01-05 Genencor International, Inc. Polypeptides having alpha-amylase and granular starch hydrolyzing activity
US7968691B2 (en) 2006-08-23 2011-06-28 Danisco Us Inc. Pullulanase variants with increased productivity
WO2008066931A2 (en) 2006-11-29 2008-06-05 Novozymes, Inc. Bacillus licheniformis chromosome
EP2428572A3 (en) 2007-03-09 2012-12-12 Danisco US, Inc., Genencor Division Alkaliphilic Bacillus species alpha-amylase variants, compositions comprising alpha-amylase variants, and methods of use
JP5492879B2 (ja) 2008-06-06 2014-05-14 ダニスコ・ユーエス・インク 改善された性質を有するゲオバチルスステアロセレモフィリス(Geobacillusstearothermophilus)アルファアミラーゼ(AmyS)変異体
JP6378089B2 (ja) 2011-12-09 2018-08-22 ダニスコ・ユーエス・インク 微生物におけるタンパク質産生のための、B.ズブチリス(B.subtilis)からのリボソームプロモーター
CN105229147B (zh) 2013-03-11 2020-08-11 丹尼斯科美国公司 α-淀粉酶组合变体
JP7012533B2 (ja) * 2014-12-16 2022-02-14 ダニスコ・ユーエス・インク タンパク質発現の増強
KR20180069057A (ko) 2015-10-30 2018-06-22 다니스코 유에스 인크. 향상된 단백질 발현 및 이의 방법
CN108779154B (zh) 2015-12-23 2022-12-27 丹尼斯科美国公司 增强的蛋白质产生及其方法
FI3735478T3 (fi) 2018-01-03 2023-10-26 Danisco Us Inc Mutantit ja geneettisesti modifioidut bacillus-solut ja niihin liittyvät menetelmät proteiinituotannon lisäämiseksi

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102803290A (zh) * 2009-06-11 2012-11-28 丹尼斯科美国公司 用于增加蛋白质产生的芽孢杆菌属菌株
CN110520520A (zh) * 2017-02-24 2019-11-29 丹尼斯科美国公司 用于增加地衣芽孢杆菌中蛋白质产生的组合物和方法
CN111094576A (zh) * 2017-09-13 2020-05-01 丹尼斯科美国公司 用于增加芽胞杆菌属中蛋白质产生的经修饰的5′-非翻译区(utr)序列

Also Published As

Publication number Publication date
KR20200105879A (ko) 2020-09-09
FI3735478T3 (fi) 2023-10-26
CN111670244A (zh) 2020-09-15
JP2021510070A (ja) 2021-04-15
US20200392451A1 (en) 2020-12-17
EP3735478B1 (en) 2023-08-16
US11414643B2 (en) 2022-08-16
EP3735478A1 (en) 2020-11-11
WO2019135868A1 (en) 2019-07-11
JP7280269B2 (ja) 2023-05-23
DK3735478T3 (da) 2023-10-30

Similar Documents

Publication Publication Date Title
CN110520520B (zh) 用于增加地衣芽孢杆菌中蛋白质产生的组合物和方法
CN111670244B (zh) 突变的和遗传修饰的芽孢杆菌属细胞及其用于增加蛋白质产生的方法
JP7218985B2 (ja) バチルス属(Bacillus)におけるタンパク質産生の増加のための改変5’-非翻訳領域(UTR)配列
US11781147B2 (en) Promoter sequences and methods thereof for enhanced protein production in Bacillus cells
US20240102028A1 (en) Methods and compositions for efficient genetic modifications of bacillus licheniformis strains
US20180030456A1 (en) Enhanced protein expression
JP2023524334A (ja) バチルス・リケニフォルミス(bacillus licheniformis)における強化したタンパク質産生のための組成物及び方法
CN107278230B (zh) 增强的蛋白质表达
CN107250371B (zh) 增强的蛋白质表达
CN117836315A (zh) 用于增强芽孢杆菌属细胞中蛋白质产生的方法和组合物
US20220282234A1 (en) Compositions and methods for increased protein production in bacillus lichenformis
CN115335503A (zh) 用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant