CN117769597A - 用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法 - Google Patents

用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法 Download PDF

Info

Publication number
CN117769597A
CN117769597A CN202280048758.5A CN202280048758A CN117769597A CN 117769597 A CN117769597 A CN 117769597A CN 202280048758 A CN202280048758 A CN 202280048758A CN 117769597 A CN117769597 A CN 117769597A
Authority
CN
China
Prior art keywords
pssa
cell
protein
seq
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280048758.5A
Other languages
English (en)
Inventor
R·L·弗里希
马臻
H·贺
B·保罗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Danisco US Inc
Original Assignee
Danisco US Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Danisco US Inc filed Critical Danisco US Inc
Publication of CN117769597A publication Critical patent/CN117769597A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/75Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1288Transferases for other substituted phosphate groups (2.7.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2408Glucanases acting on alpha -1,4-glucosidic bonds
    • C12N9/2411Amylases
    • C12N9/2414Alpha-amylase (3.2.1.1.)
    • C12N9/2417Alpha-amylase (3.2.1.1.) from microbiological source
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2451Glucanases acting on alpha-1,6-glucosidic bonds
    • C12N9/2457Pullulanase (3.2.1.41)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12RINDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
    • C12R2001/00Microorganisms ; Processes using microorganisms
    • C12R2001/01Bacteria or Actinomycetales ; using bacteria or Actinomycetales
    • C12R2001/07Bacillus
    • C12R2001/10Bacillus licheniformis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/08Transferases for other substituted phosphate groups (2.7.8)
    • C12Y207/08008CDP-diacylglycerol--serine O-phosphatidyltransferase (2.7.8.8)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • General Chemical & Material Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本公开的某些实施例涉及包含增强的蛋白质生产力表型的重组芽孢杆菌属菌株、用于构建这样的重组芽孢杆菌属细胞的组合物和方法等。更特别地,当在合适的条件下生长/培养/发酵时,本文所述的重组芽孢杆菌属菌株对于增强目的蛋白的产生特别有用。

Description

用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法
相关申请的交叉引用
本申请要求2021年5月24日提交的美国临时申请号63/192,261的权益,将该临时申请通过引用以其全文特此并入。
技术领域
本公开总体上涉及细菌学、微生物学、遗传学、分子生物学、酶学、工业蛋白质生产等领域。本公开的某些实施例涉及包含增强的蛋白质生产力表型的重组芽孢杆菌属(Bacillus)细胞(菌株)、用于构建这样的重组(修饰的)芽孢杆菌属细胞的组合物和方法等。
序列表的引用
命名为“NB41871-US-PSP_SequenceListing.txt”的文本文件序列表的电子提交的内容创建于2021年5月13日,并且大小为64KB,将其通过引用以其全文特此并入。
背景技术
革兰氏阳性细菌如枯草芽孢杆菌(Bacillus subtilis)、地衣芽孢杆菌(Bacilluslicheniformis)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)等由于其优异的发酵特性和高产率(例如,高达25克/升培养物;Van Dijl和Hecker,2013)经常被用作用于产生工业相关蛋白质的微生物工厂。例如,芽孢杆菌属物种宿主细胞因其产生食品、纺织品、衣物洗涤、医疗器械清洁、制药工业等所需的酶(例如,淀粉酶、纤维素酶、甘露聚糖酶、果胶酸裂合酶、蛋白酶、支链淀粉酶等)而为人熟知。由于这些非致病性革兰氏阳性细菌产生的蛋白质完全没有毒性副产物(例如,脂多糖;LPS,也称为内毒素),这些细菌获得了欧洲食品安全局(European Food Safety Authority,EFSA)的“安全性合格推定”(QPS)状态,并且它们的许多产品获得了美国食品药品管理局(US Food and Drug Administration)的“一般认为安全”(GRAS)地位(Olempska-Beer等人,2006;Earl等人,2008;Caspers等人,2010)。
因此,经由微生物宿主细胞产生蛋白质(例如,酶、抗体、受体等)在生物技术领域中是特别有意义的。同样,用于产生和分泌一种或多种目的蛋白的芽孢杆菌属宿主细胞的优化具有高度相关性,特别是在如下工业生物技术环境中,其中当蛋白质以大的工业产量生产时该蛋白质产率的微小改善具有重大意义。例如,许多异源蛋白质的表达在产率等方面仍可具有挑战性和不可预测性。如下文所述,本公开涉及对于获得和构建具有增加的蛋白质产生能力的芽孢杆菌属物种细胞(例如,蛋白质产生宿主)的高度希望和未满足的需求。
发明内容
如下文一般性描述的,本公开的某些实施例尤其涉及令人惊讶和非预期的结果。更特别地,本公开的某些实施例涉及令人惊讶和非预期的观察结果,即野生型pssA基因的缺失(ΔpssA)导致芽孢杆菌属物种细胞中目的蛋白的产生减少,而野生型pssA基因的过表达导致这样的芽孢杆菌属细胞中目的蛋白(例如酶)的产生增加。如下文实例中所呈现和描述的,当在合适的条件下培养时,本公开的重组(遗传修饰的)芽孢杆菌属细胞对于增强目的蛋白的产生特别有用。
因此,本公开的某些实施例涉及重组(修饰的)芽孢杆菌属细胞,其包含至少一个(一个或多个)引入的与SEQ ID NO:16的核酸序列具有至少85%序列同一性的多核苷酸。在相关的实施例中,至少一个引入的多核苷酸编码与SEQ ID NO:17具有至少85%序列同一性的磷脂酰丝氨酸合酶(PssA)蛋白。例如,在某些实施例中,重组细胞可以包含至少一(1)个引入(异源)的编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白的多核苷酸,并且在其他实施例中,重组细胞可以包含至少两(2)个引入(异源)的编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白的多核苷酸等。因此,在某些实施例中,引入的多核苷酸是表达盒,该表达盒包含可操作地连接到下游(3′)可读框(ORF)的上游(5′)启动子,该ORF编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白;以及任选地包含可操作地连接到上游(5′)ORF的下游(3′)终止子序列。在某些优选的实施例中,重组细胞产生目的蛋白(POI)。
在某些实施例中,与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白包含保守的PssA超家族结构域。在其他实施例中,与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白包含PssA功能/活性。在另一实施例中,与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白包含保守的PssA超家族结构域以及PssA功能/活性。
在某些实施例中,目的蛋白(POI)是酶。在特定的实施例中,目的蛋白(POI)包括但不限于酶,如乙酰酯酶、氨肽酶、淀粉酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂合酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲基酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶和己糖氧化酶。
某些其他实施例涉及重组(遗传修饰的)芽孢杆菌属细胞,其衍生自产生目的蛋白的亲本芽孢杆菌属细胞,其中这些重组细胞包含至少一个(一个或多个)引入的编码与SEQID NO:17具有至少85%序列同一性的磷脂酰丝氨酸合酶(PssA)蛋白的多核苷酸。在优选的实施例中,重组细胞相对于亲本细胞(即,当在相同条件下生长/培养/发酵时)产生增加量的目的蛋白。在某些相关的实施例中,引入的多核苷酸是表达盒,该表达盒包含可操作地连接到下游(3′)可读框(ORF)的上游(5′)启动子,该ORF编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白;以及任选地包含可操作地连接到上游(5′)ORF的下游(3′)终止子序列。
其他实施例涉及重组(遗传修饰的)芽孢杆菌属细胞,其衍生自包含编码磷脂酰丝氨酸合酶(PssA)蛋白的野生型pssA基因的亲本芽孢杆菌属细胞,其中由其构建的重组细胞包含用异源启动子序列替代野生型pssA基因启动子序列的遗传修饰。更特别地,本领域技术人员可以获得包含野生型pssA基因的亲本芽孢杆菌属细胞,并通过敲入异源启动子(核酸)序列对细胞进行遗传修饰,以根据需要驱动和过表达pssA。在某些相关的实施例中,相对于野生型pssA基因启动子,敲入的异源启动子使pssA基因表达增加至少1.25倍、至少1.5倍、至少1.75倍、至少2.0倍、至少2.25倍、至少2.5倍、至少2.75倍、至少3.0倍、至少5.0倍、或至少10.0倍。在其他实施例中,亲本细胞包含引入的编码目的蛋白(POI)的表达盒。在另一实施例中,重组细胞相对于亲本细胞(即,当在用于产生POI的相同条件下生长/培养/发酵时)产生增加量的POI。
因此,某些其他实施例提供了(多核苷酸)表达盒,其包含可操作地连接到下游(3′)可读框(ORF)的上游(5′)启动子序列,该ORF编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白。在某些相关的实施例中,盒进一步包含可操作地连接到上游(5′)ORF的下游(3′)终止子序列。
某些其他实施例涉及重组芽孢杆菌属(宿主)细胞/菌株,其包含本公开的表达盒。
在又其他实施例中,本公开提供了用于产生增加量的目的蛋白的方法,这样的方法通常包括(a)获得或构建产生一种或多种目的蛋白的亲本芽孢杆菌属细胞,并通过将编码与SEQ ID NO:17具有至少85%序列同一性的磷脂酰丝氨酸合酶(PssA)蛋白的多核苷酸引入其中来修饰该细胞,以及(b)在适用于产生该一种或多种目的蛋白的条件下培养修饰的细胞,其中该修饰的细胞相对于亲本细胞(即,当在相同条件下生长/培养/发酵时)产生增加量的一种或多种目的蛋白。在这些方法的某些实施例中,引入的多核苷酸是表达盒,该表达盒包含可操作地连接到下游(3′)可读框(ORF)的上游(5′)启动子序列,该ORF编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白;以及任选地包含可操作地连接到上游(5′)ORF的下游(3′)终止子序列。在某些相关的实施例中,编码PssA蛋白的可读框(ORF)序列与SEQ ID NO:16的核酸序列具有至少85%序列同一性。在某些实施例中,目的蛋白是酶,包括但不限于乙酰酯酶、氨肽酶、淀粉酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂合酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲基酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶和己糖氧化酶。
生物序列简述
SEQ ID NO:1是编码命名为“淀粉酶1”的噬细胞菌属物种(Cytophaga sp.)α-淀粉酶的核酸(DNA)。
SEQ ID NO:2是包含淀粉酶1表达盒的合成多核苷酸序列。
SEQ ID NO:3是地衣芽孢杆菌serA1基因座的核酸(DNA)序列。
SEQ ID NO:4是地衣芽孢杆菌serA1可读框(ORF)序列。
SEQ ID NO:5是合成的p3启动子核酸序列。
SEQ ID NO:6是修饰的枯草芽孢杆菌aprE 5′UTR核酸序列。
SEQ ID NO:7是编码地衣芽孢杆菌AmyL信号肽序列的核酸序列。
SEQ ID NO:8是地衣芽孢杆菌amyL转录终止子核酸序列。
SEQ ID NO:9是地衣芽孢杆菌lysA基因座的核酸序列。
SEQ ID NO:10是地衣芽孢杆菌lysA可读框(ORF)序列。
SEQ ID NO:11是地衣芽孢杆菌amyL启动子核酸序列。
SEQ ID NO:12是包含具有tuf启动子的pssA表达盒的合成多核苷酸序列。
SEQ ID NO:13是地衣芽孢杆菌catH基因座的核酸序列。
SEQ ID NO:14是包含地衣芽孢杆菌catH表达盒的合成多核苷酸序列。
SEQ ID NO:15是枯草芽孢杆菌spoVG终止子核酸序列。
SEQ ID NO:16是编码SEQ ID NO:17的PssA蛋白的地衣芽孢杆菌pssA可读框(ORF)序列。
SEQ ID NO:17是由SEQ ID NO:16编码的地衣芽孢杆菌PssA蛋白的氨基酸序列。
SEQ ID NO:18是地衣芽孢杆菌tuf启动子核酸序列。
SEQ ID NO:19是地衣芽孢杆菌citZ启动子核酸序列。
SEQ ID NO:20是编码命名为“淀粉酶2”的嗜糖假单胞菌(Pseudomonassacharophia)α-淀粉酶的核酸序列。
SEQ ID NO:21是包含淀粉酶2表达盒的合成多核苷酸序列。
SEQ ID NO:22是编码命名为“淀粉酶3”的假单胞菌属物种(Pseudomonas sp.)α-淀粉酶的核酸序列。
SEQ ID NO:23是包含淀粉酶3表达盒的合成多核苷酸序列。
SEQ ID NO:24是合成的p2启动子核酸序列。
SEQ ID NO:25是地衣芽孢杆菌aprL基因座的核酸序列。
SEQ ID NO:26是编码脱支芽孢杆菌(Bacillus deramificans)支链淀粉酶的核酸序列。
SEQ ID NO:27是包含具有citZ启动子的pssA表达盒的合成多核苷酸序列。
具体实施方式
如本文所述,本公开的某些实施例涉及用于增强芽孢杆菌属物种(宿主)细胞/菌株中蛋白质产生的组合物和方法。更特别地,如下文所阐述,以及在下文实例中进一步描述的,当在合适的条件下生长/培养/发酵时,本公开的重组(遗传修饰的)芽孢杆菌属细胞对于增强目的蛋白的产生特别有用。因此,本公开的某些实施例尤其涉及编码磷脂酰丝氨酸合酶(PssA)蛋白的重组多核苷酸(例如,表达盒)、表达/产生目的蛋白(酶)的重组芽孢杆菌属细胞、产生目的蛋白并包含至少一个引入的编码PssA蛋白的多核苷酸(表达盒)的重组芽孢杆菌属细胞、用于构建这样的遗传修饰的芽孢杆菌属细胞的组合物和方法、用于产生增加量的目的蛋白的方法等。
I.定义
鉴于本公开的修饰的细胞及本文所述的其方法,定义了以下术语和短语。本文未定义的术语应当符合如本领域使用的其常规含义。
除非另外定义,否则本文使用的所有技术和科学术语都具有与本发明组合物和方法应用的领域的普通技术人员通常所理解的相同的含义。尽管在本发明组合物和方法的实践或测试中也可以使用与本文所述的方法和材料类似或等同的任何方法和材料,但现在描述了代表性的说明性方法和材料。将本文引用的所有出版物和专利都通过引用以其全文并入。
应进一步注意,可以撰写权利要求书以排除任何任选的要素。因此,此陈述旨在作为使用与权利要求要素的叙述有关的排他性术语如“单独”、“仅”、“排除”、“不包括”等或使用“否定型”限定的前提基础(或其条件)。
在阅读本公开后,如将对于本领域技术人员显而易见的,本文描述和说明的单独实施例中的每一个具有离散的组分和特征,这些组分和特征可以在不偏离本文所述的本发明组合物和方法的范围或精神的情况下容易地与其他几个实施例中的任一个的特征分离或组合。可以按照所叙述的事件的顺序或按照逻辑上可能的任何其他顺序来进行任何叙述的方法。
如本文使用的,“芽孢杆菌属”包括如本领域技术人员已知的“芽孢杆菌”属内的所有物种,包括但不限于枯草芽孢杆菌、地衣芽孢杆菌、迟缓芽孢杆菌(B.lentus)、短芽孢杆菌(B.brevis)、嗜热脂肪芽孢杆菌(B.stearothermophilus)、嗜碱芽孢杆菌(B.alkalophilus)、解淀粉芽孢杆菌、克劳氏芽孢杆菌(B.clausii)、耐盐芽孢杆菌(B.halodurans)、巨大芽孢杆菌(B.megaterium)、凝结芽孢杆菌(B.coagulans)、环状芽孢杆菌(B.circulans)、灿烂芽孢杆菌(B.lautus)和苏云金芽孢杆菌(B.thuringiensis)。应认识到,芽孢杆菌属不断进行分类学重组。因此,该属旨在包括已重新分类的物种,包括但不限于如嗜热脂肪芽孢杆菌(其现在名为“嗜热脂肪土芽孢杆菌(Geobacillusstearothermophilus)”)等的生物体。
如本文使用的,术语“重组”或“非天然”是指具有至少一个工程化遗传改变或已通过引入异源核酸分子而修饰的生物体、微生物、细胞、核酸分子或载体,或者是指已经被改变使得可以控制异源或内源核酸分子或基因的表达的细胞(例如,微生物细胞)。重组还指衍生自非天然细胞的细胞,或者是具有一个或多个这样的修饰的非天然细胞的后代。遗传改变包括例如引入编码蛋白质的可表达核酸分子的修饰,或细胞遗传物质的其他核酸分子添加、缺失、取代或其他功能性改变。例如,重组细胞可以表达未在天然(野生型)细胞内发现的相同或同源形式的基因或其他核酸分子(例如,融合蛋白或嵌合蛋白),或者可以提供改变的内源基因表达模式,如过表达、低表达、最低表达或根本不表达。“重组(recombination、recombining)”或产生“重组的(recombined)”核酸通常是两个或更多个核酸片段的组装,其中该组装产生嵌合基因。
如本文使用的,术语“淀粉酶”是指尤其能够催化淀粉的降解的糖苷水解酶(酶)。这样的淀粉酶包括但不限于内切作用的α-淀粉酶(EC 3.2.1.1;α-D-(l→4)-葡聚糖葡聚糖水解酶)、外切作用的β-淀粉酶(EC 3.2.1.2;α-D-(l→4)-葡聚糖麦芽糖水解酶)和产物特异性淀粉酶,如产麦芽糖的α-淀粉酶(EC 3.2.1.133)、α-葡糖苷酶(EC 3.2.1.20;α-D-葡萄糖苷葡糖水解酶)、葡糖淀粉酶(EC 3.2.1.3;α-D-(l→4)-葡聚糖葡糖水解酶)、麦芽四糖苷酶(EC 3.2.1.60)、麦芽六糖苷酶(EC 3.2.1.98)等。
如本文使用的,术语“淀粉酶1(Amylase 1、amylase 1)”和/或“淀粉酶1蛋白”是指PCT公开号WO 2014/164777(将其通过引用以其全文并入本文)中描述的变体噬细胞菌属物种α-淀粉酶,其中编码淀粉酶1的DNA在SEQ ID NO:1中阐述。
如本文使用的,术语“淀粉酶2(Amylase 2、amylase 2)”和/或“淀粉酶2蛋白”是指PCT公开号WO 2005/003339(将其通过引用以其全文并入本文)中描述的变体嗜糖假单胞菌α-淀粉酶,其中编码淀粉酶2的DNA在SEQ ID NO:20中阐述。
如本文使用的,术语“淀粉酶3(Amylase 3、amylase 3)”和/或“淀粉酶3蛋白”是指假单胞菌属物种α-淀粉酶的变体,该变体淀粉酶3衍生自PCT公开号WO 2005/003339(将其通过引用以其全文并入本文)中描述的亲本α-淀粉酶。
如本文使用的,术语“支链淀粉酶”是指能够催化普鲁兰多糖降解(去分支)的糖苷水解酶(酶),普鲁兰多糖是由麦芽三糖单元(α-1,4-葡聚糖;α-1,6-葡聚糖)组成的多糖聚合物。支链淀粉酶(EC 3.2.1.41)也可称为普鲁兰多糖-6-葡聚糖水解酶
如本文使用的,本文中命名为“PULm104”的支链淀粉酶是PCT公开号WO 99/45124(将其通过引用以其全文并入本文)中描述的截短的脱支芽孢杆菌支链淀粉酶,其中编码该支链淀粉酶的DNA在SEQ ID NO:26中阐述。
如本领域技术人员通常理解的,这样的淀粉酶和/或支链淀粉酶特别适合用于淀粉液化和糖化、清洁淀粉污渍、纺织品退浆、烘焙、酿造等。
如本文使用的,“磷脂酰丝氨酸合酶”在本文中缩写为“PssA”,其尤其是催化碱交换反应的酶,在该反应中,磷脂酰胆碱(PC)或磷脂酰乙醇胺(PE)的极性头基被L-丝氨酸替代。PssA酶典型地被分类在酶学委员会(EC)编号EC 2.7.8.29下,并且通常包含保守的PssA超家族结构域。例如,在芽孢杆菌属物种细胞中,PssA酶负责磷脂酰乙醇胺(PE)的合成,PE是细胞膜中带正电荷的磷脂。
如本文使用的,“野生型pssA基因”编码“天然”磷脂酰丝氨酸合酶(PssA)蛋白(即酶)。
在某些实施例中,野生型pssA基因与SEQ ID NO:16具有约80%或更大的(核苷酸)序列同一性。在其他实施例中,野生型pssA基因与SEQ ID NO:16具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。
在某些实施例中,天然PssA酶与SEQ ID NO:17的PssA蛋白具有约85%或更大的(氨基酸)序列同一性。在其他实施例中,天然PssA蛋白与SEQ ID NO:17具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。
在其他实施例中,野生型pssA基因与SEQ ID NO 16具有至少85%序列同一性,并且编码与SEQ ID NO:17具有至少85%序列同一性的功能性PssA酶。
如本文使用的,“芽孢杆菌属细胞(菌株)”可以包含编码天然PssA蛋白的内源(野生型)pssA基因,并且因此,当将编码功能性PssA蛋白的异源(外源)多核苷酸(例如,表达盒)引入芽孢杆菌属细胞中时,引入的多核苷酸在本文中可称为“第二(第2)pssA拷贝”。在某些实施例中,异源多核苷酸(即第2pssA拷贝)包含编码天然PssA蛋白的野生型pssA基因。例如,SEQ ID NO:16的野生型pssA基因编码SEQ IDNO:17的天然PssA蛋白,该蛋白包含PssA酶活性(功能)。在其他实施例中,异源多核苷酸(即第2pssA拷贝)包含编码非天然PssA蛋白的核酸序列。例如,在某些实施例中,编码非天然PssA蛋白的核酸序列与SEQ ID NO 16的野生型pssA基因具有至少约85%序列同一性。在某些其他实施例中,编码非天然PssA蛋白的核酸序列与SEQ ID NO 16的野生型pssA基因具有至少约85%序列同一性,并且编码与SEQID NO:17的天然PssA蛋白具有至少85%至约99%序列同一性的功能性(非天然)PssA蛋白。因此,如本文所述,包含这样的引入的异源多核苷酸的本公开的修饰的芽孢杆菌属细胞特别适用于表达天然PssA蛋白和/或其功能性PssA变体蛋白。
如本文使用的,命名为“BF140”或“BF140(ΔserA1_ΔlysA)”的亲本地衣芽孢杆菌菌株包含serA基因缺失(ΔserA1)和lysA基因缺失(ΔlysA),如2020年1月15日提交的美国临时专利申请号62/961,234(将其通过引用以其全文并入本文)中所述。
如本文使用的,命名为“BF333”的地衣芽孢杆菌淀粉酶1生产菌株衍生自(亲本)地衣芽孢杆菌BF140菌株,其中BF333(子)菌株包含两(2)个引入的编码淀粉酶1的表达盒。
如本文使用的,命名为“ZM1021”的地衣芽孢杆菌(子)菌株衍生自地衣芽孢杆菌(淀粉酶1)生产菌株BF333,其中ZM1021菌株包含引入的含有可操作地连接到下游(3′)pssAORF的上游(5′)地衣芽孢杆菌tuf启动子的表达盒。
如本文使用的,命名为“ZM1022”的地衣芽孢杆菌(子)菌株衍生自地衣芽孢杆菌(淀粉酶1)生产菌株BF333,其中ZM1022菌株包含引入的含有可操作地连接到下游(3′)pssAORF的上游(5′)地衣芽孢杆菌citZ启动子的表达盒。
如本文使用的,命名为“LDN0032”的亲本地衣芽孢杆菌菌株包含serA基因缺失(ΔserA1)和lysA基因缺失(ΔlysA),如2020年1月15日提交的美国临时专利申请号62/961,234中所述。
如本文使用的,命名为“LDN253”的地衣芽孢杆菌淀粉酶2生产菌株衍生自(亲本)地衣芽孢杆菌LDN0032菌株,其中LDN253菌株包含两(2)个引入的编码淀粉酶2的表达盒。
如本文使用的,命名为“ZM1061”的地衣芽孢杆菌(子)菌株衍生自地衣芽孢杆菌(淀粉酶2)生产菌株LDN253,其中ZM1061菌株包含引入的含有可操作地连接到下游(3′)pssA ORF的上游(5′)地衣芽孢杆菌tuf启动子的表达盒。
如本文使用的,命名为“ZM1062”的地衣芽孢杆菌(子)菌株衍生自地衣芽孢杆菌(淀粉酶2)生产菌株LDN253,其中ZM1062菌株包含引入的含有可操作地连接到下游(3′)pssA ORF的上游(5′)地衣芽孢杆菌citZ启动子的表达盒。
如本文使用的,命名为“BF613”的亲本地衣芽孢杆菌菌株包含serA基因缺失(ΔserA1)和lysA基因缺失(ΔlysA),如2020年1月15日提交的美国临时专利申请号62/961,234中所述。
如本文使用的,命名为“WAAA53”的地衣芽孢杆菌淀粉酶3生产菌株衍生自(亲本)地衣芽孢杆菌BF613菌株,其中WAAA53菌株包含两(2)个引入的编码淀粉酶3的表达盒。
如本文使用的,命名为“WAAA103”的地衣芽孢杆菌(子)菌株衍生自地衣芽孢杆菌(淀粉酶3)生产菌株WAAA53,其中WAAA103菌株包含引入的含有可操作地连接到下游(3′)pssA ORF的上游(5′)地衣芽孢杆菌tuf启动子的表达盒。
如本文使用的,命名为“WAAA104”的地衣芽孢杆菌(子)菌株衍生自地衣芽孢杆菌(淀粉酶3)生产菌株WAAA53,其中WAAA104菌株包含引入的含有可操作地连接到下游(3′)pssA ORF的上游(5′)地衣芽孢杆菌citZ启动子的表达盒。
如本文使用的,命名为“BF144”的亲本地衣芽孢杆菌菌株包含lysA基因缺失。
如本文使用的,命名为“LDN300”的地衣芽孢杆菌菌株衍生自亲本BF144菌株,其中LDN300菌株包含引入的编码截短的支链淀粉酶(PULm104)的表达盒。
如本文使用的,命名为“ZM1134”的地衣芽孢杆菌菌株衍生自地衣芽孢杆菌(PULm104)生产菌株LDN300,其中ZM1134菌株包含引入的含有可操作地连接到下游(3′)pssA ORF的上游(5′)地衣芽孢杆菌tuf启动子的表达盒。
如本文使用的,命名为“ZM1135”的地衣芽孢杆菌菌株衍生自地衣芽孢杆菌(PULm104)生产菌株LDN300,其中ZM1135菌株包含引入的含有可操作地连接到下游(3′)pssA ORF的上游(5′)地衣芽孢杆菌citZ启动子的表达盒。
如本文使用的,“宿主细胞”是指具有作为新引入的DNA序列的宿主或表达媒介物的能力的细胞。因此,在本公开的某些实施例中,宿主细胞是芽孢杆菌属物种或大肠杆菌(E.coli)细胞。
如本文使用的,短语“修饰的芽孢杆菌属细胞”和/或“芽孢杆菌属子细胞”是指包含至少一个遗传修饰的重组芽孢杆菌属细胞,该遗传修饰不存在于衍生修饰的芽孢杆菌属细胞的亲本芽孢杆菌属细胞中。在某些实施例中,“未修饰的”芽孢杆菌属(亲本)细胞可以被称为“对照细胞”,特别是当与修饰的芽孢杆菌属细胞进行比较或相对于修饰的芽孢杆菌属细胞时。
如本文使用的,当将“未修饰的”(亲本)细胞中目的蛋白(POI)的表达和/或产生与“修饰的”(子)细胞中相同POI的表达和/或产生相比较时,应理解,使“未修饰的”和“修饰的”细胞在相同条件(例如,相同条件如培养基、温度、pH等)下生长/培养/发酵。在某些实施例中,增加量的目的蛋白可以是在本公开的重组芽孢杆菌属细胞中表达的内源芽孢杆菌属目的蛋白(例如,天然蛋白酶、天然淀粉酶等)或异源目的蛋白(例如,重组蛋白酶、重组淀粉酶等)。
如本文使用的,“增加”蛋白质产生或“增加的”蛋白质产生意指产生的蛋白质(例如,目的蛋白)的量增加。蛋白质可以在宿主细胞内产生,或分泌(或转运)到培养基中。在某些实施例中,目的蛋白被产生(被分泌)到培养基中。与亲本细胞相比,增加的蛋白质产生可以被检测为例如蛋白质或酶活性(例如像蛋白酶活性、淀粉酶活性、支链淀粉酶活性、纤维素酶活性等)或者所产生的总细胞外蛋白的更高的最大水平。
如本文使用的,术语“修饰”和“遗传修饰”可以互换使用,并且包括:(a)引入、取代或去除基因(或其ORF)中的一个或多个核苷酸,或者引入、取代或去除基因或其ORF的转录或翻译所需的调节元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)基因下调,(f)本文公开的任何一个或多个基因的特异性诱变和/或(g)随机诱变。
如本文使用的,术语“表达”是指衍生自本公开的核酸分子的有义(mRNA)或反义RNA的转录和稳定积累。表达也可指将mRNA翻译成多肽。因此,术语“表达”包括涉及多肽产生的任何步骤,这些步骤包括但不限于转录、转录后修饰、翻译、翻译后修饰、分泌等。
如本文使用的,“核酸”是指核苷酸或多核苷酸序列及其片段或部分,以及基因组或合成起点的DNA、cDNA和RNA,其可以是双链或单链,无论代表有义链还是反义链。应理解,由于遗传密码的简并性,多种核苷酸序列可以编码给定的蛋白质。
应理解,本文所述的多核苷酸(或核酸分子)包括“基因”、“载体”和“质粒”。
相应地,术语“基因”是指编码氨基酸的特定序列的多核苷酸,其包含所有或部分蛋白质编码序列,并且可以包括调节性(非转录的)DNA序列,如启动子序列,该启动子序列确定例如表达基因的条件。基因的转录区可以包括非翻译区(UTR)(包括内含子、5'-非翻译区(UTR)和3'-UTR)以及编码序列。
如本文使用的,术语“编码序列”是指直接指定其(所编码的)蛋白质产物的氨基酸序列的核苷酸序列。编码序列的边界一般由通常以ATG起始密码子开始的可读框(在下文中,“ORF”)确定。编码序列典型地包括DNA、cDNA和重组核苷酸序列。
如本文使用的,术语“启动子”是指能够控制编码序列或功能性RNA表达的核酸序列。通常,编码序列位于启动子序列的3'(下游)。启动子可以全部衍生自天然基因,或者由衍生自在自然界中发现的不同启动子的不同元件组成,或者甚至包含合成核酸区段。本领域技术人员应理解,不同的启动子可以指导基因在不同细胞类型中、或在不同发育阶段、或响应于不同环境或生理条件而表达。使基因在大多数细胞类型中在大多数时间表达的启动子通常被称为“组成型启动子”。应进一步认识到,由于在大多数情况下,尚未完全界定调节序列的确切边界,因此不同长度的DNA片段可以具有相同启动子活性。
如本文使用的,术语“可操作地连接”是指核酸序列在单个核酸片段上的缔合,使得一者的功能受到另一者影响。例如,当能够实现编码序列的表达(即,编码序列在启动子的转录控制下)时,启动子与该编码序列(例如ORF)可操作地连接。编码序列可以在有义或反义方向上可操作地连接到调节序列。
当核酸被放置成与另一个核酸序列具有功能性关系时,该核酸与该另一个核酸序列“可操作地连接”。例如,如果编码分泌性前导序列(即,信号肽)的DNA被表达为参与多肽分泌的前蛋白,则该编码分泌性前导序列(即,信号肽)的DNA可操作地连接到该多肽的DNA;如果启动子或增强子影响编码序列的转录,则该启动子或增强子可操作地连接到该序列;或者如果核糖体结合位点被定位以促进翻译,则该核糖体结合位点可操作地连接到编码序列。通常,“可操作地连接”意指被连接的DNA序列是连续的,并且在分泌性前导序列的情况下,是连续的并且处于阅读相中。然而,增强子不必是连续的。通过在方便的限制位点处连接来实现连接。如果这样的位点不存在,则按照常规实践使用合成的寡核苷酸衔接子或接头。
如本文使用的,“控制目的基因(或其可读框)的表达的与目的基因的蛋白质编码序列连接的功能性启动子序列”是指控制编码序列在芽孢杆菌属中的转录和翻译的启动子序列。例如,在某些实施例中,本公开涉及包含5′启动子(或5′启动子区、或串联5′启动子等)的多核苷酸,其中启动子区可操作地连接到编码蛋白质的核酸序列(例如ORF)。
如本文使用的,“合适的调节序列”是指位于编码序列上游(5′非编码序列)、内部或下游(3′非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调节序列可以包括启动子、翻译前导序列、RNA加工位点、效应子结合位点和茎环结构。
如本文使用的,如在短语如“向细菌细胞中引入”或“向芽孢杆菌属细胞中引入”至少一种多核苷酸可读框(ORF)、或其基因、或其载体中使用的,术语“引入”包括本领域已知的用于将多核苷酸引入细胞中的方法,这些方法包括但不限于原生质体融合、自然或人工转化(例如,氯化钙、电穿孔)、转导、转染、缀合等(例如,参见Ferrari等人,1989)。
如本文使用的,“转化的”或“转化”意指通过使用重组DNA技术转化的细胞。典型地,转化通过将一个或多个核苷酸序列(例如,多核苷酸、ORF或基因)插入细胞中而发生。插入的核苷酸序列可以是异源核苷酸序列(即,非天然存在于待转化细胞中的序列)。因此,转化通常是指将外源DNA引入宿主细胞中,使得DNA保持为染色体整合体或自我复制的染色体外载体。
如本文使用的,“转化DNA”、“转化序列”和“DNA构建体”是指用于将序列引入宿主细胞或生物体中的DNA。转化DNA是用于将序列引入宿主细胞或生物体中的DNA。可以通过PCR或任何其他合适的技术在体外产生DNA。在一些实施例中,转化DNA包含输入序列,而在其他实施例中,它进一步包含侧翼为同源盒的输入序列。在又另外的实施例中,转化DNA包含添加到末端的其他非同源序列(即,填充序列或侧翼)。末端可以闭合,使得转化DNA形成闭环,例如像插入载体中。
如本文使用的,“基因的破坏”或“基因破坏”可以互换使用,并且广泛地是指基本上防止宿主细胞产生功能性基因产物(例如,蛋白质)的任何遗传修饰。因此,如本文使用的,基因破坏包括但不限于移码突变、提前终止密码子(即,使得不产生功能性蛋白质)、消除或降低活性的蛋白质内部缺失的取代(使得不产生功能性蛋白质)、破坏编码序列的插入,去除转录所需的天然启动子与可读框之间的可操作连接的突变等。
如本文使用的,“输入序列”是指引入芽孢杆菌属物种染色体中的DNA序列。在一些实施例中,输入序列是DNA构建体的一部分。在其他实施例中,输入序列编码一种或多种目的蛋白。在一些实施例中,输入序列包含可以已经或可以不存在于待转化的细胞的基因组中的序列(即,它可以是同源或异源序列)。在一些实施例中,输入序列编码一种或多种目的蛋白、基因和/或突变的或修饰的基因。在可替代的实施例中,输入序列编码功能性野生型基因或操纵子、功能性突变型基因或操纵子或者非功能性基因或操纵子。在一些实施例中,可以将非功能性序列插入基因中以破坏基因的功能。在另一实施例中,输入序列包括选择性标记。在另外的实施例中,输入序列包括两个同源盒。
如本文使用的,“同源盒”是指与芽孢杆菌属染色体中的序列同源的核酸序列。更特别地,根据本发明,同源盒是上游或下游区,该上游或下游区与待缺失、破坏、灭活、下调等的基因或基因的一部分的直接侧翼编码区具有约80%与100%之间的序列同一性、约90%与100%之间的序列同一性、或约95%与100%之间的序列同一性。这些序列指导在芽孢杆菌属染色体中,DNA构建体被整合到何处,并且指导哪一部分芽孢杆菌属染色体被输入序列替代。虽然不意在限制本公开,但同源盒可以包括约1个碱基对(bp)至200千碱基(kb)之间。优选地,同源盒包括约1bp与10.0kb之间;1bp与5.0kb之间;1bp与2.5kb之间;1bp与1.0kb之间;以及0.25kb与2.5kb之间。同源盒还可以包括约10.0kb、5.0kb、2.5kb、2.0kb、1.5kb、1.0kb、0.5kb、0.25kb和0.1kb。在一些实施例中,选择性标记的5'和3'端的侧翼为同源盒,其中该同源盒包含与基因的编码区紧密侧接的核酸序列。
如本文使用的,术语“编码可选择标记的核苷酸序列”是指如下核苷酸序列,该核苷酸序列能够在宿主细胞中表达并且其中可选择标记的表达赋予含有表达的基因的细胞在存在对应的选择性试剂或缺乏必需营养物质的情况下生长的能力。
如本文使用的,术语“可选择标记”和“选择性标记”是指能够在宿主细胞中表达的核酸(例如,基因),其允许容易地选择含有载体的那些宿主。这样的可选择标记的实例包括但不限于抗微生物剂。因此,术语“可选择标记”是指提供宿主细胞已经摄取了输入的目的DNA或者已经发生了一些其他反应的指示的基因。典型地,可选择标记是赋予宿主细胞抗微生物抗性或代谢优势的基因,以允许在转化期间将含有外源DNA的细胞与未接受任何外源序列的细胞区分开来。
“驻留可选择标记(residing selectable marker)”是位于待转化微生物的染色体上的标记。驻留可选择标记编码与转化DNA构建体上的可选择标记不同的基因。选择性标记是本领域技术人员熟知的。如上所指示,标记可以是抗微生物抗性标记(例如,ampR、phleoR、specR、kanR、eryR、tetR、cmpR、和neoR)。在一些实施例中,本发明提供氯霉素抗性基因(例如,存在于pC194上的基因,以及存在于地衣芽孢杆菌基因组中的抗性基因)。该抗性基因在本发明中以及在涉及染色体整合的盒和整合性质粒的染色体扩增的实施例中特别有用(参见例如,Albertini和Galizzi,1985;Stahl和Ferrari,1984)。根据本发明有用的其他标记包括但不限于营养缺陷型标记,如丝氨酸、赖氨酸、色氨酸;和检测标记,如β-半乳糖苷酶。
如本文定义的,宿主细胞“基因组”、细菌(宿主)细胞“基因组”、或芽孢杆菌属物种(宿主)细胞“基因组”包括染色体基因和染色体外基因。
如本文使用的,术语“质粒”、“载体”和“盒”是指染色体外元件,其通常携带典型地不是细胞的中心代谢的一部分的基因,并且通常呈环状双链DNA分子的形式。这样的元件可以是衍生自任何来源的单链或双链DNA或RNA的线性或环状自主复制序列、基因组整合序列、噬菌体或核苷酸序列,其中多种核苷酸序列已连接或重组到单一结构中,该单一结构能够将用于选定基因产物的启动子片段和DNA序列连同适当3'未翻译序列一起引入到细胞中。
如本文使用的,术语“质粒”是指用作克隆载体,并且在许多细菌和一些真核生物中形成染色体外自我复制遗传元件的环状双链(ds)DNA构建体。在一些实施例中,质粒被掺入宿主细胞的基因组中。在一些实施例中,质粒存在于亲本细胞中并且在子细胞中丢失。
如本文使用的,“转化盒”是指包含基因(或其ORF)并且除了外源基因之外还具有促进特定宿主细胞的转化的元件的特定载体。
如本文使用的,术语“载体”是指可以在细胞中复制(传播)并且可以携带新基因或DNA区段到细胞中的任何核酸。因此,该术语是指设计用于在不同宿主细胞之间转移的核酸构建体。载体包括为“附加体”(即,其自主复制或可以整合到宿主生物体的染色体中)的病毒、噬菌体、前病毒、质粒、噬菌粒、转座子、和人工染色体如YAC(酵母人工染色体)、BAC(细菌人工染色体)、PLAC(植物人工染色体)等。
“表达载体”是指能够在细胞中掺入和表达异源DNA的载体。多种原核和真核表达载体可商购并且是本领域技术人员已知的。适当的表达载体的选择在本领域技术人员的知识范围内。
如本文使用的,术语“表达盒”和“表达载体”是指重组或合成生成的具有允许特定核酸在靶细胞中转录的一系列指定核酸元件的核酸构建体(即,这些是载体或载体元件,如上所述)。可以将重组表达盒掺入质粒、染色体、线粒体DNA、质体DNA、病毒或核酸片段中。典型地,表达载体的重组表达盒部分包括(除了其他序列之外)待转录的核酸序列和启动子。在一些实施例中,DNA构建体还包括允许在靶细胞中转录特定核酸的一系列指定核酸元件。在某些实施例中,本公开的DNA构建体包含如本文定义的选择性标记和失活染色体或基因或DNA区段。
如本文使用的,“靶向载体”是如下载体,该载体包括与该靶向载体转化至其中的宿主细胞的染色体中的区同源并且可以驱动在该区处的同源重组的多核苷酸序列。例如,靶向载体可用于通过同源重组将突变引入宿主细胞的染色体中。在一些实施例中,靶向载体包含例如添加到末端的其他非同源序列(即,填充序列或侧翼序列)。末端可以闭合,使得靶向载体形成闭环,例如像插入载体中。例如,在某些实施例中,通过在亲本地衣芽孢杆菌(宿主)细胞中引入一个或多个“靶向载体”来修饰(例如转化)该细胞。
如本文使用的,术语“目的蛋白”或“POI”是指希望在修饰的地衣芽孢杆菌(子)宿主细胞中表达的目的多肽,其中该POI优选地以增加的水平表达(即,相对于“未修饰的”(亲本)细胞)。因此,如本文使用的,POI可以是酶、底物结合蛋白、表面活性蛋白、结构蛋白、受体蛋白等。在某些实施例中,本公开的修饰的细胞相对于亲本细胞产生增加量的异源目的蛋白或内源目的蛋白。在特定的实施例中,由本公开的修饰的细胞产生的目的蛋白的增加量是相对于亲本细胞至少0.5%增加、至少1.0%增加、至少5.0%增加、或超过5.0%增加。
类似地,如本文定义的,“目的基因”或“GOI”是指编码POI的核酸序列(例如,多核苷酸、基因、或ORF)。编码“目的蛋白”的“目的基因”可以是天然存在的基因、经突变的基因或合成基因。
如本文使用的,术语“多肽”和“蛋白质”可互换地使用,并且是指包含通过肽键连接的氨基酸残基的任何长度的聚合物。在本文中使用氨基酸残基的常规一(1)字母或三(3)字母代码。多肽可以是线性的或支链的,它可以包含经修饰的氨基酸,并且它可以被非氨基酸中断。术语多肽还涵盖如下氨基酸聚合物,该氨基酸聚合物已经天然地或通过干预修饰;例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作或修饰,如与标记组分缀合。该定义内还包括例如含有一种或多种氨基酸类似物(包括例如非天然氨基酸等)以及本领域已知的其他修饰的多肽。
在某些实施例中,本公开的基因编码商业上相关的工业目的蛋白,如酶(例如,乙酰酯酶、氨肽酶、淀粉酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂合酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲基酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合)。
如本文使用的,“变体”多肽是指典型地通过重组DNA技术,通过取代、添加或缺失一个或多个氨基酸,衍生自亲本(或参考)多肽的多肽。变体多肽与亲本多肽可以相差小数量的氨基酸残基,并且可以通过它们与亲本(参考)多肽的一级氨基酸序列同源性/同一性的水平来定义。
优选地,变体多肽与亲本(参考)多肽序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%氨基酸序列同一性。如本文使用的,“变体”多核苷酸是指编码变体多肽的多核苷酸,其中“变体多核苷酸”与亲本多核苷酸具有指定程度的序列同源性/同一性,或者与亲本多核苷酸(或其互补序列)在严格杂交条件下杂交。优选地,变体多核苷酸与亲本(参考)多核苷酸序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%核苷酸序列同一性。
如本文使用的,“突变”是指核酸序列中的任何变化或改变。存在几种类型的突变,包括点突变、缺失突变、沉默突变、移码突变、剪接突变等。突变可以特异性地(例如,经由定点诱变)或随机地(例如,经由化学试剂、通过修复减去细菌菌株传代)进行。
如本文使用的,在多肽或其序列的上下文中,术语“取代”意指一个氨基酸被另一个氨基酸替代(即,取代)。
如本文定义的,“内源基因”是指位于生物体基因组的其天然位置中的基因。
如本文定义的,“异源”基因、“非内源”基因或“外源”基因是指正常情况下未在宿主生物体中发现,但是通过基因转移引入宿主生物体中的基因(或ORF)。如本文使用的,术语一个或多个“外源”基因包含插入非天然生物体中的天然基因(或ORF)和/或插入天然或非天然生物体中的嵌合基因。
如本文定义的,“异源控制序列”是指在自然界中不起调节(控制)目的基因表达的作用的基因表达控制序列(例如,启动子或增强子)。通常,异源核酸序列对于它们存在的细胞或基因组的一部分而言不是内源(天然)的,并且已通过感染、转染、转化、显微注射、电穿孔等添加到细胞中。“异源”核酸构建体可以含有与在天然宿主细胞中发现的控制序列/DNA编码序列组合相同或不同的控制序列/DNA编码(ORF)序列组合。
如本文使用的,术语“信号序列”和“信号肽”是指可以参与成熟蛋白或蛋白质的前体形式的分泌或定向转运的氨基酸残基的序列。典型地,信号序列位于前体或成熟蛋白序列的N-末端。信号序列可以是内源的或外源的。正常情况下,成熟蛋白中不存在信号序列。典型地,在蛋白质转运后,信号序列通过信号肽酶从蛋白质切割。
术语“衍生的”涵盖术语“起源的”、“获得的”“可获得的”和“产生的”,并且通常指示一种指定的材料或组合物在另一种指定的材料或组合物中找到它的起源,或者具有可以参考另一种指定的材料或组合物描述的特征。
如本文使用的,术语“同源性”涉及同源多核苷酸或多肽。如果两个或更多个多核苷酸或者两个或更多个多肽是同源的,则这意味着同源多核苷酸或多肽具有至少60%、更优选至少70%、甚至更优选至少85%、仍更优选至少90%、更优选至少95%、以及最优选至少98%的“同一性程度”。两个多核苷酸或多肽序列是否具有如本文定义的程度足够高的同一性而使其同源,可以通过使用本领域已知的计算机程序比对两个序列来适当地研究,该计算机程序如GCG程序包中提供的“GAP”(威斯康星程序包手册(Program Manual for theWisconsin Package),第8版,1994年8月,遗传学计算机集团(Genetics Computer Group),科学大道575号(575Science Drive),麦迪逊,威斯康星州,美国53711)(Needleman和Wunsch,1970)。使用具有以下设置的GAP进行DNA序列比较:GAP产生罚分5.0和GAP扩展罚分0.3。
如本文使用的,术语“百分比(%)同一性”是指当使用序列比对程序进行比对时,编码多肽的核酸序列或多肽的氨基酸序列之间的核酸或氨基酸序列同一性的水平。
如本文使用的,“比生产力”是在给定时间段内产生的蛋白质的总量/细胞/时间。
如本文定义的,术语“纯化的”、“分离的”或“富集的”意指生物分子(例如,多肽或多核苷酸)通过将其与它在自然界中相关联的天然存在的成分中的一些或所有分离而从其天然状态改变。这样的分离或纯化可以通过本领域公认的分离技术如离子交换色谱法、亲和色谱法、疏水分离、透析、蛋白酶处理、硫酸铵沉淀或其他蛋白质盐沉淀、离心、尺寸排阻色谱法、过滤、微量过滤、凝胶电泳或梯度分离完成,以去除最终组合物中所不希望的全细胞、细胞碎片、杂质、外来蛋白质或酶。然后可以进一步向纯化的或分离的生物分子组合物中添加提供另外益处的成分,例如激活剂、抗抑制剂、希望的离子、控制pH的化合物或者其他酶或化学品。
如本文使用的,“侧翼序列”是指正在讨论的序列的上游或下游的任何序列(例如,对于基因A-B-C,基因B以A和C基因序列为侧翼)。在某些实施例中,输入序列在每侧的侧翼为同源盒。在另一实施例中,输入序列和同源盒包含在每侧的侧翼为填充序列的单元。在一些实施例中,侧翼序列仅存在于单侧(3'或5'),但是在优选的实施例中,它在被侧接的序列的每侧。每个同源盒的序列与芽孢杆菌属染色体中的序列同源。这些序列指导在芽孢杆菌属染色体中新构建体的整合位置以及芽孢杆菌属染色体的哪部分将被输入序列替代。在其他实施例中,选择性标记的5'和3'端的侧翼为包含失活染色体区段的部分的多核苷酸序列。在一些实施例中,侧翼序列仅存在于单侧(3'或5'),而在其他实施例中,它存在于被侧接的序列的每侧。
II.芽孢杆菌属细胞中磷脂酰丝氨酸合酶(PssA)的过表达增强蛋白质的产生
如本领域中通常理解的,枯草芽孢杆菌的细胞壁是由肽聚糖和阴离子聚合物(磷壁酸和糖醛酸磷壁酸)的共聚物形成的多层结构,并且含有脂磷壁酸和蛋白质。Cao等人(2017)描述了能够通过分泌蛋白确定通过效率的细菌细胞壁的某些方面(即,壁的电荷密度和交联指数)。例如,为了研究膜磷脂与分泌的蛋白之间的静电相互作用的作用,Cao等人(2017)创建了六(6)个具有修饰的细胞表面组分的工程化枯草芽孢杆菌菌株的文库,并使用具有低、中性或高等电点(pI)的α-淀粉酶变体研究了对蛋白质分泌的对应影响。如Cao等人得出的结论,六个选定基因(即,编码TagO、TuaA、PssA、ClsA、DacA或DltA)的缺失以及对α-淀粉酶产率的功能性后果表明,磷脂酰丝氨酸合酶(PssA)或心磷脂合酶(ClsA)的不存在(缺失)增强了α-淀粉酶的产生,并且这些有益效果可以在双敲除菌株中具有累加性(例如,ΔPssA/ΔClsA)。
如本文一般性和以下实例描述的,申请人构建了表达目的报告子蛋白(例如,α-淀粉酶、支链淀粉酶)和编码野生型磷脂酰丝氨酸合酶(PssA)蛋白的异源多核苷酸(盒)的重组(修饰的)地衣芽孢杆菌细胞(菌株)。例如,为了更好地理解PssA酶及其对蛋白质产生的作用/影响,在包含引入的pssA表达盒(即,编码天然PssA蛋白的第2拷贝)的重组地衣芽孢杆菌菌株中测定了三(3)种不同的α-淀粉酶(报告子)蛋白(即,实例1-3;淀粉酶1-3)和支链淀粉酶(报告子)蛋白(实例4)的蛋白质产生。如表1-4中呈现的,相对于对照菌株(即,没有引入的pssA表达盒),包含引入的pssA盒的重组菌株产生了增加量的报告子蛋白,考虑到Cao等人(2017)的菌株(包含pssA基因缺失),这些结果令人惊讶。
因此,如本文所述,本公开的某些实施例涉及令人惊讶和非预期的观察结果,即野生型pssA基因的缺失(ΔpssA)导致地衣芽孢杆菌细胞中淀粉酶的产生降低(数据未显示),而野生型pssA基因的过表达导致地衣芽孢菌细胞中淀粉酶和支链淀粉酶的产生增加。更特别地,本公开的某些实施例涉及修饰的芽孢杆菌属细胞,其包含引入的编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白的多核苷酸。在特定的实施例中,引入的多核苷酸是表达盒,其包含可操作地连接到下游(3′)可读框(ORF)序列的上游(5′)启动子序列,该ORF序列编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白。
因此,某些其他实施例涉及修饰的芽孢杆菌属细胞,其衍生自产生目的蛋白(POI)的亲本芽孢杆菌属细胞,其中修饰的细胞包含引入的编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白的多核苷酸。因此,某些其他实施例涉及多核苷酸表达盒,其包含可操作地连接到下游(3′)可读框(ORF)序列的上游(5′)启动子序列,该ORF序列编码本公开的PssA蛋白。其他实施例涉及用于产生增加量的目的蛋白(POI)的方法,这些方法包括获得或构建产生POI的亲本芽孢杆菌属细胞,并通过将编码PssA蛋白的多核苷酸引入其中来修饰该细胞,以及在适合用于产生该POI的条件下培养修饰的细胞,其中该修饰的细胞相对于亲本细胞(当在相同条件下培养时)产生增加量的POI。
III.重组多核苷酸和分子生物学
如上文和下文一般性描述的,某些实施例涉及重组芽孢杆菌属细胞,其包含引入(异源)的编码天然PssA蛋白的多核苷酸。在相关的实施例中,重组芽孢杆菌属细胞进一步包含引入(异源)的编码一种或多种目的蛋白的多核苷酸(参见第V部分)。更特别地,如下文实例中呈现的,通过使用本领域技术人员已知的常规分子生物学和微生物学技术和方法,容易构建重组多核苷酸、遗传修饰的芽孢杆菌属细胞等。因此,本公开通常依赖于重组遗传学领域中的常规技术。公开了在本公开中使用的一般方法的基础文本包括Sambrook等人,(第2版,1989);Kriegler(1990)和Ausubel等人,(1994)。同样地,本领域技术人员熟知用于将多核苷酸序列引入细菌细胞(例如,大肠杆菌、芽孢杆菌等)中的合适方法。
因此,在某些实施例中,重组芽孢杆菌属细胞包含引入的编码含有SEQ ID NO:17的氨基酸序列的天然芽孢杆菌属PssA蛋白的多核苷酸。在某些其他实施例中,重组芽孢杆菌属细胞包含引入的编码与SEQ ID NO:17具有至少85%序列同一性的芽孢杆菌属PssA蛋白的多核苷酸。在相关的实施例中,重组芽孢杆菌属细胞包含引入的编码与SEQ ID NO:17具有至少85%至约99%序列同一性的PssA蛋白的多核苷酸,其中编码的PssA蛋白包含保守的PssA超家族结构域并且/或者包含PssA酶活性。例如,在某些实施例中,与SEQ ID NO:17具有至少85%至约99%序列同一性的PssA蛋白是转移酶,如L-丝氨酸-磷脂酰乙醇胺磷脂酰转移酶(例如,酶学委员会编号EC 2.7.8.29)。
因此,某些其他实施例涉及多核苷酸表达盒,其编码本公开的PssA蛋白。例如,在某些实施例中,表达盒包含可操作地连接到下游(3′)可读框(ORF)序列的上游(5′)启动子序列,该ORF序列编码包含SEQ ID NO:17的氨基酸序列的天然芽孢杆菌属PssA蛋白。在相关的实施例中,ORF包含SEQ ID NO:16的核苷酸序列。在某些其他实施例中,ORF与SEQ ID NO:16具有至少85%至约99%序列同一性,并编码功能性PssA蛋白。某些其他实施例涉及多核苷酸表达盒,其编码目的蛋白(POI)。因此,某些其他实施例涉及包含编码本公开的一种或多种蛋白质的多核苷酸序列的质粒、载体、表达盒等,其重组(修饰的)细胞以及用于构建这样的重组细胞的方法。
因此,在某些实施例中,编码芽孢杆菌属PssA蛋白和/或编码一种或多种目的蛋白的本公开的基因、多核苷酸或ORF被遗传修饰,例如遗传修饰包括但不限于(a)引入、取代或去除基因(或其ORF)中的一个或多个核苷酸,或者引入、取代或去除基因或其ORF的转录或翻译所需的调节元件中的一个或多个核苷酸,(b)基因破坏,(c)基因转换,(d)基因缺失,(e)基因下调,(f)本文公开的任何一个或多个基因的特异性诱变和/或(g)随机诱变。
在特定的实施例中,本公开涉及包含编码天然PssA蛋白(例如,SEQ ID NO:17)和/或其变体PssA蛋白的基因或ORF的重组(修饰的)核酸(多核苷酸),和/或编码目的蛋白的重组核酸(多核苷酸),该变体PssA蛋白与SEQ ID NO:17的PssA具有至少85%至约99%同一性。
在某些
因此,在某些实施例中,使用本领域熟知的方法(例如,插入、破坏、替代或缺失)通过增加基因的表达和/或通过减少(或消除)基因的表达来构建本公开的修饰的芽孢杆菌属细胞。待修饰或灭活的基因的部分可以是例如编码区或编码区表达所需的调节元件。这样的调节或控制序列的实例可以是启动子序列或其功能性部分(即,足以影响核酸序列的表达的部分)。用于修饰的其他控制序列包括但不限于前导序列、前肽序列、信号序列、转录终止子、转录激活子等。
基因缺失技术使得能够部分或完全去除一个或多个基因,从而消除它们的表达,或者表达非功能性(或活性降低的)蛋白质产物。在这样的方法中,一个或多个基因的缺失可以通过使用已构建为连续含有侧接于该基因的5'和3'区的质粒进行同源重组来完成。可以将连续的5′和3′区引入芽孢杆菌属细胞中,例如,在温度敏感型质粒(如pE194)上,在允许温度下与第二可选择标记缔合以允许在该细胞中建立质粒。然后将细胞移至非允许温度以选择质粒在同源侧翼区之一处整合到染色体中的细胞。通过选择第二可选择性标记来实现质粒整合的选择。在整合后,通过将细胞移至允许温度持续几代而不进行选择来刺激第二同源侧翼区处的重组事件。将细胞铺板以获得单菌落,并且检查菌落是否丢失两种可选择标记(参见例如,Perego,1993)。因此,本领域的技术人员可容易地鉴定在基因的编码序列和/或基因的非编码序列中的核苷酸区(适合用于完全或部分缺失)。
在其他实施例中,通过在基因或其转录或翻译所需的调节元件中引入、取代、或去除一个或多个核苷酸来构建本公开的修饰的芽孢杆菌属细胞。
在某些实施例中,经由CRISPR-Cas9编辑构建修饰的芽孢杆菌属细胞。例如,编码天然PssA蛋白(或其功能性PssA变体)的野生型pssA基因可以借助核酸指导的内切核酸酶经由CRISPR-Cas9编辑来修饰,这些核酸指导的内切核酸酶通过结合指导RNA(例如,Cas9)和Cpfl或指导DNA(例如,NgAgo)发现其靶DNA,这将内切核酸酶募集到DNA上的靶序列上,其中该内切核酸酶可以在DNA中产生单链或双链断裂。该靶向的DNA断裂成DNA修复的底物,并且可以与提供的编辑模板(例如,用异源启动子替代天然pssA基因启动子序列的编辑模板)重组。例如,编码核酸指导的内切核酸酶(出于该目的,来自化脓链球菌(S.pyogenes)的Cas9)的基因或编码Cas9核酸酶的密码子优化的基因可操作地连接到在芽孢杆菌属细胞中具有活性的启动子和在芽孢杆菌属细胞中具有活性的终止子,从而产生芽孢杆菌属Cas9表达盒。同样,本领域技术人员容易地鉴定目的基因特有的一个或多个靶位点。例如,为了使用化脓链球菌(Streptococcus pyogenes)Cas9构造编码针对目的基因内的靶位点的gRNA的DNA构建体,可变的靶向(VT)结构域将包含处于(PAM)原间隔子邻近基序(NGG)5'的靶位点的核苷酸,这些核苷酸与编码化脓链球菌Cas9的Cas9内切核酸酶识别结构域(CER)的DNA融合。将编码VT结构域的DNA和编码CER结构域的DNA组合,从而产生编码gRNA的DNA。因此,通过将编码gRNA的DNA可操作地连接到在芽孢杆菌属细胞中具有活性的启动子和在芽孢杆菌属细胞中具有活性的终止子来产生gRNA的芽孢杆菌属表达盒。
在某些实施例中,将由内切核酸酶诱导的DNA断裂用输入序列修复/替代。例如,为了精确修复由上述Cas9表达盒和gRNA表达盒产生的DNA断裂,提供了核苷酸编辑模板,使得细胞的DNA修复机构可以利用该编辑模板。例如,靶基因的约500-bp 5'可以与靶基因的约500-bp3'融合以生成编辑模板,该模板由芽孢杆菌属宿主的机构用于修复由RGEN产生的DNA断裂。
可以使用许多不同的方法将Cas9表达盒、gRNA表达盒和编辑模板共同递送至细胞。通过用正向和反向引物扩增基因座,通过PCR扩增靶基因座来筛选经转化的细胞。这些引物可以扩增野生型基因座或已由RGEN编辑的经修饰的基因座。然后使用测序引物对这些片段进行测序以鉴定经编辑的菌落。
在又其他实施例中,使用本领域熟知的方法(包括但不限于化学诱变和转座),通过随机或特异性诱变构建修饰的芽孢杆菌属细胞。可以通过对亲本细胞进行诱变并筛选其中基因表达已经改变的突变型细胞来进行基因的修饰。可以例如通过使用合适的物理或化学诱变剂、使用合适的寡核苷酸或使DNA序列经受PCR产生的诱变来进行可以是特异性的或随机的诱变。此外,诱变可以通过使用这些诱变方法的任何组合来进行。适合用于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)辐照、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、N-甲基-N'-亚硝基胍(NTG)、O-甲基羟胺、亚硝酸、甲烷磺酸乙酯(EMS)、亚硫酸氢钠、甲酸、和核苷酸类似物。当使用这样的试剂时,典型地通过如下方式来进行诱变:在合适的条件下在选择的诱变剂的存在下孵育待诱变的亲本细胞,并且选择展现出基因的表达降低或无表达的突变型细胞。
国际PCT公开号WO 2003/083125公开了用于修饰芽孢杆菌属细胞的方法,如使用PCR融合来产生芽孢杆菌属缺失菌株和DNA构建体以绕过大肠杆菌。PCT公开号WO 2002/14490公开了用于修饰芽孢杆菌属细胞的方法,这些方法包括(1)构建和转化整合的质粒(pComK),(2)随机诱变编码序列、信号序列和前肽序列,(3)同源重组,(4)通过向转化DNA添加非同源侧翼提高转化效率,(5)优化双交叉整合,(6)定向诱变和(7)无标记缺失。
本领域技术人员熟知用于将多核苷酸序列引入细菌细胞(例如,大肠杆菌和芽孢杆菌属物种)中的合适方法。实际上,包括原生质体转化和中板集合、转导和原生质体融合在内的如转化等的方法是已知的并且适合用于本公开。转化方法特别优选地用于将本公开的DNA构建体引入宿主细胞中。
除了通常使用的方法之外,在一些实施例中,还直接转化宿主细胞(即,在引入宿主细胞中之前,不使用中间细胞扩增或以其他方式加工DNA构建体)。将DNA构建体引入宿主细胞中包括本领域已知的将DNA引入宿主细胞中而不插入质粒或载体中的那些物理和化学方法。这样的方法包括但不限于氯化钙沉淀、电穿孔、裸DNA、脂质体等。在另外的实施例中,将DNA构建体与质粒一起共转化而不插入该质粒中。在另外的实施例中,通过本领域已知的方法,将选择性标记从修饰的芽孢杆菌属菌株中缺失或基本上切除。在一些实施例中,载体从宿主染色体上拆分下来,将侧翼区留在染色体上,而将固有的染色体区去除。
用于在芽孢杆菌属细胞中表达基因、其可读框(ORF)和/或其变体序列的启动子和启动子序列区通常是本领域技术人员已知的。通常选择本公开的启动子序列使得它们在芽孢杆菌属细胞中具有功能,并且包括但不限于天然存在的启动子序列、合成的启动子序列、和/或其启动子序列组合等,这些启动子(序列)在芽孢杆菌属细胞中是可操作的/具有功能的。能够在芽孢杆菌属细胞中过量产生异源(外源)蛋白的合成的(工程化的)启动子的实例包括但不限于由Zhou等人(2019)、Wang等人(2019)和Castillo-Hair等人(2019)描述的启动子系统。某些其他示例性芽孢杆菌属启动子序列包括但不限于枯草芽孢杆菌碱性蛋白酶(aprE)启动子、枯草芽孢杆菌的α-淀粉酶启动子、解淀粉芽孢杆菌的α-淀粉酶启动子、来自枯草芽孢杆菌的中性蛋白酶(nprE)启动子、突变型aprE启动子(例如,PCT公开号WO 2001/51643)、地衣芽孢杆菌tuf启动子、地衣芽孢杆菌citZ启动子、或来自芽孢杆菌属物种细胞的任何其他功能性启动子。在某些实施例中,(异源)启动子序列用于驱动天然PssA蛋白(或其功能性变体)的表达,其中相对于在野生型pssA基因启动子控制下表达的相同PssA蛋白,该异源启动子使该PssA蛋白的表达增加至少1.5倍。在某些优选的实施例中,相对于在野生型pssA基因启动子的控制下表达的相同PssA蛋白的表达,用于驱动天然PssA蛋白(或其功能性变体)表达的启动子使该PssA蛋白的表达增加至少1.25倍、至少1.5倍、至少1.75倍、至少2.0倍、至少2.25倍、至少2.5倍、至少2.75倍、至少3.0倍、至少5.0倍、或至少10.0倍。在PCT公开号WO 2003/089604中描述了用于在芽孢杆菌属细胞中筛选和产生具有一系列活性(启动子强度)的启动子文库的方法。
IV.发酵用于产生目的蛋白的芽孢杆菌属细胞
如上文一般性描述的,某些实施例涉及用于构建和获得具有增加的蛋白质产生表型的芽孢杆菌属细胞的组合物和方法。因此,某些实施例涉及通过在合适的培养基中发酵细胞而在芽孢杆菌属细胞中产生目的蛋白的方法。本领域熟知的发酵方法可以应用于发酵本公开的亲本和修饰的(子)芽孢杆菌属细胞。
在一些实施例中,将细胞在分批或连续发酵条件下培养。经典的分批发酵是封闭的系统,其中在发酵开始时设定培养基的组成,并且该组成在发酵期间不改变。在发酵开始时,将培养基用一种或多种希望的生物体接种。在该方法中,允许发酵发生而不向系统中添加任何组分。典型地,分批发酵符合关于添加碳源的“分批”的资格,并且经常对控制因素(如pH和氧浓度)进行尝试。分批系统的代谢物和生物质组成不断变化直到发酵停止时。在典型分批培养中,细胞可以通过静态停滞期进展到高生长对数期,并且最后进入生长速率减小或停止的静止期。如果不经处理,处于静止期的细胞最终死亡。通常,处于对数期的细胞负责产物的大量产生。
标准分批系统的合适变化是“补料分批”发酵系统。在典型分批系统的该变化中,随着发酵的进展,以增量添加底物。当分解代谢物阻遏可能抑制细胞的代谢时并且在培养基中希望具有有限量的底物的情况下,补料分批系统是有用的。在补料分批系统中实际底物浓度的测量是困难的并且因此基于可测量因素(如pH、溶解氧和废气(如CO2)的分压)的变化对其进行估计。分批和补料分批发酵在本领域中是常用并且已知的。
连续发酵是开放的系统,其中将限定的发酵培养基连续添加到生物反应器中,并同时去除等量的条件培养基以用于加工。连续发酵通常将培养物维持在恒定的高密度,其中细胞主要处于对数期生长。连续发酵允许对影响细胞生长和/或产物浓度的一种或多种因素进行调节。例如,在一个实施例中,将限制营养物质(如碳源或氮源)维持在固定的速率,并且允许调节所有其他参数。在其他系统中,影响生长的许多因素可以不断改变,而通过培养基浊度测量的细胞浓度保持不变。连续系统努力维持稳态生长条件。因此,由于抽出培养基而引起的细胞损失应当与发酵中的细胞生长速率相平衡。调节用于连续发酵过程的营养物质和生长因子的方法以及用于最大化产物形成速率的技术是工业微生物学领域中熟知的。
在某些实施例中,可以通过常规程序从培养基中回收由本公开的芽孢杆菌属细胞表达/产生的目的蛋白,这些常规程序包括通过离心或过滤从培养基中分离宿主细胞,或者如果需要,破坏细胞并从细胞部分和碎片中去除上清液。典型地,在澄清后,将上清液或滤液的蛋白质组分借助盐(例如,硫酸铵)沉淀。然后将沉淀出的蛋白质溶解,并且可以通过多种色谱程序(例如,离子交换色谱法、凝胶过滤)进行纯化。
在一些实施例中,将细胞在分批或连续发酵条件下培养。经典的分批发酵是封闭的系统,其中在发酵开始时设定培养基的组成,并且该组成在发酵期间不改变。在发酵开始时,将培养基用一种或多种希望的生物体接种。在该方法中,允许发酵发生而不向系统中添加任何组分。典型地,分批发酵符合关于添加碳源的“分批”的资格,并且经常对控制因素(如pH和氧浓度)进行尝试。分批系统的代谢物和生物质组成不断变化直到发酵停止时。在典型分批培养中,细胞可以通过静态停滞期进展到高生长对数期,并且最后进入生长速率减小或停止的静止期。如果不经处理,处于静止期的细胞最终死亡。通常,处于对数期的细胞负责产物的大量产生。
标准分批系统的合适变化是“补料分批”发酵系统。在典型分批系统的该变化中,随着发酵的进展,以增量添加底物。当分解代谢物阻遏可能抑制细胞的代谢时并且在培养基中希望具有有限量的底物的情况下,补料分批系统是有用的。在补料分批系统中实际底物浓度的测量是困难的并且因此基于可测量因素(如pH、溶解氧和废气(如CO2)的分压)的变化对其进行估计。分批和补料分批发酵在本领域中是常用并且已知的。
连续发酵是开放的系统,其中将限定的发酵培养基连续添加到生物反应器中,并同时去除等量的条件培养基以用于加工。连续发酵通常将培养物维持在恒定的高密度,其中细胞主要处于对数期生长。连续发酵允许对影响细胞生长和/或产物浓度的一种或多种因素进行调节。例如,在一个实施例中,将限制营养物质(如碳源或氮源)维持在固定的速率,并且允许调节所有其他参数。在其他系统中,影响生长的许多因素可以不断改变,而通过培养基浊度测量的细胞浓度保持不变。连续系统努力维持稳态生长条件。因此,由于抽出培养基而引起的细胞损失应当与发酵中的细胞生长速率相平衡。调节用于连续发酵过程的营养物质和生长因子的方法以及用于最大化产物形成速率的技术是工业微生物学领域中熟知的。
在某些实施例中,可以通过常规程序从培养基中回收由本公开的芽孢杆菌属细胞表达/产生的目的蛋白,这些常规程序包括通过离心或过滤从培养基中分离宿主细胞,或者如果需要,破坏细胞并从细胞部分和碎片中去除上清液。典型地,在澄清后,将上清液或滤液的蛋白质组分借助盐(例如,硫酸铵)沉淀。然后将沉淀出的蛋白质溶解,并且可以通过多种色谱程序(例如,离子交换色谱法、凝胶过滤)进行纯化。
V.目的蛋白
本公开的目的蛋白(POI)可以是任何内源或异源蛋白,并且它可以是这样的POI的变体。蛋白质可以含有一个或多个二硫桥,或者是其功能形式为单体或多聚体的蛋白质,即蛋白质具有四级结构并且由多个相同的(同源)或不相同的(异源)亚基组成,其中POI或其变体POI优选是具有目的特性的POI。
例如,在某些实施例中,相对于其未修饰的(亲本)细胞,本公开的修饰的芽孢杆菌属细胞产生多至少约0.1%、多至少约0.5%、多至少约1%、多至少约5%、多至少约6%、多至少约7%、多至少约8%、多至少约9%、或多至少约10%或更多的POI。
在某些实施例中,相对于(未修饰的)亲本细胞,本公开的修饰的芽孢杆菌属细胞表现出POI的比生产力(Qp)增加。例如,比生产力(Qp)的检测是评价蛋白质产生的合适方法。比生产力(Qp)可以使用以下等式确定:
“Qp=gP/gDCW·hr”
其中,“gP”是罐中产生的蛋白质的克数;“gDCW”是罐中的干细胞重量(DCW)的克数;并且“hr”是从接种时间开始的以小时计的发酵时间,其包括产生时间以及生长时间。
因此,在某些其他实施例中,相对于未修饰的(亲本)细胞,本公开的修饰的芽孢杆菌属细胞包含至少约0.1%、至少约1%、至少约5%、至少约6%、至少约7%、至少约8%、至少约9%、或至少约10%或更多的比生产力(Qp)增加。
在某些实施例中,POI或其变体POI选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂合酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲基酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶、己糖氧化酶、及其组合。
因此,在某些实施例中,POI或其变体POI是选自酶学委员会(EC)编号EC 1、EC 2、EC 3、EC 4、EC 5或EC 6的酶。
存在本领域普通技术人员已知的用于检测和测量细胞内和细胞外表达的蛋白质的活性的各种测定。
VI.示例性实施例
1.一种重组(修饰的)芽孢杆菌属细胞,其包含引入的与SEQ ID NO:16的核酸序列具有至少85%序列同一性的多核苷酸。
2.如实施例1所述的重组细胞,其中该引入的多核苷酸编码与SEQ ID NO:17具有至少85%序列同一性的磷脂酰丝氨酸合酶(PssA)蛋白。
3.如实施例1所述的重组细胞,其产生目的蛋白(POI)。
4.如实施例1所述的重组细胞,其中该引入的多核苷酸是表达盒,该表达盒包含可操作地连接到下游(3′)可读框(ORF)的上游(5′)启动子,该ORF编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白;以及任选地包含可操作地连接到上游(5′)ORF的下游(3′)终止子序列。
5.如实施例2所述的重组细胞,其中PssA蛋白包含保守的PssA超家族结构域和/或PssA酶活性。
6.如实施例3所述的重组细胞,其中该POI是酶。
7.一种重组芽孢杆菌属细胞,其衍生自产生目的蛋白(POI)的亲本芽孢杆菌属细胞,其中该修饰的细胞包含引入的编码与SEQ ID NO:17具有至少85%序列同一性的磷脂酰丝氨酸合酶(PssA)蛋白的多核苷酸。
8.如实施例8所述的重组细胞,当在用于产生该POI的相同条件下培养时,该重组细胞相对于该亲本细胞产生增加量的POI。
9.如实施例8所述的重组细胞,其中该引入的多核苷酸是表达盒,该表达盒包含可操作地连接到下游(3′)可读框(ORF)的上游(5′)启动子,该ORF编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白;以及任选地包含可操作地连接到上游(5′)ORF的下游(3′)终止子序列。
10.如实施例7所述的重组细胞,其中该POI是酶。
11.一种重组芽孢杆菌属细胞,其衍生自包含编码与SEQ ID NO:17具有至少85%序列同一性的磷脂酰丝氨酸合酶(PssA)蛋白的野生型pssA基因的亲本芽孢杆菌属细胞,其中该重组细胞包含用异源启动子序列替代野生型pssA基因启动子序列的遗传修饰。
12.如实施例11所述的重组细胞,其中相对于该野生型pssA基因启动子,该异源启动子使pssA基因表达增加至少1.5倍。
13.如实施例11所述的重组细胞,其中该亲本细胞包含编码目的蛋白(POI)的表达盒。
14.如实施例13所述的重组细胞,当在用于产生该POI的相同条件下培养时,该重组细胞相对于该亲本细胞产生增加量的POI。
15.如实施例13所述的重组细胞,其中该POI是酶。
16.如实施例6、10或15中任一项所述的重组细胞,其中该酶选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂合酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲基酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶和己糖氧化酶。
17.一种表达盒,其包含可操作地连接到下游(3′)可读框(ORF)序列的上游(5′)启动子序列,该ORF序列编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白;以及任选地包含可操作地连接到上游(5′)ORF的下游(3′)终止子序列。
18.一种重组宿主细胞,其包含如实施例17所述的盒。
19.一种用于产生增加量的目的蛋白(POI)的方法,该方法包括(a)获得或构建产生POI的亲本芽孢杆菌属细胞,并通过将编码与SEQ ID NO:17具有至少85%序列同一性的磷脂酰丝氨酸合酶(PssA)蛋白的多核苷酸引入其中来修饰该细胞,以及(b)在适合用于产生该POI的条件下培养该修饰的细胞,其中当在相同条件下培养时,该修饰的细胞相对于该亲本细胞产生增加量的该POI。
20.如实施例19所述的方法,其中该引入的多核苷酸是表达盒,该表达盒包含可操作地连接到下游(3′)可读框(ORF)的上游(5′)启动子序列,该ORF编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白;以及任选地包含可操作地连接到上游(5′)ORF的下游(3′)终止子序列。
21.如实施例20所述的方法,其中编码该PssA蛋白的可读框(ORF)序列与SEQ IDNO:16的核酸序列具有至少85%序列同一性。
22.如实施例19所述的方法,其中该POI是酶。
23.如实施例22所述的方法,其中该POI是选自由以下组成的组的酶:乙酰酯酶、氨肽酶、淀粉酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂合酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲基酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶和己糖氧化酶。
实例
根据以下实例可以进一步理解本发明的某些方面,这些实例不应被解释为限制性的。对材料和方法的修改对于本领域技术人员而言是显而易见的。如本文所述,所有表达盒均使用PCT公开号WO 2019/040412(将其通过引用以其全文并入本文)描述的方法转化到宿主菌株中。
实例1
包含PSSA表达盒的芽孢杆菌属细胞中增强的淀粉酶1产生
在本实例中,将编码变体噬细胞菌属物种α-淀粉酶(淀粉酶1)的表达盒引入包含serA1和lysA基因缺失的地衣芽孢杆菌菌株BF140中。更特别地,将淀粉酶1的第一盒(SEQID NO:2)整合到serA1基因座(SEQ ID NO:3)中,并且该第一盒含有serA1 ORF(SEQ ID NO:4)和合成的p3启动子(SEQ ID NO:5),该启动子可操作地连接到修饰的枯草芽孢杆菌aprE5′UTR(SEQ ID NO:6),该aprE 5′UTR可操作地连接到编码地衣芽孢杆菌AmyL信号肽序列的DNA(SEQ ID NO:7),该编码地衣芽孢杆菌AmyL信号肽序列的DNA可操作地连接到编码淀粉酶1的DNA(SEQ ID NO:1),该编码淀粉酶1的DNA可操作地连接到地衣芽孢杆菌amyL转录终止子(SEQ ID NO:8)。将淀粉酶1的第二盒整合到lysA基因座(SEQ ID NO:9)中,并且该第二盒含有lysA ORF(SEQ ID NO:10)和地衣芽孢杆菌amyL启动子(SEQ ID NO:11),该启动子可操作地连接到修饰的枯草芽孢杆菌aprE 5′UTR(SEQ ID NO:6),该aprE 5′UTR可操作地连接到编码地衣芽孢杆菌AmyL信号肽序列的DNA(SEQ ID NO:7),该编码地衣芽孢杆菌AmyL信号肽序列的DNA可操作地连接到编码淀粉酶1的DNA(SEQ ID NO:1),该编码淀粉酶1的DNA可操作地连接到地衣芽孢杆菌amyL转录终止子(SEQ ID NO:8)。这产生了在本文中命名为“BF333”的淀粉酶1生产菌株。
然后将包含SEQ ID NO:12或SEQ ID NO:27的pssA表达盒整合在淀粉酶1生产菌株BF333的catH基因座(SEQ ID NO:13)处。更特别地,pssA表达盒含有天然地衣芽孢杆菌catH表达盒(SEQ ID NO:14),该catH表达盒可操作地连接到枯草芽孢杆菌spoVG转录终止子(SEQ ID NO:15),该转录终止子可操作地连接到启动子,该启动子可操作地连接到修饰的枯草芽孢杆菌aprE 5′UTR(SEQ ID NO:6),该aprE 5′UTR可操作地连接到地衣芽孢杆菌pssA ORF(SEQ ID NO:16),该ORF可操作地连接到地衣芽孢杆菌amyL转录终止子(SEQ IDNO:8)。在本实例中,使用地衣芽孢杆菌tuf启动子(SEQ ID NO:18)和citZ启动子(SEQ IDNO:19)驱动pssA表达(即,分别为表达盒SEQ ID NO:12和SEQ ID NO:27),并产生了淀粉酶1生产菌株,分别命名为“ZM1021”和“ZM1022”。
使用标准小规模条件测定了三(3)种淀粉酶1生产菌株(BF333、ZM1021、ZM1022)的α-淀粉酶产生(如PCT公开号WO 2018/156705和WO 2019/055261中所述,将每个文献通过引用并入本文)。使用Bradford方法或Ceralpha测定对产生的α-淀粉酶进行定量。将包含引入的pssA表达盒的淀粉酶生产菌株的相对改善与亲本菌株BF333进行比较,如下表1所呈现的。表1中所示的结果表明了包含由异源启动子(例如,tuf或citZ启动子)控制的天然pssA基因的第二(第2)拷贝的菌株中淀粉酶产生的改善。
表1
菌株 描述 相对淀粉酶1产生
BF333 2个拷贝的淀粉酶1;WT pssA基因 1.00
ZM1021 2个拷贝的淀粉酶1;WT pssA基因+pssA盒(tuf) 1.08
ZM1022 2个拷贝的淀粉酶1;WT pssA基因+pssA盒(citZ) 1.19
淀粉酶1在含有PSSA表达盒的菌株中的相对表达
实例2
包含PSSA表达盒的芽孢杆菌属细胞中增强的淀粉酶2产生
在本实例中,如上文在实例1中一般所述,将淀粉酶2表达盒引入包含serA1和lysA两种基因缺失的地衣芽孢杆菌菌株LDN0032中。更特别地,将淀粉酶2的第一盒(SEQ ID NO:21)整合到lysA基因座(SEQ ID NO:9)中,并且该第一盒含有lysA ORF(SEQ ID NO:10)和合成的p3启动子(SEQ ID NO:5),该启动子可操作地连接到修饰的枯草芽孢杆菌aprE 5′UTR(SEQ ID NO:6),该aprE 5′UTR可操作地连接到编码地衣芽孢杆菌AmyL信号肽序列的DNA(SEQ ID NO:7),该编码地衣芽孢杆菌AmyL信号肽序列的DNA可操作地连接到编码淀粉酶2的DNA(SEQ ID NO:20),该编码淀粉酶2的DNA可操作地连接到地衣芽孢杆菌amyL转录终止子(SEQ ID NO:8)。将淀粉酶2的第二盒整合到serA1基因座(SEQ ID NO:3)中,并且该第二盒含有地衣芽孢杆菌amyL启动子(SEQ ID NO:11),该启动子可操作地连接到修饰的枯草芽孢杆菌aprE 5′UTR(SEQ ID NO:6),该aprE 5′UTR可操作地连接到编码地衣芽孢杆菌AmyL信号肽序列的DNA(SEQ ID NO:7),该编码地衣芽孢杆菌AmyL信号肽序列的DNA可操作地连接到编码淀粉酶2的DNA(SEQ ID NO:20),该编码淀粉酶2的DNA可操作地连接到地衣芽孢杆菌amyL转录终止子(SEQ ID NO:8),该转录终止子可操作地连接到serA1 ORF(SEQ ID NO:4)。这产生了在本文中命名为“LDN253”的淀粉酶2生产菌株。
然后将包含SEQ ID NO:12或SEQ ID NO:27的pssA表达盒整合在淀粉酶2生产菌株LDN253的catH基因座(SEQ ID NO:13)处。pssA表达盒含有天然地衣芽孢杆菌catH表达盒(SEQ ID NO:14),该catH表达盒可操作地连接到枯草芽孢杆菌spoVG转录终止子(SEQ IDNO:15),该转录终止子可操作地连接到启动子,该启动子可操作地连接到修饰的枯草芽孢杆菌aprE 5′UTR(SEQ ID NO:6),该aprE 5′UTR可操作地连接到地衣芽孢杆菌pssA ORF(SEQ ID NO:16),该ORF可操作地连接到地衣芽孢杆菌amyL转录终止子(SEQ ID NO:8)。在本实例中,使用地衣芽孢杆菌tuf启动子(SEQ ID NO:18)和citZ启动子(SEQ ID NO:19)驱动pssA表达(即,分别为表达盒SEQ ID NO:12和SEQ ID NO:27),并产生了淀粉酶2生产菌株,分别命名为“ZM1061”和“ZM1062”。
使用标准小规模条件测定了三(3)种淀粉酶2生产菌株(LDN253、ZM1061、ZM1062)的α-淀粉酶产生(如PCT公开号WO 2018/156705和WO 2019/055261中所述)。使用Bradford方法或Ceralpha测定对产生的淀粉酶2进行定量。将包含引入的pssA表达盒的淀粉酶生产菌株的相对改善与亲本菌株LDN253进行比较,如下表2所呈现的。表2中所示的结果表明了包含由tuf或citZ启动子控制的天然pssA基因的第二(第2)拷贝的菌株中淀粉酶产生的改善。
表2
菌株 描述 相对淀粉酶2产生
LDN253 2个拷贝的淀粉酶2;WT pssA基因 1.00
ZM1061 2个拷贝的淀粉酶2;WT pssA基因+pssA盒(tuf) 1.11
ZM1062 2个拷贝的淀粉酶2;WT pssA基因+pssA盒(citZ) 1.12
淀粉酶2在含有PSSA表达盒的菌株中的相对表达
实例3
包含PSSA表达盒的芽孢杆菌属细胞中增强的淀粉酶3产生
在本实例中,如上文在实例1中一般所述,将淀粉酶3表达盒引入包含serA1和lysA两种基因缺失的地衣芽孢杆菌菌株BF613中。更特别地,将淀粉酶3的第一盒(SEQ ID NO:23)整合到serA1基因座(SEQ ID NO:3)中,并且该第一盒含有serA1 ORF(SEQ ID NO:4)和合成的p3启动子(SEQ ID NO:5),该启动子可操作地连接到修饰的枯草芽孢杆菌aprE 5′UTR(SEQ ID NO:6),该aprE 5′UTR可操作地连接到编码地衣芽孢杆菌AmyL信号肽序列的DNA(SEQ ID NO:7),该编码地衣芽孢杆菌AmyL信号肽序列的DNA可操作地连接到编码淀粉酶3的DNA(SEQ ID NO:22),该编码淀粉酶3的DNA可操作地连接到地衣芽孢杆菌amyL转录终止子(SEQ ID NO:8)。将淀粉酶3的第二盒整合到lysA基因座(SEQ ID NO:9)中,并且该第二盒含有lysA ORF(SEQ ID NO:10)和合成的p2启动子(SEQ ID NO:24),该启动子可操作地连接到修饰的枯草芽孢杆菌aprE 5′UTR(SEQ ID NO:6),该aprE 5′UTR可操作地连接到编码地衣芽孢杆菌AmyL信号肽序列的DNA(SEQ ID NO:7),该编码地衣芽孢杆菌AmyL信号肽序列的DNA可操作地连接到编码淀粉酶3的DNA(SEQ ID NO:22),该编码淀粉酶3的DNA可操作地连接到地衣芽孢杆菌amyL转录终止子(SEQ ID NO:8)。这产生了在本文中命名为“WAAA53”的淀粉酶3生产菌株。
然后将包含SEQ ID NO:12或SEQ ID NO:27的pssA表达盒整合在淀粉酶3生产菌株WAAA53的aprL基因座(SEQ ID NO:25)处。pssA表达盒含有天然地衣芽孢杆菌catH表达盒(SEQ ID NO:14),该catH表达盒可操作地连接到枯草芽孢杆菌spoVG转录终止子(SEQ IDNO:15),该转录终止子可操作地连接到启动子,该启动子可操作地连接到修饰的枯草芽孢杆菌aprE 5′UTR(SEQ ID NO:6),该aprE 5′UTR可操作地连接到编码地衣芽孢杆菌pssAORF的DNA(SEQ ID NO:16),该DNA可操作地连接到地衣芽孢杆菌amyL转录终止子(SEQ IDNO:8)。在本实例中,使用地衣芽孢杆菌tuf启动子(SEQ ID NO:18)和citZ启动子(SEQ IDNO:19)驱动pssA表达(即,分别为表达盒SEQ ID NO:12和SEQ ID NO:27),并分别产生了淀粉酶3生产菌株“WAAA103”和“WAAA104”。
使用标准小规模条件测定了三(3)种淀粉酶3生产菌株(WAAA53、WAAA103、WAAA104)的α-淀粉酶产生(如PCT公开号WO 2018/156705和WO 2019/055261中所述)。使用Bradford方法或Ceralpha测定对产生的淀粉酶3进行定量。将包含引入的pssA表达盒的淀粉酶生产菌株的相对改善与亲本菌株WAAA53进行比较,如下表3所呈现的。表3中所示的结果表明了包含由tuf或citZ启动子控制的天然pssA基因的第二(第2)拷贝的菌株中淀粉酶产生的改善。
表3
淀粉酶3在含有PSSA表达盒的菌株中的相对表达
菌株 描述 相对淀粉酶3产生
WAAA53 2个拷贝的淀粉酶3;WT pssA基因 1.00
WAAA103 2个拷贝的淀粉酶3;WT pssA基因+pssA盒(tuf) 1.06
WAAA104 2个拷贝的淀粉酶3;WT pssA基因+pssA盒(citZ) 1.07
实例4
包含PSSA表达盒的芽孢杆菌属细胞中增强的支链淀粉酶产生
在本实例中,将支链淀粉酶表达盒引入包含lysA基因缺失的地衣芽孢杆菌菌株BF144中。更特别地,表达盒含有lysA ORF(SEQ ID NO:10)和合成的p3启动子(SEQ ID NO:5),该启动子可操作地连接到修饰的枯草芽孢杆菌aprE 5′UTR(SEQ ID NO:6),该aprE 5′UTR可操作地连接到编码地衣芽孢杆菌AmyL信号肽序列的DNA(SEQ ID NO:7),该编码地衣芽孢杆菌AmyL信号肽序列的DNA可操作地连接到编码支链淀粉酶的DNA(SEQ ID NO:26),该编码支链淀粉酶的DNA可操作地连接到地衣芽孢杆菌amyL转录终止子(SEQ ID NO:8)。这产生了在本文中命名为“LDN300”的支链淀粉酶生产菌株。
然后将包含SEQ ID NO:12或SEQ ID NO:27的pssA表达盒整合在支链淀粉酶生产菌株LDN300的catH基因座(SEQ ID NO:13)处。pssA表达盒含有天然地衣芽孢杆菌catH表达盒(SEQ ID NO:14),该catH表达盒可操作地连接到枯草芽孢杆菌spoVG转录终止子(SEQ IDNO:15),该转录终止子可操作地连接到启动子,该启动子可操作地连接到修饰的枯草芽孢杆菌aprE 5′UTR(SEQ ID NO:6),该aprE 5′UTR可操作地连接到编码地衣芽孢杆菌pssAORF的DNA(SEQ ID NO:16),该DNA可操作地连接到地衣芽孢杆菌amyL转录终止子(SEQ IDNO:8)。在本实例中,使用地衣芽孢杆菌tuf启动子(SEQ ID NO:18)和citZ启动子(SEQ IDNO:19)驱动pssA表达(即,分别为表达盒SEQ ID NO:12和SEQ ID NO:27),并分别产生了支链淀粉酶生产菌株“ZM1134”和“ZM1135”。
使用标准小规模条件测定了三(3)种支链淀粉酶生产菌株(LDN300、ZM1134、ZM1135)的支链淀粉酶产生(如PCT公开号WO 2018/156705和WO 2019/055261中所述)。使用Bradford测定法对支链淀粉酶进行定量。将含有额外引入的pssA表达盒的支链淀粉酶生产菌株的相对改善与亲本菌株LDN300进行比较,如下表4所呈现的。表4中所示的结果表明了包含由tuf或citZ启动子控制的天然pssA基因的第二(第2)拷贝的菌株中支链淀粉酶产生的改善。
表4
支链淀粉酶在含有PSSA表达盒的菌株中的相对表达
参考文献
PCT公开号WO 2001/51643
PCT公开号WO 2002/14490
PCT公开号WO 2003/083125
PCT公开号WO 2005/003339
PCT公开号WO 2014/164777
PCT公开号WO 2018/156705
PCT公开号WO 2018/156705
PCT公开号WO 2019/040412
PCT公开号WO 2019/055261
PCT公开号WO 2019/055261
PCT公开号WO 99/45124
美国临时专利申请号62/961,234
Albertini and Galizzi,Bacteriol.,162:1203-1211,1985.
Ausubel et al.,(1994)
Cao et al.,“Cell surface engineering of Bacillus subtilis improvesproduction yields of heterologously expressedα-amylases”,Microb.Cell Fact.,16:56,2017.
Caspers et al.,“Improvement of Sec-dependent secretion of aheterologous model protein in Bacillus subtilis by saturation mutagenesis ofthe N-domain of the AmyE signal peptide”,Appl.Microbiol.Biotechnol.,86(6):1877-1885,2010.
Castillo-Hair et al.,“An Engineered B.subtilis Inducible PromoterSystem with over 10000-Fold Dynamic Range”,ACS Synth.Biol.,8(7):1673-1678,2019.
Earl et al.,“Ecology and genomics of Bacillus subtilis”,Trends inMicrobiology.,16(6):269-275,2008.
Ferrari et al.,"Genetics,"in Harwood et al.(ed.),Bacillus,PlenumPublishing Corp.,1989.
Matsumoto,“Phosphatidylserine synthase from bacteria”,Review BiochimBiophys Acta,1348(1-2):214-227,1997.
Olempska-Beer et al.,“Food-processing enzymes from recombinantmicroorganisms--a review”’Regul.Toxicol.Pharmacol.,45(2):144-158,2006.
Sambrook,J.;Fritsch,E.F.;Maniatis,T.“Molecular cloning:a laboratorymanual”.1989 2nd Ed.;pp.xxxviii+1546 pp.
Stahl and Ferrari,J.Bacteriol.,158:411-418,1984.
Van Dijl and Hecker,“Bacillus subtilis:from soil bacterium to super-secreting cell factory”,Microbial Cell Factories,12(3).2013.
Wang et al.,“Engineering strong and stress-responsive promoters inBacillus subtilis by interlocking sigma factor binding motifs”,Synth.Syst.Biotechnol.,4(4):197-203,2019.
Zhou et al.,“Promoter engineering enables overproduction of foreignproteins from a single copy expression cassette in Bacillus subtilis”,Microbial Cell Factories,18(111),2019.
序列表
<110> 丹尼斯科美国公司(DANISCO US INC)
<120> 用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法
<130> NB41871-US-PSP
<160> 27
<170> PatentIn 3.5版
<210> 1
<211> 483
<212> PRT
<213> 噬细胞菌属物种(Cytophaga sp.)
<400> 1
Ala Ala Thr Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Val Pro
1 5 10 15
Asn Asp Gly Gln Gln Trp Asn Arg Leu Arg Thr Asp Ala Pro Tyr Leu
20 25 30
Ser Ser Val Gly Ile Thr Ala Val Trp Thr Pro Pro Ala Tyr Lys Gly
35 40 45
Thr Ser Gln Ala Asp Val Gly Tyr Gly Pro Tyr Asp Leu Tyr Asp Leu
50 55 60
Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys
65 70 75 80
Gly Glu Leu Lys Ser Ala Val Asn Thr Leu His Ser Asn Gly Ile Gln
85 90 95
Val Tyr Gly Asp Val Val Met Asn His Lys Ala Gly Ala Asp Tyr Thr
100 105 110
Glu Asn Val Thr Ala Val Glu Val Asn Pro Ser Asn Arg Tyr Gln Glu
115 120 125
Thr Ser Gly Glu Tyr Asn Ile Gln Ala Trp Thr Gly Phe Asn Phe Pro
130 135 140
Gly Arg Gly Thr Thr Tyr Ser Asn Trp Lys Trp Gln Trp Phe His Phe
145 150 155 160
Asp Gly Thr Asp Trp Asp Gln Ser Arg Ser Leu Ser Arg Ile Phe Lys
165 170 175
Phe His Gly Lys Ala Trp Asp Trp Pro Val Ser Ser Glu Asn Gly Asn
180 185 190
Tyr Asp Tyr Leu Met Tyr Ala Asp Tyr Asp Tyr Asp His Pro Asp Val
195 200 205
Val Asn Glu Met Lys Lys Trp Gly Val Trp Tyr Ala Asn Glu Val Gly
210 215 220
Leu Asp Gly Tyr Arg Leu Asp Ala Val Lys His Ile Lys Phe Ser Phe
225 230 235 240
Leu Lys Asp Trp Val Asp Asn Ala Arg Ala Ala Thr Gly Lys Glu Met
245 250 255
Phe Thr Val Gly Glu Tyr Trp Gln Asn Asp Leu Gly Ala Leu Asn Asn
260 265 270
Tyr Leu Ala Lys Val Asn Tyr Asn Gln Ser Leu Phe Asp Ala Pro Leu
275 280 285
His Tyr Asn Phe Tyr Ala Ala Ser Thr Gly Gly Gly Ala Tyr Asp Met
290 295 300
Arg Asn Ile Leu Asn Asn Thr Leu Val Ala Ser Asn Pro Thr Lys Ala
305 310 315 320
Val Thr Leu Val Glu Asn His Asp Thr Gln Pro Gly Gln Ser Leu Glu
325 330 335
Ser Thr Val Gln Pro Trp Phe Lys Pro Leu Ala Tyr Ala Phe Ile Leu
340 345 350
Thr Arg Ser Gly Gly Tyr Pro Ala Val Phe Tyr Gly Asp Met Tyr Gly
355 360 365
Thr Lys Gly Thr Thr Thr Tyr Glu Ile Pro Ala Leu Lys Ser Lys Ile
370 375 380
Glu Pro Leu Leu Lys Ala Arg Lys Asp Tyr Ala Tyr Gly Thr Gln Arg
385 390 395 400
Asp Tyr Ile Asp Asn Pro Asp Val Ile Gly Trp Thr Arg Glu Gly Asp
405 410 415
Ser Thr Lys Ala Lys Ser Gly Leu Ala Thr Val Ile Thr Asp Gly Pro
420 425 430
Gly Gly Ser Lys Arg Met Tyr Val Gly Thr Ser Asn Ala Gly Glu Ile
435 440 445
Trp Tyr Asp Leu Thr Gly Asn Arg Thr Asp Lys Ile Thr Ile Gly Ser
450 455 460
Asp Gly Tyr Ala Thr Phe Pro Val Asn Gly Gly Ser Val Ser Val Trp
465 470 475 480
Val Gln Gln
<210> 2
<211> 9515
<212> DNA
<213> 人工序列
<220>
<223> 合成的表达盒
<400> 2
ctgggagctg atagcacagc gatttcccgc ctcctgtcgg aagcatcgcc accgtgtccc 60
gtccctccag cacgcttttg atgatcgttt cctggccttt tttaaaagca tgataaccaa 120
aatacctgcg gagcgcctga tgaagtttat ccattcctga tcaccgtttt cgacagggcc 180
aggcggattt taaaataact gtatcggccg ccgagtccct ctttaatttg tctgatttta 240
ttggtttggt tcgctatcgc ataatcggca ataattttct gttcctcttt cgacacgtac 300
tgatcgatgg aaaaagacgg atcatgaatg gcgatttcca caatgtgatc ctcgatcgtc 360
gccaatttca gctttctaat ttttgcgatc cggtctattg tatacccttc ttttataaga 420
aagagcgttt ttctcgtcga ttgtgtcaga ccatcattca aaggaatgtc atgaatgagc 480
gtttgaaaaa gcggactttc accattttgg gcggattgaa taaaatggtg cagaacatcc 540
caaaacagtg catatatgta ccactcatca aggttcattt tttcggaaag ctgtctgaat 600
gtatagcccg cttttgttct ggatgtcagg gagtgaacaa aaatagcggc ctgttcatca 660
tgatttaaaa cagacagctt ctctttcagc tcttggtgaa actgggccgc tgtttcagca 720
gcattccggt ttcttaaata ctgtttaacc cagttctgaa tctgataatc ttttacgatc 780
ggcaaataca cgcgttcgcg gtaaagcttg ttggagagca cttggatcaa aagcgacatc 840
cttgcccaca tcactttggc tgccgcctga taatagccgc cgtgaaaatg gcggggccac 900
ggataaaggg caaaaaagcc ggcaagttcc gcttctcctt tttcggtgac ggtgtaagcg 960
ccgctttccg ctttttctct gaccaaagac tcctgcttca atcgttgaac gctggctgcc 1020
acctgctctc tcgacagagc cgaacaaaag ccgaagtatt ttgaaacggc aaataaaccg 1080
gcgtcctgta tcgtctgtga cgaccttttt ccttttaata aatgatagac cgcgcttgga 1140
gaacgctcac ccttcatgga tgacagaatg tcaagcacaa tcgcgtcaaa aaaatgaacc 1200
ggcatatcat cacctgcaat cttccggcaa cattcgatca tttcttcctt ttattttaac 1260
agattttgcg gagaaatcga cgtttaaact catataaaag gggtatgtta gcagtagaac 1320
ccttgtgtga taagcattct caatattttt gagttgaaat gtaagattaa caccattaca 1380
ataaggaatg ggaataggtt tcatatcgga tagatagagg gttaaaccat ttgttccaac 1440
gaagaacaat ctgggaggtt ttttattcat gccaaaatat acaattgtag acaaagatac 1500
gtgcatcgca tgcggagctt gtggtgctgc ggctcctgat atttatgatt acgacgatga 1560
gggaatcgca tttgtcaccc ttgacgacaa tcagggtgtc gtcgaagtcc ctgacgtctt 1620
agaagaagac atgatggacg cgtttgaagg ctgtcctaca gattcgatca aagttgcgga 1680
tgagccgttc gaaggcgacc cgcttaaaca cgaataaagc caaaaaacat ccggtgcaca 1740
aagtgccgga tgttttttta tgagataagc acggctttac caacaagcaa aaagaagccg 1800
gctaaagaca tccggcttct tctgcagctg acaatatccg ggaacatgca cccgatattg 1860
tcatgtttat ttatttggcc atgcggacgt tttccttcag ccgcggtttc agcgaaagga 1920
aaatcggcgt ggacacgagg gccacagcga tgcctttaat gaaattaaaa ggcaggattc 1980
cggccagaac tgttgtcttg agcgcctctc cagtcagcgc tggagcattt aaaaaccaag 2040
tgtaggcagg cagaaacagc agataattta aaatgctcat cgaaacggcc atcacaagcg 2100
tccctgcgaa aagagctgtg acaaaccctt tggcagaact tgattttttc agcagtacag 2160
ctgccggcag gataaacaat gttccggcaa tgaagttagc cgcctgatca atcggaacgc 2220
ccgaggcgct tcctgcaata aagtaattca gcacgttttt gatcgcttca acggcaatcc 2280
cggctcccgg accgtacaaa ataacagcga gcaatgccgg gatatcactg aaatcgattt 2340
ttaaatacgg gaatgccccc aggatcggaa agctcagcat cattaaaata aatgcgatgc 2400
tgctcagcat gctgatagag acgagacgtc tcaccttgtt gtgtttcatt ttgtcactct 2460
ctccttttcg atcacatctc acgaaaagag gaatggttct ttcccctgtc ctaaacaaaa 2520
aacccgcttt attgaaaaag cggggctgtt ttacagacag gtcaaataaa cgtttgaaaa 2580
tgttcatttc aaaacgcgcg gaacctccat cttctcccat ccagactata ctgtcggctt 2640
cggaatcgca ccgaatcctg cccataaaaa ggctcgcggg cttagagcgc ttgctcatca 2700
ccgccggtag ggaatttcac cctgccccga agattgatct tatttatttt taatactgat 2760
attattataa attaattgtg aaaaaatgta caggtgcaaa gcttattgcg ctgttttggg 2820
acatcctgca cgatatttcg gtaaactcac tttttccgca tactaaaaac cgcacattca 2880
cagttatttc atttttaatt ttcgtctttc cgcgtgaaac tcattgacac tctttatgga 2940
atatggtaaa ttatcagata tttatgacgc ttatttagga ggaaatctta catgtttcga 3000
gtattggtct cagataaaat gtccagcgac ggcctcaaac cattaatgga agcagatttt 3060
attgaaattg tagaaaagaa tgttgcggaa gcggaagacg agcttcatac gtttgacgcg 3120
ctcttggtgc ggagcgccac gaaggtaacc gaagagctgt ttaaaaagat gacttcgctg 3180
aaaatcgtcg ccagagcagg tgtcggcgtc gacaatatcg atattgacga ggcgacaaaa 3240
cacggtgtta tcgtcgtaaa cgcgccaaac gggaatacaa tttcaaccgc tgaacatacc 3300
tttgcaatgt tttcagcgtt aatgagacat attccgcagg caaacatctc cgtgaaatca 3360
agggagtgga atcgttcggc ttacgtcggt tcagagcttt acggaaaaac gctcggcatc 3420
atcggaatgg gccgcatcgg aagcgaaatc gcgagccgcg caaaagcatt cggtatgacc 3480
gttcatgtat ttgacccgtt cctgacccaa gaaagggcaa gcaagctcgg cgttaacgcg 3540
aacagctttg aagaagttct ggcatgcgcc gacatcatta cggttcatac cccgctcacg 3600
aaagaaacga agggactttt gaacaaagaa accatcgcaa aaacgaaaaa aggcgttcgt 3660
ctcgttaact gtgcaagagg cggcatcatc gatgaagcag cgcttttgga agctctggaa 3720
agcggacatg tcgctggcgc tgccttggat gtattcgaag tcgagcctcc ggtcgattca 3780
aaactgatcg atcatccgct tgtagtcgcg actcctcact tgggcgcctc aacaaaagaa 3840
gcccagctga atgtcgctgc acaagtgtcc gaagaagtcc ttcagtatgc gcaaggaaac 3900
cctgtgatgt ccgcgatcaa ccttccggcc atgacaaagg attcattcga aaaaatccag 3960
ccttatcatc agtttgccaa tacgatcgga aaccttgtgt ctcagtgcat gaatgagcct 4020
gttcaagatg tagccatcca atatgaaggc tccatcgcca aacttgaaac gtcatttatt 4080
acgaaaagcc ttttggccgg atttctgaag ccgagggtcg cggctaccgt taacgaagtg 4140
aatgccggca ccgttgcgaa agagcgcggc atcagcttca gcgaaaaaat ttcttccaat 4200
gagtcaggct atgaaaactg catctctgtg actgtcacgg gagatgtaac aacattctct 4260
ttaagagcga cgtacattcc gcacttcggc ggacgcatcg ttgccttaaa cggctttgat 4320
attgattttt atccggctgg acaccttgtc tacattcacc accaggataa accaggggct 4380
atcggccatg tcggacgaat tttaggagac catgacatca atatcgccac tatgcaggta 4440
ggccgaaaag aaaaaggcgg agaagcgatc atgatgcttt cctttgaccg ccaccttgag 4500
gacgatattt tagctgagct gaaaaacatc ccggatatcg tgtctgttaa agccatcgac 4560
cttccttaag tcgctgataa acagctgaca tcaatatcct attttttcaa aaaatatttt 4620
aaaaagttgt tgacttaaaa gaagctaaat gttatagtaa taaaacagaa tagtctttta 4680
agtaagtcta ctctgaattt ttttaaaagg agagggtaaa gatgaaacaa caaaaacggc 4740
tttacgcccg attgctgacg ctgttatttg cgctcatctt cttgctgcct cattctgcag 4800
ctagcgcagc agcgacaaac ggaacaatga tgcagtattt cgagtggtat gtacctaacg 4860
acggccagca atggaacaga ctgagaacag atgcccctta cttgtcatct gttggtatta 4920
cagcagtatg gacaccgccg gcttataagg gcacgtctca agcagatgtg gggtacggcc 4980
cgtacgatct gtatgattta ggcgagttta atcaaaaagg tacagtcaga acgaagtatg 5040
gcacaaaagg agaacttaaa tctgctgtca acacgctgca ttcaaatgga atccaagtgt 5100
atggtgatgt cgtgatgaat cataaagcag gtgctgatta tacagaaaac gtaacggcgg 5160
tggaggtgaa tccgtctaat agatatcagg aaacgagcgg cgaatataat attcaggcat 5220
ggacaggctt caactttccg ggcagaggaa caacgtattc taactggaaa tggcagtggt 5280
tccattttga tggaacggat tgggaccaga gcagaagcct ctctagaatc ttcaaattcc 5340
atggaaaggc gtgggactgg ccggtttctt cagaaaacgg aaattatgac tatctgatgt 5400
acgcggacta tgattatgac catccggatg tcgtgaatga aatgaaaaag tggggcgtct 5460
ggtatgccaa cgaagttggg ttagatggat acagacttga cgcggtcaaa catattaaat 5520
ttagctttct caaagactgg gtggataacg caagagcagc gacgggaaaa gaaatgttta 5580
cggttggcga atattggcaa aatgatttag gggccctgaa taactacctg gcaaaggtaa 5640
attacaacca atctcttttt gatgcgccgt tgcattacaa cttttacgct gcctcaacag 5700
ggggtggagc gtacgatatg agaaatattc ttaataacac gttagtcgca agcaatccga 5760
caaaggctgt tacgttagtt gagaatcatg acacacagcc tggacaatca ctggaatcaa 5820
cagtccaacc gtggtttaaa ccgttagcct acgcgtttat tctcacgaga agcggaggct 5880
atcctgcggt attttatgga gatatgtacg gtacaaaagg aacgacaaca tatgagatcc 5940
ctgctcttaa atctaaaatc gaacctttgc ttaaggctag aaaagactat gcttatggaa 6000
cacagagaga ctatattgat aacccggatg tcattggctg gacgagagaa ggggactcaa 6060
cgaaagccaa gagcggtctg gccacagtga ttacagatgg gccgggcggt tcaaaaagaa 6120
tgtatgttgg cacgagcaat gcgggtgaaa tctggtatga tttgacaggg aatagaacag 6180
ataaaatcac gattggaagc gatggctatg caacatttcc tgtcaatggg ggctcagttt 6240
cagtatgggt gcagcaatga aagcttctcg aggttaacag aggacggatt tcctgaagga 6300
aatccgtttt tttattttac agaagctgcg gaacctgaaa agaattcctt tcaggttccg 6360
ttttttttag gaattctccc tgatctcaag catctggcgg ggataaatcc gctctccttt 6420
caaatcgttc cattctttga ggcgctgtac agttacgccc attttttcgg cgatatgatg 6480
aagcgtatcc cctttccgca ctacatatgt accggtcttc gattcatcgt catgaaggcg 6540
gagtgtttgg ccggccttga gatttgaatg tttcaacccg tttattctca tgatctcctc 6600
gatggatata ccgctatcct tgctgattct ccagagcgtg tccccttttt gaacggtcac 6660
cgcaccgctc attgtcccgg cgttttgata aacgtggata gaattttgcc ggaacgcctc 6720
ctcacgaagc accgtcagcg gattgattgc atatctttta tcttcagtcc atgaaccgtg 6780
atgcatttca aaatgcaggt gggttccggt cgatattccc gtattgccga tgattccgat 6840
ttgctcgcct tttttcaccc gctccttttc ctttttcagg cgtttgctta agtgggcata 6900
aacggtttca tatccgttgt catgtttaat aaatatcact tggccgtagg agtcggattg 6960
atacgatttg cttatcgttc cgtctgcggc tgccgctact gcttcccctt cgggagcagc 7020
gatgtcaagc cccttatgct ttccgcctct cgtaccgaat tgatctgtga tctctccttt 7080
aatcggttca atccactctg aggcttccgc ccccggggca ttgacgaaaa gcgccaatcc 7140
cgaaagccat gcgatcgcga acaggaagtt ttgatgtctg agtttcttca aggttttcca 7200
tatcctccta ttacatgcat cttcggtaaa attgccccct attcggagac agcttagtat 7260
acttccaaat caatacaatt tatacattaa aaaaagactc cgcacaggga gtcttttagt 7320
tttctatcgt catcggattc ggtgcgtacg gaacctgtac agatttcgac aggtcatagg 7380
cgccgacctt ggttatggat gcgtttttaa atttcacttt tgtgaagccg aaatctttcg 7440
cggtcaatag aaggccttcc accatcaaga catcttcggg tttattttca atattcgcgg 7500
aggaagaaaa ttgaatgatc agttcttttc cattcttttg aatatcttca atcggcgtat 7560
catcggataa aatgggtttt aaatgagtgc cgctttcttc gtttttcatc atcttaatcg 7620
cttcctgcac cgattcgtaa gattcgcttg aaggtgcaag gaaccggcgc ccgtctgagc 7680
tttcatataa atagtagcat ttttgcgtct ggtgcataat cgccatatcg gcgagcattc 7740
cgaatgtttc aaattcaaca cccgatttat cattggaaat aaacagaaca gaatcatacg 7800
atccccattt aaaggtttcg ttgatcacat ttttcagccg ttcgaaatct tcgactgata 7860
gctccggtat tttctcatca acttgaatct tcagtttttt attgtttttc tgctctttga 7920
acttcacctt atcaaggtaa gctgtgtcaa atgatgtaaa ctggtccact ccaagccggc 7980
tgtaagcgtg aagcgcatct tcaagatttg tcatgccagt gcttttctcg aggcttaccg 8040
ggacaacgac agacttggac tcgtcaagga aagcgaaggt gatatagtcg tctttttgat 8100
tctgtgagac gacaaacgta tttgcaggtt cagacttggc agcatcagcc tccgtctgca 8160
ccaattttcc gtcagaagaa atgttggcgt cggcgctgtt ttgagatctg atctgttcga 8220
ttaactgggg agtgatcagc atcagaagaa agagaaccaa aactgtagca gcaaatgcgc 8280
cgacccgttt tttcggtgat ttacgctttg gtgcgagaat cagcttttga tagatctgat 8340
ttgccgaacg attatcctta accgttggaa gttggcttag taacgccttc agccgttctt 8400
cgttccattc tgacttcttc attctttgga tcctccttca aaagctccat ctgtttacga 8460
agcactttca gaccgcggtg ctgagtggtt tttaccttgc tttcggaaaa attcaaggct 8520
tttgctgttt cactgatcga atatccttga ataaaacgca agacgataac tgatctttgg 8580
tcaagcgtac acttgtctag ggcctcgaaa atttccttta ggttttcatt ttgcatcacg 8640
atgtcctcag gcagaggctt gcggtctttt acatcttgtt tctcccagtc aaacgtcccc 8700
aaaatccgct ggcggatcgt ctgctgcttt ctgaaccagt cgatcgcaac gtgccgcgca 8760
atcgaaagaa gccaggtttt ttcgctgctc ctgccttcaa atgtttcgta agaatgcagg 8820
acgcggatgt atacttcctg aactaagtct tccgcctgat ttttgtcttt taccatataa 8880
aataaaaact gaaataaatc ctgatgatac tgatcatata ttttctgaaa ggtttcttcc 8940
acctgaaacc cctccgttca atttattgtc gtttgtcaat cttaaaaggt tacattacaa 9000
ctattacaac tatattacga acatatgaaa atggaaaggg ggttttgcga aagttaagct 9060
taattttaac ttaacaagca caaaagcacc cgttctaaat gaacaggtgc caaggttata 9120
ggagcccaca ttttcactaa gctgtgccct tacaaggctt tcgttctcct gaccggagcg 9180
ttgcggatcc gctgaaatga actaatttca atccgtttat gactttaagt ccaattgttg 9240
gcgaagcttt ttggaaatct ccattctctt ttcgtcagtc actaggtgat accataagcc 9300
gtcaactttt ttgtcttcac cttcaatttc tacctgctta atatctttag cagcttcttt 9360
ataagaactt tgaatatcga tcatcttgtc cagtgttaag tttgttttga tgtttttttc 9420
taatgctgcc aaaatctctt gatagtttgt taatgatttt aattgtgcac cttcatgaat 9480
aatttcgttg ataatctcac gctgacgctc ttgac 9515
<210> 3
<211> 1000
<212> DNA
<213> 人工序列
<220>
<223> serA1基因座
<400> 3
aatggttctt tcccctgtcc taaacaaaaa acccgcttta ttgaaaaagc ggggctgttt 60
tacagacagg tcaaataaac gtttgaaaat gttcatttca aaacgcgcgg aacctccatc 120
ttctcccatc cagactatac tgtcggcttc ggaatcgcac cgaatcctgc ccataaaaag 180
gctcgcgggc ttagagcgct tgctcatcac cgccggtagg gaatttcacc ctgccccgaa 240
gattgatctt atttattttt aatactgata ttattataaa ttaattgtga aaaaatgtac 300
aggtgcaaag cttattgcgc tgttttggga catcctgcac gatatttcgg taaactcact 360
ttttccgcat actaaaaacc gcacattcac agttatttca tttttaattt tcgtctttcc 420
gcgtgaaact cattgacact ctttatggaa tatggtaaat tatcagatat ttatgacgct 480
tatttaggag gaaatcttac acagaagctg cggaacctga aaagaattcc tttcaggttc 540
cgtttttttt aggaattctc cctgatctca agcatctggc ggggataaat ccgctctcct 600
ttcaaatcgt tccattcttt gaggcgctgt acagttacgc ccattttttc ggcgatatga 660
tgaagcgtat cccctttccg cactacatat gtaccggtct tcgattcatc gtcatgaagg 720
cggagtgttt ggccggcctt gagatttgaa tgtttcaacc cgtttattct catgatctcc 780
tcgatggata taccgctatc cttgctgatt ctccagagcg tgtccccttt ttgaacggtc 840
accgcaccgc tcattgtccc ggcgttttga taaacgtgga tagaattttg ccggaacgcc 900
tcctcacgaa gcaccgtcag cggattgatt gcatatcttt tatcttcagt ccatgaaccg 960
tgatgcattt caaaatgcag gtgggttccg gtcgatattc 1000
<210> 4
<211> 1578
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 4
atgtttcgag tattggtctc agataaaatg tccagcgacg gcctcaaacc attaatggaa 60
gcagatttta ttgaaattgt agaaaagaat gttgcggaag cggaagacga gcttcatacg 120
tttgacgcgc tcttggtgcg gagcgccacg aaggtaaccg aagagctgtt taaaaagatg 180
acttcgctga aaatcgtcgc cagagcaggt gtcggcgtcg acaatatcga tattgacgag 240
gcgacaaaac acggtgttat cgtcgtaaac gcgccaaacg ggaatacaat ttcaaccgct 300
gaacatacct ttgcaatgtt ttcagcgtta atgagacata ttccgcaggc aaacatctcc 360
gtgaaatcaa gggagtggaa tcgttcggct tacgtcggtt cagagcttta cggaaaaacg 420
ctcggcatca tcggaatggg ccgcatcgga agcgaaatcg cgagccgcgc aaaagcattc 480
ggtatgaccg ttcatgtatt tgacccgttc ctgacccaag aaagggcaag caagctcggc 540
gttaacgcga acagctttga agaagttctg gcatgcgccg acatcattac ggttcatacc 600
ccgctcacga aagaaacgaa gggacttttg aacaaagaaa ccatcgcaaa aacgaaaaaa 660
ggcgttcgtc tcgttaactg tgcaagaggc ggcatcatcg atgaagcagc gcttttggaa 720
gctctggaaa gcggacatgt cgctggcgct gccttggatg tattcgaagt cgagcctccg 780
gtcgattcaa aactgatcga tcatccgctt gtagtcgcga ctcctcactt gggcgcctca 840
acaaaagaag cccagctgaa tgtcgctgca caagtgtccg aagaagtcct tcagtatgcg 900
caaggaaacc ctgtgatgtc cgcgatcaac cttccggcca tgacaaagga ttcattcgaa 960
aaaatccagc cttatcatca gtttgccaat acgatcggaa accttgtgtc tcagtgcatg 1020
aatgagcctg ttcaagatgt agccatccaa tatgaaggct ccatcgccaa acttgaaacg 1080
tcatttatta cgaaaagcct tttggccgga tttctgaagc cgagggtcgc ggctaccgtt 1140
aacgaagtga atgccggcac cgttgcgaaa gagcgcggca tcagcttcag cgaaaaaatt 1200
tcttccaatg agtcaggcta tgaaaactgc atctctgtga ctgtcacggg agatgtaaca 1260
acattctctt taagagcgac gtacattccg cacttcggcg gacgcatcgt tgccttaaac 1320
ggctttgata ttgattttta tccggctgga caccttgtct acattcacca ccaggataaa 1380
ccaggggcta tcggccatgt cggacgaatt ttaggagacc atgacatcaa tatcgccact 1440
atgcaggtag gccgaaaaga aaaaggcgga gaagcgatca tgatgctttc ctttgaccgc 1500
caccttgagg acgatatttt agctgagctg aaaaacatcc cggatatcgt gtctgttaaa 1560
gccatcgacc ttccttaa 1578
<210> 5
<211> 95
<212> DNA
<213> 人工序列
<220>
<223> 合成的启动子
<400> 5
gtcgctgata aacagctgac atcaatatcc tattttttca aaaaatattt taaaaagttg 60
ttgacttaaa agaagctaaa tgttatagta ataaa 95
<210> 6
<211> 58
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 6
acagaatagt cttttaagta agtctactct gaattttttt aaaaggagag ggtaaaga 58
<210> 7
<211> 87
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 7
atgaaacaac aaaaacggct ttacgcccga ttgctgacgc tgttatttgc gctcatcttc 60
ttgctgcctc attctgcagc tagcgca 87
<210> 8
<211> 34
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 8
cggatttcct gaaggaaatc cgttttttta tttt 34
<210> 9
<211> 1000
<212> DNA
<213> 人工序列
<220>
<223> lysA基因座
<400> 9
tcgttccggg ttcgatgccg cctccatgga tggccatgat gagcatcggc actcttgcgt 60
tcttctccgt aattcggtaa gaagctggat cttcattccg ctccaattct tcaaagcttg 120
aatattgatc gccggactgt gttgcgccat gggccgcagc agaatatggg aatgagatca 180
cagccgaaat caataaaata ttcacaaaaa tgtttattgc tgtaaaacga tttactgtgt 240
tacaatcaac acattgcttc aggcactgga gcaatcggtg gagtagggat actttggccg 300
gtttcatcta ctccgcctct aaatccaaca aatcagcaaa tctcatcctt ttcaccctgg 360
tcattgcctt tatcatctcc tttgtaaatt ttttgttaaa ttcacaatat tatatacaat 420
tagcccggtc gctgttctat gcatgtcatg atctttttaa caaaaaacac ctcccgatca 480
ccgggaagtg tttttcgtgc ttgtcattcc ctctttctct atcgacaaag gtgcaagggg 540
cgctccggtt gctgcccgat gcatcttccg gcttcatgat agtgcgattc ttatgttgta 600
ttataacatt tcgttttaaa aactaaacca ccatttgtcc aaattttctt gatttataaa 660
ggaaatgatt ccctaaacaa ctaatccatt ctattgatta tagaataaca gaaaacagcg 720
cttgatagaa ataggcatac acaacgtcca ttcaataaaa aaagagccga aaagctgaga 780
ttttcgccca tacaaatagg catttacctg aatataatct taaagatgaa aaccaaaaaa 840
cgaagtggga aagaggttat catatgtatc caaatcgcta tccctacacc cccgctcccg 900
gctatgcacc tgaagatgta tacgcccctt atcagccggc tgcgcattat gaacagagaa 960
tttatgagcc ttatgaaggg cagattatta cagctccggc 1000
<210> 10
<211> 1320
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 10
ttgtttttac acggtactag cagacaaaat gaaagagggc acctcgaaat cggcggtgtc 60
gatgttctat cattggcaga aagatacgga acacctcttt atgtatacga tgtcgcgctg 120
attagagagc gcgcccgaaa attccagaag gcattcaagg aagccggttt aaaagcgcag 180
gtagcgtatg caagcaaggc gttttcatcg gttgccatga ttcagcttgc cgaacaagag 240
gggctgtctc tggatgtggt atcgggagga gagcttttca ctgcgatcaa agcagggttc 300
ccagctgagc ggattcattt tcacggaaac aataagagcc ctgaagaact agccatggcg 360
ctggagcatc aaatcggctg catcgtgctc gataactttc acgagatcgc cattacagaa 420
gatctttgca agcgatcagg acaaactgta gacgttttgc tcagaatcac tccgggagtt 480
gaagcgcaca cgcacgatta tattacgacg gggcaggaag attccaaatt cggttttgat 540
ctgcataatg gacaggtcga acaagccatc gaacaagtcc tccgctcgtc tgcgtttaag 600
ctcctcggcg tgcactgcca catcggttcg caaatttttg atacggcagg atttgtcctt 660
gcagcagaca agattttcga gaagcttgcg gaatggcggg agacttactc tttcattccg 720
gaagtgctca atcttggcgg gggcttcggc atccgctata caaaagacga cgagccgctt 780
gcagctgatg tttatgttga aaaaatcatc gaggcggtca aagcaaatgc cgagcatttc 840
ggctttgaca tccctgagat ttggatcgaa ccaggccggt ctctcgtcgg tgatgcgggg 900
actacgctgt acacgatcgg ttctcaaaaa gaggtgccgg gcattcgcaa atatgtagcc 960
atcgacggcg gcatgagcga taatatcagg ccggcgcttt atgaggcaaa atatgaagca 1020
gccgtcgcca acaggatgaa cgatgcttgt catgataccg catcaatcgc aggaaaatgc 1080
tgcgaaagcg gagatatgct gatttgggat ttggaaatcc ccgaagttcg cgacggagat 1140
gtgctcgccg ttttctgcac cggtgcgtac ggctacagca tggccaacaa ctacaaccgc 1200
attccgcgcc cggccgtcgt ctttgtcgag gacggggaag cgcagctcgt cattcagaga 1260
gagacgtatg aggatatcgt caagctggat ctgccgctga aatcgaaagt caaacaataa 1320
<210> 11
<211> 74
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 11
gcttttcttt tggaagaaaa tatagggaaa atggtacttg ttaaaaattc ggaatattta 60
tacaatatca tatg 74
<210> 12
<211> 5822
<212> DNA
<213> 人工序列
<220>
<223> 表达盒
<400> 12
aaatataagg aggccaatta aatgatgaca gcaaaaaatt tgcaagatcg aatcaaattg 60
aataacggga cagctatgcc ttggtttgga cttggcgtat ttaaagtaga agaagggccc 120
gaactggtac aagccgtaaa aacggcgatt aaacacggct accgcagtat tgataccgca 180
gccatctacg gtaatgaaga gggggttggg caaggaatcc gcgaggggtt gaaagaagcc 240
ggcatttcaa gagaagacct gtttgttaca tcaaaggtct ggaatgacga tttaggctat 300
gacgaaacga ttgcagccta tgaggcgagt ctcgaaaagc tcggacttga ctaccttgat 360
ttatacctga tccactggcc tgttgaagga cgctacaaag cggcgtggaa agcgcttgaa 420
acactttatg aacaaggacg cgtaaaagca atcggagtga gcaattttca gattcaccat 480
ctggaagact tgctgaaaga tgccgccgtc aaaccggcga tcaaccaggt tgagtatcat 540
ccgcggctga cgcagaaaga gctgcaagcg ttttgccgtg cgcacggcat ccagctgcaa 600
gcatggtcgc cgctgatgca aggccaattg ctcagccatc cactgctgaa agatatcgcg 660
gacaagtacg gcaagacacc ggcccaagtc attttgcgct gggatttgca aaacggggtc 720
gttacgattc cgaagtcgac taaagcggag cggattgccc aaaacgcgga catatttgat 780
tttgaactga ccaccgagga aatgaagcaa attgacgcgc tgaatgaaaa cacccgtgtc 840
ggccctgatc ccgataactt tgacttttaa caaaacggcc ccgttcgaca ttcgaacggg 900
gctttaattg aattgtgcgg ttacaccgcc ggactccatc atcatcagtt cttttttcat 960
atccaatccg ccccggtatc ccgtgagctg cccgctttta ccgataaccc gatggcaagg 1020
caccaccatt aacagcggat ttgcgccgat cgccgcgcct actgcccgca cagcggcctg 1080
cttttcaata tgctcggcga tatcggaata ggagcaagtg ctgccgtaag ggatttcgga 1140
gagcgccttc cacactgcca gctgaaaagg cgtgccggca aggtcgacag gaaagctgaa 1200
atgagttcgc ttgccgttca aatacgcctg cagctgctcg gcgtattctg ccaatccttt 1260
gtcatcccga atgaaaactg gctgtgtaaa tcttttttca gcccaagcgg ccaaatcctc 1320
gaagccttga ttccatcccc ctgtaaaaca gagcccgcgg gcagtcgccc caatgtgaat 1380
ctgccaacct cggcaaataa gcgtacgcca gtatacgatt tgatcgtcca tatgtttacc 1440
tccgtttcat ttgccggtac gacgtcggcg attgcccagt cttcttttta aacaaagagg 1500
caaaatattc cgcattcgca atgcctacca ttgaagcgat ttctgcgatc gatcgttctg 1560
aatgagcaag caaatcgacc gctttctcaa tccttttctg caggatgtat tctgccggcg 1620
agacgccttt gattcgttta aatgtccgct gcaggtgaaa agggctgata tggcacctgt 1680
cagccaaagc ttgcagagac agcggatcgc gataagattc ctcgatgatt tccaccacac 1740
gctgtgccag ctcttcatcc ggcagcagcg ccccggccgg attgcagcgt ttgcaggggc 1800
ggtacccttc tgataaagca tcttttgcat tgaaaaagat ctgcacattg tcgatttgcg 1860
gaactctcga tttgcaggaa gggcggcaaa atatgccggt cgttttgacc gcgtaataaa 1920
aaactccgtc ataggcggaa tcgttttccg taatcgcccg ccacatttca ggcgtcaatc 1980
gtgatttgct gttcatatct tcaccccgat ctatgtcagt ataacctata tgacagccgg 2040
aggtggagag gcggagaacg gcacagcaag aagacaaaga agaagagaga ctgttgcctg 2100
gacctccgaa acgcgctaca attcatttac aacacaggat ggggtgagaa tattgccgga 2160
atcagtgaag caggcctcct aaaataaaaa tctatatttt aggaggtaaa acatgaattt 2220
tcaaacaatc gagcttgaca catggtatag aaaatcttat tttgaccatt acatgaagga 2280
agcgaaatgt tctttcagca tcacggcaaa cgtcaatgtg acaaatttgc tcgccgtgct 2340
caagaaaaag aagctcaagc tgtatccggc ttttatttat atcgtatcaa gggtcattca 2400
ttcgcgccct gagtttagaa caacgtttga tgacaaagga cagctgggtt attgggaaca 2460
aatgcatccg tgctatgcga tttttcatca ggacgaccaa acgttttccg ccctctggac 2520
ggaatactca gacgattttt cgcagtttta tcatcaatat cttctggacg ccgagcgctt 2580
tggagacaaa aggggccttt gggctaagcc ggacatcccg cccaatacgt tttcagtttc 2640
ttctattcca tgggtgcgct tttcaaactt caatttaaac cttgataaca gcgaacactt 2700
gctgccgatt attacaaacg ggaaatactt ttcagaaggc agggaaacat ttttgcccgt 2760
ttccttgcaa gttcaccatg cagtgtgtga cggctatcat gccggcgctt ttataaacga 2820
gttggaacgg cttgccgccg attgtgagga gtggcttgtg tgacagagga aaggccgata 2880
tgattcggcc ttttttatat gtacttctta gcgggtctct aaaataacca aaaagcaagg 2940
actgctgaaa gggctgacat aagccttttg ccggcggtcc ttttttaatt ctgatttttc 3000
aaacttagcc ccctcgagca cacaaggacg cggtacgttc acaatggtct ttgaccacta 3060
tgaagaagtg cctaagagca tcgctgatga gatcatcaaa aaaaatcaag gtgaataatt 3120
gattttgcct cttcattaaa gtataactac tattacagaa tagtctttta agtaagtcta 3180
ctctgaattt ttttaaaagg agagggtaaa gattgaataa atcagtcata ccttctttaa 3240
ttacggttgg aaactttgtt tcgggcatct cttcaatact gcttgcattc agagggtatt 3300
tattcttagc cattatattt gttctgatcg gcgctatctt ggacagcctt gacggcatgg 3360
ccgcgcgcag attaaatgcc gtcagcccgt ttggaaaaga attagattct ttgtctgata 3420
ttatcacttt cggagtcgcc ccggccatca tcacctattc aatcgttttt tatgatgctc 3480
cgatcttagg ccttccttcg acattgttat tccctgtttg cggagcgctt cggctggcgc 3540
gatttaatat tcaatcagag aaccaggatt attttacagg ccttccgatc accgcagccg 3600
gaacgattct ggtatgctta aaccttttct cagaaatcct gggcaaaaag ccgttcattt 3660
tgatcatgct gttcctgtcc tttctcatgg tcagcaaaat caaagtcatc agcctgaagg 3720
ggaaaaaact attgaagaaa gtgagctaga agagcagaga ggacggattt cctgaaggaa 3780
atccgttttt ttatttttaa catctctcac tgctgtgtga ttttactcac ggcatttgga 3840
acgccggctc tcaacaaact ttctgtagtg aaaatcatga accaaacgga tcgtcggcct 3900
gattaacagc tgaaagctgc cgatcacaaa catccatagt cccgccggct tcagttcctc 3960
ggagaaaaag cagaagctcc cgacaaggaa taaaaggccg atgagaaaat cgtttaatgt 4020
atgtagaact ttgtatcttt ttttgaaaaa gagttcatat cgattgttat tgttttgcgg 4080
cattgcttga tcactccaat ccttttattt accctgccgg aagccggagt gaaacgccgg 4140
tatacatagg atttatgaat taggaaaaca tatggggaaa taaaccatcc aggagtgaaa 4200
aatatgcggt tattcatatg tgcatcgtgc ctgttcggct tgattgttcc gtcatttgaa 4260
acgaaagcgc tgacgtttga agaattgccg gttaaacaag cttcaaaaca atgggaagtt 4320
caaatcggta aagccgaagc cggaaacgga atggcgaaac cggaaaaagg agcgtttcat 4380
acttatgctg tcgaaatcaa aaacattgga cacgatgtgg cttcggcgga aatttttgtc 4440
tatcggaacg agcctaattc ttcaacgaaa ttttcgcttt ggaacattcc tcacgaaaat 4500
ccggtttctt tagccaaaag cttaaatcac ggaagctctg tcaagcaccg caatctgctt 4560
atggcagaga atgcgaccga attggaagtg gacatgattt ggacggaaaa aggaagcgaa 4620
ggcagacttt taaaggaaac gttcattttc aagggagatg aatcatgaag aaaaaatggc 4680
cgttcatcgt caacggtctt tttttaatga cttaggcagc cgatcgttcg gccatacgat 4740
atcgaagcga cctcgaacca gcagagctcg tcacaaaaca tttgcattta aagaaaaata 4800
caggatgttt tcaccaatat ttttctcaat gatgatacac tattgacaag ctgctacttt 4860
gggagggtgt ttccatagat gccgatgaag caaaaacacc aaatgtgtca tgagagctct 4920
ctctaatcga tataaaagta gggtgaaccg gggttgtcaa tctgtaaaag atcttttttt 4980
atcccgtgat acgcttttgg aattctgaat cttcaagaaa gtccccagcc ttttgctgat 5040
caatcgagaa caaaggatga tacatatgaa aagaatagat aaaatctacc atcagctgct 5100
ggataatttt cgcgaaaaga atatcaatca gcttttaaag atacaaggga attcggctaa 5160
agaaatcgcc gggcagctgc aaatggagcg ttccaatgtc agctttgaat taaacaatct 5220
cgttcgggcc aaaaaggtga tcaagattaa aacgttcccc gtccgctaca tcccggtgga 5280
aattgttgaa aacgtcttga acatcaaatg gaattcagag ttgatggagg ttgaagaact 5340
gaggcggctg gctgacggcc aaaaaaagcc ggcgcgcaat atatccgccg atcccctcga 5400
gctcatgatc ggggctaaag ggagcttgaa aaaggcaatt tctcaggcga aagcggcagt 5460
cttttatcct ccgcacggct tgcatatgct gctgctcggg ccgacgggtt cggggaaatc 5520
gctgtttgcg aatcggatct accagttcgc cgtttattct gacatattga agcccgattc 5580
cccgttcatc acattcaact gtgcagatta ctataacaac cctcaattat tgctctctca 5640
attgttcgga cataaaaaag ggtcttttac aggtgcgggt gaagacaaag caggattagt 5700
cgagcaggcg gacgggggca ttctgtttat ggatgaaatc catcgcctcc cgccggaggg 5760
gcaggaaatg ctgttttatt tcatagacag cggcacatac aacaggcttg gtgaaacaga 5820
gc 5822
<210> 13
<211> 3308
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 13
atgagcaaca ctgaacttga tttgctgagg cagcaggcga atgaattaaa cttgcaaata 60
ttaaagctga ttaacgagcg aggaagaatc gttcaggaga ttggaaaagc gaaggaagca 120
caaggcatca accgctacga tcctgtcaga gaaagagcga tgctgaacga aattattgaa 180
aataacgacg gaccgtttga aaactcgacg atccagcata tcttcaaaga gattttcaaa 240
gccgggcttg aactgcagga agacgatcac agcaaagcgc tgctcgtttc tcgcaagaaa 300
aagcctgaaa atacaatcgt tgatctgaaa ggcgaaaaaa tcggcgacgg agaacaaaga 360
tttatcgtcg gtccgtgtgc ggttgaaagc tacgaacaag tagcggaagt cgcagcggca 420
gctaaaaagc aaggcttgaa actgcttcgc ggcggagctt tcaaaccgcg tacaagcccg 480
tacgacttcc aaggcctcgg cgtggaaggc ctgcaaatct taaagcgtgt tgctgatgag 540
tatgatctgg ccgtcatcag tgagatcgtg aatccgcagc atattgaaga agccattgat 600
tacatcgatg tcatccaaat cggcgcccgc aacatgcaga acttcgagct cttaaaagcg 660
gccggttcag tgaagaagcc ggttctgctg aagcgcggac ttgccgcaac gctgaaggaa 720
ttcatcaatg cagcggagta catcatgtcg cagggcaatg atcaaatcat cctttgtgaa 780
cgcggaatca gaacgtatga aacagcgact agaaatacgc ttgatatctc agctgtgccg 840
atcctgaagc aggaaactca ccttcctgta ttcgtggatg tcactcattc aaccggacgc 900
cgcgacctgc ttcttccgac agcaaaagca gcgcttgcga tcggagctga cggtgtcatg 960
gccgaggtcc atcctgatcc ttctgtcgcg ctttccgact cagctcagca aatggatatc 1020
ccgacatttg aaaaatggtt aaatgaactg aagccgctcg ttcaagtaaa agcataagat 1080
ttgtttatgg accgctcgcg agcggtcctt tttttacgtt gtcatcaaaa attgtcgaaa 1140
aaatttctta tttttaagta aaaagctgtt tattcttatt taaattaatt ataaaaataa 1200
agggaacgtt ttcatattag gtaaaaccgt gtataatttc agagagcccc ttttgttttg 1260
gcaggttatg aaaaataatg taaactggtg ttctgtttat tttacataaa gttttacatt 1320
ttgacatttc tctacatgaa aatgtttatg ctataggaaa agaaaagtgt acccagttaa 1380
ggagtggtaa aaatgagtaa tgtgacaata tatgatgtag cacgcgaagc aaatgtaagt 1440
atggcaaccg tttcccgggt cgtcaacggg aatccgaatg tcaagccgac gacgagaaag 1500
aaggtgcttg aagcgatcga gcgtcttggc tatcgtccaa acgccgtggc aagagggctg 1560
gcaagcaaaa agacgacgac tgtcggcgtg atcattcccg atatttccag tatcttttat 1620
tcagagctgg cgaggggaat cgaagatatc gcaacgatgt acaagtacaa tattattttg 1680
agcaattccg accagaatat ggacaaagaa cttcatcttt tgaatacgat gctaggaaag 1740
caagttgacg gtatcgtctt tatgagcgga aatgtgactg aagagcatgt ggaggaattt 1800
aagcgatcgc cagttccgat cgtgcttgcg gcatctgttg aagaaaaagg ggaaacgccg 1860
tcggttgcga tcgattatga acaggcgatt tatgatgcgg caaccatgct gattgagaaa 1920
ggccataagc gccttgcgtt cgtctcagga cctatggctg aaccggttaa tcaagcgaaa 1980
aaactgcaag gctttaaaag agcgcttggg gataaggggc tgcaatttaa ggaagagtat 2040
gttgtagaag gcgattatac gtacgattca ggaatggaag cgctggaggc tttaatgaag 2100
ctggatgaaa aaccgacagc cgtcctgtca gcgacagacg aaatggcgct cggcgttatt 2160
cacgcagcac aggataaagg actggctgtt ccggatgacc ttgaagtgat cggttttgac 2220
aatacaaggc tttcattaat ggttcggccg cagctgtcga ctgtcgtcca gcctacgtat 2280
gatatcggtg ccgtggcgat gaggcttctg acaaagctga tgaacaaaga ggaagtcgaa 2340
gagcatattg tccagctgcc gcatcgcatt gaactcagac aatcaacaaa atgatcatca 2400
ttaaataaac gagaaagaaa gcaagtgttc acagcttttt tcgtgaattg cttgctttct 2460
tttccttgag ctggagagat tatgaaaaaa tgaaacgatt tgattatctg acaccggtcg 2520
gttttattct gggtattttc attttagtgc tcggcgttgt ctctggagcg gggctttccg 2580
gtttttattc gtttatcgat ttgacgtctt tttttattgt gacgggtgga ttgtgtgcag 2640
ctgtattcat cagcttttcc ccgaaagatt taaaaagagc gccggctgtg ctgaagcagg 2700
tctttatttc ggaggaagat gatgtgcgcg aattggtcaa aacctttgtc agcctgtctg 2760
aacaggcgcg caaacaagga attttattat tggacgccaa tgtcaatgaa atgaaagacc 2820
cgtttttgaa aaaaggcctg ctccttgcca tcgacggatg ggatgaggag acgatccgca 2880
atgtgatgaa ctcggaaatt gccgcgatgg aagaacgaca cagaaagggg agaaggatct 2940
ttgaaaaagc aggagaattt gcgcctgcat ggggaatgat cggaacgctt gtcggtctcg 3000
tcatgatgct caaaaacctg aacaagccgg aaacgctcgg tccgaatatg gcaatcgccc 3060
ttttgacgac gctttacgga tcacttttag ccaacatgct gtttataccg atcgccgcga 3120
agcttgaaga aaagacggag aatgaaatct ttaagaagca agtcatgatc gaaggcatca 3180
tcggcatcca gtcgggaaga aatccgcgaa atcttgaaag tcagcttgtc gttttcagtt 3240
caaaagaaga atggacaaaa aagcgggcgg accgcatgaa acaaaaggac aggtctcatg 3300
aagcttag 3308
<210> 14
<211> 924
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 14
atcttcaccc cgatctatgt cagtataacc tatatgacag ccggaggtgg agaggcggag 60
aacggcacag caagaagaca aagaagaaga gagactgttg cctggacctc cgaaacgcgc 120
tacaattcat ttacaacaca ggatggggtg agaatattgc cggaatcagt gaagcaggcc 180
tcctaaaata aaaatctata ttttaggagg taaaacatga attttcaaac aatcgagctt 240
gacacatggt atagaaaatc ttattttgac cattacatga aggaagcgaa atgttctttc 300
agcatcacgg caaacgtcaa tgtgacaaat ttgctcgccg tgctcaagaa aaagaagctc 360
aagctgtatc cggcttttat ttatatcgta tcaagggtca ttcattcgcg ccctgagttt 420
agaacaacgt ttgatgacaa aggacagctg ggttattggg aacaaatgca tccgtgctat 480
gcgatttttc atcaggacga ccaaacgttt tccgccctct ggacggaata ctcagacgat 540
ttttcgcagt tttatcatca atatcttctg gacgccgagc gctttggaga caaaaggggc 600
ctttgggcta agccggacat cccgcccaat acgttttcag tttcttctat tccatgggtg 660
cgcttttcaa acttcaattt aaaccttgat aacagcgaac acttgctgcc gattattaca 720
aacgggaaat acttttcaga aggcagggaa acatttttgc ccgtttcctt gcaagttcac 780
catgcagtgt gtgacggcta tcatgccggc gcttttataa acgagttgga acggcttgcc 840
gccgattgtg aggagtggct tgtgtgacag aggaaaggcc gatatgattc ggcctttttt 900
atatgtactt cttagcgggt ctct 924
<210> 15
<211> 98
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 15
aaaataacca aaaagcaagg actgctgaaa gggctgacat aagccttttg ccggcggtcc 60
ttttttaatt ctgatttttc aaacttagcc ccctcgag 98
<210> 16
<211> 537
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 16
ttgaataaat cagtcatacc ttctttaatt acggttggaa actttgtttc gggcatctct 60
tcaatactgc ttgcattcag agggtattta ttcttagcca ttatatttgt tctgatcggc 120
gctatcttgg acagccttga cggcatggcc gcgcgcagat taaatgccgt cagcccgttt 180
ggaaaagaat tagattcttt gtctgatatt atcactttcg gagtcgcccc ggccatcatc 240
acctattcaa tcgtttttta tgatgctccg atcttaggcc ttccttcgac attgttattc 300
cctgtttgcg gagcgcttcg gctggcgcga tttaatattc aatcagagaa ccaggattat 360
tttacaggcc ttccgatcac cgcagccgga acgattctgg tatgcttaaa ccttttctca 420
gaaatcctgg gcaaaaagcc gttcattttg atcatgctgt tcctgtcctt tctcatggtc 480
agcaaaatca aagtcatcag cctgaagggg aaaaaactat tgaagaaagt gagctag 537
<210> 17
<211> 178
<212> PRT
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 17
Leu Asn Lys Ser Val Ile Pro Ser Leu Ile Thr Val Gly Asn Phe Val
1 5 10 15
Ser Gly Ile Ser Ser Ile Leu Leu Ala Phe Arg Gly Tyr Leu Phe Leu
20 25 30
Ala Ile Ile Phe Val Leu Ile Gly Ala Ile Leu Asp Ser Leu Asp Gly
35 40 45
Met Ala Ala Arg Arg Leu Asn Ala Val Ser Pro Phe Gly Lys Glu Leu
50 55 60
Asp Ser Leu Ser Asp Ile Ile Thr Phe Gly Val Ala Pro Ala Ile Ile
65 70 75 80
Thr Tyr Ser Ile Val Phe Tyr Asp Ala Pro Ile Leu Gly Leu Pro Ser
85 90 95
Thr Leu Leu Phe Pro Val Cys Gly Ala Leu Arg Leu Ala Arg Phe Asn
100 105 110
Ile Gln Ser Glu Asn Gln Asp Tyr Phe Thr Gly Leu Pro Ile Thr Ala
115 120 125
Ala Gly Thr Ile Leu Val Cys Leu Asn Leu Phe Ser Glu Ile Leu Gly
130 135 140
Lys Lys Pro Phe Ile Leu Ile Met Leu Phe Leu Ser Phe Leu Met Val
145 150 155 160
Ser Lys Ile Lys Val Ile Ser Leu Lys Gly Lys Lys Leu Leu Lys Lys
165 170 175
Val Ser
<210> 18
<211> 136
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 18
cacacaagga cgcggtacgt tcacaatggt ctttgaccac tatgaagaag tgcctaagag 60
catcgctgat gagatcatca aaaaaaatca aggtgaataa ttgattttgc ctcttcatta 120
aagtataact actatt 136
<210> 19
<211> 227
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 19
aaatgtgcgc ggtccccctg tttcaggggg ttttttagtt tgaaaaaaac tttcgctact 60
aaaaaaattt cggccccgta tttttttaaa aaaacataat tgaatataaa taatacagtt 120
aaaactacta agaatctgta aatagaagta agctgggcca aaaaataaga aaaaaaaact 180
atagttaaac atttaacaaa tgtctgataa ttgtttataa tataaat 227
<210> 20
<211> 430
<212> PRT
<213> 嗜糖假单胞菌(Pseudomonas saccharophila)
<400> 20
Ala Asp Gln Ala Gly Lys Ser Pro Ala Gly Val Arg Tyr His Gly Gly
1 5 10 15
Asp Glu Ile Ile Leu Gln Gly Phe His Trp Asn Val Val Arg Glu Ala
20 25 30
Pro Tyr Asn Trp Tyr Asn Ile Leu Arg Gln Gln Ala Ser Thr Ile Ala
35 40 45
Ala Asp Gly Phe Ser Ala Ile Trp Met Pro Val Pro Trp Arg Asp Phe
50 55 60
Ser Ser Trp Thr Asp Gly Asp Lys Ser Gly Gly Gly Glu Gly Tyr Phe
65 70 75 80
Trp His Asp Phe Asn Lys Asn Gly Arg Tyr Gly Ser Asp Ala Gln Leu
85 90 95
Arg Gln Ala Ala Gly Ala Leu Gly Gly Ala Gly Val Lys Val Leu Tyr
100 105 110
Asp Val Val Pro Asn His Met Asn Arg Phe Tyr Pro Asp Lys Glu Ile
115 120 125
Asn Leu Pro Ala Gly Gln Arg Phe Trp Arg Asn Asp Cys Pro Asp Pro
130 135 140
Gly Asn Gly Pro Asn Asp Cys Asp Asp Gly Asp Arg Phe Leu Gly Gly
145 150 155 160
Glu Ala Asp Leu Asn Thr Gly His Pro Gln Ile Tyr Gly Met Phe Arg
165 170 175
Asp Glu Phe Thr Asn Leu Arg Ser Gly Tyr Gly Ala Gly Gly Phe Arg
180 185 190
Phe Asp Phe Val Arg Gly Tyr Ala Pro Glu Arg Val Asp Ser Trp Met
195 200 205
Ser Asp Ser Ala Asp Ser Ser Phe Cys Val Gly Glu Leu Trp Lys Glu
210 215 220
Pro Ser Glu Tyr Pro Pro Trp Asp Trp Arg Asn Thr Ala Ser Trp Gln
225 230 235 240
Gln Ile Ile Lys Asp Trp Ser Asp Arg Ala Lys Cys Pro Val Phe Asp
245 250 255
Phe Ala Leu Lys Glu Arg Met Gln Asn Gly Ser Val Ala Asp Trp Lys
260 265 270
His Gly Leu Asn Gly Asn Pro Asp Pro Arg Trp Arg Glu Val Ala Val
275 280 285
Thr Phe Val Asp Asn His Asp Thr Gly Tyr Ser Pro Gly Gln Asn Gly
290 295 300
Gly Gln His Lys Trp Pro Leu Gln Asp Gly Leu Ile Arg Gln Ala Tyr
305 310 315 320
Ala Tyr Ile Leu Thr Ser Pro Gly Thr Pro Val Val Tyr Trp Pro His
325 330 335
Met Tyr Asp Trp Gly Tyr Gly Asp Phe Ile Arg Gln Leu Ile Gln Val
340 345 350
Arg Arg Thr Ala Gly Val Arg Ala Asp Ser Ala Ile Ser Phe His Ser
355 360 365
Gly Tyr Ser Gly Leu Val Ala Thr Val Ser Gly Ser Gln Gln Thr Leu
370 375 380
Val Val Ala Leu Asn Ser Asp Leu Ala Asn Pro Gly Gln Val Ala Ser
385 390 395 400
Gly Ser Phe Ser Glu Ala Val Asn Ala Ser Asn Gly Gln Val Arg Val
405 410 415
Trp Arg Ser Gly Ser Gly Asp Gly Gly Gly Asn Asp Gly Gly
420 425 430
<210> 21
<211> 9175
<212> DNA
<213> 人工序列
<220>
<223> 表达盒
<400> 21
ctagcgtgtc ctcgcatagt tcttagattg tcgctacggc atatacgatc cgtgagacgt 60
catcggacag ctcttgcttg atatcttcaa aatgacgccg gctcatgtca tgtcaacttt 120
tgtcgtatct ggagcgatcc ttgacggatt cggcatttac gaccgtttta tcgaatttgc 180
cggtgccggg gctacagtcc cgattgtcag cttcggccac tctcttttgc acggcgcgat 240
gcaccaggct gagaaacatg gctttatcgg aatcggcatg gggatatttg aactgacatc 300
tgccggtata tctgccgcta tcttgttcgc ttttcttgtt gccgtgattt ttaaaccgaa 360
aggataaagg aaaatgccag caaaacgcaa ggtcattttg gtcacagacg gcgatatata 420
cgctgcaaaa gcaatcgaat atgcagcaag aaaaacgggt ggccgctgca tttcccaatc 480
ggcggggaat ccgagcgtta aaacaggacc ggagcttgta accatgatcc tgcaaacccc 540
tcatgatcct gtattcgtca tgtttgatga ttccggactt caaggtgaag gcccgggaga 600
gacagctatg aaatatgtag cgatgcatcc cgatatcgag gtgctcggag tcatcgccgt 660
cgcttcaaaa actcattatg cagagtggac gagagtcgat gtatcaatcg atgcagaagg 720
cgaactgaca gagtacggcg tcgataaaca cggggtcaaa gagttcgatg tcaaacgaat 780
gaatggtgat acagtctatt gccttgacca gctggatgtt ccgatcattg tcggaatcgg 840
tgatatcggt aagatgaaca gaaaagacga tgtggaaaaa ggttcgccga ttacaatgaa 900
agcggtcgag ctcattttag aaaggagcgg gtatcatgag tgctcaaaag caagagaaga 960
cgaacgtatt ccttgatcct tctaagaatg aagcgtattt caagaagcgg gtcggcatgg 1020
gagaaagctt tgaccttggc gtacggaagg tctttattct cggacatgaa gttcagcttt 1080
attatgtcaa cggattgtgc gacacacaat acatcattca cctgttaaga gaactggtgc 1140
atctgaatga taaagaaaaa gaatcgggcg aggtcgaaga catcgtcgaa aacaggcttt 1200
tgaaccagca ggtttcaaaa gcggaaacgc ttgatgaagc tgtcgaccaa gtgttgtcag 1260
gactggttgc catcatcgtc gaagatgcgg gctttgcttt tatcatcgat gtcagaagct 1320
acccgggcag aacgccggaa gaacctgata cagaaaaagt cgtacgcggt gcaagggacg 1380
gactcgtcga gaacatcatc gtcaacacag ccctgattag acgccggatc agagatgagc 1440
gcttgcgcta caaaatgctt catatcggtg aacgctctaa aacagacatc tgcctctgct 1500
atttggaaga cgttgcagat cccgatcttg ttgaagtatt aaaaaaagaa attgaagatg 1560
tgaagatcga cgggctgccg atgtcggata aatcggtaga ggaattcctg gtcggccaag 1620
gctacaatcc gtttccgctt gtcaggttta cggaaagggc agacgtagcc gcaagccata 1680
ttttagaggg gcatgtcatc gtgatcgtcg atacgtcgcc aagcgtcatc atcacaccga 1740
ccactttgtt tcaccatgtt cagcatgctg aggaatacag acagacgccg gctgttggga 1800
cgtttttaag gtgggtgcgg tttttcggta ttttggcctc cacctttttg ctgccgcttt 1860
ggctgctgtt tgtcattcat ccgtcgctct tgcctgataa tttatcgttt atcgggttga 1920
ataaagacac ccatattccg attatcatgc agattttcct ggcggatctc ggcgtcgaat 1980
ttttaagaat ggccgccatt catacgccga cggcgctttc gactgcaatg ggcctgatcg 2040
ccgctgtatt gatcggcgat atcgcgatca atgtcggctt gttttctccc gaagtcattt 2100
tatacgtttc cctctcggca atcggagcct acacgacacc aagctacgag ctgagcctgg 2160
cgaataaaat ggtgaagctg tttatgctga tattggtggc gctttttaaa gtggagggat 2220
ttgtcatcgg attaacgatc ttaactatag tgatgacttc gatcaggtca ttgcgaacgc 2280
cttacttatg gcctctcctc ccgttcaatg gaaaagcgtt ttggcatgtt ctcgtgcgca 2340
cgtccgttcc agggggaaaa gtcaggccga gcatcgttca tccgagaaac cgctccagac 2400
agccgtgaag ccggcattcg aagaggcttt tccccgggga aaagcctctt tttcaataat 2460
cgaattccgg tctttgagta ccgatgcctc tgtattcatt ggcagagatc gcgactgccc 2520
ggaggctgca gatgttgttc tgtcttctga tcggatagac gacatacagc atttcgcggc 2580
cgtacgggtc aatcgttgac gaatgaagga aaacctcagt tcctctccgc caaaatctcg 2640
tattcgccgg agctgtaata atctgccctt cataaggctc ataaattctc tgttcataat 2700
gcgcagccgg ctgataaggg gcgtatacat cttcaggtgc atagccggga gcgggggtgt 2760
agggatagcg atttggatac atatgataac ctctttccca cttcgttttt tggttttcat 2820
ctttaagatt atattcaggt aaatgcctat ttgtatgggc gaaaatctca gcttttcggc 2880
tcttttttta ttgaatggac gttgtgtatg cctatttcta tcaagcgctg ttttctgtta 2940
ttctataatc aatagaatgg attagttgtt tagggaatca tttcctttat aaatcaagaa 3000
aatttggaca aatggtggtt tagtttttaa aacgaaatgt tataatacaa cataagaatc 3060
gcactatcat gaagccggaa gatgcatcgg gcagcaaccg gagcgcccct tgcacctttg 3120
tcgatagaga aagagggaat gacaattgtt tttacacggt actagcagac aaaatgaaag 3180
agggcacctc gaaatcggcg gtgtcgatgt tctatcattg gcagaaagat acggaacacc 3240
tctttatgta tacgatgtcg cgctgattag agagcgcgcc cgaaaattcc agaaggcatt 3300
caaggaagcc ggtttaaaag cgcaggtagc gtatgcaagc aaggcgtttt catcggttgc 3360
catgattcag cttgccgaac aagaggggct gtctctggat gtggtatcgg gaggagagct 3420
tttcactgcg atcaaagcag ggttcccagc tgagcggatt cattttcacg gaaacaataa 3480
gagccctgaa gaactagcca tggcgctgga gcatcaaatc ggctgcatcg tgctcgataa 3540
ctttcacgag atcgccatta cagaagatct ttgcaagcga tcaggacaaa ctgtagacgt 3600
tttgctcaga atcactccgg gagttgaagc gcacacgcac gattatatta cgacggggca 3660
ggaagattcc aaattcggtt ttgatctgca taatggacag gtcgaacaag ccatcgaaca 3720
agtcctccgc tcgtctgcgt ttaagctcct cggcgtgcac tgccacatcg gttcgcaaat 3780
ttttgatacg gcaggatttg tccttgcagc agacaagatt ttcgagaagc ttgcggaatg 3840
gcgggagact tactctttca ttccggaagt gctcaatctt ggcgggggct tcggcatccg 3900
ctatacaaaa gacgacgagc cgcttgcagc tgatgtttat gttgaaaaaa tcatcgaggc 3960
ggtcaaagca aatgccgagc atttcggctt tgacatccct gagatttgga tcgaaccagg 4020
ccggtctctc gtcggtgatg cggggactac gctgtacacg atcggttctc aaaaagaggt 4080
gccgggcatt cgcaaatatg tagccatcga cggcggcatg agcgataata tcaggccggc 4140
gctttatgag gcaaaatatg aagcagccgt cgccaacagg atgaacgatg cttgtcatga 4200
taccgcatca atcgcaggaa aatgctgcga aagcggagat atgctgattt gggatttgga 4260
aatccccgaa gttcgcgacg gagatgtgct cgccgttttc tgcaccggtg cgtacggcta 4320
cagcatggcc aacaactaca accgcattcc gcgcccggcc gtcgtctttg tcgaggacgg 4380
ggaagcgcag ctcgtcattc agagagagac gtatgaggat atcgtcaagc tggatctgcc 4440
gctgaaatcg aaagtcaaac aataaaaaaa tggagattcc ctaagagggg ggtctccatt 4500
tttaattcag agctcgtcgc tgataaacag ctgacatcaa tatcctattt tttcaaaaaa 4560
tattttaaaa agttgttgac ttaaaagaag ctaaatgtta tagtaataaa acagaatagt 4620
cttttaagta agtctactct gaattttttt aaaaggagag ggtaaagaat gaaacaacaa 4680
aaacggcttt acgcccgatt gctgacgctg ttatttgcgc tcatcttctt gctgcctcat 4740
tctgcagctt cagcagctga tcaagcagga aaaagcccgg caggcgtcag atatcatggc 4800
ggtgatgaaa tcatccttca gggctttcat tggaacgtcg tcagagaagc gccgtataac 4860
tggtataaca tcctgagaca acaagcgagc acaattgccg ctgatggctt ttccgcaatc 4920
tggatgccgg ttccgtggag agattttagc agctggacgg atggagataa aagcggaggc 4980
ggcgaaggat atttttggca tgactttaac aaaaacggcc gctatggaag cgatgctcaa 5040
ctgagacaag cagcaggagc acttggagga gcaggagtca aagtcctgta cgatgtcgtc 5100
ccgaaccata tgaaccgctt ttatccggac aaagaaatca atctgccggc aggccaaaga 5160
ttttggagaa acgattgccc ggacccggga aatggaccga atgattgcga tgatggcgat 5220
agatttctgg gcggcgaagc ggatctgaat acaggccatc cgcaaatcta tggcatgttt 5280
cgggacgaat ttacgaatct gagaagcgga tatggagcgg gcggatttcg ctttgatttt 5340
gtcagaggct atgccccgga aagagttgat agctggatga gcgattcagc ggatagcagc 5400
ttttgcgtcg gcgaactttg gaaagaaccg agcgaatatc cgccgtggga ttggagaaat 5460
acagcgagct ggcagcagat catcaaagat tggagcgata gagcaaaatg cccggtcttt 5520
gactttgccc tgaaagaacg catgcaaaat ggaagcgtcg ccgattggaa acatggcctg 5580
aacggaaatc cggacccgag atggagagaa gtcgccgtca cgtttgtcga taaccatgac 5640
acaggatata gcccgggaca aaatggagga caacataaat ggccgcttca agatggcctt 5700
atcagacagg cgtatgccta tatccttaca tcaccgggaa caccggttgt ttattggccg 5760
catatgtatg attggggcta tggcgatttc atccgccaac tgatccaggt tagaagaaca 5820
gcaggagtca gagcggatag cgccattagc tttcatagcg gctatagcgg acttgtcgct 5880
acagttagcg gcagccaaca aacactggtc gtcgccctga atagcgatct ggcaaatccg 5940
ggacaagttg ctagcggcag ctttagcgaa gcagtcaatg ccagcaatgg ccaagtcaga 6000
gtctggagaa gcggaagcgg agatggagga ggaaatgacg gcggctaaaa gagcagagag 6060
gacggatttc ctgaaggaaa tccgtttttt tattttcaag cacgaaaaac acttcccggt 6120
gatcgggagg tgttttttgt taaaaagatc atgacatgca tagaacagcg accgggctaa 6180
ttgtatataa tattgtgaat ttaacaaaaa atttacaaag gagatgataa aggcaatgac 6240
cagggtgaaa aggatgagat ttgctgattt gttggattta gaggcggagt agatgaaacc 6300
ggccaaagta tccctactcc accgattgct ccagtgcctg aagcaatgtg ttgattgtaa 6360
cacagtaaat cgttttacag caataaacat ttttgtgaat attttattga tttcggctgt 6420
gatctcattc ccatattctg ctgcggccca tggcgcaaca cagtccggcg atcaatattc 6480
aagctttgaa gaattggagc ggaatgaaga tccagcttct taccgaatta cggagaagaa 6540
cgcaagagtg ccgatgctca tcatggccat ccatggaggc ggcatcgaac ccggaacgag 6600
cgaaatcgcc aatgaagtgt ccaaaaacta ttccctgtac ttgtttgaag ggctgaaatc 6660
atcaggcaat acggaccttc acattacaag cacgcgtttt gacgagccag cggcgctcgc 6720
aattactgca agccaccagt atgtcatgtc gctccacggc tattacagtg aagaccgcga 6780
tattaaagta ggcggcacag accgcgctaa aatcagaata ttggttgatg agctgaaccg 6840
ctcggggttt gccgctgaaa tgctggggac agatgacaag tatgccggaa cccatccgaa 6900
taacatcgcc aacaagtcgc tttccgggct gagcattcag cttgaaatga gcacgggttt 6960
ccgcaaatct ttattcgacc ggtttacact aaaagacagg gcggcgacgc aaaacgaaac 7020
gttttaccga tttacaaagc tgctgacaga ttttattcat gaaaactatg aagaagacgg 7080
aggggatttc ccctctgcaa aaataaaaca cccccttcaa gtgaaaaagg aggtgtttcg 7140
gcggttgtgt taaccgttgg actctgaggt gccgccgccg gtgaatacgg aaacgatggc 7200
gttccacaga gacacaaaga agtcgatcag tttttgaaga aagttttgtc cttcttcaga 7260
atccaagaat ttcgtgattt tatcctttgc tttgtcaagc tggtctccaa cctggttcca 7320
gtcgatatta atatttttca tgttattaaa taaagatata agagagtttt tctgatcttc 7380
tgtgagtgtc acgccaagtt cggaagcagc cgaatcaatc gttttctcca attcctcttt 7440
tgactcggga actccgtttt tcgagatttc ttccttgact ttggccatca gcgctgacgc 7500
gttttcactg ccgattttct cgccaagctc tgaagtggtg acaagctctt cattcgcgac 7560
ctttttcaca tcttcggaaa ttttttcgcc cgaagtcgtt tcatacgctt tcatcaatcc 7620
ggttaaagcg gctgtgcctg acacttcaaa cggagcggtg acatagactt tggcgtcttt 7680
tacaccggcc gtcatcagcg cgttcaaata catctcatct gtaattctgc tgatattgtg 7740
tgtctgaact tccaaaccgg tgcctttttt cgctacggta attgaagaag aagaaatcgc 7800
tcttgttccg atttgtgctt tcggtatata atcccctaaa tatttatgct cctcatcatt 7860
tgtcacctcg atgatggtcg cattttcagg cgcattcatt tcttttaata ctttttgtct 7920
gtcctggctt gacaagtctt tccccagcgt gacgatgaca tcacccactg cggcgtcagc 7980
gaagctgacc tgcgggaaaa tgagcagaca caatgctgta aagattccta gtatcgattt 8040
tttcaagctc aatgccctcc ttaaaaatgc aggcttcagg cagaattgct gtacttttaa 8100
agaagcctgc cggaacggaa ataatgcgtt ccgaaatata gacggatgaa agatgagtga 8160
ggtttcaaag aaaaaaagag agaattttct cttcaagtca aatgccctcc cggcatcgta 8220
tctcgccgct cttttatcat tcatgatttt cacaggcgat tcaacctttt tttaaaattt 8280
tttacaaaaa cgatacaaga gcggcgttta tttcggtcga ttggctctct gcttcttcaa 8340
tatgatataa tgacccttgt gaaatgaaag gagagaatca agatggctaa aaaaggatac 8400
atacaactga caaacggcaa aaaaatcgag tttgaactat atccggatgc ggcgccggga 8460
actgtcgcca actttgaaaa acttgcaaac gaagggttct atgacgggct gaagttccac 8520
cgcgtcatcc cgggcttcgt cagccaggga ggctgcccgc acggcaccgg aacaggcgga 8580
cctggatata cgattaaatg cgagacagaa gggaatccgc acaaacacga agccggttct 8640
ctctcaatgg ctcacgcagg aaaagatacc ggaggcagcc aattttttat cgtccatgag 8700
cctcagccgc acttgaacgg cgttcacacc gttttcggaa aggtcacatc aggccttgat 8760
gccgtcactt caatggagca gggacaaggc atggaaaaag tcgaagtatt tgatgcataa 8820
tcagagagcg caaaaaacag cccgcttagc cgggctgttt ttttgtctgt aacggtgttt 8880
attttccagg tgcaacagga cttgaggccg attcttcgtc cacatcctga taggaaataa 8940
cgatgctaat aaataaaata attgtgaaaa aatgaccctt tatgtaaaat atattcaagt 9000
gaagagctag atagagaacg caatctgtaa aaaaggaagg ggcgtaaggg gtgagcgtaa 9060
aaatcccatc gacggcagtc ggcgtaaaaa ttaatgactg gtataacgcg atacggttga 9120
acattcttag gctggtcgaa tcatttagac acgggcatcg tcctctcgaa aggtg 9175
<210> 22
<211> 84
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 22
Phe Tyr Thr Phe Thr Tyr Phe Tyr Thr Phe Tyr Thr Phe Tyr Thr Phe
1 5 10 15
Thr Tyr Phe Tyr Thr Phe Tyr Thr Phe Tyr Thr Phe Thr Tyr Phe Tyr
20 25 30
Thr Phe Tyr Thr Phe Tyr Thr Phe Thr Tyr Phe Tyr Thr Phe Tyr Thr
35 40 45
Phe Tyr Thr Phe Thr Tyr Phe Tyr Thr Phe Tyr Thr Phe Tyr Thr Phe
50 55 60
Thr Tyr Phe Tyr Thr Phe Tyr Thr Phe Tyr Thr Phe Thr Tyr Phe Tyr
65 70 75 80
Thr Phe Tyr Thr
<210> 23
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 表达盒
<400> 23
aaaaaaaaaa aaattttttt ttttttgggg gggggggggc cccccccccc cc 52
<210> 24
<211> 91
<212> DNA
<213> 人工序列
<220>
<223> 合成的启动子
<400> 24
gctgataaac agctgacatc aactaaaagt ttcattaaat actttgaaaa aagttgttga 60
cttaaaagaa gctaaatgtt atagtaattg t 91
<210> 25
<211> 1127
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 25
catccgacca taatggaacg gattcaaaat attgaacagt cttcaactga atgaagaaaa 60
agctagtgct aaaaacacta gctttttcta tatgccattt gttagaatat gttattgagc 120
ggcagcttcg acattgatca gaccttttcc atagtagaag gagcttccca aataagtcgc 180
cgtactggag agacggttgc ggacttgtga agctgaaagg ttcggatgtt ttgacaagat 240
caaagctgct gctcccgcta catgaggaga agccattgac gttccgttca atgttgcata 300
agtgctggtt gggtaagtgc tgtatacgcc tgcgccagga gccatgactt caagctctgc 360
tccgacgctg gaaaatgaag ctctgttgct gttagagtct accgcaccaa cagcgatgac 420
agaatcgtat ttcgcaggat agccaattgt attcgtgttt cctgaagatc cgctgttccc 480
tgctgcagct acaacgacaa cccctcttgc atatgcattg tccctatttt tttggaggac 540
caatttaaaa ttttttggtt attaataact gttttagaaa aatgttcagt tcgaaagtat 600
gaatagaccg cttcagcctg gcagggaaag aggtcccgag ggccgcgaat gacaggagat 660
tgctccatct gattcatttt atgaaaatac tattcattta ttttatgaga tcattttttg 720
ccgaaggagg ttgcggcctt gtcgatcatc tattaaaaca tgcaatatat cgcatacaga 780
aacgggtgaa agatatgaaa tcagctcatg tgaaaggtgt attgatggtg cttgcagggg 840
cttcattgtg gggattatcg ggaagcgctg cacagtacat atttgaaagg ggagcggttg 900
aagccggctc gcttgtctct gtcaggcttc tggcatcggg agtcattctc ttgttatatg 960
tttcaatgaa aaacggtttt caacatgtgt gtaagatatg gaagaaaaaa acagatattt 1020
gttcgatttt agtattttcc atttttggaa tgcttgctgt tcaatatacg ttttttgctt 1080
caatcgaaaa gggtaatgcc gctgctgctg caattcttca atatttg 1127
<210> 26
<211> 2472
<212> DNA
<213> 芽孢杆菌属物种(Bacillus sp.)
<400> 26
gcagctaaac ccgctgtaag caacgcttat ttagatgctt caaaccaggt gctggttaaa 60
cttagccagc cgttaactct tggggaaggc gcaagcggct ttacggttca tgacgacaca 120
gcaaataagg atattccagt gacatctgtg aaggatgcaa gtcttggtca agatgtaacc 180
gctgttttgg caggtacctt ccaacatatt tttggaggtt ccgattgggc acctgataat 240
cacagtactt tattaaaaaa ggtgactaac aatctctatc aattctcagg agatcttcct 300
gaaggaaact accaatataa agtggcttta aatgatagct ggaataatcc gagttaccca 360
tctgacaaca ttaatttaac agtccctgcc ggcggtgcac acgtcacttt ttcgtatatt 420
ccgtccactc atgcagtcta tgacacaatt aataatccta atgcggattt acaagtagaa 480
agcggggtta aaacggatct cgtgacggtt actctagggg aagatccaga tgtgagccat 540
actctgtcca ttcaaacaga tggctatcag gcaaagcagg tgatacctcg taacgtgctt 600
aattcatcac agtactacta ttcaggagat gatcttggga atacctatac acagaaagca 660
acaaccttta aagtctgggc accaacttct actcaagtaa atgttcttct ttatgacagt 720
gcaacgggtt ctgtaacaaa aatcgtacct atgacggcat cgggccatgg tgtgtgggaa 780
gcaacggtta atcaaaacct tgaaaattgg tattacatgt atgaggtaac aggccaaggc 840
tctacccgaa cggctgttga tccttatgca actgcgattg caccaaatgg aacgagaggc 900
atgattgtgg acctggctaa aacagatcct gctggctgga acagtgataa acatattacg 960
ccaaagaata tagaagatga ggtcatctat gaaatggatg tccgtgactt ttccattgac 1020
cctaattcgg gtatgaaaaa taaagggaag tatttggctc ttacagaaaa aggaacaaag 1080
ggccctgaca acgtaaagac ggggatagat tccttaaaac aacttgggat tactcatgtt 1140
cagcttatgc ctgttttcgc atctaacagt gtcgatgaaa ctgatccaac ccaagataat 1200
tggggttatg accctcgcaa ctatgatgtt cctgaagggc agtatgctac aaatgcgaat 1260
ggtaatgctc gtataaaaga gtttaaggaa atggttcttt cactccatcg tgaacacatt 1320
ggggttaaca tggatgttgt ctataatcat acctttgcca cgcaaatctc tgacttcgat 1380
aaaattgtac cagaatatta ttaccgtacg gatgatgcag gtaattatac caacggatca 1440
ggtactggaa atgaaattgc agccgaaagg ccaatggttc aaaaatttat tattgattcc 1500
cttaagtatt gggtcaatga gtatcatatt gacggcttcc gttttgactt aatggcgctg 1560
cttggaaaag acacgatgtc caaagctgcc tcggagcttc atgctattaa tccaggaatt 1620
gcactttacg gtgagccatg gacgggtgga acctctgcac tgccagatga tcagcttctg 1680
acaaaaggag ctcaaaaagg catgggagta gcggtgttta atgacaattt acgaaacgcg 1740
ttggacggca atgtctttga ttcttccgct caaggttttg cgacaggtgc aacaggctta 1800
actgatgcaa ttaagaatgg cgttgagggg agtattaatg actttacctc ttcaccaggt 1860
gagacaatta actatgtcac aagtcatgat aactacaccc tttgggacaa aatagcccta 1920
agcaatccta atgattccga agcggatcgg attaaaatgg atgaactcgc acaagcagtt 1980
gttatgacct cacaaggcgt tccattcatg caaggcgggg aagaaatgct tcgtacaaaa 2040
ggcggcaacg acaatagtta taatgcaggc gatgcggtca atgagtttga ttggagcagg 2100
aaagctcaat atccagatgt tttcaactat tatagcgggc taatccacct tcgtcttgat 2160
cacccagcct tccgcatgac gacagctaat gaaatcaata gccacctcca attcctaaat 2220
agtccagaga acacagtggc ctatgaatta actgatcatg ttaataaaga caaatgggga 2280
aatatcattg ttgtttataa cccaaataaa actgtagcaa ccatcaattt gccgagcggg 2340
aaatgggcaa tcaatgctac gagcggtaag gtaggagaat ccacccttgg tcaagcagag 2400
ggaagtgtcc aagtaccagg tatatctatg atgatccttc atcaagaggt aagcccagac 2460
cacggtaaaa ag 2472
<210> 27
<211> 5913
<212> DNA
<213> 人工序列
<220>
<223> 表达盒
<400> 27
aaatataagg aggccaatta aatgatgaca gcaaaaaatt tgcaagatcg aatcaaattg 60
aataacggga cagctatgcc ttggtttgga cttggcgtat ttaaagtaga agaagggccc 120
gaactggtac aagccgtaaa aacggcgatt aaacacggct accgcagtat tgataccgca 180
gccatctacg gtaatgaaga gggggttggg caaggaatcc gcgaggggtt gaaagaagcc 240
ggcatttcaa gagaagacct gtttgttaca tcaaaggtct ggaatgacga tttaggctat 300
gacgaaacga ttgcagccta tgaggcgagt ctcgaaaagc tcggacttga ctaccttgat 360
ttatacctga tccactggcc tgttgaagga cgctacaaag cggcgtggaa agcgcttgaa 420
acactttatg aacaaggacg cgtaaaagca atcggagtga gcaattttca gattcaccat 480
ctggaagact tgctgaaaga tgccgccgtc aaaccggcga tcaaccaggt tgagtatcat 540
ccgcggctga cgcagaaaga gctgcaagcg ttttgccgtg cgcacggcat ccagctgcaa 600
gcatggtcgc cgctgatgca aggccaattg ctcagccatc cactgctgaa agatatcgcg 660
gacaagtacg gcaagacacc ggcccaagtc attttgcgct gggatttgca aaacggggtc 720
gttacgattc cgaagtcgac taaagcggag cggattgccc aaaacgcgga catatttgat 780
tttgaactga ccaccgagga aatgaagcaa attgacgcgc tgaatgaaaa cacccgtgtc 840
ggccctgatc ccgataactt tgacttttaa caaaacggcc ccgttcgaca ttcgaacggg 900
gctttaattg aattgtgcgg ttacaccgcc ggactccatc atcatcagtt cttttttcat 960
atccaatccg ccccggtatc ccgtgagctg cccgctttta ccgataaccc gatggcaagg 1020
caccaccatt aacagcggat ttgcgccgat cgccgcgcct actgcccgca cagcggcctg 1080
cttttcaata tgctcggcga tatcggaata ggagcaagtg ctgccgtaag ggatttcgga 1140
gagcgccttc cacactgcca gctgaaaagg cgtgccggca aggtcgacag gaaagctgaa 1200
atgagttcgc ttgccgttca aatacgcctg cagctgctcg gcgtattctg ccaatccttt 1260
gtcatcccga atgaaaactg gctgtgtaaa tcttttttca gcccaagcgg ccaaatcctc 1320
gaagccttga ttccatcccc ctgtaaaaca gagcccgcgg gcagtcgccc caatgtgaat 1380
ctgccaacct cggcaaataa gcgtacgcca gtatacgatt tgatcgtcca tatgtttacc 1440
tccgtttcat ttgccggtac gacgtcggcg attgcccagt cttcttttta aacaaagagg 1500
caaaatattc cgcattcgca atgcctacca ttgaagcgat ttctgcgatc gatcgttctg 1560
aatgagcaag caaatcgacc gctttctcaa tccttttctg caggatgtat tctgccggcg 1620
agacgccttt gattcgttta aatgtccgct gcaggtgaaa agggctgata tggcacctgt 1680
cagccaaagc ttgcagagac agcggatcgc gataagattc ctcgatgatt tccaccacac 1740
gctgtgccag ctcttcatcc ggcagcagcg ccccggccgg attgcagcgt ttgcaggggc 1800
ggtacccttc tgataaagca tcttttgcat tgaaaaagat ctgcacattg tcgatttgcg 1860
gaactctcga tttgcaggaa gggcggcaaa atatgccggt cgttttgacc gcgtaataaa 1920
aaactccgtc ataggcggaa tcgttttccg taatcgcccg ccacatttca ggcgtcaatc 1980
gtgatttgct gttcatatct tcaccccgat ctatgtcagt ataacctata tgacagccgg 2040
aggtggagag gcggagaacg gcacagcaag aagacaaaga agaagagaga ctgttgcctg 2100
gacctccgaa acgcgctaca attcatttac aacacaggat ggggtgagaa tattgccgga 2160
atcagtgaag caggcctcct aaaataaaaa tctatatttt aggaggtaaa acatgaattt 2220
tcaaacaatc gagcttgaca catggtatag aaaatcttat tttgaccatt acatgaagga 2280
agcgaaatgt tctttcagca tcacggcaaa cgtcaatgtg acaaatttgc tcgccgtgct 2340
caagaaaaag aagctcaagc tgtatccggc ttttatttat atcgtatcaa gggtcattca 2400
ttcgcgccct gagtttagaa caacgtttga tgacaaagga cagctgggtt attgggaaca 2460
aatgcatccg tgctatgcga tttttcatca ggacgaccaa acgttttccg ccctctggac 2520
ggaatactca gacgattttt cgcagtttta tcatcaatat cttctggacg ccgagcgctt 2580
tggagacaaa aggggccttt gggctaagcc ggacatcccg cccaatacgt tttcagtttc 2640
ttctattcca tgggtgcgct tttcaaactt caatttaaac cttgataaca gcgaacactt 2700
gctgccgatt attacaaacg ggaaatactt ttcagaaggc agggaaacat ttttgcccgt 2760
ttccttgcaa gttcaccatg cagtgtgtga cggctatcat gccggcgctt ttataaacga 2820
gttggaacgg cttgccgccg attgtgagga gtggcttgtg tgacagagga aaggccgata 2880
tgattcggcc ttttttatat gtacttctta gcgggtctct aaaataacca aaaagcaagg 2940
actgctgaaa gggctgacat aagccttttg ccggcggtcc ttttttaatt ctgatttttc 3000
aaacttagcc ccctcgagaa atgtgcgcgg tccccctgtt tcagggggtt ttttagtttg 3060
aaaaaaactt tcgctactaa aaaaatttcg gccccgtatt tttttaaaaa aacataattg 3120
aatataaata atacagttaa aactactaag aatctgtaaa tagaagtaag ctgggccaaa 3180
aaataagaaa aaaaaactat agttaaacat ttaacaaatg tctgataatt gtttataata 3240
taaatacaga atagtctttt aagtaagtct actctgaatt tttttaaaag gagagggtaa 3300
agattgaata aatcagtcat accttcttta attacggttg gaaactttgt ttcgggcatc 3360
tcttcaatac tgcttgcatt cagagggtat ttattcttag ccattatatt tgttctgatc 3420
ggcgctatct tggacagcct tgacggcatg gccgcgcgca gattaaatgc cgtcagcccg 3480
tttggaaaag aattagattc tttgtctgat attatcactt tcggagtcgc cccggccatc 3540
atcacctatt caatcgtttt ttatgatgct ccgatcttag gccttccttc gacattgtta 3600
ttccctgttt gcggagcgct tcggctggcg cgatttaata ttcaatcaga gaaccaggat 3660
tattttacag gccttccgat caccgcagcc ggaacgattc tggtatgctt aaaccttttc 3720
tcagaaatcc tgggcaaaaa gccgttcatt ttgatcatgc tgttcctgtc ctttctcatg 3780
gtcagcaaaa tcaaagtcat cagcctgaag gggaaaaaac tattgaagaa agtgagctag 3840
aagagcagag aggacggatt tcctgaagga aatccgtttt tttattttta acatctctca 3900
ctgctgtgtg attttactca cggcatttgg aacgccggct ctcaacaaac tttctgtagt 3960
gaaaatcatg aaccaaacgg atcgtcggcc tgattaacag ctgaaagctg ccgatcacaa 4020
acatccatag tcccgccggc ttcagttcct cggagaaaaa gcagaagctc ccgacaagga 4080
ataaaaggcc gatgagaaaa tcgtttaatg tatgtagaac tttgtatctt tttttgaaaa 4140
agagttcata tcgattgtta ttgttttgcg gcattgcttg atcactccaa tccttttatt 4200
taccctgccg gaagccggag tgaaacgccg gtatacatag gatttatgaa ttaggaaaac 4260
atatggggaa ataaaccatc caggagtgaa aaatatgcgg ttattcatat gtgcatcgtg 4320
cctgttcggc ttgattgttc cgtcatttga aacgaaagcg ctgacgtttg aagaattgcc 4380
ggttaaacaa gcttcaaaac aatgggaagt tcaaatcggt aaagccgaag ccggaaacgg 4440
aatggcgaaa ccggaaaaag gagcgtttca tacttatgct gtcgaaatca aaaacattgg 4500
acacgatgtg gcttcggcgg aaatttttgt ctatcggaac gagcctaatt cttcaacgaa 4560
attttcgctt tggaacattc ctcacgaaaa tccggtttct ttagccaaaa gcttaaatca 4620
cggaagctct gtcaagcacc gcaatctgct tatggcagag aatgcgaccg aattggaagt 4680
ggacatgatt tggacggaaa aaggaagcga aggcagactt ttaaaggaaa cgttcatttt 4740
caagggagat gaatcatgaa gaaaaaatgg ccgttcatcg tcaacggtct ttttttaatg 4800
acttaggcag ccgatcgttc ggccatacga tatcgaagcg acctcgaacc agcagagctc 4860
gtcacaaaac atttgcattt aaagaaaaat acaggatgtt ttcaccaata tttttctcaa 4920
tgatgataca ctattgacaa gctgctactt tgggagggtg tttccataga tgccgatgaa 4980
gcaaaaacac caaatgtgtc atgagagctc tctctaatcg atataaaagt agggtgaacc 5040
ggggttgtca atctgtaaaa gatctttttt tatcccgtga tacgcttttg gaattctgaa 5100
tcttcaagaa agtccccagc cttttgctga tcaatcgaga acaaaggatg atacatatga 5160
aaagaataga taaaatctac catcagctgc tggataattt tcgcgaaaag aatatcaatc 5220
agcttttaaa gatacaaggg aattcggcta aagaaatcgc cgggcagctg caaatggagc 5280
gttccaatgt cagctttgaa ttaaacaatc tcgttcgggc caaaaaggtg atcaagatta 5340
aaacgttccc cgtccgctac atcccggtgg aaattgttga aaacgtcttg aacatcaaat 5400
ggaattcaga gttgatggag gttgaagaac tgaggcggct ggctgacggc caaaaaaagc 5460
cggcgcgcaa tatatccgcc gatcccctcg agctcatgat cggggctaaa gggagcttga 5520
aaaaggcaat ttctcaggcg aaagcggcag tcttttatcc tccgcacggc ttgcatatgc 5580
tgctgctcgg gccgacgggt tcggggaaat cgctgtttgc gaatcggatc taccagttcg 5640
ccgtttattc tgacatattg aagcccgatt ccccgttcat cacattcaac tgtgcagatt 5700
actataacaa ccctcaatta ttgctctctc aattgttcgg acataaaaaa gggtctttta 5760
caggtgcggg tgaagacaaa gcaggattag tcgagcaggc ggacgggggc attctgttta 5820
tggatgaaat ccatcgcctc ccgccggagg ggcaggaaat gctgttttat ttcatagaca 5880
gcggcacata caacaggctt ggtgaaacag agc 5913

Claims (21)

1.一种重组芽孢杆菌属物种(Bacillus sp.)细胞,其包含引入的与SEQ ID NO:16的核酸序列具有至少85%序列同一性的多核苷酸。
2.如权利要求1所述的重组细胞,其中所述引入的多核苷酸编码与SEQ ID NO:17具有至少85%序列同一性的磷脂酰丝氨酸合酶(PssA)蛋白。
3.如权利要求1所述的重组细胞,其产生目的蛋白(POI)。
4.如权利要求1所述的重组细胞,其中所述引入的多核苷酸是表达盒,所述表达盒包含可操作地连接到下游(3′)可读框(ORF)的上游(5′)启动子,所述ORF编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白;以及任选地包含可操作地连接到上游(5′)ORF的下游(3′)终止子序列。
5.如权利要求3所述的重组细胞,其中所述POI是酶。
6.一种重组芽孢杆菌属物种细胞,其衍生自产生目的蛋白(POI)的亲本芽孢杆菌属物种细胞,其中所述重组细胞包含引入的编码与SEQ ID NO:17具有至少85%序列同一性的磷脂酰丝氨酸合酶(PssA)蛋白的多核苷酸,并且当在相同条件下培养时,所述重组细胞相对于所述亲本细胞产生增加量的所述POI。
7.如权利要求6所述的重组细胞,其中所述引入的多核苷酸是表达盒,所述表达盒包含可操作地连接到下游(3′)可读框(ORF)的上游(5′)启动子,所述ORF编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白;以及任选地包含可操作地连接到上游(5′)ORF的下游(3′)终止子序列。
8.如权利要求6所述的重组细胞,其中所述POI是酶。
9.一种重组芽孢杆菌属物种细胞,其衍生自包含编码天然磷脂酰丝氨酸合酶(PssA)蛋白的野生型pssA基因的亲本芽孢杆菌属物种细胞,其中所述重组细胞包含引入的替代所述亲本细胞的野生型pssA基因启动子序列的异源启动子序列。
10.如权利要求9所述的重组细胞,其中相对于所述野生型pssA基因启动子,所述异源启动子使pssA基因表达增加至少1.2倍。
11.如权利要求9所述的重组细胞,其中所述亲本细胞包含编码目的蛋白(POI)的表达盒。
12.如权利要求11所述的重组细胞,当在相同条件下培养时,所述重组细胞相对于所述亲本细胞产生增加量的所述POI。
13.如权利要求11所述的重组细胞,其中所述POI是酶。
14.如权利要求5、8或13中任一项所述的重组细胞,其中所述酶选自由以下组成的组:乙酰酯酶、氨肽酶、淀粉酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂合酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲基酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶和己糖氧化酶。
15.一种表达盒,其包含可操作地连接到下游(3′)可读框(ORF)序列的上游(5′)启动子序列,该ORF序列编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白;以及任选地包含可操作地连接到上游(5′)ORF的下游(3′)终止子序列。
16.一种重组芽孢杆菌属物种细胞,其包含如权利要求15所述的盒。
17.一种用于产生增加量的目的蛋白(POI)的方法,所述方法包括:
(a)获得或构建产生POI的亲本芽孢杆菌属细胞,并通过将编码与SEQ ID NO:17具有至少85%序列同一性的磷脂酰丝氨酸合酶(PssA)蛋白的多核苷酸引入其中来修饰所述细胞,以及
(b)在适合用于产生所述POI的条件下培养所述修饰的细胞,
其中当在相同条件下培养时,所述修饰的细胞相对于所述亲本细胞产生增加量的所述POI。
18.如权利要求17所述的方法,其中所述引入的多核苷酸是表达盒,所述表达盒包含可操作地连接到下游(3′)可读框(ORF)的上游(5′)启动子序列,所述ORF编码与SEQ ID NO:17具有至少85%序列同一性的PssA蛋白;以及任选地包含可操作地连接到上游(5′)ORF的下游(3′)终止子序列。
19.如权利要求18所述的方法,其中所述编码所述PssA蛋白的可读框(ORF)序列与SEQID NO:16的核酸序列具有至少85%序列同一性。
20.如权利要求17所述的方法,其中所述POI是酶。
21.如权利要求20所述的方法,其中所述POI是选自由以下组成的组的酶:乙酰酯酶、氨肽酶、淀粉酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、碳酸酐酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、凝乳酶、角质酶、脱氧核糖核酸酶、差向异构酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、α-葡聚糖酶、葡聚糖裂合酶、内切-β-葡聚糖酶、葡糖淀粉酶、葡萄糖氧化酶、α-葡糖苷酶、β-葡糖苷酶、葡糖醛酸酶、糖基水解酶、半纤维素酶、己糖氧化酶、水解酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、氧化还原酶、果胶酸裂合酶、果胶乙酰酯酶、果胶解聚酶、果胶甲基酯酶、果胶分解酶、过水解酶、多元醇氧化酶、过氧化物酶、酚氧化酶、植酸酶、聚半乳糖醛酸酶、蛋白酶、肽酶、鼠李糖-半乳糖醛酸酶、核糖核酸酶、转移酶、转运蛋白、转谷氨酰胺酶、木聚糖酶和己糖氧化酶。
CN202280048758.5A 2021-05-24 2022-05-23 用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法 Pending CN117769597A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163192261P 2021-05-24 2021-05-24
US63/192,261 2021-05-24
PCT/US2022/030521 WO2022251109A1 (en) 2021-05-24 2022-05-23 Compositions and methods for enhanced protein production in bacillus cells

Publications (1)

Publication Number Publication Date
CN117769597A true CN117769597A (zh) 2024-03-26

Family

ID=82595180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280048758.5A Pending CN117769597A (zh) 2021-05-24 2022-05-23 用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法

Country Status (4)

Country Link
US (1) US20240263185A1 (zh)
EP (1) EP4347812A1 (zh)
CN (1) CN117769597A (zh)
WO (1) WO2022251109A1 (zh)

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1249226C (zh) 1998-03-04 2006-04-05 金克克国际有限公司 支链淀粉酶的修饰形式
US6509185B1 (en) 2000-01-07 2003-01-21 Genencor International, Inc. Mutant aprE promotor
CA2418317A1 (en) 2000-08-11 2002-02-21 Genencor International, Inc. Bacillus transformation, transformants and mutant libraries
EP2339017A3 (en) 2002-03-29 2011-10-12 Genencor International, Inc. Enhanced protein expression in bacillus
EP1576094B1 (en) 2002-04-22 2011-09-28 Danisco US Inc. Methods of creating modified promoters resulting in varying levels of gene expression
EP2292744A1 (en) 2003-07-07 2011-03-09 Genencor International, Inc. Thermostable amylase polypeptides, nucleic acids encoding those polypeptides and uses thereof
US20100064393A1 (en) * 2006-11-29 2010-03-11 Novozymes, Inc. Bacillus liceniformis chromosome
EP3978604A1 (en) 2013-03-11 2022-04-06 Danisco US Inc. Alpha-amylase combinatorial variants
EP3585910B1 (en) 2017-02-24 2024-03-20 Danisco US Inc. Compositions and methods for increased protein production in bacillus licheniformis
US11879127B2 (en) 2017-08-23 2024-01-23 Danisco Us Inc. Methods and compositions for efficient genetic modifications of Bacillus licheniformis strains
JP7218985B2 (ja) 2017-09-13 2023-02-07 ダニスコ・ユーエス・インク バチルス属(Bacillus)におけるタンパク質産生の増加のための改変5’-非翻訳領域(UTR)配列

Also Published As

Publication number Publication date
WO2022251109A1 (en) 2022-12-01
US20240263185A1 (en) 2024-08-08
EP4347812A1 (en) 2024-04-10

Similar Documents

Publication Publication Date Title
KR102375732B1 (ko) 바실러스 리체니포르미스에서 단백질 생산을 증가시키기 위한 조성물 및 방법
CN108473946B (zh) 增强的蛋白质表达及其方法
CN113366108A (zh) 新颖启动子序列及其增强芽孢杆菌属细胞蛋白生产的方法
EP3380496B1 (en) Enhanced protein production and methods thereof
JP7280269B2 (ja) タンパク質の産生増加のための変異及び遺伝子改変バチルス属(bacillus)細胞、並びにその方法
JP2023524334A (ja) バチルス・リケニフォルミス(bacillus licheniformis)における強化したタンパク質産生のための組成物及び方法
CN117836315A (zh) 用于增强芽孢杆菌属细胞中蛋白质产生的方法和组合物
US20220389372A1 (en) Compositions and methods for enhanced protein production in bacillus cells
CN116897160A (zh) 在色素缺陷型芽孢杆菌属细胞中产生目的蛋白的方法和组合物
US20220282234A1 (en) Compositions and methods for increased protein production in bacillus lichenformis
CN117769597A (zh) 用于增强芽孢杆菌属细胞中蛋白质产生的组合物和方法
EP4433588A1 (en) Compositions and methods for enhanced protein production in bacillus cells
WO2024091804A1 (en) Compositions and methods for enhanced protein production in bacillus cells
WO2023137264A1 (en) Compositions and methods for enhanced protein production in gram‑positive bacterial cells

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination