CN113201514B - 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用 - Google Patents

具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用 Download PDF

Info

Publication number
CN113201514B
CN113201514B CN202011110184.9A CN202011110184A CN113201514B CN 113201514 B CN113201514 B CN 113201514B CN 202011110184 A CN202011110184 A CN 202011110184A CN 113201514 B CN113201514 B CN 113201514B
Authority
CN
China
Prior art keywords
polypeptide
amino acid
recombinant
lysine
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011110184.9A
Other languages
English (en)
Other versions
CN113201514A (zh
Inventor
郑平
刘娇
王钰
周文娟
孙际宾
陈久洲
马延和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Institute of Industrial Biotechnology of CAS
Original Assignee
Tianjin Institute of Industrial Biotechnology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Institute of Industrial Biotechnology of CAS filed Critical Tianjin Institute of Industrial Biotechnology of CAS
Priority to CN202011110184.9A priority Critical patent/CN113201514B/zh
Publication of CN113201514A publication Critical patent/CN113201514A/zh
Priority to PCT/CN2021/117492 priority patent/WO2022078127A1/zh
Priority to EP21879173.9A priority patent/EP4230723A1/en
Priority to US18/030,228 priority patent/US20230332116A1/en
Application granted granted Critical
Publication of CN113201514B publication Critical patent/CN113201514B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1217Phosphotransferases with a carboxyl group as acceptor (2.7.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/77Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/001Amines; Imines
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/005Amino acids other than alpha- or beta amino acids, e.g. gamma amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/06Alanine; Leucine; Isoleucine; Serine; Homoserine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/08Lysine; Diaminopimelic acid; Threonine; Valine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/44Polycarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/02Phosphotransferases with a carboxy group as acceptor (2.7.2)
    • C12Y207/02004Aspartate kinase (2.7.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B40/00Libraries per se, e.g. arrays, mixtures
    • C40B40/04Libraries containing only organic compounds
    • C40B40/10Libraries containing peptides or polypeptides, or derivatives thereof
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P60/00Technologies relating to agriculture, livestock or agroalimentary industries
    • Y02P60/80Food processing, e.g. use of renewable energies or variable speed drives in handling, conveying or stacking
    • Y02P60/87Re-use of by-products of food processing for fodder production

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本公开涉及具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用。具体来说,本公开涉及一种新的具有天冬氨酸激酶活性的多肽、重组多肽、多核苷酸、核酸构建体、重组表达载体、重组宿主细胞,以及生产氨基酸的方法。本公开的具有天冬氨酸激酶活性的多肽是在在对应于SEQ ID NO:1所示的氨基酸序列的第293、294和307位的一个或多个位置处发生突变的突变体,与SEQ ID NO:1所示序列的多肽相比,突变体多肽解除了赖氨酸对天冬氨酸激酶的反馈抑制,具有高的天冬氨酸激酶活性,能够用于赖氨酸及其衍生物的稳定、高效生产。

Description

具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用
技术领域
本公开属于分子生物学和生物工程领域,具体涉及一种具有天冬氨酸激酶活性的多肽、重组多肽、编码多肽或重组多肽的多核苷酸、核酸构建体、重组表达载体、重组宿主细胞,以及生产氨基酸的方法。
背景技术
赖氨酸(lysine)的化学名称是2,6-二氨基庚二酸,是动物和人体必需氨基酸,能促进人体发育、增强免疫能力,并有提高中枢神经组织功能的作用。赖氨酸有L-型(左旋)、D-型(右旋)和DL型(消旋型)三种化学旋光异构体,其中只有L型才能为生物所利用,通常所说的赖氨酸即为L-赖氨酸。赖氨酸在人类主食谷物食品中的含量较低,缺乏会引起蛋白质代谢及功能障碍,对生长造成不利影响,并且在加工过程中容易被破坏,故被称为第一限制性氨基酸,在医药、健康、食品、动物饲料和化妆品等行业中有着十分重要的地位。
目前为止,工业上生产赖氨酸的方法主要有三种:蛋白水解法、化学合成法和微生物发酵法。其中微生物发酵法具有生产成本低、生产强度高、高特异性和对环境污染小等优点而成为当今工业生产赖氨酸应用最广泛的方法。棒状细菌和埃希氏菌在赖氨酸的工业化生产中获得了广泛应用,常用的埃希氏菌如大肠杆菌(Escherichia coli),常用的棒状细菌有棒状杆菌属的谷氨酸棒杆菌(Corynebacterium glutamicum),短杆菌属的黄色短杆菌(Brevibacterium flavum)、乳酸发酵短杆菌(Brevibacterium lactofermentus),以及节杆菌属的某些种和微杆菌属的某些种。而由于谷氨酸棒杆菌的生理优越性,谷氨酸棒杆菌已成为工业中最重要的生产菌株。
谷氨酸棒杆菌中同时存在脱氢酶途径和琥珀酰化酶途径两种赖氨酸的生物合成途径。其中,谷氨酸棒杆菌利用脱氢酶途径合成赖氨酸有6个酶催化反应,分别是天冬氨酸激酶(AK,由基因lysC编码)、天冬氨酸半醛脱氢酶(ASADH,由基因asd编码)、二氢吡啶二羧酸合酶(DHDPS,由基因dapA编码)、二氢吡啶二羧酸还原酶(DHDPR,由基因dapB编码)、二氨基庚二酸脱氢酶(DAPDH,由基因ddh编码)和二氨基庚二酸脱羧酶(DAPDC,由基因lysA编码)。谷氨酸棒杆菌利用琥珀酰化酶途径合成赖氨酸的过程中还涉及合成内消旋二氨基庚二酸的四种酶:琥珀酰二氨基庚二酸氨基转移酶(由基因dapD编码),四氢吡啶二羧酸酯琥珀酰酶(由基因dapC编码),琥珀酰二氨基庚二酸脱酰基酶(由基因dapE编码)及二氨基庚二酸差向异构酶(由基因dapF编码)。其中,天冬氨酸激酶催化L-天冬氨酸生成天冬氨酸磷酸,是谷氨酸棒杆菌中L-天冬氨酸生物合成途径的第一步,也是赖氨酸生产的限速步骤,天冬氨酸激酶的活性受赖氨酸的反馈抑制[1]。因此,如何解除赖氨酸生物合成途径中赖氨酸对天冬氨酸激酶的反馈抑制,对于选育赖氨酸的高产菌株具有重要意义。
引用文献1公开了一种对赖氨酸抑制不敏感的天冬氨酸激酶的突变体,其对分离于大肠杆菌中的天冬氨酸激酶III(Aspartate kinase III,AKIII)的编码基因进行随机突变,筛选得到了两种解除反馈抑制的AK III突变体,分别是将352位苏氨酸用异亮氨酸替换(T352I)和318位甲硫氨酸用异亮氨酸替换(M318I)。虽然两种AK III突变体可以解除赖氨酸对天冬氨酸激酶的反馈抑制,但其应用于赖氨酸生产的效率不高,无法获得赖氨酸产量显著提升的赖氨酸高产菌株。
引用文献2公开了谷氨酸棒杆菌来源的天冬氨酸激酶突变体,包括279T,A279V,S301F,T308I,S301Y,G345D,R320G,T311I和S381F。上述的AK III突变体虽然可解除赖氨酸对天冬氨酸激酶的反馈抑制,但应用于赖氨酸生产的效率差别较大,其中T311I是目前所有文献报道的应用于赖氨酸生产效果最好的突变体,可显著提升菌株的赖氨酸产量。能否获得解除赖氨酸反馈抑制且赖氨酸生产效果更高的天冬氨酸激酶突变体是本领域技术人员急需解决的问题。
引用文献:
引用文献1:EP1394257
引用文献2:EP1590463A2
发明内容
发明要解决的问题
鉴于现有技术中存在的问题,例如,天冬氨酸激酶的突变体无法稳定、高效生产赖氨酸的缺陷。为此,本公开提供了一种具有天冬氨酸激酶活性的多肽,是野生型天冬氨酸激酶的突变体。与野生型的天冬氨酸激酶相比,本公开的突变体解除了赖氨酸对天冬氨基酸激酶的反馈抑制,具有高的天冬氨酸激酶活性,能够稳定、高效地生产赖氨酸。
用于解决问题的方案
(1)一种多肽,所述多肽具有天冬氨酸激酶活性,其中,所述多肽选自如下(i)-(iv)组成的组中的任一项:
(i)具有如SEQ ID NO:1所示序列的多肽的突变体,所述突变体和SEQ ID NO: 1所示的序列相比,在对应于SEQ ID NO:1所示序列的至少第293、294和307位中的一个或多个位置处包含突变;
(ii)与(i)所示序列具有至少70%、至少80%或至少90%的序列同一性,且不包括SEQ ID NO:1所示序列的多肽;
(iii)由多核苷酸编码的多肽,所述多核苷酸在非常高严格条件下与(a)或(b) 所示的多核苷酸杂交:
(a)编码如(i)所示氨基酸序列的多肽的多核苷酸;
(b)(a)的全长互补多核苷酸;
(iv)由(i)、(ii)、(iii)所示的多肽的片段,并且所述片段仍然具有天冬氨酸激酶活性。
(2)根据(1)所述的多肽,其中,所述多肽为包含如下(c)-(e)中至少一组所示的突变的多肽:
(c)对应SEQ ID NO:1所示序列的第293位的氨基酸由异亮氨酸(I)突变为丝氨酸(S)、甘氨酸(G)、谷氨酸(E)、脯氨酸(P)、色氨酸(W)、酪氨酸(Y)、组氨酸(H)、蛋氨酸(M)、谷氨酰胺(Q)、半胱氨酸(C)或精氨酸(R);
(d)对应SEQ ID NO:1所示序列的第294位的氨基酸由天冬氨酸(D)突变为酪氨酸(Y)、色氨酸(W)或苯丙氨酸(F);
(e)对应SEQ ID NO:1所示序列的第307位的氨基酸由苏氨酸(T)突变为酪氨酸(Y)、甘氨酸(G)或苯丙氨酸(F)。
(3)根据(1)或(2)所述的多肽,其中,所述多肽包括在(i)所示序列的多肽的N端或C端部位缺失或添加至少一个氨基酸残基。
(4)一种重组多肽,其中,所述重组多肽包括(1)-(3)任一项所述的多肽,以及与所述多肽融合的外源多肽;可选地,所述外源多肽包括标签多肽;优选地,所述外源多肽包括标签多肽,以及连接所述标签多肽与所述具有天冬氨酸激酶活的多肽的间隔多肽。
(5)一种分离的多核苷酸,其中,所述多核苷酸包含编码(1)-(3)任一项所述多肽的核苷酸序列,或包含编码(4)所述重组多肽的核苷酸序列。
(6)一种核酸构建体,其中,所述核酸构建体包含(5)所述的多核苷酸,所述多核苷酸与一个或多个调控序列可操作地连接,所述调控序列指导多肽在表达宿主中产生。
(7)一种重组表达载体,其中,所述重组表达载体包含(5)所述的多核苷酸,或 (6)所述的核酸构建体。
(8)一种重组宿主细胞,其中,所述重组宿主细胞包含(1)-(3)任一项所述的多肽、(4)所述的重组多肽、(5)所述的多核苷酸、(6)所述的核酸构建体,或者(7) 所述的重组表达载体。
(9)根据(8)所述的重组宿主细胞,其中,所述宿主细胞来源于棒状杆菌属、短杆菌属、节杆菌属、微杆菌属或埃希氏菌属;优选地,所述宿主细胞为谷氨酸棒杆菌或大肠杆菌。
(10)(1)-(3)任一项所述的多肽、(4)所述的重组多肽、(5)所述的多核苷酸、(6)所述的核酸构建体、(7)所述的重组表达载体,或(8)-(9)任一项所述的重组宿主细胞在生产氨基酸中的应用;
优选地,所述氨基酸选自赖氨酸、苏氨酸、异亮氨酸及氨基酸衍生物,其中,所述氨基酸衍生物包括戊二胺、5-氨基戊酸、戊二酸和羟基异亮氨酸的至少一种。
(11)一种生产氨基酸的方法,其中,包括利用(1)-(3)任一项所述的多肽、(4) 所述的重组多肽、(5)所述的多核苷酸、(6)所述的核酸构建体、(7)所述的重组表达载体,或(8)-(9)任一项所述的重组宿主细胞生产氨基酸的步骤;
可选地,所述方法还包括纯化或分离所述氨基酸的步骤;
优选地,所述氨基酸选自赖氨酸、苏氨酸、异亮氨酸及氨基酸衍生物,其中,所述氨基酸衍生物包括戊二胺、5-氨基戊酸、戊二酸和羟基异亮氨酸的至少一种。
发明的效果
在一些实施方式中,本公开发现了野生型天冬氨酸激酶的突变体,该突变体解除了赖氨酸对天冬氨酸激酶的反馈抑制,具有高的天冬氨酸激酶活性,将其应用于赖氨酸的生产,可显著提高赖氨酸产量,实现赖氨酸的稳定、高效生产。此外,本公开的天冬氨酸激酶的突变体还能高效生产苏氨酸、异亮氨酸,以及戊二胺、5-氨基戊酸、戊二酸、羟基异亮氨酸等的氨基酸衍生物。
在一些实施方式中,本公开的重组多肽、分离的多核苷酸、核酸构建体、重组表达载体分别包含或表达上述具有天冬氨酸激酶活性的多肽,可应用于赖氨酸及其衍生物的生产。
在一些实施方式中,本公开的重组宿主细胞,具有解除赖氨酸反馈抑制的天冬氨酸激酶活性的多肽,重组宿主细胞中能够过量积累赖氨酸,适用于赖氨酸及其衍生物的工业生产。
在一些实施方式中,本公开的生产氨基酸的方法,利用了上述具有天冬氨酸激酶活性的多肽,或重组多肽、重组宿主细胞等,能够实现氨基酸的稳定、高效生产。当用于氨基酸生产时,能够获得稳定高产的赖氨酸、苏氨酸、异亮氨酸及其衍生物。
附图说明
图1示出了pCas9gRNA-ccdB质粒的示意图;
图2示出了pRecT质粒的示意图。
具体实施方式
定义
当在权利要求和/或说明书中与术语“包含”联用时,词语“一(a)”或“一(an)”可以指“一个”,但也可以指“一个或多个”、“至少一个”以及“一个或多于一个”。
如在权利要求和说明书中所使用的,词语“包含”、“具有”、“包括”或“含有”是指包括在内的或开放式的,并不排除额外的、未引述的元件或方法步骤。
在整个申请文件中,术语“约”表示:一个值包括测定该值所使用的装置或方法的误差的标准偏差。
虽然所公开的内容支持术语“或”的定义仅为替代物以及“和/或”,但除非明确表示仅为替代物或替代物之间相互排斥外,权利要求中的术语“或”是指“和/或”。
当用于权利要求书或说明书时,选择/可选/优选的“数值范围”既包括范围两端的数值端点,也包括相对于前述数值端点而言,所述数值端点中间所覆盖的所有自然数。
如本公开所使用的,尽管可以使用其他有机或无机催化剂,但术语“转化(converting)”是指主要由一种或多种的多肽(酶)催化从一个分子到另一个分子的化学转化;其也可以指期望产物的摩尔量与限量底物的摩尔量之间的比率(以%为单位)
如本公开所使用的,术语“天冬氨酸激酶”(Aspartate kinase)及其缩写名称“AK”是指能够催化天冬氨酸磷酸化,使天冬氨酸转化为天冬氨酰磷酸的多肽(酶)。天冬氨酸激酶作为赖氨酸生物合成途径中的第一个关键酶,控制着天冬氨酸族各氨基酸的生物合成途径。
如本公开所使用的,术语“多肽”、“肽”和“蛋白质”在本文中互换地使用并且为任意长度的氨基酸聚合物。该聚合物可以是线形或分支的,它可以包含修饰的氨基酸,并且它可以由非氨基酸隔断。该术语也包括已经被修饰(例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作,如以标记组分缀合)的氨基酸聚合物。
如本公开所使用的,术语“片段”意指从成熟多肽或结构域的氨基和/或羧基末端缺失一个或多个(例如,若干个)氨基酸的一种多肽或一个催化或碳水化合物结合模块。在本公开的技术方案中,所述片段具有天冬氨酸激酶活性。
如本公开所使用的,术语“野生型的”指在自然界中可以找到的对象。例如,一种存在于生物体中,可以从自然界的一个来源中分离出来并且在实验室中没有被人类有意修改的多肽或多核苷酸序列是天然存在的。如本公开所用的,“天然存在的”和“野生型的”是同义词。
如本公开所使用的,术语“突变体”是指相对于“野生型”,或者“相比较的”多核苷酸或多肽,在一个或多个(例如,若干个)位置处包含改变(即,取代、插入和/或缺失)的多核苷酸或多肽,其中,取代是指用不同的核苷酸或氨基酸置换占用一个位置的核苷酸或氨基酸。缺失是指去除占据某一位置的核苷酸或氨基酸。插入是指在邻接并且紧随占据位置的核苷酸或氨基酸之后添加核苷酸或氨基酸。示例性的,本公开中的“突变体”为具有提高的天冬氨酸激酶活性的多肽。
如本公开所使用的,术语“氨基酸突变”或“核苷酸突变”,包括“取代、重复、缺失或添加一个或多个氨基酸或核苷酸”。在本公开中,术语“突变”是指核苷酸序列或者氨基酸序列的改变。在一个具体的实施方式中,术语“突变”是指“取代”。
在一些实施方式中,本公开的“突变”包含在SEQ ID NO:1所示序列的第293位、第294位和第307位的一个或多个位置处的取代的氨基酸。上述位置处的氨基酸被取代后的突变体,与SEQ ID NO:1所示序列的多肽相比,解除了赖氨酸对酶活性的反馈抑制,具有提高的天冬氨酸激酶活性,可提高天冬氨酸向天冬氨酰磷酸的转化效率,进而提高赖氨酸的产量。
在本公开中,“突变”还可以包含在对应SEQ ID NO:1所示序列的一个或几个位置处不影响天冬氨酸酶活性的添加、缺失或取代的氨基酸。众所周知,在多肽的某些区域,例如非重要区域改变少数氨基酸残基基本上不会改变生物活性,例如,适当替换、添加或缺失某些氨基酸得到的序列并不会影响其活性[2]。示例性的,本公开的“突变”包含在对应SEQID NO:1所示序列的多肽的C端和N端至少一端的至少一个氨基酸残基的缺失或添加,且多肽具有天冬氨酸激酶活性。在一些实施方式中,本公开的“突变”对应如SEQ ID NO:1所示序列的多肽的N端起或C端起,缺失或添加1-20个氨基酸,优选1-15 个,更优选1-10个,更优选1-3个,最优选1个,并且具有天冬氨酸激酶活性。
在一些实施方式中,本公开的“突变”可以选自“保守突变”。在本公开中,术语“保守突变”是指可正常维持蛋白质的功能的突变。保守突变的代表性例子为保守置换。
如本公开所使用的,术语“保守置换”涉及用具有类似侧链的氨基酸残基替换氨基酸残基。本领域已经定义了具有类似侧链的氨基酸残基家族,并且包括具有碱性侧链(例如赖氨酸、精氨酸和组氨酸)、酸性侧链(例如天冬氨酸和谷氨酸)、不带电极性侧链 (例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、和半胱氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸和色氨酸)、β-支链(例如苏氨酸、缬氨酸和异亮氨酸)和芳香侧链(例如酪氨酸、苯丙氨酸、色氨酸和组氨酸)。
如本公开所使用的,“保守置换”通常在蛋白质的一个或多个位点上交换一种氨基酸。这种取代可以是保守的。作为被视作保守置换的置换,示例性的,可以举出Ala向Ser 或Thr的置换、Arg向Gln、His或Lys的置换、Asn向Glu、Gln、Lys、His或Asp的置换、Asp 向Asn、Glu或Gln的置换、Cys向Ser或Ala的置换、Gln向Asn、Glu、Lys、His、Asp或Arg 的置换、Glu向Gly、Asn、Gln、Lys或Asp的置换、Gly向Pro的置换、His向Asn、Lys、 Gln、Arg或Tyr的置换、Ile向Leu、Met、Val或Phe的置换、Leu向Ile、Met、Val或Phe的置换、Lys向Asn、Glu、Gln、His或Arg的置换、Met向Ile、Leu、Val或Phe的置换、Phe 向Trp、Tyr、Met、Ile或Leu的置换、Ser向Thr或Ala的置换、Thr向Ser或Ala的置换、Trp 向Phe或Tyr的置换、Tyr向His、Phe或Trp的置换、及Val向Met、Ile或Leu的置换。此外,保守突变还包括起因于基因所来源的个体差异、株、种的差异等天然产生的突变。
如本公开所使用的,术语“重组多肽”是指以采用基因工程的方法,使两种或两种以上的多肽融合表达。在一些实施方式中,重组多肽是将SEQ ID NO:1所示序列的多肽的突变体与外源多肽融合得到的重组多肽。在一些实施方式中,外源多肽包括标签多肽。在一些实施方式中,外源多肽包括标签多肽,以及连接突变体与标签多肽的间隔多肽,具体而言,间隔多肽可以具有10个以下的间隔氨基酸残基。
示例性的,标签多肽为下表1中所示的标签序列的多肽。
表1标签的序列
标签 残基 序列
Poly-Arg 5-6个(通常为5个) RRRRR
Poly-His 2-10个(通常为6个) HHHHHH
FLAG 8 DYKDDDDK
Strep-tag II 8 WSHPQFEK
c-myc 10 EQKLISEEDL
HA 9 YPYDVPDYA
在一些实施方式中,重组多肽从N端至C端依次为:如SEQ ID NO:1所示序列的多肽的突变体、间隔多肽、标签多肽;其中,标签多肽可以是如His6所示标签序列的多肽,间隔多肽具有10个以下的氨基酸残基,例如,间隔多肽的氨基酸序列为“LE”。
如本公开所使用的,在两种核酸或多肽比较中的术语“序列同一性”或“同一性百分比”,是指当使用核苷酸或氨基酸残基序列比较算法或通过目视检查测量,以最大的对应性进行比较和比对时,它们是相同的或具有相同序列特定百分比数。也就是说,核苷酸或者氨基酸序列的同一性可以利用下述比例来定义,该比例是将两个或多个核苷酸或氨基酸序列按照一致的核苷酸或氨基酸数达到最大的方式,并根据需要加入空位来进行比对时一致的核苷酸数或氨基酸数,在比对部分的全部核苷酸或氨基酸数中的比例。
本公开涉及的测定“序列同一性”或“同一性百分比”的方法包括但不限于:计算机分子生物学(Computational Molecular Biology),Lesk,A.M.编,牛津大学出版社,纽约,1988;生物计算:信息学和基因组项目(Biocomputing:Informatics and GenomeProjects),Smith, D.W.编,学术出版社,纽约,1993;序列数据的计算机分析(ComputerAnalysis of Sequence Data),第一部分,Griffin,A.M.和Griffin,H.G.编,HumanaPress,新泽西,1994;分子生物学中的序列分析(Sequence Analysis in MolecularBiology),von Heinje,G.,学术出版社,1987和序列分析引物(Sequence AnalysisPrimer),Gribskov,M.与Devereux,J.编M Stockton Press,纽约,1991和Carillo,H.与Lipman,D.,SIAM J.Applied Math.,48:1073(1988)。测定相同性的优选方法要在测试的序列之间得到最大的匹配。测定相同性的方法编译在公众可获得的计算机程序中。优选的测定两条序列之间相同性的计算机程序方法包括但不限于:GCG程序包(Devereux,J.等,1984)、BLASTP、BLASTN和FASTA(Altschul, S,F.等,1990)。公众可从NCBI和其它来源得到BLASTX程序(BLAST手册,Altschul, S.等,NCBI NLM NIH Bethesda,Md.20894;Altschul,S.等,1990)。熟知的Smith Waterman 算法也可用于测定相同性。
在一些实施方式中,本公开的具有天冬氨酸活性的多肽包含与SEQ ID NO:1所示序列的多肽的突变体具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%氨基酸残基的“序列同一性”或“同一性百分比”。在另外一些实施方式中,本公开的编码具有天冬氨酸活性的多肽的多核苷酸包含与编码SEQ ID NO: 1所示序列的多肽的突变体的多核苷酸具有至少70%、75%、80%、85%、90%、91%、92%、 93%、94%、95%、96%、97%、98%或99%核苷酸的“序列同一性”或“同一性百分比”。“序列同一性”或“同一性百分比”的判断/计算可以基于序列任何合适的区域上。例如,长度至少约50个残基的区域、至少约100个残基的区域,至少约200个残基的区域,至少约400个残基的区域,或至少约500个残基的区域。在某些实施方案中,所述序列在任一或两个相比较的生物聚合物(就是核酸或多肽)的整个长度上基本相同。
如本公开所使用的,术语“多核苷酸”指由核苷酸组成的聚合物。多核苷酸可以是单独片段的形式,也可以是更大的核苷酸序列结构的一个组成部分,其是从至少在数量或浓度上分离一次的核苷酸序列衍生而来的,能够通过标准分子生物学方法(例如,使用克隆载体)识别、操纵以及恢复序列及其组分核苷酸序列。当一个核苷酸序列通过一个DNA序列(即A、T、G、C)表示时,这也包括一个RNA序列(即A、U、G、C),其中“U”取代“T”。换句话说,“多核苷酸”指从其他核苷酸(单独的片段或整个片段)中去除的核苷酸聚合物,或者可以是一个较大核苷酸结构的组成部分或成分,如表达载体或多顺反子序列。多核苷酸包括DNA、RNA和cDNA序列。
如本公开所使用的,术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)包括但不限于任何酶、突变体、核酸、蛋白质、肽或辅因子的任何物质,该物质至少部分地从与其本质相关的一种或多种或所有天然存在的成分中去除;(3)相对于天然发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。分离的物质可以存在于发酵液样品中。例如宿主细胞可以被遗传修饰以表达本公开的多肽。来自宿主细胞的发酵液将包含分离的多肽。“重组多核苷酸”属于“多核苷酸”中的一种。
如本公开所使用的,术语“重组多核苷酸”指具有在自然界中不连接在一起的序列的多核苷酸。重组多核苷酸可包括在合适的载体中,且该载体可用于转化至合适的宿主细胞。含有重组多核苷酸的宿主细胞被称为“重组宿主细胞”。然后多核苷酸在重组宿主细胞中表达以产生例如“重组多肽”。
如本公开所使用的,术语“表达”包括涉及多肽产生的任何步骤,包括但不限于:转录、转录后修饰、翻译、翻译后修饰、和分泌。
如本公开所使用的,术语“表达载体”是指线状或环状DNA分子,该分子包含编码多肽的多核苷酸并且该多核苷酸有效地连接于供用于其表达的控制序列。
如本公开所使用的,术语“重组表达载体”指用于表达例如编码所需多肽的多核苷酸的DNA结构。重组表达载体可包括,例如包含i)对基因表达具有调控作用的遗传元素的集合,例如启动子和增强子;ii)转录成mRNA并翻译成蛋白质的结构或编码序列;以及iii)适当的转录和翻译起始和终止序列的转录亚单位。重组表达载体以任何合适的方式构建。载体的性质并不重要,并可以使用任何载体,包括质粒、病毒、噬菌体和转座子。用于本公开的可能载体包括但不限于染色体、非染色体和合成DNA序列,例如细菌质粒、噬菌体DNA、酵母质粒以及从质粒和噬菌体DNA的组合中衍生的载体,来自如牛痘、腺病毒、鸡痘、杆状病毒、SV40和伪狂犬病等病毒的DNA。
如本公开所使用的,术语“重组基因”是并非天然存在的基因。重组基因是人造的。重组基因包括可操作地连接到表达控制序列上的蛋白质编码序列。实施方案包括但不限于引入微生物的外源基因、可操作地连接到异源启动子的内源蛋白质编码序列和具有经修改的蛋白质编码序列的基因。重组基因保存在微生物的基因组、微生物中的质粒或微生物中的噬菌体上。
如本公开所使用的,术语“可操作地连接”是指如下的构造:调控序列相对于多核苷酸的编码序列安置在适当位置,从而使得该调控序列指导该编码序列的表达。示例性的,所述调控序列可以选自启动子和/或增强子编码的序列。
如本公开所使用的,术语“核酸构建体”包含与适合的调控序列有效地连接的编码多肽或结构域或模块的多核苷酸,该调控序列对于在所选细胞或者菌株进行多核苷酸的表达是必需的。在本公开中,转录调控元件包含启动子,在此基础上,还可以包含增强子、沉默子、绝缘子等元件。
本公开中的术语“宿主细胞”意指易于用包含本公开的突变体多肽、编码突变体多肽的多核苷酸或重组表达载体转化、转染、转导等的任何细胞类型。术语“重组宿主细胞”涵盖导入编码突变体多肽的多核苷酸或重组表达载体后不同于亲本细胞的宿主细胞,重组宿主细胞具体通过转化来实现。本公开的宿主细胞可以是原核细胞或真核细胞,只要是能够导入本公开的具有编码天冬氨酸激酶活性的多肽、重组多肽的多核苷酸的细胞即可。在一个实施方案中,宿主细胞指原核细胞,具体地,宿主细胞来源于适合发酵生产氨基酸的微生物,例如棒状杆菌属、短杆菌属、节杆菌属、微杆菌属或埃希氏菌属。作为优选地,宿主细胞是来源于棒状杆菌属的谷氨酸棒杆菌,或来源于埃希氏菌属的大肠杆菌。
本公开中的术语“转化、转染、转导”具有本领域技术人员普遍理解的意思,即将外源性的DNA导入宿主的过程。所述转化、转染、转导的方法包括任何将核酸导入细胞的方法,这些方法包括但不限于电穿孔法、磷酸钙(CaPO4)沉淀法、氯化钙(CaCl2)沉淀法、微注射法、聚乙二醇(PEG)法、DEAE-葡聚糖法、阳离子脂质体法以及乙酸锂-DMSO法。
本公开的宿主细胞的培养可以根据本领域的常规方法进行,包括但不限于孔板培养、摇瓶培养、批次培养、连续培养和分批补料培养等,并可以根据实际情况适当地调整各种培养条件如温度、时间和培养基的pH值等。
如本公开所使用的,术语“高严格条件”是指,对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃处在5X SSPE(saline sodium phosphate EDTA)、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和50%甲酰胺中预杂交和杂交12至24小时。最后在65℃处使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
如本公开所使用的,术语“非常高严格条件”是指,对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃处在5X SSPE(saline sodium phosphate EDTA)、0.3%SDS、200微克/ml剪切并变性的鲑精DNA和50%甲酰胺中预杂交和杂交12至24小时。最后在70℃处使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
除非另外定义或由背景清楚指示,否则在本公开中的全部技术与科学术语具有如本公开所属领域的普通技术人员通常理解的相同含义。
天冬氨酸激酶的突变体
在一些实施方式中,本公开通过定点突变构建了谷氨酸棒状杆菌中编码天冬氨酸激酶的LysC基因的突变文库,从中筛选出可以解除赖氨酸的反馈抑制,从而提高天冬氨酸激酶活性的突变体。
在一些实施方式中,本公开的解除赖氨酸反馈抑制的突变位点包括SEQ ID NO:1所示序列的第293、294和307位的一个或多个位置的取代的氨基酸。
示例性的,第293位点的突变包括氨基酸由异亮氨酸(I)突变为丝氨酸(S)、甘氨酸(G)、谷氨酸(E)、脯氨酸(P)、色氨酸(W)、酪氨酸(Y)、组氨酸(H)、蛋氨酸 (M)、谷氨酰胺(Q)、半胱氨酸(C)或精氨酸(R)。
第294位点的突变包括氨基酸由天冬氨酸(D)突变为酪氨酸(Y)、色氨酸(W)、苯丙氨酸(F)。
第307位的突变包括氨基酸由苏氨酸(T)突变为酪氨酸(Y)、甘氨酸(G)、苯丙氨酸(F)。
在一些实施方式中,本公开提供了具有天冬氨酸激酶活性的多肽,包括与本公开的天冬氨酸激酶的突变体具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、100%的序列同一性,且氨基酸序列不为SEQ ID NO:1 所示序列的多肽。
在一些实施方式中,本公开提供了具有天冬氨酸激酶活性的多肽,包括天冬氨酸激酶的突变体的N端和C端的至少一端起,存在氨基酸的添加或缺失。
在一些具体的实施方式中,上述天冬氨酸激酶的突变体的N端和C端的至少一端起,添加或缺失1-20个氨基酸,优选1-15个,更优选1-10个,更优选1-3个,最优选1个,并且具有天冬氨酸激酶活性。
在一些实施方式中,本公开提供了编码天冬氨酸激酶的突变体的多核苷酸,多核苷酸编码如SEQ ID NO:1所示序列的多肽的突变体。具体的,多核苷酸为LysC基因的突变文库中筛选得到的高产赖氨酸的LysC基因的突变基因,LysC基因的核苷酸序列如SEQ ID NO:2所示。
在一些实施方式中,多核苷酸对应编码第293位氨基酸的核苷酸序列选自如下任一组:TCC;GGC;GAA;CCA;TGG;TAC;CAC;ATG;CAA;TGC;CGC。优选地,多核苷酸对应编码第293位氨基酸的核苷酸序列选自TCC;GGC;GAA;CCA;TGG; TAC;CAC;ATG;CAA中的任一组。
在一些实施方式中,多核苷酸对应编码第294位氨基酸的核苷酸序列选自如下任一组:TAC;TGG;TTC。优选地,多核苷酸对应编码第294位氨基酸的核苷酸序列选自 TGG;TTC中的任一组。
在一些实施方式中,多核苷酸对应编码307位氨基酸的核苷酸序列选自如下任一组:TAC;GGC;TTC。优选地,多核苷酸对应编码第307位氨基酸的核苷酸序列选自TAC; GGC中的任一组。
LysC基因的突变文库的构建
以pCas9质粒[3]为模板,以cas9-1/cas9-2为扩增引物,扩增包含Cas9的扩增片段1。其中,cas9-1/cas9-2引物中引入操纵元件lacO突变和RBS突变。
以pnCas9(D10A)-AID-gRNA-ccdBTS[4]为模板,以gRNA-1/gRNA-2为扩增引物,扩增包含gRNA-ccdB表达盒和温敏复制原点的扩增片段2。
将扩增片段1和扩增片段2重组连接,得到pCas9gRNA-ccdB质粒。得到 pCas9gRNA-ccdB质粒图谱如图1所示,序列如SEQ ID NO:3所示。
以谷氨酸棒杆菌ATCC13032基因组为模板,以Pddh-1/Pddh-2为引物,扩增包含ddh基因的启动子突变体,作为扩增片段3。
以大肠杆菌MG1655基因组为模板,以recT-1/recT-2为引物,扩增recT基因,作为扩增片段4。
以pEC-XK99E质粒为模板,以rrnB-1/rrnB-2为引物,扩增rrnB终止子,作为扩增片段5。
以pEC-XK99E质粒为模板,以PEC-1/PEC-2为引物,扩增去除per基因的质粒骨架片段,作为扩增片段6。
将扩增片段3、扩增片段、扩增片段5和扩增片段6重组连接,获得表达RecT的pRecT质粒。pRecT质粒图谱如图2所示,序列如SEQ ID NO:5所示。
以Goldengate克隆方法构建靶向lysC基因293/294和307位点的pCas9gRNA质粒。其中,gRNA-1的靶DNA结合区为TGCAGAAATCAACATTGACA,gRNA-2的靶DNA 结合区为GCAGGTGAAGGTGATGTCGG具体的,分别将lysC-F1/lysC-R1, lysC-F2/lysC-R2进行变性退火,再与pCas9gRNA-ccdB质粒进行Goldengate克隆,分别获得pCas9gRNA-lysC1和pCas9gRNA-lysC2质粒。
将pRecT质粒电转化至谷氨酸棒杆菌ATCC13032,获得ATCC13032(pRecT)菌株。分别设计293-1至293-9,294-1至294-9;307-1至307-9的单链DNA,作为突变体构建的重组模板。在ATCC13032(pRecT)感受态细胞中分别转入pCas9gRNA-lysC1质粒和293-1至293-9、294-1至294-9的单链DNA,以及pCas9gRNA-lysC2质粒和307-1 至307-9的单链DNA,将转导有质粒和单链DNA的感受态细胞涂布平板,挑选包含293、 294和307位氨基酸突变的单克隆菌株,获得LysC基因的突变文库。
在一些实施方式中,将转化了目标DNA的感受态细胞加入1mL 46℃预热的TSB 液体培养基,46℃热击6min,30℃孵育3h,涂布添加5μg/mL氯霉素和0.05mM IPTG 的TSB平板,培养2天,长出数百克隆,从中筛选获得293、294和307位氨基酸位点的突变体库。
TSB液体培养基成份为(g/L):葡萄糖,5g/L;酵母粉,5g/L;大豆蛋白胨,9g/L;尿素,3g/L;丁二酸,0.5g/L;K2HPO4·3H2O,1g/L;MgSO4·7H2O,0.1g/L;生物素, 0.01mg/L;维生素B1,0.1mg/L;MOPS,20g/L。固体培养基补充15g/L琼脂粉。
谷氨酸棒杆菌的具体来源为谷氨酸棒杆菌ATCC 13032(Corynebacteriumglutamicum ATCC 13032,Gene ID:2830649)。
氨基酸的生产过程
(1)在293、294和307位氨基酸突变的LysC基因的突变文库中通过可重复得到筛选结果的方法筛选高产赖氨酸的单克隆菌株,作为生产氨基酸的重组宿主细胞。
(2)对重组宿主细胞进行发酵培养,从重组宿主细胞或重组宿主细胞的培养液中收集氨基酸,完成氨基酸的生产过程。
上述的氨基酸生产过程中,重组宿主细胞包含的突变的LysC基因能够编码解除赖氨酸抑制作用的天冬氨酸激酶,重组宿主细胞可大量积累赖氨酸,实现了对于赖氨酸、苏氨酸、异亮氨酸及其衍生物的稳定、高效生产。
对于生产的氨基酸,所述氨基酸选自赖氨酸、苏氨酸、异亮氨酸及氨基酸衍生物,其中,所述氨基酸衍生物包括戊二胺、5-氨基戊酸、戊二酸和羟基异亮氨酸的至少一种。
对于重组宿主细胞,重组宿主细胞中还包含其他参与合成氨基酸的酶,示例性的,参与合成氨基酸的酶包括天冬氨酸激酶、天冬氨酸半醛脱氢酶、天冬氨酸氨裂合酶、二氢吡啶二羧酸合成酶、二氢吡啶甲酸还原酶、琥珀酰二氨基庚二酸氨基转移酶、四氢吡啶二羧酸酯琥珀酰酶、琥珀酰二氨基庚二酸脱酰基酶、二氨基庚二酸差向异构酶、二氨基庚二酸脱酰基酶、甘油醛-3-磷酸脱氢酶、赖氨酸运输蛋白、转酮酶、二氨基庚二酸脱氢酶和丙酮酸羧化酶中的一种或两种以上的组合。
在一些实施方式中,可以通过基因工程的方法增强参与合成氨基酸的酶的活性或酶的表达量,例如通过引入强启动子或者采用质粒游离表达形式提高参与合成氨基酸的酶编码基因的表达强度,或者采用染色体整合的方式整合其他物种来源的酶活性更高的参与合成氨基酸的酶的编码基因。
在一些实施方式中,宿主细胞为谷氨酸棒杆菌,在另外一些实施方式中,宿主细胞为大肠杆菌。谷氨酸棒杆菌和大肠杆菌均是生产赖氨酸的重要菌株,通过在谷氨酸棒杆菌和大肠杆菌中表达解除赖氨酸反馈抑制的天冬氨酸激酶的突变体,可实现对赖氨酸及其衍生物的高效生产。
在一些实施方式中,重组宿主细胞的筛选条件为:采用牙签挑取少量菌接种到每孔含有200μl发酵培养基的96孔板中,30℃培养24h,孔板摇床转速为800rpm。
在一些实施方式中,发酵培养条件为:将重组宿主细胞接种到TSB液体培养基中培养6-8h,培养物作为种子接种到每孔含有600μl发酵培养基的24孔板中,初始OD600控制约为0.1,30℃培养17h,孔板摇床转速为800rpm,每个菌株3个平行,发酵结束后检测OD600和L-赖氨酸产量。
发酵培养基成份为:葡萄糖,80g/L;酵母粉,1g/L;大豆蛋白胨,1g/L;NaCl, 1g/L;硫酸铵,1g/L;尿素,8g/L;K2HPO4·3H2O,1g/L;MgSO4·7H2O,0.45g/L; FeSO4·7H2O,0.05g/L;生物素,0.4mg/L;维生素B1,0.1mg/L;MOPS,40g/L;初始pH7.2。
在一些实施方式中,对于重组宿主细胞或重组细胞的培养液回收氨基酸,可通过本领域常用方法,包括但不限于:过滤、阴离子交换色谱、结晶和HPLC。
本公开所述的催化一些或所有反应的酶可在非天然的、经工程改造的异源生物体中表达。具体地,编码途径用酶的基因可被分离,插入到用于转化生产的生物体的表达载体中,可被并入至基因组,并直接表达所述酶。在本领域,用于操纵微生物的方法是已知的,如《分子生物学现代方法》(Online ISBN:9780471142720,John Wiley and Sons,Inc.)、《微生物代谢工程:方法和规程》(Qiong Cheng Ed.,Springer)和《系统代谢工程:方法和规程》(Hal S.Alper Ed.,Springer)等出版物中被解释。
实施例
本公开的其他目的、特征和优点将从以下详细描述中变得明显。但是,应当理解的是,详细描述和具体实施例(虽然表示本公开的具体实施方式)仅为解释性目的而给出,因为在阅读该详细说明后,在本公开的精神和范围内所作出的各种改变和修饰,对于本领域技术人员来说将变得显而易见。
本实施例中所用到的实验技术与实验方法,如无特殊说明均为常规技术方法,例如下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。实施例中所使用的材料、试剂等,如无特殊说明,均可通过正规商业渠道获得。
实施例1.构建谷氨酸棒杆菌lysC基因的突变体库
基于谷氨酸棒杆菌LysC的序列和结构特征,以及我们对其功能的理解,推测293、294和307位氨基酸位点突变可以解除LysC的赖氨酸反馈抑制,并可以提高谷氨酸棒杆菌的L-赖氨酸产量。
为了实现谷氨酸棒杆菌的快速定点突变,首先构建基于单链重组的CRISPR/Cas9基因组编辑系统。以pCas9质粒[3]为模板,以cas9-1/cas9-2为引物,在引物上引入操纵元件lacO突变(TGTGTGGAATTGTGAGCGGATAACAATTTCACACA突变为 TGTGTGGAATTGTGAGCGCTCACAATTTCACACA)和RBS突变(AAAGGAGTTGAGA 突变为AAAGGCACCCGAT),扩增包含cas9的片段;再以pnCas9(D10A)-AID- gRNA-ccdBTS[4]质粒为模板,以gRNA-1/gRNA-2为引物,扩增包含gRNA-ccdB表达盒和温敏复制原点的质粒骨架片段。以上2个片段通过诺唯赞的一步重组试剂盒克隆连接,获得可以高效构建的pCas9gRNA-ccdB质粒,质粒图谱如图1所示,序列如SEQID NO:3所示。以谷氨酸棒杆菌ATCC13032基因组为模板,以Pddh-1/Pddh-2为引物,扩增ddh基因的启动子突变体(ATGCATCTC突变为ACAAAAGGT),序列如SEQ ID NO: 4所示;以大肠杆菌MG1655基因组为模板,扩增recT基因;以pEC-XK99E质粒为模板,以rrnB-1/rrnB-2为引物,扩增rrnB终止子片段;以pEC-XK99E质粒为模板,以PEC-1/ PEC-2为引物,扩增去除per基因的质粒骨架片段。以上4个片段通过诺唯赞的一步重组试剂盒克隆连接,获得表达RecT的pRecT质粒,质粒图谱如图2所示,序列如SEQ ID NO:5所示。
根据文献报道的Goldengate克隆方法[4]构建2个靶向lysC基因293/294和307位点的pCas9gRNA质粒,gRNA1的靶DNA结合区为TGCAGAAATCAACATTGACA,gRNA2 的靶DNA结合区为GCAGGTGAAGGTGATGTCGG。分别将lysC-F1/lysC-R1, lysC-F2/lysC-R2引物进行变性退火,再与pCas9gRNA-ccdB质粒进行Goldengate克隆,分别获得pCas9gRNA-lysC1和pCas9gRNA-lysC2质粒。
基于单链重组的CRISPR/Cas9基因组编辑系统构建lysC基因293、294和307位氨基酸位点的突变体库。将pRecT质粒电转化至谷氨酸棒杆菌ATCC13032,获得 ATCC13032(pRecT)菌株。ATCC13032(pRecT)菌株采用文献报道的方法制备感受态细胞[5]。为了对lysC基因293、294和307位的氨基酸位点进行野生型以外的19种突变,分别设计293-1至293-9,294-1至294-9;307-1至307-9的单链DNA,作为突变体构建的重组模板。ATCC13032(pRecT)感受态细胞,分别电转化1-2μg pCas9gRNA-lysC1 质粒和10μg 293-1至293-9的理论上19种突变等摩尔浓度的单链DNA,1-2μg pCas9gRNA-lysC1质粒和10μg 294-1至294-9的理论上19种突变等摩尔浓度的单链DNA,以及1-2μg pCas9gRNA-lysC2质粒和10μg 307-1至307-9的理论上19种突变等摩尔浓度的单链DNA,然后加入1mL 46℃预热的TSB培养基,46℃热击6min,30℃孵育3h,涂布添加5μg/mL氯霉素和0.05mM IPTG的TSB平板,培养2天,长出数百克隆,分别获得293、294和307位氨基酸位点的突变体库。TSB培养基成份为(g/L):葡萄糖,5g/L;酵母粉,5g/L;大豆蛋白胨,9g/L;尿素,3g/L;丁二酸,0.5g/L;K2HPO4·3H2O,1g/L;MgSO4·7H2O,0.1g/L;生物素,0.01mg/L;维生素B1,0.1mg/L;MOPS,20g/L。固体培养基补充15g/L琼脂粉。以上所用引物序列如表2所示。
表2
Figure BDA0002728346030000121
Figure BDA0002728346030000131
实施例2.谷氨酸棒杆菌lysC基因突变体库的筛选及测序
为了筛选谷氨酸棒杆菌lysC基因的突变体库,分别挑取293、294和307位点突变体库各60个克隆进行发酵,筛选可以高产L-赖氨酸的突变体。发酵培养基成份为:葡萄糖,80g/L;酵母粉,1g/L;大豆蛋白胨,1g/L;NaCl,1g/L;硫酸铵,1g/L;尿素, 8g/L;K2HPO4·3H2O,1g/L;MgSO4·7H2O,0.45g/L;FeSO4·7H2O,0.05g/L;生物素, 0.4mg/L;维生素B1,0.1mg/L;MOPS,40g/L;初始pH7.2。采用牙签挑取少量菌接种到每孔含有200μl发酵培养基的96孔板中,30℃培养24h,孔板摇床转速为800rpm,发酵结束后检测L-赖氨酸产量。293突变体库的所有克隆产量都高于0.5g/L,294和307 突变库也有部分克隆产量高于0.5g/L,表明以上位点突变可以解除赖氨酸反馈抑制,提高赖氨酸产量。对赖氨酸产量大于0.5g/L的突变体,以及294和307突变库中部分不产赖氨酸的突变体,采用lysC-C1/lysC-C2(表2)引物PCR扩增目的条带进行测序分析。突变体的产量和测序结果如表3所示,有部分相同突变的克隆,最终293位点获得11种突变体,294位点获得6种突变体,307位点获得5种突变体。
表3
Figure BDA0002728346030000141
注:–,不产赖氨酸;+,赖氨酸产量0.5-1.0g/L;++,赖氨酸产量1.0-2.0g/L;+++,赖氨酸产量2.0-3.0g/L;++++,赖氨酸产量3.0-4.0g/L。
实施例3.谷氨酸棒杆菌lysC基因突变体的赖氨酸产量评价
由于前面突变体赖氨酸产量初筛时菌株中还包含pRecT和pCas9gRNA-lysC1或pCas9gRNA-lysC2质粒,因此本实施例将以上质粒进行了丢失,获得仅基因组上存在突变体的菌株,并对其赖氨酸产量进行了评价。对以上获得产量较高菌株293-M1至293-M9、 293-M1至293-M3、307-M1至307-M2菌株,在无抗性的TSB培养基培养,丢失两个质粒,分别获得丢失质粒后ZCgLJ1至ZCgLJ9、ZCgLJ11至ZCgLJ13、ZCgLJ14至ZCgLJ15 突变体菌株。为了进行效果对比,同时构建了大量在先文献报道的高效解除赖氨酸反馈抑制的lysCT311I突变体,该菌株是在谷氨酸棒杆菌ATCC13032的天冬氨酸激酶编码基因 lysC上引入T311I(碱基由ACC突变为ATC)氨基酸突变(引用文献2),此外,以野生型谷氨酸棒杆菌ATCC13032作为对照菌株(WT)。采用24孔板评价菌株的赖氨酸产量,首先将菌株接种到TSB液体培养基中培养6-8h,培养物作为种子接种到每孔含有600μl 发酵培养基(同实施例2)的24孔板中,初始OD600控制约为0.1,30℃培养17h,孔板摇床转速为800rpm,每个菌株3个平行,发酵结束后检测OD600和L-赖氨酸产量。结果如表4所示,293位点的所有11个突变体产量都高于T311I对照突变体,294位点的D294F (ZCgLJ13菌株)和307位点的T307G(ZCgLJ15)产量也高于T311I对照突变体。这些氨基酸位点突变在氨基酸及其衍生物生产中具有较T311I更好的应用前景,特别是对于均依赖LysC催化反应的赖氨酸、苏氨酸和异亮氨酸的生产及其衍生物戊二胺、5-氨基戊酸、戊二酸、羟基异亮氨酸等的生产。
表4
菌株 氨基酸突变 OD<sub>600</sub> 赖氨酸产量(g/L)
WT 11.78±0.18 0.17±0.06
lysC<sup>T311I</sup> T311I 12.15±0.23 2.33±0.06
ZCgLJ1 I293S 12.50±0.35 3.27±0.15
ZCgLJ2 I293G 11.99±0.34 3.00±0.10
ZCgLJ3 I293E 11.86±0.59 3.00±0.20
ZCgLJ4 I293P 12.22±0.55 3.30±0.20
ZCgLJ5 I293W 12.35±0.03 3.33±0.06
ZCgLJ6 I293Y 12.72±0.24 3.53±0.06
ZCgLJ7 I293H 12.40±0.08 3.30±0.00
ZCgLJ8 I293M 12.15±0.25 2.77±0.06
ZCgLJ9 I293Q 12.23±0.06 3.50±0.00
ZCgLJ11 D294Y 12.00±0.51 0.60±0.00
ZCgLJ12 D294W 12.04±0.41 1.73±0.06
ZCgLJ13 D294F 12.66±0.20 2.73±0.06
ZCgLJ14 T307Y 12.14±0.41 0.7±0.00
ZCgLJ15 T307G 12.41±0.18 2.50±0.00
本说明书公开的所有技术特征都可以任何组合方式进行组合。本说明所公开的每个特征也可以被其它具有相同、相等或相似作用的特征所替换。因此,除非特殊说明,所公开的每一特征仅仅是一系列相等或相似特征的实例。
此外,从上述描述中,本领域技术人员可从本公开中很容易清楚本公开的关键特征,在不脱离本公开的精神及范围的情况下,可对发明进行很多修改以适应各种不同的使用目的及条件,因此这类修改也旨在落入所附权利要求书的范围内。
参考文献:
[1]Bearer CF,Neet KE;Stadtman,E.R.,Cohen,G.N.,LeBras,G.,Robichon-Szulmajster, H.(1961)."Feed-back Inhibition and Repression of AspartokinaseActivity in Escherichia coli and Saccharomyces cerevisiae."J.Biol.Chem.
[2]Watson等,Molecular Biology of The Gene,第四版,1987,The Benjamin/Cummings Pub.Co.P224.
[3]LIU,Jiao,et al.Development of a CRISPR/Cas9 genome editing toolboxfor Corynebacterium glutamicum.Microbial cell factories,2017,16.1:205.
[4]WANG,Yu,et al.Expanding targeting scope,editing window,and basetransition capability of base editing in Corynebacteriumglutamicum.Biotechnology and bioengineering, 2019,116:3016-3029.
[5]Ruan Y,Zhu L,Li Q.Improving the electro-transformation efficiencyof Corynebacterium glutamicum by weakening its cell wall and increasing thecytoplasmic membrane fluidity.Biotechnol Lett.2015;37:2445–52。
序列表
<110> 中国科学院天津工业生物技术研究所
<120> 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用
<130> 6A17-2093168I
<141> 2020-10-16
<160> 50
<170> SIPOSequenceListing 1.0
<210> 1
<211> 421
<212> PRT
<213> Corynebacterium glutamicum
<400> 1
Met Ala Leu Val Val Gln Lys Tyr Gly Gly Ser Ser Leu Glu Ser Ala
1 5 10 15
Glu Arg Ile Arg Asn Val Ala Glu Arg Ile Val Ala Thr Lys Lys Ala
20 25 30
Gly Asn Asp Val Val Val Val Cys Ser Ala Met Gly Asp Thr Thr Asp
35 40 45
Glu Leu Leu Glu Leu Ala Ala Ala Val Asn Pro Val Pro Pro Ala Arg
50 55 60
Glu Met Asp Met Leu Leu Thr Ala Gly Glu Arg Ile Ser Asn Ala Leu
65 70 75 80
Val Ala Met Ala Ile Glu Ser Leu Gly Ala Glu Ala Gln Ser Phe Thr
85 90 95
Gly Ser Gln Ala Gly Val Leu Thr Thr Glu Arg His Gly Asn Ala Arg
100 105 110
Ile Val Asp Val Thr Pro Gly Arg Val Arg Glu Ala Leu Asp Glu Gly
115 120 125
Lys Ile Cys Ile Val Ala Gly Phe Gln Gly Val Asn Lys Glu Thr Arg
130 135 140
Asp Val Thr Thr Leu Gly Arg Gly Gly Ser Asp Thr Thr Ala Val Ala
145 150 155 160
Leu Ala Ala Ala Leu Asn Ala Asp Val Cys Glu Ile Tyr Ser Asp Val
165 170 175
Asp Gly Val Tyr Thr Ala Asp Pro Arg Ile Val Pro Asn Ala Gln Lys
180 185 190
Leu Glu Lys Leu Ser Phe Glu Glu Met Leu Glu Leu Ala Ala Val Gly
195 200 205
Ser Lys Ile Leu Val Leu Arg Ser Val Glu Tyr Ala Arg Ala Phe Asn
210 215 220
Val Pro Leu Arg Val Arg Ser Ser Tyr Ser Asn Asp Pro Gly Thr Leu
225 230 235 240
Ile Ala Gly Ser Met Glu Asp Ile Pro Val Glu Glu Ala Val Leu Thr
245 250 255
Gly Val Ala Thr Asp Lys Ser Glu Ala Lys Val Thr Val Leu Gly Ile
260 265 270
Ser Asp Lys Pro Gly Glu Ala Ala Lys Val Phe Arg Ala Leu Ala Asp
275 280 285
Ala Glu Ile Asn Ile Asp Met Val Leu Gln Asn Val Ser Ser Val Glu
290 295 300
Asp Gly Thr Thr Asp Ile Thr Phe Thr Cys Pro Arg Ser Asp Gly Arg
305 310 315 320
Arg Ala Met Glu Ile Leu Lys Lys Leu Gln Val Gln Gly Asn Trp Thr
325 330 335
Asn Val Leu Tyr Asp Asp Gln Val Gly Lys Val Ser Leu Val Gly Ala
340 345 350
Gly Met Lys Ser His Pro Gly Val Thr Ala Glu Phe Met Glu Ala Leu
355 360 365
Arg Asp Val Asn Val Asn Ile Glu Leu Ile Ser Thr Ser Glu Ile Arg
370 375 380
Ile Ser Val Leu Ile Arg Glu Asp Asp Leu Asp Ala Ala Ala Arg Ala
385 390 395 400
Leu His Glu Gln Phe Gln Leu Gly Gly Glu Asp Glu Ala Val Val Tyr
405 410 415
Ala Gly Thr Gly Arg
420
<210> 2
<211> 1266
<212> DNA
<213> Artificial Sequence
<400> 2
gtggccctgg tcgtacagaa atatggcggt tcctcgcttg agagtgcgga acgcattaga 60
aacgtcgctg aacggatcgt tgccaccaag aaggctggaa atgatgtcgt ggttgtctgc 120
tccgcaatgg gagacaccac ggatgaactt ctagaacttg cagcggcagt gaatcccgtt 180
ccgccagctc gtgaaatgga tatgctcctg actgctggtg agcgtatttc taacgctctc 240
gtcgccatgg ctattgagtc ccttggcgca gaagcccaat ctttcacggg ctctcaggct 300
ggtgtgctca ccaccgagcg ccacggaaac gcacgcattg ttgatgtcac tccaggtcgt 360
gtgcgtgaag cactcgatga gggcaagatc tgcattgttg ctggtttcca gggtgttaat 420
aaagaaaccc gcgatgtcac cacgttgggt cgtggtggtt ctgacaccac tgcagttgcg 480
ttggcagctg ctttgaacgc tgatgtgtgt gagatttact cggacgttga cggtgtgtat 540
accgctgacc cgcgcatcgt tcctaatgca cagaagctgg aaaagctcag cttcgaagaa 600
atgctggaac ttgctgctgt tggctccaag attttggtgc tgcgcagtgt tgaatacgct 660
cgtgcattca atgtgccact tcgcgtacgc tcgtcttata gtaatgatcc cggcactttg 720
attgccggct ctatggagga tattcctgtg gaagaagcag tccttaccgg tgtcgcaacc 780
gacaagtccg aagccaaagt aaccgttctg ggtatttccg ataagccagg cgaggctgcg 840
aaggttttcc gtgcgttggc tgatgcagaa atcaacattg acatggttct gcagaacgtc 900
tcttctgtag aagacggcac caccgacatc accttcacct gccctcgttc cgacggccgc 960
cgcgcgatgg agatcttgaa gaagcttcag gttcagggca actggaccaa tgtgctttac 1020
gacgaccagg tcggcaaagt ctccctcgtg ggtgctggca tgaagtctca cccaggtgtt 1080
accgcagagt tcatggaagc tctgcgcgat gtcaacgtga acatcgaatt gatttccacc 1140
tctgagattc gtatttccgt gctgatccgt gaagatgatc tggatgctgc tgcacgtgca 1200
ttgcatgagc agttccagct gggcggcgaa gacgaagccg tcgtttatgc aggcaccgga 1260
cgctaa 1266
<210> 3
<211> 11773
<212> DNA
<213> Artificial Sequence
<400> 3
aattaagctt aaaggcaccc gatatggata agaaatactc aataggctta gatatcggca 60
caaatagcgt cggatgggcg gtgatcactg atgaatataa ggttccgtct aaaaagttca 120
aggttctggg aaatacagac cgccacagta tcaaaaaaaa tcttataggg gctcttttat 180
ttgacagtgg agagacagcg gaagcgactc gtctcaaacg gacagctcgt agaaggtata 240
cacgtcggaa gaatcgtatt tgttatctac aggagatttt ttcaaatgag atggcgaaag 300
tagatgatag tttctttcat cgacttgaag agtctttttt ggtggaagaa gacaagaagc 360
atgaacgtca tcctattttt ggaaatatag tagatgaagt tgcttatcat gagaaatatc 420
caactatcta tcatctgcga aaaaaattgg tagattctac tgataaagcg gatttgcgct 480
taatctattt ggccttagcg catatgatta agtttcgtgg tcattttttg attgagggag 540
atttaaatcc tgataatagt gatgtggaca aactatttat ccagttggta caaacctaca 600
atcaattatt tgaagaaaac cctattaacg caagtggagt agatgctaaa gcgattcttt 660
ctgcacgatt gagtaaatca agacgattag aaaatctcat tgctcagctc cccggtgaga 720
agaaaaatgg cttatttggg aatctcattg ctttgtcatt gggtttgacc cctaatttta 780
aatcaaattt tgatttggca gaagatgcta aattacagct ttcaaaagat acttacgatg 840
atgatttaga taatttattg gcgcaaattg gagatcaata tgctgatttg tttttggcag 900
ctaagaattt atcagatgct attttacttt cagatatcct aagagtaaat actgaaataa 960
ctaaggctcc cctatcagct tcaatgatta aacgctacga tgaacatcat caagacttga 1020
ctcttttaaa agctttagtt cgacaacaac ttccagaaaa gtataaagaa atcttttttg 1080
atcaatcaaa aaacggatat gcaggttata ttgatggggg agctagccaa gaagaatttt 1140
ataaatttat caaaccaatt ttagaaaaaa tggatggtac tgaggaatta ttggtgaaac 1200
taaatcgtga agatttgctg cgcaagcaac ggacctttga caacggctct attccccatc 1260
aaattcactt gggtgagctg catgctattt tgagaagaca agaagacttt tatccatttt 1320
taaaagacaa tcgtgagaag attgaaaaaa tcttgacttt tcgaattcct tattatgttg 1380
gtccattggc gcgtggcaat agtcgttttg catggatgac tcggaagtct gaagaaacaa 1440
ttaccccatg gaattttgaa gaagttgtcg ataaaggtgc ttcagctcaa tcatttattg 1500
aacgcatgac aaactttgat aaaaatcttc caaatgaaaa agtactacca aaacatagtt 1560
tgctttatga gtattttacg gtttataacg aattgacaaa ggtcaaatat gttactgaag 1620
gaatgcgaaa accagcattt ctttcaggtg aacagaagaa agccattgtt gatttactct 1680
tcaaaacaaa tcgaaaagta accgttaagc aattaaaaga agattatttc aaaaaaatag 1740
aatgttttga tagtgttgaa atttcaggag ttgaagatag atttaatgct tcattaggta 1800
cctaccatga tttgctaaaa attattaaag ataaagattt tttggataat gaagaaaatg 1860
aagatatctt agaggatatt gttttaacat tgaccttatt tgaagatagg gagatgattg 1920
aggaaagact taaaacatat gctcacctct ttgatgataa ggtgatgaaa cagcttaaac 1980
gtcgccgtta tactggttgg ggacgtttgt ctcgaaaatt gattaatggt attagggata 2040
agcaatctgg caaaacaata ttagattttt tgaaatcaga tggttttgcc aatcgcaatt 2100
ttatgcagct gatccatgat gatagtttga catttaaaga agacattcaa aaagcacaag 2160
tgtctggaca aggcgatagt ttacatgaac atattgcaaa tttagctggt agccctgcta 2220
ttaaaaaagg tattttacag actgtaaaag ttgttgatga attggtcaaa gtaatggggc 2280
ggcataagcc agaaaatatc gttattgaaa tggcacgtga aaatcagaca actcaaaagg 2340
gccagaaaaa ttcgcgagag cgtatgaaac gaatcgaaga aggtatcaaa gaattaggaa 2400
gtcagattct taaagagcat cctgttgaaa atactcaatt gcaaaatgaa aagctctatc 2460
tctattatct ccaaaatgga agagacatgt atgtggacca agaattagat attaatcgtt 2520
taagtgatta tgatgtcgat cacattgttc cacaaagttt ccttaaagac gattcaatag 2580
acaataaggt cttaacgcgt tctgataaaa atcgtggtaa atcggataac gttccaagtg 2640
aagaagtagt caaaaagatg aaaaactatt ggagacaact tctaaacgcc aagttaatca 2700
ctcaacgtaa gtttgataat ttaacgaaag ctgaacgtgg aggtttgagt gaacttgata 2760
aagctggttt tatcaaacgc caattggttg aaactcgcca aatcactaag catgtggcac 2820
aaattttgga tagtcgcatg aatactaaat acgatgaaaa tgataaactt attcgagagg 2880
ttaaagtgat taccttaaaa tctaaattag tttctgactt ccgaaaagat ttccaattct 2940
ataaagtacg tgagattaac aattaccatc atgcccatga tgcgtatcta aatgccgtcg 3000
ttggaactgc tttgattaag aaatatccaa aacttgaatc ggagtttgtc tatggtgatt 3060
ataaagttta tgatgttcgt aaaatgattg ctaagtctga gcaagaaata ggcaaagcaa 3120
ccgcaaaata tttcttttac tctaatatca tgaacttctt caaaacagaa attacacttg 3180
caaatggaga gattcgcaaa cgccctctaa tcgaaactaa tggggaaact ggagaaattg 3240
tctgggataa agggcgagat tttgccacag tgcgcaaagt attgtccatg ccccaagtca 3300
atattgtcaa gaaaacagaa gtacagacag gcggattctc caaggagtca attttaccaa 3360
aaagaaattc ggacaagctt attgctcgta aaaaagactg ggatccaaaa aaatatggtg 3420
gttttgatag tccaacggta gcttattcag tcctagtggt tgctaaggtg gaaaaaggga 3480
aatcgaagaa gttaaaatcc gttaaagagt tactagggat cacaattatg gaaagaagtt 3540
cctttgaaaa aaatccgatt gactttttag aagctaaagg atataaggaa gttaaaaaag 3600
acttaatcat taaactacct aaatatagtc tttttgagtt agaaaacggt cgtaaacgga 3660
tgctggctag tgccggagaa ttacaaaaag gaaatgagct ggctctgcca agcaaatatg 3720
tgaatttttt atatttagct agtcattatg aaaagttgaa gggtagtcca gaagataacg 3780
aacaaaaaca attgtttgtg gagcagcata agcattattt agatgagatt attgagcaaa 3840
tcagtgaatt ttctaagcgt gttattttag cagatgccaa tttagataaa gttcttagtg 3900
catataacaa acatagagac aaaccaatac gtgaacaagc agaaaatatt attcatttat 3960
ttacgttgac gaatcttgga gctcccgctg cttttaaata ttttgataca acaattgatc 4020
gtaaacgata tacgtctaca aaagaagttt tagatgccac tcttatccat caatccatca 4080
ctggtcttta tgaaacacgc attgatttga gtcagctagg aggtgactga agcttggctg 4140
ttttggcgga tgagagaaga ttttcagcct gatacagatt aaatcagaac gcagaagcgg 4200
tctgataaaa cagaatttgc ctggcggcag tagcgcggtg gtcccacctg accccatgcc 4260
gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg gggtctgccc atgcgagagt 4320
agggaactgc caggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt 4380
ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg ggagcggatt 4440
tgaacgttgc gaagcaacgg cccggagggt ggcgggcagg acgcccgcca taaactgcca 4500
ggcatcaaat taagcagaag gccatcctga cggatggcct ttttgcgttt ctacaaactc 4560
ttttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga 4620
taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc 4680
cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg 4740
aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc 4800
aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact 4860
tttgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 4920
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 4980
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 5040
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 5100
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 5160
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 5220
gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 5280
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 5340
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 5400
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 5460
aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc 5520
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 5580
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 5640
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 5700
atgagattat caaaaaggat cttcacctag atccttttgg ggtgggcgaa gaactccagc 5760
atgagatccc cgcgctggag gatcatccag ccattcgggg tcgttcactg gttccccttt 5820
ctgatttctg gcatagaaga acccccgtga actgtgtggt tccgggggtt gctgattttt 5880
gcgagacttc tcgcgcaatt ccctagctta ggtgaaaaca ccatgaaaca ctagggaaac 5940
acccatgaaa cacccattag ggcagtaggg cggcttcttc gtctagggct tgcatttggg 6000
cggtgatctg gtctttagcg tgtgaaagtg tgtcgtaggt ggcgtgctca atgcactcga 6060
acgtcacgtc atttaccggg tcacggtggg caaagagaac tagtgggtta gacattgttt 6120
tcctcgttgt cggtggtggt gagcttttct agccgctcgg taaacgcggc gatcatgaac 6180
tcttggaggt tttcaccgtt ctgcatgcct gcgcgcttca tgtcctcacg tagtgccaaa 6240
ggaacgcgtg cggtgaccac gacgggctta gcctttgcct gcgcttctag tgcttcgatg 6300
gtggcttgtg cctgcgcttg ctgcgcctgt agtgcctgtt gagcttcttg tagttgctgt 6360
tctagctgtg ccttggttgc catgctttaa gactctagta gctttcctgc gatatgtcat 6420
gcgcatgcgt agcaaacatt gtcctgcaac tcattcatta tgtgcagtgc tcctgttact 6480
agtcgtacat actcatattt acctagtctg catgcagtgc atgcacatgc agtcatgtcg 6540
tgctaatgtg taaaacatgt acatgcagat tgctgggggt gcagggggcg gagccaccct 6600
gtccatgcgg ggtgtggggc ttgccccgcc ggtacagaca gtgagcaccg gggcacctag 6660
tcgcggatac cccccctagg tatcggacac gtaaccctcc catgtcgatg caaatcttta 6720
acattgagta cgggtaagct ggcacgcata gccaagctag gcggccacca aacaccacta 6780
aaaattaata gtccctagac aagacaaacc cccgtgcgag ctaccaactc atatgcacgg 6840
gggccacata acccgaaggg gtttcaattg acaaccatag cactagctaa gacaacgggc 6900
acaacacccg cacaaactcg cactgcgcaa ccccgcacaa catcgggtct aggtaacact 6960
gagtaacact gaaatagaag tgaacacctc taaggaaccg caggtcaatg agggttctaa 7020
ggtcactcgc gctagggcgt ggcgtaggca aaacgtcatg tacaagatca ccaatagtaa 7080
ggctctggcg gggtgccata ggtggcgcag ggacgaagct gttgcggtgt cctggtcgtc 7140
taacggtgct tcgcagtttg agggtctgca aaactctcac tctcgctggg ggtcatctct 7200
ggctgaattg gaagtcatgg gcgaacgccg cattgagctg gctattgcta ctaagaatca 7260
cttggcggcg ggtggcgcgc tcatgatgtt tgtgggcact gttcgacaca accgctcaca 7320
gtcatttgcg caggttgaag cgggtattaa gactgcgtac tcttcgatgg tgaaaacatc 7380
tcagtggaag aaagaacgtg cacggtacgg ggtggagcac acctatagtg actatgaggt 7440
cacagactct tgggcgaacg gttggcactt gcaccgcaac atgctgttgt tcttggatcg 7500
tccactgtct gacgatgaac tcaaggcgtt tgaggattcc atgttttccc gctggtctgc 7560
tggtgtggtt aaggccggta tggacgcgcc actgcgtgag cacggggtca aacttgatca 7620
ggtgtctacc tggggtggag acgctgcgaa aatggcaacc tacctcgcta agggcatgtc 7680
tcaggaactg actggctccg ctactaaaac cgcgtctaag gggtcgtaca cgccgtttca 7740
gatgttggat atgttggccg atcaaagcga cgccggcgag gatatggacg ctgttttggt 7800
ggctcggtgg cgtgagtatg aggttggttc taaaaacctg cgttcgtcct ggtcacgtgg 7860
ggctaagcgt gctttgggca ttgattacat agacgctgat gtacgtcgtg aaatggaaga 7920
agaactgtac aagctcgccg gtctggaagc accggaacgg gtcgaatcaa cccgcgttgc 7980
tgttgctttg gtgaagcccg atgattggaa actgattcag tctgatttcg cggttaggca 8040
gtacgttctc gattgcgtgg ataaggctaa ggacgtggcc gctgcgcaac gtgtcgctaa 8100
tgaggtgctg gcaagtctgg gtgtggattc caccccgtgc atgatcgtta tggatgatgt 8160
ggacttggac gcggttctgc ctactcatgg ggacgctact aagcgtgatc tgaatgcggc 8220
ggtgttcgcg ggtaatgagc agactattct tcgcacccac taaaagcggc ataaaccccg 8280
ttcgatattt tgtgcgatga atttatggtc aatgtcgcgg gggcaaacta tgatgggtct 8340
tgttgttggc gtcccggaaa acgattccga agcccaacct ttcatagaag gcggcggtgg 8400
aatttttctc cacataagct ggcaatgttg cgacgcaaca ggtacagtgt aattcatgag 8460
accacgcgtg gatccggctt actaaaagcc agataacagt atgcgtattt gcgcgctgat 8520
ttttgcggta taagaatata tactgatatg tatacccgaa gtatgtcaaa aagaggtatg 8580
ctatgaagca gcgtattaca gtgacagttg acagcgacag ctatcagttg ctcaaggcat 8640
atatgatgtc aatatctccg gtctggtaag cacaaccatg cagaatgaag cccgtcgtct 8700
gcgtgccgaa cgctggaaag cggaaaatca ggaagggatg gctgaggtcg cccggtttat 8760
tgaaatgaac ggctcttttg ctgacgagaa caggggctgg tgaaatgcag tttaaggttt 8820
acacctataa aagagagagc cgttatcgtc tgtttgtgga tgtacagagt gatattattg 8880
acacgcccgg gcgacggatg gtgatccccc tggccagtgc acgtctgctg tcagataaag 8940
tctcccgtga actttacccg gtggtgcata tcggggatga aagctggcgc atgatgacca 9000
ccgatatggc cagtgtgccg gtatccgtta tcggggaaga agtggctgat ctcagccacc 9060
gcgaaaatga catcaaaaac gccattaacc tgatgttctg gggaatataa ggtctcagtt 9120
ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc 9180
accgagtcgg tgcttttttt ccaggcatca aataaaacga aaggctcagt cgaaagactg 9240
ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga caaatccgcc 9300
gggagcggat ttgaacgttg cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc 9360
ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg acggatggcc tttttgcgtt 9420
tctacaaact ctttttgttt atttttctaa atacattcaa atatgtatcc gctcatgaat 9480
taattccgct agatgacgtg cggcttcgaa aatctcgtga tggcaggttg ggcgtcgctt 9540
ggtcggtcat ttcgaagggc accaataact gccttaaaaa aattacgccc cgccctgcca 9600
ctcatcgcag tactgttgta attcattaag cattctgccg acatggaagc catcacagac 9660
ggcatgatga acctgaatcg ccagcggcat cagcaccttg tcgccttgcg tataatattt 9720
gcccatggtg aaaacggggg cgaagaagtt gtccatattg gccacgttta aatcaaaact 9780
ggtgaaactc acccagggat tggctgagac gaaaaacata ttctcaataa accctttagg 9840
gaaataggcc aggttttcac cgtaacacgc cacatcttgc gaatatatgt gtagaaactg 9900
ccggaaatcg tcgtggtatt cactccagag cgatgaaaac gtttcagttt gctcatggaa 9960
aacggtgtaa caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat 10020
acggaactcc ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa 10080
cttgtgctta tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg 10140
gttataggta cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg 10200
ggatatatca acggtggtat atccagtgat ttttttctcc attttagctt ccttagctcc 10260
tgaaaatctc gtcgaagctc ggcggatttg tcctactcaa gctgatccga caaaatccac 10320
acattatccc aggtgtccgg atcggtcaaa tacgctgcca gctcatagac cgtatccaaa 10380
gcatccgggg ctgatccccg gcgccagggt ggtttttctt ttcaccagtg agacgggcaa 10440
cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgtggtt 10500
tgccccagca ggcgaaaatc ctgtttgatg gtggttaacg gcgggatata acatgagctg 10560
tcttcggtat cgtcgtatcc cactaccgag atatccgcac caacgcgcag cccggactcg 10620
gtaatggcgc gcattgcgcc cagcgccatc tgatcgttgg caaccagcat cgcagtggga 10680
acgatgccct cattcagcat ttgcatggtt tgttgaaaac cggacatggc actccagtcg 10740
ccttcccgtt ccgctatcgg ctgaatttga ttgcgagtga gatatttatg ccagccagcc 10800
agacgcagac gcgccgagac agaacttaat gggcccgcta acagcgcgat ttgctggtga 10860
cccaatgcga ccagatgctc cacgcccagt cgcgtaccgt cttcatggga gaaaataata 10920
ctgttgatgg gtgtctggtc agagacatca agaaataacg ccggaacatt agtgcaggca 10980
gcttccacag caatggcatc ctggtcatcc agcggatagt taatgatcag cccactgacg 11040
cgttgcgcga gaagattgtg caccgccgct ttacaggctt cgacgccgct tcgttctacc 11100
atcgacacca ccacgctggc acccagttga tcggcgcgag atttaatcgc cgcgacaatt 11160
tgcgacggcg cgtgcagggc cagactggag gtggcaacgc caatcagcaa cgactgtttg 11220
cccgccagtt gttgtgccac gcggttggga atgtaattca gctccgccat cgccgcttcc 11280
actttttccc gcgttttcgc agaaacgtgg ctggcctggt tcaccacgcg ggaaacggtc 11340
tgataagaga caccggcata ctctgcgaca tcgtataacg ttactggttt cacattcacc 11400
accctgaatt gactctcttc cgggcgctat catgccatac cgcgaaaggt tttgcaccat 11460
tcgatggtgt caacgtaaat gccgcttcgc cttcgcgcgc gaattgcaag ctgatccggg 11520
cttatcgact gcacggtgca ccaatgcttc tggcgtcagg cagccatcgg aagctgtggt 11580
atggctgtgc aggtcgtaaa tcactgcata attcgtgtcg ctcaaggcgc actcccgttc 11640
tggataatgt tttttgcgcc gacatcataa cggttctggc aaatattctg aaatgagctg 11700
ttgacaatta atcatcggct cgtataatgt gtggaattgt gagcgctcac aatttcacac 11760
aggaaacaga att 11773
<210> 4
<211> 351
<212> DNA
<213> Corynebacterium glutamicum
<400> 4
gtgcgtggcg agttttacaa agaaccccac atcatcaatg cctaaatggc gggtattttc 60
atccaaaccc aaccgcgcat cattccaatg ctgatccacc ccatccggat aaaccaccat 120
gaacggcaac ggatcaaaag tcctgttggt gaagctgcgc cccacagatc ctgactgctg 180
ggagccatga aaatagatca gcgcatccgt ggtggaacca aaaggctcaa caatacgaaa 240
cgttcgcttt cggtcctgat gaaagagatg tccctgaatc atcatctaag tacaaaaggt 300
ggtaagctcg accaggacag tgccaccaca attttggagg attacaagaa c 351
<210> 5
<211> 5688
<212> DNA
<213> Artificial Sequence
<400> 5
gtgcgtggcg agttttacaa agaaccccac atcatcaatg cctaaatggc gggtattttc 60
atccaaaccc aaccgcgcat cattccaatg ctgatccacc ccatccggat aaaccaccat 120
gaacggcaac ggatcaaaag tcctgttggt gaagctgcgc cccacagatc ctgactgctg 180
ggagccatga aaatagatca gcgcatccgt ggtggaacca aaaggctcaa caatacgaaa 240
cgttcgcttt cggtcctgat gaaagagatg tccctgaatc atcatctaag tacaaaaggt 300
ggtaagctcg accaggacag tgccaccaca attttggagg attacaagaa catgactaag 360
caaccaccaa tcgcaaaagc cgatctgcaa aaaactcagg gaaaccgtgc accagcagca 420
gttaaaaata gcgacgtgat tagttttatt aaccagccat caatgaaaga gcaactggca 480
gcagctcttc cacgccatat gacggctgaa cgtatgatcc gtatcgccac cacagaaatt 540
cgtaaagttc cggcgttagg aaactgtgac actatgagtt ttgtcagtgc gatcgtacag 600
tgttcacagc tcggacttga gccaggtagc gccctcggtc atgcatattt actgcctttt 660
ggtaataaaa acgaaaagag cggtaaaaag aacgttcagc taatcattgg ctatcgcggc 720
atgattgatc tggctcgccg ttctggtcaa atcgccagcc tgtcagcccg tgttgtccgt 780
gaaggtgacg agtttagctt cgaatttggc cttgatgaaa agttaataca ccgcccggga 840
gaaaacgaag atgccccggt tacccacgtc tatgctgtcg caagactgaa agacggaggt 900
actcagtttg aagttatgac gcgcaaacag attgagctgg tgcgcagcct gagtaaagct 960
ggtaataacg ggccgtgggt aactcactgg gaagaaatgg caaagaaaac ggctattcgt 1020
cgcctgttca aatatttgcc cgtatcaatt gagatccagc gtgcagtatc aatggatgaa 1080
aaggaaccac tgacaatcga tcctgcagat tcctctgtat taaccgggga atacagtgta 1140
atcgataatt cagaggaata actgttttgg cggatgagag aagattttca gcctgataca 1200
gattaaatca gaacgcagaa gcggtctgat aaaacagaat ttgcctggcg gcagtagcgc 1260
ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag 1320
tgtggggtct ccccatgcga gagtagggaa ctgccaggca tcaaataaaa cgaaaggctc 1380
agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctcctgagta 1440
ggacaaatcc gccgggagcg gatttgaacg ttgcgaagca acggcccgga gggtggcggg 1500
caggacgccc gccataaact gccaggcatc aaattaagca gaaggccatc ctgacggatg 1560
gcctttttgc gtttctacaa actctttttg tttatttttc taaatacatt caaatatgta 1620
tccgctcatg aattaattcc gctagatgac gtgcggcttc gactagctcc aaaaaggtct 1680
ccaggatctc gaggagattt ttgaggggga gggagtcgag gaagagccag agcagaaggc 1740
ggggaaccgt tctctgccga cagcgtgagc cccccttaaa aatcaggccg gggaggaacc 1800
ggggagggat cagagctagg agcgagacac cctaaagggg gggaaccgtt ttctgctgac 1860
ggtgtttcgt ttattagttt tcagcccgtg gatagcggag ggtgagggca agtgagagcc 1920
agagcaagga cgggacccct aaagggggga accgttttct gctgacggtg tttcgtttat 1980
tagttttcag cccgtggacg gccgcgttta gcttccattc caagtgcctt tctgacttgt 2040
tggatgcgcc tttcactgac acctagttcg cctgcaagct cacgagtcga gggatcagca 2100
accgattgag aacgggcatc caggatcgca gttttgacgc gaagttcgag caactcgcct 2160
gtcatttctc ggcgtttgtt tgcttccgct aatcgctgtc gcgtctcctg cgcatactta 2220
ctttctgggt cagcccatct gcgtgcattc gatgtagctg cgccccgtcg ccccatcgtc 2280
gctagagctt tccgccctcg gctgctctgc gtttccaccc gacgagcagg gacgactggc 2340
tggcctttag ccacgtagcc gcgcacacga cgcgccatcg tcaggcgatc acgcatggcg 2400
ggaagatccg gctcccggcc gtctgcaccg accgcctggg caacgttgta cgccacttca 2460
tacgcgtcga tgatcttggc atcttttagg cgctcaccag cagctttgag ctggtatccc 2520
acggtcaacg cgtggcgaaa cgcggtctcg tcgcgcgctc gctctggatt tgtccagagc 2580
actcgcacgc cgtcgatcag gtcgccggac gcgtccaggg cgctcggcag gctcgcgtcc 2640
aaaatcgcta gcgccttggc ttctgcggtg gcgcgttgtg ccgcttcaat gcgggcgcgt 2700
ccgctggaaa agtcctgctc aatgtacttt ttcggcttct gtgatccggt catcgttcga 2760
gcaatctcca ttaggtcggc cagccgatcc acacgatcat gctggcagtg ccatttatag 2820
gctgtcggat cgtctgagac gtgcagcggc caccggctca gcctatgcga aaaagcctgg 2880
tcagcgccga aaacacgagt catttcttcc gtcgttgcag ccagcaggcg catatttggg 2940
ctggttttac ctgctgcggc atacaccggg tcaatgagcc agatgagctg gcatttcccg 3000
ctcagcggat tcacgccgat ccaagccggc gctttttcta ggcgtgccca tttctctaaa 3060
atcgcgtaga cctgcgggtt tacgtgctca atcttcccgc cggcctggtg gctgggcaca 3120
tcgatgtcaa gcacgatcac cgcggcatgt tgcgcgtgcg tcagcgcaac gtactggcac 3180
cgcgtcagcg cttttgagcc agcccggtag agctttggtt gggtttcgcc ggtatccggg 3240
tttttaatcc aggcgctcgc gaaatctctt gtcttgctgc cctggaagct ttcgcgtccc 3300
aggtgagcga gcagttcgcg gcgatcttct gccgtccagc cgcgtgagcc gcagcgcata 3360
gcttcggggt gggtgtcgaa cagatcggcg gacaatttcc acgcgctagc tgtgactgtg 3420
tcctgcggat cggctagagt catgtcttga gtgctttctc ccagctgatg actgggggtt 3480
agccgacgcc ctgtgagttc ccgctcacgg ggcgttcaac tttttcaggt atttgtgcag 3540
cttatcgtgt tttcttcgta aatgaacgct taactacctt gttaaacgtg gcaaataggc 3600
aggattgatg gggatctagc ttcacgctgc cgcaagcact cagggcgcaa gggctgctaa 3660
aggaagcgga acacgtagaa agccagtccg cagaaacggt gctgaccccg gatgaatgtc 3720
agctactggg ctatctggac aagggaaaac gcaagcgcaa agagaaagca ggtagcttgc 3780
agtgggctta catggcgata gctagactgg gcggttttat ggacagcaag cgaaccggaa 3840
ttgccagctg gggcgccctc tggtaaggtt gggaagccct gcaaagtaaa ctggatggct 3900
ttcttgccgc caaggatctg atggcgcagg ggatcaagat ctgatcaaga gacaggatga 3960
ggatcgtttc gcatgattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg 4020
gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg 4080
ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc 4140
ctgaatgaac tccaagacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct 4200
tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa 4260
gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg 4320
gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa 4380
gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat 4440
gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg 4500
cggatgcccg acggcgagga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc 4560
atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac 4620
cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg 4680
gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc 4740
tatcgccttc ttgacgagtt cttctgagcg ggactctggg gttcgcggaa tcatgaccaa 4800
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 4860
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 4920
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 4980
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5040
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5100
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 5160
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 5220
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 5280
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 5340
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 5400
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 5460
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 5520
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 5580
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagtg 5640
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccg 5688
<210> 6
<211> 78
<212> DNA
<213> Artificial Sequence
<400> 6
gcgctcacaa tttcacacag gaaacagaat taattaagct taaaggcacc cgatatggat 60
aagaaatact caataggc 78
<210> 7
<211> 27
<212> DNA
<213> Artificial Sequence
<400> 7
tcagtcacct cctagctgac tcaaatc 27
<210> 8
<211> 42
<212> DNA
<213> Artificial Sequence
<400> 8
gtcagctagg aggtgactga agcttggctg ttttggcgga tg 42
<210> 9
<211> 30
<212> DNA
<213> Artificial Sequence
<400> 9
ctgtgtgaaa ttgtgagcgc tcacaattcc 30
<210> 10
<211> 42
<212> DNA
<213> Artificial Sequence
<400> 10
ctgtgcggta tttcacaccg gtgcgtggcg agttttacaa ag 42
<210> 11
<211> 82
<212> DNA
<213> Artificial Sequence
<400> 11
gttcttgtaa tcctccaaaa ttgtggtggc actgtcctgg tcgagcttac caccttttgt 60
acttagatga tgattcaggg ac 82
<210> 12
<211> 43
<212> DNA
<213> Artificial Sequence
<400> 12
ttttggagga ttacaagaac atgactaagc aaccaccaat cgc 43
<210> 13
<211> 25
<212> DNA
<213> Artificial Sequence
<400> 13
ttcctctgaa ttatcgatta cactg 25
<210> 14
<211> 45
<212> DNA
<213> Artificial Sequence
<400> 14
taatcgataa ttcagaggaa taactgtttt ggcggatgag agaag 45
<210> 15
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 15
ggagaccttt ttggagctag tcg 23
<210> 16
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 16
ctagctccaa aaaggtctcc agg 23
<210> 17
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 17
cggtgtgaaa taccgcacag atg 23
<210> 18
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 18
ttcatgcaga aatcaacatt gaca 24
<210> 19
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 19
aaactgtcaa tgttgatttc tgca 24
<210> 20
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 20
ttcagcaggt gaaggtgatg tcgg 24
<210> 21
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 21
aaacccgaca tcaccttcac ctgc 24
<210> 22
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 22
ggtggtgccg tcttctacag aagagacgtt ctgcagaacc atgtcgargt tgatttctgc 60
atcagccaac gcacggaaaa ccttcgcagc 90
<210> 23
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 23
ggtggtgccg tcttctacag aagagacgtt ctgcagaacc atgtccwtgt tgatttctgc 60
atcagccaac gcacggaaaa ccttcgcagc 90
<210> 24
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 24
ggtggtgccg tcttctacag aagagacgtt ctgcagaacc atgtcgghgt tgatttctgc 60
atcagccaac gcacggaaaa ccttcgcagc 90
<210> 25
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 25
ggtggtgccg tcttctacag aagagacgtt ctgcagaacc atgtcgtdgt tgatttctgc 60
atcagccaac gcacggaaaa ccttcgcagc 90
<210> 26
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 26
ggtggtgccg tcttctacag aagagacgtt ctgcagaacc atgtctkggt tgatttctgc 60
atcagccaac gcacggaaaa ccttcgcagc 90
<210> 27
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 27
ggtggtgccg tcttctacag aagagacgtt ctgcagaacc atgtcwtcgt tgatttctgc 60
atcagccaac gcacggaaaa ccttcgcagc 90
<210> 28
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 28
ggtggtgccg tcttctacag aagagacgtt ctgcagaacc atgtcgcvgt tgatttctgc 60
atcagccaac gcacggaaaa ccttcgcagc 90
<210> 29
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 29
ggtggtgccg tcttctacag aagagacgtt ctgcagaacc atgtcgacgt tgatttctgc 60
atcagccaac gcacggaaaa ccttcgcagc 90
<210> 30
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 30
ggtggtgccg tcttctacag aagagacgtt ctgcagaacc atgtcccagt tgatttctgc 60
atcagccaac gcacggaaaa ccttcgcagc 90
<210> 31
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 31
gtcggtggtg ccgtcttcta cagaagagac gttctgcaga accatgadaa tgttgatttc 60
tgcatcagcc aacgcacgga aaaccttcgc 90
<210> 32
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 32
gtcggtggtg ccgtcttcta cagaagagac gttctgcaga accatcwtaa tgttgatttc 60
tgcatcagcc aacgcacgga aaaccttcgc 90
<210> 33
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 33
gtcggtggtg ccgtcttcta cagaagagac gttctgcaga accatgghaa tgttgatttc 60
tgcatcagcc aacgcacgga aaaccttcgc 90
<210> 34
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 34
gtcggtggtg ccgtcttcta cagaagagac gttctgcaga accatgtdaa tgttgatttc 60
tgcatcagcc aacgcacgga aaaccttcgc 90
<210> 35
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 35
gtcggtggtg ccgtcttcta cagaagagac gttctgcaga accattkgaa tgttgatttc 60
tgcatcagcc aacgcacgga aaaccttcgc 90
<210> 36
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 36
gtcggtggtg ccgtcttcta cagaagagac gttctgcaga accatttcaa tgttgatttc 60
tgcatcagcc aacgcacgga aaaccttcgc 90
<210> 37
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 37
gtcggtggtg ccgtcttcta cagaagagac gttctgcaga accatgcvaa tgttgatttc 60
tgcatcagcc aacgcacgga aaaccttcgc 90
<210> 38
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 38
gtcggtggtg ccgtcttcta cagaagagac gttctgcaga accatgacaa tgttgatttc 60
tgcatcagcc aacgcacgga aaaccttcgc 90
<210> 39
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 39
gtcggtggtg ccgtcttcta cagaagagac gttctgcaga accatccaaa tgttgatttc 60
tgcatcagcc aacgcacgga aaaccttcgc 90
<210> 40
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 40
cgcgcggcgg ccgtcggaac gagggcaggt gaaggtgatg tcggtgadgc cgtcttctac 60
agaagagacg ttctgcagaa ccatgtcaat 90
<210> 41
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 41
cgcgcggcgg ccgtcggaac gagggcaggt gaaggtgatg tcggtcwtgc cgtcttctac 60
agaagagacg ttctgcagaa ccatgtcaat 90
<210> 42
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 42
cgcgcggcgg ccgtcggaac gagggcaggt gaaggtgatg tcggtagmgc cgtcttctac 60
agaagagacg ttctgcagaa ccatgtcaat 90
<210> 43
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 43
cgcgcggcgg ccgtcggaac gagggcaggt gaaggtgatg tcggtgtdgc cgtcttctac 60
agaagagacg ttctgcagaa ccatgtcaat 90
<210> 44
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 44
cgcgcggcgg ccgtcggaac gagggcaggt gaaggtgatg tcggttkggc cgtcttctac 60
agaagagacg ttctgcagaa ccatgtcaat 90
<210> 45
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 45
cgcgcggcgg ccgtcggaac gagggcaggt gaaggtgatg tcggtwtcgc cgtcttctac 60
agaagagacg ttctgcagaa ccatgtcaat 90
<210> 46
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 46
cgcgcggcgg ccgtcggaac gagggcaggt gaaggtgatg tcggtgcvgc cgtcttctac 60
agaagagacg ttctgcagaa ccatgtcaat 90
<210> 47
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 47
cgcgcggcgg ccgtcggaac gagggcaggt gaaggtgatg tcggtgacgc cgtcttctac 60
agaagagacg ttctgcagaa ccatgtcaat 90
<210> 48
<211> 90
<212> DNA
<213> Artificial Sequence
<400> 48
cgcgcggcgg ccgtcggaac gagggcaggt gaaggtgatg tcggtccagc cgtcttctac 60
agaagagacg ttctgcagaa ccatgtcaat 90
<210> 49
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 49
cggacgttga cggtgtgtat ac 22
<210> 50
<211> 23
<212> DNA
<213> Artificial Sequence
<400> 50
gcacggaaat acgaatctca gag 23

Claims (11)

1.一种多肽,所述多肽具有天冬氨酸激酶活性,其中,所述多肽为如下(c)-(e)中至少一组所示的突变的多肽:
(c)SEQ ID NO:1所示序列的第293位的氨基酸由异亮氨酸(I)突变为丝氨酸(S)、甘氨酸(G)、谷氨酸(E)、脯氨酸(P)、色氨酸(W)、酪氨酸(Y)、组氨酸(H)、蛋氨酸(M)、谷氨酰胺(Q)、半胱氨酸(C)或精氨酸(R);
(d)SEQ ID NO:1所示序列的第294位的氨基酸由天冬氨酸(D)突变为酪氨酸(Y)、色氨酸(W)或苯丙氨酸(F);
(e)SEQ ID NO:1所示序列的第307位的氨基酸由苏氨酸(T)突变为酪氨酸(Y)、甘氨酸(G)或苯丙氨酸(F)。
2.一种重组多肽,其中,所述重组多肽包括权利要求1所述的多肽,以及与所述多肽融合的外源多肽;其中,所述外源多肽包括标签多肽。
3.根据权利要求2所述的重组多肽,其中,所述外源多肽包括标签多肽,以及连接所述标签多肽与所述具有天冬氨酸激酶活的多肽的间隔多肽。
4.一种分离的多核苷酸,其中,所述多核苷酸为编码权利要求1所述多肽的核苷酸序列,或为编码权利要求2-3任一项所述重组多肽的核苷酸序列。
5.一种核酸构建体,其中,所述核酸构建体包含权利要求4所述的多核苷酸,所述多核苷酸与一个或多个调控序列可操作地连接,所述调控序列指导多肽在表达宿主中产生。
6.一种重组表达载体,其中,所述重组表达载体包含权利要求4所述的多核苷酸,或权利要求5所述的核酸构建体。
7.一种重组宿主细胞,其中,所述重组宿主细胞包含权利要求1所述的多肽、权利要求2-3任一项所述的重组多肽、权利要求4所述的多核苷酸、权利要求5所述的核酸构建体,或者权利要求6所述的重组表达载体。
8.根据权利要求7所述的重组宿主细胞,其中,所述宿主细胞来源于棒状杆菌属、短杆菌属、节杆菌属、微杆菌属或埃希氏菌属。
9.根据权利要求8所述的重组宿主细胞,其中,所述宿主细胞为谷氨酸棒杆菌或大肠杆菌。
10.权利要求1所述的多肽、权利要求2-3任一项所述的重组多肽、权利要求4所述的多核苷酸、权利要求5所述的核酸构建体、权利要求6所述的重组表达载体,或权利要求7-9任一项所述的重组宿主细胞在生产氨基酸中的应用;
所述氨基酸选自赖氨酸、苏氨酸、异亮氨酸及氨基酸衍生物,其中,所述氨基酸衍生物为戊二胺、5-氨基戊酸、戊二酸和羟基异亮氨酸的至少一种。
11.一种生产氨基酸的方法,其中,包括利用权利要求1所述的多肽、权利要求2-3任一项所述的重组多肽、权利要求4所述的多核苷酸、权利要求5所述的核酸构建体、权利要求6所述的重组表达载体,或权利要求7-9任一项所述的重组宿主细胞生产氨基酸的步骤;
所述氨基酸选自赖氨酸、苏氨酸、异亮氨酸及氨基酸衍生物,其中,所述氨基酸衍生物为戊二胺、5-氨基戊酸、戊二酸和羟基异亮氨酸的至少一种;
所述方法还包括纯化或分离所述氨基酸的步骤。
CN202011110184.9A 2020-10-16 2020-10-16 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用 Active CN113201514B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202011110184.9A CN113201514B (zh) 2020-10-16 2020-10-16 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用
PCT/CN2021/117492 WO2022078127A1 (zh) 2020-10-16 2021-09-09 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用
EP21879173.9A EP4230723A1 (en) 2020-10-16 2021-09-09 Polypeptide with aspartate kinase activity and use thereof in production of amino acid
US18/030,228 US20230332116A1 (en) 2020-10-16 2021-09-09 Polypeptide with aspartate kinase activity and use thereof in production of amino acid

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011110184.9A CN113201514B (zh) 2020-10-16 2020-10-16 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用

Publications (2)

Publication Number Publication Date
CN113201514A CN113201514A (zh) 2021-08-03
CN113201514B true CN113201514B (zh) 2022-09-06

Family

ID=77025056

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011110184.9A Active CN113201514B (zh) 2020-10-16 2020-10-16 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用

Country Status (4)

Country Link
US (1) US20230332116A1 (zh)
EP (1) EP4230723A1 (zh)
CN (1) CN113201514B (zh)
WO (1) WO2022078127A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115490761B (zh) 2021-11-01 2023-06-09 中国科学院天津工业生物技术研究所 基于赖氨酸外排蛋白构建的重组微生物及生产赖氨酸的方法

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK1394257T3 (da) 1992-03-19 2007-12-10 Du Pont Nukleinsyrefragmenter og fremgangsmåder til forögelse af lysin- og threonin-indholdet i fröene fra planter
US7160711B2 (en) 2001-08-06 2007-01-09 Degussa Ag Coryneform bacteria which produce chemical compounds I
CN103773745B (zh) * 2012-10-18 2018-03-23 中粮生物化学(安徽)股份有限公司 天冬氨酸激酶iii突变体及其宿主细胞和应用
CN104099308B (zh) * 2013-04-03 2019-05-31 上海凯赛生物技术研发中心有限公司 一种具有天冬氨酸激酶活性的多肽及其应用
CN106062176A (zh) * 2014-01-02 2016-10-26 特雷里斯公司 用于在氢营养微生物中生物制备氨基酸的组合物和方法
CN109295028B (zh) * 2018-11-05 2021-12-17 吉林农业大学 高酶活天冬氨酸激酶突变体、工程菌及该突变体的制备方法
CN112111469B (zh) * 2020-11-23 2021-02-26 中国科学院天津工业生物技术研究所 γ-谷氨酰激酶突变体及其应用

Also Published As

Publication number Publication date
CN113201514A (zh) 2021-08-03
US20230332116A1 (en) 2023-10-19
EP4230723A1 (en) 2023-08-23
WO2022078127A1 (zh) 2022-04-21

Similar Documents

Publication Publication Date Title
CN112111469B (zh) γ-谷氨酰激酶突变体及其应用
US8067210B2 (en) Method of producing lysine by culturing a host cell expressing a polynucleotide encoding a feedback resistant aspartokinase from corynebacterium
KR101511639B1 (ko) 재조합 미생물 및 이의 사용 방법
DK2491120T3 (en) Synthetic phytasevarianter
KR20150115009A (ko) 아코니트산수화 효소 유전자와(또는) 그 조절요소를 개조한 세균 발효를 통한 l-리신 생산방법
WO2012172822A1 (ja) 組換え微生物、当該組換え微生物を用いたアラニンの製造方法
CN113201514B (zh) 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用
KR20200086303A (ko) 숙주 세포에서의 향미 화합물 생산
KR20110102752A (ko) L-아미노산 생산능을 갖는 미생물 및 이를 이용하여 l-아미노산을 생산하는 방법
JP2019535271A (ja) L‐リジンを生産するコリネバクテリウム属微生物及びそれを用いたl‐リジンの生産方法
CN113956992B (zh) 一株耐受l-高丝氨酸的大肠杆菌及其应用
CN111662903B (zh) 对数期特异性启动子及其应用
KR20240053585A (ko) 카고 뉴클레오티드 서열을 전이시키기 위한 시스템 및 방법
JP4383984B2 (ja) L−スレオニンの生産方法
CN108410900B (zh) 无抗性植物乳杆菌锚定表达载体pLPSa及其制备方法
CN113736764A (zh) 一种包含氨肽酶Amp0279编码序列的重组质粒、重组谷氨酸棒状杆菌及应用
JP4551870B2 (ja) 酢酸菌の増殖促進機能に関与する遺伝子及びその使用
KR20150035917A (ko) L-쓰레오닌 생산 미생물 및 이를 이용한 l-쓰레오닌의 생산방법
RU2792116C2 (ru) Способ получения L-лизина модифицированием гена аконитазы и/или его регуляторных элементов
CN115612678A (zh) 谷氨酸脱氢酶突变体及其应用
CN115490761A (zh) 基于赖氨酸外排蛋白构建的重组微生物及生产赖氨酸的方法
JP2005046071A (ja) 酢酸耐性に関与する遺伝子
JP2005040098A (ja) 酢酸耐性に関与する遺伝子
JPH07111894A (ja) L−アラニンの製造法、ならびにそれに用いる組換え体dnaおよび該dnaで形質転換されたコリネ型細菌

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant