CN113956992B - 一株耐受l-高丝氨酸的大肠杆菌及其应用 - Google Patents

一株耐受l-高丝氨酸的大肠杆菌及其应用 Download PDF

Info

Publication number
CN113956992B
CN113956992B CN202110290555.4A CN202110290555A CN113956992B CN 113956992 B CN113956992 B CN 113956992B CN 202110290555 A CN202110290555 A CN 202110290555A CN 113956992 B CN113956992 B CN 113956992B
Authority
CN
China
Prior art keywords
gene
homoserine
bacterium
aspc
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110290555.4A
Other languages
English (en)
Other versions
CN113956992A (zh
Inventor
牟庆璇
毛贤军
陶勇
于波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Microbiology of CAS
Original Assignee
Institute of Microbiology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Microbiology of CAS filed Critical Institute of Microbiology of CAS
Priority to CN202110290555.4A priority Critical patent/CN113956992B/zh
Publication of CN113956992A publication Critical patent/CN113956992A/zh
Application granted granted Critical
Publication of CN113956992B publication Critical patent/CN113956992B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/24Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
    • C07K14/245Escherichia (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0014Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4)
    • C12N9/0016Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on the CH-NH2 group of donors (1.4) with NAD or NADP as acceptor (1.4.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/06Alanine; Leucine; Isoleucine; Serine; Homoserine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y104/00Oxidoreductases acting on the CH-NH2 group of donors (1.4)
    • C12Y104/01Oxidoreductases acting on the CH-NH2 group of donors (1.4) with NAD+ or NADP+ as acceptor (1.4.1)
    • C12Y104/01002Glutamate dehydrogenase (1.4.1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/01Oxidoreductases acting on NADH or NADPH (1.6) with NAD+ or NADP+ as acceptor (1.6.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/01Oxidoreductases acting on NADH or NADPH (1.6) with NAD+ or NADP+ as acceptor (1.6.1)
    • C12Y106/01002NAD(P)+ Transhydrogenase (AB-specific) (1.6.1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y203/00Acyltransferases (2.3)
    • C12Y203/01Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • C12Y203/01046Homoserine O-succinyltransferase (2.3.1.46)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)
    • C12Y206/01021D-Amino-acid transaminase (2.6.1.21), i.e. D-alanine aminotransferase/transaminase or D-aspartic aminotransferase/transaminase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y207/00Transferases transferring phosphorus-containing groups (2.7)
    • C12Y207/01Phosphotransferases with an alcohol group as acceptor (2.7.1)
    • C12Y207/01039Homoserine kinase (2.7.1.39)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/0102Diaminopimelate decarboxylase (4.1.1.20)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01031Phosphoenolpyruvate carboxylase (4.1.1.31)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y403/00Carbon-nitrogen lyases (4.3)
    • C12Y403/01Ammonia-lyases (4.3.1)
    • C12Y403/01001Aspartate ammonia-lyase (4.3.1.1), i.e. aspartase
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一株耐受L‑高丝氨酸的大肠杆菌及其应用。本发明提供的耐受L‑高丝氨酸的大肠杆菌为大肠杆菌HS02CGMCC No.21837。本发明还提供了一种重组菌,是通过改造底盘宿主菌中的两条代谢途径,使两者代谢通量1:1匹配后得到的重组菌;两代谢途径为:从草酰乙酸合成天冬氨酸再到L‑高丝氨酸;从富马酸合成天冬氨酸再到L‑高丝氨酸;所述底盘宿主菌为在具有L‑高丝氨酸耐受性且具有天冬氨酸到苏氨酸通路的出发细菌中进行降低lacI、metA、lysA、thrB、sthA和iclR的活性或其编码基因的表达量,并提高ppc和pntAB的活性或其编码基因的表达量后得到的菌。本发明所获得的L‑高丝氨酸高水平发酵工程菌株,其L‑高丝氨酸的发酵强度可高达2.10g/L/h。

Description

一株耐受L-高丝氨酸的大肠杆菌及其应用
技术领域
本发明涉及生物技术领域,特别涉及一株耐受L-高丝氨酸的大肠杆菌及其应用。
背景技术
L-高丝氨酸是非蛋白原性氨基酸,是重要的L-天冬氨酸族衍生的必需氨基酸(如L-蛋氨酸、L-苏氨酸和L-异亮氨酸)的合成前体。L-高丝氨酸已经在食品、医药、化妆品、农业和动物饲料工业方面显示出巨大的潜在应用前景。此外,L-高丝氨酸是一种很有前途的平台化合物,可以用来生产如O-乙酰高丝氨酸、邻琥珀酰-L-高丝氨酸、1,3-丙二醇、异丁醇和γ-丁内酯等精细化学品。因此,它引起了人们极大的兴趣,市场需求不断增加。目前,L-高丝氨酸的主要生产方法主要有三种:化学法、酶催化和微生物发酵。微生物发酵法因其成本低、条件温和、绿色环保等优点越来越受到重视。目前有文章报道的微生物发酵法,主要使用的宿主是大肠杆菌和谷氨酸棒杆菌。
通过敲除代谢竞争途径,改变代谢通量,谷氨酸棒杆菌可以生产8.8g/L L-高丝氨酸(Li N,Xu S,Du G,et al.Efficient production ofL-homoserine inCorynebacterium glutamicumATCC13032by redistribution ofmetabolicflux.Biochemical Engineering Journal,2020,161:107665)。利用大肠杆菌作为宿主生产L-高丝氨酸的文献报道较多,基于细胞内天冬氨酸的合成途径,经过发酵优化,文献报道的L-高丝氨酸产量在48h达到60.1g/L,发酵强度1.25g/L/h(Zhang Y,Wei M,Zhao G,etal.High-level production of L-homoserine using a non-induced,non-auxotrophic Escherichia coli chassisthrough metabolic engineering,BioresourceTechnology,2021,doi:https://doi.org/10.1016/j.biortech.2021.124814),这是目前文献报道的最高产量和发酵强度。现有报道存在转化率低,高丝氨酸耐受差,产量不够高,不利于规模化低成本生产等等缺点。
发明内容
本发明的目的是提供一株耐受L-高丝氨酸且能够高产L-高丝氨酸的大肠杆菌及其应用。
第一方面,本发明要求保护一株耐受L-高丝氨酸的大肠杆菌。
本发明要求保护的耐受L-高丝氨酸的大肠杆菌具体为大肠杆菌HS02。所述大肠杆菌HS02为以大肠杆菌BW25113作为出发菌株,经过ARTP诱变传代培养,筛选得到的能够耐受高浓度L-高丝氨酸生长的菌株,其在中国微生物菌种保藏管理委员会普通微生物中心的保藏号为CGMCC No.21837。
第二方面,本发明要求保护一种重组菌。
本发明所要求保护的重组菌是通过改造底盘宿主菌中的代谢途径1和代谢途径2,使两条代谢途径的代谢通量(0.8-1.2):1(优选1:1)匹配后得到的重组菌。
所述代谢途径1为:从草酰乙酸合成天冬氨酸,再经天冬氨酸合成L-高丝氨酸;
所述代谢途径2为:从富马酸合成天冬氨酸,再经天冬氨酸合成L-高丝氨酸。
所述底盘宿主菌为在具有L-高丝氨酸耐受性且具有天冬氨酸到苏氨酸通路的出发细菌中进行如下a1)-a8)所示全部改造(其他基因不变)后得到的菌:
a1)降低所述出发细菌中DNA结合转录抑制因子lacI的活性或其编码基因的表达量;
a2)降低所述出发细菌中高丝氨酸琥珀酰转移酶metA的活性或其编码基因的表达量;
a3)降低所述出发细菌中二氨基庚酸脱羧酶lysA的活性或其编码基因的表达量;
a4)降低所述出发细菌中的高丝氨酸激酶thrB的活性或其编码基因的表达量;
a5)降低所述出发细菌中的可溶性吡啶核苷酸转移酶sthA的活性或其编码基因的表达量;
a6)提高所述出发细菌中磷酸烯醇式丙酮酸羧化酶ppc的活性或其编码基因的表达量;
a7)提高所述出发细菌中吡啶核苷酸转移酶pntAB的活性或其编码基因的表达量;
a8)降低所述出发细菌中的乙醛酸途径抑制蛋白iclR的活性或其编码基因的表达量。
在本发明的具体实施方式中,所述a1)具体为敲除所述出发细菌中的所述DNA结合转录抑制因子lacI的编码基因(简称lacI基因);所述a2)具体为敲除所述出发细菌中的所述高丝氨酸琥珀酰转移酶metA的编码基因(简称metA基因);所述a3)具体为敲除所述出发细菌中的所述二氨基庚酸脱羧酶lysA的编码基因(简称lysA基因);所述a4)具体为敲除所述出发细菌中的所述高丝氨酸激酶thrB的编码基因(简称thrB基因);所述a5)具体为敲除所述可溶性吡啶核苷酸转移酶sthA的编码基因(简称sthA基因);所述a6)具体为向所述出发细菌中导入所述磷酸烯醇式丙酮酸羧化酶ppc的编码基因(简称ppc基因);所述a7)具体为向所述出发细菌中导入所述吡啶核苷酸转移酶pntAB的编码基因(简称pntAB基因);所述a8)具体为敲除所述出发细菌中的所述乙醛酸途径抑制蛋白iclR的编码基因(简称iclR基因)。
在本发明的具体实施方式中,所述底盘宿主菌为敲除所述出发细菌基因组中的lacI基因、metA基因、lysA基因、iclR基因,且将thrB基因替换为Trc-ppc(由Trc启动子启动表达的ppc基因),且将sthA基因替换为Trc-pntAB(由Trc启动子启动表达的pntAB基因),其他基因序列不变,得到的菌。
其中,所述DNA结合转录抑制因子lacI的氨基酸序列为(genbank号及提交日NP_414879.3,提交日20181011),对应的编码基因序列为Gene ID:945007。所述高丝氨酸琥珀酰转移酶metA的氨基酸序列为(genbank号及提交日AAC76983.1,20180924),对应的编码基因序列为Gene ID:948513。所述二氨基庚酸脱羧酶lysA的氨基酸序列为(genbank号及提交日NP_417315.1,20181011),对应的编码基因序列为Gene ID:947313。所述高丝氨酸激酶thrB的氨基酸序列为(genbank号及提交日:NP_414544.1,20181011),对应的编码基因序列为Gene ID:947498。所述可溶性吡啶核苷酸转移酶sthA的氨基酸序列为(genbank号及提交日NP_418397.2;20181011),对应的编码基因序列为Gene ID:948461。所述磷酸烯醇式丙酮酸羧化酶ppc的氨基酸序列为与SEQ ID No.2编码的氨基酸序列相同,对应的编码基因序列为SEQ ID No.2。所述吡啶核苷酸转移酶pntAB的氨基酸序列为与SEQ ID No.6编码的氨基酸序列相同,对应的编码基因序列为SEQ ID No.6。所述的乙醛酸途径抑制蛋白iclR的氨基酸序列为(genbank号及提交日NP_418442.2,20181011),对应的编码基因序列为Gene ID:948524。
在本发明中,所述重组菌是通过对前文所述底盘宿主菌进行如下b1)和b2)中至少b2)所示改造(其他基因不变)后实现:
b1)加强所述底盘宿主菌中的天冬氨酸到高丝氨酸代谢途径;
b2)向所述底盘宿主菌中导入天冬氨酸氨基裂解酶aspA的编码基因(简称aspA基因),以及天冬氨酸氨基转移酶aspC的编码基因(简称aspC基因)和谷氨酸脱氢酶gdhA的编码基因(简称gdhA基因);并使所述天冬氨酸氨基裂解酶aspA的编码基因在强度为2800AU的RBS序列的调控下进行表达,使所述天冬氨酸氨基转移酶aspC的编码基因在强度为3600AU的RBS序列的调控下进行表达,使所述谷氨酸脱氢酶gdhA的编码基因在强度为1000AU的RBS序列的调控下进行表达。
其中,aspA用于加强富马酸到天冬氨酸代谢途径;aspC和gdhA用于加强草酰乙酸到天冬氨酸代谢途径。
所述天冬氨酸氨基裂解酶aspA的氨基酸序列为与SEQ ID No.16编码的氨基酸序列相同,对应的编码基因序列为SEQ ID No.16。所述天冬氨酸氨基转移酶aspC的氨基酸序列为与SEQ ID No.12编码的氨基酸序列相同,对应的编码基因序列为SEQ ID No.12。所述谷氨酸脱氢酶gdhA的氨基酸序列为与SEQ ID No.13编码的氨基酸序列相同,对应的编码基因序列为SEQ ID No.13。
更进一步地,在b1)中,所述加强天冬氨酸到高丝氨酸代谢途径可通过如下实现的:1)提高所述底盘宿主菌中天冬氨酸激酶I突变体thrA*的活性或其编码基因的表达量;和/或,2)提高所述底盘宿主菌中天冬氨酸半醛脱氢酶asd的活性或其编码基因的表达量(其他基因不变)。
在本发明的具体实施方式中,所述1)具体为向所述底盘宿主菌中导入所述天冬氨酸激酶I突变体thrA*的编码基因(简称thrA*基因);所述2)具体为向所述底盘宿主菌中导入所述天冬氨酸半醛脱氢酶asd的编码基因(简称asd基因)。
所述天冬氨酸激酶I突变体thrA*的氨基酸序列为与SEQ ID No.10编码的氨基酸序列相同,对应的编码基因序列为SEQ ID No.10。所述天冬氨酸半醛脱氢酶asd的氨基酸序列为与SEQ ID No.11编码的氨基酸序列相同,对应的编码基因序列为SEQ ID No.11。
在本发明的具体实施方式中,用于调控所述天冬氨酸氨基裂解酶aspA的编码基因表达的强度为2800AU的RBS序列为SEQ ID No.17。
在本发明的具体实施方式中,用于调控所述天冬氨酸氨基转移酶aspC的编码基因表达的强度为3600AU的RBS序列为SEQ ID No.18。
在本发明的具体实施方式中,用于调控所述谷氨酸脱氢酶gdhA的编码基因表达的强度为1000AU的RBS序列为SEQ ID No.19。
在本发明的具体实施方式中,所述thrA*基因、所述asd基因和所述aspA基因是以串联的方式由Trc启动子启动表达的。进一步地,自上游到下游的连接顺序为Trc启动子-thrA*基因-asd基因-aspA基因。所述aspC基因和所述gdhA基因是以串联的方式由Trc启动子启动表达的。进一步地,自上游到下游的连接顺序为Trc启动子-aspC基因-gdhA基因。
在本发明中,所述Trc启动子的核苷酸序列为SEQ ID No.21。
在本发明中,通过前文所述b2)使所述代谢途径1和所述代谢途径2的代谢通量达(0.8-1.2):1(如1:1)。
在所述重组菌中,各基因的导入均是通过导入表达各自基因的质粒实现的。所述敲除或所述替换均是通过Crispr/cas9技术实现的。
在本发明的具体实施方式中,用于敲除所述出发细菌基因组中的lacI基因的打靶片段的序列如SEQ ID No.1所示。用于将所述出发细菌基因组中thrB基因替换为Trc-ppc的打靶片段的序列如SEQ ID No.3所示。用于敲除所述出发细菌基因组中metA基因的打靶片段的序列如SEQ ID No.4所示。用于敲除所述出发细菌基因组中lysA基因的打靶片段的序列如SEQ ID No.5所示。用于将所述出发细菌基因组中sthA基因替换为Trc-pntAB的打靶片段的序列如SEQ ID No.7所示。用于敲除所述出发细菌基因组中iclR基因的打靶片段的序列如SEQ ID No.20所示。
在所述重组菌中,所述出发细菌可为大肠杆菌、谷氨酸棒杆菌、芽孢杆菌或假单胞菌。
在本发明的具体实施方式中,所述出发细菌具体为前文第一方面所述的大肠杆菌HS02。
第三方面,本发明要求保护前文所述的底盘宿主菌。
第四方面,本发明要求保护一种制备重组菌的方法。
本发明要求保护的制备重组菌的方法,可包括:按照前文第一方面中的方式对所述底盘宿主菌进行改造,得到所述重组菌。
第五方面,本发明要求保护一种制备前文所述的底盘宿主菌的方法。
本发明要求保护的制备前文所述的底盘宿主菌的方法,可包括:按照前文第一方面中的a1)-a8)对所述出发细菌进行改造,得到所述底盘宿主菌。
第六方面,本发明要求保护如下任一应用:
Q1、前文第一方面所述的重组菌在生产高丝氨酸中的应用;
Q2、前文第二方面所述的大肠杆菌HS02在制备前文第三方面所述底盘细菌中的应用;
Q3、前文第二方面所述的大肠杆菌HS02或前文第三方面所述底盘细菌在制备前文第一方面所述的重组菌中的应用。
第七方面,本发明要求保护一种生产高丝氨酸的方法。
本发明要求保护的生产高丝氨酸的方法,可包括如下步骤:发酵前文第一方面中所述的重组菌,得到高丝氨酸。
上述发酵采用的培养基为无机盐发酵培养基,无机盐发酵培养基配方如下:1.7g/L柠檬酸,14g/L磷酸二氢钾,4g/L磷酸氢二铵,2g/L酵母提取物,初始葡萄糖20g/L,硫酸镁0.6g/L,余量为水,pH为7.0。
上述发酵方式为:发酵过程中维持溶氧含量在30%左右,调节pH7.0,补料过程中葡萄糖含量控制在1g/L-0.5g/L之间;30℃条件下发酵43h。
葡萄糖含量低于0.5g/L时,开始流加600g/L葡萄糖溶液。葡萄糖溶液配方:600g/L葡萄糖、1g/L赖氨酸、0.3g/L蛋氨酸、0.5g/L苏氨酸和2g/L硫酸镁,余量为水。
本发明获得了L-高丝氨酸高效发酵的大肠杆菌工程菌株。首先,由于L-高丝氨酸对于细胞生长有毒性,会影响菌体的生长(Kotre AM,Sullivan SJ,SavageauMA.Metabolic regulation by homoserine in Escherichia coli B-r.Journal ofBacteriology,1973,116:663-672)。以大肠杆菌BW25113作为出发菌株,经过ARTP诱变传代培养,筛选到能够耐受高浓度L-高丝氨酸生长的菌株HS02;在HS02菌株基础上开展系统代谢工程改造,整合大肠杆菌中生产L-高丝氨酸的2条途径,并优化两条途径的代谢通路配比,获得L-高丝氨酸高水平发酵工程菌株,工程菌株L-高丝氨酸的发酵强度达到2.10g/L/h(未经发酵工艺优化),远高于现有报道。
保藏说明
建议的分类命名:大肠埃希氏菌(Escherichia coli)
参椐的生物材料(株):HS02
保藏机构:中国微生物菌种保藏管理委员会普通微生物中心
保藏机构简称:CGMCC
地址:北京市朝阳区北辰西路1号院3号
保藏日期:2021年2月26日
保藏中心登记入册编号:CGMCC No.21837
附图说明
图1为比较BW25113和HS02在不同浓度L-高丝氨酸存在生长情况。
图2为L-高丝氨酸检测图示例。
图3为比较不同RBS强度时L-高丝氨酸的生产能力。
图4为HS03/pTRC99A-thrA*-asd-aspA-RBS2800-trc-aspC-gdhA菌株的L-高丝氨酸发酵曲线
具体实施方式
大肠杆菌胞内存在两条途径生成天冬氨酸,然后进一步合成L-高丝氨酸。1.从草酰乙酸合成天冬氨酸,再经天冬氨酸合成L-高丝氨酸,该途径的L-高丝氨酸理论转化率达到2mol/mol葡萄糖,但缺少4个NADPH的还原力;2.从富马酸合成天冬氨酸,再经天冬氨酸合成L-高丝氨酸,该途径的L-高丝氨酸理论转化率只有1mol/mol葡萄糖,但产生4个富余的NADH还原力。整合上述2条途径,使两条途径的代谢通量接近1:1,理论转化率为1.5mol/mol葡萄糖,虽然理论转化率不如单独从草酰乙酸合成途径,但还原力整体平衡,可实现L-高丝氨酸的高强度发酵。
本发明基于上述改造思路,获得了L-高丝氨酸高效发酵的大肠杆菌工程菌株。首先,由于L-高丝氨酸对于细胞生长有毒性,会影响菌体的生长(Kotre AM,Sullivan SJ,Savageau MA.Metabolic regulation by homoserine in Escherichia coli B-r.Journal of Bacteriology,1973,116:663-672)。以大肠杆菌BW25113作为出发菌株,经过ARTP诱变传代培养,筛选到能够耐受高浓度L-高丝氨酸生长的菌株;以该菌株为底盘细胞,开展系统代谢工程改造,整合上述2条途径,并优化两条途径的代谢通路配比,获得L-高丝氨酸高水平发酵工程菌株,工程菌株L-高丝氨酸的发酵强度达到2.10g/L/h(未经发酵工艺优化)。
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
下述实施例中所涉及的引物如表1所示。
表1、本发明中引物设计
实施例1、ARTP诱变提高大肠杆菌对L-高丝氨酸的耐受
一、ARTP诱变
L-高丝氨酸对于细胞生长有毒性,在进行无机盐发酵时,高浓度的L-高丝氨酸会导致生物量无法进一步提高,从而限制产物的产量。通过ARTP诱变的方法,提高大肠杆菌BW25113对高浓度L-高丝氨酸的耐受程度。
将培养12h的BW25113菌液,均匀涂布在无菌载玻片上,采用ARTP照射时,照射时间分别是30s、60s、90s、120s、150s。照射完后将载玻片放入1mL的无菌生理盐水中,进行震荡、洗脱,取100微升液体进行稀释涂布在不同的培养皿上。37℃培养3天后,挑取单克隆在含有40g/L的L-高丝氨酸培养皿上进行划线,经过多次传代后,得到一株在高浓度L-高丝氨酸条件下生长迅速的菌株,该菌株记作HS02。
菌株HS02已经于2021年2月26日保藏于中国微生物菌种保藏管理委员会普通微生物中心,其保藏号为CGMCC No.21837。
二、测定生长曲线
将生长12h的BW25113和HS02菌液,按照1%(体积百分比)的接种量,转接于含有0g/L、10g/L、20g/L、40g/L、80g/L的L-高丝氨酸的LB液体培养基中,在24h取样测定OD600。与BW25113相比,在20g/L的L-高丝氨酸条件下,HS02菌株的生长速度提高一倍(图1)。
实施例2、底盘菌株HS03的构建
利用Crispr/cas9技术对HS02 CGMCC No.21837染色体上基因敲除、替换或者插入,底盘菌株HS03的构建主要包括:敲除苏氨酸代谢通路高丝氨酸激酶thrB、敲除蛋氨酸代谢旁路高丝氨酸琥珀酰转移酶metA、敲除赖氨酸代谢旁路二氨基庚酸脱羧酶lysA、敲除DNA结合转录抑制因子lacI、敲除乙醛酸途径抑制蛋白iclR,过表达磷酸烯醇式丙酮酸羧化酶ppc,敲除可溶性吡啶核苷酸转移酶sthA,过表达吡啶核苷酸转移酶pntAB,具体如下:
下述实施例中的pCas、pTargetF质粒记载在如下参考文献“Multigene Editingin the Escherichia coli Genome via the CRISPR-Cas9 System;AppliedEnvironmental Microbiology.2015,81(7):2506-2514”。
BW25113菌株为实验室保存的商业模式菌;pTRC99A质粒为实验室保存的商业质粒。
一、敲除DNA结合转录抑制因子lacI(NP_414879.3,提交日20181011)
1、HS02/pCas的构建
将pCas质粒(卡那霉素抗性)导入HS02中,因pCas质粒是温度敏感型质粒,30℃培养15h,筛选得到阳性克隆子HS02/pCas。
2、lacI基因敲除gRNA质粒
以pTargetF为模板,pTargetF-lacI-F/R为引物,进行PCR扩增,得到2118bp含有lacI基因识别N20的质粒,经测序验证正确后命名为pTargetF-lacI,该质粒中含有lacI基因gRNA的编码基因,N20的核苷酸序列为CCGCTTGCTGCAACTCTCTC。
以BW25113基因组DNA为模板,lacI-up-F/R和lacI-down-F/R引物扩增,分别得到538bp lacI位点上游同源臂和524bp lacI位点下游同源臂;再以上下游同源臂为模板进行overlap PCR,PCR程序如下:98℃5min,98℃30s,55℃30s,72℃1min,72℃10min,16℃10min,30个循环数,扩增获得1062bp含有lacI基因上下游同源臂的打靶片段(SEQ IDNo.1)。
将HS02/pCas在30℃培养3h,利用10%(V/V)甘油清洗3次,2.5kv条件下将pTargetF-lacI质粒(链霉素抗性)和含有lacI基因上下游同源臂的打靶片段(SEQ IDNo.1)电转入其中,利用卡那霉素和链霉素双抗性筛选,PCR验证获得基因敲除阳性克隆,引物为lacI-up-F和lacI-down-R,得到1062bp的为阳性克隆HS02/pCasΔlacI;将该克隆子在42℃下培养5h,在LB无抗平板上进行划线,将生长出的克隆子在LB无抗和卡那霉素抗性平板上进行对照验证,确认pCas质粒消除。得到菌株HS02/ΔlacI。
二、ΔthrB::Trc-ppc(thrB的genbank号及提交日:NP_414544.1,20181011)
1、Trc-ppc的制备
以商业化质粒pTRC99A(博迈德基因技术有限公司)过表达磷酸烯醇式丙酮酸羧化酶ppc,具体方法为:
以NcoI和HindIII对pTRC99A进行双酶切,得到4120bp的pTRC99A的酶切产物。
以谷氨酸棒杆菌(CGMCC No.1.841)基因组DNA为模板,用ppc-F和ppc-R扩增,获得2760bp的基因ppc片段(SEQ ID No.2)。
上述PCR程序如下:98℃5min,98℃30s,55℃30s,72℃2min,72℃10min,16℃10min,30个循环数。
将扩增获得ppc片段(SEQ ID No.2)同样进行NcoI和HindIII双酶切,酶切结束后进行回收,将ppc片段的酶切产物与pTRC99A的酶切产物连接,并经测序验证正确后得到重组质粒pTRC99A-ppc。
2、ΔthrB::Trc-ppc
以pTargetF为模板,pTargetF-thrB-F/R为引物,进行PCR扩增,得到2118bp含有thrB基因识别N20的质粒,经测序验证正确后命名为pTargetF-thrB,该质粒中含有thrB基因gRNA的编码基因,N20核苷酸序列为GCGCACGGGCGACATCTGGC。
以BW25113基因组DNA为模板,分别用thrB-up-F/R、thrB-down-F/R引物扩增,分别得到515bp thrB位点上游同源臂和510bp thrB位点下游同源臂;以重组质粒pTRC99A-ppc为模板,用引物Trc-ppc-F/R进行PCR扩增,得到3173bp Trc-ppc表达阅读框;再以3个片段为模板进行overlap PCR,PCR程序如下:98℃5min,98℃30s,55℃30s,72℃1min,72℃10min,16℃10min,30个循环数,扩增获得4198bp含有thrB上游-Trc-ppc-thrB下游的打靶片段(SEQ ID No.3)。
将上述一得到的HS02/pCasΔlacI在30℃培养3h,利用10%(V/V)甘油清洗3次,2.5kv条件下将pTargetF-thrB质粒(链霉素抗性)和含有thrB上游-Trc-ppc-thrB下游的打靶片段(SEQ ID No.3)电转入其中,利用卡那霉素和链霉素双抗性筛选,PCR验证获得基因替换阳性克隆,引物为thrB-up-F、thrB-down-R,得到4198bp的为阳性克隆HS02/pCasΔlacIΔthrB::Trc-ppc。将该克隆子在42℃下培养5h,在LB无抗平板上进行划线,将生长出的克隆子在LB无抗和卡那霉素抗性平板上进行对照验证,确认pCas质粒消除,得到菌株HS02/ΔlacIΔthrB::Trc-ppc。
三、ΔmetA(genbank号及提交日AAC76983.1,20180924)
以pTargetF为模板,pTargetF-metA-F/R为引物,进行PCR扩增,得到2118bp含有metA基因识别N20的质粒,经测序验证正确后命名为pTargetF-metA,该质粒中含有metA基因gRNA的编码基因,N20核苷酸序列为GTATTTTGCGGATCATTGTG。
以BW25113基因组DNA为模板,metA-up-F/R和metA-down-F/R引物扩增,分别得到553bp metA位点上游同源臂和561bp metA位点下游同源臂;再以上下游同源臂为模板进行overlap PCR,PCR程序如下:98℃5min,98℃30s,55℃30s,72℃1min,72℃10min,16℃10min,30个循环数,扩增获得1114bp含有metA基因上下游同源臂的打靶片段(SEQ IDNo.4)。
将上述二得到的HS02/pCasΔlacIΔthrB::Trc-ppc在30℃培养3h,利用10%(V/V)甘油清洗3次,2.5kv条件下将pTargetF-metA质粒(链霉素抗性)、含有metA基因上下游同源臂的打靶片段(SEQ ID No.4)电转入其中,利用卡那霉素和链霉素双抗性筛选,PCR验证获得基因敲除阳性克隆,引物为metA-up-F和metA-down-R,得到1114bp的为阳性克隆HS02/pCasΔlacIΔthrB::Trc-ppcΔmetA。将该克隆子在42℃下培养5h,在LB无抗平板上进行划线,将生长出的克隆子在LB无抗和卡那霉素抗性平板上进行对照验证,确认pCas质粒消除,得到菌株HS02/ΔlacIΔthrB::Trc-ppcΔmetA。
四、ΔlysA(genbank号及提交日NP_417315.1,20181011)
以pTargetF为模板,pTargetF-lysA-F/R为引物,进行PCR扩增,得到2118bp含有lysA基因识别N20的质粒,经测序验证正确后命名为pTargetF-lysA,该质粒中含有lysA基因gRNA的编码基因,N20核苷酸序列为AGGCTATTTCTGCGGGCGGT。
以BW25113基因组DNA为模板,lysA-up-F/R和lysA-down-F/R引物扩增,分别得到516bp lysA位点上游同源臂和543bp lysA位点下游同源臂;再以上下游同源臂为模板进行overlap PCR,PCR程序如下:98℃5min,98℃30s,55℃30s,72℃1min,72℃10min,16℃10min,30个循环数,扩增获得1059bp含有lysA基因上下游同源臂的打靶片段(SEQ IDNo.5)。
将上述三得到的HS02/pCasΔlacIΔthrB::Trc-ppcΔmetA在30℃培养3h,利用10%(V/V)甘油清洗3次,2.5kv条件下将pTargetF-lysA质粒(链霉素抗性)、含有lysA基因上下游同源臂的打靶片段(SEQ ID No.5)电转入其中,利用卡那霉素和链霉素双抗性筛选,PCR验证获得基因敲除或者插入阳性克隆,引物为lysA-up-F和lysA-down-R,得到1059bp的为阳性克隆HS02/pCasΔlacIΔthrB::Trc-ppcΔmetAΔlysA;将该克隆子在42℃下培养5h,在LB无抗平板上进行划线,将生长出的克隆子在LB无抗和卡那霉素抗性平板上进行对照验证,确认pCas质粒消除,得到菌株HS02/ΔlacIΔthrB::Trc-ppcΔmetAΔlysA。
五、ΔsthA::Trc-pntAB(sthA的genbank号及提交日NP_418397.2;20181011)
1、Trc-pntAB的制备
以商业化质粒pTRC99A(博迈德基因技术有限公司)过表达吡啶核苷酸转移酶pntAB,具体方法为:
以NcoI和HindIII对pTRC99A进行双酶切,得到4120bp的pTRC99A的酶切产物。
以大肠杆菌BW25113基因组DNA为模板,用:pntAB-F和pntAB-R扩增,获得2932bp的基因pntAB片段(SEQ ID No.6)。
上述PCR程序如下:98℃5min,98℃30s,55℃30s,72℃2min,72℃10min,16℃10min,30个循环数。
将扩增获得pntAB片段(SEQ ID No.6)同样进行NcoI和HindIII双酶切,酶切结束后进行回收,将pntAB片段的酶切产物与pTRC99A的酶切产物连接,并经测序验证正确后得到重组质粒pTRC99A-pntAB。
2、ΔsthA::Trc-pntAB
以pTargetF为模板,pTargetF-sthA-F/R为引物,进行PCR扩增,得到2118bp含有thrB基因识别N20的质粒,经测序验证正确后命名为pTargetF-sthA,该质粒中含有sthA基因gRNA的编码基因,N20核苷酸序列为GCCACTGTTCCAGAAGTGAT。
以BW25113基因组DNA为模板,分别用sthA-up-F/R、sthA-down-F/R引物扩增,分别得到1186bp sthA位点上游同源臂和1218bp sthA位点下游同源臂;以重组质粒pTRC99A-pntAB为模板,用引物Trc-pntAB-F/R进行PCR扩增,得到3345bp Trc-pntAB表达阅读框;再以3个片段为模板进行overlap PCR,PCR程序如下:98℃5min,98℃30s,55℃30s,72℃1min,72℃10min,16℃10min,30个循环数,扩增获得5749bp含有sthA上游-Trc-pntAB-sthA下游的打靶片段(SEQ ID No.7)。
将上述四得到的HS02/pCasΔlacIΔthrB::Trc-ppcΔmetAΔlysA在30℃培养3h,利用10%(V/V)甘油清洗3次,2.5kv条件下将pTargetF-sthA质粒(链霉素抗性)和含有sthA上游-Trc-pntAB-sthA下游的打靶片段(SEQ ID No.7)电转入其中,利用卡那霉素和链霉素双抗性筛选,PCR验证获得基因敲除或者插入阳性克隆,引物为sthA-up-F、sthA-down-R,得到5749bp的为阳性克隆HS02/pCasΔlacIΔthrB::Trc-ppcΔmetAΔlysA ΔsthA::Trc-pntAB,将该克隆子在42℃下培养5h,在LB无抗平板上进行划线,将生长出的克隆子在LB无抗和卡那霉素抗性平板上进行对照验证,确认pCas质粒消除。得到菌株HS02/ΔlacIΔthrB::Trc-ppcΔmetAΔlysAΔsthA::Trc-pntAB命名为HS03。
六、ΔiclR(genbank号及提交日NP_418442.2,20181011)
以pTargetF为模板,pTargetF-iclR-F/R为引物,进行PCR扩增,得到2118bp含有iclR基因识别N20的质粒,命名为pTargetF-iclR,该质粒中含有iclR基因gRNA的编码基因,N20核苷酸序列为GTTAAAGGAGAAAACCATGA。
以BW25113基因组DNA为模板,iclR-up-F/R和iclR-down-F/R引物扩增,分别得到539bp iclR位点上游同源臂和529bp iclR位点下游同源臂;再以上下游同源臂为模板进行overlap PCR,PCR程序如下:98℃5min,98℃30s,55℃30s,72℃1min,72℃10min,16℃10min,30个循环数,扩增获得1068bp含有iclR基因上下游同源臂的打靶片段(SEQ IDNo.20)。
将上述五种得到的HS02/pCasΔlacIΔthrB::Trc-ppcΔmetAΔlysAΔsthA::Trc-pntAB在30℃培养3h,利用10%(V/V)甘油清洗3次,2.5kv条件下将pTargetF-iclR质粒(链霉素抗性)、含有iclR基因上下游同源臂的打靶片段(SEQ ID No.20)电转入其中,利用卡那霉素和链霉素双抗性筛选,PCR验证获得基因敲除或者插入阳性克隆,引物为iclR-up-F和iclR-down-R,得到1068bp的为阳性克隆HS02/pCasΔlacIΔthrB::Trc-ppcΔmetAΔlysAΔsthA::Trc-pntAB△iclR。将该克隆子在42℃下培养5h,在LB无抗平板上进行划线,将生长出的克隆子在LB无抗和卡那霉素抗性平板上进行对照验证,确认pCas质粒消除。得到菌株HS02/ΔlacIΔthrB::Trc-ppcΔmetAΔlysAΔsthA::Trc-pntAB△iclR,该重组菌记作HS03。
HS03为敲除HS02基因组中的lacI、metA、lysA、iclR,且将thrB基因替换为Trc-ppc,且将sthA基因替换为Trc-pntAB,其他基因序列不变,得到的重组菌。
实施例3、从草酰乙酸到天冬氨酸途径合成L-高丝氨酸菌株的构建
一、HS03菌株基础上敲除丙酮酸激酶IpykF(GeneBANK:QKN73339.1,提交日20200710)
将pCas质粒(卡那霉素抗性)导入HS03中,因pCas质粒是温度敏感型质粒,30℃培养15h,筛选得到阳性克隆子HS03/pCas。
以pTargetF为模板,pTargetF-pykF-F/R为引物,进行PCR扩增,得到2118bp含有pykF基因识别N20的质粒,经测序验证正确后命名为pTargetF-pykF,该质粒中含有pykF基因gRNA的编码基因,N20的核苷酸序列为CGAAGCCTCTGACGGCATCA。
以BW25113基因组DNA为模板,pykF-up-F/R和pykF-down-F/R引物扩增,分别得到500bp pykF位点上游同源臂和500bp pykF位点下游同源臂;再以上下游同源臂为模板进行overlap PCR,PCR程序如下:98℃5min,98℃30s,55℃30s,72℃1min,72℃10min,16℃10min,30个循环数,扩增获得1000bp含有pykF基因上下游同源臂的打靶片段(SEQ IDNo.8)。
将HS03/pCas在30℃培养3h,利用10%(V/V)甘油清洗3次,2.5kv条件下将pTargetF-pykF质粒(链霉素抗性)和含有pykF基因上下游同源臂的打靶片段(SEQ IDNo.8)电转入其中,利用卡那霉素和链霉素双抗性筛选,PCR验证获得基因敲除或者插入阳性克隆,引物为pykF-up-F和pykF-down-R,得到1000bp的为阳性克隆HS03/pCasΔpykF;将该克隆子在42℃下培养5h,在LB无抗平板上进行划线,将生长出的克隆子在LB无抗和卡那霉素抗性平板上进行对照验证,确认pCas质粒消除。得到菌株HS03/ΔpykF。
二、敲除丙酮酸激酶II pykA(GeneBANK:QKN73536.1,提交日20200710)
以pTargetF为模板,经测序验证正确后pTargetF-pykA-F/R为引物,进行PCR扩增,得到2118bp含有pykA基因识别N20的质粒,命名为pTargetF-pykA,该质粒中含有pykA基因gRNA的编码基因,N20的核苷酸序列为TCTGAACTATGCCCGTCGCC。
以BW25113基因组DNA为模板,pykA-up-F/R和pykA-down-F/R引物扩增,分别得到500bp pykA位点上游同源臂和500bp pykA位点下游同源臂;再以上下游同源臂为模板进行overlap PCR,PCR程序如下:98℃5min,98℃30s,55℃30s,72℃1min,72℃10min,16℃10min,30个循环数,扩增获得1000bp含有pykA基因上下游同源臂的打靶片段(SEQ IDNo.9)。
将HS03/pCasΔpykF在30℃培养3h,利用10%(V/V)甘油清洗3次,2.5kv条件下将pTargetF-pykA质粒(链霉素抗性)和含有pykA基因上下游同源臂的打靶片段(SEQ IDNo.9)电转入其中,利用卡那霉素和链霉素双抗性筛选,PCR验证获得基因敲除或者插入阳性克隆,引物为pykA-up-F和pykA-down-R,得到1000bp的为阳性克隆HS03/pCasΔpykFΔpykA;将该克隆子在42℃下培养5h,在LB无抗平板上进行划线,将生长出的克隆子在LB无抗和卡那霉素抗性平板上进行对照验证,确认pCas质粒消除。得到菌株HS03/ΔpykFΔpykA。
三、构建重组菌HS03/ΔpykFΔpykA/pTRC99A-thrA*-asd-aspC-gdhA
1、重组质粒pTRC99A-thrA*-asd-aspC-gdhA的制备
利用商业化质粒pTRC99A过表达天冬氨酸激酶I突变体thrA*(1034C-T)和天冬氨酸半醛脱氢酶asd提高从天冬氨酸到高丝氨酸的通量,同时过表达天冬氨酸氨基转移酶aspC和谷氨酸脱氢酶gdhA提高从草酰乙酸到天冬氨酸的通量;具体方法如下:
以NcoI和HindIII对pTRC99A进行双酶切,收集4120bp的pTRC99A酶切产物。
以BW25113基因组DNA为模板,用引物thrA-F/R和asd-AC-F/R分别扩增,得到2463bp的thrA基因(核苷酸序列与SEQ ID No.10相比,仅1034位的碱基为C,其他碱基相同)和1104bp的asd基因(SEQ ID No.11)。
以BW25113基因组DNA为模板,用引物aspC-F/R和gdhA-F/R分别扩增,得到1191bp的aspC基因(SEQ ID No.12)和1344bp的gdhA基因(SEQ ID No.13)。
将上述4120bp的pTRC99A酶切产物、2463bp的thrA基因、1104bp的asd基因、1191bp的aspC基因和1344bp的gdhA基因采用Gibson无缝(Gibson无缝连接试剂盒购自博迈德基因技术有限公司)连接的方法构建质粒pTRC99A-thrA-asd-aspC-gdhA,并经测序验证正确。
以pTRC99A-thrA-asd-aspC-gdhA为模板,利用quik-change PCR的方法,以引物thrA-1034CT-F/R进行PCR扩增,得到质粒pTRC99A-thrA*-asd-aspC-gdhA,该质粒中的thrA基因的1034位由胞嘧啶C突变为胸腺嘧啶T(命名为thrA*,thrA*的核苷酸序列为SEQ IDNo.10)。
2、重组菌HS03/ΔpykFΔpykA/pTRC99A-thrA*-asd-aspC-gdhA的构建
将重组质粒pTRC99A-thrA*-asd-aspC-gdhA转入上述二制备的HS03/ΔpykFΔpykA中,经抗性筛选和测序验证正确后得到重组菌HS03/ΔpykFΔpykA/pTRC99A-thrA*-asd-aspC-gdhA。
HS03/ΔpykFΔpykA/pTRC99A-thrA*-asd-aspC-gdhA为敲除HS03基因组中的pykF、pykA,且过表达thrA*、asd、aspC、gdhA,其他基因序列不变,得到的重组菌。
四、无机盐培养基发酵测试
将得到的重组菌HS03/ΔpykFΔpykA/pTRC99A-thrA*-asd-aspC-gdhA在无机盐培养基进行发酵优化,发酵过程中维持溶氧含量在30%左右,利用氨水调节pH7.0。补料过程中葡萄糖含量控制在1g/L-0.5g/L之间;30℃条件下发酵,收集发酵液。
无机盐发酵培养基配方如下:1.7g/L柠檬酸,14g/L磷酸二氢钾,4g/L磷酸氢二铵,2g/L酵母提取物,初始葡萄糖20g/L,硫酸镁0.6g/L,余量为水,氨水调节pH为7.0。
利用SBA定糖仪检测发酵体系中葡萄糖含量低于0.5g/L时,开始流加600g/L葡萄糖溶液;葡萄糖溶液配方:600g/L葡萄糖、1g/L赖氨酸、0.3g/L蛋氨酸、0.5g/L苏氨酸和2g/L硫酸镁,余量为水。标准品为1mM、2.5mM、5mM、7.5mM、10mM的L-高丝氨酸溶液,测定标准曲线。
具体HPLC检测方法为:25μL标准品,加入40μL 36.8mM DNFB(2,4-二硝基氟苯),10μL1M饱和碳酸氢钠,60℃反应30min,加入20μL 4M盐酸,离心过滤,360nm紫外光进行HPLC检测。流动相为A:乙腈、B超纯水(含千分之一甲酸)。35%A:65%B(%表示体积百分含量)的配比进行检测,流速为1mL/min。
标准品高丝氨酸出峰时间为5.458min。取发酵液10000rpm离心收集发酵上清液,稀释相应倍数,按照上述方法进行发酵液中高丝氨酸含量检测。结果在5.458min有出峰,HS03/ΔpykFΔpykA/pTRC99A-thrA*-asd-aspC-gdhA在54h可产生22.6g/L高丝氨酸,摩尔转化率为1.26摩尔/1摩尔葡萄糖,达到理论转化率的63%。L-高丝氨酸检测图示例如图2所示。
实施例4、富马酸到天冬氨酸途径合成L-高丝氨酸菌株的构建
一、HS03菌株基础上,敲除磷酸烯醇式丙酮酸羧化酶ppc(SEQ ID No.2)
将pCas质粒(卡那霉素抗性)导入HS03中,因pCas质粒是温度敏感型质粒,30℃培养15h,筛选得到阳性克隆子HS03/pCas。
以pTargetF为模板,pTargetF-ppc-F/R为引物,进行PCR扩增,得到2118bp含有ppc基因识别N20的质粒,经测序验证正确后命名为pTargetF-ppc,该质粒中含有ppc基因gRNA的编码基因,N20的核苷酸序列为CTGTTTTTGATGCGCAAAAG。
以BW25113基因组DNA为模板,ppc-up-F/R和ppc-down-F/R引物扩增,分别得到515bp ppc位点上游同源臂和510bp ppc位点下游同源臂;再以上下游同源臂为模板进行overlap PCR,PCR程序如下:98℃5min,98℃30s,55℃30s,72℃1min,72℃10min,16℃10min,30个循环数,扩增获得1025bp含有ppc基因上下游同源臂的打靶片段(SEQ IDNo.14)。
将HS03/pCas在30℃培养3h,利用10%(V/V)甘油清洗3次,2.5kv条件下将pTargetF-ppc质粒(链霉素抗性)和含有ppc基因上下游同源臂的打靶片段(SEQ ID No.14)电转入其中,利用卡那霉素和链霉素双抗性筛选,PCR验证获得基因敲除或者插入阳性克隆,引物为thrB-up-F和thrB-down-R,得到1025bp的为阳性克隆HS03/pCasΔppc;将该克隆子在42℃下培养5h,在LB无抗平板上进行划线,将生长出的克隆子在LB无抗和卡那霉素抗性平板上进行对照验证,确认pCas质粒消除。得到菌株HS03/Δppc。
二、敲除天冬氨酸氨基转移酶aspC(SEQ ID No.12)
以pTargetF为模板,pTargetF-aspC-F/R为引物,进行PCR扩增,得到2118bp含有aspC基因识别N20的质粒,经测序验证正确后命名为pTargetF-aspC,该质粒中含有aspC基因gRNA的编码基因,N20的核苷酸序列为GCTGGAACAATGGCAAACAC。
以BW25113基因组DNA为模板,aspC-up-F/R和aspC-down-F/R引物扩增,分别得到500bp aspC位点上游同源臂和500bp aspC位点下游同源臂;再以上下游同源臂为模板进行overlap PCR,PCR程序如下:98℃5min,98℃30s,55℃30s,72℃1min,72℃10min,16℃10min,30个循环数,扩增获得1000bp含有aspC基因上下游同源臂的打靶片段(SEQ IDNo.15)。
将HS03/pCasΔppc在30℃培养3h,利用10%(V/V)甘油清洗3次,2.5kv条件下将pTargetF-aspC质粒(链霉素抗性)和含有aspC基因上下游同源臂的打靶片段(SEQ IDNo.15)电转入其中,利用卡那霉素和链霉素双抗性筛选,PCR验证获得基因敲除或者插入阳性克隆,引物为aspC-up-F和aspC-down-R,得到1000bp的为阳性克隆HS03/pCasΔppcΔaspC;将该克隆子在42℃下培养5h,在LB无抗平板上进行划线,将生长出的克隆子在LB无抗和卡那霉素抗性平板上进行对照验证,确认pCas质粒消除。得到菌株HS03/ΔppcΔaspC。
三、构建重组菌HS03/ΔppcΔaspC/pTRC99A-thrA*-asd-aspA
1、重组质粒pTRC99A-thrA*-asd-aspA的制备
利用商业化质粒pTRC99A过表达天冬氨酸激酶I突变体thrA*(1034C-T)和天冬氨酸半醛脱氢酶asd提高从天冬氨酸到高丝氨酸的通量,同时过表达天冬氨酸氨基裂解酶aspA提高从富马酸到天冬氨酸的通量;具体方法如下:
以NcoI和HindIII对pTRC99A进行双酶切,收集4120bp的pTRC99A酶切产物。
以BW25113基因组DNA为模板,用引物thrA-F/R和asd-AA-F/R分别扩增,得到2463bp的thrA基因(核苷酸序列与SEQ ID No.10相比,仅1034位的碱基为C,其他碱基相同)和1104bp的asd基因(SEQ ID No.11)。
以BW25113基因组DNA为模板,用引物aspA-F/R扩增,得到1437bp的aspA基因(SEQID No.16)。
将上述4120bp的pTRC99A酶切产物、2463bp的thrA基因、1104bp的asd基因、1437bp的aspA基因采用Gibson无缝(Gibson无缝连接试剂盒购自博迈德基因技术有限公司)连接的方法构建质粒pTRC99A-thrA-asd-aspA,并经测序验证正确。
以pTRC99A-thrA-asd-aspA为模板,利用quik-change PCR的方法,以引物thrA-1034CT-F/R进行PCR扩增,得到质粒pTRC99A-thrA*-asd-aspA,该质粒中的thrA基因的1034位由胞嘧啶C突变为胸腺嘧啶T(命名为thrA*,thrA*的核苷酸序列为SEQ ID No.10)。
2、重组菌HS03/ΔppcΔaspC/pTRC99A-thrA*-asd-aspA的构建
将重组质粒pTRC99A-thrA*-asd-aspA转入上述制备的HS03/ΔppcΔaspC中,经抗性筛选和测序验证正确后得到重组菌HS03/ΔppcΔaspC/pTRC99A-thrA*-asd-aspA。
HS03/ΔppcΔaspC/pTRC99A-thrA*-asd-aspA为敲除HS03基因组中的ppc、aspC,且过表达thrA*、asd、aspA,其他基因序列不变,得到的重组菌。
四、无机盐培养基发酵测试
将得到的重组菌HS03/ΔppcΔaspC/pTRC99A-thrA*-asd-aspA在无机盐培养基进行发酵优化,发酵过程中维持溶氧含量在30%左右,利用氨水调节pH7.0。补料过程中葡萄糖含量控制在1g/L-0.5g/L之间;30℃条件下发酵,收集发酵液。
无机盐发酵培养基配方如下:1.7g/L柠檬酸,14g/L磷酸二氢钾,4g/L磷酸氢二铵,2g/L酵母提取物,初始葡萄糖20g/L,硫酸镁0.6g/L,余量为水,氨水调节pH为7.0。
利用SBA定糖仪检测发酵体系中葡萄糖含量低于0.5g/L时,开始流加600g/L葡萄糖溶液;葡萄糖溶液配方:600g/L葡萄糖、1g/L赖氨酸、0.3g/L蛋氨酸、0.5g/L苏氨酸和2g/L硫酸镁,余量为水。标准品为1mM、2.5mM、5mM、7.5mM、10mM的L-高丝氨酸溶液,测定标准曲线。
具体HPLC检测方法为:25μL标准品,加入40μL 36.8mM DNFB(2,4-二硝基氟苯),10μL1M饱和碳酸氢钠,60℃反应30min,加入20μL 4M盐酸,离心过滤,360nm紫外光进行HPLC检测。流动相为A:乙腈、B超纯水(含千分之一甲酸)。35%A:65%B(%表示体积百分含量)的配比进行检测,流速为1mL/min。
标准品高丝氨酸出峰时间为5.458min。取发酵液10000rpm离心收集发酵上清液,稀释相应倍数,按照上述方法进行发酵液中高丝氨酸含量检测。结果在5.458min有出峰,HS03/ΔppcΔaspC/pTRC99A-thrA*-asd-aspA在58h可产生54.4g/L高丝氨酸,摩尔转化率为0.59摩尔/1摩尔葡萄糖,达到理论转化率的59%。L-高丝氨酸检测图示例如图2所示。
实施例5、整合两条途径提高L-高丝氨酸发酵强度
一、pTRC99A-thrA*-asd-aspA-trc-aspC-gdhA
在质粒水平过表达两条途径的关键基因,提高细胞内到产物的通量。
以pTRC99A-thrA*-asd-aspA为模板,trc-AAA-F/R为引物进行PCR扩增,得到9156bp的pTRC99A-thrA*-asd-aspA线性化片段。以pTRC99A-thrA*-asd-aspC-gdhA为模板,trc-aspC-F/trc-gdhA-R为引物进行PCR扩增,得到2626bp的trc-aspC-gdhA线性化片段。
将9156bp的pTRC99A-thrA*-asd-aspA扩增产物和2626bp的trc-aspC-gdhA线性化扩增产物利用Gibson无缝连接的方法,成功构建质粒pTRC99A-thrA*-asd-aspA-trc-aspC-gdhA。
二、将pTRC99A-thrA*-asd-aspA-trc-aspC-gdhA设计不同RBS强度的aspA
质粒pTRC99A-thrA*-asd-aspA-trc-aspC-gdhA中,aspA的RBS强度为1400AU,利用网站RBS Calculator计算不同的RBS强度,分别为200AU、400AU、700AU、1400AU、2800AU、4000AU、6000AU,RBS具体序列不限,以具体强度为准。设计引物200-F/R、400-F/R、700-F/R、2800-F/R、4000-F/R、6000-F/R,以模板pTRC99A-thrA*-asd-aspA-trc-aspC-gdhA进行PCR,PCR程序如下:98℃5min,98℃30s,55℃30s,72℃1min,72℃10min,16℃10min,30个循环数,扩增获得约11778bp含有不同RBS强度的pTRC99A-thrA*-asd-aspA-trc-aspC-gdhA线性化片段,转入DH5α感受态细胞后,可以获得质粒。
质粒pTRC99A-thrA*-asd-aspA-trc-aspC-gdhA中,aspC的RBS强度为3600AU(用于调控所述天冬氨酸氨基转移酶aspC的编码基因表达的强度为3600AU的RBS序列为SEQ IDNo.18),gdhA的RBS强度为1000AU(用于调控所述谷氨酸脱氢酶gdhA的编码基因表达的强度为1000AU的RBS序列为SEQ ID No.19)。
三、重组菌HS03/pTRC99A-thrA*-asd-aspA-trc-aspC-gdhA以及含有不同强度RBS的质粒
将pTRC99A-thrA*-asd-aspA-trc-aspC-gdhA质粒转入HS03菌株中,得到重组菌HS03/pTRC99A-thrA*-asd-aspA-trc-aspC-gdhA。
该重组菌为将thrA*-asd-aspA-aspC-gdhA以质粒的形式在HS03菌株中过表达。
上述各种不同RBS强度的质粒,均以上述方法转入HS03菌株中。
四、摇瓶发酵测试
将HS03/pTRC99A-thrA*-asd-aspA-trc-aspC-gdhA和含有不同强度RBS的菌株接入含有10g/L葡萄糖的LB培养基中,30℃条件下培养24h,得到发酵液。
标准品为1mM、2.5mM、5mM、7.5mM、10mM的L-高丝氨酸溶液,测定标准曲线。具体HPLC检测方法为:25μL标准品,加入40μL 36.8mM DNFB(2,4-二硝基氟苯),10μL 1M饱和碳酸氢钠,60℃反应30min,加入20μL 4M盐酸,离心过滤,360nm紫外光进行HPLC检测。流动相为A:乙腈、B超纯水(含千分之一甲酸)。35%A:65%B(%表示体积百分含量)的配比进行检测,流速为1mL/min。
标准品高丝氨酸出峰时间为5.458min。取发酵液10000rpm离心收集发酵上清液,稀释相应倍数,按照上述方法进行发酵上清液中高丝氨酸含量检测。结果在5.458min有出峰,表明发酵上清液中含有L-高丝氨酸,对比不同的RBS强度菌株,aspA基因在强度2800AU的RBS序列调控下(对应重组菌命名为重组菌HS03/pTRC99A-thrA*-asd-aspA-RBS2800-trc-aspC-gdhA),L-高丝氨酸能够达到最大的产量,即转化率最高(图3)。
将aspA基因在强度2800AU的RBS序列(SEQ ID No.17)调控下的pTRC99A-thrA*-asd-aspA-trc-aspC-gdhA质粒命名为pTRC99A-thrA*-asd-aspA-RBS2800-trc-aspC-gdhA。该质粒中调控aspC基因的RBS序列(SEQ ID No.18)强度为3600AU,调控gdhA基因的RBS序列(SEQ ID No.19)强度为1000AU。
五、无机盐培养基发酵测试
将得到的重组菌HS03/pTRC99A-thrA*-asd-aspA-RBS2800-trc-aspC-gdhA在无机盐培养基进行发酵优化,发酵过程中维持溶氧含量在30%左右,利用氨水调节pH7.0。补料过程中葡萄糖含量控制在1g/L-0.5g/L之间;30℃条件下发酵,收集发酵液。
无机盐发酵培养基配方如下:1.7g/L柠檬酸,14g/L磷酸二氢钾,4g/L磷酸氢二铵,2g/L酵母提取物,初始葡萄糖20g/L,硫酸镁0.6g/L,余量为水,氨水调节pH为7.0。
利用SBA定糖仪检测发酵体系中葡萄糖含量低于0.5g/L时,开始流加600g/L葡萄糖溶液;葡萄糖溶液配方:600g/L葡萄糖、1g/L赖氨酸、0.3g/L蛋氨酸、0.5g/L苏氨酸和2g/L硫酸镁,余量为水。标准品为1mM、2.5mM、5mM、7.5mM、10mM的L-高丝氨酸溶液,测定标准曲线。
具体HPLC检测方法为:25μL标准品,加入40μL 36.8mM DNFB(2,4-二硝基氟苯),10μL1M饱和碳酸氢钠,60℃反应30min,加入20μL 4M盐酸,离心过滤,360nm紫外光进行HPLC检测。流动相为A:乙腈、B超纯水(含千分之一甲酸)。35%A:65%B(%表示体积百分含量)的配比进行检测,流速为1mL/min。
标准品高丝氨酸出峰时间为5.458min。取发酵液10000rpm离心收集发酵上清液,稀释相应倍数,按照上述方法进行发酵液中高丝氨酸含量检测。结果在5.458min有出峰,HS03/pTRC99A-thrA*-asd-aspA-RBS2800-trc-aspC-gdhA在43h可产生90.3g/L的L-高丝氨酸,发酵强度达到2.10g/L/h(图4)。
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
<110> 中国科学院微生物研究所
<120> 一株耐受L-高丝氨酸的大肠杆菌及其应用
<130> GNCLN210853
<160> 21
<170> PatentIn version 3.5
<210> 1
<211> 1062
<212> DNA
<213> Artificial sequence
<400> 1
tggccttcct gtagccagct ttcatcaaca ttaaatgtga gcgagtaaca acccgtcgga 60
ttctccgtgg gaacaaacgg cggattgacc gtaatgggat aggtcacgtt ggtgtagatg 120
ggcgcatcgt aaccgtgcat ctgccagttt gaggggacga cgacagtatc ggcctcagga 180
agatcgcact ccagccagct ttccggcacc gcttctggtg ccggaaacca ggcaaagcgc 240
cattcgccat tcaggctgcg caactgttgg gaagggcgat cggtgcgggc ctcttcgcta 300
ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat taagttgggt aacgccaggg 360
ttttcccagt cacgacgttg taaaacgacg gccagtgaat ccgtaatcat ggtcatagct 420
gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag ccggaagcat 480
aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgcat 540
tcaccaccct gaattgactc tcttccgggc gctatcatgc cataccgcga aaggttttgc 600
gccattcgat ggtgtcaacg taaatgcatg ccgcttcgcc ttccggccac cagaatagcc 660
tgcgattcaa ccccttcttc gatctgtttt gctacccgtt gtagcgccgg aagatgcttt 720
tccgctgcct gttcaatggt cattgcgctc gccatataca ccagattcag acagccaatc 780
acccgttgtt cactgcgcag cggtacggcg atagaggcga tcttctcctc ctgatcccag 840
ccgcggtagt tctgtccgta accctctttg cgcgcgcgcg ccagaatggc ttccagcttt 900
aacggttccc gtgccagttg atagtcatca ccggggcggg aggctaacat ttcgattaat 960
tccttgcggt cttgttccgg gcaaaaggcc agccaggtca ggcccgaggc ggttttcaga 1020
agcggcaaac gtcgcccgac cattgcccgg tgaaaggata ag 1062
<210> 2
<211> 2760
<212> DNA
<213> Artificial sequence
<400> 2
atgactgatt ttttacgcga tgacatcagg ttcctcggtc aaatcctcgg tgaggtaatt 60
gcggaacaag aaggccagga ggtttatgaa ctggtcgaac aagcgcgcct gacttctttt 120
gatatcgcca agggcaacgc cgaaatggat agcctggttc aggttttcga cggcattact 180
ccagccaagg caacaccgat tgctcgcgca ttttcccact tcgctctgct ggctaacctg 240
gcggaagacc tctacgatga agagcttcgt gaacaggctc tcgatgcagg cgacacccct 300
ccggacagca ctcttgatgc cacctggctg aaactcaatg agggcaatgt tggcgcagaa 360
gctgtggccg atgtgctgcg caatgctgag gtggcgccgg ttctgactgc gcacccaact 420
gagactcgcc gccgcactgt ttttgatgcg caaaagtgga tcaccaccca catgcgtgaa 480
cgccacgctt tgcagtctgc ggagcctacc gctcgtacgc aaagcaagtt ggatgagatc 540
gagaagaaca tccgccgtcg catcaccatt ttgtggcaga ccgcgttgat tcgtgtggcc 600
cgcccacgta tcgaggacga gatcgaagta gggctgcgct actacaagct gagccttttg 660
gaagagattc cacgtatcaa ccgtgatgtg gctgttgagc ttcgtgagcg tttcggcgag 720
ggtgttcctt tgaagcccgt ggtcaagcca ggttcctgga ttggtggaga ccacgacggt 780
aacccttatg tcaccgcgga aacagttgag tattccactc accgcgctgc ggaaaccgtg 840
ctcaagtact atgcacgcca gctgcattcc ctcgagcatg agctcagcct gtcggaccgc 900
atgaataagg tcaccccgca gctgcttgcg ctggcagatg cagggcacaa cgacgtgcca 960
agccgcgtgg atgagcctta tcgacgcgcc gtccatggcg ttcgcggacg tatcctcgcg 1020
acgacggccg agctgatcgg cgaggacgcc gttgagggcg tgtggttcaa ggtctttact 1080
ccatacgcat ctccggaaga attcttaaac gatgcgttga ccattgatca ttctctgcgt 1140
gaatccaagg acgttctcat tgccgatgat cgtttgtctg tgctgatttc tgccatcgag 1200
agctttggat tcaaccttta cgcactggat ctgcgccaaa actccgaaag ctacgaggac 1260
gtcctcaccg agcttttcga acgcgcccaa gtcaccgcaa actaccgcga gctgtctgaa 1320
gcagagaagc ttgaggtgct gctgaaggaa ctgcgcagcc ctcgtccgct gatcccgcac 1380
ggttcagatg aatacagcga ggtcaccgac cgcgagctcg gcatcttccg caccgcgtcg 1440
gaggctgtta agaaattcgg gccacggatg gtgcctcact gcatcatctc catggcatca 1500
tcggtcaccg atgtgctcga gccgatggtg ttgctcaagg aattcggact catcgcagcc 1560
aacggcgaca acccacgcgg caccgtcgat gtcatcccac tgttcgaaac catcgaagat 1620
ctccaggccg gcgccggaat cctcgacgaa ctgtggaaaa ttgatctcta ccgcaactac 1680
ctcctgcagc gcgacaacgt ccaggaagtc atgctcggtt actccgattc caacaaggat 1740
ggcggatatt tctccgcaaa ctgggcgctt tacgacgcgg aactgcagct cgtcgaacta 1800
tgccgatcag ccggggtcaa gcttcgcctg ttccacggcc gtggtggcac cgtcggccgc 1860
ggtggcggac cttcctacga cgcgattctt gcccagccca ggggggctgt ccaaggttcc 1920
gtgcgcatca ccgagcaggg cgagatcatc tccgctaagt acggcaaccc cgaaaccgcg 1980
cgccgaaacc tcgaagccct ggtctcagcc acgcttgagg catcgcttct cgacgtctcc 2040
gaactcaccg atcaccaacg cgcgtacgac atcatgagtg agatctctga gctcagcttg 2100
aagaagtacg cctccttggt gcacgaggat caaggcttca tcgattactt cacccagtcc 2160
acgccgctgc aggagattgg atccctcaac atcggatcca ggccttcctc acgcaagcag 2220
acctcctcgg tggaagattt gcgagccatc ccatgggtgc tcagctggtc acagtctcgt 2280
gtcatgctgc caggctggtt tggtgtcgga accgcattag agcagtggat tggcgaaggg 2340
gagcaggcca cccaacgcat tgccgagctg caaacactca atgagtcctg gccatttttc 2400
acctcagtgt tggataacat ggctcaggtg atgtccaagg cagagctgcg tttggcaaag 2460
ctctacgcag acctgatccc agatacggaa gtagccgagc gagtctattc cgtcatccgc 2520
gaggagtact tcctgaccaa gaagatgttc tgcgtaatca ccggctctga tgatctgctt 2580
gatgacaacc cacttctcgc acgctctgtc cagcgccgat acccctacct gcttccactc 2640
aacgtgatcc aggtagagat gatgcgacgc taccgaaaag gcgaccaaag cgagcaagtg 2700
tcccgcaaca ttcagctgac catgaacggt ctttccactg cgctgcgcaa ctccggctag 2760
<210> 3
<211> 4198
<212> DNA
<213> Artificial sequence
<400> 3
catgagtttc tccgaggcga ccacgctggc gcgggaaatg ggttataccg aaccggaccc 60
gcgagatgat ctttctggta tggatgtggc gcgtaaacta ttgattctcg ctcgtgaaac 120
gggacgtgaa ctggagctgg cggatattga aattgaacct gtgctgcccg cagagtttaa 180
cgccgagggt gatgttgccg cttttatggc gaatctgtca caactcgacg atctctttgc 240
cgcgcgcgtg gcgaaggccc gtgatgaagg aaaagttttg cgctatgttg gcaatattga 300
tgaagatggc gtctgccgcg tgaagattgc cgaagtggat ggtaatgatc cgctgttcaa 360
agtgaaaaat ggcgaaaacg ccctggcctt ctatagccac tattatcagc cgctgccgtt 420
ggtactgcgc ggatatggtg cgggcaatga cgttacagct gccggtgtct ttgctgatct 480
gctacgtacc ctctcatgga agttaggagt ctgaccatca taacggttct ggcaaatatt 540
ctgaaatgag ctgttgacaa ttaatcatcc ggctcgtata atgtgtggaa ttgtgagcgg 600
ataacaattt cacacaggaa acagaccatg ggtatgactg attttttacg cgatgacatc 660
aggttcctcg gtcaaatcct cggtgaggta attgcggaac aagaaggcca ggaggtttat 720
gaactggtcg aacaagcgcg cctgacttct tttgatatcg ccaagggcaa cgccgaaatg 780
gatagcctgg ttcaggtttt cgacggcatt actccagcca aggcaacacc gattgctcgc 840
gcattttccc acttcgctct gctggctaac ctggcggaag acctctacga tgaagagctt 900
cgtgaacagg ctctcgatgc aggcgacacc cctccggaca gcactcttga tgccacctgg 960
ctgaaactca atgagggcaa tgttggcgca gaagctgtgg ccgatgtgct gcgcaatgct 1020
gaggtggcgc cggttctgac tgcgcaccca actgagactc gccgccgcac tgtttttgat 1080
gcgcaaaagt ggatcaccac ccacatgcgt gaacgccacg ctttgcagtc tgcggagcct 1140
accgctcgta cgcaaagcaa gttggatgag atcgagaaga acatccgccg tcgcatcacc 1200
attttgtggc agaccgcgtt gattcgtgtg gcccgcccac gtatcgagga cgagatcgaa 1260
gtagggctgc gctactacaa gctgagcctt ttggaagaga ttccacgtat caaccgtgat 1320
gtggctgttg agcttcgtga gcgtttcggc gagggtgttc ctttgaagcc cgtggtcaag 1380
ccaggttcct ggattggtgg agaccacgac ggtaaccctt atgtcaccgc ggaaacagtt 1440
gagtattcca ctcaccgcgc tgcggaaacc gtgctcaagt actatgcacg ccagctgcat 1500
tccctcgagc atgagctcag cctgtcggac cgcatgaata aggtcacccc gcagctgctt 1560
gcgctggcag atgcagggca caacgacgtg ccaagccgcg tggatgagcc ttatcgacgc 1620
gccgtccatg gcgttcgcgg acgtatcctc gcgacgacgg ccgagctgat cggcgaggac 1680
gccgttgagg gcgtgtggtt caaggtcttt actccatacg catctccgga agaattctta 1740
aacgatgcgt tgaccattga tcattctctg cgtgaatcca aggacgttct cattgccgat 1800
gatcgtttgt ctgtgctgat ttctgccatc gagagctttg gattcaacct ttacgcactg 1860
gatctgcgcc aaaactccga aagctacgag gacgtcctca ccgagctttt cgaacgcgcc 1920
caagtcaccg caaactaccg cgagctgtct gaagcagaga agcttgaggt gctgctgaag 1980
gaactgcgca gccctcgtcc gctgatcccg cacggttcag atgaatacag cgaggtcacc 2040
gaccgcgagc tcggcatctt ccgcaccgcg tcggaggctg ttaagaaatt cgggccacgg 2100
atggtgcctc actgcatcat ctccatggca tcatcggtca ccgatgtgct cgagccgatg 2160
gtgttgctca aggaattcgg actcatcgca gccaacggcg acaacccacg cggcaccgtc 2220
gatgtcatcc cactgttcga aaccatcgaa gatctccagg ccggcgccgg aatcctcgac 2280
gaactgtgga aaattgatct ctaccgcaac tacctcctgc agcgcgacaa cgtccaggaa 2340
gtcatgctcg gttactccga ttccaacaag gatggcggat atttctccgc aaactgggcg 2400
ctttacgacg cggaactgca gctcgtcgaa ctatgccgat cagccggggt caagcttcgc 2460
ctgttccacg gccgtggtgg caccgtcggc cgcggtggcg gaccttccta cgacgcgatt 2520
cttgcccagc ccaggggggc tgtccaaggt tccgtgcgca tcaccgagca gggcgagatc 2580
atctccgcta agtacggcaa ccccgaaacc gcgcgccgaa acctcgaagc cctggtctca 2640
gccacgcttg aggcatcgct tctcgacgtc tccgaactca ccgatcacca acgcgcgtac 2700
gacatcatga gtgagatctc tgagctcagc ttgaagaagt acgcctcctt ggtgcacgag 2760
gatcaaggct tcatcgatta cttcacccag tccacgccgc tgcaggagat tggatccctc 2820
aacatcggat ccaggccttc ctcacgcaag cagacctcct cggtggaaga tttgcgagcc 2880
atcccatggg tgctcagctg gtcacagtct cgtgtcatgc tgccaggctg gtttggtgtc 2940
ggaaccgcat tagagcagtg gattggcgaa ggggagcagg ccacccaacg cattgccgag 3000
ctgcaaacac tcaatgagtc ctggccattt ttcacctcag tgttggataa catggctcag 3060
gtgatgtcca aggcagagct gcgtttggca aagctctacg cagacctgat cccagatacg 3120
gaagtagccg agcgagtcta ttccgtcatc cgcgaggagt acttcctgac caagaagatg 3180
ttctgcgtaa tcaccggctc tgatgatctg cttgatgaca acccacttct cgcacgctct 3240
gtccagcgcc gataccccta cctgcttcca ctcaacgtga tccaggtaga gatgatgcga 3300
cgctaccgaa aaggcgacca aagcgagcaa gtgtcccgca acattcagct gaccatgaac 3360
ggtctttcca ctgcgctgcg caactccggc tagaagcttg gctgttttgg cggatgagag 3420
aagattttca gcctgataca gattaaatca gaacgcagaa gcggtctgat aaaacagaat 3480
ttgcctggcg gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa 3540
cgccgtagcg ccgatggtag tgtggggtct ccccatgcga gagtagggaa ctgccaggca 3600
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc 3660
ggtgaacgct ctcctgagta ggacaaataa tctattcatt atctcaatca ggccgggttt 3720
gcttttatgc agcccggctt ttttatgaag aaattatgga gaaaaatgac agggaaaaag 3780
gagaaattct caataaatgc ggtaacttag agattaggat tgcggagaat aacaaccgcc 3840
gttctcatcg agtaatctcc ggatatcgac ccataacggg caatgataaa aggagtaacc 3900
tgtgaaaaag atgcaatcta tcgtactcgc actttccctg gttctggtcg ctcccatggc 3960
agcacaggct gcggaaatta cgttagtccc gtcagtaaaa ttacagatag gcgatcgtga 4020
taatcgtggc tattactggg atggaggtca ctggcgcgac cacggctggt ggaaacaaca 4080
ttatgaatgg cgaggcaatc gctggcacct acacggaccg ccgccaccgc cgcgccacca 4140
taagaaagct cctcatgatc atcacggcgg tcatggtcca ggcaaacatc accgctaa 4198
<210> 4
<211> 1114
<212> DNA
<213> Artificial sequence
<400> 4
aatcgtccac ctcagagcgt cccgtaacct taaaacccac cttcttatag aacccaaccg 60
cctgctcatt ttgctcatta acgttggttg tcagttccgg tgccatcgag agcgcatgct 120
ccaccagcac ccgacctacg ccgcagccgc gcacatcagg atcgataaac agcgcatcca 180
tatgctgccc acttagcaac ataaatccaa ccggctgatc ccgctcatta accgcgaccc 240
acaacggcgc ttccggcagg aaggaacgaa ctaggtcctc cagctcggtc cgatactctg 300
ctgatagaaa atcgtgagtg gcatcgacag aacgacacca aatcgcaacg agttcctccc 360
cttcctcatg ccgtgagcgg cgaatactaa taaccatttt ctctcctttt agtcattctt 420
atattctaac gtagtctttt ccttgaaact ttctcacctt caacatgcag gctcgacatt 480
ggcaaatttt ctggttatct tcagctatct ggatgtctaa acgtataagc gtatgtagtg 540
aggtaatcag gtttcttctg tgatagtcga tcgttaagcg attcagcacc ttacctcagg 600
caccttcggg tgcctttttt atttccgaaa cgtacctcag caggtgaata aattttattc 660
atattgttat caacaagtta tcaagtattt ttaattaaaa tggaaattgt ttttgatttt 720
gcattttaaa tgagtagtct tagttgtgct gaacgaaaag agcacaacga tccttcgttc 780
acagtgggga agttttcgga tccatgacga ggagctgcac gatgactgaa caggcaacaa 840
caaccgatga actggctttc acaaggccgt atggcgagca ggagaagcaa attcttactg 900
ccgaagcggt agaatttctg actgagctgg tgacgcattt tacgccacaa cgcaataaac 960
ttctggcagc gcgcattcag cagcagcaag atattgataa cggaacgttg cctgatttta 1020
tttcggaaac agcttccatt cgcgatgctg attggaaaat tcgcgggatt cctgcggact 1080
tagaagaccg ccgcgtagag ataactggcc cggt 1114
<210> 5
<211> 1059
<212> DNA
<213> Artificial sequence
<400> 5
ggtcataccc gcattggtta tctgtgctct aaccactcta tttctgacgc cgaagatcgt 60
ctgcaagggt attacgatgc ccttgctgaa agtggtattg cggccaatga ccggctggtg 120
acatttggcg aaccagacga aagcggcggc gaacaggcaa tgaccgagct tttgggacga 180
ggaagaaatt tcactgcggt agcctgttat aacgattcaa tggcggcggg tgcgatgggc 240
gttctcaatg ataatggtat tgatgtaccg ggtgagattt cgttaattgg ctttgatgat 300
gtgctggtgt cacgctatgt gcgtccgcgc ctgaccaccg tgcgttaccc aatcgtgacg 360
atggcgaccc aggctgccga actggctttg gcgctggcgg ataatcgccc tctcccggaa 420
atcactaatg tctttagtcc gacgctggta cgtcgtcatt cagtgtcaac tccgtcgctg 480
gaggcaagtc atcatgcaac cagcgactaa ccgcagaaca aactccagat aagtgctttt 540
ttatgattac gccacatcat aaaaagaata aaaaatatcg atttatgtcg agtctatgca 600
aaaatgatat ggattaccgg attgcgagag agcgctaatg gccgccgtta acttacgtca 660
tattgaaatt tttcatgcgg taatgaccgc cggaagcctg actgaggcgg cacacctgct 720
acacacctca cagccaaccg tcagccgcga acttgcgcgc tttgagaagg tgatcgggct 780
gaaattgttt gagcgcgtac gtgggcgatt acatcctacc gtgcaaggac tgcgtctgtt 840
tgaagaagtg caacgatcct ggtacggact ggatcgcatt gtcagcgccg cagaaagtct 900
gcgcgagttt cgccagggag aactgtctat tgcctgcctg ccggtctttt cgcaatcttt 960
tttaccgcag ctcctgcaac cctttctggc acgttatccc gatgtcagct taaatatcgt 1020
gccccaggaa tcaccgctac ttgaagagtg gctctcggc 1059
<210> 6
<211> 2932
<212> DNA
<213> Artificial sequence
<400> 6
atgcgaattg gcataccaag agaacggtta accaatgaaa cccgtgttgc agcaacgcca 60
aaaacagtgg aacagctgct gaaactgggt tttaccgtcg cggtagagag cggcgcgggt 120
caactggcaa gttttgacga taaagcgttt gtgcaagcgg gcgctgaaat tgtagaaggg 180
aatagcgtct ggcagtcaga gatcattctg aaggtcaatg cgccgttaga tgatgaaatt 240
gcgttactga atcctgggac aacgctggtg agttttatct ggcctgcgca gaatccggaa 300
ttaatgcaaa aacttgcgga acgtaacgtg accgtgatgg cgatggactc tgtgccgcgt 360
atctcacgcg cacaatcgct ggacgcacta agctcgatgg cgaacatcgc cggttatcgc 420
gccattgttg aagcggcaca tgaatttggg cgcttcttta ccgggcaaat tactgcggcc 480
gggaaagtgc caccggcaaa agtgatggtg attggtgcgg gtgttgcagg tctggccgcc 540
attggcgcag caaacagtct cggcgcgatt gtgcgtgcat tcgacacccg cccggaagtg 600
aaagaacaag ttcaaagtat gggcgcggaa ttcctcgagc tggattttaa agaggaagct 660
ggcagcggcg atggctatgc caaagtgatg tcggacgcgt tcatcaaagc ggaaatggaa 720
ctctttgccg cccaggcaaa agaggtcgat atcattgtca ccaccgcgct tattccaggc 780
aaaccagcgc cgaagctaat tacccgtgaa atggttgact ccatgaaggc gggcagtgtg 840
attgtcgacc tggcagccca aaacggcggc aactgtgaat acaccgtgcc gggtgaaatc 900
ttcactacgg aaaatggtgt caaagtgatt ggttataccg atcttccggg ccgtctgccg 960
acgcaatcct cacagcttta cggcacaaac ctcgttaatc tgctgaaact gttgtgcaaa 1020
gagaaagacg gcaatatcac tgttgatttt gatgatgtgg tgattcgcgg cgtgaccgtg 1080
atccgtgcgg gcgaaattac ctggccggca ccgccgattc aggtatcagc tcagccgcag 1140
gcggcacaaa aagcggcacc ggaagtgaaa actgaggaaa aatgtacctg ctcaccgtgg 1200
cgtaaatacg cgttgatggc gctggcaatc attctttttg gctggatggc aagcgttgcg 1260
ccgaaagaat tccttgggca cttcaccgtt ttcgcgctgg cctgcgttgt cggttattac 1320
gtggtgtgga atgtatcgca cgcgctgcat acaccgttga tgtcggtcac caacgcgatt 1380
tcagggatta ttgttgtcgg agcactgttg cagattggcc agggcggctg ggttagcttc 1440
cttagtttta tcgcggtgct tatagccagc attaatattt tcggtggctt caccgtgact 1500
cagcgcatgc tgaaaatgtt ccgcaaaaat taaggggtaa catatgtctg gaggattagt 1560
tacagctgca tacattgttg ccgcgatcct gtttatcttc agtctggccg gtctttcgaa 1620
acatgaaacg tctcgccagg gtaacaactt cggtatcgcc gggatggcga ttgcgttaat 1680
cgcaaccatt tttggaccgg atacgggtaa tgttggctgg atcttgctgg cgatggtcat 1740
tggtggggca attggtatcc gtctggcgaa gaaagttgaa atgaccgaaa tgccagaact 1800
ggtggcgatc ctgcatagct tcgtgggtct ggcggcagtg ctggttggct ttaacagcta 1860
tctgcatcat gacgcgggaa tggcaccgat tctggtcaat attcacctga cggaagtgtt 1920
cctcggtatc ttcatcgggg cggtaacgtt cacgggttcg gtggtggcgt tcggcaaact 1980
gtgtggcaag atttcgtcta aaccattgat gctgccaaac cgtcacaaaa tgaacctggc 2040
ggctctggtc gtttccttcc tgctgctgat tgtatttgtt cgcacggaca gcgtcggcct 2100
gcaagtgctg gcattgctga taatgaccgc aattgcgctg gtattcggct ggcatttagt 2160
cgcctccatc ggtggtgcag atatgccagt ggtggtgtcg atgctgaact cgtactccgg 2220
ctgggcggct gcggctgcgg gctttatgct cagcaacgac ctgctgattg tgaccggtgc 2280
gctggtcggt tcttcggggg ctatcctttc ttacattatg tgtaaggcga tgaaccgttc 2340
ctttatcagc gttattgcgg gtggtttcgg caccgacggc tcttctactg gcgatgatca 2400
ggaagtgggt gagcaccgcg aaatcaccgc agaagagaca gcggaactgc tgaaaaactc 2460
ccattcagtg atcattactc cggggtacgg catggcagtc gcgcaggcgc aatatcctgt 2520
cgctgaaatt actgagaaat tgcgcgctcg tggtattaat gtgcgtttcg gtatccaccc 2580
ggtcgcgggg cgtttgcctg gacatatgaa cgtattgctg gctgaagcaa aagtaccgta 2640
tgacatcgtg ctggaaatgg acgagatcaa tgatgacttt gctgataccg ataccgtact 2700
ggtgattggt gctaacgata cggttaaccc ggcggcgcag gatgatccga agagtccgat 2760
tgctggtatg cctgtgctgg aagtgtggaa agcgcagaac gtgattgtct ttaaacgttc 2820
gatgaacact ggctatgctg gtgtgcaaaa cccgctgttc ttcaaggaaa acacccacat 2880
gctgtttggt gacgccaaag ccagcgtgga tgcaatcctg aaagctctgt aa 2932
<210> 7
<211> 5749
<212> DNA
<213> Artificial sequence
<400> 7
cgcaggctcg gttagggtaa gaacatttat atgtataaat ttgagcctgg cttatcgccg 60
ggctttttta tggcaaaaaa aagcggatcc tggagatccg caaaagttca cgttggcttt 120
agttattcga gttgagaaac tctcgaaacg ggcagtgact tcaagggtta aaagaggtgc 180
cgctccgttt ctgtgagcaa ttatcagtca gaatgcttga tagggataat cgttcattgc 240
tattctacct atcgccatga actatcgtgg cgatggagga tggataatga atattcgtga 300
tcttgagtac ctggtggcat tggctgaaca ccgccatttt cggcgtgcgg cagattcctg 360
ccacgttagc cagccgacgc ttagcgggca aattcgtaag ctggaagatg agctgggcgt 420
gatgttgctg gagcggacca gccgtaaagt gttgttcacc caggcgggaa tgctgctggt 480
ggatcaggcg cgtaccgtgc tgcgtgaggt gaaagtcctt aaagagatgg caagccagca 540
gggcgagacg atgtccggac cgctgcacat tggtttgatt cccacagttg gaccgtacct 600
gctaccgcat attatcccta tgctgcacca gacctttcca aagctggaaa tgtatctgca 660
tgaagcacag acccaccagt tactggcgca actggacagc ggcaaactcg attgcgtgat 720
cctcgcgctg gtgaaagaga gcgaagcatt cattgaagtg ccgttgtttg atgagccaat 780
gttgctggct atctatgaag atcacccgtg ggcgaaccgc gaatgcgtac cgatggccga 840
tctggcaggg gaaaaactgc tgatgctgga agatggtcac tgtttgcgcg atcaggcaat 900
gggtttctgt tttgaagccg gggcggatga agatacacac ttccgcgcga ccagcctgga 960
aactctgcgc aacatggtgg cggcaggtag cgggatcact ttactgccag cgctggctgt 1020
gccgccggag cgcaaacgcg atggggttgt ttatctgccg tgcattaagc cggaaccacg 1080
ccgcactatt ggcctggttt atcgtcctgg ctcaccgctg cgcagccgct atgagcagct 1140
ggcagaggcc atccgcgcaa gaatggatgg ccatttcgat aaagttcatc ataacggttc 1200
tggcaaatat tctgaaatga gctgttgaca attaatcatc cggctcgtat aatgtgtgga 1260
attgtgagcg gataacaatt tcacacagga aacagaccat gggtatgcga attggcatac 1320
caagagaacg gttaaccaat gaaacccgtg ttgcagcaac gccaaaaaca gtggaacagc 1380
tgctgaaact gggttttacc gtcgcggtag agagcggcgc gggtcaactg gcaagttttg 1440
acgataaagc gtttgtgcaa gcgggcgctg aaattgtaga agggaatagc gtctggcagt 1500
cagagatcat tctgaaggtc aatgcgccgt tagatgatga aattgcgtta ctgaatcctg 1560
ggacaacgct ggtgagtttt atctggcctg cgcagaatcc ggaattaatg caaaaacttg 1620
cggaacgtaa cgtgaccgtg atggcgatgg actctgtgcc gcgtatctca cgcgcacaat 1680
cgctggacgc actaagctcg atggcgaaca tcgccggtta tcgcgccatt gttgaagcgg 1740
cacatgaatt tgggcgcttc tttaccgggc aaattactgc ggccgggaaa gtgccaccgg 1800
caaaagtgat ggtgattggt gcgggtgttg caggtctggc cgccattggc gcagcaaaca 1860
gtctcggcgc gattgtgcgt gcattcgaca cccgcccgga agtgaaagaa caagttcaaa 1920
gtatgggcgc ggaattcctc gagctggatt ttaaagagga agctggcagc ggcgatggct 1980
atgccaaagt gatgtcggac gcgttcatca aagcggaaat ggaactcttt gccgcccagg 2040
caaaagaggt cgatatcatt gtcaccaccg cgcttattcc aggcaaacca gcgccgaagc 2100
taattacccg tgaaatggtt gactccatga aggcgggcag tgtgattgtc gacctggcag 2160
cccaaaacgg cggcaactgt gaatacaccg tgccgggtga aatcttcact acggaaaatg 2220
gtgtcaaagt gattggttat accgatcttc cgggccgtct gccgacgcaa tcctcacagc 2280
tttacggcac aaacctcgtt aatctgctga aactgttgtg caaagagaaa gacggcaata 2340
tcactgttga ttttgatgat gtggtgattc gcggcgtgac cgtgatccgt gcgggcgaaa 2400
ttacctggcc ggcaccgccg attcaggtat cagctcagcc gcaggcggca caaaaagcgg 2460
caccggaagt gaaaactgag gaaaaatgta cctgctcacc gtggcgtaaa tacgcgttga 2520
tggcgctggc aatcattctt tttggctgga tggcaagcgt tgcgccgaaa gaattccttg 2580
ggcacttcac cgttttcgcg ctggcctgcg ttgtcggtta ttacgtggtg tggaatgtat 2640
cgcacgcgct gcatacaccg ttgatgtcgg tcaccaacgc gatttcaggg attattgttg 2700
tcggagcact gttgcagatt ggccagggcg gctgggttag cttccttagt tttatcgcgg 2760
tgcttatagc cagcattaat attttcggtg gcttcaccgt gactcagcgc atgctgaaaa 2820
tgttccgcaa aaattaaggg gtaacatatg tctggaggat tagttacagc tgcatacatt 2880
gttgccgcga tcctgtttat cttcagtctg gccggtcttt cgaaacatga aacgtctcgc 2940
cagggtaaca acttcggtat cgccgggatg gcgattgcgt taatcgcaac catttttgga 3000
ccggatacgg gtaatgttgg ctggatcttg ctggcgatgg tcattggtgg ggcaattggt 3060
atccgtctgg cgaagaaagt tgaaatgacc gaaatgccag aactggtggc gatcctgcat 3120
agcttcgtgg gtctggcggc agtgctggtt ggctttaaca gctatctgca tcatgacgcg 3180
ggaatggcac cgattctggt caatattcac ctgacggaag tgttcctcgg tatcttcatc 3240
ggggcggtaa cgttcacggg ttcggtggtg gcgttcggca aactgtgtgg caagatttcg 3300
tctaaaccat tgatgctgcc aaaccgtcac aaaatgaacc tggcggctct ggtcgtttcc 3360
ttcctgctgc tgattgtatt tgttcgcacg gacagcgtcg gcctgcaagt gctggcattg 3420
ctgataatga ccgcaattgc gctggtattc ggctggcatt tagtcgcctc catcggtggt 3480
gcagatatgc cagtggtggt gtcgatgctg aactcgtact ccggctgggc ggctgcggct 3540
gcgggcttta tgctcagcaa cgacctgctg attgtgaccg gtgcgctggt cggttcttcg 3600
ggggctatcc tttcttacat tatgtgtaag gcgatgaacc gttcctttat cagcgttatt 3660
gcgggtggtt tcggcaccga cggctcttct actggcgatg atcaggaagt gggtgagcac 3720
cgcgaaatca ccgcagaaga gacagcggaa ctgctgaaaa actcccattc agtgatcatt 3780
actccggggt acggcatggc agtcgcgcag gcgcaatatc ctgtcgctga aattactgag 3840
aaattgcgcg ctcgtggtat taatgtgcgt ttcggtatcc acccggtcgc ggggcgtttg 3900
cctggacata tgaacgtatt gctggctgaa gcaaaagtac cgtatgacat cgtgctggaa 3960
atggacgaga tcaatgatga ctttgctgat accgataccg tactggtgat tggtgctaac 4020
gatacggtta acccggcggc gcaggatgat ccgaagagtc cgattgctgg tatgcctgtg 4080
ctggaagtgt ggaaagcgca gaacgtgatt gtctttaaac gttcgatgaa cactggctat 4140
gctggtgtgc aaaacccgct gttcttcaag gaaaacaccc acatgctgtt tggtgacgcc 4200
aaagccagcg tggatgcaat cctgaaagct ctgtaaaagc ttggctgttt tggcggatga 4260
gagaagattt tcagcctgat acagattaaa tcagaacgca gaagcggtct gataaaacag 4320
aatttgcctg gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg 4380
aaacgccgta gcgccgatgg tagtgtgggg tctccccatg cgagagtagg gaactgccag 4440
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 4500
gtcggtgaac gctctcctga gtaggacaaa tggtagggct tacctgttct tatacataaa 4560
agcaacagaa tggtaacatt ttatcgcggg taagccaatt gatccccgtc atttatctgg 4620
ctatatcctg agcggccttt gctttgtctg tttcttactt ttgccctgac gttttattgg 4680
atttttatcg acgatactct ccgtttaagc ggcaggtttc cgctgtacgt aaaagaaccg 4740
gccaaagaat tgcagtaaat atgttttatt gcgttaccgt tcattcacaa tactggagca 4800
atccagtatg ttcattctct ggtatagtgc cagcagtact tttggcaagg attcagacat 4860
cgtgatgggc gtaagagcgc aacaaaaaga aaaaacccgc cgttcgctgg tggaagccgc 4920
atttagccaa ttaagtgctg aacgcagctt cgccagcctg agtttgcgtg aagtggcgcg 4980
tgaagcgggc attgctccca cctcttttta tcggcatttc cgcgacgtag acgaactggg 5040
tctgaccatg gttgatgaga gcggtttaat gctacgccaa ctcatgcgcc aggcgcgtca 5100
gcgtatcgcc aaaggcggga gtgtgatccg cacctcggtc tccacattta tggagttcat 5160
cggtaataat cctaacgcct tccggttatt attgcgggaa cgctccggca cctccgctgc 5220
gtttcgtgcc gccgttgcgc gtgaaattca gcacttcatt gcggaacttg cggactatct 5280
ggaactcgaa aaccatatgc cgcgtgcgtt tactgaagcg caagccgaag caatggtgac 5340
aattgtcttc agtgcgggtg ccgaggcgtt ggacgtcggc gtcgaacaac gtcggcaatt 5400
agaagagcga ctggtactgc aactgcgaat gatttcgaaa ggggcttatt actggtatcg 5460
ccgtgaacaa gagaaaaccg caattattcc gggaaatgtg aaggacgagt aatgaaacaa 5520
gcaaatcaag atagaggtac gctgctgctg gcgttagttg ctggcttatc gattaatggt 5580
actttcgcag cgctgtttag ctccattgtg ccattttctg tattcccgat tatttccctg 5640
gtgctgacgg tttactgcct gcatcaacgt tatcttaatc gcactatgcc ggtaggcttg 5700
ccgggtctgg cagctgcctg ttttattctc ggcgtactgc tgtacagca 5749
<210> 8
<211> 1000
<212> DNA
<213> Artificial sequence
<400> 8
caaaaatcaa acaaaatcag acaaataacg cgataaatta ttttaactgt agcaattgag 60
cgatgatata tttatacacc ggatgaactt tcacttatcc tcacactgac aacttcggca 120
ccagacgttg cgcaaacagt gaagtttttg cgtaaccttt tccctggaac gttaaatctt 180
tgataacaat ttattgtcta acaagttgta tattttttga aacgctgttt ttgttttcct 240
tttggattaa tttcagcgta taatgcgcgc caattgactc ttgaatggtt tcagcacttt 300
ggactgtaga actcaacgac tcaaaaacag gcactcacgt tgggctgaga cacaagcaca 360
cattcctctg cacgcttttt cgatgtcacc tatccttaga gcgaggcacc accactttcg 420
taataccgga ttcgctttcc ggcagtgcgc ccagaaagca agtttctccc atccttctca 480
acttaaagac taagactgtc tattgctttt gtgaattaat ttgtatatcg aagcgccctg 540
atgggcgctt tttttattta atcgataacc agaagcaata aaaaatcaaa tcggatttca 600
ctatataatc tcactttatc taagatgaat ccgatggaag catcctgttt tctctcaatt 660
tttttatcta aaacccagcg ttcgatgctt ctttgagcga acgatcaaaa ataagtgcct 720
tcccatcaaa aaaatattct caacataaaa aactttgtgt aatacttgta acgctacatg 780
gagattaact caatctagag ggtattaata atgaaagcta ctaaactggt actgggcgcg 840
gtaatcctgg gttctactct gctggcaggt tgctccagca acgctaaaat cgatcagctg 900
tcttctgacg ttcagactct gaacgctaaa gttgaccagc tgagcaacga cgtgaacgca 960
atgcgttccg acgttcaggc tgctaaagat gacgcagctc 1000
<210> 9
<211> 1000
<212> DNA
<213> Artificial sequence
<400> 9
acgcatgagt tgtatgaatt gtagcgacgg agacgtggtg gtgctgattt ctcacactgg 60
aagaacaaaa aatctggtcg agctggcgca gctggcacgc gaaaacgacg ccatggtgat 120
tgccctcacc tctgcgggta ccccgctcgc ccgggaagca acgctggcaa ttaccctcga 180
cgtaccggaa gatactgaca tttatatgcc catggtttct cgacttgcac agctgaccgt 240
gatagatgtg ctggcgacag gatttacttt gcgacgcggt gcaaaattca gagataactt 300
gaagcgggtc aaagaagcgc tgaaggaatc gcgttttgat aagcagttac ttaatttaag 360
tgacgatcgc taaaaacgac tgtcactgtc ctaatcttat acgacatccg aatgagatta 420
atttatcgcc atcgcggcgt tatttcattc ggatttcatg ttcaagcaac acctggttgt 480
ttcagtcaac ggagtattac gtacgttgcc ggatgcggcg aaaacgccac atccggccta 540
cagttcaatg atagttcaac agatttcgaa tattctgaag caaacttgaa cttatcatca 600
ggcgaaggcc tctcctcgcg agaggctttt ttatttgatg ggataaagat ctttgcgctt 660
atacggctgg atttcgcccg gtttgcgagt tttcagcaat tttagtatcc aggtgtattg 720
ttctggtcgc ggaccaacaa aaatctcgac ttcttcattc atccgccgcg caatcgtatg 780
atcatccgcc tctaacagat catccatcgg tgggcgcacc tgaatcgtca gacgatgcgt 840
cttgccatca taaatcggaa acagcggtac aacgcgcgca cggcacactt tcatcaaacg 900
accaatcgcg ggcaacgtcg ctttataggt ggcaaagaaa tccacaaatt cgctgtgctc 960
tgggccatga tcctgatcgg gtaaataata tccccagtac 1000
<210> 10
<211> 2463
<212> DNA
<213> Artificial sequence
<400> 10
atgcgagtgt tgaagttcgg cggtacatca gtggcaaatg cagaacgttt tctgcgtgtt 60
gccgatattc tggaaagcaa tgccaggcag gggcaggtgg ccaccgtcct ctctgccccc 120
gccaaaatca ccaaccacct ggtggcgatg attgaaaaaa ccattagcgg ccaggatgct 180
ttacccaata tcagcgatgc cgaacgtatt tttgccgaac ttttgacggg actcgccgcc 240
gcccagccgg ggttcccgct ggcgcaattg aaaactttcg tcgatcagga atttgcccaa 300
ataaaacatg tcctgcatgg cattagtttg ttggggcagt gcccggatag catcaacgct 360
gcgctgattt gccgtggcga gaaaatgtcg atcgccatta tggccggcgt attagaagcg 420
cgcggtcaca acgttactgt tatcgatccg gtcgaaaaac tgctggcagt ggggcattac 480
ctcgaatcta ccgtcgatat tgctgagtcc acccgccgta ttgcggcaag ccgcattccg 540
gctgatcaca tggtgctgat ggcaggtttc accgccggta atgaaaaagg cgaactggtg 600
gtgcttggac gcaacggttc cgactactct gctgcggtgc tggctgcctg tttacgcgcc 660
gattgttgcg agatttggac ggacgttgac ggggtctata cctgcgaccc gcgtcaggtg 720
cccgatgcga ggttgttgaa gtcgatgtcc taccaggaag cgatggagct ttcctacttc 780
ggcgctaaag ttcttcaccc ccgcaccatt acccccatcg cccagttcca gatcccttgc 840
ctgattaaaa ataccggaaa tcctcaagca ccaggtacgc tcattggtgc cagccgtgat 900
gaagacgaat taccggtcaa gggcatttcc aatctgaata acatggcaat gttcagcgtt 960
tctggtccgg ggatgaaagg gatggtcggc atggcggcgc gcgtctttgc agcgatgtca 1020
cgcgcccgta ttttcgtggt gctgattacg caatcatctt ccgaatacag catcagtttc 1080
tgcgttccac aaagcgactg tgtgcgagct gaacgggcaa tgcaggaaga gttctacctg 1140
gaactgaaag aaggcttact ggagccgctg gcagtgacgg aacggctggc cattatctcg 1200
gtggtaggtg atggtatgcg caccttgcgt gggatctcgg cgaaattctt tgccgcactg 1260
gcccgcgcca atatcaacat tgtcgccatt gctcagggat cttctgaacg ctcaatctct 1320
gtcgtggtaa ataacgatga tgcgaccact ggcgtgcgcg ttactcatca gatgctgttc 1380
aataccgatc aggttatcga agtgtttgtg attggcgtcg gtggcgttgg cggtgcgctg 1440
ctggagcaac tgaagcgtca gcaaagctgg ctgaagaata aacatatcga cttacgtgtc 1500
tgcggtgttg ccaactcgaa ggctctgctc accaatgtac atggccttaa tctggaaaac 1560
tggcaggaag aactggcgca agccaaagag ccgtttaatc tcgggcgctt aattcgcctc 1620
gtgaaagaat atcatctgct gaacccggtc attgttgact gcacttccag ccaggcagtg 1680
gcggatcaat atgccgactt cctgcgcgaa ggtttccacg ttgtcacgcc gaacaaaaag 1740
gccaacacct cgtcgatgga ttactaccat cagttgcgtt atgcggcgga aaaatcgcgg 1800
cgtaaattcc tctatgacac caacgttggg gctggattac cggttattga gaacctgcaa 1860
aatctgctca atgcaggtga tgaattgatg aagttctccg gcattctttc tggttcgctt 1920
tcttatatct tcggcaagtt agacgaaggc atgagtttct ccgaggcgac cacgctggcg 1980
cgggaaatgg gttataccga accggacccg cgagatgatc tttctggtat ggatgtggcg 2040
cgtaaactat tgattctcgc tcgtgaaacg ggacgtgaac tggagctggc ggatattgaa 2100
attgaacctg tgctgcccgc agagtttaac gccgagggtg atgttgccgc ttttatggcg 2160
aatctgtcac aactcgacga tctctttgcc gcgcgcgtgg cgaaggcccg tgatgaagga 2220
aaagttttgc gctatgttgg caatattgat gaagatggcg tctgccgcgt gaagattgcc 2280
gaagtggatg gtaatgatcc gctgttcaaa gtgaaaaatg gcgaaaacgc cctggccttc 2340
tatagccact attatcagcc gctgccgttg gtactgcgcg gatatggtgc gggcaatgac 2400
gttacagctg ccggtgtctt tgctgatctg ctacgtaccc tctcatggaa gttaggagtc 2460
tga 2463
<210> 11
<211> 1104
<212> DNA
<213> Artificial sequence
<400> 11
atgaaaaatg ttggttttat cggctggcgc ggtatggtcg gctccgttct catgcaacgc 60
atggttgaag agcgcgactt cgacgccatt cgccctgtct tcttttctac ttctcagctt 120
ggccaggctg cgccgtcttt tggcggaacc actggcacac ttcaggatgc ctttgatctg 180
gaggcgctaa aggccctcga tatcattgtg acctgtcagg gcggcgatta taccaacgaa 240
atctatccaa agcttcgtga aagcggatgg caaggttact ggattgacgc agcatcgtct 300
ctgcgcatga aagatgacgc catcatcatt cttgaccccg tcaatcagga cgtcattacc 360
gacggattaa ataatggcat caggactttt gttggcggta actgtaccgt aagcctgatg 420
ttgatgtcgt tgggtggttt attcgccaat gatcttgttg attgggtgtc cgttgcaacc 480
taccaggccg cttccggcgg tggtgcgcga catatgcgtg agttattaac ccagatgggc 540
catctgtatg gccatgtggc agatgaactc gcgaccccgt cctctgctat tctcgatatc 600
gaacgcaaag tcacaacctt aacccgtagc ggtgagctgc cggtggataa ctttggcgtg 660
ccgctggcgg gtagcctgat tccgtggatc gacaaacagc tcgataacgg tcagagccgc 720
gaagagtgga aagggcaggc ggaaaccaac aagatcctca acacatcttc cgtaattccg 780
gtagatggtt tatgtgtgcg tgtcggggca ttgcgctgcc acagccaggc attcactatt 840
aaattgaaaa aagatgtgtc tattccgacc gtggaagaac tgctggctgc gcacaatccg 900
tgggcgaaag tcgttccgaa cgatcgggaa atcactatgc gtgagctaac cccagctgcc 960
gttaccggca cgctgaccac gccggtaggc cgcctgcgta agctgaatat gggaccagag 1020
ttcctgtcag cctttaccgt gggcgaccag ctgctgtggg gggccgcgga gccgctgcgt 1080
cggatgcttc gtcaactggc gtaa 1104
<210> 12
<211> 1191
<212> DNA
<213> Artificial sequence
<400> 12
atgtttgaga acattaccgc cgctcctgcc gacccgattc tgggcctggc cgatctgttt 60
cgtgccgatg aacgtcccgg caaaattaac ctcgggattg gtgtctataa agatgagacg 120
ggcaaaaccc cggtactgac cagcgtgaaa aaggctgaac agtatctgct cgaaaatgaa 180
accaccaaaa attacctcgg cattgacggc atccctgaat ttggtcgctg cactcaggaa 240
ctgctgtttg gtaaaggtag cgccctgatc aatgacaaac gtgctcgcac ggcacagact 300
ccggggggca ctggcgcact acgcgtggct gccgatttcc tggcaaaaaa taccagcgtt 360
aagcgtgtgt gggtgagcaa cccaagctgg ccgaaccata agagcgtctt taactctgca 420
ggtctggaag ttcgtgaata cgcttattat gatgcggaaa atcacactct tgacttcgat 480
gcactgatta acagcctgaa tgaagctcag gctggcgacg tagtgctgtt ccatggctgc 540
tgccataacc caaccggtat cgaccctacg ctggaacaat ggcaaacact ggcacaactc 600
tccgttgaga aaggctggtt accgctgttt gacttcgctt accagggttt tgcccgtggt 660
ctggaagaag atgctgaagg actgcgcgct ttcgcggcta tgcataaaga gctgattgtt 720
gccagttcct actctaaaaa ctttggcctg tacaacgagc gtgttggcgc ttgtactctg 780
gttgctgccg acagtgaaac cgttgatcgc gcattcagcc aaatgaaagc ggcgattcgc 840
gctaactact ctaacccacc agcacacggc gcttctgttg ttgccaccat cctgagcaac 900
gatgcgttac gtgcgatttg ggaacaagag ctgactgata tgcgccagcg tattcagcgt 960
atgcgtcagt tgttcgtcaa tacgctgcag gaaaaaggcg caaaccgcga cttcagcttt 1020
atcatcaaac agaacggcat gttctccttc agtggcctga caaaagaaca agtgctgcgt 1080
ctgcgcgaag agtttggcgt atatgcggtt gcttctggtc gcgtaaatgt ggccgggatg 1140
acaccagata acatggctcc gctgtgcgaa gcgattgtgg cagtgctgta a 1191
<210> 13
<211> 1344
<212> DNA
<213> Artificial sequence
<400> 13
atggatcaga catattctct ggagtcattc ctcaaccatg tccaaaagcg cgacccgaat 60
caaaccgagt tcgcgcaagc cgttcgtgaa gtaatgacca cactctggcc ttttcttgaa 120
caaaatccaa aatatcgcca gatgtcatta ctggagcgtc tggttgaacc ggagcgcgtg 180
atccagtttc gcgtggtatg ggttgatgat cgcaaccaga tacaggtcaa ccgtgcatgg 240
cgtgtgcagt tcagctctgc catcggcccg tacaaaggcg gtatgcgctt ccatccgtca 300
gttaaccttt ccattctcaa attcctcggc tttgaacaaa ccttcaaaaa tgccctgact 360
actctgccga tgggcggtgg taaaggcggc agcgatttcg atccgaaagg aaaaagcgaa 420
ggtgaagtga tgcgtttttg ccaggcgctg atgactgaac tgtatcgcca cctgggcgcg 480
gataccgacg ttccggcagg tgatatcggg gttggtggtc gtgaagtcgg ctttatggcg 540
gggatgatga aaaagctctc caacaatacc gcctgcgtct tcaccggtaa gggcctttca 600
tttggcggca gtcttattcg cccggaagct accggctacg gtctggttta tttcacagaa 660
gcaatgctaa aacgccacgg tatgggtttt gaagggatgc gcgtttccgt ttctggctcc 720
ggcaacgtcg cccagtacgc tatcgaaaaa gcgatggaat ttggtgctcg tgtgatcact 780
gcgtcagact ccagcggcac tgtagttgat gaaagcggat tcacgaaaga gaaactggca 840
cgtcttatcg aaatcaaagc cagccgcgat ggtcgagtgg cagattacgc caaagaattt 900
ggtctggtct atctcgaagg ccaacagccg tggtctctac cggttgatat cgccctgcct 960
tgcgccaccc agaatgaact ggatgttgac gccgcgcatc agcttatcgc taatggcgtt 1020
aaagccgtcg ccgaaggggc aaatatgccg accaccatcg aagcgactga actgttccag 1080
caggcaggcg tactatttgc accgggtaaa gcggctaatg ctggtggcgt cgctacatcg 1140
ggcctggaaa tggcacaaaa cgctgcgcgc ctgggctgga aagccgagaa agttgacgca 1200
cgtttgcatc acatcatgct ggatatccac catgcctgtg ttgagcatgg tggtgaaggt 1260
gagcaaacca actacgtgca gggcgcgaac attgccggtt ttgtgaaggt tgccgatgcg 1320
atgctggcgc agggtgtgat ttaa 1344
<210> 14
<211> 1025
<212> DNA
<213> Artificial sequence
<400> 14
catgagtttc tccgaggcga ccacgctggc gcgggaaatg ggttataccg aaccggaccc 60
gcgagatgat ctttctggta tggatgtggc gcgtaaacta ttgattctcg ctcgtgaaac 120
gggacgtgaa ctggagctgg cggatattga aattgaacct gtgctgcccg cagagtttaa 180
cgccgagggt gatgttgccg cttttatggc gaatctgtca caactcgacg atctctttgc 240
cgcgcgcgtg gcgaaggccc gtgatgaagg aaaagttttg cgctatgttg gcaatattga 300
tgaagatggc gtctgccgcg tgaagattgc cgaagtggat ggtaatgatc cgctgttcaa 360
agtgaaaaat ggcgaaaacg ccctggcctt ctatagccac tattatcagc cgctgccgtt 420
ggtactgcgc ggatatggtg cgggcaatga cgttacagct gccggtgtct ttgctgatct 480
gctacgtacc ctctcatgga agttaggagt ctgacaatct attcattatc tcaatcaggc 540
cgggtttgct tttatgcagc ccggcttttt tatgaagaaa ttatggagaa aaatgacagg 600
gaaaaaggag aaattctcaa taaatgcggt aacttagaga ttaggattgc ggagaataac 660
aaccgccgtt ctcatcgagt aatctccgga tatcgaccca taacgggcaa tgataaaagg 720
agtaacctgt gaaaaagatg caatctatcg tactcgcact ttccctggtt ctggtcgctc 780
ccatggcagc acaggctgcg gaaattacgt tagtcccgtc agtaaaatta cagataggcg 840
atcgtgataa tcgtggctat tactgggatg gaggtcactg gcgcgaccac ggctggtgga 900
aacaacatta tgaatggcga ggcaatcgct ggcacctaca cggaccgccg ccaccgccgc 960
gccaccataa gaaagctcct catgatcatc acggcggtca tggtccaggc aaacatcacc 1020
gctaa 1025
<210> 15
<211> 1000
<212> DNA
<213> Artificial sequence
<400> 15
ttacaggtgt tacattgccc tgggcatacg ccgggtcatg tcgtgttttt tgatgatcgg 60
gcaaagctgc tgatttctgg cgatgttatt ttcaaaggcg gagtagggcg cagtgacttc 120
ccgcgtggcg atcataatca actgatttct tcaatcaaag ataaattgct gccactgggg 180
gatgacgtga tatttattcc gggtcacgga ccattatcca cacttggtta tgaacgcctg 240
cataatccct tcctgcaaga cgaaatgccc gtctggtaag gcacataaaa aagcccgctt 300
ttaatgctgg cctggatttc tggcaaagtg cgctttgttt atgccggatg cggcacgagc 360
gccttatccg gcctacaaaa tcgtgcaaat tcaaaatatt gcaggggacg cgtaggcctg 420
ataagcgtag cgcatcaggc aatgttgcgt ttgtcatcag tctcagcccg cttttcagcg 480
ggcttcattg tttttaatgc gacgaggttc cattatggtt acagaaggga agtccgctat 540
cagggtaacg ggagatttac aaaattccaa ctattactga tgaaaacgca ggctgttttt 600
gcaagacgtg agattgctct ggaaggtata aaaaaaacag gaccaaagtc ctgttttttc 660
ggcatttaac aaagaggtgt gctattagaa ctggtaaacg atacccacag caacggtgtc 720
gtctgaacct acgcccagtt tgttgtcaga atcgatctgg ttgatgatgt agtcaacata 780
ggtggacatg tttttgttga agtagtaggt tgcgcccact tcaaagtagt tcaccagatc 840
aacatcaccg ataccttcta cgtctttcgc tttagatttg gtgtaagcga tggacggacg 900
cagaccgaaa tcgaactggt attgcgcaac taacagaacg tcttgcgttt tgttggcgaa 960
gccgctggtg tttgtaaatt tattagtgat cggcgtagcg 1000
<210> 16
<211> 1437
<212> DNA
<213> Artificial sequence
<400> 16
atgtcaaaca acattcgtat cgaagaagat ctgttgggta ccagggaagt tccagctgat 60
gcctactatg gtgttcacac tctgagagcg attgaaaact tctatatcag caacaacaaa 120
atcagtgata ttcctgaatt tgttcgcggt atggtaatgg ttaaaaaagc cgcagctatg 180
gcaaacaaag agctgcaaac cattcctaaa agtgtagcga atgccatcat tgccgcatgt 240
gatgaagtcc tgaacaacgg aaaatgcatg gatcagttcc cggtagacgt ctaccagggc 300
ggcgcaggta cttccgtaaa catgaacacc aacgaagtgc tggccaatat cggtctggaa 360
ctgatgggtc accaaaaagg tgaatatcag tacctgaacc cgaacgacca tgttaacaaa 420
tgtcagtcca ctaacgacgc ctacccgacc ggtttccgta tcgcagttta ctcttccctg 480
attaagctgg tagatgcgat taaccaactg cgtgaaggct ttgaacgtaa agctgtcgaa 540
ttccaggaca tcctgaaaat gggtcgtacc cagctgcagg acgcagtacc gatgaccctc 600
ggtcaggaat tccgcgcttt cagcatcctg ctgaaagaag aagtgaaaaa catccaacgt 660
accgctgaac tgctgctgga agttaacctt ggtgcaacag caatcggtac tggtctgaac 720
acgccgaaag agtactctcc gctggcagtg aaaaaactgg ctgaagttac tggcttccca 780
tgcgtaccgg ctgaagacct gatcgaagcg acctctgact gcggcgctta tgttatggtt 840
cacggcgcgc tgaaacgcct ggctgtgaag atgtccaaaa tctgtaacga cctgcgcttg 900
ctctcttcag gcccacgtgc cggcctgaac gagatcaacc tgccggaact gcaggcgggc 960
tcttccatca tgccagctaa agtaaacccg gttgttccgg aagtggttaa ccaggtatgc 1020
ttcaaagtca tcggtaacga caccactgtt accatggcag cagaagcagg tcagctgcag 1080
ttgaacgtta tggagccggt cattggccag gccatgttcg aatccgttca cattctgacc 1140
aacgcttgct acaacctgct ggaaaaatgc attaacggca tcactgctaa caaagaagtg 1200
tgcgaaggtt acgtttacaa ctctatcggt atcgttactt acctgaaccc gttcatcggt 1260
caccacaacg gtgacatcgt gggtaaaatc tgtgccgaaa ccggtaagag tgtacgtgaa 1320
gtcgttctgg aacgcggtct gttgactgaa gcggaacttg acgatatttt ctccgtacag 1380
aatctgatgc acccggctta caaagcaaaa cgctatactg atgaaagcga acagtaa 1437
<210> 17
<211> 21
<212> DNA
<213> Artificial sequence
<400> 17
tactagagtc acacaggact a 21
<210> 18
<211> 17
<212> DNA
<213> Artificial sequence
<400> 18
cacacaggaa acagacc 17
<210> 19
<211> 17
<212> DNA
<213> Artificial sequence
<400> 19
cacacaggaa acagacc 17
<210> 20
<211> 1068
<212> DNA
<213> Artificial sequence
<400> 20
acgtggaaaa tttaatgaca aaatccttgt tgctaaagat atgacgacca ttttgtctac 60
agttctctga gaagcttttt aatagaggcg tcgccagctc cttgccagaa aatttatcct 120
cgagttcttt ataaaacaat tcactcaggg tttggtgttc atttgtctgg gctgtattat 180
taatatttgc agagaaagaa ctacgaggaa tacgagtaat catttaaata tctcattgtt 240
tattgatgtc ttgaatttta actatcagaa cagtgaaaaa atttaatatg attacaacta 300
aagaaatatc ataaatcgct caatctcata atgcagccgt aaaagtttcg gtggaatgag 360
atcttgcgat tttgttaata attaagtggt ttgatgttta aaaataatgc tgagttaata 420
aaagtgtgtg aagtgtatga cattaagtta ttttggcgtc aatgcgatta acagacaccc 480
ttattctatt gccactcagg tatgatgggc agaatattgc ctctgcccgc cagaaaaagg 540
acagtctctt ttttctgtat cgtggaaatc attttcattt ttattgttag ctaatgcaat 600
agttactgaa ctgatccgat gagttaatgt tgaacaaatc tcatgttgcg tggtggtcgc 660
ttttaccaca gatgcgttta tgccagtatg gtttgttgaa tttttattaa atctgggttg 720
agcgtgtcgg gagcaagtgt gagcagcaaa gtggaacaac tgcgtgcgca gttaaatgaa 780
cgtattctgg tgctggacgg cggtatgggc accatgatcc agagttatcg actgaacgaa 840
gccgattttc gtggtgaacg ctttgccgac tggccatgcg acctcaaagg caacaacgac 900
ctgctggtac tcagtaaacc ggaagtgatc gccgctatcc acaacgccta ctttgaagcg 960
ggcgcggata tcatcgaaac caacaccttc aactccacga ccattgcgat ggcggattac 1020
cagatggaat ccctgtcggc ggaaatcaac tttgcggcgg cgaaactg 1068
<210> 21
<211> 30
<212> DNA
<213> Artificial sequence
<400> 21
ttgacaatta atcatccggc tcgtataatg 30

Claims (5)

1.大肠杆菌HS02,其在中国微生物菌种保藏管理委员会普通微生物中心的保藏号为CGMCC No.21837。
2.重组菌,其特征在于:所述重组菌是通过对底盘宿主菌进行如下b1)和b2)中至少b2)所示改造后实现:
b1)加强所述底盘宿主菌中的天冬氨酸到高丝氨酸代谢途径;所述加强所述底盘宿主菌中的天冬氨酸到高丝氨酸代谢途径是通过如下实现的:提高所述底盘宿主菌中天冬氨酸激酶I突变体thrA*的活性或其编码基因的表达量,并提高所述底盘宿主菌中天冬氨酸半醛脱氢酶asd的活性或其编码基因的表达量;
b2)向所述底盘宿主菌中导入天冬氨酸氨基裂解酶aspA的编码基因,以及天冬氨酸氨基转移酶aspC的编码基因和谷氨酸脱氢酶gdhA的编码基因;并使所述天冬氨酸氨基裂解酶aspA的编码基因在强度为2800AU的RBS序列的调控下进行表达,使所述天冬氨酸氨基转移酶aspC的编码基因在强度为3600AU的RBS序列的调控下进行表达,使所述谷氨酸脱氢酶gdhA的编码基因在强度为1000AU的RBS序列的调控下进行表达;
用于调控所述天冬氨酸氨基裂解酶aspA的编码基因表达的强度为2800AU的RBS序列为SEQ ID No.17;
用于调控所述天冬氨酸氨基转移酶aspC的编码基因表达的强度为3600AU的RBS序列为SEQ ID No.18;
用于调控所述谷氨酸脱氢酶gdhA的编码基因表达的强度为1000AU的RBS序列为SEQ IDNo.19;
所述底盘宿主菌为在具有L-高丝氨酸耐受性且具有天冬氨酸到苏氨酸通路的出发细菌中进行如下a1)-a8)所示全部改造后得到的菌:
a1)降低所述出发细菌中DNA结合转录抑制因子 lacI的活性或其编码基因的表达量;
a2)降低所述出发细菌中高丝氨酸琥珀酰转移酶metA的活性或其编码基因的表达量;
a3)降低所述出发细菌中二氨基庚酸脱羧酶lysA的活性或其编码基因的表达量;
a4)降低所述出发细菌中的高丝氨酸激酶thrB的活性或其编码基因的表达量;
a5)降低所述出发细菌中的可溶性吡啶核苷酸转移酶sthA的活性或其编码基因的表达量;
a6)提高所述出发细菌中磷酸烯醇式丙酮酸羧化酶ppc的活性或其编码基因的表达量;
a7)提高所述出发细菌中吡啶核苷酸转移酶pntAB的活性或其编码基因的表达量;
a8)降低所述出发细菌中的乙醛酸途径抑制蛋白iclR的活性或其编码基因的表达量;
所述出发细菌为权利要求1所述大肠杆菌HS02。
3.如下任一方法:
P1、一种制备权利要求2所述重组菌的方法,所述重组菌是通过对底盘宿主菌进行如下b1)和b2)中至少b2)所示改造后实现:
b1)加强所述底盘宿主菌中的天冬氨酸到高丝氨酸代谢途径;所述加强所述底盘宿主菌中的天冬氨酸到高丝氨酸代谢途径是通过如下实现的:提高所述底盘宿主菌中天冬氨酸激酶I突变体thrA*的活性或其编码基因的表达量,并提高所述底盘宿主菌中天冬氨酸半醛脱氢酶asd的活性或其编码基因的表达量;
b2)向所述底盘宿主菌中导入天冬氨酸氨基裂解酶aspA的编码基因,以及天冬氨酸氨基转移酶aspC的编码基因和谷氨酸脱氢酶gdhA的编码基因;并使所述天冬氨酸氨基裂解酶aspA的编码基因在强度为2800AU的RBS序列的调控下进行表达,使所述天冬氨酸氨基转移酶aspC的编码基因在强度为3600AU的RBS序列的调控下进行表达,使所述谷氨酸脱氢酶gdhA的编码基因在强度为1000AU的RBS序列的调控下进行表达;
用于调控所述天冬氨酸氨基裂解酶aspA的编码基因表达的强度为2800AU的RBS序列为SEQ ID No.17;
用于调控所述天冬氨酸氨基转移酶aspC的编码基因表达的强度为3600AU的RBS序列为SEQ ID No.18;
用于调控所述谷氨酸脱氢酶gdhA的编码基因表达的强度为1000AU的RBS序列为SEQ IDNo.19;
P2、一种制备权利要求2中所述的底盘宿主菌的方法,包括:按照权利要求2中的a1)-a8)对所述出发细菌进行改造,所述出发细菌为权利要求1所述大肠杆菌HS02。
4.如下任一应用:
Q1、权利要求2所述的重组菌在生产高丝氨酸中的应用;
Q2、权利要求1所述的大肠杆菌HS02在制备权利要求2所述的重组菌中的应用。
5.一种生产高丝氨酸的方法,包括如下步骤:发酵权利要求2所述的重组菌,得到高丝氨酸。
CN202110290555.4A 2021-03-18 2021-03-18 一株耐受l-高丝氨酸的大肠杆菌及其应用 Active CN113956992B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110290555.4A CN113956992B (zh) 2021-03-18 2021-03-18 一株耐受l-高丝氨酸的大肠杆菌及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110290555.4A CN113956992B (zh) 2021-03-18 2021-03-18 一株耐受l-高丝氨酸的大肠杆菌及其应用

Publications (2)

Publication Number Publication Date
CN113956992A CN113956992A (zh) 2022-01-21
CN113956992B true CN113956992B (zh) 2023-09-01

Family

ID=79460200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110290555.4A Active CN113956992B (zh) 2021-03-18 2021-03-18 一株耐受l-高丝氨酸的大肠杆菌及其应用

Country Status (1)

Country Link
CN (1) CN113956992B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115109738B (zh) * 2022-06-15 2024-03-08 江南大学 一种生产l-高丝氨酸的重组大肠杆菌及其应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108130306A (zh) * 2018-01-10 2018-06-08 天津科技大学 高产尿苷的基因工程菌及其构建方法与应用
CN111286520A (zh) * 2018-12-10 2020-06-16 上海凯赛生物技术股份有限公司 用于发酵生产l-赖氨酸的重组dna、菌株及其应用
CN111705030A (zh) * 2020-07-07 2020-09-25 浙江工业大学 高产l-高丝氨酸的大肠杆菌基因工程菌、构建方法及菌株
CN112063572A (zh) * 2020-09-22 2020-12-11 浙江工业大学 一种高产o-乙酰-l-高丝氨酸的重组大肠杆菌及其应用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108130306A (zh) * 2018-01-10 2018-06-08 天津科技大学 高产尿苷的基因工程菌及其构建方法与应用
CN111286520A (zh) * 2018-12-10 2020-06-16 上海凯赛生物技术股份有限公司 用于发酵生产l-赖氨酸的重组dna、菌株及其应用
CN111705030A (zh) * 2020-07-07 2020-09-25 浙江工业大学 高产l-高丝氨酸的大肠杆菌基因工程菌、构建方法及菌株
CN112063572A (zh) * 2020-09-22 2020-12-11 浙江工业大学 一种高产o-乙酰-l-高丝氨酸的重组大肠杆菌及其应用

Also Published As

Publication number Publication date
CN113956992A (zh) 2022-01-21

Similar Documents

Publication Publication Date Title
KR101483395B1 (ko) L-라이신 생산능을 갖는 미생물을 이용하여 l-라이신을 생산하는 방법
EP1792976B1 (en) Microorganism of corynebacterium genus having enhanced L-lysine production ability and method of producing L-lysine using the same
KR101947959B1 (ko) 변이형 호모세린 디하이드로게나제 및 이를 이용한 호모세린 또는 호모세린 유래 l-아미노산의 생산 방법
US20090093030A1 (en) fadR KNOCK-OUT MICROORGANISM AND METHODS FOR PRODUCING L-THREONINE
KR20020089320A (ko) 유전자 증폭에 의해 증가된 리신 생산
JP6375391B2 (ja) O−アセチル−ホモセリンを生産する微生物及びこれを用いてo−アセチル−ホモセリンを生産する方法
JP6646075B2 (ja) L−リジンを生産する微生物及びそれを用いたl−リジン生産方法
CN113249347B (zh) 丙酮酸脱氢酶的突变体及其用于生产l-氨基酸的方法
CN113122487B (zh) 一种高产l-高丝氨酸的重组菌及其制备方法与应用
CN111411092B (zh) 高产l-赖氨酸的谷氨酸棒状杆菌及其应用
CN111705030A (zh) 高产l-高丝氨酸的大肠杆菌基因工程菌、构建方法及菌株
KR100898246B1 (ko) 신규한 코리네박테리움 글루타미쿰 프로모터
CN113956992B (zh) 一株耐受l-高丝氨酸的大肠杆菌及其应用
JP4034737B2 (ja) L−スレオニンの製造方法
US10597686B2 (en) Polypeptide having the activity of exporting O-acetyl-homoserine
KR102097065B1 (ko) 4-히드록시부티레이트 생산 균주 및 이를 이용한 4-히드록시부티레이트의 혐기적 생산 방법
KR102126951B1 (ko) 디하이드로디피콜린산 리덕타제 변이형 폴리펩티드 및 이를 이용한 l-쓰레오닌 생산방법
CN113846132A (zh) 苏氨酸生产菌种的构建及生产苏氨酸的方法
CN115975957A (zh) 大肠埃希氏菌鞭毛特异性ATP合成酶基因fliI及其突变体在L-氨基酸生产中的应用
JP4334565B2 (ja) 染色体内のtdcBC及びpckA遺伝子が不活性化された微生物及びこれを用いてL−トレオニンを製造する方法
CN107109357A (zh) 能生产o‑琥珀酰高丝氨酸或琥珀酸的微生物和用其生产琥珀酸或o‑琥珀酰高丝氨酸方法
CN115667525A (zh) 具有增强的l-支链氨基酸生产能力的微生物及使用该微生物生产l-支链氨基酸的方法
CN115028694A (zh) 与l-谷氨酸产量相关的蛋白及其相关生物材料和应用
WO2005023999A1 (en) A method for producing l-threonine

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant