CN114605509A - Yh66_01475蛋白及其编码基因在调控细菌精氨酸产量中的应用 - Google Patents

Yh66_01475蛋白及其编码基因在调控细菌精氨酸产量中的应用 Download PDF

Info

Publication number
CN114605509A
CN114605509A CN202210247165.3A CN202210247165A CN114605509A CN 114605509 A CN114605509 A CN 114605509A CN 202210247165 A CN202210247165 A CN 202210247165A CN 114605509 A CN114605509 A CN 114605509A
Authority
CN
China
Prior art keywords
gene
mutant
protein
arginine
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210247165.3A
Other languages
English (en)
Inventor
孟刚
魏爱英
贾慧萍
蔡卫卫
田斌
付丽霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningxia Eppen Biotech Co ltd
Original Assignee
Ningxia Eppen Biotech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningxia Eppen Biotech Co ltd filed Critical Ningxia Eppen Biotech Co ltd
Priority to CN202210247165.3A priority Critical patent/CN114605509A/zh
Publication of CN114605509A publication Critical patent/CN114605509A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/34Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/77Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/10Citrulline; Arginine; Ornithine

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公开了YH66_01475蛋白及其编码基因在调控细菌精氨酸产量中的应用。本发明公开的YH66_01475突变体是将YH66_01475蛋白质第32位氨基酸残基由精氨酸突变为半胱氨酸得到的蛋白质。本发明首先通过对YH66_01475基因进行单点突变得到YH66_01475C94T,然后通过对构建的YH66_01475或突变基因的过表达重组菌以及YH66_01475敲除重组菌进行发酵培养发现,YH66_01475基因或其突变基因可以调控细菌L‑精氨酸产量。本发明首次发现YH66_01475基因参与精氨酸的生物合成,对于培育高产、高质量菌种,以及精氨酸工业化生产具有重大的应用价值。

Description

YH66_01475蛋白及其编码基因在调控细菌精氨酸产量中的 应用
技术领域
本发明属于生物技术领域,具体涉及YH66_01475蛋白及其编码基因在调控细菌精氨酸产量中的应用。
背景技术
L-精氨酸是人体和动物的一种半必需氨基酸,具有重要的生化和生理学意义,因此被广泛应用于食品和医药工业中,尤其在医药工业领域,其作为提高人体免疫力,防治心血管疾病等治疗用药已受到人们的关注。
随着L-精氨酸的市场需求不断增加,选育高产、稳定的生产菌种,促进L-精氨酸在微生物体内的积累,进一步提高L-精氨酸的产量一直是L-精氨酸发酵工业技术开发和发酵工程化研究的热点,并且也将一直伴随L-精氨酸发酵工业的发展,对于促进L-精氨酸产业化的进程具有重要的意义。
棒杆菌属(Corynebacterium)微生物通过环形步骤途径实现L-精氨酸的生物合成,L-精氨酸从L-谷氨酸经由N-乙酰谷氨酸(N-acetylglutamate)、N-乙酰谷氨酰磷酸(N-acetylglutamyl phosphate)、N-乙酰谷氨酸半醛(N-acetylglutamate semialdehyde)、N-乙酰鸟氨酸(N-acetylornithine)、鸟氨酸(ornithine)、瓜氨酸(citrulline)以及精氨琥珀酸(argininosuccinate)而合成。
目前发酵法生产L-精氨酸常采用的棒杆菌属微生物有谷氨酸棒杆菌,但由于谷氨酸棒杆菌受到细胞内精氨酸的反馈抑制,从而使其在L-精氨酸产量方面存在局限。
发明内容
本发明要解决的技术问题是如何提高精氨酸产量。
为了解决上述技术问题,本发明首先提供了一种YH66_01475突变体。
本发明提供的YH66_01475突变体是将YH66_01475蛋白质第32位氨基酸残基由精氨酸突变为其他氨基酸残基得到的蛋白质;
所述YH66_01475蛋白质为如下A1)-A3)中的任一种:
A1)SEQ ID No.2所示的氨基酸序列组成的蛋白质;
A2)将A1)所示的氨基酸序列经过除第32位氨基酸残基以外的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与细菌产精氨酸相关的蛋白质;
A3)来源于细菌且与A1)或A2)具有95%以上同一性且与细菌产精氨酸相关的蛋白质。
上述A2)所述的蛋白质中,所述一个或几个氨基酸残基的取代和/或缺失和/或添加为不超过10个氨基酸残基的取代和/或缺失和/或添加。
上述A3)所述的蛋白质中,这里使用的术语“同一性”指与天然氨基酸序列的序列相似性。“同一性”包括与本发明的SEQ ID No.2所示的氨基酸序列具有95%或更高,或96%或更高,或97%或更高,或98%或更高,或99%或更高同一性的氨基酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
上述A1)或A2)或A3)所述的蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。
进一步的,所述YH66_01475突变体是将YH66_01475蛋白质第32位氨基酸残基由精氨酸突变为半胱氨酸得到的蛋白质(对应本发明实施例中的YH66_01475C94T蛋白质)。
更进一步的,所述YH66_01475突变体(YH66_01475C94T蛋白质)是SEQ ID No.4所示的氨基酸序列组成的蛋白质。
为了解决上述技术问题,本发明又提供了与YH66_01475突变体相关的生物材料。
本发明提供的与YH66_01475突变体相关的生物材料为如下B1)至B4)中的任一种:
B1)编码上述YH66_01475突变体的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物。
为了解决上述技术问题,本发明还提供了上述YH66_01475蛋白质或与上述YH66_01475蛋白质相关的生物材料或上述YH66_01475突变体或与上述YH66_01475突变体相关的生物材料的新用途。
本发明提供了上述YH66_01475蛋白质或与上述YH66_01475蛋白质相关的生物材料或上述YH66_01475突变体或与上述YH66_01475突变体相关的生物材料在如下X1)至X3)中任一种中的应用:
X1)调控细菌精氨酸产量;
X2)构建产精氨酸工程菌;
X3)制备精氨酸;
与YH66_01475蛋白质相关的生物材料为如下D1)至D4)中的任一种:
D1)编码所述YH66_01475蛋白质的核酸分子;
D2)含有D1)所述核酸分子的表达盒;
D3)含有D1)所述核酸分子的重组载体、或含有D2)所述表达盒的重组载体;
D4)含有D1)所述核酸分子的重组微生物、或含有D2)所述表达盒的重组微生物、或含有D3)所述重组载体的重组微生物。
上述生物材料或应用中,B1)所述编码YH66_01475突变体的核酸分子为如下C1)或C2)中的任一种:
C1)核苷酸序列为SEQ ID No.3的DNA分子;
C2)将SEQ ID No.3所示的核苷酸序列经过修饰和/或一个或几个核苷酸的取代和/或缺失和/或添加得到的与C1)所示的DNA分子具有90%以上的同一性,且具有相同功能的DNA分子。
D1)所述编码YH66_01475蛋白质的核酸分子为如下E1)或E2)中的任一种:
E1)核苷酸序列为SEQ ID No.1的DNA分子;
E2)将SEQ ID No.1所示的核苷酸序列经过修饰和/或一个或几个核苷酸的取代和/或缺失和/或添加得到的与E1)所示的DNA分子具有90%以上的同一性,且具有相同功能的DNA分子。
其中,SEQ ID No.1所示的DNA分子为谷氨酸棒杆菌(Corynebacteriumglutamicum)CGMCC No.20516中的YH66_01475基因,其编码的YH66_01475蛋白质的氨基酸序列如SEQ ID No.2所示。在本发明中通过引入点突变,得到SEQ ID No.3所示的YH66_01475C94T基因,其编码的YH66_01475C94T蛋白质的氨基酸序列如SEQ ID No.4所示。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化和点突变的方法,对本发明的编码YH66_01475蛋白质或YH66_01475突变体的核苷酸序列进行突变。那些经过人工修饰的,具有编码YH66_01475蛋白质或YH66_01475突变体的核苷酸序列90%或者更高同一性的核苷酸,只要编码YH66_01475蛋白质或YH66_01475突变体且具有相同功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。
这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码SEQ ID No.2或SEQ ID No.4所示的氨基酸序列组成的蛋白质的核苷酸序列具有90%或更高,或91%或更高,或92%或更高,或93%或更高,或94%或更高,或95%或更高,或96%或更高,或97%或更高,或98%或更高,或99%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
所述严格条件是在2×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次5min;或,0.5×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次15min;或,0.1×SSPE(或0.1×SSC)、0.1%SDS的溶液中,65℃条件下杂交并洗膜。
上述生物材料或应用中,B2)所述含有编码YH66_01475突变体的核酸分子的表达盒是指能够在宿主细胞中表达YH66_01475突变体的DNA,该DNA不但可包括启动YH66_01475突变体基因转录的启动子,还可包括终止YH66_01475突变体基因转录的终止子。进一步,所述表达盒还可包括增强子序列。D2)所述含有编码YH66_01475蛋白质的核酸分子的表达盒是指能够在宿主细胞中表达YH66_01475蛋白质的DNA,该DNA不但可包括启动YH66_01475基因转录的启动子,还可包括终止YH66_01475基因转录的终止子。进一步,所述表达盒还可包括增强子序列。
上述生物材料或应用中,B3)或D3)所述载体可为质粒、黏粒、噬菌体或病毒载体。所述质粒具体可为pK18mobsacB质粒或pXMJ19质粒。
在本发明的一个具体实施例中,所述重组载体为重组载体pK18-YH66_01475C94T
在本发明的另一个具体实施例中,所述重组载体为重组载体pK18-YH66_01475OE或重组载体pK18-YH66_01475C94TOE。
在本发明的又一个具体实施例中,所述重组载体为重组载体pXMJ19-YH66_01475或重组载体pXMJ19-YH66_01475C94T
上述生物材料中,B4)或D4)所述微生物可为酵母、细菌、藻或真菌。
进一步的,所述细菌可为任一具有产精氨酸能力的细菌,如来自短杆菌属(Brevibacterium)、棒杆菌属(Corynebacterium)、埃希氏菌属(Escherichia)、气杆菌属(Aerobacter)、微球菌属(Micrococcus)、黄杆菌属(Flavobacterium)或芽胞杆菌属(Bacillus)的细菌等。
更进一步的,所述细菌包括但不限于谷氨酸棒杆菌(Corynebacteriumglutamicum)、黄色短杆菌(Brevibacterium flavum)、乳酸发酵短杆菌(Brevibacteriumlactofermentum)、产谷氨酸微球菌(Micrococcus glutamicus)、产氨短杆菌(Brevibacterum ammoniagenes)、大肠杆菌(Escherichia coli)、产气气杆菌(Aerobacteraerogenes)。
在本发明的一个具体实施例中,所述微生物为谷氨酸棒杆菌(Corynebacteriumglutamicum)CGMCC No.20516,该菌株名称为YPARG01,已于2020年8月10日保藏于中国微生物菌种保藏管理委员会普通微生物中心(简称CGMCC,地址为:北京市朝阳区北辰西路1号院3号,中国科学院微生物研究所),保藏登记号为CGMCC No.20516。
上述应用中,调控为正调控。具体体现为当细菌中YH66_01475蛋白质或YH66_01475突变体含量或活性提高时,所述细菌精氨酸产量提高;当细菌中YH66_01475蛋白质含量或活性降低时,所述细菌精氨酸产量降低。
为了解决上述技术问题,本发明还提供了提高YH66_01475蛋白质或YH66_01475突变体含量和/或活性的物质或提高YH66_01475基因或YH66_01475突变体基因表达量的物质的新用途。
本发明提供了提高YH66_01475蛋白质或YH66_01475突变体含量和/或活性的物质或提高YH66_01475基因或YH66_01475突变体基因表达量的物质在如下Y1)至Y3)中任一种中的应用:
Y1)提高细菌精氨酸产量;
Y2)构建产精氨酸工程菌;
Y3)制备精氨酸。
进一步的,所述提高YH66_01475基因表达量的物质可为YH66_01475基因或含有所述YH66_01475基因的重组载体。
所述提高YH66_01475突变体基因表达量的物质可为YH66_01475突变体基因或含有所述YH66_01475突变体基因的重组载体。
更进一步的,含有所述YH66_01475基因的重组载体具体可为重组载体pK18-YH66_01475OE或重组载体pXMJ19-YH66_01475。
含有所述YH66_01475突变体基因的重组载体具体可为重组载体pK18-YH66_01475C94TOE或重组载体pXMJ19-YH66_01475C94T
为了解决上述技术问题,本发明还提供了一种提高细菌精氨酸产量的方法。
本发明提供的提高细菌精氨酸产量的方法为如下M1)或M2):
所述M1)包括如下步骤:将细菌基因组中的YH66_01475基因替换为YH66_01475突变体基因,实现细菌精氨酸产量的提高;
所述M2)包括如下步骤:提高细菌中YH66_01475蛋白质或YH66_01475突变体含量和/或活性,或提高细菌中YH66_01475基因或YH66_01475突变体基因表达量,实现细菌精氨酸产量的提高。
为了解决上述技术问题,本发明还提供了一种产精氨酸工程菌的构建方法。
本发明提供的产精氨酸工程菌的构建方法为如下N1)或N2):
所述N1)包括如下步骤:将细菌基因组中的YH66_01475基因替换为YH66_01475突变体基因,得到所述产精氨酸工程菌;
所述N2)包括如下步骤:提高细菌中YH66_01475蛋白质或YH66_01475突变体含量和/或活性,或提高细菌中YH66_01475基因或YH66_01475突变体基因表达量,得到所述产精氨酸工程菌;
上述任一所述应用或方法中,所述YH66_01475突变体具体为YH66_01475C94T蛋白质,具体为SEQ ID No.4所示的氨基酸序列组成的蛋白质。
所述YH66_01475突变体基因具体为YH66_01475C94T基因,具体为SEQ ID No.3所示的DNA分子。
按照上述产精氨酸工程菌的构建方法构建得到的产精氨酸工程菌在制备精氨酸中的应用也属于本发明的保护范围。
为了解决上述技术问题,本发明最后提供了一种制备精氨酸的方法。
本发明提供的制备精氨酸的方法包括如下步骤:发酵培养按照上述产精氨酸工程菌的构建方法构建得到的产精氨酸工程菌,得到所述精氨酸。
所述发酵培养方法可按照现有技术中的常规试验方法进行。也可采用优化和改进后的常规试验方法进行。所述发酵培养采用的培养基如实施例中的表3所示。所述发酵培养条件如实施例中的表4所示。
上述任一所述应用或方法中,所述精氨酸具体为L-精氨酸。
本发明首先通过对YH66_01475基因进行单点突变得到YH66_01475C94T基因,然后通过对构建的YH66_01475或突变基因的过表达重组菌以及YH66_01475敲除重组菌进行发酵培养发现,YH66_01475基因或其突变基因可以调控细菌L-精氨酸产量。本发明首次发现YH66_01475基因参与精氨酸的生物合成,对于培育符合工业化生产的高产、高质量菌种,以及精氨酸工业化生产具有重大的应用价值。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、构建包含点突变的YH66_01475基因编码区的重组载体
依据NCBI公布的黄色短杆菌(Brevibacterium flavum)ATCC15168基因组序列,设计并合成两对扩增YH66_01475基因编码区的引物,以等位基因置换的方式在谷氨酸棒杆菌(Corynebacterium glutamicum)CGMCC 20516(经测序确认该菌株染色体上保留有野生型的YH66_01475基因)的YH66_01475基因编码区(SEQ ID No.1)中引入点突变,所述点突变为将YH66_01475基因的核苷酸序列(SEQ ID No.1)中的第94位胞嘧啶(C)突变为胸腺嘧啶(T),得到SEQ ID No.3所示的DNA分子(突变的YH66_01475基因),并将其命名为YH66_01475C94T
其中,SEQ ID No.1所示的DNA分子编码氨基酸序列为SEQ ID No.2的蛋白质(所述蛋白质名称为蛋白质YH66_01475)。SEQ ID No.3所示的DNA分子编码氨基酸序列为SEQ IDNo.4的突变蛋白质(所述突变蛋白质名称为YH66_01475C94T)。所述突变蛋白质YH66_01475C94T氨基酸序列(SEQ ID No.4)中的第32位半胱氨酸(C)由精氨酸(R)突变而来。
采用NEBuilder重组技术进行基因定点突变,引物设计如下(上海invitrogen公司合成),加红色粗字体的碱基为突变位置:
P1:5'-CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGAGGAGTTGGATCCATGACCT-3';
P2:
Figure BDA0003545215060000051
P3:
Figure BDA0003545215060000052
P4:5'-CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCTACGGCCTAATCCTCACCGC-3'。
构建方法:以黄色短杆菌ATCC15168为模板,分别采用引物P1/P2和P3/P4进行PCR扩增,获得两条分别带有突变碱基,大小分别为670bp和668bp的YH66_01475基因编码区的DNA片段(YH66_01475Up和YH66_01475Down)。
PCR扩增体系为:10×Ex Taq Buffer 5μL,dNTP Mixture(各2.5mM)4μL,Mg2+(25mM)4μL,引物(10pM)各2μL,Ex Taq(5U/μL)0.25μL,总体积50μL。
PCR扩增反应程序为:94℃预变性5min,(94℃变性30s;52℃退火30s;72℃延伸40s;30个循环),72℃过度延伸10min。
将上述两条DNA片段(YH66_01475Up和YH66_01475Down)经琼脂糖凝胶电泳分离纯化后,与经过酶切(Xbal I/BamH I)后纯化的pK18mobsacB质粒(购自Addgene公司,用XbalI/BamH I酶切)用NEBuilder酶(购自NEB公司)50℃连接30min,连接产物转化后长出的单克隆经PCR鉴定获得阳性重组载体pK18-YH66_01475C94T,该重组载体上含有卡那霉素抗性标记。将酶切正确的重组载体pK18-YH66_01475C94T送测序公司测序鉴定,并将含有正确点突变(C-T)的重组载体pK18-YH66_01475C94T保存备用。
重组载体pK18-YH66_01475C94T中YH66_01475C94T Up-Down DNA片段(YH66_01475Up-Down,SEQ ID No.5)大小为1304bp,由于含有突变位点,可导致菌株谷氨酸棒杆菌CGMCC 20516中YH66_01475基因编码区的第94位胞嘧啶(C)突变为胸腺嘧啶(T),最终导致编码蛋白的第32位精氨酸(R)变为半胱氨酸(C)。
重组载体pK18-YH66_01475C94T是将pK18mobsacB载体的Xbal I和/BamH I识别位点间的片段(小片段)替换为序列表中SEQ ID No.5第37-1266位所示的DNA片段,且保持pK18mobsacB载体的其他序列不变,得到的重组载体。
重组载体pK18-YH66_01475C94T含有SEQ ID No.3所示的突变基因YH66_01475C94T的第1-714位所示的DNA分子。
实施例2、构建包含基因YH66_01475C94T的工程菌株
构建方法:将实施例1中的等位替换质粒(pK18-YH66_01475C94T)通过电击转化入谷氨酸棒杆菌(Corynebacterium glutamicum)CGMCC 20516中后,在培养基中进行培养,培养基成分和培养条件参见表1,对培养产生的单菌落分别通过实施例1中的引物P1和通用引物M13R进行鉴定,能扩增出1311bp大小条带的菌株为阳性菌株。将阳性菌株在含15%蔗糖的培养基上培养,对培养产生的单菌落分别在含有卡那霉素和不含卡那霉素的培养基上培养,选择在不含卡那霉素的培养基上生长,而在含卡那霉素的培养基上不生长的菌株进一步采用如下引物(上海invitrogen公司合成)进行PCR鉴定:
P5:5'-TCAACAGCACACCACTGAGG-3';
P6:5'-GTCGTGGACCCACCCAAAAC-3'。
将得到的PCR扩增产物(259bp)通过95℃高温变性10min、冰浴5min后进行SSCP(Single-Strand Conformation Polymorphis)电泳(以质粒pK18-YH66_01475C94T扩增片段为阳性对照,黄色短杆菌ATCC15168扩增片段为阴性对照,水作为空白对照),SSCP电泳的PAGE的制备及电泳条件参见表2,由于片段结构不同,电泳位置不同,因此片段电泳位置与阴性对照片段位置不一致且与阳性对照片段位置一致的菌株为等位替换成功的菌株。再次通过引物P5/P6 PCR扩增阳性菌株YH66_01475基因片段,并连接到PMD19-T载体进行测序,通过序列比对,碱基序列发生突变(C-T)的菌株为等位替换成功的阳性菌株,并被命名为YPR-055。
重组菌YPR-055含有SEQ ID No.3所示的突变的基因YH66_01475C94T
表1、培养基的组成和培养条件
成分 配方
蔗糖 10g/L
多聚蛋白胨 10g/L
牛肉膏 10g/L
酵母粉 5g/L
尿素 2g/L
氯化钠 2.5g/L
琼脂粉 20g/L
pH 7.0
培养条件 32℃
表2、SSCP电泳的PAGE的制备及电泳条件
Figure BDA0003545215060000071
实施例3、构建基因组上过表达YH66_01475基因或YH66_01475C94T基因的工程菌株
依据NCBI公布的黄色短杆菌ATCC15168基因组序列,设计并合成三对扩增上下游同源臂片段及YH66_01475或YH66_01475C94T基因编码区及启动子区的引物,以同源重组的方式在谷氨酸棒杆菌CGMCC 20516中引入YH66_01475或YH66_01475C94T基因。
引物设计如下(上海invitrogen公司合成):
P7:5'-CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGCATGACGGCTGACTGGACTC-3';
P8:5'-TCCTGGCTGG CGGCGTTTAAAATCGGACTC CTTAAATGGG-3';
P9:5'-CCCATTTAAG GAGTCCGATTTTAAACGCCG CCAGCCAGGA-3';
P10:5'-CTATGTGAGT AGTCGATTTAAACTCCAAAG TTCCCCCCCG-3';
P11:5'-CGGGGGGGAA CTTTGGAGTTTAAATCGACT ACTCACATAG-3';
P12:5'-CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCTGCATAAGAAACAACCACTT-3'。
构建方法:分别以黄色短杆菌ATCC15168或YPR-055为模板,分别采用引物P7/P8、P9/P10和P11/P12进行PCR扩增,获得上游同源臂片段806bp(对应于谷氨酸棒杆菌CGMCC20516YH66_03350基因及其启动子区或者是与上一个基因的间隔区,序列如SEQ ID No.6所示),YH66_01475基因及其启动子片段2146bp(序列如SEQ ID No.7所示)或YH66_01475C94T基因及其启动子片段2146bp(序列如SEQ ID No.8所示)及下游同源臂片段783bp(对应于谷氨酸棒杆菌CGMCC 20516YH66_03355基因及其与YH66_03350基因的部分间隔区,序列如SEQID No.9所示)。PCR反应结束后,对每个模板扩增得到的3个片段采用柱式DNA凝胶回收试剂盒分别进行电泳回收。回收后的3个片段与经过Xbal I/BamH I酶切后纯化的pK18mobsacB质粒(购自Addgene公司)用NEBuilder酶(购自NEB公司)50℃连接30min,连接产物转化后长出的单克隆用M13引物经PCR鉴定获得阳性整合质粒(重组载体),分别为pK18-YH66_01475OE、pK18-YH66_01475C94TOE,该阳性整合质粒上含有卡那霉素抗性标记,可以通过卡那霉素筛选获得质粒整合到基因组上的重组子。
PCR反应体系为:10×Ex Taq Buffer 5μL,dNTP Mixture(各2.5mM)4μL,Mg2+(25mM)4μL,引物(10pM)各2μL,Ex Taq(5U/μL)0.25μL,总体积50μL。
PCR反应程序为:94℃预变性5min,94℃变性30s;52℃退火30s;72℃延伸60s(30个循环),72℃过度延伸10min。
将测序正确的整合质粒(pK18-YH66_01475OE、pK18-YH66_01475C94TOE)分别电转化入谷氨酸棒杆菌CGMCC 20516,在培养基中进行培养,培养基成分和培养条件参见表1,对培养产生的单菌落通过P13/P14引物进行PCR鉴定,PCR扩增出含有大小为2167bp片段的菌株为阳性菌株,扩增不到片段的菌株为原菌。将阳性菌株在含15%蔗糖的培养基上培养,对培养产生的单菌落进一步采用P15/P16引物进行PCR鉴定,扩增出大小为1669bp片段的菌株为YH66_01475或YH66_01475C94T基因整合到谷氨酸棒杆菌CGMCC 20516基因组上的阳性菌株,分别命名为YPR-056(不含突变点)和YPR-057(含突变点)。
重组菌YPR-056含有双拷贝的SEQ ID No.1所示的YH66_01475基因;具体地,重组菌YPR-056是将谷氨酸棒杆菌CGMCC 20516的基因组中上同源臂YH66_03350和下同源臂YH66_03355的间隔区替换为YH66_01475基因,且保持谷氨酸棒杆菌CGMCC 20516的基因组中的其它核苷酸不变得到的重组菌。含有双拷贝YH66_01475基因的重组菌可以显著和稳定地提高YH66_01475基因的表达量。
重组菌YPR-057含有SEQ ID No.3所示的突变的YH66_01475C94T基因;具体地,重组菌YPR-057是将谷氨酸棒杆菌CGMCC 20516的基因组中上同源臂YH66_03350和下同源臂YH66_03355的间隔区替换为YH66_01475C94T基因,且保持谷氨酸棒杆菌CGMCC 20516的基因组中的其它核苷酸不变得到的重组菌。
PCR鉴定引物如下所示:
P13:5'-GTCCGCTCTGTTGGTGTTCA-3'(对应上同源臂YH66_03350的外侧);
P14:5'-GCAACGTGGTGTTCCGCATG-3'(对应YH66_01475基因内部);
P15:5'-CCAGCGCCAGTTGGTGTCTG-3'(对应YH66_01475基因内部);
P16:5'-TGGAGGAATATTCGGCCCAG-3'(对应下同源臂YH66_03355的外侧)。
实施例4、构建质粒上过表达YH66_01475基因或YH66_01475C94T基因的工程菌株
依据NCBI公布的黄色短杆菌ATCC15168基因组序列,设计并合成一对扩增YH66_01475或YH66_01475C94T基因编码区及启动子区的引物,引物设计如下(上海invitrogen公司合成):
P17:5'-GCTTGCATGCCTGCAGGTCGACTCTAGAGGATCCCCTTAAACGCCGCCAGCCAGGA-3'(带下划线的核苷酸序列为pXMJ19上的序列);
P18:5'-ATCAGGCTGAAAATCTTCTCTCATCCGCCAAAACAACTCCAAAGTTCCCCCCCG-3'(带下划线的核苷酸序列为pXMJ19上的序列)。
构建方法:分别以黄色短杆菌ATCC15168或YPR-055为模板,采用引物P17/P18进行PCR扩增,获得大小为2176bp的YH66_01475基因及其启动子片段(序列如SEQ ID No.12所示)和YH66_01475C94T基因及其启动子片段(序列如SEQ ID No.13所示),对扩增产物进行电泳并采用柱式DNA凝胶回收试剂盒进行纯化回收,回收的DNA片段与经EcoR I酶切回收的穿梭质粒pXMJ19用NEBuilder酶(购自NEB公司)50℃连接30min,连接产物转化后长出的单克隆用M13引物经PCR鉴定获得阳性过表达质粒pXMJ19-YH66_01475(含有YH66_01475基因)和pXMJ19-YH66_01475C94T(含有YH66_01475C94T基因),将该质粒送测序。因质粒上含有氯霉素抗性标记,可以通过氯霉素来筛选质粒是否转化到菌株中。
PCR反应体系为:10×Ex Taq Buffer 5μL,dNTP Mixture(各2.5mM)4μL,Mg2+(25mM)4μL,引物(10pM)各2μL,Ex Taq(5U/μL)0.25μL,总体积50μL。
PCR反应程序为:94℃预变性5min,94℃变性30s;52℃退火30s;72℃延伸120s(30个循环),72℃过度延伸10min。
将测序正确的pXMJ19-YH66_01475和pXMJ19-YH66_01475C94T质粒分别电转化入谷氨酸棒杆菌CGMCC 20516中,在培养基中进行培养,培养基成分和培养条件参见表1,对培养产生的单菌落通过引物M13R(-48)/P18进行PCR鉴定,PCR扩增出含有大小为2215bp片段的菌株为阳性菌株,其被命名为YPR-058(不含突变点)和YPR-059(含突变点)。
重组菌YPR-058含有SEQ ID No.1所示的YH66_01475基因;重组菌YPR-059含有SEQID No.3所示的突变的YH66_01475C94T基因。
实施例5、构建基因组上缺失YH66_01475基因的工程菌株
根据NCBI公布的黄色短杆菌ATCC15168的基因组序列,合成两对扩增YH66_01475基因编码区两端片段的引物,作为上下游同源臂片段。引物设计如下(上海invitrogen公司合成):
P19:5'-CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGAATTCCCTGTCGGTGAAGCA-3';
P20:5'-TTTTAAGAAGGTTGAACACAGCTTTACGACGCCTCCCCCT-3';
P21:5'-AGGGGGAGGCGTCGTAAAGCTGTGTTCAACCTTCTTAAAA-3';
P22:5'-CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCTGTCCAAAGCCGCGGTGGAT-3'。
构建方法:以黄色短杆菌ATCC15168为模板,分别以引物P19/P20和P21/P22进行PCR扩增,获得YH66_01475的上游同源臂片段660bp及YH66_01475的下游同源臂片段642bp。对扩增的产物进行电泳并采用柱式DNA凝胶回收试剂盒进行纯化,回收的DNA片段与经过Xbal I/BamH I酶切后纯化的pK18mobsacB质粒(购自Addgene公司)用NEBuilder酶(购自NEB公司)50℃连接30min,连接产物转化后长出的单克隆用M13引物经PCR鉴定获得阳性敲除载体pK18-ΔYH66_01475,该质粒含有整个敲除YH66_01475同源臂片段1262bp(序列如SEQ ID No.14所示)和卡那霉素抗性作为筛选标记,将该质粒送测序。
PCR扩增反应体系为:10×Ex Taq Buffer 5μL,dNTP Mixture(各2.5mM)4μL,Mg2+(25mM)4μL,引物(10pM)各2μL,Ex Taq(5U/μL)0.25μL,总体积50μL。
PCR扩增反应程序为:94℃预变性5min,94℃变性30s;52℃退火30s;72℃延伸90s(30个循环),72℃过度延伸10min。
将测序正确的敲除质粒pK18-ΔYH66_01475电转化入谷氨酸棒杆菌CGMCC 20516,在培养基中进行培养,培养基成分和培养条件参见表1,对培养产生的单菌落通过如下引物(上海invitrogen公司合成)进行PCR鉴定:
P23:5'-AATTCCCTGTCGGTGAAGCA-3'(对应于谷氨酸棒杆菌CGMCC 20516YH66_01470基因编码区);
P24:5'-TGTCCAAAGCCGCGGTGGAT-3'(对应于谷氨酸棒杆菌CGMCC 20516YH66_01480基因编码区)。
上述PCR同时扩增出大小为1188bp及3039bp条带的菌株为阳性菌株,只扩增出大小为3039bp条带的菌株为原菌。阳性菌株在15%蔗糖培养基上筛选后分别在含有卡那霉素和不含卡那霉素的培养基上培养,选择在不含卡那霉素的培养基上生长,而在含卡那霉素的培养基上不生长的菌株进一步采用P23/P24引物进行PCR鉴定,扩增出大小为1188bp条带的菌株为YH66_01475基因编码区被敲除的阳性菌株。再次通过P23/P24引物PCR扩增阳性菌株YH66_01475片段,并连接到pMD19-T载体进行测序,将测序正确的菌株命名为YPR-060。
重组菌YPR-060是将谷氨酸棒杆菌CGMCC 20516基因组上的YH66_01475基因敲除,且保持谷氨酸棒杆菌CGMCC 20516基因组中的其它核苷酸不变得到的重组菌。
实施例6、L-精氨酸发酵实验
将上述实施例构建的菌株和原始菌株谷氨酸棒杆菌CGMCC 20516在BLBIO-5GC-4-H型号的发酵罐(购自上海百仑生物科技有限公司)中以表3所示的培养基和表4所示的控制工艺进行发酵实验。每个菌株重复三次,结果如表5所示。
结果如表5所示,在谷氨酸棒杆菌中对YH66_01475基因编码区进行点突变YH66_01475C94T及过表达,有助于L-精氨酸产量及转化率的提高,而对基因进行敲除或弱化,不利于L-精氨酸的积累。
表3、发酵培养基配方(其余为水)
Figure BDA0003545215060000101
Figure BDA0003545215060000111
表4、发酵控制工艺
Figure BDA0003545215060000112
表5、L-精氨酸发酵实验结果
菌株 OD<sub>562nm</sub> L-精氨酸产量(g/L)
谷氨酸棒杆菌CGMCC 20516 75.3 87.9
YPR-055 76.9 89.1
YPR-056 76.6 89.1
YPR-057 76.8 89.3
YPR-058 77.9 89.2
YPR-059 77.4 89.4
YPR-060 73.2 86.3
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 宁夏伊品生物科技股份有限公司
<120> YH66_01475蛋白及其编码基因在调控细菌精氨酸产量中的应用
<160> 14
<170> PatentIn version 3.5
<210> 1
<211> 1851
<212> DNA
<213> Artificial Sequence
<400> 1
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagcgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgcc tttcaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccgcacctcg 1680
ggcgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 2
<211> 616
<212> PRT
<213> Artificial Sequence
<400> 2
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Arg
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Asp Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Val Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Pro Phe Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
His Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala Arg Thr Ser
545 550 555 560
Gly Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 3
<211> 1851
<212> DNA
<213> Artificial Sequence
<400> 3
atgtctccta acgatgcatt catctccgca cctgccaaga tcgaaacccc agttgggcct 60
cgcaatgaag gccagccagc atggaataag cagtgtggct cctcaatgcc agttaaccgc 120
tacatgcctt tcgaggttga ggtagaagat atttctctgc cggaccgcac ttggccagat 180
aaaaaaatca ccgttgcacc tcagtggtgt gctgttgacc tgcgtgacgg caaccaggct 240
ctgattgatc cgatgtctcc tgagcgtaag cgccgcatgt ttgagctgct ggttcagatg 300
ggattcaagg aaatcgaggt cggtttccct tcagcttccc agactgattt tgatttcgtt 360
cgtgagatca tcgaaaagga catgatccct gacgatgtca ccattcaggt tctggttcag 420
gctcgtgagc acctgattcg ccgtactttt gaagcttgcg aaggcgcaaa aaacgttatc 480
gtgcacttct acaactcaac ctccatcctg cagcgcaacg tggtgttccg catggacaag 540
gtgcaggtga agaagctggc taccgatgcc gctgaactga tcaagaccgt cgctcaggat 600
tacccagaca ccaactggcg ctggcagtac tcccctgagt ccttcaccgg cactgaggtt 660
gagtacgcca aggaagttgt ggacgcagtt gttgaggtca tggatccaac tcctgagaac 720
ccaatgatca tcaacctgcc tttcaccgtt gagatgatca cccctaacgt ttacgcagac 780
tccattgaat ggatgcaccg caatctaaac cgtcgtgatt ccattatcct gtccctgcac 840
ccgcacaatg accgtggcac cggcgttggc gcagctgagc tgggctacat ggctggcgct 900
gaccgcatcg aaggctgcct gttcggcaac ggcgagcgca ccggcaacgt ctgcctggtc 960
accctggcac tgaacatgct gacccagggc gttgaccctc agctggactt caccgatata 1020
cgccagatcc gcagcaccgt tgaatactgc aaccagctgc gcgttcctga gcgccaccca 1080
tacggcggcg acctggtctt caccgctttc tccggttccc accaggacgc tgtgaacaag 1140
ggtctggacg ccatggctgc caaggttcag ccaggtgcta gctccactga agtttcttgg 1200
gagcagctgc gcgacaccga atgggaggtt ccttacctgc ctatcgatcc aaaggatgtc 1260
ggtcgcgact acgaggctgt tatccgcgtg aactcccagt ccggcaaggg cggcgttgct 1320
tacatcatga agaccgatca cggtctgcag atccctcgct ccatgcaggt tgagttctcc 1380
accgttgtcc agaacgtcac cgacgctgag ggcggcgagg tcaactccaa ggcaatgtgg 1440
gatatcttcg ccaccgagta cctggagcgc accgcaccag ttgagcagat cgcgctgcgc 1500
gtcgagaacg ctcagaccga aaacgaggat gcatccatca ccgccgagct catccacaac 1560
ggcaaggacg tcaccgtcga tggccacggc aacggcccac tggctgctta cgccaacgcg 1620
ctggagaagc tgggcatcga cgttgagatc caggaataca accagcacgc ccgcacctcg 1680
ggcgacgatg cagaagcagc cgcctacgtg ctggctgagg tcaacggccg caaggtctgg 1740
ggcgtcggca tcgctggctc catcacctac gcttcgctga aggcagtgac ctccgccgta 1800
aaccgcgcgc tggacgtcaa ccacgaggca gtcctggctg gcggcgttta a 1851
<210> 4
<211> 616
<212> PRT
<213> Artificial Sequence
<400> 4
Met Ser Pro Asn Asp Ala Phe Ile Ser Ala Pro Ala Lys Ile Glu Thr
1 5 10 15
Pro Val Gly Pro Arg Asn Glu Gly Gln Pro Ala Trp Asn Lys Gln Cys
20 25 30
Gly Ser Ser Met Pro Val Asn Arg Tyr Met Pro Phe Glu Val Glu Val
35 40 45
Glu Asp Ile Ser Leu Pro Asp Arg Thr Trp Pro Asp Lys Lys Ile Thr
50 55 60
Val Ala Pro Gln Trp Cys Ala Val Asp Leu Arg Asp Gly Asn Gln Ala
65 70 75 80
Leu Ile Asp Pro Met Ser Pro Glu Arg Lys Arg Arg Met Phe Glu Leu
85 90 95
Leu Val Gln Met Gly Phe Lys Glu Ile Glu Val Gly Phe Pro Ser Ala
100 105 110
Ser Gln Thr Asp Phe Asp Phe Val Arg Glu Ile Ile Glu Lys Asp Met
115 120 125
Ile Pro Asp Asp Val Thr Ile Gln Val Leu Val Gln Ala Arg Glu His
130 135 140
Leu Ile Arg Arg Thr Phe Glu Ala Cys Glu Gly Ala Lys Asn Val Ile
145 150 155 160
Val His Phe Tyr Asn Ser Thr Ser Ile Leu Gln Arg Asn Val Val Phe
165 170 175
Arg Met Asp Lys Val Gln Val Lys Lys Leu Ala Thr Asp Ala Ala Glu
180 185 190
Leu Ile Lys Thr Val Ala Gln Asp Tyr Pro Asp Thr Asn Trp Arg Trp
195 200 205
Gln Tyr Ser Pro Glu Ser Phe Thr Gly Thr Glu Val Glu Tyr Ala Lys
210 215 220
Glu Val Val Asp Ala Val Val Glu Val Met Asp Pro Thr Pro Glu Asn
225 230 235 240
Pro Met Ile Ile Asn Leu Pro Phe Thr Val Glu Met Ile Thr Pro Asn
245 250 255
Val Tyr Ala Asp Ser Ile Glu Trp Met His Arg Asn Leu Asn Arg Arg
260 265 270
Asp Ser Ile Ile Leu Ser Leu His Pro His Asn Asp Arg Gly Thr Gly
275 280 285
Val Gly Ala Ala Glu Leu Gly Tyr Met Ala Gly Ala Asp Arg Ile Glu
290 295 300
Gly Cys Leu Phe Gly Asn Gly Glu Arg Thr Gly Asn Val Cys Leu Val
305 310 315 320
Thr Leu Ala Leu Asn Met Leu Thr Gln Gly Val Asp Pro Gln Leu Asp
325 330 335
Phe Thr Asp Ile Arg Gln Ile Arg Ser Thr Val Glu Tyr Cys Asn Gln
340 345 350
Leu Arg Val Pro Glu Arg His Pro Tyr Gly Gly Asp Leu Val Phe Thr
355 360 365
Ala Phe Ser Gly Ser His Gln Asp Ala Val Asn Lys Gly Leu Asp Ala
370 375 380
Met Ala Ala Lys Val Gln Pro Gly Ala Ser Ser Thr Glu Val Ser Trp
385 390 395 400
Glu Gln Leu Arg Asp Thr Glu Trp Glu Val Pro Tyr Leu Pro Ile Asp
405 410 415
Pro Lys Asp Val Gly Arg Asp Tyr Glu Ala Val Ile Arg Val Asn Ser
420 425 430
Gln Ser Gly Lys Gly Gly Val Ala Tyr Ile Met Lys Thr Asp His Gly
435 440 445
Leu Gln Ile Pro Arg Ser Met Gln Val Glu Phe Ser Thr Val Val Gln
450 455 460
Asn Val Thr Asp Ala Glu Gly Gly Glu Val Asn Ser Lys Ala Met Trp
465 470 475 480
Asp Ile Phe Ala Thr Glu Tyr Leu Glu Arg Thr Ala Pro Val Glu Gln
485 490 495
Ile Ala Leu Arg Val Glu Asn Ala Gln Thr Glu Asn Glu Asp Ala Ser
500 505 510
Ile Thr Ala Glu Leu Ile His Asn Gly Lys Asp Val Thr Val Asp Gly
515 520 525
His Gly Asn Gly Pro Leu Ala Ala Tyr Ala Asn Ala Leu Glu Lys Leu
530 535 540
Gly Ile Asp Val Glu Ile Gln Glu Tyr Asn Gln His Ala Arg Thr Ser
545 550 555 560
Gly Asp Asp Ala Glu Ala Ala Ala Tyr Val Leu Ala Glu Val Asn Gly
565 570 575
Arg Lys Val Trp Gly Val Gly Ile Ala Gly Ser Ile Thr Tyr Ala Ser
580 585 590
Leu Lys Ala Val Thr Ser Ala Val Asn Arg Ala Leu Asp Val Asn His
595 600 605
Glu Ala Val Leu Ala Gly Gly Val
610 615
<210> 5
<211> 1304
<212> DNA
<213> Artificial Sequence
<400> 5
cagtgccaag cttgcatgcc tgcaggtcga ctctagagga gttggatcca tgacctcaac 60
aactgcgtcc acaacttcct tggcgtactc aacctcagtg ccggtgaagg actcagggga 120
gtactgccag cgccagttgg tgtctgggta atcctgagcg acggtcttga tcagttcagc 180
ggcatcggta gccagcttct tcacctgcac cttgtccatg cggaacacca cgttgcgctg 240
caggatggag gttgagttgt agaagtgcac gataacgttt tttgcgcctt cgcaagcttc 300
aaaagtacgg cgaatcaggt gctcacgagc ctgaaccaga acctgaatgg tgacatcgtc 360
agggatcatg tccttttcga tgatctcacg aacgaaatca aaatcagtct gggaagctga 420
agggaaaccg acctcgattt ccttgaatcc catctgaacc agcagctcaa acatgcggcg 480
cttacgctca ggagacatcg gatcaatcag agcctggttg ccgtcacgca ggtcaacagc 540
acaccactga ggtgcaacgg tgattttttt atctggccaa gtgcggtccg gcagagaaat 600
atcttctacc tcaacctcga aaggcatgta gcggttaact ggcattgagg agccacactg 660
cttattccat gctggctggc cttcattgcg aggcccaact ggggtttcga tcttggcagg 720
tgcggagatg aatgcatcgt taggagacat tgtgttcaac cttcttaaaa agttttgggt 780
gggtccacga ccggcaacac caaactccgc gacgggatgc cggtcgtgtt aagacctctg 840
ggacccgccg cggcgaagaa gaagtagatt cgcacgcgaa gtcatgtggt gaagcataca 900
acaactttgt ggtgtgggta gcaactcggg gggagttttc ttttaaaaaa gcttttcgac 960
gcccagttcc agtgctgtca tgtctcgggg gggaactttg gagttttacc ttttcgatcc 1020
ggccggcatt gtgcttgtac gagacagtgc aatggtggaa acaatcatca ccaagagtgc 1080
gatgcccatg gcgatccatt cccagtccac gacttggaat ttttcgccca gaaccaagta 1140
gcccaaactg aaggcgacaa ttggttcggc aatggtcatg gcgggtagcg atttttgtag 1200
ttcgccagcg ttaaaggaat actgctgcac gattgttcca agtaatgcgg tgaggattag 1260
gccgtagggt accgagctcg aattcgtaat catggtcata gctg 1304
<210> 6
<211> 806
<212> DNA
<213> Artificial Sequence
<400> 6
cagtgccaag cttgcatgcc tgcaggtcga ctctagcatg acggctgact ggactcgact 60
tccatacgag gttctggaga agatctccac ccgcatcacc aacgaagttc cagatgtgaa 120
ccgcgtggtt ttggacgtaa cctccaagcc accaggaacc atcgaatggg agtaggcctt 180
aaatgagcct tcgttaagcg gcaatcacct tattggagat tgtcgctttt cccatttctc 240
cgggttttct ggaacttttt gggcgtatgc tgggaatgat tctattattg ccaaatcaga 300
aagcaggaga gacccgatga gcgaaatcct agaaacctat tgggcacccc actttggaaa 360
aaccgaagaa gccacagcac tcgtttcata cctggcacaa gcttccggcg atcccattga 420
ggttcacacc ctgttcgggg atttaggttt agacggactc tcgggaaact acaccgacac 480
tgagattgac ggctacggcg acgcattcct gctggttgca gcgctatccg tgttgatggc 540
tgaaaacaaa gcaacaggtg gcgtgaatct gggtgagctt gggggagctg ataaatcgat 600
ccggctgcat gttgaatcca aggagaacac ccaaatcaac accgcattga agtattttgc 660
gctctcccca gaagaccacg cagcagcaga tcgcttcgat gaggatgacc tgtctgagct 720
tgccaacttg agtgaagagc tgcgcggaca gctggactaa ttgtctccca tttaaggagt 780
ccgattttaa acgccgccag ccagga 806
<210> 7
<211> 2146
<212> DNA
<213> Artificial Sequence
<400> 7
cccatttaag gagtccgatt ttaaacgccg ccagccagga ctgcctcgtg gttgacgtcc 60
agcgcgcggt ttacggcgga ggtcactgcc ttcagcgaag cgtaggtgat ggagccagcg 120
atgccgacgc cccagacctt gcggccgttg acctcagcca gcacgtaggc ggctgcttct 180
gcatcgtcgc ccgaggtgcg ggcgtgctgg ttgtattcct ggatctcaac gtcgatgccc 240
agcttctcca gcgcgttggc gtaagcagcc agtgggccgt tgccgtggcc atcgacggtg 300
acgtccttgc cgttgtggat gagctcggcg gtgatggatg catcctcgtt ttcggtctga 360
gcgttctcga cgcgcagcgc gatctgctca actggtgcgg tgcgctccag gtactcggtg 420
gcgaagatat cccacattgc cttggagttg acctcgccgc cctcagcgtc ggtgacgttc 480
tggacaacgg tggagaactc aacctgcatg gagcgaggga tctgcagacc gtgatcggtc 540
ttcatgatgt aagcaacgcc gcccttgccg gactgggagt tcacgcggat aacagcctcg 600
tagtcgcgac cgacatcctt tggatcgata ggcaggtaag gaacctccca ttcggtgtcg 660
cgcagctgct cccaagaaac ttcagtggag ctagcacctg gctgaacctt ggcagccatg 720
gcgtccagac ccttgttcac agcgtcctgg tgggaaccgg agaaagcggt gaagaccagg 780
tcgccgccgt atgggtggcg ctcaggaacg cgcagctggt tgcagtattc aacggtgctg 840
cggatctggc gtatatcggt gaagtccagc tgagggtcaa cgccctgggt cagcatgttc 900
agtgccaggg tgaccaggca gacgttgccg gtgcgctcgc cgttgccgaa caggcagcct 960
tcgatgcggt cagcgccagc catgtagccc agctcagctg cgccaacgcc ggtgccacgg 1020
tcattgtgcg ggtgcaggga caggataatg gaatcacgac ggtttagatt gcggtgcatc 1080
cattcaatgg agtctgcgta aacgttaggg gtgatcatct caacggtgaa aggcaggttg 1140
atgatcattg ggttctcagg agttggatcc atgacctcaa caactgcgtc cacaacttcc 1200
ttggcgtact caacctcagt gccggtgaag gactcagggg agtactgcca gcgccagttg 1260
gtgtctgggt aatcctgagc gacggtcttg atcagttcag cggcatcggt agccagcttc 1320
ttcacctgca ccttgtccat gcggaacacc acgttgcgct gcaggatgga ggttgagttg 1380
tagaagtgca cgataacgtt ttttgcgcct tcgcaagctt caaaagtacg gcgaatcagg 1440
tgctcacgag cctgaaccag aacctgaatg gtgacatcgt cagggatcat gtccttttcg 1500
atgatctcac gaacgaaatc aaaatcagtc tgggaagctg aagggaaacc gacctcgatt 1560
tccttgaatc ccatctgaac cagcagctca aacatgcggc gcttacgctc aggagacatc 1620
ggatcaatca gagcctggtt gccgtcacgc aggtcaacag cacaccactg aggtgcaacg 1680
gtgatttttt tatctggcca agtgcggtcc ggcagagaaa tatcttctac ctcaacctcg 1740
aaaggcatgt agcggttaac tggcattgag gagccacgct gcttattcca tgctggctgg 1800
ccttcattgc gaggcccaac tggggtttcg atcttggcag gtgcggagat gaatgcatcg 1860
ttaggagaca ttgtgttcaa ccttcttaaa aagttttggg tgggtccacg accggcaaca 1920
ccaaactccg cgacgggatg ccggtcgtgt taagacctct gggacccgcc gcggcgaaga 1980
agaagtagat tcgcacgcga agtcatgtgg tgaagcatac aacaactttg tggtgtgggt 2040
agcaactcgg ggggagtttt cttttaaaaa agcttttcga cgcccagttc cagtgctgtc 2100
atgtctcggg ggggaacttt ggagtttaaa tcgactactc acatag 2146
<210> 8
<211> 2146
<212> DNA
<213> Artificial Sequence
<400> 8
cccatttaag gagtccgatt ttaaacgccg ccagccagga ctgcctcgtg gttgacgtcc 60
agcgcgcggt ttacggcgga ggtcactgcc ttcagcgaag cgtaggtgat ggagccagcg 120
atgccgacgc cccagacctt gcggccgttg acctcagcca gcacgtaggc ggctgcttct 180
gcatcgtcgc ccgaggtgcg ggcgtgctgg ttgtattcct ggatctcaac gtcgatgccc 240
agcttctcca gcgcgttggc gtaagcagcc agtgggccgt tgccgtggcc atcgacggtg 300
acgtccttgc cgttgtggat gagctcggcg gtgatggatg catcctcgtt ttcggtctga 360
gcgttctcga cgcgcagcgc gatctgctca actggtgcgg tgcgctccag gtactcggtg 420
gcgaagatat cccacattgc cttggagttg acctcgccgc cctcagcgtc ggtgacgttc 480
tggacaacgg tggagaactc aacctgcatg gagcgaggga tctgcagacc gtgatcggtc 540
ttcatgatgt aagcaacgcc gcccttgccg gactgggagt tcacgcggat aacagcctcg 600
tagtcgcgac cgacatcctt tggatcgata ggcaggtaag gaacctccca ttcggtgtcg 660
cgcagctgct cccaagaaac ttcagtggag ctagcacctg gctgaacctt ggcagccatg 720
gcgtccagac ccttgttcac agcgtcctgg tgggaaccgg agaaagcggt gaagaccagg 780
tcgccgccgt atgggtggcg ctcaggaacg cgcagctggt tgcagtattc aacggtgctg 840
cggatctggc gtatatcggt gaagtccagc tgagggtcaa cgccctgggt cagcatgttc 900
agtgccaggg tgaccaggca gacgttgccg gtgcgctcgc cgttgccgaa caggcagcct 960
tcgatgcggt cagcgccagc catgtagccc agctcagctg cgccaacgcc ggtgccacgg 1020
tcattgtgcg ggtgcaggga caggataatg gaatcacgac ggtttagatt gcggtgcatc 1080
cattcaatgg agtctgcgta aacgttaggg gtgatcatct caacggtgaa aggcaggttg 1140
atgatcattg ggttctcagg agttggatcc atgacctcaa caactgcgtc cacaacttcc 1200
ttggcgtact caacctcagt gccggtgaag gactcagggg agtactgcca gcgccagttg 1260
gtgtctgggt aatcctgagc gacggtcttg atcagttcag cggcatcggt agccagcttc 1320
ttcacctgca ccttgtccat gcggaacacc acgttgcgct gcaggatgga ggttgagttg 1380
tagaagtgca cgataacgtt ttttgcgcct tcgcaagctt caaaagtacg gcgaatcagg 1440
tgctcacgag cctgaaccag aacctgaatg gtgacatcgt cagggatcat gtccttttcg 1500
atgatctcac gaacgaaatc aaaatcagtc tgggaagctg aagggaaacc gacctcgatt 1560
tccttgaatc ccatctgaac cagcagctca aacatgcggc gcttacgctc aggagacatc 1620
ggatcaatca gagcctggtt gccgtcacgc aggtcaacag cacaccactg aggtgcaacg 1680
gtgatttttt tatctggcca agtgcggtcc ggcagagaaa tatcttctac ctcaacctcg 1740
aaaggcatgt agcggttaac tggcattgag gagccacact gcttattcca tgctggctgg 1800
ccttcattgc gaggcccaac tggggtttcg atcttggcag gtgcggagat gaatgcatcg 1860
ttaggagaca ttgtgttcaa ccttcttaaa aagttttggg tgggtccacg accggcaaca 1920
ccaaactccg cgacgggatg ccggtcgtgt taagacctct gggacccgcc gcggcgaaga 1980
agaagtagat tcgcacgcga agtcatgtgg tgaagcatac aacaactttg tggtgtgggt 2040
agcaactcgg ggggagtttt cttttaaaaa agcttttcga cgcccagttc cagtgctgtc 2100
atgtctcggg ggggaacttt ggagtttaaa tcgactactc acatag 2146
<210> 9
<211> 783
<212> DNA
<213> Artificial Sequence
<400> 9
cgggggggaa ctttggagtt taaatcgact actcacatag ggtcgggcta gtcattctga 60
tcagcgaatt ccacgttcac atcgccaatt ccagagttca caaccagatt cagcattgga 120
ccttctagat cagcattgtg ggcggtgaga tctccaacat cacagcgcgc tgtgcccaca 180
ccggcggtac aacttaggct cacgggcaca tcatcgggca gggtgaccat gacttcgccg 240
atccctgagg tgatttggat gttttgttcc tgatccaatt gggtgaggtg gctgaaatcg 300
aggttcattt cacccacgcc agaggtgtag ctgctgagga gttcatcgtt ggtggggatg 360
agattgacat cgccgattcc agggtcgtct tcaaagtaga tgggatcgat atttgaaata 420
aacaggcctg cgagggcgct catgacaact ccggtaccaa ctacaccgcc gacaatccat 480
ggccacacat ggcgcttttt ctgaggcttt tgtggaggga cttgtacatc ccaggtgttg 540
tattggtttt gggcaagtgg atcccaatga ggcgcttcgg gggtttgttg cgcgaagggt 600
gcatagtagc cctcaacggg ggtgatagtg cttagatctg gttggggttg tgggtagaga 660
tcttcgtttt tcatggtggc atcctcagaa acagtgaatt cagtggtgag tagtccgcgg 720
ggtggaagtg gttgtttctt atgcagggta ccgagctcga attcgtaatc atggtcatag 780
ctg 783
<210> 10
<211> 2167
<212> DNA
<213> Artificial Sequence
<400> 10
gtccgctctg ttggtgttca aggcgatggc cgcacctacg gacacccaat cgtgctgcgc 60
ccagtgtctt ccgaagacgc catgacggct gactggactc gacttccata cgaggttctg 120
gagaagatct ccacccgcat caccaacgaa gttccagatg tgaaccgcgt ggttttggac 180
gtaacctcca agccaccagg aaccatcgaa tgggagtagg ccttaaatga gccttcgtta 240
agcggcaatc accttattgg agattgtcgc ttttcccatt tctccgggtt ttctggaact 300
ttttgggcgt atgctgggaa tgattctatt attgccaaat cagaaagcag gagagacccg 360
atgagcgaaa tcctagaaac ctattgggca ccccactttg gaaaaaccga agaagccaca 420
gcactcgttt catacctggc acaagcttcc ggcgatccca ttgaggttca caccctgttc 480
ggggatttag gtttagacgg actctcggga aactacaccg acactgagat tgacggctac 540
ggcgacgcat tcctgctggt tgcagcgcta tccgtgttga tggctgaaaa caaagcaaca 600
ggtggcgtga atctgggtga gcttggggga gctgataaat cgatccggct gcatgttgaa 660
tccaaggaga acacccaaat caacaccgca ttgaagtatt ttgcgctctc cccagaagac 720
cacgcagcag cagatcgctt cgatgaggat gacctgtctg agcttgccaa cttgagtgaa 780
gagctgcgcg gacagctgga ctaattgtct cccatttaag gagtccgatt ttaaacgccg 840
ccagccagga ctgcctcgtg gttgacgtcc agcgcgcggt ttacggcgga ggtcactgcc 900
ttcagcgaag cgtaggtgat ggagccagcg atgccgacgc cccagacctt gcggccgttg 960
acctcagcca gcacgtaggc ggctgcttct gcatcgtcgc ccgaggtgcg ggcgtgctgg 1020
ttgtattcct ggatctcaac gtcgatgccc agcttctcca gcgcgttggc gtaagcagcc 1080
agtgggccgt tgccgtggcc atcgacggtg acgtccttgc cgttgtggat gagctcggcg 1140
gtgatggatg catcctcgtt ttcggtctga gcgttctcga cgcgcagcgc gatctgctca 1200
actggtgcgg tgcgctccag gtactcggtg gcgaagatat cccacattgc cttggagttg 1260
acctcgccgc cctcagcgtc ggtgacgttc tggacaacgg tggagaactc aacctgcatg 1320
gagcgaggga tctgcagacc gtgatcggtc ttcatgatgt aagcaacgcc gcccttgccg 1380
gactgggagt tcacgcggat aacagcctcg tagtcgcgac cgacatcctt tggatcgata 1440
ggcaggtaag gaacctccca ttcggtgtcg cgcagctgct cccaagaaac ttcagtggag 1500
ctagcacctg gctgaacctt ggcagccatg gcgtccagac ccttgttcac agcgtcctgg 1560
tgggaaccgg agaaagcggt gaagaccagg tcgccgccgt atgggtggcg ctcaggaacg 1620
cgcagctggt tgcagtattc aacggtgctg cggatctggc gtatatcggt gaagtccagc 1680
tgagggtcaa cgccctgggt cagcatgttc agtgccaggg tgaccaggca gacgttgccg 1740
gtgcgctcgc cgttgccgaa caggcagcct tcgatgcggt cagcgccagc catgtagccc 1800
agctcagctg cgccaacgcc ggtgccacgg tcattgtgcg ggtgcaggga caggataatg 1860
gaatcacgac ggtttagatt gcggtgcatc cattcaatgg agtctgcgta aacgttaggg 1920
gtgatcatct caacggtgaa aggcaggttg atgatcattg ggttctcagg agttggatcc 1980
atgacctcaa caactgcgtc cacaacttcc ttggcgtact caacctcagt gccggtgaag 2040
gactcagggg agtactgcca gcgccagttg gtgtctgggt aatcctgagc gacggtcttg 2100
atcagttcag cggcatcggt agccagcttc ttcacctgca ccttgtccat gcggaacacc 2160
acgttgc 2167
<210> 11
<211> 1669
<212> DNA
<213> Artificial Sequence
<400> 11
ccagcgccag ttggtgtctg ggtaatcctg agcgacggtc ttgatcagtt cagcggcatc 60
ggtagccagc ttcttcacct gcaccttgtc catgcggaac accacgttgc gctgcaggat 120
ggaggttgag ttgtagaagt gcacgataac gttttttgcg ccttcgcaag cttcaaaagt 180
acggcgaatc aggtgctcac gagcctgaac cagaacctga atggtgacat cgtcagggat 240
catgtccttt tcgatgatct cacgaacgaa atcaaaatca gtctgggaag ctgaagggaa 300
accgacctcg atttccttga atcccatctg aaccagcagc tcaaacatgc ggcgcttacg 360
ctcaggagac atcggatcaa tcagagcctg gttgccgtca cgcaggtcaa cagcacacca 420
ctgaggtgca acggtgattt ttttatctgg ccaagtgcgg tccggcagag aaatatcttc 480
tacctcaacc tcgaaaggca tgtagcggtt aactggcatt gaggagccac actgcttatt 540
ccatgctggc tggccttcat tgcgaggccc aactggggtt tcgatcttgg caggtgcgga 600
gatgaatgca tcgttaggag acattgtgtt caaccttctt aaaaagtttt gggtgggtcc 660
acgaccggca acaccaaact ccgcgacggg atgccggtcg tgttaagacc tctgggaccc 720
gccgcggcga agaagaagta gattcgcacg cgaagtcatg tggtgaagca tacaacaact 780
ttgtggtgtg ggtagcaact cggggggagt tttcttttaa aaaagctttt cgacgcccag 840
ttccagtgct gtcatgtctc gggggggaac tttggagttt aaatcgacta ctcacatagg 900
gtcgggctag tcattctgat cagcgaattc cacgttcaca tcgccaattc cagagttcac 960
aaccagattc agcattggac cttctagatc agcattgtgg gcggtgagat ctccaacatc 1020
acagcgcgct gtgcccacac cggcggtaca acttaggctc acgggcacat catcgggcag 1080
ggtgaccatg acttcgccga tccctgaggt gatttggatg ttttgttcct gatccaattg 1140
ggtgaggtgg ctgaaatcga ggttcatttc acccacgcca gaggtgtagc tgctgaggag 1200
ttcatcgttg gtggggatga gattgacatc gccgattcca gggtcgtctt caaagtagat 1260
gggatcgata tttgaaataa acaggcctgc gagggcgctc atgacaactc cggtaccaac 1320
tacaccgccg acaatccatg gccacacatg gcgctttttc tgaggctttt gtggagggac 1380
ttgtacatcc caggtgttgt attggttttg ggcaagtgga tcccaatgag gcgcttcggg 1440
ggtttgttgc gcgaagggtg catagtagcc ctcaacgggg gtgatagtgc ttagatctgg 1500
ttggggttgt gggtagagat cttcgttttt catggtggca tcctcagaaa cagtgaattc 1560
agtggtgagt agtccgcggg gtggaagtgg ttgtttctta tgcaacgccc accacatggc 1620
taaaaggcaa aggtaagtaa tggctgctgc tgggccgaat attcctcca 1669
<210> 12
<211> 2176
<212> DNA
<213> Artificial Sequence
<400> 12
gcttgcatgc ctgcaggtcg actctagagg atccccttaa acgccgccag ccaggactgc 60
ctcgtggttg acgtccagcg cgcggtttac ggcggaggtc actgccttca gcgaagcgta 120
ggtgatggag ccagcgatgc cgacgcccca gaccttgcgg ccgttgacct cagccagcac 180
gtaggcggct gcttctgcat cgtcgcccga ggtgcgggcg tgctggttgt attcctggat 240
ctcaacgtcg atgcccagct tctccagcgc gttggcgtaa gcagccagtg ggccgttgcc 300
gtggccatcg acggtgacgt ccttgccgtt gtggatgagc tcggcggtga tggatgcatc 360
ctcgttttcg gtctgagcgt tctcgacgcg cagcgcgatc tgctcaactg gtgcggtgcg 420
ctccaggtac tcggtggcga agatatccca cattgccttg gagttgacct cgccgccctc 480
agcgtcggtg acgttctgga caacggtgga gaactcaacc tgcatggagc gagggatctg 540
cagaccgtga tcggtcttca tgatgtaagc aacgccgccc ttgccggact gggagttcac 600
gcggataaca gcctcgtagt cgcgaccgac atcctttgga tcgataggca ggtaaggaac 660
ctcccattcg gtgtcgcgca gctgctccca agaaacttca gtggagctag cacctggctg 720
aaccttggca gccatggcgt ccagaccctt gttcacagcg tcctggtggg aaccggagaa 780
agcggtgaag accaggtcgc cgccgtatgg gtggcgctca ggaacgcgca gctggttgca 840
gtattcaacg gtgctgcgga tctggcgtat atcggtgaag tccagctgag ggtcaacgcc 900
ctgggtcagc atgttcagtg ccagggtgac caggcagacg ttgccggtgc gctcgccgtt 960
gccgaacagg cagccttcga tgcggtcagc gccagccatg tagcccagct cagctgcgcc 1020
aacgccggtg ccacggtcat tgtgcgggtg cagggacagg ataatggaat cacgacggtt 1080
tagattgcgg tgcatccatt caatggagtc tgcgtaaacg ttaggggtga tcatctcaac 1140
ggtgaaaggc aggttgatga tcattgggtt ctcaggagtt ggatccatga cctcaacaac 1200
tgcgtccaca acttccttgg cgtactcaac ctcagtgccg gtgaaggact caggggagta 1260
ctgccagcgc cagttggtgt ctgggtaatc ctgagcgacg gtcttgatca gttcagcggc 1320
atcggtagcc agcttcttca cctgcacctt gtccatgcgg aacaccacgt tgcgctgcag 1380
gatggaggtt gagttgtaga agtgcacgat aacgtttttt gcgccttcgc aagcttcaaa 1440
agtacggcga atcaggtgct cacgagcctg aaccagaacc tgaatggtga catcgtcagg 1500
gatcatgtcc ttttcgatga tctcacgaac gaaatcaaaa tcagtctggg aagctgaagg 1560
gaaaccgacc tcgatttcct tgaatcccat ctgaaccagc agctcaaaca tgcggcgctt 1620
acgctcagga gacatcggat caatcagagc ctggttgccg tcacgcaggt caacagcaca 1680
ccactgaggt gcaacggtga tttttttatc tggccaagtg cggtccggca gagaaatatc 1740
ttctacctca acctcgaaag gcatgtagcg gttaactggc attgaggagc cacgctgctt 1800
attccatgct ggctggcctt cattgcgagg cccaactggg gtttcgatct tggcaggtgc 1860
ggagatgaat gcatcgttag gagacattgt gttcaacctt cttaaaaagt tttgggtggg 1920
tccacgaccg gcaacaccaa actccgcgac gggatgccgg tcgtgttaag acctctggga 1980
cccgccgcgg cgaagaagaa gtagattcgc acgcgaagtc atgtggtgaa gcatacaaca 2040
actttgtggt gtgggtagca actcgggggg agttttcttt taaaaaagct tttcgacgcc 2100
cagttccagt gctgtcatgt ctcggggggg aactttggag ttgttttggc ggatgagaga 2160
agattttcag cctgat 2176
<210> 13
<211> 2176
<212> DNA
<213> Artificial Sequence
<400> 13
gcttgcatgc ctgcaggtcg actctagagg atccccttaa acgccgccag ccaggactgc 60
ctcgtggttg acgtccagcg cgcggtttac ggcggaggtc actgccttca gcgaagcgta 120
ggtgatggag ccagcgatgc cgacgcccca gaccttgcgg ccgttgacct cagccagcac 180
gtaggcggct gcttctgcat cgtcgcccga ggtgcgggcg tgctggttgt attcctggat 240
ctcaacgtcg atgcccagct tctccagcgc gttggcgtaa gcagccagtg ggccgttgcc 300
gtggccatcg acggtgacgt ccttgccgtt gtggatgagc tcggcggtga tggatgcatc 360
ctcgttttcg gtctgagcgt tctcgacgcg cagcgcgatc tgctcaactg gtgcggtgcg 420
ctccaggtac tcggtggcga agatatccca cattgccttg gagttgacct cgccgccctc 480
agcgtcggtg acgttctgga caacggtgga gaactcaacc tgcatggagc gagggatctg 540
cagaccgtga tcggtcttca tgatgtaagc aacgccgccc ttgccggact gggagttcac 600
gcggataaca gcctcgtagt cgcgaccgac atcctttgga tcgataggca ggtaaggaac 660
ctcccattcg gtgtcgcgca gctgctccca agaaacttca gtggagctag cacctggctg 720
aaccttggca gccatggcgt ccagaccctt gttcacagcg tcctggtggg aaccggagaa 780
agcggtgaag accaggtcgc cgccgtatgg gtggcgctca ggaacgcgca gctggttgca 840
gtattcaacg gtgctgcgga tctggcgtat atcggtgaag tccagctgag ggtcaacgcc 900
ctgggtcagc atgttcagtg ccagggtgac caggcagacg ttgccggtgc gctcgccgtt 960
gccgaacagg cagccttcga tgcggtcagc gccagccatg tagcccagct cagctgcgcc 1020
aacgccggtg ccacggtcat tgtgcgggtg cagggacagg ataatggaat cacgacggtt 1080
tagattgcgg tgcatccatt caatggagtc tgcgtaaacg ttaggggtga tcatctcaac 1140
ggtgaaaggc aggttgatga tcattgggtt ctcaggagtt ggatccatga cctcaacaac 1200
tgcgtccaca acttccttgg cgtactcaac ctcagtgccg gtgaaggact caggggagta 1260
ctgccagcgc cagttggtgt ctgggtaatc ctgagcgacg gtcttgatca gttcagcggc 1320
atcggtagcc agcttcttca cctgcacctt gtccatgcgg aacaccacgt tgcgctgcag 1380
gatggaggtt gagttgtaga agtgcacgat aacgtttttt gcgccttcgc aagcttcaaa 1440
agtacggcga atcaggtgct cacgagcctg aaccagaacc tgaatggtga catcgtcagg 1500
gatcatgtcc ttttcgatga tctcacgaac gaaatcaaaa tcagtctggg aagctgaagg 1560
gaaaccgacc tcgatttcct tgaatcccat ctgaaccagc agctcaaaca tgcggcgctt 1620
acgctcagga gacatcggat caatcagagc ctggttgccg tcacgcaggt caacagcaca 1680
ccactgaggt gcaacggtga tttttttatc tggccaagtg cggtccggca gagaaatatc 1740
ttctacctca acctcgaaag gcatgtagcg gttaactggc attgaggagc cacactgctt 1800
attccatgct ggctggcctt cattgcgagg cccaactggg gtttcgatct tggcaggtgc 1860
ggagatgaat gcatcgttag gagacattgt gttcaacctt cttaaaaagt tttgggtggg 1920
tccacgaccg gcaacaccaa actccgcgac gggatgccgg tcgtgttaag acctctggga 1980
cccgccgcgg cgaagaagaa gtagattcgc acgcgaagtc atgtggtgaa gcatacaaca 2040
actttgtggt gtgggtagca actcgggggg agttttcttt taaaaaagct tttcgacgcc 2100
cagttccagt gctgtcatgt ctcggggggg aactttggag ttgttttggc ggatgagaga 2160
agattttcag cctgat 2176
<210> 14
<211> 1262
<212> DNA
<213> Artificial Sequence
<400> 14
cagtgccaag cttgcatgcc tgcaggtcga ctctagaatt ccctgtcggt gaagcaggca 60
gaggagcgag gattttctca gcgctttact gcagaaactg atgtggcggg agctgcgaaa 120
tttcaaaagt tgcttcccgt cggtttgtac ttgattcgtg agatcacgcc tgagaatccg 180
cataaggatt ataaaacttc tgagccgttc ttgatcacgt tgcctgtggg taatgtgaca 240
ggcgatgcgt ggcagtgtga tgtggtgatc aagacaaagg agactccgga cccagaccca 300
gatccgactc cgaccccaac ttcaccacag ccccctactt cgacagaaac cacgacgact 360
ccgctggtac ctacccctcc gatcacgccg ccagctgagg atataactgg cagcaccact 420
gagaaagatc cgagtcgccc tagtattctg gcgtctaccg gtgccaacgt gttgtggctg 480
gtaggtggag cattactggc tgttattgct ggtgtgttct ttgttcttcg tggacgtaga 540
tctaaagact cctaaagtaa aaaaggttct gccctcactc cacatggagt gagggcagaa 600
cctttcggtg tgtagggcct agggggaggc gtcgtaaagc tgtgttcaac cttcttaaaa 660
agttttgggt gggtccacga ccggcaacac caaactccgc gacgggatgc cggtcgtgtt 720
aagacctctg ggacccgccg cggcgaagaa gaagtagatt cgcacgcgaa gtcatgtggt 780
gaagcataca acaactttgt ggtgtgggta gcaactcggg gggagttttc ttttaaaaaa 840
gcttttcgac gcccagttcc agtgctgtca tgtctcgggg gggaactttg gagttttacc 900
ttttcgatcc ggccggcatt gtgcttgtac gagacagtgc aatggtggaa acaatcatca 960
ccaagagtgc gatgcccatg gcgatccatt cccagtccac gacttggaat ttttcgccca 1020
gaaccaagta gcccaaactg aaggcgacaa ttggttcggc aatggtcatg gcgggtagcg 1080
atttttgtag ttcgccagcg ttaaaggaat actgctgcac gattgttcca agtaatgcgg 1140
tgaggattag gccgtagcct tcccagttca agatgagtcc cgttatgcct tgatggacaa 1200
aaagatccac cgcggctttg gacagggtac cgagctcgaa ttcgtaatca tggtcatagc 1260
tg 1262

Claims (10)

1.一种YH66_01475突变体,是将YH66_01475蛋白质第32位氨基酸残基由精氨酸突变为其他氨基酸残基得到的蛋白质;
所述YH66_01475蛋白质为如下A1)-A3)中的任一种:
A1)SEQ ID No.2所示的氨基酸序列组成的蛋白质;
A2)将A1)所示的氨基酸序列经过除第32位氨基酸残基以外的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与细菌产精氨酸相关的蛋白质;
A3)来源于细菌且与A1)或A2)具有95%以上同一性且与细菌产精氨酸相关的蛋白质。
2.根据权利要求1所述的YH66_01475突变体,其特征在于:所述YH66_01475突变体是将YH66_01475蛋白质第32位氨基酸残基由精氨酸突变为半胱氨酸得到的蛋白质。
3.与权利要求1所述YH66_01475突变体相关的生物材料,所述生物材料为如下B1)至B4)中的任一种:
B1)编码权利要求1或2所述YH66_01475突变体的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物。
4.根据权利要求3所述的生物材料,其特征在于:所述核酸分子为如下C1)或C2)中的任一种:
C1)核苷酸序列为SEQ ID No.3的DNA分子;
C2)将SEQ ID No.3所示的核苷酸序列经过修饰和/或一个或几个核苷酸的取代和/或缺失和/或添加得到的与C1)所示的DNA分子具有90%以上的同一性,且具有相同功能的DNA分子。
5.YH66_01475蛋白质或与YH66_01475蛋白质相关的生物材料或权利要求1所述的YH66_01475突变体或权利要求2所述的生物材料在如下X1)至X4)中任一种中的应用:
X1)调控细菌精氨酸产量;
X2)构建产精氨酸工程菌;
X3)制备精氨酸;
所述YH66_01475蛋白质为权利要求1中所述YH66_01475蛋白质;
与YH66_01475蛋白质相关的生物材料为如下D1)至D4)中的任一种:
D1)编码所述YH66_01475蛋白质的核酸分子;
D2)含有D1)所述核酸分子的表达盒;
D3)含有D1)所述核酸分子的重组载体、或含有D2)所述表达盒的重组载体;
D4)含有D1)所述核酸分子的重组微生物、或含有D2)所述表达盒的重组微生物、或含有D3)所述重组载体的重组微生物。
6.提高YH66_01475蛋白质或YH66_01475突变体含量和/或活性的物质或提高YH66_01475基因或YH66_01475突变体基因表达量的物质在如下Y1)至Y3)中任一种中的应用:
Y1)提高细菌精氨酸产量;
Y2)构建产精氨酸工程菌;
Y3)制备精氨酸;
所述YH66_01475蛋白质为权利要求1中所述YH66_01475蛋白质;
所述YH66_01475突变体为权利要求1所述YH66_01475突变体;
所述YH66_01475基因为编码权利要求1中所述YH66_01475蛋白质的基因;
所述YH66_01475突变体基因为编码权利要求1所述YH66_01475突变体的基因。
7.一种提高细菌精氨酸产量的方法,为如下M1)或M2):
所述M1)包括如下步骤:将细菌基因组中的YH66_01475基因替换为YH66_01475突变体基因,实现细菌精氨酸产量的提高;
所述M2)包括如下步骤:提高细菌中YH66_01475蛋白质或YH66_01475突变体含量和/或活性,或提高细菌中YH66_01475基因或YH66_01475突变体基因表达量,实现细菌精氨酸产量的提高;
所述YH66_01475蛋白质为权利要求1中所述YH66_01475蛋白质;
所述YH66_01475突变体为权利要求1所述YH66_01475突变体;
所述YH66_01475基因为编码权利要求1中所述YH66_01475蛋白质的基因;
所述YH66_01475突变体基因为编码权利要求1所述YH66_01475突变体的基因。
8.一种产精氨酸工程菌的构建方法,为如下N1)或N2):
所述N1)包括如下步骤:将细菌基因组中的YH66_01475基因替换为YH66_01475突变体基因,得到所述产精氨酸工程菌;
所述N2)包括如下步骤:提高细菌中YH66_01475蛋白质或YH66_01475突变体含量和/或活性,或提高细菌中YH66_01475基因或YH66_01475突变体基因表达量,得到所述产精氨酸工程菌;
所述YH66_01475蛋白质为权利要求1中所述YH66_01475蛋白质;
所述YH66_01475突变体为权利要求1所述YH66_01475突变体;
所述YH66_01475基因为编码权利要求1中所述YH66_01475蛋白质的基因;
所述YH66_01475突变体基因为编码权利要求1所述YH66_01475突变体的基因。
9.按照权利要求8所述方法构建得到的产精氨酸工程菌在制备精氨酸中的应用。
10.一种制备精氨酸的方法,包括如下步骤:发酵培养按照权利要求8所述方法构建得到的产精氨酸工程菌,得到所述精氨酸。
CN202210247165.3A 2022-03-14 2022-03-14 Yh66_01475蛋白及其编码基因在调控细菌精氨酸产量中的应用 Pending CN114605509A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210247165.3A CN114605509A (zh) 2022-03-14 2022-03-14 Yh66_01475蛋白及其编码基因在调控细菌精氨酸产量中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210247165.3A CN114605509A (zh) 2022-03-14 2022-03-14 Yh66_01475蛋白及其编码基因在调控细菌精氨酸产量中的应用

Publications (1)

Publication Number Publication Date
CN114605509A true CN114605509A (zh) 2022-06-10

Family

ID=81863413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210247165.3A Pending CN114605509A (zh) 2022-03-14 2022-03-14 Yh66_01475蛋白及其编码基因在调控细菌精氨酸产量中的应用

Country Status (1)

Country Link
CN (1) CN114605509A (zh)

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZAIWEI MAN等: "Systems pathway engineering of Corynebacterium crenatum for improved L-arginine production", SCIENTIFIC REPORTS, vol. 6, pages 1 - 10 *
王颖妤: "代谢工程改造谷氨酸棒杆菌发酵生产 L-亮氨酸", 中国博士学位论文全文数据库(电子期刊), pages 018 - 19 *

Similar Documents

Publication Publication Date Title
CN110607313B (zh) 一种高产l-赖氨酸的重组菌株及其构建方法与应用
CN113667682B (zh) Yh66-rs11190基因突变体及其在制备l-缬氨酸中的应用
CN110592109B (zh) 一种spoT基因改造的重组菌株及其构建方法与应用
CN110846333B (zh) 一种deoB基因改造的重组菌株及其构建方法与应用
CN111471693B (zh) 一种产赖氨酸的谷氨酸棒杆菌及其构建方法与应用
CN110592084B (zh) 一种rhtA基因启动子改造的重组菌株及其构建方法与应用
CN110846312B (zh) 一种sdaA基因的启动子核酸序列、含有该核酸序列的重组菌株及其应用
CN111961635A (zh) 一种产l-赖氨酸的重组菌株及其构建方法与应用
CN114181288B (zh) 制备l-缬氨酸的方法及其所用的基因与该基因编码的蛋白质
WO2023231547A1 (zh) NCgl2747基因突变体及其在制备L-赖氨酸中的应用
CN114409751A (zh) 一种yh66_04470基因突变的重组菌及其在制备精氨酸中的应用
CN114349831A (zh) aspA基因突变体、重组菌及制备L-缬氨酸的方法
CN114540399A (zh) 一种制备l-缬氨酸的方法及其所用基因突变体和生物材料
CN110804617B (zh) 一种kdtA基因改造的重组菌株及其构建方法与应用
CN110564742B (zh) 一种yebN基因改造的重组菌株及其构建方法与应用
KR20230142709A (ko) 유전자 bbd29_11265를 변형시켜 l-글루탐산을 생성하기위한 재조합 균주 및 이의 구성 방법 및 적용
CN114507273B (zh) Yh66_07020蛋白及其相关生物材料在提高精氨酸产量中的应用
CN114605509A (zh) Yh66_01475蛋白及其编码基因在调控细菌精氨酸产量中的应用
CN112725253A (zh) 一种改造基因bbd29_14900的重组菌株及其构建方法与应用
CN114410615B (zh) Yh66_00525蛋白及其编码基因在调控细菌精氨酸产量中的应用
CN112522175A (zh) 一种改造基因bbd29_09525产l-谷氨酸的重组菌株及其构建方法与应用
CN114277069B (zh) 制备l-缬氨酸的方法及其所用生物材料
CN114249803B (zh) 一种高产精氨酸的工程菌及其构建方法与应用
CN114410615A (zh) Yh66_00525蛋白及其编码基因在调控细菌精氨酸产量中的应用
CN114315998B (zh) Cey17_rs00300基因突变体及其在制备l-缬氨酸中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination