CN114409751A - 一种yh66_04470基因突变的重组菌及其在制备精氨酸中的应用 - Google Patents

一种yh66_04470基因突变的重组菌及其在制备精氨酸中的应用 Download PDF

Info

Publication number
CN114409751A
CN114409751A CN202111661169.8A CN202111661169A CN114409751A CN 114409751 A CN114409751 A CN 114409751A CN 202111661169 A CN202111661169 A CN 202111661169A CN 114409751 A CN114409751 A CN 114409751A
Authority
CN
China
Prior art keywords
mutant
gene
protein
arginine
nucleic acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111661169.8A
Other languages
English (en)
Inventor
魏爱英
赵春光
孟刚
田斌
贾慧萍
付丽霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ningxia Eppen Biotech Co ltd
Original Assignee
Ningxia Eppen Biotech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ningxia Eppen Biotech Co ltd filed Critical Ningxia Eppen Biotech Co ltd
Priority to CN202111661169.8A priority Critical patent/CN114409751A/zh
Publication of CN114409751A publication Critical patent/CN114409751A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/34Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Corynebacterium (G)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/77Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/10Citrulline; Arginine; Ornithine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/101Plasmid DNA for bacteria

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公开了一种YH66_04470基因突变的重组菌及其在制备精氨酸中的应用。本发明公开的YH66_04470突变体是将YH66_04470蛋白质第215位氨基酸残基由苏氨酸突变为异亮氨酸得到的蛋白质。本发明首先通过对YH66_04470基因进行单点突变得到YH66_04470C644T,然后通过对构建的YH66_04470或突变基因的过表达重组菌以及YH66_04470敲除重组菌进行发酵培养发现,YH66_04470基因或其突变基因可以调控细菌L‑精氨酸产量。本发明首次发现YH66_04470基因参与精氨酸的生物合成,对于培育高产、高质量菌种,以及精氨酸工业化生产具有重大的应用价值。

Description

一种YH66_04470基因突变的重组菌及其在制备精氨酸中的 应用
技术领域
本发明属于生物技术领域,具体涉及一种YH66_04470基因突变的重组菌及其在制备精氨酸中的应用。
背景技术
精氨酸是人体必需的一种氨基酸,存在于多种动物类食物中。精氨酸在医药、营养保健、食品等领域应用广泛,需求量大,被称之为氨基酸中最重要的品种之一。L-精氨酸是生物体尿素循环的重要中间代谢产物,所有的机体组织都利用L-精氨酸合成细胞浆蛋白和核蛋白。在生理活性方面,除了与生长激素、胰岛素、胰高血糖素等激素诱导有关外,近年来,又作为血管舒张因子而引起关注,有望成为营养疗法的新材料。由于L-精氨酸拥有重要的科学研究、实际生产及应用价值,且现在国内传统生产方法依旧污染严重、产能产值较低,因此,发酵法生产精氨酸列入国家重点攻关科技项目。
目前已被报道的精氨酸生产菌株主要有钝齿棒状杆菌、谷氨酸棒状杆菌、大肠杆菌、酿酒酵母、黄色短杆菌等。虽然已被报道的部分精氨酸生产菌株已经具备了较为优良的发酵性能,但是,鉴于精氨酸重要的应用价值和巨大的市场需求,寻求发酵性能更为优良的精氨酸生产菌株仍然是所有研究开发工作的基础,更是各精氨酸生产厂家增加自身市场竞争力的重中之重。
发明内容
第一方面,本发明保护一种YH66_04470突变体。
本发明保护的YH66_04470突变体是将YH66_04470蛋白质第215位氨基酸残基由苏氨酸突变为其他氨基酸残基得到的蛋白质;
所述YH66_04470蛋白质为如下A1)-A3)中的任一种:
A1)SEQ ID No.2所示的氨基酸序列组成的蛋白质;
A2)将A1)所示的氨基酸序列经过除第215位氨基酸残基以外的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与细菌产精氨酸相关的蛋白质;
A3)来源于细菌且与A1)或A2)具有95%以上同一性且与细菌产精氨酸相关的蛋白质。
上述A2)所述的蛋白质中,所述一个或几个氨基酸残基的取代和/或缺失和/或添加为不超过10个氨基酸残基的取代和/或缺失和/或添加。
上述A3)所述的蛋白质中,这里使用的术语“同一性”指与天然氨基酸序列的序列相似性。“同一性”包括与本发明的SEQ ID No.2所示的氨基酸序列具有95%或更高,或96%或更高,或 97%或更高,或98%或更高,或99%或更高同一性的氨基酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比(%)表示,其可以用来评价相关序列之间的同一性。
上述A1)或A2)或A3)所述的蛋白质可人工合成,也可先合成其编码基因,再进行生物表达得到。
进一步的,所述YH66_04470突变体是将YH66_04470蛋白质第215位氨基酸残基由苏氨酸突变为异亮氨酸得到的蛋白质(对应本发明实施例中的YH66_04470C644T蛋白质)。
更进一步的,所述YH66_04470突变体(YH66_04470C644T蛋白质)是SEQ ID No.4所示的氨基酸序列组成的蛋白质。
第二方面,本发明保护与YH66_04470突变体相关的生物材料。
本发明保护的与YH66_04470突变体相关的生物材料为如下B1)至B4)中的任一种:
B1)编码上述YH66_04470突变体的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物。
第三方面,本发明保护上述YH66_04470蛋白质或与上述YH66_04470蛋白质相关的生物材料或上述YH66_04470突变体或与上述YH66_04470突变体相关的生物材料的新用途。
本发明保护上述YH66_04470蛋白质或与上述YH66_04470蛋白质相关的生物材料或上述YH66_04470突变体或与上述YH66_04470突变体相关的生物材料在如下X1)至X4)中任一种中的应用:
X1)调控细菌精氨酸产量;
X2)构建产精氨酸工程菌;
X3)制备精氨酸;
与YH66_04470蛋白质相关的生物材料为如下D1)至D4)中的任一种:
D1)编码所述YH66_04470蛋白质的核酸分子;
D2)含有D1)所述核酸分子的表达盒;
D3)含有D1)所述核酸分子的重组载体、或含有D2)所述表达盒的重组载体;
D4)含有D1)所述核酸分子的重组微生物、或含有D2)所述表达盒的重组微生物、或含有D3)所述重组载体的重组微生物。
上述生物材料或应用中,B1)所述编码YH66_04470突变体的核酸分子为如下C1)或C2)中的任一种:
C1)核苷酸序列为SEQ ID No.3的DNA分子;
C2)将SEQ ID No.3所示的核苷酸序列经过修饰和/或一个或几个核苷酸的取代和/或缺失和/或添加得到的与C1)所示的DNA分子具有90%以上的同一性,且具有相同功能的DNA 分子。
D1)所述编码YH66_04470蛋白质的核酸分子为如下E1)或E2)中的任一种:
E1)核苷酸序列为SEQ ID No.1的DNA分子;
E2)将SEQ ID No.1所示的核苷酸序列经过修饰和/或一个或几个核苷酸的取代和/或缺失和/或添加得到的与E1)所示的DNA分子具有90%以上的同一性,且具有相同功能的DNA分子。
其中,SEQ ID No.1所示的DNA分子为谷氨酸棒杆菌(Corynebacteriumglutamicum) CGMCC No.20516中的YH66_04470基因,其编码的YH66_04470蛋白质的氨基酸序列如SEQ ID No.2所示。在本发明中通过引入点突变,得到SEQ ID No.3所示的YH66_04470C644T基因,其编码的YH66_04470C644T蛋白质的氨基酸序列如SEQ ID No.4所示。
本领域普通技术人员可以很容易地采用已知的方法,例如定向进化和点突变的方法,对本发明的编码YH66_04470蛋白质或YH66_04470突变体的核苷酸序列进行突变。那些经过人工修饰的,具有编码YH66_04470蛋白质或YH66_04470突变体的核苷酸序列90%或者更高同一性的核苷酸,只要编码YH66_04470蛋白质或YH66_04470突变体且具有相同功能,均是衍生于本发明的核苷酸序列并且等同于本发明的序列。
这里使用的术语“同一性”指与天然核酸序列的序列相似性。“同一性”包括与本发明的编码SEQ ID No.2或SEQ ID No.4所示的氨基酸序列组成的蛋白质的核苷酸序列具有90%或更高,或91%或更高,或92%或更高,或93%或更高,或94%或更高,或95%或更高,或96%或更高,或97%或更高,或98%或更高,或99%或更高同一性的核苷酸序列。同一性可以用肉眼或计算机软件进行评价。使用计算机软件,两个或多个序列之间的同一性可以用百分比 (%)表示,其可以用来评价相关序列之间的同一性。
所述严格条件是在2×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次5min;或,0.5×SSC,0.1%SDS的溶液中,在68℃下杂交并洗膜2次,每次15min;或,0.1×SSPE (或0.1×SSC)、0.1%SDS的溶液中,65℃条件下杂交并洗膜。
上述生物材料或应用中,B2)所述含有编码YH66_04470突变体的核酸分子的表达盒是指能够在宿主细胞中表达YH66_04470突变体的DNA,该DNA不但可包括启动YH66_04470突变体基因转录的启动子,还可包括终止YH66_04470突变体基因转录的终止子。进一步,所述表达盒还可包括增强子序列。D2)所述含有编码YH66_04470蛋白质的核酸分子的表达盒是指能够在宿主细胞中表达YH66_04470蛋白质的DNA,该DNA不但可包括启动 YH66_04470基因转录的启动子,还可包括终止YH66_04470基因转录的终止子。进一步,所述表达盒还可包括增强子序列。
上述生物材料或应用中,B3)或D3)所述载体可为质粒、黏粒、噬菌体或病毒载体。所述质粒具体可为pK18mobsacB质粒或pXMJ19质粒。
在本发明的一个具体实施例中,所述重组载体为重组载体pK18-YH66_04470C644T
在本发明的另一个具体实施例中,所述重组载体为重组载体pK18-YH66_04470OE或重组载体pK18-YH66_04470C644TOE。
在本发明的又一个具体实施例中,所述重组载体为重组载体pXMJ19-YH66_04470或重组载体pXMJ19-YH66_04470C644T
上述生物材料中,B4)或D4)所述微生物可为酵母、细菌、藻或真菌。
进一步的,细菌可为任一具有产精氨酸能力的细菌,如来自短杆菌属(Brevibacterium)、棒杆菌属(Corynebacterium)、埃希氏菌属(Escherichia)、气杆菌属(Aerobacter)、微球菌属(Micrococcus)、黄杆菌属(Flavobacterium)或芽胞杆菌属(Bacillus)的细菌等。
更进一步的,所述细菌包括但不限于谷氨酸棒杆菌(Corynebacteriumglutamicum)、黄色短杆菌(Brevibacterium flavum)、乳酸发酵短杆菌(Brevibacteriumlactofermentum)、产谷氨酸微球菌(Micrococcus glutamicus)、产氨短杆菌(Brevibacterum ammoniagenes)、大肠杆菌 (Escherichia coli)、产气气杆菌(Aerobacter aerogenes)。
在本发明的一个具体实施例中,所述微生物为谷氨酸棒杆菌(Corynebacteriumglutamicum)CGMCC No.20516,该菌株名称为YPARG01,已于2020年08月10日保藏于 中国微生物菌种保藏管理委员会普通微生物中心(简称CGMCC,地址为:北京市朝阳区北辰 西路1号院3号,中国科学院微生物研究所),保藏登记号为CGMCC No.20516。
上述应用中,调控为正调控。具体体现为当细菌中YH66_04470蛋白质或YH66_04470 突变体含量或活性提高时,所述细菌精氨酸产量提高;当细菌中YH66_04470蛋白质含量或活性降低时,所述细菌精氨酸产量降低。
第四方面,本发明保护提高YH66_04470蛋白质或YH66_04470突变体含量和/或活性的物质或提高YH66_04470基因或YH66_04470突变体基因表达量的物质的新用途。
本发明保护提高YH66_04470蛋白质或YH66_04470突变体含量和/或活性的物质或提高 YH66_04470基因或YH66_04470突变体基因表达量的物质在如下Y1)至Y4)中任一种中的应用:
Y1)提高细菌精氨酸产量;
Y2)构建产精氨酸工程菌;
Y3)制备精氨酸。
进一步的,所述提高YH66_04470基因表达量的物质可为YH66_04470基因或含有所述 YH66_04470基因的重组载体。
所述提高YH66_04470突变体基因表达量的物质可为YH66_04470突变体基因或含有所述YH66_04470突变体基因的重组载体。
更进一步的,含有所述YH66_04470基因的重组载体具体可为重组载体pK18-YH66_04470OE或重组载体pXMJ19-YH66_04470。
含有所述YH66_04470突变体基因的重组载体具体可为重组载体pK18-YH66_04470C644T OE或重组载体pXMJ19-YH66_04470C644T
第五方面,本发明保护一种提高细菌精氨酸产量的方法。
本发明保护的提高细菌精氨酸产量的方法为如下M1)或M2):
所述M1)包括如下步骤:将细菌基因组中的YH66_04470基因替换为YH66_04470突变体基因,实现细菌精氨酸产量的提高;
所述M2)包括如下步骤:提高细菌中YH66_04470蛋白质或YH66_04470突变体含量和/ 或活性,或提高细菌中YH66_04470基因或YH66_04470突变体基因表达量,实现细菌精氨酸产量的提高。
第六方面,本发明保护一种产精氨酸工程菌的构建方法。
本发明保护的产精氨酸工程菌的构建方法为如下N1)或N2):
所述N1)包括如下步骤:将细菌基因组中的YH66_04470基因替换为YH66_04470突变体基因,得到所述产精氨酸工程菌;
所述N2)包括如下步骤:提高细菌中YH66_04470蛋白质或YH66_04470突变体含量和/ 或活性,或提高细菌中YH66_04470基因或YH66_04470突变体基因表达量,得到所述产精氨酸工程菌;
上述任一所述应用或方法中,所述YH66_04470突变体具体为YH66_04470C644T蛋白质,具体为SEQ ID No.4所示的氨基酸序列组成的蛋白质。
所述YH66_04470突变体基因具体为YH66_04470C644T基因,具体为SEQ ID No.3所示的 DNA分子。
按照上述产精氨酸工程菌的构建方法构建得到的产精氨酸工程菌在制备精氨酸中的应用也属于本发明的保护范围。
第七方面,本发明保护一种制备精氨酸的方法。
本发明保护的制备精氨酸的方法包括如下步骤:发酵培养按照上述产精氨酸工程菌的构建方法构建得到的产精氨酸工程菌,得到所述精氨酸。
所述发酵培养方法可按照现有技术中的常规试验方法进行。也可采用优化和改进后的常规试验方法进行。
所述发酵培养采用的培养基如实施例中的表3所示。
所述发酵培养条件如实施例中的表4所示。
上述任一所述应用或方法中,所述精氨酸具体为L-精氨酸。
本发明首先通过对YH66_04470基因进行单点突变得到YH66_04470C644T基因,然后通过对构建的YH66_04470或突变基因的过表达重组菌以及YH66_04470敲除重组菌进行发酵培养发现,YH66_04470基因或其突变基因可以调控细菌L-精氨酸产量。本发明首次发现YH66_04470基因参与精氨酸的生物合成,对于培育符合工业化生产的高产、高质量菌种,以及精氨酸工业化生产具有重大的应用价值。
具体实施方式
下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。以下提供的实施例可作为本技术领域普通技术人员进行进一步改进的指南,并不以任何方式构成对本发明的限制。
下述实施例中的实验方法,如无特殊说明,均为常规方法,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、构建包含点突变的YH66_04470基因编码区的重组载体
依据NCBI公布的黄色短杆菌(Brevibacterium flavum)ATCC15168基因组序列,设计并合成两对扩增YH66_04470基因编码区的引物,以等位基因置换的方式在谷氨酸棒杆菌(Corynebacterium glutamicum)CGMCC 20516(经测序确认该菌株染色体上保留有野生型的 YH66_04470基因)的YH66_04470基因编码区(SEQ ID No.1)中引入点突变,所述点突变为将YH66_04470基因的核苷酸序列(SEQ ID No.1)中的第644位胞嘧啶(C)突变为胸腺嘧啶(T),得到SEQ ID No.3所示的DNA分子(突变的YH66_04470基因,名称为 YH66_04470C644T)。
其中,SEQ ID No.1所示的DNA分子编码氨基酸序列为SEQ ID No.2的蛋白质(所述蛋白质名称为蛋白质YH66_04470)。
SEQ ID No.3所示的DNA分子编码氨基酸序列为SEQ ID No.4的突变蛋白质(所述突变蛋白质名称为YH66_04470C644T)。所述突变蛋白质YH66_04470C644T氨基酸序列(SEQ IDNo.4)中的第215位异亮氨酸(I)由苏氨酸(T)突变而来。
采用NEBuilder重组技术进行基因定点突变,引物设计如下(上海invitrogen公司合成),加粗字体的碱基为突变位置:
P1:5'-CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGTGGCGAGTTCGAAATG GACA-3',
P2:5'-GTCGATCTCGTATGGCTCAATTGGGTAACCGAAC-3',
P3:5'-GTTCGGTTACCCAATTGAGCCATACGAGATCGAC-3',
P4:5'-CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCTGATCTTGTTGCCTG CTGCA-3'。
构建方法:以黄色短杆菌ATCC15168为模板,分别采用引物P1/P2和P3/P4进行PCR扩增,获得两条分别带有突变碱基,大小分别为640bp和658bp的YH66_04470基因编码区的DNA片段(YH66_04470Up和YH66_04470Down)。
PCR扩增体系为:10×Ex Taq Buffer 5μL,dNTP Mixture(各2.5mM)4μL,Mg2+(25mM) 4μL,引物(10pM)各2μL,Ex Taq(5U/μL)0.25μL,总体积50μL。
PCR扩增反应程序为:94℃预变性5min,(94℃变性30s;52℃退火30s;72℃延伸40s;30个循环),72℃过度延伸10min。
将上述两条DNA片段(YH66_04470Up和YH66_04470Down)经琼脂糖凝胶电泳分离纯化后,与经过酶切(Xbal I/BamH I)后纯化的pK18mobsacB质粒(购自Addgene公司,用 XbalI/BamH I酶切)用NEBuilder酶(购自NEB公司)50℃连接30min,连接产物转化后长出的单克隆经PCR鉴定获得阳性重组载体pK18-YH66_04470C644T,该重组载体上含有卡那霉素抗性标记。将酶切正确的重组载体pK18-YH66_04470C644T送测序公司测序鉴定,并将含有正确点突变(C-T)的重组载体pK18-YH66_04470C644T保存备用。
重组载体pK18-YH66_04470C644T中YH66_04470C644T Up-Down DNA片段(YH66_04470Up-Down,SEQ ID No.5)大小为1264bp,由于含有突变位点,导致菌株谷氨酸棒杆菌CGMCC20516中YH66_04470基因编码区的第644位胞嘧啶(C)变为胸腺嘧啶(T),最终导致编码蛋白的第215位苏氨酸(T)变为异亮氨酸(I)。
所述重组载体pK18-YH66_04470C644T是将pK18mobsacB载体的Xbal I和/BamH I识别位点间的片段(小片段)替换为序列表中SEQ ID No.5的第37-1226位所示的DNA片段,且保持pK18mobsacB载体的其他序列不变,得到的重组载体。
所述重组载体pK18-YH66_04470C644T含有SEQ ID No.3所示的突变基因 YH66_04470C644T的第60-1249位所示的DNA分子。
实施例2、构建包含基因YH66_04470C644T的工程菌株YPR-013
构建方法:将实施例1中的等位替换质粒(pK18-YH66_04470C644T)通过电击转化入谷氨酸棒杆菌(Corynebacterium glutamicum)CGMCC 20516中后,在培养基中进行培养,培养基成分和培养条件参见表1,对培养产生的单菌落分别通过实施例1中的引物P1和通用引物 M13R进行鉴定,能扩增出1271bp大小条带的菌株为阳性菌株。将阳性菌株在含15%蔗糖的培养基上培养,对培养产生的单菌落分别在含有卡那霉素和不含卡那霉素的培养基上培养,选择在不含卡那霉素的培养基上生长,而在含卡那霉素的培养基上不生长的菌株进一步采用如下引物(上海invitrogen公司合成)进行PCR鉴定:
P5:5'-TTCGCCTCATGGCAAAGGTT-3';
P6:5'-CCTGTGCGGAACCGATCATA-3'。
将得到的PCR扩增产物(252bp)通过95℃高温变性10min、冰浴5min后进行SSCP(Single-Strand Conformation Polymorphis)电泳(以质粒pK18-YH66_04470C644T扩增片段为阳性对照,黄色短杆菌ATCC15168扩增片段为阴性对照,水作为空白对照),SSCP电泳的PAGE的制备及电泳条件参见表2,由于片段结构不同,电泳位置不同,因此片段电泳位置与阴性对照片段位置不一致且与阳性对照片段位置一致的菌株为等位替换成功的菌株。再次通过引物P5/P6 PCR扩增阳性菌株YH66_04470基因片段,并连接到PMD19-T载体进行测序,通过序列比对,碱基序列发生突变(C-T)的菌株为等位替换成功的阳性菌株,并被命名为YPR-0013。
重组菌YPR-013是将谷氨酸棒杆菌CGMCC 20516基因组中的YH66_04470基因进行单点突变(对应于SEQ ID No.1所示YH66_04470基因的第644位的碱基C突变为碱基T),且保持谷氨酸棒杆菌CGMCC 20516的基因组中的其它序列不变得到的重组菌。
表1、培养基的组成和培养条件
成分 配方
蔗糖 10g/L
多聚蛋白胨 10g/L
牛肉膏 10g/L
酵母粉 5g/L
尿素 2g/L
氯化钠 2.5g/L
琼脂粉 20g/L
pH 7.0
培养条件 32℃
表2、SSCP电泳的PAGE的制备及电泳条件
成分 用量(丙烯酰胺终浓度为8%)
40%丙烯酰胺 8mL
ddH<sub>2</sub>O 26mL
甘油 4mL
10×TBE 2mL
TEMED 40μL
10%APS 600μL
电泳条件 将电泳槽置入冰中,使用1×TBE缓冲液电压120V,电泳时间10h
实施例3、构建基因组上过表达YH66_04470基因或YH66_04470C644T基因的工程菌株YPR-014和YPR-015
依据NCBI公布的黄色短杆菌ATCC15168基因组序列,设计并合成三对扩增上下游同源臂片段及YH66_04470或YH66_04470C644T基因编码区及启动子区的引物,以同源重组的方式在谷氨酸棒杆菌CGMCC 20516中引入YH66_04470或YH66_04470C644T基因。
引物设计如下(上海invitrogen公司合成):
P7:5'-CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGCATGACGGCTGACTGG ACTC-3';
P8:5'-GCAGAAAGTTGCCCGAAGACAATCGGACTCCTTAAATGGG-3';
P9:5'-CCCATTTAAGGAGTCCGATTGTCTTCGGGCAACTTTCTGC-3';
P10:5'-CTATGTGAGTAGTCGATTTATTAGCGCTCCTCGCGAGGAA-3';
P11:5'-TTCCTCGCGAGGAGCGCTAATAAATCGACTACTCACATAG-3';
P12:5'-CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCTGCATAAGAAACAA CCACTT-3'。
构建方法:分别以黄色短杆菌ATCC15168或YPR-013为模板,分别采用引物P7/P8、P9/P10和P11/P12进行PCR扩增,获得上游同源臂片段806bp(对应于谷氨酸棒杆菌CGMCC20516YH66_03350基因及其启动子区或者是与上一个基因的间隔区,序列如SEQ ID No.6所示),YH66_04470基因及其启动子片段2079bp(序列如SEQ ID No.7所示)或YH66_04470C644T基因及其启动子片段2079bp(序列如SEQ ID No.8所示)及下游同源臂片段783bp(对应于谷氨酸棒杆菌CGMCC 20516YH66_03355基因及其与YH66_03350基因的部分间隔区,序列如SEQID No.9所示)。PCR反应结束后,对每个模板扩增得到的3个片段采用柱式DNA凝胶回收试剂盒分别进行电泳回收。回收后的3个片段与经过Xbal I/BamH I酶切后纯化的 pK18mobsacB质粒(购自Addgene公司)用NEBuilder酶(购自NEB公司)50℃连接30min,连接产物转化后长出的单克隆用M13引物经PCR鉴定获得阳性整合质粒(重组载体),分别为pK18-YH66_04470OE、pK18-YH66_04470C644TOE,该阳性整合质粒上含有卡那霉素抗性标记,可以通过卡那霉素筛选获得质粒整合到基因组上的重组子。
PCR反应体系为:10×Ex Taq Buffer 5μL,dNTP Mixture(各2.5mM)4μL,Mg2+(25mM) 4μL,引物(10pM)各2μL,Ex Taq(5U/μL)0.25μL,总体积50μL。
PCR反应程序为:94℃预变性5min,94℃变性30s;52℃退火30s;72℃延伸60s (30个循环),72℃过度延伸10min。
将测序正确的整合质粒(pK18-YH66_04470OE、pK18-YH66_04470C644TOE)分别电转化入谷氨酸棒杆菌CGMCC 20516,在培养基中进行培养,培养基成分和培养条件参见表1,对培养产生的单菌落通过P13/P14引物进行PCR鉴定,PCR扩增出大小为2352bp的片段(序列如SEQ ID No.10所示)的菌株为阳性菌株,扩增不到片段的菌株为原菌。将阳性菌株在含15%蔗糖的培养基上培养,对培养产生的单菌落进一步采用P15/P16引物进行PCR鉴定,PCR扩增出大小为1775bp的片段(序列如SEQ ID No.11所示)的菌株为YH66_04470或YH66_04470C644T基因整合到谷氨酸棒杆菌CGMCC 20516基因组上同源臂YH66_03350和下同源臂YH66_03355的间隔区上的阳性菌株,分别命名为YPR-014(不含突变点)和YPR-015 (含突变点)。
PCR鉴定引物如下所示:
P13:5'-GTCCGCTCTGTTGGTGTTCA-3'(对应上同源臂YH66_03350的外侧);
P14:5'-TTGATGCCACCAGCGATGGA-3'(对应YH66_04470基因内部);
P15:5'-CAAGTTTAACGACGAGATTC-3'(对应YH66_04470基因内部);
P16:5'-TGGAGGAATATTCGGCCCAG-3'(对应下同源臂YH66_03355的外侧)。
重组菌YPR-014含有双拷贝的SEQ ID No.1所示的YH66_04470基因;具体地,重组菌 YPR-014是将谷氨酸棒杆菌CGMCC 20516的基因组中上同源臂YH66_03350和下同源臂YH66_03355的间隔区替换为YH66_04470基因,保持谷氨酸棒杆菌CGMCC 20516的基因组中的其它核苷酸不变得到的重组菌。含有双拷贝YH66_04470基因的重组菌可以显著和稳定地提高YH66_04470基因的表达量。
重组菌YPR-015含有SEQ ID No.3所示的突变的YH66_04470C644T基因;具体地,重组菌YPR-015是将谷氨酸棒杆菌CGMCC 20516的基因组中上同源臂YH66_03350和下同源臂YH66_03355的间隔区替换为YH66_04470C644T基因,保持谷氨酸棒杆菌CGMCC 20516的基因组中的其它核苷酸不变得到的重组菌。
实施例4、构建质粒上过表达YH66_04470基因或YH66_04470C644T基因的工程菌株YPR-016和YPR-017
依据NCBI公布的黄色短杆菌ATCC15168基因组序列,设计并合成一对扩增YH66_04470 或YH66_04470C644T基因编码区及启动子区的引物,引物设计如下(上海invitrogen公司合成):
P17:5'-GCTTGCATGCCTGCAGGTCGACTCTAGAGGATCCCCGTCTTCGGGCAACTTT CTGC-3'(带下划线的核苷酸序列为pXMJ19上的序列);
P18:5'-ATCAGGCTGAAAATCTTCTCTCATCCGCCAAAACTTAGCGCTCCTCGCGAGG AA-3'(带下划线的核苷酸序列为pXMJ19上的序列)。
构建方法:分别以黄色短杆菌ATCC15168或YPR-013为模板,以引物P17/P18进行PCR 扩增,获得YH66_04470基因及其启动子片段2109bp(序列如SEQ ID No.12所示)和YH66_04470C644T基因及其启动子片段2109bp(序列如SEQ ID No.13所示),对扩增产物进行电泳并采用柱式DNA凝胶回收试剂盒进行纯化回收,回收的DNA片段与经EcoR I酶切回收的穿梭质粒pXMJ19用NEBuilder酶(购自NEB公司)50℃连接30min,连接产物转化后长出的单克隆用M13引物经PCR鉴定获得阳性过表达质粒pXMJ19-YH66_04470(含有 YH66_04470基因)和pXMJ19-YH66_04470C644T(含有YH66_04470C644T基因),将该质粒送测序。因质粒上含有氯霉素抗性标记,可以通过氯霉素来筛选质粒是否转化到菌株中。
PCR反应体系为:10×Ex Taq Buffer 5μL,dNTP Mixture(各2.5mM)4μL,Mg2+(25mM) 4μL,引物(10pM)各2μL,Ex Taq(5U/μL)0.25μL,总体积50μL。
PCR反应程序为:94℃预变性5min,94℃变性30s;52℃退火30s;72℃延伸60s (30个循环),72℃过度延伸10min。
将测序正确的pXMJ19-YH66_04470和pXMJ19-YH66_04470C644T质粒分别电转化入谷氨酸棒杆菌CGMCC 20516中,在培养基中进行培养,培养基成分和培养条件参见表1,对培养产生的单菌落通过引物M13R(-48)/P18进行PCR鉴定,PCR扩增出大小为2148bp的片段的菌株为阳性菌株,其被命名为YPR-016(不含突变点)和YPR-017(含突变点)。
重组菌YPR-016含有SEQ ID No.1所示的YH66_04470基因,是通过质粒过表达YH66_04470基因的重组菌。
重组菌YPR-017含有SEQ ID No.3所示的突变的YH66_04470C644T基因,是通过质粒过表达YH66_04470C644T基因的重组菌。
实施例5、构建基因组上缺失YH66_04470基因的工程菌株YPR-018
根据NCBI公布的黄色短杆菌ATCC15168的基因组序列,合成两对扩增YH66_04470基因编码区两端片段的引物,作为上下游同源臂片段。引物设计如下(上海invitrogen公司合成):
P19:5'-CAGTGCCAAGCTTGCATGCCTGCAGGTCGACTCTAGCACCCTAGATTCTTCA CGCA-3';
P20:5'-ACGAGAATCATCCGCTAAATATTTGTTCGGAAAAAAACTC-3';
P21:5'-GAGTTTTTTTCCGAACAAATATTTAGCGGATGATTCTCGT-3';
P22:5'-CAGCTATGACCATGATTACGAATTCGAGCTCGGTACCCTTAAGCCAAGGGCTT ATCGA-3'。
构建方法:以黄色短杆菌ATCC15168为模板,分别采用引物P19/P20和P21/P22进行PCR 扩增,获得YH66_04470的上游同源臂片段666bp及YH66_04470的下游同源臂片段684bp。对扩增的产物进行电泳并采用柱式DNA凝胶回收试剂盒进行纯化,回收的DNA片段与经过 Xbal I/BamH I酶切后纯化的pK18mobsacB质粒(购自Addgene公司)用NEBuilder酶(购自 NEB公司)50℃连接30min,连接产物转化后长出的单克隆用M13引物经PCR鉴定获得阳性敲除载体pK18-ΔYH66_04470,该质粒含有整个敲除YH66_04470同源臂片段1350bp(序列如SEQ ID No.14所示)和卡那霉素抗性作为筛选标记,将该质粒送测序。
PCR扩增反应体系为:10×Ex Taq Buffer 5μL,dNTP Mixture(各2.5mM)4μL,Mg2+(25mM)4μL,引物(10pM)各2μL,Ex Taq(5U/μL)0.25μL,总体积50μL。
PCR扩增反应程序为:94℃预变性5min,94℃变性30s;52℃退火30s;72℃延伸 90s(30个循环),72℃过度延伸10min。
将测序正确的敲除质粒pK18-ΔYH66_04470电转化入谷氨酸棒杆菌CGMCC 20516,在培养基中进行培养,培养基成分和培养条件参见表1,对培养产生的单菌落通过如下引物(上海invitrogen公司合成)进行PCR鉴定:
P23:5'-CACCCTAGATTCTTCACGCA-3'(对应于谷氨酸棒杆菌CGMCC 20516 YH66_04465基因启动子区);
P24:5'-TTAAGCCAAGGGCTTATCGA-3'(对应于谷氨酸棒杆菌CGMCC 20516YH66_04480基因编码区)。
上述PCR同时扩增出大小1276bp及2590bp的条带的菌株为阳性菌株,只扩增出2590bp 条带的菌株为原菌。阳性菌株在15%蔗糖培养基上筛选后分别在含有卡那霉素和不含卡那霉素的培养基上培养,选择在不含卡那霉素的培养基上生长,而在含卡那霉素的培养基上不生长的菌株进一步采用P23/P24引物进行PCR鉴定,扩增出大小为1276bp条带的菌株为 YH66_04470基因编码区被敲除的阳性菌株。再次通过P23/P24引物PCR扩增阳性菌株 YH66_04470片段,并连接到pMD19-T载体进行测序,将测序正确的菌株命名为YPR-018(谷氨酸棒杆菌CGMCC 20516上的基因组上的YH66_04470基因被敲除)。
实施例6、L-精氨酸发酵实验
将上述实施例构建的菌株(YPR-013、YPR-014、YPR-015、YPR-016、YPR-017和YPR-018) 和原始菌株谷氨酸棒杆菌CGMCC 20516在BLBIO-5GC-4-H型号的发酵罐(购自上海百仑生物科技有限公司)中以表3所示的培养基和表4所示的控制工艺进行发酵实验。每个菌株重复三次。完成发酵后,收集上清,采用HPLC检测上清中的L-精氨酸产量。
结果如表5所示,在谷氨酸棒杆菌中对YH66_04470基因编码区进行点突变 YH66_04470C644T及过表达,有助于L-精氨酸产量及转化率的提高,而对基因进行敲除或弱化,不利于L-精氨酸的积累。
表3、发酵培养基配方(其余为水)
Figure BDA0003447517950000101
Figure BDA0003447517950000111
表4、发酵控制工艺
Figure BDA0003447517950000112
表5、L-精氨酸发酵实验结果
Figure BDA0003447517950000113
Figure BDA0003447517950000121
以上对本发明进行了详述。对于本领域技术人员来说,在不脱离本发明的宗旨和范围,以及无需进行不必要的实验情况下,可在等同参数、浓度和条件下,在较宽范围内实施本发明。虽然本发明给出了特殊的实施例,应该理解为,可以对本发明作进一步的改进。总之,按本发明的原理,本申请欲包括任何变更、用途或对本发明的改进,包括脱离了本申请中已公开范围,而用本领域已知的常规技术进行的改变。按以下附带的权利要求的范围,可以进行一些基本特征的应用。
序列表
<110> 宁夏伊品生物科技股份有限公司
<120> 一种YH66_04470基因突变的重组菌及其在制备精氨酸中的应用
<160> 14
<170> PatentIn version 3.5
<210> 1
<211> 1314
<212> DNA
<213> Artificial Sequence
<400> 1
atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60
ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120
aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180
accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240
gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300
ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360
cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420
gcaaccttgg cttcctcggt taacattttg tctacctact accaggatca gctgaaccca 480
ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540
gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600
aacgcgcgtg agaacttcct gcgcatgatg ttcggttacc caactgagcc atacgagatc 660
gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720
aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780
atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840
ctggagatgc tcgaagacat caagaacaac cacggtggcg acgcaaccgc gttcatgaac 900
aaggtcaaga acaaggaaga cggcgtccgc ctcatgggct tcggacaccg cgtttacaag 960
aattacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020
ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080
tacttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140
gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200
tggatcgctc actaccgcga gcagctcggt gcagcaggca acaagatcaa ccgcccacgc 1260
caggtctaca ccggcaacga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314
<210> 2
<211> 437
<212> PRT
<213> Artificial Sequence
<400> 2
Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu
1 5 10 15
His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu
20 25 30
Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu
35 40 45
Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys
50 55 60
Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr
65 70 75 80
Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr
85 90 95
Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe
100 105 110
Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser
115 120 125
Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala
130 135 140
Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro
145 150 155 160
Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys
165 170 175
Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro
180 185 190
Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg
195 200 205
Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met
210 215 220
Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln
225 230 235 240
Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn
245 250 255
Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu
260 265 270
His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys
275 280 285
Asn Asn His Gly Gly Asp Ala Thr Ala Phe Met Asn Lys Val Lys Asn
290 295 300
Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys
305 310 315 320
Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile
325 330 335
Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu
340 345 350
Glu Glu Ile Ala Leu Ala Asp Asp Tyr Phe Ile Ser Arg Lys Leu Tyr
355 360 365
Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe
370 375 380
Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly
385 390 395 400
Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn Lys Ile
405 410 415
Asn Arg Pro Arg Gln Val Tyr Thr Gly Asn Glu Ser Arg Lys Leu Val
420 425 430
Pro Arg Glu Glu Arg
435
<210> 3
<211> 1314
<212> DNA
<213> Artificial Sequence
<400> 3
atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60
ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120
aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180
accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240
gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300
ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360
cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420
gcaaccttgg cttcctcggt taacattttg tctacctact accaggatca gctgaaccca 480
ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540
gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600
aacgcgcgtg agaacttcct gcgcatgatg ttcggttacc caattgagcc atacgagatc 660
gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720
aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780
atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840
ctggagatgc tcgaagacat caagaacaac cacggtggcg acgcaaccgc gttcatgaac 900
aaggtcaaga acaaggaaga cggcgtccgc ctcatgggct tcggacaccg cgtttacaag 960
aattacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020
ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080
tacttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140
gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200
tggatcgctc actaccgcga gcagctcggt gcagcaggca acaagatcaa ccgcccacgc 1260
caggtctaca ccggcaacga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314
<210> 4
<211> 437
<212> PRT
<213> Artificial Sequence
<400> 4
Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu
1 5 10 15
His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu
20 25 30
Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu
35 40 45
Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys
50 55 60
Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr
65 70 75 80
Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr
85 90 95
Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe
100 105 110
Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser
115 120 125
Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala
130 135 140
Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro
145 150 155 160
Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys
165 170 175
Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro
180 185 190
Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg
195 200 205
Met Met Phe Gly Tyr Pro Ile Glu Pro Tyr Glu Ile Asp Pro Ile Met
210 215 220
Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln
225 230 235 240
Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn
245 250 255
Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu
260 265 270
His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys
275 280 285
Asn Asn His Gly Gly Asp Ala Thr Ala Phe Met Asn Lys Val Lys Asn
290 295 300
Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys
305 310 315 320
Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile
325 330 335
Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu
340 345 350
Glu Glu Ile Ala Leu Ala Asp Asp Tyr Phe Ile Ser Arg Lys Leu Tyr
355 360 365
Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe
370 375 380
Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly
385 390 395 400
Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn Lys Ile
405 410 415
Asn Arg Pro Arg Gln Val Tyr Thr Gly Asn Glu Ser Arg Lys Leu Val
420 425 430
Pro Arg Glu Glu Arg
435
<210> 5
<211> 1264
<212> DNA
<213> Artificial Sequence
<400> 5
cagtgccaag cttgcatgcc tgcaggtcga ctctagtggc gagttcgaaa tggacatcat 60
cgaggcttct gagggtaaca acggtgttgt cctgggcaag atgctgtctg agactggact 120
gatcactttt gacccaggtt atgtgagcac tggctccacc gagtcgaaga tcacctacat 180
cgatggcgat gcgggaatcc tgcgttaccg cggctatgac atcgctgatc tggctgagaa 240
tgccaccttc aacgaggttt cttacctact tatcaacggt gagctaccaa ccccagatga 300
gcttcacaag tttaacgacg agattcgcca ccacaccctt ctggacgagg acttcaagtc 360
ccagttcaac gtgttcccac gcgacgctca cccaatggca accttggctt cctcggttaa 420
cattttgtct acctactacc aggatcagct gaacccactc gatgaggcac agcttgataa 480
ggcaaccgtt cgcctcatgg caaaggttcc aatgctggct gcgtacgcac accgcgcacg 540
caagggtgct ccttacatgt acccagacaa ctccctcaac gcgcgtgaga acttcctgcg 600
catgatgttc ggttacccaa ttgagccata cgagatcgac ccaatcatgg tcaaggctct 660
ggacaagctg ctcatcctgc acgctgacca cgagcagaac tgctccacct ccaccgttcg 720
tatgatcggt tccgcacagg ccaacatgtt tgtctccatc gctggtggca tcaacgctct 780
gtccggccca ctgcacggtg gcgcaaacca ggctgttctg gagatgctcg aagacatcaa 840
gaacaaccac ggtggcgacg caaccgcgtt catgaacaag gtcaagaaca aggaagacgg 900
cgtccgcctc atgggcttcg gacaccgcgt ttacaagaat tacgatccac gtgcagcaat 960
cgtcaaggag accgcacacg agatcctcga gcacctcggt ggcgacgatc ttctggatct 1020
ggcaatcaag ctggaagaaa ttgcactggc tgatgattac ttcatctccc gcaagctcta 1080
cccgaacgta gacttctaca ccggcctgat ctaccgcgca atgggcttcc caactgactt 1140
cttcaccgta ttgttcgcaa tcggtcgtct gccaggatgg atcgctcact accgcgagca 1200
gctcggtgca gcaggcaaca agatcagggt accgagctcg aattcgtaat catggtcata 1260
gctg 1264
<210> 6
<211> 806
<212> DNA
<213> Artificial Sequence
<400> 6
cagtgccaag cttgcatgcc tgcaggtcga ctctagcatg acggctgact ggactcgact 60
tccatacgag gttctggaga agatctccac ccgcatcacc aacgaagttc cagatgtgaa 120
ccgcgtggtt ttggacgtaa cctccaagcc accaggaacc atcgaatggg agtaggcctt 180
aaatgagcct tcgttaagcg gcaatcacct tattggagat tgtcgctttt cccatttctc 240
cgggttttct ggaacttttt gggcgtatgc tgggaatgat tctattattg ccaaatcaga 300
aagcaggaga gacccgatga gcgaaatcct agaaacctat tgggcacccc actttggaaa 360
aaccgaagaa gccacagcac tcgtttcata cctggcacaa gcttccggcg atcccattga 420
ggttcacacc ctgttcgggg atttaggttt agacggactc tcgggaaact acaccgacac 480
tgagattgac ggctacggcg acgcattcct gctggttgca gcgctatccg tgttgatggc 540
tgaaaacaaa gcaacaggtg gcgtgaatct gggtgagctt gggggagctg ataaatcgat 600
ccggctgcat gttgaatcca aggagaacac ccaaatcaac accgcattga agtattttgc 660
gctctcccca gaagaccacg cagcagcaga tcgcttcgat gaggatgacc tgtctgagct 720
tgccaacttg agtgaagagc tgcgcggaca gctggactaa ttgtctccca tttaaggagt 780
ccgattgtct tcgggcaact ttctgc 806
<210> 7
<211> 2079
<212> DNA
<213> Artificial Sequence
<400> 7
cccatttaag gagtccgatt gtcttcgggc aactttctgc gcttggaagt aaaagggcca 60
gggatcgtta acgatctgac ccaacaacta taaccctgaa gctgtcagtt cctagcaccc 120
tagattcttc acgcagtctc ccaaacgatg aaaaacgccc aaaactggcg acaccgaact 180
attgaaaacg cgggggttag ttgaccagcc accaatttgg gggtagttca aagttttgca 240
aagttttcaa tttctaggtt gttaatatcc cctgaggttg cgttataggg tggcgaattg 300
catggggaaa gctacttggc acccatcctt gtcgtgtgca tcacaaactt tgctaaactg 360
tgtaccagtc cacttattgt gggattttta atgccttaaa ggccagcatt ttcaccctct 420
agcggggttg aatgctggcc ttgagggtgc agaactaaat agcagcacat cggcacaatt 480
gatctgagtt ctattggcgt gaccgtggct actgattacg gtggctgtgg gtggtcggga 540
atgatgtaac caacgtgatt gtgggggaat tggctctcac ttcggatatg gctaaaccgc 600
atttatcggt atagcgtgtt aaccggacca gattgggaaa gaaatgtgtc gagtaacaaa 660
aactgacatg cgcttggcgc atcccagttg gtaagaataa acgggactac ttccgcaatc 720
cggaagagtt tttttccgaa caaatatgtt tgaaagggat atcgtggcta ctgataacaa 780
caaggctgtc ctgcactacc ccggtggcga gttcgaaatg gacatcatcg aggcttctga 840
gggtaacaac ggtgttgtcc tgggcaagat gctgtctgag actggactga tcacttttga 900
cccaggttat gtgagcactg gctccaccga gtcgaagatc acctacatcg atggcgatgc 960
gggaatcctg cgttaccgcg gctatgacat cgctgatctg gctgagaatg ccaccttcaa 1020
cgaggtttct tacctactta tcaacggtga gctaccaacc ccagatgagc ttcacaagtt 1080
taacgacgag attcgccacc acacccttct ggacgaggac ttcaagtccc agttcaacgt 1140
gttcccacgc gacgctcacc caatggcaac cttggcttcc tcggttaaca ttttgtctac 1200
ctactaccag gatcagctga acccactcga tgaggcacag cttgataagg caaccgttcg 1260
cctcatggca aaggttccaa tgctggctgc gtacgcacac cgcgcacgca agggtgctcc 1320
ttacatgtac ccagacaact ccctcaacgc gcgtgagaac ttcctgcgca tgatgttcgg 1380
ttacccaact gagccatacg agatcgaccc aatcatggtc aaggctctgg acaagctgct 1440
catcctgcac gctgaccacg agcagaactg ctccacctcc accgttcgta tgatcggttc 1500
cgcacaggcc aacatgtttg tctccatcgc tggtggcatc aacgctctgt ccggcccact 1560
gcacggtggc gcaaaccagg ctgttctgga gatgctcgaa gacatcaaga acaaccacgg 1620
tggcgacgca accgcgttca tgaacaaggt caagaacaag gaagacggcg tccgcctcat 1680
gggcttcgga caccgcgttt acaagaatta cgatccacgt gcagcaatcg tcaaggagac 1740
cgcacacgag atcctcgagc acctcggtgg cgacgatctt ctggatctgg caatcaagct 1800
ggaagaaatt gcactggctg atgattactt catctcccgc aagctctacc cgaacgtaga 1860
cttctacacc ggcctgatct accgcgcaat gggcttccca actgacttct tcaccgtatt 1920
gttcgcaatc ggtcgtctgc caggatggat cgctcactac cgcgagcagc tcggtgcagc 1980
aggcaacaag atcaaccgcc cacgccaggt ctacaccggc aacgaatccc gcaagttggt 2040
tcctcgcgag gagcgctaat aaatcgacta ctcacatag 2079
<210> 8
<211> 2079
<212> DNA
<213> Artificial Sequence
<400> 8
cccatttaag gagtccgatt gtcttcgggc aactttctgc gcttggaagt aaaagggcca 60
gggatcgtta acgatctgac ccaacaacta taaccctgaa gctgtcagtt cctagcaccc 120
tagattcttc acgcagtctc ccaaacgatg aaaaacgccc aaaactggcg acaccgaact 180
attgaaaacg cgggggttag ttgaccagcc accaatttgg gggtagttca aagttttgca 240
aagttttcaa tttctaggtt gttaatatcc cctgaggttg cgttataggg tggcgaattg 300
catggggaaa gctacttggc acccatcctt gtcgtgtgca tcacaaactt tgctaaactg 360
tgtaccagtc cacttattgt gggattttta atgccttaaa ggccagcatt ttcaccctct 420
agcggggttg aatgctggcc ttgagggtgc agaactaaat agcagcacat cggcacaatt 480
gatctgagtt ctattggcgt gaccgtggct actgattacg gtggctgtgg gtggtcggga 540
atgatgtaac caacgtgatt gtgggggaat tggctctcac ttcggatatg gctaaaccgc 600
atttatcggt atagcgtgtt aaccggacca gattgggaaa gaaatgtgtc gagtaacaaa 660
aactgacatg cgcttggcgc atcccagttg gtaagaataa acgggactac ttccgcaatc 720
cggaagagtt tttttccgaa caaatatgtt tgaaagggat atcgtggcta ctgataacaa 780
caaggctgtc ctgcactacc ccggtggcga gttcgaaatg gacatcatcg aggcttctga 840
gggtaacaac ggtgttgtcc tgggcaagat gctgtctgag actggactga tcacttttga 900
cccaggttat gtgagcactg gctccaccga gtcgaagatc acctacatcg atggcgatgc 960
gggaatcctg cgttaccgcg gctatgacat cgctgatctg gctgagaatg ccaccttcaa 1020
cgaggtttct tacctactta tcaacggtga gctaccaacc ccagatgagc ttcacaagtt 1080
taacgacgag attcgccacc acacccttct ggacgaggac ttcaagtccc agttcaacgt 1140
gttcccacgc gacgctcacc caatggcaac cttggcttcc tcggttaaca ttttgtctac 1200
ctactaccag gatcagctga acccactcga tgaggcacag cttgataagg caaccgttcg 1260
cctcatggca aaggttccaa tgctggctgc gtacgcacac cgcgcacgca agggtgctcc 1320
ttacatgtac ccagacaact ccctcaacgc gcgtgagaac ttcctgcgca tgatgttcgg 1380
ttacccaatt gagccatacg agatcgaccc aatcatggtc aaggctctgg acaagctgct 1440
catcctgcac gctgaccacg agcagaactg ctccacctcc accgttcgta tgatcggttc 1500
cgcacaggcc aacatgtttg tctccatcgc tggtggcatc aacgctctgt ccggcccact 1560
gcacggtggc gcaaaccagg ctgttctgga gatgctcgaa gacatcaaga acaaccacgg 1620
tggcgacgca accgcgttca tgaacaaggt caagaacaag gaagacggcg tccgcctcat 1680
gggcttcgga caccgcgttt acaagaatta cgatccacgt gcagcaatcg tcaaggagac 1740
cgcacacgag atcctcgagc acctcggtgg cgacgatctt ctggatctgg caatcaagct 1800
ggaagaaatt gcactggctg atgattactt catctcccgc aagctctacc cgaacgtaga 1860
cttctacacc ggcctgatct accgcgcaat gggcttccca actgacttct tcaccgtatt 1920
gttcgcaatc ggtcgtctgc caggatggat cgctcactac cgcgagcagc tcggtgcagc 1980
aggcaacaag atcaaccgcc cacgccaggt ctacaccggc aacgaatccc gcaagttggt 2040
tcctcgcgag gagcgctaat aaatcgacta ctcacatag 2079
<210> 9
<211> 783
<212> DNA
<213> Artificial Sequence
<400> 9
ttcctcgcga ggagcgctaa taaatcgact actcacatag ggtcgggcta gtcattctga 60
tcagcgaatt ccacgttcac atcgccaatt ccagagttca caaccagatt cagcattgga 120
ccttctagat cagcattgtg ggcggtgaga tctccaacat cacagcgcgc tgtgcccaca 180
ccggcggtac aacttaggct cacgggcaca tcatcgggca gggtgaccat gacttcgccg 240
atccctgagg tgatttggat gttttgttcc tgatccaatt gggtgaggtg gctgaaatcg 300
aggttcattt cacccacgcc agaggtgtag ctgctgagga gttcatcgtt ggtggggatg 360
agattgacat cgccgattcc agggtcgtct tcaaagtaga tgggatcgat atttgaaata 420
aacaggcctg cgagggcgct catgacaact ccggtaccaa ctacaccgcc gacaatccat 480
ggccacacat ggcgcttttt ctgaggcttt tgtggaggga cttgtacatc ccaggtgttg 540
tattggtttt gggcaagtgg atcccaatga ggcgcttcgg gggtttgttg cgcgaagggt 600
gcatagtagc cctcaacggg ggtgatagtg cttagatctg gttggggttg tgggtagaga 660
tcttcgtttt tcatggtggc atcctcagaa acagtgaatt cagtggtgag tagtccgcgg 720
ggtggaagtg gttgtttctt atgcagggta ccgagctcga attcgtaatc atggtcatag 780
ctg 783
<210> 10
<211> 2352
<212> DNA
<213> Artificial Sequence
<400> 10
gtccgctctg ttggtgttca aggcgatggc cgcacctacg gacacccaat cgtgctgcgc 60
ccagtgtctt ccgaagacgc catgacggct gactggactc gacttccata cgaggttctg 120
gagaagatct ccacccgcat caccaacgaa gttccagatg tgaaccgcgt ggttttggac 180
gtaacctcca agccaccagg aaccatcgaa tgggagtagg ccttaaatga gccttcgtta 240
agcggcaatc accttattgg agattgtcgc ttttcccatt tctccgggtt ttctggaact 300
ttttgggcgt atgctgggaa tgattctatt attgccaaat cagaaagcag gagagacccg 360
atgagcgaaa tcctagaaac ctattgggca ccccactttg gaaaaaccga agaagccaca 420
gcactcgttt catacctggc acaagcttcc ggcgatccca ttgaggttca caccctgttc 480
ggggatttag gtttagacgg actctcggga aactacaccg acactgagat tgacggctac 540
ggcgacgcat tcctgctggt tgcagcgcta tccgtgttga tggctgaaaa caaagcaaca 600
ggtggcgtga atctgggtga gcttggggga gctgataaat cgatccggct gcatgttgaa 660
tccaaggaga acacccaaat caacaccgca ttgaagtatt ttgcgctctc cccagaagac 720
cacgcagcag cagatcgctt cgatgaggat gacctgtctg agcttgccaa cttgagtgaa 780
gagctgcgcg gacagctgga ctaattgtct cccatttaag gagtccgatt gtcttcgggc 840
aactttctgc gcttggaagt aaaagggcca gggatcgtta acgatctgac ccaacaacta 900
taaccctgaa gctgtcagtt cctagcaccc tagattcttc acgcagtctc ccaaacgatg 960
aaaaacgccc aaaactggcg acaccgaact attgaaaacg cgggggttag ttgaccagcc 1020
accaatttgg gggtagttca aagttttgca aagttttcaa tttctaggtt gttaatatcc 1080
cctgaggttg cgttataggg tggcgaattg catggggaaa gctacttggc acccatcctt 1140
gtcgtgtgca tcacaaactt tgctaaactg tgtaccagtc cacttattgt gggattttta 1200
atgccttaaa ggccagcatt ttcaccctct agcggggttg aatgctggcc ttgagggtgc 1260
agaactaaat agcagcacat cggcacaatt gatctgagtt ctattggcgt gaccgtggct 1320
actgattacg gtggctgtgg gtggtcggga atgatgtaac caacgtgatt gtgggggaat 1380
tggctctcac ttcggatatg gctaaaccgc atttatcggt atagcgtgtt aaccggacca 1440
gattgggaaa gaaatgtgtc gagtaacaaa aactgacatg cgcttggcgc atcccagttg 1500
gtaagaataa acgggactac ttccgcaatc cggaagagtt tttttccgaa caaatatgtt 1560
tgaaagggat atcgtggcta ctgataacaa caaggctgtc ctgcactacc ccggtggcga 1620
gttcgaaatg gacatcatcg aggcttctga gggtaacaac ggtgttgtcc tgggcaagat 1680
gctgtctgag actggactga tcacttttga cccaggttat gtgagcactg gctccaccga 1740
gtcgaagatc acctacatcg atggcgatgc gggaatcctg cgttaccgcg gctatgacat 1800
cgctgatctg gctgagaatg ccaccttcaa cgaggtttct tacctactta tcaacggtga 1860
gctaccaacc ccagatgagc ttcacaagtt taacgacgag attcgccacc acacccttct 1920
ggacgaggac ttcaagtccc agttcaacgt gttcccacgc gacgctcacc caatggcaac 1980
cttggcttcc tcggttaaca ttttgtctac ctactaccag gatcagctga acccactcga 2040
tgaggcacag cttgataagg caaccgttcg cctcatggca aaggttccaa tgctggctgc 2100
gtacgcacac cgcgcacgca agggtgctcc ttacatgtac ccagacaact ccctcaacgc 2160
gcgtgagaac ttcctgcgca tgatgttcgg ttacccaatt gagccatacg agatcgaccc 2220
aatcatggtc aaggctctgg acaagctgct catcctgcac gctgaccacg agcagaactg 2280
ctccacctcc accgttcgta tgatcggttc cgcacaggcc aacatgtttg tctccatcgc 2340
tggtggcatc aa 2352
<210> 11
<211> 1775
<212> DNA
<213> Artificial Sequence
<400> 11
caagtttaac gacgagattc gccaccacac ccttctggac gaggacttca agtcccagtt 60
caacgtgttc ccacgcgacg ctcacccaat ggcaaccttg gcttcctcgg ttaacatttt 120
gtctacctac taccaggatc agctgaaccc actcgatgag gcacagcttg ataaggcaac 180
cgttcgcctc atggcaaagg ttccaatgct ggctgcgtac gcacaccgcg cacgcaaggg 240
tgctccttac atgtacccag acaactccct caacgcgcgt gagaacttcc tgcgcatgat 300
gttcggttac ccaattgagc catacgagat cgacccaatc atggtcaagg ctctggacaa 360
gctgctcatc ctgcacgctg accacgagca gaactgctcc acctccaccg ttcgtatgat 420
cggttccgca caggccaaca tgtttgtctc catcgctggt ggcatcaacg ctctgtccgg 480
cccactgcac ggtggcgcaa accaggctgt tctggagatg ctcgaagaca tcaagaacaa 540
ccacggtggc gacgcaaccg cgttcatgaa caaggtcaag aacaaggaag acggcgtccg 600
cctcatgggc ttcggacacc gcgtttacaa gaattacgat ccacgtgcag caatcgtcaa 660
ggagaccgca cacgagatcc tcgagcacct cggtggcgac gatcttctgg atctggcaat 720
caagctggaa gaaattgcac tggctgatga ttacttcatc tcccgcaagc tctacccgaa 780
cgtagacttc tacaccggcc tgatctaccg cgcaatgggc ttcccaactg acttcttcac 840
cgtattgttc gcaatcggtc gtctgccagg atggatcgct cactaccgcg agcagctcgg 900
tgcagcaggc aacaagatca accgcccacg ccaggtctac accggcaacg aatcccgcaa 960
gttggttcct cgcgaggagc gctaataaat cgactactca catagggtcg ggctagtcat 1020
tctgatcagc gaattccacg ttcacatcgc caattccaga gttcacaacc agattcagca 1080
ttggaccttc tagatcagca ttgtgggcgg tgagatctcc aacatcacag cgcgctgtgc 1140
ccacaccggc ggtacaactt aggctcacgg gcacatcatc gggcagggtg accatgactt 1200
cgccgatccc tgaggtgatt tggatgtttt gttcctgatc caattgggtg aggtggctga 1260
aatcgaggtt catttcaccc acgccagagg tgtagctgct gaggagttca tcgttggtgg 1320
ggatgagatt gacatcgccg attccagggt cgtcttcaaa gtagatggga tcgatatttg 1380
aaataaacag gcctgcgagg gcgctcatga caactccggt accaactaca ccgccgacaa 1440
tccatggcca cacatggcgc tttttctgag gcttttgtgg agggacttgt acatcccagg 1500
tgttgtattg gttttgggca agtggatccc aatgaggcgc ttcgggggtt tgttgcgcga 1560
agggtgcata gtagccctca acgggggtga tagtgcttag atctggttgg ggttgtgggt 1620
agagatcttc gtttttcatg gtggcatcct cagaaacagt gaattcagtg gtgagtagtc 1680
cgcggggtgg aagtggttgt ttcttatgca acgcccacca catggctaaa aggcaaaggt 1740
aagtaatggc tgctgctggg ccgaatattc ctcca 1775
<210> 12
<211> 2109
<212> DNA
<213> Artificial Sequence
<400> 12
gcttgcatgc ctgcaggtcg actctagagg atccccgtct tcgggcaact ttctgcgctt 60
ggaagtaaaa gggccaggga tcgttaacga tctgacccaa caactataac cctgaagctg 120
tcagttccta gcaccctaga ttcttcacgc agtctcccaa acgatgaaaa acgcccaaaa 180
ctggcgacac cgaactattg aaaacgcggg ggttagttga ccagccacca atttgggggt 240
agttcaaagt tttgcaaagt tttcaatttc taggttgtta atatcccctg aggttgcgtt 300
atagggtggc gaattgcatg gggaaagcta cttggcaccc atccttgtcg tgtgcatcac 360
aaactttgct aaactgtgta ccagtccact tattgtggga tttttaatgc cttaaaggcc 420
agcattttca ccctctagcg gggttgaatg ctggccttga gggtgcagaa ctaaatagca 480
gcacatcggc acaattgatc tgagttctat tggcgtgacc gtggctactg attacggtgg 540
ctgtgggtgg tcgggaatga tgtaaccaac gtgattgtgg gggaattggc tctcacttcg 600
gatatggcta aaccgcattt atcggtatag cgtgttaacc ggaccagatt gggaaagaaa 660
tgtgtcgagt aacaaaaact gacatgcgct tggcgcatcc cagttggtaa gaataaacgg 720
gactacttcc gcaatccgga agagtttttt tccgaacaaa tatgtttgaa agggatatcg 780
tggctactga taacaacaag gctgtcctgc actaccccgg tggcgagttc gaaatggaca 840
tcatcgaggc ttctgagggt aacaacggtg ttgtcctggg caagatgctg tctgagactg 900
gactgatcac ttttgaccca ggttatgtga gcactggctc caccgagtcg aagatcacct 960
acatcgatgg cgatgcggga atcctgcgtt accgcggcta tgacatcgct gatctggctg 1020
agaatgccac cttcaacgag gtttcttacc tacttatcaa cggtgagcta ccaaccccag 1080
atgagcttca caagtttaac gacgagattc gccaccacac ccttctggac gaggacttca 1140
agtcccagtt caacgtgttc ccacgcgacg ctcacccaat ggcaaccttg gcttcctcgg 1200
ttaacatttt gtctacctac taccaggatc agctgaaccc actcgatgag gcacagcttg 1260
ataaggcaac cgttcgcctc atggcaaagg ttccaatgct ggctgcgtac gcacaccgcg 1320
cacgcaaggg tgctccttac atgtacccag acaactccct caacgcgcgt gagaacttcc 1380
tgcgcatgat gttcggttac ccaactgagc catacgagat cgacccaatc atggtcaagg 1440
ctctggacaa gctgctcatc ctgcacgctg accacgagca gaactgctcc acctccaccg 1500
ttcgtatgat cggttccgca caggccaaca tgtttgtctc catcgctggt ggcatcaacg 1560
ctctgtccgg cccactgcac ggtggcgcaa accaggctgt tctggagatg ctcgaagaca 1620
tcaagaacaa ccacggtggc gacgcaaccg cgttcatgaa caaggtcaag aacaaggaag 1680
acggcgtccg cctcatgggc ttcggacacc gcgtttacaa gaattacgat ccacgtgcag 1740
caatcgtcaa ggagaccgca cacgagatcc tcgagcacct cggtggcgac gatcttctgg 1800
atctggcaat caagctggaa gaaattgcac tggctgatga ttacttcatc tcccgcaagc 1860
tctacccgaa cgtagacttc tacaccggcc tgatctaccg cgcaatgggc ttcccaactg 1920
acttcttcac cgtattgttc gcaatcggtc gtctgccagg atggatcgct cactaccgcg 1980
agcagctcgg tgcagcaggc aacaagatca accgcccacg ccaggtctac accggcaacg 2040
aatcccgcaa gttggttcct cgcgaggagc gctaagtttt ggcggatgag agaagatttt 2100
cagcctgat 2109
<210> 13
<211> 2109
<212> DNA
<213> Artificial Sequence
<400> 13
gcttgcatgc ctgcaggtcg actctagagg atccccgtct tcgggcaact ttctgcgctt 60
ggaagtaaaa gggccaggga tcgttaacga tctgacccaa caactataac cctgaagctg 120
tcagttccta gcaccctaga ttcttcacgc agtctcccaa acgatgaaaa acgcccaaaa 180
ctggcgacac cgaactattg aaaacgcggg ggttagttga ccagccacca atttgggggt 240
agttcaaagt tttgcaaagt tttcaatttc taggttgtta atatcccctg aggttgcgtt 300
atagggtggc gaattgcatg gggaaagcta cttggcaccc atccttgtcg tgtgcatcac 360
aaactttgct aaactgtgta ccagtccact tattgtggga tttttaatgc cttaaaggcc 420
agcattttca ccctctagcg gggttgaatg ctggccttga gggtgcagaa ctaaatagca 480
gcacatcggc acaattgatc tgagttctat tggcgtgacc gtggctactg attacggtgg 540
ctgtgggtgg tcgggaatga tgtaaccaac gtgattgtgg gggaattggc tctcacttcg 600
gatatggcta aaccgcattt atcggtatag cgtgttaacc ggaccagatt gggaaagaaa 660
tgtgtcgagt aacaaaaact gacatgcgct tggcgcatcc cagttggtaa gaataaacgg 720
gactacttcc gcaatccgga agagtttttt tccgaacaaa tatgtttgaa agggatatcg 780
tggctactga taacaacaag gctgtcctgc actaccccgg tggcgagttc gaaatggaca 840
tcatcgaggc ttctgagggt aacaacggtg ttgtcctggg caagatgctg tctgagactg 900
gactgatcac ttttgaccca ggttatgtga gcactggctc caccgagtcg aagatcacct 960
acatcgatgg cgatgcggga atcctgcgtt accgcggcta tgacatcgct gatctggctg 1020
agaatgccac cttcaacgag gtttcttacc tacttatcaa cggtgagcta ccaaccccag 1080
atgagcttca caagtttaac gacgagattc gccaccacac ccttctggac gaggacttca 1140
agtcccagtt caacgtgttc ccacgcgacg ctcacccaat ggcaaccttg gcttcctcgg 1200
ttaacatttt gtctacctac taccaggatc agctgaaccc actcgatgag gcacagcttg 1260
ataaggcaac cgttcgcctc atggcaaagg ttccaatgct ggctgcgtac gcacaccgcg 1320
cacgcaaggg tgctccttac atgtacccag acaactccct caacgcgcgt gagaacttcc 1380
tgcgcatgat gttcggttac ccaattgagc catacgagat cgacccaatc atggtcaagg 1440
ctctggacaa gctgctcatc ctgcacgctg accacgagca gaactgctcc acctccaccg 1500
ttcgtatgat cggttccgca caggccaaca tgtttgtctc catcgctggt ggcatcaacg 1560
ctctgtccgg cccactgcac ggtggcgcaa accaggctgt tctggagatg ctcgaagaca 1620
tcaagaacaa ccacggtggc gacgcaaccg cgttcatgaa caaggtcaag aacaaggaag 1680
acggcgtccg cctcatgggc ttcggacacc gcgtttacaa gaattacgat ccacgtgcag 1740
caatcgtcaa ggagaccgca cacgagatcc tcgagcacct cggtggcgac gatcttctgg 1800
atctggcaat caagctggaa gaaattgcac tggctgatga ttacttcatc tcccgcaagc 1860
tctacccgaa cgtagacttc tacaccggcc tgatctaccg cgcaatgggc ttcccaactg 1920
acttcttcac cgtattgttc gcaatcggtc gtctgccagg atggatcgct cactaccgcg 1980
agcagctcgg tgcagcaggc aacaagatca accgcccacg ccaggtctac accggcaacg 2040
aatcccgcaa gttggttcct cgcgaggagc gctaagtttt ggcggatgag agaagatttt 2100
cagcctgat 2109
<210> 14
<211> 1350
<212> DNA
<213> Artificial Sequence
<400> 14
cagtgccaag cttgcatgcc tgcaggtcga ctctagcacc ctagattctt cacgcagtct 60
cccaaacgat gaaaaacgcc caaaactggc gacaccgaac tattgaaaac gcgggggtta 120
gttgaccagc caccaatttg ggggtagttc aaagttttgc aaagttttca atttctaggt 180
tgttaatatc ccctgaggtt gcgttatagg gtggcgaatt gcatggggaa agctacttgg 240
cacccatcct tgtcgtgtgc atcacaaact ttgctaaact gtgtaccagt ccacttattg 300
tgggattttt aatgccttaa aggccagcat tttcaccctc tagcggggtt gaatgctggc 360
cttgagggtg cagaactaaa tagcagcaca tcggcacaat tgatctgagt tctattggcg 420
tgaccgtggc tactgattac ggtggctgtg ggtggtcggg aatgatgtaa ccaacgtgat 480
tgtgggggaa ttggctctca cttcggatat ggctaaaccg catttatcgg tatagcgtgt 540
taaccggacc agattgggaa agaaatgtgt cgagtaacaa aaactgacat gcgcttggcg 600
catcccagtt ggtaagaata aacgggacta cttccgcaat ccggaagagt ttttttccga 660
acaaatattt agcggatgat tctcgttcaa cttcggccga agccacttcg tctgtcataa 720
tgacagggat ggtttcggcc gtttttgcat gaaaccaaaa aatacgattt tcaaggagca 780
tgtacagcac atggaaaagc cacagattga gctaccggtc ggtccagcac cggaagatct 840
cgtaatctct gacatcatcg ttggcgaagg cgcagaagct cgcccaggcg gagaagttga 900
ggtccactac gtgggcgttg actttgaaac cggcgaggag tttgactctt cctgggatcg 960
tggacagacc agccagttcc cactcaacgg cctcattgca ggttggcaag agggaattcc 1020
aggcatgaag gtcggcggac gtcgtcagct gaccattcca ccagaggctg cttacggccc 1080
tgagggttcc ggccacccac tgtctggccg taccctggtg ttcatcatcg atttgatcag 1140
cgcataattt tctttactgc gctaaacgct caaatcgtgt gaagcgactg tcgcgtcccg 1200
ccctctccgg attgttatcc aattcggaga gggcgttgct gattgtgccg agaatttctt 1260
caacaaagtg ctcggtttcg gcgacgatcc cgtcgataag cccttggctt aagggtaccg 1320
agctcgaatt cgtaatcatg gtcatagctg 1350

Claims (10)

1.一种YH66_04470突变体,是将YH66_04470蛋白质第215位氨基酸残基由苏氨酸突变为其他氨基酸残基得到的蛋白质;
所述YH66_04470蛋白质为如下A1)-A3)中的任一种:
A1)SEQ ID No.2所示的氨基酸序列组成的蛋白质;
A2)将A1)所示的氨基酸序列经过除第215位氨基酸残基以外的一个或几个氨基酸残基的取代和/或缺失和/或添加得到的与细菌产精氨酸相关的蛋白质;
A3)来源于细菌且与A1)或A2)具有95%以上同一性且与细菌产精氨酸相关的蛋白质。
2.根据权利要求1所述的YH66_04470突变体,其特征在于:所述YH66_04470突变体是将YH66_04470蛋白质第215位氨基酸残基由苏氨酸突变为异亮氨酸得到的蛋白质。
3.与权利要求1所述YH66_04470突变体相关的生物材料,所述生物材料为如下B1)至B4)中的任一种:
B1)编码权利要求1或2所述YH66_04470突变体的核酸分子;
B2)含有B1)所述核酸分子的表达盒;
B3)含有B1)所述核酸分子的重组载体、或含有B2)所述表达盒的重组载体;
B4)含有B1)所述核酸分子的重组微生物、或含有B2)所述表达盒的重组微生物、或含有B3)所述重组载体的重组微生物。
4.根据权利要求3所述的生物材料,其特征在于:所述核酸分子为如下C1)或C2)中的任一种:
C1)核苷酸序列为SEQ ID No.3的DNA分子;
C2)将SEQ ID No.3所示的核苷酸序列经过修饰和/或一个或几个核苷酸的取代和/或缺失和/或添加得到的与C1)所示的DNA分子具有90%以上的同一性,且具有相同功能的DNA分子。
5.YH66_04470蛋白质或与YH66_04470蛋白质相关的生物材料或权利要求1所述的YH66_04470突变体或权利要求2所述的生物材料在如下X1)至X4)中任一种中的应用:
X1)调控细菌精氨酸产量;
X2)构建产精氨酸工程菌;
X3)制备精氨酸;
所述YH66_04470蛋白质为权利要求1中所述YH66_04470蛋白质;
与YH66_04470蛋白质相关的生物材料为如下D1)至D4)中的任一种:
D1)编码所述YH66_04470蛋白质的核酸分子;
D2)含有D1)所述核酸分子的表达盒;
D3)含有D1)所述核酸分子的重组载体、或含有D2)所述表达盒的重组载体;
D4)含有D1)所述核酸分子的重组微生物、或含有D2)所述表达盒的重组微生物、或含有D3)所述重组载体的重组微生物。
6.提高YH66_04470蛋白质或YH66_04470突变体含量和/或活性的物质或提高YH66_04470基因或YH66_04470突变体基因表达量的物质在如下Y1)至Y4)中任一种中的应用:
Y1)提高细菌精氨酸产量;
Y2)构建产精氨酸工程菌;
Y3)制备精氨酸;
所述YH66_04470蛋白质为权利要求1中所述YH66_04470蛋白质;
所述YH66_04470突变体为权利要求1所述YH66_04470突变体;
所述YH66_04470基因为编码权利要求1中所述YH66_04470蛋白质的基因;
所述YH66_04470突变体基因为编码权利要求1所述YH66_04470突变体的基因。
7.一种提高细菌精氨酸产量的方法,为如下M1)或M2):
所述M1)包括如下步骤:将细菌基因组中的YH66_04470基因替换为YH66_04470突变体基因,实现细菌精氨酸产量的提高;
所述M2)包括如下步骤:提高细菌中YH66_04470蛋白质或YH66_04470突变体含量和/或活性,或提高细菌中YH66_04470基因或YH66_04470突变体基因表达量,实现细菌精氨酸产量的提高;
所述YH66_04470蛋白质为权利要求1中所述YH66_04470蛋白质;
所述YH66_04470突变体为权利要求1所述YH66_04470突变体;
所述YH66_04470基因为编码权利要求1中所述YH66_04470蛋白质的基因;
所述YH66_04470突变体基因为编码权利要求1所述YH66_04470突变体的基因。
8.一种产精氨酸工程菌的构建方法,为如下N1)或N2):
所述N1)包括如下步骤:将细菌基因组中的YH66_04470基因替换为YH66_04470突变体基因,得到所述产精氨酸工程菌;
所述N2)包括如下步骤:提高细菌中YH66_04470蛋白质或YH66_04470突变体含量和/或活性,或提高细菌中YH66_04470基因或YH66_04470突变体基因表达量,得到所述产精氨酸工程菌;
所述YH66_04470蛋白质为权利要求1中所述YH66_04470蛋白质;
所述YH66_04470突变体为权利要求1所述YH66_04470突变体;
所述YH66_04470基因为编码权利要求1中所述YH66_04470蛋白质的基因;
所述YH66_04470突变体基因为编码权利要求1所述YH66_04470突变体的基因。
9.按照权利要求8所述方法构建得到的产精氨酸工程菌在制备精氨酸中的应用。
10.一种制备精氨酸的方法,包括如下步骤:发酵培养按照权利要求8所述方法构建得到的产精氨酸工程菌,得到所述精氨酸。
CN202111661169.8A 2021-12-30 2021-12-30 一种yh66_04470基因突变的重组菌及其在制备精氨酸中的应用 Pending CN114409751A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111661169.8A CN114409751A (zh) 2021-12-30 2021-12-30 一种yh66_04470基因突变的重组菌及其在制备精氨酸中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111661169.8A CN114409751A (zh) 2021-12-30 2021-12-30 一种yh66_04470基因突变的重组菌及其在制备精氨酸中的应用

Publications (1)

Publication Number Publication Date
CN114409751A true CN114409751A (zh) 2022-04-29

Family

ID=81271999

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111661169.8A Pending CN114409751A (zh) 2021-12-30 2021-12-30 一种yh66_04470基因突变的重组菌及其在制备精氨酸中的应用

Country Status (1)

Country Link
CN (1) CN114409751A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117264034A (zh) * 2023-11-21 2023-12-22 内蒙古伊品生物科技有限公司 Bbd29_09715基因突变体及其在制备l-谷氨酸中的应用

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
"NCBI Reference Sequence: WP_034983619.1,Genbank", GENBANK, pages 2 *
"NCBI Reference Sequence: WP_074495373.1, citrate synthase [Corynebacterium glutamicum]", GENBANK, pages 2 *
房战: "过量表达钝齿棒杆菌柠檬酸合酶编码基因prpC2对L-精氨酸合成的影响", 中国生物工程杂志, vol. 35, no. 3, pages 49 - 55 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117264034A (zh) * 2023-11-21 2023-12-22 内蒙古伊品生物科技有限公司 Bbd29_09715基因突变体及其在制备l-谷氨酸中的应用
CN117264034B (zh) * 2023-11-21 2024-02-06 内蒙古伊品生物科技有限公司 Bbd29_09715基因突变体及其在制备l-谷氨酸中的应用

Similar Documents

Publication Publication Date Title
CN110607313B (zh) 一种高产l-赖氨酸的重组菌株及其构建方法与应用
CN113667682B (zh) Yh66-rs11190基因突变体及其在制备l-缬氨酸中的应用
CN110195087B (zh) 用改变ppc基因的细菌发酵生产L-赖氨酸的方法
JP2024505808A (ja) 増強されたl-グルタミン酸生産能を有する菌株及びその構築方法と応用
CN110846333B (zh) 一种deoB基因改造的重组菌株及其构建方法与应用
CN110592109B (zh) 一种spoT基因改造的重组菌株及其构建方法与应用
CN111471693B (zh) 一种产赖氨酸的谷氨酸棒杆菌及其构建方法与应用
CN110592084B (zh) 一种rhtA基因启动子改造的重组菌株及其构建方法与应用
CN114409751A (zh) 一种yh66_04470基因突变的重组菌及其在制备精氨酸中的应用
CN114181288B (zh) 制备l-缬氨酸的方法及其所用的基因与该基因编码的蛋白质
WO2023231547A1 (zh) NCgl2747基因突变体及其在制备L-赖氨酸中的应用
CN114349831B (zh) aspA基因突变体、重组菌及制备L-缬氨酸的方法
CN110846312A (zh) 一种sdaA基因的启动子核酸序列、含有该核酸序列的重组菌株及其应用
CN114540399A (zh) 一种制备l-缬氨酸的方法及其所用基因突变体和生物材料
CN110804617B (zh) 一种kdtA基因改造的重组菌株及其构建方法与应用
CN110564742B (zh) 一种yebN基因改造的重组菌株及其构建方法与应用
WO2022143639A1 (zh) 一种改造基因bbd29_11265产l-谷氨酸的重组菌株及其构建方法与应用
CN114507273B (zh) Yh66_07020蛋白及其相关生物材料在提高精氨酸产量中的应用
CN114605509B (zh) Yh66_01475蛋白及其编码基因在调控细菌精氨酸产量中的应用
CN114277069B (zh) 制备l-缬氨酸的方法及其所用生物材料
CN114410615B (zh) Yh66_00525蛋白及其编码基因在调控细菌精氨酸产量中的应用
CN114317583B (zh) 构建产l-缬氨酸的重组微生物的方法及其所用核酸分子
CN114249803B (zh) 一种高产精氨酸的工程菌及其构建方法与应用
CN114315998B (zh) Cey17_rs00300基因突变体及其在制备l-缬氨酸中的应用
CN115073569A (zh) 一种yh66_09125基因突变的重组菌及其在制备精氨酸中的应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination