CN112111469A - γ-谷氨酰激酶突变体及其应用 - Google Patents

γ-谷氨酰激酶突变体及其应用 Download PDF

Info

Publication number
CN112111469A
CN112111469A CN202011316277.7A CN202011316277A CN112111469A CN 112111469 A CN112111469 A CN 112111469A CN 202011316277 A CN202011316277 A CN 202011316277A CN 112111469 A CN112111469 A CN 112111469A
Authority
CN
China
Prior art keywords
protein
gamma
amino acid
mutant
glutamyl kinase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011316277.7A
Other languages
English (en)
Other versions
CN112111469B (zh
Inventor
郑平
刘娇
王钰
孙际宾
刘莫识
周文娟
郭轩
马延和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Institute of Industrial Biotechnology of CAS
Original Assignee
Tianjin Institute of Industrial Biotechnology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Institute of Industrial Biotechnology of CAS filed Critical Tianjin Institute of Industrial Biotechnology of CAS
Priority to CN202011316277.7A priority Critical patent/CN112111469B/zh
Publication of CN112111469A publication Critical patent/CN112111469A/zh
Application granted granted Critical
Publication of CN112111469B publication Critical patent/CN112111469B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1217Phosphotransferases with a carboxyl group as acceptor (2.7.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • C12N15/77Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Corynebacterium; for Brevibacterium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/24Proline; Hydroxyproline; Histidine

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明公开了γ‑谷氨酰激酶突变体及其应用。本发明提供了γ‑谷氨酰激酶突变体蛋白,为如下A或B:A)所述的蛋白为将γ‑谷氨酰激酶对应于序列1所示的氨基酸序列第150位残基进行突变,得到具有γ‑谷氨酰激酶活性的蛋白;B)所述的蛋白为将A所示蛋白的氨基酸序列末端添加标签序列且具有γ‑谷氨酰激酶活性的由A衍生的蛋白。本发明提供了γ‑谷氨酰激酶(ProB)突变体蛋白,将含有该蛋白的谷氨酸棒杆菌进行发酵,解除L‑脯氨酸反馈抑制,提高了脯氨酸的产量。

Description

γ-谷氨酰激酶突变体及其应用
技术领域
本发明属于分子生物学和生物工程领域,具体涉及γ-谷氨酰激酶突变体及其应用,以及利用该突变体生产脯氨酸及其衍生物的方法。
背景技术
脯氨酸(通常所说的脯氨酸为L-脯氨酸),是天然存在的一种人体的非必需氨基酸,在临床、生物材料和工业等方面有广泛的应用。脯氨酸的生产方法主要有化学法和发酵法,由于化学提取法污染严重成本高,已逐渐失去市场,微生物发酵法由于具有生产成本低、生产强度高、高特异性和对环境污染小等优点而成为当今工业应用最广泛的方法。目前,常用的工业发酵菌株有棒杆菌和埃希氏菌,常用的埃希氏菌如大肠杆菌(Escherichia coli),常用的棒杆菌如谷氨酸棒杆菌(Corynebacterium glutamicum),短杆菌如黄色短杆菌(Brevibacterium flavum)、乳酸发酵短杆菌 (Brevibacterium lactofermentus),以及节杆菌属的某些种和微杆菌属的某些种。而由于谷氨酸棒杆菌的生理优越性,已成为工业中最重要的生产菌株用来生产氨基酸等产品。
在棒杆菌中,主要以谷氨酸为底物经过γ-谷氨酰激酶(ProB)、谷氨酸半醛脱氢酶(ProA)和吡咯啉-5-羧酸还原酶(ProC)催化后生产L-脯氨酸。γ-谷氨酰激酶(ProB)作为其中最关键的酶,其活性受到产物L-脯氨酸的反馈抑制。因此,如何筛选获得解除L-脯氨酸反馈抑制的γ-谷氨酰激酶,对于选育L-脯氨酸的高产菌株具有重要意义。
因此,迫切需要寻找新的谷氨酸棒杆菌来源的ProB突变体。
发明内容
本发明的一个目的是提供新的来源于谷氨酸棒杆菌的解除L-脯氨酸反馈抑制的γ-谷氨酰激酶突变体蛋白。
本发明提供的γ-谷氨酰激酶(ProB)突变体蛋白,为如下A或B:
A)所述的蛋白为将γ-谷氨酰激酶对应于序列1所示的氨基酸序列第150位残基进行突变,得到具有γ-谷氨酰激酶活性的蛋白;
B)所述的蛋白为将A所示蛋白的氨基酸序列末端添加标签序列且具有γ-谷氨酰激酶活性的由A)衍生的蛋白。
上述蛋白中,所述突变为将对应于序列1所示的氨基酸序列第150位残基由缬氨酸(V)突变为天冬酰胺(N)、苏氨酸(T)、赖氨酸(K)、谷氨酰胺(Q)、组氨酸(H)、脯氨酸(P)、精氨酸(R)、谷氨酸(E)、丙氨酸(A)、酪氨酸(Y)、丝氨酸(S)、半胱氨酸(C)、色氨酸(W)和蛋氨酸(M)中任一种;
优选为将对应于序列1的第150位氨基酸残基由缬氨酸(V)突变为天冬酰胺(N)、苏氨酸(T)、组氨酸(H)、酪氨酸(Y)中的任一个;
更优选为将对应于序列1的第150位氨基酸残基由缬氨酸(V)突变为天冬酰胺(N)或苏氨酸(T)。
本发明另一个目的是提供一种具有γ-谷氨酰激酶活性的组合物。
本发明提供的具有γ-谷氨酰激酶活性的组合物,其包括含有上述γ-谷氨酰激酶突变体蛋白的蛋白组合物或含有上述γ-谷氨酰激酶突变体蛋白的融合蛋白。
编码上述突变体蛋白的多核苷酸或编码上述融合蛋白的多核苷酸也是本发明保护的范围。
含有编码上述蛋白的多核苷酸的表达盒或重组载体或重组微生物也是本发明保护的范围。
上述重组微生物为含有编码上述蛋白的多核苷酸的宿主菌,该宿主菌包括但不限于埃希氏菌、棒杆菌,更优选大肠杆菌或谷氨酸棒杆菌。
上述重组微生物,按照包括如下步骤的方法制备:将宿主菌中γ-谷氨酰激酶氨基酸序列对应于序列1的第150位氨基酸进行突变,得到重组微生物。
上述突变为将宿主菌中γ-谷氨酰激酶氨基酸序列对应于序列1的第150位氨基酸突变为如下任一氨基酸;
所述如下任一氨基酸为N、T、K、Q、H、P、R、E、A、Y、S、C、W和M中任一种。
上述宿主菌包括但不限于埃希氏菌、棒杆菌,更优选大肠杆菌或谷氨酸棒杆菌。
上述突变方法可以为现有常规的突变方法,也可以按照本发明实施例中的方法进行突变。本发明的实施例中的例子为:将实施例中制备的pCas9gRNA-proB2载体、pRecT载体和150-1单链DNA至150-8单链DNA导入目的菌ATCC13032,得到各种表达突变体的重组菌SLCgP54至SLCgP67。
上述蛋白或上述多核苷酸或上述表达盒或重组载体或重组微生物在制备L-脯氨酸或其衍生物中的应用也是本发明保护的范围。
本发明还有一个目的是提供一种生产L-脯氨酸或其衍生物的方法。
本发明提供的方法,包括如下步骤:发酵培养上述重组微生物,得到L-脯氨酸或其衍生物。
上述方法还包括如下步骤:收集发酵产物,从所述发酵产物中分离脯氨酸或其衍生物。
上述L-脯氨酸衍生物为羟基脯氨酸。
本发明提供了新的ProB突变体蛋白,将含有该蛋白的谷氨酸棒杆菌进行发酵,解除L-脯氨酸反馈抑制,提高了脯氨酸的产量,为脯氨酸及其衍生物生产菌株构建提供了全新的思路。
附图说明
图1为pCas9gRNA-ccdB质粒图谱。
图2为pRecT质粒图谱。
具体实施方式
本文所用的术语“包含”、“具有”、“包括”或“含有”是指包括在内的或开放式的,并不排除额外的、未引述的元件或方法步骤。
本文所用的“约”表示:一个值包括测定该值所使用的装置或方法的误差的标准偏差。
本文所用的“或”的定义仅为替代物以及“和/或”,但除非明确表示仅为替代物或替代物之间相互排斥外,权利要求中的术语“或”是指“和/或”。
本文所用的选择/可选/优选的“数值范围”既包括范围两端的数值端点,也包括相对于前述数值端点而言,所述数值端点中间所覆盖的所有自然数。
本文所用的术语“多核苷酸”指由核苷酸组成的聚合物。多核苷酸可以是单独片段的形式,也可以是更大的核苷酸序列结构的一个组成部分,其是从至少在数量或浓度上分离一次的核苷酸序列衍生而来的,能够通过标准分子生物学方法(例如,使用克隆载体)识别、操纵以及恢复序列及其组分核苷酸序列。当一个核苷酸序列通过一个DNA序列(即A、T、G、C)表示时,这也包括一个RNA序列(即A、U、G、C),其中“U”取代“T”。换句话说,“多核苷酸”指从其他核苷酸(单独的片段或整个片段)中去除的核苷酸聚合物,或者可以是一个较大核苷酸结构的组成部分或成分,如表达载体或多顺反子序列。多核苷酸包括DNA、RNA和cDNA序列。
本公开中的术语“蛋白编码基因”是指能够通过一定的规则指导蛋白的合成DNA分子,蛋白编码基因指导蛋白合成的过程一般包括以双链DNA为模板的转录过程和以mRNA为模板的翻译过程。蛋白编码基因含有CDS序列(Coding Sequence),能够指导编码蛋白质的mRNA的产生。蛋白编码基因包括但不限于用于编码参与合成L-脯氨酸及其衍生物的酶,在一些实施方案中,蛋白编码基因涉及用于编码参与合成L-脯氨酸及其衍生物的酶,如γ-谷氨酰激酶、谷氨酸半醛脱氢酶、吡咯啉-5-羧酸还原酶、脯氨酸4-羟化酶、脯氨酸3-羟化酶、脯氨酸转运蛋白等等。
本文所用的术语“载体”指的是DNA构建体,其含有与合适的控制序列可操作地连接的DNA序列,从而在合适的宿主中表达目的基因。“重组表达载体”指用于表达例如编码所需多肽的多核苷酸的DNA结构。重组表达载体可包括,例如包含 i)对基因表达具有调控作用的遗传元素的集合,例如启动子和增强子;ii)转录成mRNA并翻译成蛋白质的结构或编码序列;以及iii)适当的转录和翻译起始和终止序列的转录亚单位。重组表达载体以任何合适的方式构建。载体的性质并不重要,并可以使用任何载体,包括质粒、病毒、噬菌体和转座子。用于本公开的可能载体包括但不限于染色体、非染色体和合成DNA序列,例如细菌质粒、噬菌体DNA、酵母质粒以及从质粒和噬菌体DNA的组合中衍生的载体,来自如牛痘、腺病毒、鸡痘、杆状病毒、SV40和伪狂犬病等病毒的DNA。
本文所用的术语“表达载体”是指线状或环状DNA分子,该分子包含编码多肽的多核苷酸并且该多核苷酸有效地连接于供用于其表达的控制序列。
本文所用的术语“重组表达载体”指用于表达例如编码所需多肽的多核苷酸的DNA结构。重组表达载体可包括,例如包含i)对基因表达具有调控作用的遗传元素的集合,例如启动子和增强子;ii)转录成mRNA并翻译成蛋白质的结构或编码序列;以及iii)适当的转录和翻译起始和终止序列的转录亚单位。重组表达载体以任何合适的方式构建。载体的性质并不重要,并可以使用任何载体,包括质粒、病毒、噬菌体和转座子。用于本公开的可能载体包括但不限于染色体、非染色体和合成DNA序列,例如细菌质粒、噬菌体DNA、酵母质粒以及从质粒和噬菌体DNA的组合中衍生的载体,来自如牛痘、腺病毒、鸡痘、杆状病毒、SV40和伪狂犬病等病毒的DNA。
本文所用的术语“蛋白”、“多肽”和“肽”可互换使用,并具有本领域普通技术人员通常理解的含义。在本文中互换地使用并且为任意长度的氨基酸聚合物。该聚合物可以是线形或分支的,它可以包含修饰的氨基酸,并且它可以由非氨基酸隔断。该术语也包括已经被修饰(例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作,如以标记组分缀合)的氨基酸聚合物。
本文所用的术语“融合蛋白”为将所述突变体蛋白与蛋白标签融合得到的蛋白质。蛋白标签可位于突变体蛋白的N端,也可位于突变体蛋白的C端。突变体蛋白和蛋白标签之间还可以具有间隔氨基酸残基,具体可具有10个以下间隔氨基酸残基。
本文所用的术语“野生型的”、“天然存在的”指在自然界中可以找到的对象。例如,一种存在于生物体中,可以从自然界的一个来源中分离出来并且在实验室中没有被人类有意修改的多肽或多核苷酸序列是天然存在的。
本文所用的术语“氨基酸突变”或“核苷酸突变”,包括“取代、重复、缺失或添加一个或多个氨基酸或核苷酸”。在本发明中,术语“突变”是指核苷酸序列或者氨基酸序列的改变。在一个具体的实施方式中,术语“突变”是指“取代”。
本发明的“ProB突变体”是指通过对ProB蛋白氨基酸序列如序列1所示氨基酸序列进行突变获得。具体地说,本发明的ProB突变体是ProB蛋白氨基酸序列在对应于序列1所示氨基酸序列的第150位缬氨酸(V)被其他氨基酸残基取代,优选地,第150位缬氨酸(V)突变为天冬酰胺(N)、苏氨酸(T)、赖氨酸(K)、谷氨酰胺(Q)、组氨酸(H)、脯氨酸(P)、精氨酸(R)、谷氨酸(E)、丙氨酸(A)、酪氨酸(Y)、丝氨酸(S)、半胱氨酸(C)、色氨酸(W)和蛋氨酸(M)中任一种,更优选突变为天冬酰胺(N)、苏氨酸(T)、组氨酸(H)、酪氨酸(Y)中的任一个,最优选天冬酰胺(N)、苏氨酸(T)。关于本发明,还可以包括与序列1同源性大于80%,优选90%,更优选95%、96%、97%、98%、最优选99%以上来源于棒杆菌的多肽,只要其在对应于序列1所示氨基酸序列的第150位V被其他氨基酸残基取代,也在本发明的范围内。
本文所用的术语“自然状态”是指微生物中多肽处于未修饰状态的活性,即自然状态下的活性。
本文所用的术语“含有本发明的ProB蛋白突变体”具有本领域技术人员常规理解的含义,并且可以通过本领域已知的方法实施,包括但不限于,如:将包含编码蛋白的多核苷酸序列的多核苷酸插入到染色体上,和/或将多核苷酸克隆到载体上引入微生物,和/或在染色体上行直接增加该多核苷酸的拷贝等方法来实现,也可以非限制性地包括任何已知的可以引入蛋白活性的方法。
本领域技术人员知晓,为提升活性而对野生型多肽进行突变,找到能实现所需目的的位点更为重要。因此,基于本发明的教导,本领域技术人员会对序列1所示氨基酸序列的第150位的氨基酸残基进行突变,并检测突变体的相关活性。此外,本领域普通技术人员也不难知晓,在多肽的某些区域,例如非重要区域改变少数氨基酸残基基本上不会改变生物活性,例如,适当替换某些氨基酸得到的序列并不会影响其活性(可参见Watson等,Molecular Biology of The Gene,第四版,1987,The Benjamin/Cummings Pub. Co.P224)。因此,本领域普通技术人员能够实施这种替换并且确保所得分子仍具有所需生物活性。
因此,对本发明的ProB蛋白及其突变体作进一步突变而得到仍具备相应功能和活性的进一步突变体是显而易见的。例如,本领域技术人员公知在多肽的任一端增加或减少数个氨基酸残基,例如优选1-20个、更优选1-15个、更优选1-10个、更优选1-3个、最优选1个氨基酸残基不会影响得到的突变体的功能。例如,为便于纯化,技术人员往往在得到的蛋白的任一端带上6×His标签,而这种蛋白与不具备6×His标签的蛋白具有相同的功能。因此,本发明应包括在本发明基础上得到的保守性突变。
术语“保守突变”是指可正常维持蛋白质的功能的突变。保守突变的代表性例子为保守置换。
如本公开所使用的,术语“保守置换”涉及用具有类似侧链的氨基酸残基替换氨基酸残基。本领域已经定义了具有类似侧链的氨基酸残基家族,并且包括具有碱性侧链(例如赖氨酸、精氨酸和组氨酸)、酸性侧链(例如天冬氨酸和谷氨酸)、不带电极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、和半胱氨酸)、非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、蛋氨酸和色氨酸)、β-支链(例如苏氨酸、缬氨酸和异亮氨酸)和芳香侧链(例如酪氨酸、苯丙氨酸、色氨酸和组氨酸)。作为被视作保守置换的置换,示例性的,可以举出Ala向Ser或Thr的置换、Arg向Gln、His或Lys的置换、Asn向Glu、Gln、Lys、His或Asp的置换、Asp向Asn、Glu或Gln的置换、Cys向Ser或Ala的置换、Gln向Asn、Glu、Lys、His、Asp或Arg的置换、Glu向Gly、Asn、Gln、Lys或Asp的置换、Gly向Pro的置换、His向Asn、Lys、Gln、Arg或Tyr的置换、Ile向Leu、Met、Val或Phe的置换、Leu向Ile、Met、Val或Phe的置换、Lys向Asn、Glu、Gln、His或Arg的置换、Met向Ile、Leu、Val或Phe的置换、Phe向Trp、Tyr、Met、Ile或Leu的置换、Ser向Thr或Ala的置换、Thr向Ser或Ala的置换、Trp向Phe或Tyr的置换、Tyr向His、Phe或Trp的置换、及Val向Met、Ile或Leu的置换。此外,保守突变还包括起因于基因所来源的个体差异、株、种的差异等天然产生的突变。
本文所用的术语“对应于”具有本领域普通技术人员通常理解的意义。具体地说,“对应于”表示两条序列经同源性或序列相同性比对后,一条序列与另一条序列中的指定位置相对应的位置。因此,例如,就“对应于序列1所示氨基酸序列的第150位的氨基酸残基”而言,如果在序列1所示氨基酸序列的一端加上6×His标签,那么所得突变体中对应于序列1所示氨基酸序列的第150位就可能是第156位。
在具体的实施方式中,所述同源性或序列相同性可以是90%以上,优选95%以上,更优选96%、97%、98%、99%的同源性。
本领域普通技术人员公知的测定序列同源性或相同性的方法包括但不限于:计算机分子生物学(Computational Molecular Biology),Lesk,A.M.编,牛津大学出版社,纽约,1988;生物计算:信息学和基因组项目(Biocomputing:Informatics and GenomeProjects),Smith,D.W.编,学术出版社,纽约,1993;序列数据的计算机分析(ComputerAnalysis of Sequence Data),第一部分,Griffin,A.M.和Griffin,H.G.编,HumanaPress,新泽西,1994;分子生物学中的序列分析(Sequence Analysis in MolecularBiology),von Heinje,G.,学术出版社,1987和序列分析引物(Sequence AnalysisPrimer),Gribskov,M.与Devereux,J.编M Stockton Press,纽约,1991和Carillo,H.与Lipman,D.,SIAM J. Applied Math.,48:1073(1988)。测定相同性的优选方法要在测试的序列之间得到最大的匹配。测定相同性的方法编译在公众可获得的计算机程序中。优选的测定两条序列之间相同性的计算机程序方法包括但不限于:GCG程序包 (Devereux,J.等,1984)、BLASTP、BLASTN和FASTA(Altschul,S,F.等,1990)。公众可从NCBI和其它来源得到BLASTX程序 (BLAST手册,Altschul,S.等,NCBI NLM NIH Bethesda,Md.20894;Altschul,S.等,1990)。熟知的Smith Waterman算法也可用于测定相同性。
本文中的术语“宿主细胞”意指易于用包含本公开的突变体多肽、编码突变体多肽的多核苷酸或表达载体转化、转染、转导等的任何细胞类型。术语“重组微生物”涵盖导入转录起始元件或重组表达载体后不同于亲本细胞的宿主细胞,重组宿主细胞具体通过转化来实现。例如,适用于本发明的宿主细胞包括但不限于埃希氏菌属、棒杆菌属,优选大肠杆菌或谷氨酸棒杆菌。
本文中的术语“转化”具有本领域技术人员普遍理解的意思,即将外源性的DNA导入宿主的过程。所述转化的方法包括任何将核酸导入细胞的方法,这些方法包括但不限于电穿孔法、磷酸钙(CaPO4)沉淀法、氯化钙(CaCl2)沉淀法、微注射法、聚乙二醇(PEG)法、DEAE-葡聚糖法、阳离子脂质体法以及乙酸锂-DMSO法。
本文的宿主细胞的培养可以根据本领域的常规方法进行,包括但不限于孔板培养、摇瓶培养、批次培养、连续培养和分批补料培养等,并可以根据实际情况适当地调整各种培养条件如温度、时间和培养基的pH值等。
除非另外定义或由背景清楚指示,否则在本公开中的全部技术与科学术语具有如本公开所属领域的普通技术人员通常理解的相同含义。
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。下列实施例中未注明具体条件的实验方法,通常按照常规条件如Sambrook等人,分子克隆:实验室手册(New York: ColdSpring Harbor Laboratory Press, 1989)中所述的条件,或按照制造厂商所建议的条件。
下述实施例中的TSB培养基成份为(g/L):葡萄糖,5 g/L;酵母粉,5 g/L;大豆蛋白胨,9 g/L;尿素,3 g/L;丁二酸,0.5 g/L;K2HPO4·3H2O,1 g/L;MgSO4·7H2O,0.1 g/L;生物素,0.01 mg/L;维生素B1,0.1 mg/L ;MOPS,20 g/L,余量为水。固体培养基补充15 g/L琼脂粉。
下述实施例中的发酵培养基成份为(g/L):葡萄糖,80 g/L;酵母粉,1 g/L;大豆蛋白胨,1 g/L;NaCl,1 g/L;硫酸铵,1 g/L;尿素,10 g/L; K2HPO4·3H2O,1 g/L;MgSO4·7H2O,0.45 g/L;FeSO4·7H2O,0.05 g/L;生物素,0.4 mg/L;维生素B1,0.1 mg/L ;MOPS,40 g/L,余量为水;初始pH7.2。
下述实施例中所用的引物和序列如表1所示:
表1为引物
引物 核苷酸序列 序列
<i>cas9</i>-1 GCGCTCACAATTTCACACAGGAAACAGAATTAATTAAGCTTAAAGGCACCCGATATGGATAAGAAATACTCAATAGGC
<i>cas9</i>-2 TCAGTCACCTCCTAGCTGACTCAAATC
gRNA-1 GTCAGCTAGGAGGTGACTGAAGCTTGGCTGTTTTGGCGGATG
gRNA-2 CTGTGTGAAATTGTGAGCGCTCACAATTCC
P<i>ddh</i>-1 CTGTGCGGTATTTCACACCGGTGCGTGGCGAGTTTTACAAAG
P<i>ddh</i>-2 GTTCTTGTAATCCTCCAAAATTGTGGTGGCACTGTCCTGGTCGAGCTTACC<u>ACCTTTTGT</u>ACTTAGATGATGATTCAGGGAC
<i>recT</i>-1 TTTTGGAGGATTACAAGAACATGACTAAGCAACCACCAATCGC
<i>recT</i>-2 TTCCTCTGAATTATCGATTACACTG
PEC-1 CTAGCTCCAAAAAGGTCTCCAGG
PEC-2 CGGTGTGAAATACCGCACAGATG
<i>proB</i>-F2 TTCAGTTGTCACCAAAATTCACAC
<i>proB</i>-R2 AAACGTGTGAATTTTGGTGACAAC
150-1 CAGGTGCGCCACAATTGCAGCAAGTCGGTCGTTGTCACCAAAATTGADACCGGTGGTTGCCACGGTGTCATTTTCATTGACGATAGGAAC 序列5
150-2 CAGGTGCGCCACAATTGCAGCAAGTCGGTCGTTGTCACCAAAATTCWTACCGGTGGTTGCCACGGTGTCATTTTCATTGACGATAGGAAC 序列6
150-3 CAGGTGCGCCACAATTGCAGCAAGTCGGTCGTTGTCACCAAAATTGGHACCGGTGGTTGCCACGGTGTCATTTTCATTGACGATAGGAAC 序列7
150-4 CAGGTGCGCCACAATTGCAGCAAGTCGGTCGTTGTCACCAAAATTGTDACCGGTGGTTGCCACGGTGTCATTTTCATTGACGATAGGAAC 序列8
150-5 CAGGTGCGCCACAATTGCAGCAAGTCGGTCGTTGTCACCAAAATTTKGACCGGTGGTTGCCACGGTGTCATTTTCATTGACGATAGGAAC 序列9
150-6 CAGGTGCGCCACAATTGCAGCAAGTCGGTCGTTGTCACCAAAATTWTCACCGGTGGTTGCCACGGTGTCATTTTCATTGACGATAGGAAC 序列10
150-7 CAGGTGCGCCACAATTGCAGCAAGTCGGTCGTTGTCACCAAAATTGCVACCGGTGGTTGCCACGGTGTCATTTTCATTGACGATAGGAAC 序列11
150-8 CAGGTGCGCCACAATTGCAGCAAGTCGGTCGTTGTCACCAAAATTCCAACCGGTGGTTGCCACGGTGTCATTTTCATTGACGATAGGAAC 序列12
<i>proB</i>-C1 CCACGGAATTGGCAGTCAAG
<i>proB</i>-C2 TTTGCCGCAGAGGTCAACAG
实施例1、构建谷氨酸棒杆菌proB基因点突变的重组菌突变体库
一、CRISPR/Cas9基因组编辑系统相关质粒的构建
1、pCas9gRNA-ccdB质粒的构建
为了实现谷氨酸棒杆菌γ-谷氨酰激酶ProB(氨基酸序列为序列1,编码基因的核苷酸序列为序列2)的快速定点突变,首先构建基于单链重组的CRISPR/Cas9基因组编辑系统。以pCas9(LIU, Jiao, et al. Development of a CRISPR/Cas9 genome editing toolboxfor Corynebacterium glutamicum. Microbial cell factories, 2017, 16.1: 205.)质粒为模板,以cas9-1/cas9-2为引物,在引物上引入操纵元件lacO突变(TGTGTGGAATTGTGAGCGGATAACAATTTCACACA突变为TGTGTGGAATTGTGAGCGCTCACAATTTCACACA)和RBS突变(AAAGGAGTTGAGA突变为AAAGGCACCCGAT),扩增包含cas9的片段;再以pnCas9(D10A)‐AID‐gRNA‐ccdB TS(WANG, Yu, et al. Expanding targeting scope, editing window, andbase transition capability of base editing in Corynebacterium glutamicum.Biotechnology and bioengineering, 2019,116:3016-3029)质粒为模板,以gRNA-1/gRNA-2为引物,扩增包含gRNA‐ccdB表达盒和温敏复制原点的质粒骨架片段。以上2个片段通过诺唯赞的一步重组试剂盒(ClonExpressMultiS One Step Cloning Kit,C113)克隆连接,获得可以高效构建的pCas9gRNA-ccdB质粒,质粒图谱如图1所示,核苷酸序列如序列3所示。
2、pCas9gRNA-proB2质粒的构建
根据文献报道的Goldengate克隆方法(WANG, Yu, et al. Expanding targetingscope, editing window, and base transition capability of base editing inCorynebacterium glutamicum. Biotechnology and bioengineering, 2019,116:3016-3029)构建了靶向proB基因第150位氨基酸残基密码子的pCas9gRNA质粒,sgRNA的靶DNA 结合区为GTTGTCACCAAAATTCACAC;具体方法如下:
将proB-F2/proB-R2进行变性退火,得到带有粘性末端的DNA双链产物,再与上述1构建的pCas9gRNA-ccdB质粒进行Goldengate克隆(NEB® Golden Gate 组装试剂盒,#E1601),获得pCas9gRNA-proB2质粒,该质粒表达Cas9蛋白和靶向定点突变区的sgRNA。
以上质粒构建所用引物如表1所示。
3、pRecT质粒的构建
以谷氨酸棒杆菌ATCC13032基因组为模板,以P ddh -1/ P ddh -2为引物,扩增ddh基因的启动子突变体(ATGCATCTC突变为ACAAAAGGT);
以大肠杆菌MG1655基因组为模板,以recT-1/ recT-2为引物,扩增recT基因;
以pEC-XK99E(GenBank: AY219683.1,15-JAN-2003)质粒为模板,以PEC-1/ PEC-2为引物,扩增去除per基因的质粒骨架片段。
以上3个片段通过诺唯赞的一步重组试剂盒克隆连接,获得表达RecT的pRecT质粒,质粒如图2所示,该质粒的核苷酸序列如序列4所示。
以上质粒构建所用引物如表1所示。
二、构建谷氨酸棒杆菌proB基因第150位氨基酸密码子突变的突变体库
基于单链重组的CRISPR/Cas9基因组编辑系统构建proB基因第150位氨基酸密码子的突变体库,具体如下:
1、ATCC13032(pRecT)感受态细胞
将上述一的步骤3构建的pRecT质粒电转化至谷氨酸棒杆菌ATCC13032,获得ATCC13032(pRecT)菌株。ATCC13032(pRecT)菌株采用文献报道的方法制备感受态细胞(Ruan Y, ZhuL, Li Q. Improving the electro-transformation efficiency of Corynebacterium glutamicum by weakening its cell wall and increasing the cytoplasmic membranefluidity. BiotechnolLett. 2015;37:2445–52.),得到ATCC13032(pRecT)感受态细胞。
2、proB基因第150位氨基酸密码子突变的重组模板
为了对proB基因150位的氨基酸密码子进行野生型以外的19种突变,设计了150-1至150-8的单链DNA(表1),用于突变体构建的重组模板。
3、突变体库构建
ATCC13032(pRecT)感受态细胞,电转化2 μg pCas9gRNA-proB2质粒和总量为10 μg的单链DNA混合物(由150-1单链DNA至150-8单链DNA组成,含量为理论上19种单链DNA等量),加入1 mL 46℃预热的TSB培养基,46℃热击6 min,30℃孵育3 h,涂布添加5 μg/mL 氯霉素和0.05 mM IPTG的TSB平板,培养2天,长出数百克隆,获得谷氨酸棒杆菌proB基因第150位氨基酸密码子突变的突变体库。
三、谷氨酸棒杆菌proB基因第150位氨基酸密码子突变体库的筛选及测序
1、L-脯氨酸产量检测筛选谷氨酸棒杆菌proB基因150位氨基酸密码子突变体
为了筛选谷氨酸棒杆菌proB基因的突变体库,分别挑取上述二制备得到的突变体库的60个克隆进行发酵,筛选可以高产L-脯氨酸的突变体。
将60个克隆采用牙签挑取少量菌分别接种到每孔含有200 μl发酵培养基的96孔板中,30℃培养24 h,孔板摇床转速为800 rpm,发酵结束后,收集发酵产物。12000 rpm离心2 min,收集发酵液上清,检测发酵液上清中L-脯氨酸产量。
L-脯氨酸的检测方法:水配制的1 g/L的L-脯氨酸标准品(Sigma-Aldrich,P0380)或发酵液上清,用3%(W/V)磺基水杨酸稀释到合适浓度;取1 mL稀释液,加入1 mL酸合茚三酮(1.25 g茚三酮溶于30 mL冰醋酸和20 mL 6 M H3PO4中,70℃加热溶解)和1 mL冰醋酸,100℃沸水浴反应45 min;冷却后测定OD520
采用0-100 mg/L浓度的L-脯氨酸标准品绘制标准曲线(脯氨酸浓度(mg/L)=(OD520-0.0416)/0.0324),根据标准曲线及稀释倍数计算样品的L-脯氨酸浓度。
以野生型ATCC13032为对照。
结果,野生型ATCC13032的产量低于0.1g/L,突变体库的所有克隆产量都高于0.2g/L,表明以上位点突变可以解除脯氨酸反馈抑制,提高菌株的L-脯氨酸产量。
2、分子鉴定
将上述1筛选的产量都高于0.2 g/L的突变体60个克隆分别采用引物proB-C1/ proB-C2(表1)进行PCR扩增,PCR扩增目的条带进行测序分析。
上述突变体的产量和测序结果如表2所示,有部分相同突变的克隆,最终150位获得14种突变体,都可以产生L-脯氨酸。
表2为突变体的脯氨酸产量和突变信息
突变体菌株编号 L-脯氨酸产量 对应的密码子突变 氨基酸突变
150-M1 ++++ AAC V150N
150-M2 ++ AAG V150K
150-M3 +++ ACC V150T
150-M4 +++ CAA V150Q
150-M5 +++ CAC V150H
150-M6 + CCA V150P
150-M7 ++ CGC V150R
150-M8 ++ GAA V150E
150-M9 + GCC V150A
150-M10 +++ TAC V150Y
150-M11 ++ TCC V150S
150-M12 ++ TGC V150C
150-M13 ++ TGG V150W
150-M14 + ATG V150M
注: +,L-脯氨酸产量0.2-1.0 g/L;++,L-脯氨酸产量1.0-2.0 g/L;+++,L-脯氨酸产量2.0-3.0 g/L;++++,L-脯氨酸产量3.0-4.0 g/L。
实施例2、谷氨酸棒杆菌proB基因突变体的L-脯氨酸产量评价
由于实施例1获得的突变体L-脯氨酸产量初筛时菌株中还包含pRecT和 pCas9gRNA-proB2质粒,因此本实施例将以上两个质粒丢失,获得仅基因组上含有ProB蛋白150位点突变的菌株再次进行评价,具体如下:
将实施例1获得的产量较高菌株150-M1至150-M14菌株,进行pRecT和pCas9gRNA-proB2质粒的丢失,具体如下:在无抗性的TSB液体培养基30℃过夜培养,再在无抗性的TSB固体培养基平板划单克隆,然后对长出的单克隆菌分别对点3种平板(TSB+5 μg/mL 氯霉素、TSB+25 μg/mL 卡那霉素和TSB),30℃培养24 h,所获得的氯霉素和卡那霉素抗性平板不长,而TSB平板可以长的菌即为丢失2两个质粒后的突变体,命名为SLCgP54至SLCgP67(对应含有质粒的突变体150-M1至150-M14)。
上述突变体SLCgP54至SLCgP67为将野生型谷氨酸棒杆菌ATCC13032中ProB蛋白的第150位氨基酸残基V按照表3中的顺序依次替换为氨基酸残基N-M,ProB蛋白其他氨基酸残基不变,得到的重组菌。
为了进行效果对比,用现有常规方法构建包含现有文献报道的高效解除ProB的脯氨酸反馈抑制G149K突变(Jiang, Yu, et al. "CRISPR-Cpf1 assisted genome editingof Corynebacterium glutamicum." Nature communications 8 (2017): 15179.)的突变体菌株SLCgP1。该突变体菌株SLCgP1是在谷氨酸棒杆菌ATCC13032的谷氨酸激酶ProB上引入G149K(将密码子由GGT突变为AAG)氨基酸突变,该蛋白其他氨基酸残基不变。
采用24孔板评价菌株的L-脯氨酸产量:首先将SLCgP54至SLCgP67突变体菌株和对照突变体SLCgP1分别接种到TSB液体培养基中培养8 h,培养物作为种子接种到每孔含有800 μl发酵培养基的24孔板中,初始OD600控制约为0.1,30℃培养18 h,孔板摇床转速为800rpm,每个菌株3个平行,发酵结束后检测OD600和L-脯氨酸产量(检测方法同实施例1)。以野生型谷氨酸棒杆菌ATCC13032和SLCgP1作对照。
结果如表3所示,SLCgP54至SLCgP67突变体的L-脯氨基酸产量都高于野生型对照菌株,包含V150N突变的SLCgP54突变体和包含V150T突变的SLCgP56突变体的L-脯氨酸产量都高于包含对照G149K突变的SLCgP1菌株。可见,这些氨基酸位点突变在L-脯氨酸及其衍生物生产中具有较好的应用前景,尤其是在依赖ProB催化反应的L-脯氨酸、羟脯氨酸等的生产。
表3为突变体L-脯氨酸产量
菌株 氨基酸突变 OD<sub>600</sub> L-脯氨酸产量(g/L)
野生型ATCC13032 14.38±0.12 0.06±0.01
SLCgP1 G149K 13.59±0.67 2.92±0.016
SLCgP54 V150N 13.27±0.23 3.57±0.04
SLCgP55 V150K 12.48±0.20 1.55±0.24
SLCgP56 V150T 14.84±0.50 3.36±0.35
SLCgP57 V150Q 15.29±0.11 2.38±0.12
SLCgP58 V150H 14.97±0.27 2.98±0.36
SLCgP59 V150P 14.56±0.32 0.24±0.02
SLCgP60 V150R 13.60±0.09 1.69±0.18
SLCgP61 V150E 11.13±1.01 2.03±0.23
SLCgP62 V150A 12.71±0.34 0.56±0.08
SLCgP63 V150Y 13.34±0.19 2.90±0.47
SLCgP64 V150S 13.23±0.84 1.26±0.16
SLCgP65 V150C 14.11±0.24 1.61±0.09
SLCgP66 V150W 13.61±0.34 1.40±0.26
SLCgP67 V150M 13.58±0.81 0.73±0.10
SEQUENCE LISTING
<110>中国科学院天津工业生物技术研究所
<120>γ-谷氨酰激酶突变体及其应用
<160> 12
<170> PatentIn version 3.5
<210> 1
<211> 369
<212> PRT
<213> Corynebacterium glutamicum
<400> 1
Met Arg Glu Arg Ile Ser Asn Ala Lys Arg Val Val Val Lys Ile Gly
1 5 10 15
Ser Ser Ser Leu Thr Asn Asp Glu Asp Gly His Thr Val Asp Pro Asn
20 25 30
Arg Ile Asn Thr Ile Val Asn Ala Leu Gln Ala Arg Met Glu Ala Gly
35 40 45
Ser Asp Leu Ile Val Val Ser Ser Gly Ala Val Ala Ala Gly Met Ala
50 55 60
Pro Leu Gly Leu Ser Thr Arg Pro Thr Glu Leu Ala Val Lys Gln Ala
65 70 75 80
Ala Ala Ala Val Gly Gln Val His Leu Met His Gln Trp Gly Arg Ser
85 90 95
Phe Ala Arg Tyr Gly Arg Pro Ile Gly Gln Val Leu Leu Thr Ala Ala
100 105 110
Asp Ala Gly Lys Arg Asp Arg Ala Arg Asn Ala Gln Arg Thr Ile Asp
115 120 125
Lys Leu Arg Ile Leu Gly Ala Val Pro Ile Val Asn Glu Asn Asp Thr
130 135 140
Val Ala Thr Thr Gly Val Asn Phe Gly Asp Asn Asp Arg Leu Ala Ala
145 150 155 160
Ile Val Ala His Leu Val Ser Ala Asp Ala Leu Val Leu Leu Ser Asp
165 170 175
Val Asp Gly Leu Phe Asp Lys Asn Pro Thr Asp Pro Thr Ala Lys Phe
180 185 190
Ile Ser Glu Val Arg Asp Gly Asn Asp Leu Lys Gly Val Ile Ala Gly
195 200 205
Asp Gly Gly Lys Val Gly Thr Gly Gly Met Ala Ser Lys Val Ser Ala
210 215 220
Ala Arg Leu Ala Ser Arg Ser Gly Val Pro Val Leu Leu Thr Ser Ala
225 230 235 240
Ala Asn Ile Gly Pro Ala Leu Glu Asp Ala Gln Val Gly Thr Val Phe
245 250 255
His Pro Lys Asp Asn Arg Leu Ser Ala Trp Lys Phe Trp Ala Leu Tyr
260 265 270
Ala Ala Asp Thr Ala Gly Lys Ile Arg Leu Asp Asp Gly Ala Val Glu
275 280 285
Ala Val Thr Ser Gly Gly Lys Ser Leu Leu Ala Val Gly Ile Thr Glu
290 295 300
Ile Ile Gly Asp Phe Gln Gln Gly Glu Ile Val Glu Ile Leu Gly Pro
305 310 315 320
Ala Gly Gln Ile Ile Gly Arg Gly Glu Val Ser Tyr Asp Ser Asp Thr
325 330 335
Leu Gln Ser Met Val Gly Met Gln Thr Gln Asp Leu Pro Asp Gly Met
340 345 350
Gln Arg Pro Val Val His Ala Asp Tyr Leu Ser Asn Tyr Ala Ser Arg
355 360 365
Ala
<210> 2
<211> 1110
<212> DNA
<213> Corynebacterium glutamicum
<400> 2
atgcgtgagc gcatctccaa cgctaagcga gtggtggtga aaattggttc gtcctcattg 60
actaacgatg aggacggaca caccgtcgat cccaaccgca tcaacactat tgtcaatgcc 120
ttgcaagcac gcatggaagc tggctcggac ctcatcgttg tgtcctctgg cgcagtggcc 180
gcgggaatgg ccccgcttgg attgagcacc cggcccacgg aattggcagt caagcaggct 240
gcagcagcag tggggcaagt tcacctcatg caccagtggg gacgttcttt tgcccggtat 300
ggtcgcccca tcggccaggt gcttcttacc gcagctgatg caggaaagcg tgatcgtgcg 360
aggaatgcgc agcgtaccat cgacaagctg cgcattttgg gcgcggttcc tatcgtcaat 420
gaaaatgaca ccgtggcaac caccggtgtg aattttggtg acaacgaccg acttgctgca 480
attgtggcgc acctggtgtc ggctgatgct ttggtgctgc tcagtgacgt ggatggactt 540
tttgataaaa accctactga tcccaccgcg aagtttattt ccgaggttcg tgacggcaat 600
gatttgaaag gtgtcattgc cggcgacggc ggaaaagtgg gcaccggtgg catggcatca 660
aaggtgtctg ctgcacgttt ggcttcccga agtggcgtgc ctgtgctgtt gacctctgcg 720
gcaaacattg gcccagcact ggaagacgcc caggtgggca ctgtattcca ccccaaggac 780
aaccgcctct ccgcgtggaa gttctgggct ttgtatgccg cagatactgc aggaaagatc 840
cgactcgatg acggcgcggt ggaagcagtg acctccggtg gtaaatcttt gctggctgtg 900
ggcattactg aaatcattgg tgatttccag cagggtgaga tcgtggagat cttgggacct 960
gccggccaaa tcatcgggcg aggcgaggtg tcctacgatt ctgatacctt gcaatcaatg 1020
gttggtatgc aaacgcagga ccttccagat ggcatgcagc gcccggtagt gcatgcagat 1080
tatctgtcca actacgccag ccgcgcgtaa 1110
<210> 3
<211> 11773
<212> DNA
<213> Artificial sequence
<400> 3
aattaagctt aaaggcaccc gatatggata agaaatactc aataggctta gatatcggca 60
caaatagcgt cggatgggcg gtgatcactg atgaatataa ggttccgtct aaaaagttca 120
aggttctggg aaatacagac cgccacagta tcaaaaaaaa tcttataggg gctcttttat 180
ttgacagtgg agagacagcg gaagcgactc gtctcaaacg gacagctcgt agaaggtata 240
cacgtcggaa gaatcgtatt tgttatctac aggagatttt ttcaaatgag atggcgaaag 300
tagatgatag tttctttcat cgacttgaag agtctttttt ggtggaagaa gacaagaagc 360
atgaacgtca tcctattttt ggaaatatag tagatgaagt tgcttatcat gagaaatatc 420
caactatcta tcatctgcga aaaaaattgg tagattctac tgataaagcg gatttgcgct 480
taatctattt ggccttagcg catatgatta agtttcgtgg tcattttttg attgagggag 540
atttaaatcc tgataatagt gatgtggaca aactatttat ccagttggta caaacctaca 600
atcaattatt tgaagaaaac cctattaacg caagtggagt agatgctaaa gcgattcttt 660
ctgcacgatt gagtaaatca agacgattag aaaatctcat tgctcagctc cccggtgaga 720
agaaaaatgg cttatttggg aatctcattg ctttgtcatt gggtttgacc cctaatttta 780
aatcaaattt tgatttggca gaagatgcta aattacagct ttcaaaagat acttacgatg 840
atgatttaga taatttattg gcgcaaattg gagatcaata tgctgatttg tttttggcag 900
ctaagaattt atcagatgct attttacttt cagatatcct aagagtaaat actgaaataa 960
ctaaggctcc cctatcagct tcaatgatta aacgctacga tgaacatcat caagacttga 1020
ctcttttaaa agctttagtt cgacaacaac ttccagaaaa gtataaagaa atcttttttg 1080
atcaatcaaa aaacggatat gcaggttata ttgatggggg agctagccaa gaagaatttt 1140
ataaatttat caaaccaatt ttagaaaaaa tggatggtac tgaggaatta ttggtgaaac 1200
taaatcgtga agatttgctg cgcaagcaac ggacctttga caacggctct attccccatc 1260
aaattcactt gggtgagctg catgctattt tgagaagaca agaagacttt tatccatttt 1320
taaaagacaa tcgtgagaag attgaaaaaa tcttgacttt tcgaattcct tattatgttg 1380
gtccattggc gcgtggcaat agtcgttttg catggatgac tcggaagtct gaagaaacaa 1440
ttaccccatg gaattttgaa gaagttgtcg ataaaggtgc ttcagctcaa tcatttattg 1500
aacgcatgac aaactttgat aaaaatcttc caaatgaaaa agtactacca aaacatagtt 1560
tgctttatga gtattttacg gtttataacg aattgacaaa ggtcaaatat gttactgaag 1620
gaatgcgaaa accagcattt ctttcaggtg aacagaagaa agccattgtt gatttactct 1680
tcaaaacaaa tcgaaaagta accgttaagc aattaaaaga agattatttc aaaaaaatag 1740
aatgttttga tagtgttgaa atttcaggag ttgaagatag atttaatgct tcattaggta 1800
cctaccatga tttgctaaaa attattaaag ataaagattt tttggataat gaagaaaatg 1860
aagatatctt agaggatatt gttttaacat tgaccttatt tgaagatagg gagatgattg 1920
aggaaagact taaaacatat gctcacctct ttgatgataa ggtgatgaaa cagcttaaac 1980
gtcgccgtta tactggttgg ggacgtttgt ctcgaaaatt gattaatggt attagggata 2040
agcaatctgg caaaacaata ttagattttt tgaaatcaga tggttttgcc aatcgcaatt 2100
ttatgcagct gatccatgat gatagtttga catttaaaga agacattcaa aaagcacaag 2160
tgtctggaca aggcgatagt ttacatgaac atattgcaaa tttagctggt agccctgcta 2220
ttaaaaaagg tattttacag actgtaaaag ttgttgatga attggtcaaa gtaatggggc 2280
ggcataagcc agaaaatatc gttattgaaa tggcacgtga aaatcagaca actcaaaagg 2340
gccagaaaaa ttcgcgagag cgtatgaaac gaatcgaaga aggtatcaaa gaattaggaa 2400
gtcagattct taaagagcat cctgttgaaa atactcaatt gcaaaatgaa aagctctatc 2460
tctattatct ccaaaatgga agagacatgt atgtggacca agaattagat attaatcgtt 2520
taagtgatta tgatgtcgat cacattgttc cacaaagttt ccttaaagac gattcaatag 2580
acaataaggt cttaacgcgt tctgataaaa atcgtggtaa atcggataac gttccaagtg 2640
aagaagtagt caaaaagatg aaaaactatt ggagacaact tctaaacgcc aagttaatca 2700
ctcaacgtaa gtttgataat ttaacgaaag ctgaacgtgg aggtttgagt gaacttgata 2760
aagctggttt tatcaaacgc caattggttg aaactcgcca aatcactaag catgtggcac 2820
aaattttgga tagtcgcatg aatactaaat acgatgaaaa tgataaactt attcgagagg 2880
ttaaagtgat taccttaaaa tctaaattag tttctgactt ccgaaaagat ttccaattct 2940
ataaagtacg tgagattaac aattaccatc atgcccatga tgcgtatcta aatgccgtcg 3000
ttggaactgc tttgattaag aaatatccaa aacttgaatc ggagtttgtc tatggtgatt 3060
ataaagttta tgatgttcgt aaaatgattg ctaagtctga gcaagaaata ggcaaagcaa 3120
ccgcaaaata tttcttttac tctaatatca tgaacttctt caaaacagaa attacacttg 3180
caaatggaga gattcgcaaa cgccctctaa tcgaaactaa tggggaaact ggagaaattg 3240
tctgggataa agggcgagat tttgccacag tgcgcaaagt attgtccatg ccccaagtca 3300
atattgtcaa gaaaacagaa gtacagacag gcggattctc caaggagtca attttaccaa 3360
aaagaaattc ggacaagctt attgctcgta aaaaagactg ggatccaaaa aaatatggtg 3420
gttttgatag tccaacggta gcttattcag tcctagtggt tgctaaggtg gaaaaaggga 3480
aatcgaagaa gttaaaatcc gttaaagagt tactagggat cacaattatg gaaagaagtt 3540
cctttgaaaa aaatccgatt gactttttag aagctaaagg atataaggaa gttaaaaaag 3600
acttaatcat taaactacct aaatatagtc tttttgagtt agaaaacggt cgtaaacgga 3660
tgctggctag tgccggagaa ttacaaaaag gaaatgagct ggctctgcca agcaaatatg 3720
tgaatttttt atatttagct agtcattatg aaaagttgaa gggtagtcca gaagataacg 3780
aacaaaaaca attgtttgtg gagcagcata agcattattt agatgagatt attgagcaaa 3840
tcagtgaatt ttctaagcgt gttattttag cagatgccaa tttagataaa gttcttagtg 3900
catataacaa acatagagac aaaccaatac gtgaacaagc agaaaatatt attcatttat 3960
ttacgttgac gaatcttgga gctcccgctg cttttaaata ttttgataca acaattgatc 4020
gtaaacgata tacgtctaca aaagaagttt tagatgccac tcttatccat caatccatca 4080
ctggtcttta tgaaacacgc attgatttga gtcagctagg aggtgactga agcttggctg 4140
ttttggcgga tgagagaaga ttttcagcct gatacagatt aaatcagaac gcagaagcgg 4200
tctgataaaa cagaatttgc ctggcggcag tagcgcggtg gtcccacctg accccatgcc 4260
gaactcagaa gtgaaacgcc gtagcgccga tggtagtgtg gggtctgccc atgcgagagt 4320
agggaactgc caggcatcaa ataaaacgaa aggctcagtc gaaagactgg gcctttcgtt 4380
ttatctgttg tttgtcggtg aacgctctcc tgagtaggac aaatccgccg ggagcggatt 4440
tgaacgttgc gaagcaacgg cccggagggt ggcgggcagg acgcccgcca taaactgcca 4500
ggcatcaaat taagcagaag gccatcctga cggatggcct ttttgcgttt ctacaaactc 4560
ttttgtttat ttttctaaat acattcaaat atgtatccgc tcatgagaca ataaccctga 4620
taaatgcttc aataatattg aaaaaggaag agtatgagta ttcaacattt ccgtgtcgcc 4680
cttattccct tttttgcggc attttgcctt cctgtttttg ctcacccaga aacgctggtg 4740
aaagtaaaag atgctgaaga tcagttgggt gcacgagtgg gttacatcga actggatctc 4800
aacagcggta agatccttga gagttttcgc cccgaagaac gttttccaat gatgagcact 4860
tttgcttcct cgctcactga ctcgctgcgc tcggtcgttc ggctgcggcg agcggtatca 4920
gctcactcaa aggcggtaat acggttatcc acagaatcag gggataacgc aggaaagaac 4980
atgtgagcaa aaggccagca aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt 5040
ttccataggc tccgcccccc tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg 5100
cgaaacccga caggactata aagataccag gcgtttcccc ctggaagctc cctcgtgcgc 5160
tctcctgttc cgaccctgcc gcttaccgga tacctgtccg cctttctccc ttcgggaagc 5220
gtggcgcttt ctcaatgctc acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc 5280
aagctgggct gtgtgcacga accccccgtt cagcccgacc gctgcgcctt atccggtaac 5340
tatcgtcttg agtccaaccc ggtaagacac gacttatcgc cactggcagc agccactggt 5400
aacaggatta gcagagcgag gtatgtaggc ggtgctacag agttcttgaa gtggtggcct 5460
aactacggct acactagaag gacagtattt ggtatctgcg ctctgctgaa gccagttacc 5520
ttcggaaaaa gagttggtag ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt 5580
ttttttgttt gcaagcagca gattacgcgc agaaaaaaag gatctcaaga agatcctttg 5640
atcttttcta cggggtctga cgctcagtgg aacgaaaact cacgttaagg gattttggtc 5700
atgagattat caaaaaggat cttcacctag atccttttgg ggtgggcgaa gaactccagc 5760
atgagatccc cgcgctggag gatcatccag ccattcgggg tcgttcactg gttccccttt 5820
ctgatttctg gcatagaaga acccccgtga actgtgtggt tccgggggtt gctgattttt 5880
gcgagacttc tcgcgcaatt ccctagctta ggtgaaaaca ccatgaaaca ctagggaaac 5940
acccatgaaa cacccattag ggcagtaggg cggcttcttc gtctagggct tgcatttggg 6000
cggtgatctg gtctttagcg tgtgaaagtg tgtcgtaggt ggcgtgctca atgcactcga 6060
acgtcacgtc atttaccggg tcacggtggg caaagagaac tagtgggtta gacattgttt 6120
tcctcgttgt cggtggtggt gagcttttct agccgctcgg taaacgcggc gatcatgaac 6180
tcttggaggt tttcaccgtt ctgcatgcct gcgcgcttca tgtcctcacg tagtgccaaa 6240
ggaacgcgtg cggtgaccac gacgggctta gcctttgcct gcgcttctag tgcttcgatg 6300
gtggcttgtg cctgcgcttg ctgcgcctgt agtgcctgtt gagcttcttg tagttgctgt 6360
tctagctgtg ccttggttgc catgctttaa gactctagta gctttcctgc gatatgtcat 6420
gcgcatgcgt agcaaacatt gtcctgcaac tcattcatta tgtgcagtgc tcctgttact 6480
agtcgtacat actcatattt acctagtctg catgcagtgc atgcacatgc agtcatgtcg 6540
tgctaatgtg taaaacatgt acatgcagat tgctgggggt gcagggggcg gagccaccct 6600
gtccatgcgg ggtgtggggc ttgccccgcc ggtacagaca gtgagcaccg gggcacctag 6660
tcgcggatac cccccctagg tatcggacac gtaaccctcc catgtcgatg caaatcttta 6720
acattgagta cgggtaagct ggcacgcata gccaagctag gcggccacca aacaccacta 6780
aaaattaata gtccctagac aagacaaacc cccgtgcgag ctaccaactc atatgcacgg 6840
gggccacata acccgaaggg gtttcaattg acaaccatag cactagctaa gacaacgggc 6900
acaacacccg cacaaactcg cactgcgcaa ccccgcacaa catcgggtct aggtaacact 6960
gagtaacact gaaatagaag tgaacacctc taaggaaccg caggtcaatg agggttctaa 7020
ggtcactcgc gctagggcgt ggcgtaggca aaacgtcatg tacaagatca ccaatagtaa 7080
ggctctggcg gggtgccata ggtggcgcag ggacgaagct gttgcggtgt cctggtcgtc 7140
taacggtgct tcgcagtttg agggtctgca aaactctcac tctcgctggg ggtcatctct 7200
ggctgaattg gaagtcatgg gcgaacgccg cattgagctg gctattgcta ctaagaatca 7260
cttggcggcg ggtggcgcgc tcatgatgtt tgtgggcact gttcgacaca accgctcaca 7320
gtcatttgcg caggttgaag cgggtattaa gactgcgtac tcttcgatgg tgaaaacatc 7380
tcagtggaag aaagaacgtg cacggtacgg ggtggagcac acctatagtg actatgaggt 7440
cacagactct tgggcgaacg gttggcactt gcaccgcaac atgctgttgt tcttggatcg 7500
tccactgtct gacgatgaac tcaaggcgtt tgaggattcc atgttttccc gctggtctgc 7560
tggtgtggtt aaggccggta tggacgcgcc actgcgtgag cacggggtca aacttgatca 7620
ggtgtctacc tggggtggag acgctgcgaa aatggcaacc tacctcgcta agggcatgtc 7680
tcaggaactg actggctccg ctactaaaac cgcgtctaag gggtcgtaca cgccgtttca 7740
gatgttggat atgttggccg atcaaagcga cgccggcgag gatatggacg ctgttttggt 7800
ggctcggtgg cgtgagtatg aggttggttc taaaaacctg cgttcgtcct ggtcacgtgg 7860
ggctaagcgt gctttgggca ttgattacat agacgctgat gtacgtcgtg aaatggaaga 7920
agaactgtac aagctcgccg gtctggaagc accggaacgg gtcgaatcaa cccgcgttgc 7980
tgttgctttg gtgaagcccg atgattggaa actgattcag tctgatttcg cggttaggca 8040
gtacgttctc gattgcgtgg ataaggctaa ggacgtggcc gctgcgcaac gtgtcgctaa 8100
tgaggtgctg gcaagtctgg gtgtggattc caccccgtgc atgatcgtta tggatgatgt 8160
ggacttggac gcggttctgc ctactcatgg ggacgctact aagcgtgatc tgaatgcggc 8220
ggtgttcgcg ggtaatgagc agactattct tcgcacccac taaaagcggc ataaaccccg 8280
ttcgatattt tgtgcgatga atttatggtc aatgtcgcgg gggcaaacta tgatgggtct 8340
tgttgttggc gtcccggaaa acgattccga agcccaacct ttcatagaag gcggcggtgg 8400
aatttttctc cacataagct ggcaatgttg cgacgcaaca ggtacagtgt aattcatgag 8460
accacgcgtg gatccggctt actaaaagcc agataacagt atgcgtattt gcgcgctgat 8520
ttttgcggta taagaatata tactgatatg tatacccgaa gtatgtcaaa aagaggtatg 8580
ctatgaagca gcgtattaca gtgacagttg acagcgacag ctatcagttg ctcaaggcat 8640
atatgatgtc aatatctccg gtctggtaag cacaaccatg cagaatgaag cccgtcgtct 8700
gcgtgccgaa cgctggaaag cggaaaatca ggaagggatg gctgaggtcg cccggtttat 8760
tgaaatgaac ggctcttttg ctgacgagaa caggggctgg tgaaatgcag tttaaggttt 8820
acacctataa aagagagagc cgttatcgtc tgtttgtgga tgtacagagt gatattattg 8880
acacgcccgg gcgacggatg gtgatccccc tggccagtgc acgtctgctg tcagataaag 8940
tctcccgtga actttacccg gtggtgcata tcggggatga aagctggcgc atgatgacca 9000
ccgatatggc cagtgtgccg gtatccgtta tcggggaaga agtggctgat ctcagccacc 9060
gcgaaaatga catcaaaaac gccattaacc tgatgttctg gggaatataa ggtctcagtt 9120
ttagagctag aaatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc 9180
accgagtcgg tgcttttttt ccaggcatca aataaaacga aaggctcagt cgaaagactg 9240
ggcctttcgt tttatctgtt gtttgtcggt gaacgctctc ctgagtagga caaatccgcc 9300
gggagcggat ttgaacgttg cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc 9360
ataaactgcc aggcatcaaa ttaagcagaa ggccatcctg acggatggcc tttttgcgtt 9420
tctacaaact ctttttgttt atttttctaa atacattcaa atatgtatcc gctcatgaat 9480
taattccgct agatgacgtg cggcttcgaa aatctcgtga tggcaggttg ggcgtcgctt 9540
ggtcggtcat ttcgaagggc accaataact gccttaaaaa aattacgccc cgccctgcca 9600
ctcatcgcag tactgttgta attcattaag cattctgccg acatggaagc catcacagac 9660
ggcatgatga acctgaatcg ccagcggcat cagcaccttg tcgccttgcg tataatattt 9720
gcccatggtg aaaacggggg cgaagaagtt gtccatattg gccacgttta aatcaaaact 9780
ggtgaaactc acccagggat tggctgagac gaaaaacata ttctcaataa accctttagg 9840
gaaataggcc aggttttcac cgtaacacgc cacatcttgc gaatatatgt gtagaaactg 9900
ccggaaatcg tcgtggtatt cactccagag cgatgaaaac gtttcagttt gctcatggaa 9960
aacggtgtaa caagggtgaa cactatccca tatcaccagc tcaccgtctt tcattgccat 10020
acggaactcc ggatgagcat tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa 10080
cttgtgctta tttttcttta cggtctttaa aaaggccgta atatccagct gaacggtctg 10140
gttataggta cattgagcaa ctgactgaaa tgcctcaaaa tgttctttac gatgccattg 10200
ggatatatca acggtggtat atccagtgat ttttttctcc attttagctt ccttagctcc 10260
tgaaaatctc gtcgaagctc ggcggatttg tcctactcaa gctgatccga caaaatccac 10320
acattatccc aggtgtccgg atcggtcaaa tacgctgcca gctcatagac cgtatccaaa 10380
gcatccgggg ctgatccccg gcgccagggt ggtttttctt ttcaccagtg agacgggcaa 10440
cagctgattg cccttcaccg cctggccctg agagagttgc agcaagcggt ccacgtggtt 10500
tgccccagca ggcgaaaatc ctgtttgatg gtggttaacg gcgggatata acatgagctg 10560
tcttcggtat cgtcgtatcc cactaccgag atatccgcac caacgcgcag cccggactcg 10620
gtaatggcgc gcattgcgcc cagcgccatc tgatcgttgg caaccagcat cgcagtggga 10680
acgatgccct cattcagcat ttgcatggtt tgttgaaaac cggacatggc actccagtcg 10740
ccttcccgtt ccgctatcgg ctgaatttga ttgcgagtga gatatttatg ccagccagcc 10800
agacgcagac gcgccgagac agaacttaat gggcccgcta acagcgcgat ttgctggtga 10860
cccaatgcga ccagatgctc cacgcccagt cgcgtaccgt cttcatggga gaaaataata 10920
ctgttgatgg gtgtctggtc agagacatca agaaataacg ccggaacatt agtgcaggca 10980
gcttccacag caatggcatc ctggtcatcc agcggatagt taatgatcag cccactgacg 11040
cgttgcgcga gaagattgtg caccgccgct ttacaggctt cgacgccgct tcgttctacc 11100
atcgacacca ccacgctggc acccagttga tcggcgcgag atttaatcgc cgcgacaatt 11160
tgcgacggcg cgtgcagggc cagactggag gtggcaacgc caatcagcaa cgactgtttg 11220
cccgccagtt gttgtgccac gcggttggga atgtaattca gctccgccat cgccgcttcc 11280
actttttccc gcgttttcgc agaaacgtgg ctggcctggt tcaccacgcg ggaaacggtc 11340
tgataagaga caccggcata ctctgcgaca tcgtataacg ttactggttt cacattcacc 11400
accctgaatt gactctcttc cgggcgctat catgccatac cgcgaaaggt tttgcaccat 11460
tcgatggtgt caacgtaaat gccgcttcgc cttcgcgcgc gaattgcaag ctgatccggg 11520
cttatcgact gcacggtgca ccaatgcttc tggcgtcagg cagccatcgg aagctgtggt 11580
atggctgtgc aggtcgtaaa tcactgcata attcgtgtcg ctcaaggcgc actcccgttc 11640
tggataatgt tttttgcgcc gacatcataa cggttctggc aaatattctg aaatgagctg 11700
ttgacaatta atcatcggct cgtataatgt gtggaattgt gagcgctcac aatttcacac 11760
aggaaacaga att 11773
<210> 4
<211> 5688
<212> DNA
<213> Artificial sequence
<400> 4
gtgcgtggcg agttttacaa agaaccccac atcatcaatg cctaaatggc gggtattttc 60
atccaaaccc aaccgcgcat cattccaatg ctgatccacc ccatccggat aaaccaccat 120
gaacggcaac ggatcaaaag tcctgttggt gaagctgcgc cccacagatc ctgactgctg 180
ggagccatga aaatagatca gcgcatccgt ggtggaacca aaaggctcaa caatacgaaa 240
cgttcgcttt cggtcctgat gaaagagatg tccctgaatc atcatctaag tacaaaaggt 300
ggtaagctcg accaggacag tgccaccaca attttggagg attacaagaa catgactaag 360
caaccaccaa tcgcaaaagc cgatctgcaa aaaactcagg gaaaccgtgc accagcagca 420
gttaaaaata gcgacgtgat tagttttatt aaccagccat caatgaaaga gcaactggca 480
gcagctcttc cacgccatat gacggctgaa cgtatgatcc gtatcgccac cacagaaatt 540
cgtaaagttc cggcgttagg aaactgtgac actatgagtt ttgtcagtgc gatcgtacag 600
tgttcacagc tcggacttga gccaggtagc gccctcggtc atgcatattt actgcctttt 660
ggtaataaaa acgaaaagag cggtaaaaag aacgttcagc taatcattgg ctatcgcggc 720
atgattgatc tggctcgccg ttctggtcaa atcgccagcc tgtcagcccg tgttgtccgt 780
gaaggtgacg agtttagctt cgaatttggc cttgatgaaa agttaataca ccgcccggga 840
gaaaacgaag atgccccggt tacccacgtc tatgctgtcg caagactgaa agacggaggt 900
actcagtttg aagttatgac gcgcaaacag attgagctgg tgcgcagcct gagtaaagct 960
ggtaataacg ggccgtgggt aactcactgg gaagaaatgg caaagaaaac ggctattcgt 1020
cgcctgttca aatatttgcc cgtatcaatt gagatccagc gtgcagtatc aatggatgaa 1080
aaggaaccac tgacaatcga tcctgcagat tcctctgtat taaccgggga atacagtgta 1140
atcgataatt cagaggaata actgttttgg cggatgagag aagattttca gcctgataca 1200
gattaaatca gaacgcagaa gcggtctgat aaaacagaat ttgcctggcg gcagtagcgc 1260
ggtggtccca cctgacccca tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag 1320
tgtggggtct ccccatgcga gagtagggaa ctgccaggca tcaaataaaa cgaaaggctc 1380
agtcgaaaga ctgggccttt cgttttatct gttgtttgtc ggtgaacgct ctcctgagta 1440
ggacaaatcc gccgggagcg gatttgaacg ttgcgaagca acggcccgga gggtggcggg 1500
caggacgccc gccataaact gccaggcatc aaattaagca gaaggccatc ctgacggatg 1560
gcctttttgc gtttctacaa actctttttg tttatttttc taaatacatt caaatatgta 1620
tccgctcatg aattaattcc gctagatgac gtgcggcttc gactagctcc aaaaaggtct 1680
ccaggatctc gaggagattt ttgaggggga gggagtcgag gaagagccag agcagaaggc 1740
ggggaaccgt tctctgccga cagcgtgagc cccccttaaa aatcaggccg gggaggaacc 1800
ggggagggat cagagctagg agcgagacac cctaaagggg gggaaccgtt ttctgctgac 1860
ggtgtttcgt ttattagttt tcagcccgtg gatagcggag ggtgagggca agtgagagcc 1920
agagcaagga cgggacccct aaagggggga accgttttct gctgacggtg tttcgtttat 1980
tagttttcag cccgtggacg gccgcgttta gcttccattc caagtgcctt tctgacttgt 2040
tggatgcgcc tttcactgac acctagttcg cctgcaagct cacgagtcga gggatcagca 2100
accgattgag aacgggcatc caggatcgca gttttgacgc gaagttcgag caactcgcct 2160
gtcatttctc ggcgtttgtt tgcttccgct aatcgctgtc gcgtctcctg cgcatactta 2220
ctttctgggt cagcccatct gcgtgcattc gatgtagctg cgccccgtcg ccccatcgtc 2280
gctagagctt tccgccctcg gctgctctgc gtttccaccc gacgagcagg gacgactggc 2340
tggcctttag ccacgtagcc gcgcacacga cgcgccatcg tcaggcgatc acgcatggcg 2400
ggaagatccg gctcccggcc gtctgcaccg accgcctggg caacgttgta cgccacttca 2460
tacgcgtcga tgatcttggc atcttttagg cgctcaccag cagctttgag ctggtatccc 2520
acggtcaacg cgtggcgaaa cgcggtctcg tcgcgcgctc gctctggatt tgtccagagc 2580
actcgcacgc cgtcgatcag gtcgccggac gcgtccaggg cgctcggcag gctcgcgtcc 2640
aaaatcgcta gcgccttggc ttctgcggtg gcgcgttgtg ccgcttcaat gcgggcgcgt 2700
ccgctggaaa agtcctgctc aatgtacttt ttcggcttct gtgatccggt catcgttcga 2760
gcaatctcca ttaggtcggc cagccgatcc acacgatcat gctggcagtg ccatttatag 2820
gctgtcggat cgtctgagac gtgcagcggc caccggctca gcctatgcga aaaagcctgg 2880
tcagcgccga aaacacgagt catttcttcc gtcgttgcag ccagcaggcg catatttggg 2940
ctggttttac ctgctgcggc atacaccggg tcaatgagcc agatgagctg gcatttcccg 3000
ctcagcggat tcacgccgat ccaagccggc gctttttcta ggcgtgccca tttctctaaa 3060
atcgcgtaga cctgcgggtt tacgtgctca atcttcccgc cggcctggtg gctgggcaca 3120
tcgatgtcaa gcacgatcac cgcggcatgt tgcgcgtgcg tcagcgcaac gtactggcac 3180
cgcgtcagcg cttttgagcc agcccggtag agctttggtt gggtttcgcc ggtatccggg 3240
tttttaatcc aggcgctcgc gaaatctctt gtcttgctgc cctggaagct ttcgcgtccc 3300
aggtgagcga gcagttcgcg gcgatcttct gccgtccagc cgcgtgagcc gcagcgcata 3360
gcttcggggt gggtgtcgaa cagatcggcg gacaatttcc acgcgctagc tgtgactgtg 3420
tcctgcggat cggctagagt catgtcttga gtgctttctc ccagctgatg actgggggtt 3480
agccgacgcc ctgtgagttc ccgctcacgg ggcgttcaac tttttcaggt atttgtgcag 3540
cttatcgtgt tttcttcgta aatgaacgct taactacctt gttaaacgtg gcaaataggc 3600
aggattgatg gggatctagc ttcacgctgc cgcaagcact cagggcgcaa gggctgctaa 3660
aggaagcgga acacgtagaa agccagtccg cagaaacggt gctgaccccg gatgaatgtc 3720
agctactggg ctatctggac aagggaaaac gcaagcgcaa agagaaagca ggtagcttgc 3780
agtgggctta catggcgata gctagactgg gcggttttat ggacagcaag cgaaccggaa 3840
ttgccagctg gggcgccctc tggtaaggtt gggaagccct gcaaagtaaa ctggatggct 3900
ttcttgccgc caaggatctg atggcgcagg ggatcaagat ctgatcaaga gacaggatga 3960
ggatcgtttc gcatgattga acaagatgga ttgcacgcag gttctccggc cgcttgggtg 4020
gagaggctat tcggctatga ctgggcacaa cagacaatcg gctgctctga tgccgccgtg 4080
ttccggctgt cagcgcaggg gcgcccggtt ctttttgtca agaccgacct gtccggtgcc 4140
ctgaatgaac tccaagacga ggcagcgcgg ctatcgtggc tggccacgac gggcgttcct 4200
tgcgcagctg tgctcgacgt tgtcactgaa gcgggaaggg actggctgct attgggcgaa 4260
gtgccggggc aggatctcct gtcatctcac cttgctcctg ccgagaaagt atccatcatg 4320
gctgatgcaa tgcggcggct gcatacgctt gatccggcta cctgcccatt cgaccaccaa 4380
gcgaaacatc gcatcgagcg agcacgtact cggatggaag ccggtcttgt cgatcaggat 4440
gatctggacg aagagcatca ggggctcgcg ccagccgaac tgttcgccag gctcaaggcg 4500
cggatgcccg acggcgagga tctcgtcgtg acccatggcg atgcctgctt gccgaatatc 4560
atggtggaaa atggccgctt ttctggattc atcgactgtg gccggctggg tgtggcggac 4620
cgctatcagg acatagcgtt ggctacccgt gatattgctg aagagcttgg cggcgaatgg 4680
gctgaccgct tcctcgtgct ttacggtatc gccgctcccg attcgcagcg catcgccttc 4740
tatcgccttc ttgacgagtt cttctgagcg ggactctggg gttcgcggaa tcatgaccaa 4800
aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 4860
atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 4920
gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 4980
tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 5040
ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 5100
ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 5160
ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 5220
aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 5280
cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 5340
gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 5400
ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 5460
cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 5520
tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 5580
cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagtg 5640
cctgatgcgg tattttctcc ttacgcatct gtgcggtatt tcacaccg 5688
<210> 5
<211> 90
<212> DNA
<213> Artificial sequence
<400> 5
caggtgcgcc acaattgcag caagtcggtc gttgtcacca aaattgadac cggtggttgc 60
cacggtgtca ttttcattga cgataggaac 90
<210> 6
<211> 90
<212> DNA
<213> Artificial sequence
<400> 6
caggtgcgcc acaattgcag caagtcggtc gttgtcacca aaattcwtac cggtggttgc 60
cacggtgtca ttttcattga cgataggaac 90
<210> 7
<211> 90
<212> DNA
<213> Artificial sequence
<400> 7
caggtgcgcc acaattgcag caagtcggtc gttgtcacca aaattgghac cggtggttgc 60
cacggtgtca ttttcattga cgataggaac 90
<210> 8
<211> 90
<212> DNA
<213> Artificial sequence
<400> 8
caggtgcgcc acaattgcag caagtcggtc gttgtcacca aaattgtdac cggtggttgc 60
cacggtgtca ttttcattga cgataggaac 90
<210> 9
<211> 90
<212> DNA
<213> Artificial sequence
<400> 9
caggtgcgcc acaattgcag caagtcggtc gttgtcacca aaatttkgac cggtggttgc 60
cacggtgtca ttttcattga cgataggaac 90
<210> 10
<211> 90
<212> DNA
<213> Artificial sequence
<400> 10
caggtgcgcc acaattgcag caagtcggtc gttgtcacca aaattwtcac cggtggttgc 60
cacggtgtca ttttcattga cgataggaac 90
<210> 11
<211> 90
<212> DNA
<213> Artificial sequence
<400> 11
caggtgcgcc acaattgcag caagtcggtc gttgtcacca aaattgcvac cggtggttgc 60
cacggtgtca ttttcattga cgataggaac 90
<210> 12
<211> 90
<212> DNA
<213> Artificial sequence
<400> 12
caggtgcgcc acaattgcag caagtcggtc gttgtcacca aaattccaac cggtggttgc 60
cacggtgtca ttttcattga cgataggaac 90

Claims (11)

1.γ-谷氨酰激酶突变体蛋白,为如下A或B:
A)所述的蛋白为将γ-谷氨酰激酶对应于序列1所示的氨基酸序列第150位残基进行突变,得到具有γ-谷氨酰激酶活性的蛋白;
B)所述的蛋白为将A所示蛋白的氨基酸序列末端添加标签序列且具有γ-谷氨酰激酶活性的由A衍生的蛋白;
所述突变为将对应于序列1所示的氨基酸序列的第150位残基由缬氨酸突变为天冬酰胺、苏氨酸、赖氨酸、谷氨酰胺、组氨酸、脯氨酸、精氨酸、谷氨酸、丙氨酸、酪氨酸、丝氨酸、半胱氨酸、色氨酸和蛋氨酸中任一种。
2.根据权利要求1所述γ-谷氨酰激酶突变体蛋白,其特征在于:所述突变为将对应于序列1所示的氨基酸序列第150位残基由缬氨酸突变为天冬酰胺、苏氨酸、组氨酸、酪氨酸中的任一个。
3.根据权利要求1所述γ-谷氨酰激酶突变体蛋白,其特征在于:所述突变为将对应于序列1所示的氨基酸序列第150位残基由缬氨酸突变为天冬酰胺或苏氨酸。
4.一种具有γ-谷氨酰激酶活性的组合物,其包括含有权利要求1-3任一所述γ-谷氨酰激酶突变体蛋白的蛋白组合物或含有权利要求1-3任一所述γ-谷氨酰激酶突变体蛋白的融合蛋白。
5.编码权利要求1-3任一所述γ-谷氨酰激酶突变体蛋白的多核苷酸或编码权利要求4中所述组合物的多核苷酸。
6.含有编码权利要求1-3任一所述γ-谷氨酰激酶突变体蛋白的多核苷酸或权利要求5中所述多核苷酸的表达盒。
7.含有编码权利要求1-3任一所述γ-谷氨酰激酶突变体蛋白的多核苷酸或权利要求5中所述多核苷酸的重组载体。
8.含有编码权利要求1-3任一所述γ-谷氨酰激酶突变体蛋白的多核苷酸或权利要求5中所述多核苷酸的重组微生物。
9.根据权利要求8所述的重组微生物,其特征在于:所述重组微生物按照包括如下步骤的方法制备:将宿主菌中γ-谷氨酰激酶氨基酸序列对应于150位的氨基酸残基进行突变,得到重组微生物;
所述突变为将宿主菌中γ-谷氨酰激酶氨基酸序列对应于第150位的氨基酸残基突变为如下任一氨基酸;
所述如下任一氨基酸为天冬酰胺、苏氨酸、赖氨酸、谷氨酰胺、组氨酸、脯氨酸、精氨酸、谷氨酸、丙氨酸、酪氨酸、丝氨酸、半胱氨酸、色氨酸和蛋氨酸中任一种。
10.权利要求1-3任一所述γ-谷氨酰激酶突变体蛋白或权利要求4中所述组合物或权利要求5所述的多核苷酸或权利要求6所述的表达盒或权利要求7所述重组载体或权利要求8-9任一所述的重组微生物在制备L-脯氨酸或其衍生物中的应用,所述衍生物为羟基脯氨酸。
11.一种生产L-脯氨酸或其衍生物的方法,包括如下步骤:发酵培养权利要求8-9中任一所述重组微生物,得到L-脯氨酸或其衍生物,所述衍生物为羟基脯氨酸。
CN202011316277.7A 2020-11-23 2020-11-23 γ-谷氨酰激酶突变体及其应用 Active CN112111469B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011316277.7A CN112111469B (zh) 2020-11-23 2020-11-23 γ-谷氨酰激酶突变体及其应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011316277.7A CN112111469B (zh) 2020-11-23 2020-11-23 γ-谷氨酰激酶突变体及其应用

Publications (2)

Publication Number Publication Date
CN112111469A true CN112111469A (zh) 2020-12-22
CN112111469B CN112111469B (zh) 2021-02-26

Family

ID=73794928

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011316277.7A Active CN112111469B (zh) 2020-11-23 2020-11-23 γ-谷氨酰激酶突变体及其应用

Country Status (1)

Country Link
CN (1) CN112111469B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113201514A (zh) * 2020-10-16 2021-08-03 中国科学院天津工业生物技术研究所 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用
CN113684165A (zh) * 2021-08-12 2021-11-23 江南大学 一种重组谷氨酸棒杆菌及其在生产l-谷氨酰胺中的应用
WO2022037338A1 (zh) * 2020-08-19 2022-02-24 中国科学院天津工业生物技术研究所 具有启动子活性的多核苷酸及其在生产氨基酸中的应用
CN114107141A (zh) * 2021-08-19 2022-03-01 中国科学院天津工业生物技术研究所 高产l-脯氨酸的谷氨酸棒杆菌以及高产l-脯氨酸的方法
CN114874958A (zh) * 2021-02-05 2022-08-09 中国科学院天津工业生物技术研究所 生产l-脯氨酸的菌株及其构建方法和应用
CN115074304A (zh) * 2022-06-30 2022-09-20 江南大学 一种谷氨酸棒杆菌高效突变体及重组菌构建方法与应用
WO2023071580A1 (zh) 2021-11-01 2023-05-04 中国科学院天津工业生物技术研究所 基于赖氨酸外排蛋白构建的重组微生物及生产赖氨酸的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030066950A (ko) * 2002-02-06 2003-08-14 한국생명공학연구원 코리네박테리움 속의 미생물을 이용한 생산성이 향상된프롤린의 제조방법
WO2006066758A1 (en) * 2004-12-22 2006-06-29 Degussa Gmbh Mutant of the prob gene from coryneform bacteria
CN105602978A (zh) * 2016-01-19 2016-05-25 江南大学 一种利用基因组改造的重组大肠杆菌发酵生产l-脯氨酸的方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030066950A (ko) * 2002-02-06 2003-08-14 한국생명공학연구원 코리네박테리움 속의 미생물을 이용한 생산성이 향상된프롤린의 제조방법
WO2006066758A1 (en) * 2004-12-22 2006-06-29 Degussa Gmbh Mutant of the prob gene from coryneform bacteria
CN101084312A (zh) * 2004-12-22 2007-12-05 德古萨有限责任公司 棒状细菌的proB基因的突变体
CN105602978A (zh) * 2016-01-19 2016-05-25 江南大学 一种利用基因组改造的重组大肠杆菌发酵生产l-脯氨酸的方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FUJITA, T等: "Identification of regions of the tomato gamma-glutamyl kinase that are involved in allosteric regulation by proline", 《JOURNAL OF BIOLOGICAL CHEMISTRY》 *
R D SLEATOR等: "Mutations in the listerial proB gene leading to proline overproduction: effects on salt tolerance and murine infection", 《APPL ENVIRON MICROBIOL》 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022037338A1 (zh) * 2020-08-19 2022-02-24 中国科学院天津工业生物技术研究所 具有启动子活性的多核苷酸及其在生产氨基酸中的应用
CN113201514A (zh) * 2020-10-16 2021-08-03 中国科学院天津工业生物技术研究所 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用
CN114874958A (zh) * 2021-02-05 2022-08-09 中国科学院天津工业生物技术研究所 生产l-脯氨酸的菌株及其构建方法和应用
CN114874958B (zh) * 2021-02-05 2024-01-16 中国科学院天津工业生物技术研究所 生产l-脯氨酸的菌株及其构建方法和应用
CN113684165A (zh) * 2021-08-12 2021-11-23 江南大学 一种重组谷氨酸棒杆菌及其在生产l-谷氨酰胺中的应用
CN113684165B (zh) * 2021-08-12 2023-07-25 江南大学 一种重组谷氨酸棒杆菌及其在生产l-谷氨酰胺中的应用
CN114107141A (zh) * 2021-08-19 2022-03-01 中国科学院天津工业生物技术研究所 高产l-脯氨酸的谷氨酸棒杆菌以及高产l-脯氨酸的方法
WO2023071580A1 (zh) 2021-11-01 2023-05-04 中国科学院天津工业生物技术研究所 基于赖氨酸外排蛋白构建的重组微生物及生产赖氨酸的方法
CN115074304A (zh) * 2022-06-30 2022-09-20 江南大学 一种谷氨酸棒杆菌高效突变体及重组菌构建方法与应用
CN115074304B (zh) * 2022-06-30 2023-08-22 江南大学 一种谷氨酸棒杆菌突变体及重组菌构建方法与应用

Also Published As

Publication number Publication date
CN112111469B (zh) 2021-02-26

Similar Documents

Publication Publication Date Title
CN112111469B (zh) γ-谷氨酰激酶突变体及其应用
US8067210B2 (en) Method of producing lysine by culturing a host cell expressing a polynucleotide encoding a feedback resistant aspartokinase from corynebacterium
DK2491120T3 (en) Synthetic phytasevarianter
KR20130138866A (ko) 재조합 미생물 및 이의 사용 방법
HUE028104T2 (en) Synthetic phytase variants
KR101692103B1 (ko) 합성 피타아제 변이체
CN111269294A (zh) 纤维寡糖转运蛋白LacY的突变位点、突变转运蛋白LacY及其制备方法和应用
KR20200086303A (ko) 숙주 세포에서의 향미 화합물 생산
CN113201514B (zh) 具有天冬氨酸激酶活性的多肽及其在生产氨基酸中的应用
KR20110102752A (ko) L-아미노산 생산능을 갖는 미생물 및 이를 이용하여 l-아미노산을 생산하는 방법
US10351890B2 (en) Method for preparing recombinant proteins through reduction of rnpA gene expression
CN113943748B (zh) 一种丁香假单胞菌中的重组系统及应用
KR20240053585A (ko) 카고 뉴클레오티드 서열을 전이시키기 위한 시스템 및 방법
CN113736764A (zh) 一种包含氨肽酶Amp0279编码序列的重组质粒、重组谷氨酸棒状杆菌及应用
CN108410900B (zh) 无抗性植物乳杆菌锚定表达载体pLPSa及其制备方法
JP4383984B2 (ja) L−スレオニンの生産方法
CN112239756B (zh) 一组来源于植物的胞嘧啶脱氨酶和其在碱基编辑系统中的应用
CN110872596B (zh) 木糖阿拉伯糖共利用的酿酒酵母菌的构建方法
KR101291669B1 (ko) 미코박테리아―유래된 dna 오류 복구 뉴클레오타이드 서열 및 이의 용도
JP4551870B2 (ja) 酢酸菌の増殖促進機能に関与する遺伝子及びその使用
CN113549642B (zh) 一种结核分枝杆菌整合型表达质粒及其应用
CN114807201B (zh) 一种纤维寡糖转运蛋白及其制备方法和应用
CN115109861B (zh) 一种重组工程菌中质粒丢失率的检测方法
US20030157661A1 (en) De novo synthesized plasmid, methods of making and use thereof
US20040235121A1 (en) High copy number plasmids and their derivatives

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant