CN112852765B - 甲醛转化突变蛋白及其应用 - Google Patents

甲醛转化突变蛋白及其应用 Download PDF

Info

Publication number
CN112852765B
CN112852765B CN202010983978.XA CN202010983978A CN112852765B CN 112852765 B CN112852765 B CN 112852765B CN 202010983978 A CN202010983978 A CN 202010983978A CN 112852765 B CN112852765 B CN 112852765B
Authority
CN
China
Prior art keywords
formaldehyde
ala
leu
amino acid
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010983978.XA
Other languages
English (en)
Other versions
CN112852765A (zh
Inventor
朱蕾蕾
李天真
唐梓静
谭子瑊
马延和
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tianjin Institute of Industrial Biotechnology of CAS
Original Assignee
Tianjin Institute of Industrial Biotechnology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tianjin Institute of Industrial Biotechnology of CAS filed Critical Tianjin Institute of Industrial Biotechnology of CAS
Priority to CN202111161482.5A priority Critical patent/CN113832120B/zh
Priority to CN202180005890.3A priority patent/CN114616327B/zh
Priority to PCT/CN2021/076379 priority patent/WO2021169814A1/zh
Publication of CN112852765A publication Critical patent/CN112852765A/zh
Application granted granted Critical
Publication of CN112852765B publication Critical patent/CN112852765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J23/00Catalysts comprising metals or metal oxides or hydroxides, not provided for in group B01J21/00
    • B01J23/02Catalysts comprising metals or metal oxides or hydroxides, not provided for in group B01J21/00 of the alkali- or alkaline earth metals or beryllium
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C51/00Preparation of carboxylic acids or their salts, halides or anhydrides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • C12P7/28Acetone-containing products
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/11Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with 2-oxoglutarate as one donor, and incorporation of one atom each of oxygen into both donors (1.14.11)
    • C12Y114/11023Flavonol synthase (1.14.11.23)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Materials Engineering (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

本发明公开了甲醛转化突变蛋白及其应用。本发明的突变蛋白可催化甲醛制备1,3‑二羟基丙酮,可进一步通过1,3‑二羟基丙酮合成乳酸。本发明的获得的突变体大大提高甲醛到1,3‑二羟基丙酮的催化效率,可以在温和条件下进行。具有较好的应用前景。

Description

甲醛转化突变蛋白及其应用
相关申请的交叉引用
本申请要求2020年2月24日提交的申请号为202010113441.8的中国发明专利申请的优先权和权益,其整体内容通过引用的方式纳入本文。
技术领域
本发明属于生物化工技术领域,具体涉及一种甲醛转化突变蛋白及其应用。
背景技术
1,3-二羟基丙酮(1,3-dihydroxyacetone),是自然界存在的最简单的三碳酮糖,用途比较广泛。不仅可以用作化妆品的原料,对皮肤具有很好的保护作用,而且也可以以其为基础合成聚酯类化合物。此外,1,3-二羟基丙酮还是重要的代谢中间产物,通过微生物发酵法可以将其进一步转化为一些高附加值化学品和燃料分子,如乙醇、丁醇、乳酸、琥珀酸等,另外可以合成其他具有更高价值的糖类,如赤藓酮糖,山梨糖等。所以1,3-二羟基丙酮是一个重要的化学合成中间体,广泛应用于化妆品制造、食品研制、医药和化学合成等行业。
目前,1,3-二羟基丙酮的生产方法主要有微生物法和化学法两种,微生物法主要是利用微生物发酵法将甘油转化为1,3-二羟基丙酮,但是微生物方法生产能力低,需要严格控制微生物培养的条件,对微生物的生产环境要求严苛,其次后期1,3-二羟基丙酮的纯化工艺复杂,成本高,污染环境。化学法主要是使用金属催化剂氧化甘油生成1,3-二羟基丙酮,但是化学法使用金属催化剂会对环境造成污染,不利于环境的保护。
近年来,一碳化合物作为很有应用前景的绿色能源物质得到广泛关注,一碳化合物可以用来合成基本的有机化工原料、燃料和其他高附加值化学品。因其廉价易得的特性,一碳化合物成为替代石油制备高价值化合物最有发展前景的化合物,在医药、食品、化工领域具有重要的科学意义和开发价值。同时一碳化合物的利用和转化也可以显著减少人们在化石燃料利用和合成材料使用过程中对生态环境造成的负面影响。甲醛可以由其他一碳化合物转化而来,进而转化为生物利用的中间物质,同时又兼具来源广泛、价格低廉等特点,以甲醛为前体合成高价值的化合物具有重要的应用前景。
发明内容
为了解决以上问题,本发明的一个目的是提供一种甲醛转化突变蛋白,是从来源于恶臭假单胞菌的苯酰甲酸脱羧酶的突变体BFD1出发,进行易错PCR,对目的基因进行随机突变,筛选到的具有催化甲醛合成1,3-二羟基丙酮活性的蛋白,并且该活性具有热稳定性的特点。
本发明第二个目的是提供上述甲醛转化突变蛋白的应用。
本发明采用如下技术方案实现上述目的:
首先,本发明提供了一种甲醛转化突变蛋白,所述甲醛转化突变蛋白能催化甲醛合成1,3-二羟基丙酮,其氨基酸序列是,在对应于SEQ ID NO:1的S26、L43、F66、R86、T87、G109、A204、H281、A322、F397、M460、W463、V467、V473、S525位中至少一个位置处的氨基酸残基发生突变;或者所述甲醛转化突变蛋白的氨基酸序列具有所述发生突变的氨基酸序列中的突变位点,且与所述发生突变的氨基酸序列具有80%以上同源性的氨基酸序列,优选具有90%以上、95%以上或98%以上的同源性。
在一个实施方案中,上述甲醛转化突变蛋白的氨基酸序列至少包括如下突变位点之一:对应于SEQ ID NO:1的第26位的丝氨酸S突变为苯丙氨酸F、第43位的亮氨酸L突变为谷氨酰胺Q、第66位的苯丙氨酸F突变为亮氨酸L、第86位的精氨酸R突变为半胱氨酸C、第87位的苏氨酸T突变为丙氨酸A、第109位的甘氨酸G突变为丝氨酸S、第204位的丙氨酸A突变为缬氨酸V、第281位的组氨酸H突变为酪氨酸Y、第322位的丙氨酸A突变为苏氨酸T、第397位的苯丙氨酸F突变为亮氨酸L或丝氨酸S中的任一种、第460位的甲硫氨酸M突变为苏氨酸T、第463位的色氨酸W突变为精氨酸R、第467位的缬氨酸V突变为丙氨酸A、第473位的缬氨酸V突变为丙氨酸A、第525位的丝氨酸S突变为丙氨酸A。具体地,所述甲醛转化突变蛋白包括对应于SEQ ID NO:1,发生至少一个如下位点的取代或者是如下二种以上不同位点的组合:S26F、L43Q、F66L、R86C、T87A、G109S、A204V、H281Y、A322T、F397L/F397S、M460T、W463R、V467A、V473A、S525A。
在一个实施方案中,上述甲醛转化突变蛋白的氨基酸序列至少包括:对应于SEQID NO:1的第281位组氨酸H发生突变,例如突变为酪氨酸Y。进一步地,所述甲醛转化突变蛋白还可以包括至少其他一个位点的突变,例如是S26F、L43Q、F66L、T87A、G109S、A204V、A322T、F397L/F397S、M460T、W463R、V467A、V473A、S525A中的任一个或多个位点的组合。
在一个实施方案中,上述甲醛转化突变蛋白的氨基酸序列至少包括:对应于SEQID NO:1的第26位丝氨酸S突变,例如突变为苯丙氨酸F。进一步地,所述甲醛转化突变蛋白还可以包括至少其他一个位点的突变,例如是L43Q、F66L、T87A、G109S、A204V、H281Y、A322T、F397L/F397S、M460T、W463R、V467A、V473A、S525A中的任一个或多个位点的组合。
在一个实施方案中,上述甲醛转化突变蛋白的氨基酸序列至少包括:对应于SEQID NO:1的第397位苯丙氨酸F突变,例如突变为亮氨酸L或丝氨酸S中的任一种。进一步地,所述甲醛转化突变蛋白还可以包括至少其他一个位点的突变,例如是S26F、L43Q、F66L、T87A、G109S、A204V、H281Y、A322T、M460T、W463R、V467A、V473A、S525A中的任一个或多个位点的组合。
在一个实施方案中,上述甲醛转化突变蛋白的氨基酸序列至少包括:对应于SEQID NO:1的第463位色氨酸W突变,例如突变为精氨酸R。进一步地,所述甲醛转化突变蛋白还可以包括至少其他一个位点的突变,例如是S26F、L43Q、F66L、T87A、G109S、A204V、H281Y、A322T、F397L/F397S、M460T、V467A、V473A、S525A中的任一个或多个位点的组合。
在一个实施方案中,上述甲醛转化突变蛋白的氨基酸序列包括:对应于SEQ IDNO:1的第281位组氨酸H为酪氨酸Y,并且第26位丝氨酸S突变为苯丙氨酸F。进一步地,所述甲醛转化突变蛋白还可以包括至少其他一个位点的突变,例如是W463R、L43Q、G109S、F397S/F397L、M460T、S525A、V194I、V467A、F66L、A204V、A322T、中任一个或多个位点的组合。在一个实施方案中,上述甲醛转化突变蛋白的氨基酸序列包括对应于SEQ ID NO:1的S26F、H281Y、和F397S位点的突变;在又一实施方案中,所述甲醛转化突变蛋白的氨基酸序列包括对应于SEQ ID NO:1的S26F、H281Y、和W463R位点的突变。
作为本发明的示例性方案,上述甲醛转化突变蛋白的氨基酸序列具体为如下1)-18)中任一种:
1)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:3);
2)SEQ ID NO:1的第86位精氨酸突变为半胱氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:4);
3)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:5);
4)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第397位苯丙氨酸突变为亮氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:6);
5)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第473位缬氨酸突变为丙氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:7);
6)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,且将第43位亮氨酸突变为谷氨酰胺,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:8);
7)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,且将第66位苯丙氨酸突变为亮氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:9);
8)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,且将第109位的甘氨酸突变为丝氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:10);
9)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,且将第204位丙氨酸突变为缬氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:11);
10)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,且将第397位苯丙氨酸突变为丝氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:12);
11)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,且将第463位色氨酸突变为精氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:13);
12)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,且将第467位缬氨酸突变为丙氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:14);
13)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第87位苏氨酸突变为丙氨酸,且将第322位丙氨酸突变为苏氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:15);
14)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,且将第463位色氨酸突变为精氨酸,且将第109位的甘氨酸突变为丝氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:16);
15)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,且将第397位苯丙氨酸突变为丝氨酸,且将第109位的甘氨酸突变为丝氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:17);
16)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,且将第460位蛋氨酸突变为苏氨酸,且将第525位丝氨酸突变为丙氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:18);
17)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,且将第397位苯丙氨酸突变为丝氨酸,且将第109位的甘氨酸突变为丝氨酸,且将第322位丙氨酸突变为苏氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:19);
18)SEQ ID NO:1的第281位组氨酸突变为酪氨酸,且将第26位丝氨酸突变为苯丙氨酸,且将第463位色氨酸突变为精氨酸,且将第109位的甘氨酸突变为丝氨酸,且将第397位的苯丙氨酸突变为丝氨酸,其他氨基酸残基保持不变,得到的氨基酸序列(其核苷酸序列为SEQ ID NO:20);
本发明还提供一种多核苷酸,所述多核苷酸是编码上述甲醛转化突变蛋白的多核苷酸。
本发明还提供含有上述甲醛转化突变蛋白和/或上述多核苷酸的重组载体、表达盒、转基因细胞系和/或重组菌。
本发明还提供上述甲醛转化突变蛋白作为催化剂的用途,优选用于催化制备1,3-二羟基丙酮和/或乳酸的催化剂,例如催化甲醛制备1,3-二羟基丙酮和/或乳酸的催化剂。
本发明还提供含有上述多核苷酸的重组载体、表达盒、转基因细胞系和/或重组菌作为催化剂的用途,优选用于催化制备1,3-二羟基丙酮和/或乳酸的催化剂,例如催化甲醛制备1,3-二羟基丙酮和/或乳酸的催化剂。
在本发明的甲醛转化突变蛋白催化甲醛制备目标化合物时,包括:将甲醛转化突变蛋白与甲醛接触,催化其生成1,3-二羟基丙酮;进一步地,可任选地加入碱金属氢氧化物和/或碱土金属氢氧化物,催化1,3-二羟基丙酮生成乳酸。
本发明中包含上述甲醛转化突变蛋白和/或所述多核苷酸的重组载体、转基因细胞系或重组菌株在催化甲醛制备目标化合物时,包括:将包含所述甲醛转化突变蛋白和/或所述多核苷酸的重组载体、转基因细胞系或重组菌株与甲醛接触,催化其生成1,3-二羟基丙酮;进一步地,可任选地加入碱金属氢氧化物和/或碱土金属氢氧化物,催化1,3-二羟基丙酮生成乳酸。
有益效果
本发明通过对甲醛转化蛋白进行分子改造获得的甲醛转化突变蛋白,大大提高了甲醛缩合产生1,3-二羟基丙酮的效率,并为乳酸的合成提供原料。
附图说明
图1:实施例7中HPLC检测产物1,3-二羟基丙酮。
图2:实施例8中HPLC检测碱金属氢氧化物催化产生的终产物乳酸。
图3:实施例8中HPLC检测碱土金属氢氧化物催化产生的终产物乳酸。
图4:甲醛转化突变蛋白结构图。
术语和定义
在本发明的上下文中,本发明中“甲醛转化蛋白”是指能催化甲醛合成1,3-二羟基丙酮的蛋白,只要其具有催化甲醛转化为1,3-二羟基丙酮的功能即可,对其氨基酸序列和来源没有特别限制。仅作为实例但并非限制性地,其可以是例如,来源于恶臭假单胞菌(pseudomonas putida)的苯酰甲酸脱羧酶(benzoylformate decarboxylases,BFD)和来源于荧光假单胞菌(Pseudomonas fluorescens biovar I)的苯甲醛裂合酶(benzaldehydelyase,BAL)。“甲醛转化突变蛋白”是指“甲醛转化蛋白”经过氨基酸突变后得到具有上述功能的蛋白。
本发明中氨基酸由单字母或三字母代码表示,具有如下含义:A:Ala(丙氨酸);R:Arg(精氨酸);N:Asn(天冬酰胺);D:Asp(天冬氨酸);C:Cys(半胱氨酸);Q:Gln(谷氨酰胺);E:Glu(谷氨酸);G:Gly(甘氨酸);H:His(组氨酸);L:Leu(亮氨酸);K:Lys(赖氨酸);M:Met(甲硫氨酸);F:Phe(苯丙氨酸);S:Ser(丝氨酸);T:Thr(苏氨酸);W:Trp(色氨酸);Y:Tyr(酪氨酸);V:Val(缬氨酸)。
本发明中,“同源性”具有本领域常规的含义,是指两个核酸或氨基酸序列之间的“同一性”,其百分比表示在最佳比对(best alignment)后获得的待比较的两个序列之间的相同核苷酸或氨基酸残基的统计学意义的百分比,两个序列之间的差异随机地分布在其整个长度上。
在本发明中,术语“突变体”和“变体”以及“突变蛋白”可以互换使用,“修饰”或“突变”可以互换施用,这些表达是指相对于未修饰或改造蛋白的氨基酸,例如作为出发序列的SEQ ID NO:1的甲醛转化突变蛋白,或来源于此类蛋白的基础上,包含在一个或更多个位置处的改变,即取代、插入和/或缺失,并仍然保留其活性。突变蛋白可以通过本领域已知的各种技术获得。特别地,用于修饰编码野生型蛋白的DNA序列的示例性技术包括但不限于,定向诱变、随机诱变和合成寡核苷酸的构建。
关于氨基酸位置或残基的术语“取代”是指在特定位置处的氨基酸已被其他的氨基酸代替。取代可以是保守的或非保守的。
所述突变根据它们在特定残基上的突变来描述,其位置通过作为出发蛋白的氨基酸序列SEQ ID NO:1比对或参考序列SEQ ID NO:1来确定。在本发明的上下文中,还涉及在功能等同的残基上携带这些相同突变的任何变体。
本文所用的术语“对应于”具有本领域普通技术人员通常理解的意义。具体地说,“对应于”表示两条序列经同源性或序列相同性比对后,一条序列与另一条序列中的指定位置相对应的位置。在本发明中,“对应于SEQ ID NO:1”表示通过与SEQ ID NO:1对比确定突变位点的位置。因此,例如,就“对应于SEQ ID NO:1所示氨基酸序列的第40位的氨基酸残基”而言,如果在SEQ ID NO:1所示任一氨基酸序列的一端加上6×His标签,那么所得突变体中对应于SEQ ID NO:1所示氨基酸序列的第40位就可能是突变体中的第46位。
本领域技术人员应当理解,“对应于SEQ ID NO:1”仅表示将SEQ ID NO:1作为确定突变位点的位置的基准,但并不代表本发明的突变蛋白仅能通过改造SEQ ID NO:1所示的氨基酸序列所得到。在一个实施方案中,本领域技术人员可以本领域已知的任何甲醛转化酶的氨基酸序列为出发序列得到本发明的甲醛转化突变蛋白,只要所得到的甲醛转化突变蛋白与SEQ ID NO:1对比,在本发明所涉及的位点处发生突变,并保持甲醛转化酶的催化活性,即在本发明的范围内,不需要除突变位点外的其他位点均与SEQ ID NO:1完全一致。在一个实施方案中,以SEQ ID NO:1所示的蛋白为出发序列,进行本发明的突变或取代,得到本发明的甲醛转化突变蛋白。在一个实施方案中,以SEQ ID NO:1具有同源性的序列为出发序列,进行本发明的突变或取代,得到本发明的甲醛转化突变蛋白,该SEQ ID NO:1的同源性序列与SEQ ID NO:1的S26、L43、F66、R86、T87、G109、A204、H281、A322、F397、M460、W463、V467、V473、S525位点是相同的,以便可以发生本发明的突变或取代,但其他位点可以相同或不同。在一个实施方案中,该出发序列与SEQ ID NO:1的同源性为80%以上,例如85%以上、90%以上或95%以上,以便能够确定对应于SEQ ID NO:1的特定氨基酸位点。在又一个实施方案中,以野生型甲醛转化酶(氨基酸序列SEQ ID NO:23,核苷酸序列SEQ ID NO:24)为出发序列,仍在对应于SEQ ID NO:1的相应位点进行本发明的突变或取代,得到相应的甲醛转化突变蛋白。
本发明中“出发蛋白”或“出发序列”是指进行本发明的修饰或突变之前的甲醛蛋白酶或其氨基酸序列。本文采用“XaY”的形式表示氨基酸的突变或取代,其中a表示SEQ IDNO:1中氨基酸的位置,X表示SEQ ID NO:1中a位置野生型的氨基酸种类,Y表示SEQ ID NO:1中a位置突变后的氨基酸种类。例如,“H281Y”表示与SEQ ID NO:1比对,在对应于SEQ IDNO:1第281位的组氨酸H被酪氨酸Y取代。
具体实施方式
下文将结合具体实施例对本发明的技术方案做更进一步的详细说明。应当理解,下列实施例仅为示例性地说明和解释本发明,而不应被解释为对本发明保护范围的限制。凡基于本发明上述内容所实现的技术均涵盖在本发明旨在保护的范围内。
除非另有说明,以下实施例中使用的原料和试剂均为市售商品,或者可以通过已知方法制备。下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
实施例1甲醛转化突变蛋白(甲醛转化突变体)构建
甲醛转化突变蛋白是来源于恶臭假单胞菌(pseudomonas putida)的苯酰甲酸脱羧酶(benzoylformate decarboxylases,BFD)的突变体BFD1(本发明中下文简称:原始BFD1),其核苷酸序列为SEQ ID NO:2,将该核苷酸序列两端加上限制性酶切位点NdeⅠ和XhoⅠ,用T4 DNA连接酶连接至质粒pET28a的多克隆位点区域,构建重组质粒pET28a-bfd1。然后以pE T28a-bfd1为模板,设计引物(上游引物:5’-CCGCGCGGCAGCCATATG-3’
(SEQ ID NO:21)下游引物:5’-GGTGGTGGTGGTGGTGCTCGAGTT ATT-3’(SEQ ID NO:22)),进行易错PCR,对目的基因进行随机突变。PCR完成后,对目的基因进行胶回收,将突变后的目的基因连接在载体pE T28a上,再将连接后的载体转化到大肠杆菌BL21 Gold(DE3)中,37℃培养箱培养至长出单克隆。
实施例2甲醛转化突变蛋白的筛选
对实施例1中得到的突变体克隆,挑取单克隆到含有硫酸卡那霉素抗生素的LB培养基的96孔板中,在摇床中过夜培养,将上述突变体复制到含有异丙基-β-D-硫代半乳糖苷(IPTG)的LB培养基的96孔板中培养至一定时间。培养完成后,离心收集菌体,再用200μL磷酸钾缓冲液(50mM K2HPO4和KH2PO4,5mM MgSO4,pH 7.4)洗涤并收集菌体。
菌体用50μL磷酸钾缓冲液重悬,再分别加入等体积的甲醛溶液(磷酸钾缓冲液含有50mM或30mM或20mM或200mM甲醛和1mM硫胺素焦磷酸(TPP)),30℃反应3h。反应完成后,离心取90μL上清液于96孔板中,加入60μL的工具酶缓冲液1(0.3mg/mL半乳糖氧化酶,36U/mL辣根过氧化物酶),然后加入50μL的工具酶缓冲液2(3.2mM 2,2'-联氮-双-3-乙基苯并噻唑啉-6-磺酸(ABTS)),在吸收光410nm条件下检测20min。
得到的菌株与原始BFD1比较,催化效率更高的即为有益突变菌株,然后通过基因测序,找到相对应突变的位点及氨基酸。经过三轮突变体库的筛选,最终获得了十八株酶活显著提高,且活性稳定的突变体。通过基因测序,得到所述十八株突变体的名称及对应突变氨基酸见表1。
表1突变体名称及对应突变氨基酸
Figure BDA0002688501510000121
实施例3原始BFD1及其突变体在大肠杆菌中的表达
接种针挑取原始BFD1和18种突变体的阳性菌分别接种于5mL LB培养基中,37℃过夜培养,然后以1%(V/V)接种量接种于25mL LB培养基中,以37℃、200r/min培养。当OD600达到0.6时,加入0.1mM的IPTG,在30℃下诱导表达。诱导完成后,将上述培养的突变体菌体分别收集到离心管中,然后用磷酸钾缓冲液重悬并清洗菌体。离心后-80℃冰箱保存上述菌体。
实施例4原始BFD1及其突变体活性检测
取出实施例3中的菌体,磷酸钾缓冲液重悬,冰浴超声破菌,离心收集上清。取50μL细胞重悬液或上清液与50μL甲醛溶液混合,于30℃反应3h,反应完成后,取出90μL反应溶液加入60μL的工具酶缓冲液1,然后加入50μL的工具酶缓冲液2,在吸收光410nm条件下检测20min。计算原始BFD1及突变体全细胞酶活力,突变体酶活力相对于原始BFD1的百分比如下表所示(以原始BFD1及出发菌株全细胞酶活力为100%)。
表2原始BFD1及突变体的全细胞在30mM甲醛浓度下活性
Figure BDA0002688501510000131
表3突变体V3及其进一步突变体的全细胞在20mM甲醛浓度下活性
Figure BDA0002688501510000132
Figure BDA0002688501510000141
表4突变体V10及其进一步突变体的细胞破碎上清在20mM甲醛浓度下活性
Figure BDA0002688501510000142
表5突变体V11及其进一步突变体的细胞破碎上清在20mM甲醛浓度下活性
Figure BDA0002688501510000143
表6突变体V11及其进一步突变体的细胞破碎上清在200mM甲醛浓度下活性
Figure BDA0002688501510000144
Figure BDA0002688501510000151
实施例5原始BFD1及其突变体热稳定性检测
取出实施例3中的菌体,磷酸钾缓冲液重悬,冰浴超声破菌,离心收集上清。取50μL细胞上清液在55℃下加热30min,加热完成后加入50μL50mM甲醛溶液,于30℃反应3h,反应完成后,取出90μL反应溶液加入60μL的工具酶缓冲液1,然后加入50μL的工具酶缓冲液2,在吸收光410nm条件下检测20min。对细胞上清液加热后,突变体的活性相对于原始BFD1热稳定性较好。原始BFD1及其突变体的相对剩余活性如表7所示(以原始BFD1相对剩余活性为100%)。
表7原始BFD1及其突变体相对剩余活性
Figure BDA0002688501510000152
实施例6原始BFD1转化及其突变体的纯化
实施例3中收集的原始BFD1、突变蛋白V8的菌体,用25mL磷酸钾缓冲液重悬,冰浴超声破菌,离心收集上清,利用Ni2+层析柱对上述表达的突变体进行亲和层析纯化,用咪唑洗脱后经脱盐柱脱盐,纯化后的蛋白保存在磷酸钾缓冲液中备用。
实施例7甲醛转化生成1,3-二羟基丙酮的反应
用磷酸钾缓冲液将实施例6中纯化后的原始BFD1和突变体V8的蛋白浓度稀释至15mg/mL。在反应体系中先取一定体积的纯酶,然后加入等量的甲醛溶液(600mM甲醛,1mMTPP,50mM K2HPO4和KH2PO4,5mM MgSO4,pH 7.4)),30℃反应1h。反应结束后,取一定体积的反应液加入等体积的乙腈终止反应,离心过0.22μm滤膜,进行HPLC检测,HPLC检测条件:色谱柱:Aminex HPX-87H,300mm×7.8mm(Bio-Rad);流动相:50%0.005M H2SO4溶液,50%H2O;紫外吸收波长:210nm;流速:0.5mL/min;柱温:65℃;进样量:5μL。
HPLC检测结果如图1所示,经分析可知,原始BFD1和突变体V8可以催化甲醛生成1,3-二羟基丙酮。
经过计算得出,原始BFD1和突变体V8催化甲醛产生1,3-二羟基丙酮的转化率如下表8所示。
表8原始BFD1及突变体V8催化甲醛产生1,3-二羟基丙酮的转化率
Figure BDA0002688501510000161
实施例8碱金属氢氧化物及碱土金属氢氧化物催化突变蛋白催化产生的1,3-二羟基丙酮到乳酸的转化
对实施例7中的反应溶液使用超滤管离心去除反应体系中的酶,17.5mL的溶液缓慢加入至17.5mL 2M NaOH或KOH溶液,室温下反应24h,反应结束后加入稀硫酸调节溶液的pH值到1.0-2.0之间。过0.22μm的有机滤膜,HPLC检测目标产物乳酸,HPLC检测条件:色谱柱:Aminex HPX-87H,300mm×7.8mm(Bio-Rad);流动相:0.010M H2SO4;示差检测器;流速:0.5mL/min;柱温:35℃;进样量:20μL。
HPLC检测结果如图2所示,经分析可知,碱金属氢氧化物(氢氧化钠、氢氧化钾)都可以进一步催化突变体V8催化甲醛产生的1,3-二羟基丙酮转化为乳酸。
对实施例7中的反应溶液使用超滤管离心去除反应体系中的酶,取17.5mL的溶液缓慢加入至17.5ml氢氧化钙(250mM)悬浊液中,室温下反应24h,反应结束后加入稀硫酸调节溶液的pH值到1.0-2.0之间。过0.22μm的有机滤膜,HPLC检测目标产物乳酸,HPLC检测条件:色谱柱:Aminex HPX-87H,300mm×7.8mm(Bio-Rad)流动相:50%0.005M H2SO4溶液,50%H2O,紫外吸收波长:210nm,流速:0.5mL/min,柱温:65℃,进样量:5μL。
HPLC检测结果如图3所示,经分析可知,碱土金属氢氧化物(氢氧化钙)可以进一步催化突变体V8催化甲醛产生的1,3-二羟基丙酮转化为乳酸。
经过计算从甲醛经过突变体V8,及碱金属氢氧化物(氢氧化钠、氢氧化钾)和碱土金属氢氧化物(氢氧化钙)催化产生的乳酸的转化率如下表9所示。
表9从甲醛到乳酸的转化率
Figure BDA0002688501510000171
实施例9对原始BFD1的野生型蛋白及其单个氨基酸位点突变体活性检测
对实施例1中筛选得到的氨基酸突变位点S26F、L43Q、F66L、R86C、T87A、G109S、A204V、H281Y、A322T、F397L、F397S、M460T、W463R、V467A、V473A、S525A设计引物并在原始BFD1的野生型蛋白(氨基酸序列为SEQ ID NO:23,核苷酸序列为SEQ ID NO:24)序列中进行单点突变,突变完成并测序成功后,对上述突变体进行划平板。
挑取上述突变体阳性菌及原始BFD1的野生型蛋白株共17株菌分别接种于5mL LB培养基中,37℃过夜培养,然后以1%(V/V)接种量接种于25mL LB培养基中,以37℃、200r/min培养。当OD600达到0.6时,加入0.1mM的IPTG,在30℃下诱导表达。诱导完成后,将上述培养的突变体菌体分别收集到离心管中,然后用磷酸钾缓冲液重悬并清洗菌体。离心后-80℃冰箱保存上述菌体。
取出菌体,磷酸钾缓冲液重悬,冰浴超声破菌,离心收集上清。取50μL上清液与50μL 50mM甲醛溶液混合,于30℃反应3h,反应完成后,取出90μL反应溶液加入60μL的工具酶缓冲液1,然后加入50μL的工具酶缓冲液2,在吸收光410nm条件下检测20min。计算原始BFD1的野生型蛋白及突变体全细胞酶活力,突变体酶活力相对于原始BFD1的野生型蛋白的百分比如下表所示(以原始BFD1的野生型蛋白酶活力为100%)。
表10突变体名称及对应突变氨基酸及在50mM甲醛浓度下活性
Figure BDA0002688501510000181
Figure BDA0002688501510000191
实施例10甲醛转化突变蛋白的结构分析
本发明解析了突变体V8的晶体结构(PDB ID:6M2Y),并通过结构分析得出组合突变H281Y和S26F形成了派派相互作用(图4),这对包含H281Y和S26F突变的甲醛转化突变蛋白活性的提高有很大的帮助。
以上,对本发明的实施方式进行了说明。但是,本发明不限定于上述实施方式。凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
SEQUENCE LISTING
<110> 中国科学院天津工业生物技术研究所
<120> 甲醛转化突变蛋白及其应用
<130> CPCN20111183
<150> 2020101134418
<151> 2020-02-24
<160> 24
<170> PatentIn version 3.3
<210> 1
<211> 528
<212> PRT
<213> 人工序列
<400> 1
Met Ala Ser Val His Gly Thr Thr Tyr Glu Leu Leu Arg Arg Gln Gly
1 5 10 15
Ile Asp Thr Val Phe Gly Asn Pro Gly Ser Asn Glu Leu Pro Phe Leu
20 25 30
Lys Asp Phe Pro Glu Asp Phe Arg Tyr Ile Leu Ala Leu Gln Glu Ala
35 40 45
Cys Val Val Gly Ile Ala Asp Gly Tyr Ala Gln Ala Ser Arg Lys Pro
50 55 60
Ala Phe Ile Asn Leu His Ser Ala Ala Gly Thr Gly Asn Ala Met Gly
65 70 75 80
Ala Leu Ser Asn Ala Arg Thr Ser His Ser Pro Leu Ile Val Thr Ala
85 90 95
Gly Gln Gln Thr Arg Ala Met Ile Gly Val Glu Ala Gly Glu Thr Asn
100 105 110
Val Asp Ala Ala Asn Leu Pro Arg Pro Leu Val Lys Trp Ser Tyr Glu
115 120 125
Pro Ala Ser Ala Ala Glu Val Pro His Ala Met Ser Arg Ala Ile His
130 135 140
Met Ala Ser Met Ala Pro Gln Gly Pro Val Tyr Leu Ser Val Pro Tyr
145 150 155 160
Asp Asp Trp Asp Lys Asp Ala Asp Pro Gln Ser His His Leu Phe Asp
165 170 175
Arg His Val Ser Ser Ser Val Arg Leu Asn Asp Gln Asp Leu Asp Ile
180 185 190
Leu Val Lys Ala Leu Asn Ser Ala Ser Asn Pro Ala Ile Val Leu Gly
195 200 205
Pro Asp Val Asp Ala Ala Asn Ala Asn Ala Asp Cys Val Met Leu Ala
210 215 220
Glu Arg Leu Lys Ala Pro Val Trp Val Ala Pro Ser Ala Pro Arg Cys
225 230 235 240
Pro Phe Pro Thr Arg His Pro Cys Phe Arg Gly Leu Met Pro Ala Gly
245 250 255
Ile Ala Ala Ile Ser Gln Leu Leu Glu Gly His Asp Val Val Leu Val
260 265 270
Ile Gly Ala Pro Val Phe Arg Tyr His Gln Tyr Asp Pro Gly Gln Tyr
275 280 285
Leu Lys Pro Gly Thr Arg Leu Ile Ser Val Thr Cys Asp Pro Leu Glu
290 295 300
Ala Ala Arg Ala Pro Met Gly Asp Ala Ile Val Ala Asp Ile Gly Ala
305 310 315 320
Met Ala Ser Ala Leu Ala Asn Leu Val Glu Glu Ser Ser Arg Gln Leu
325 330 335
Pro Thr Ala Ala Pro Glu Pro Ala Lys Val Asp Gln Asp Ala Gly Arg
340 345 350
Leu His Pro Glu Thr Val Phe Asp Thr Leu Asn Asp Met Ala Pro Glu
355 360 365
Asn Ala Ile Tyr Leu Asn Glu Ser Thr Ser Thr Thr Ala Gln Met Trp
370 375 380
Gln Arg Leu Asn Met Arg Asn Pro Gly Ser Tyr Tyr Phe Cys Ala Ala
385 390 395 400
Gly Gly Leu Gly Phe Ala Leu Pro Ala Ala Ile Gly Val Gln Leu Ala
405 410 415
Glu Pro Glu Arg Gln Val Ile Ala Val Ile Gly Asp Gly Ser Ala Asn
420 425 430
Tyr Ser Ile Ser Ala Leu Trp Thr Ala Ala Gln Tyr Asn Ile Pro Thr
435 440 445
Ile Phe Val Ile Met Asn Asn Gly Thr Tyr Gly Met Leu Arg Trp Phe
450 455 460
Ala Gly Val Leu Glu Ala Glu Asn Val Pro Gly Leu Asp Val Pro Gly
465 470 475 480
Ile Asp Phe Arg Ala Leu Ala Lys Gly Tyr Gly Val Gln Ala Leu Lys
485 490 495
Ala Asp Asn Leu Glu Gln Leu Lys Gly Ser Leu Gln Glu Ala Leu Ser
500 505 510
Ala Lys Gly Pro Val Leu Ile Glu Val Ser Thr Val Ser Pro Val Lys
515 520 525
<210> 2
<211> 1587
<212> DNA
<213> 人工序列
<400> 2
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttctaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
caccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 3
<211> 1587
<212> DNA
<213> 人工序列
<400> 3
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttctaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 4
<211> 1587
<212> DNA
<213> 人工序列
<400> 4
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttctaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgcttgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
caccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 5
<211> 1587
<212> DNA
<213> 人工序列
<400> 5
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 6
<211> 1587
<212> DNA
<213> 人工序列
<400> 6
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttctaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactacct ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 7
<211> 1587
<212> DNA
<213> 人工序列
<400> 7
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttctaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgctc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 8
<211> 1587
<212> DNA
<213> 人工序列
<400> 8
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatccagg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 9
<211> 1587
<212> DNA
<213> 人工序列
<400> 9
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctctcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 10
<211> 1587
<212> DNA
<213> 人工序列
<400> 10
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctagtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 11
<211> 1587
<212> DNA
<213> 人工序列
<400> 11
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ttatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 12
<211> 1587
<212> DNA
<213> 人工序列
<400> 12
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactc ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 13
<211> 1587
<212> DNA
<213> 人工序列
<400> 13
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgtcggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtccgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 14
<211> 1587
<212> DNA
<213> 人工序列
<400> 14
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgc tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 15
<211> 1587
<212> DNA
<213> 人工序列
<400> 15
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttctaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtgc ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atgacttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 16
<211> 1587
<212> DNA
<213> 人工序列
<400> 16
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctagtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgtcggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtccgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 17
<211> 1587
<212> DNA
<213> 人工序列
<400> 17
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctagtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactc ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 18
<211> 1587
<212> DNA
<213> 人工序列
<400> 18
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctggtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtacg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg ttgctccggt taaataa 1587
<210> 19
<211> 1587
<212> DNA
<213> 人工序列
<400> 19
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctagtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atgacttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactc ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 20
<211> 1587
<212> DNA
<213> 人工序列
<400> 20
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttttaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgctcgtac ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctagtgaa accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
taccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactc ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtatg 1380
ctgcgtcggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtccgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587
<210> 21
<211> 18
<212> DNA
<213> 人工序列
<400> 21
ccgcgcggca gccatatg 18
<210> 22
<211> 27
<212> DNA
<213> 人工序列
<400> 22
ggtggtggtg gtggtgctcg agttatt 27
<210> 23
<211> 528
<212> PRT
<213> 人工序列
<400> 23
Met Ala Ser Val His Gly Thr Thr Tyr Glu Leu Leu Arg Arg Gln Gly
1 5 10 15
Ile Asp Thr Val Phe Gly Asn Pro Gly Ser Asn Glu Leu Pro Phe Leu
20 25 30
Lys Asp Phe Pro Glu Asp Phe Arg Tyr Ile Leu Ala Leu Gln Glu Ala
35 40 45
Cys Val Val Gly Ile Ala Asp Gly Tyr Ala Gln Ala Ser Arg Lys Pro
50 55 60
Ala Phe Ile Asn Leu His Ser Ala Ala Gly Thr Gly Asn Ala Met Gly
65 70 75 80
Ala Leu Ser Asn Ala Trp Asn Ser His Ser Pro Leu Ile Val Thr Ala
85 90 95
Gly Gln Gln Thr Arg Ala Met Ile Gly Val Glu Ala Leu Leu Thr Asn
100 105 110
Val Asp Ala Ala Asn Leu Pro Arg Pro Leu Val Lys Trp Ser Tyr Glu
115 120 125
Pro Ala Ser Ala Ala Glu Val Pro His Ala Met Ser Arg Ala Ile His
130 135 140
Met Ala Ser Met Ala Pro Gln Gly Pro Val Tyr Leu Ser Val Pro Tyr
145 150 155 160
Asp Asp Trp Asp Lys Asp Ala Asp Pro Gln Ser His His Leu Phe Asp
165 170 175
Arg His Val Ser Ser Ser Val Arg Leu Asn Asp Gln Asp Leu Asp Ile
180 185 190
Leu Val Lys Ala Leu Asn Ser Ala Ser Asn Pro Ala Ile Val Leu Gly
195 200 205
Pro Asp Val Asp Ala Ala Asn Ala Asn Ala Asp Cys Val Met Leu Ala
210 215 220
Glu Arg Leu Lys Ala Pro Val Trp Val Ala Pro Ser Ala Pro Arg Cys
225 230 235 240
Pro Phe Pro Thr Arg His Pro Cys Phe Arg Gly Leu Met Pro Ala Gly
245 250 255
Ile Ala Ala Ile Ser Gln Leu Leu Glu Gly His Asp Val Val Leu Val
260 265 270
Ile Gly Ala Pro Val Phe Arg Tyr His Gln Tyr Asp Pro Gly Gln Tyr
275 280 285
Leu Lys Pro Gly Thr Arg Leu Ile Ser Val Thr Cys Asp Pro Leu Glu
290 295 300
Ala Ala Arg Ala Pro Met Gly Asp Ala Ile Val Ala Asp Ile Gly Ala
305 310 315 320
Met Ala Ser Ala Leu Ala Asn Leu Val Glu Glu Ser Ser Arg Gln Leu
325 330 335
Pro Thr Ala Ala Pro Glu Pro Ala Lys Val Asp Gln Asp Ala Gly Arg
340 345 350
Leu His Pro Glu Thr Val Phe Asp Thr Leu Asn Asp Met Ala Pro Glu
355 360 365
Asn Ala Ile Tyr Leu Asn Glu Ser Thr Ser Thr Thr Ala Gln Met Trp
370 375 380
Gln Arg Leu Asn Met Arg Asn Pro Gly Ser Tyr Tyr Phe Cys Ala Ala
385 390 395 400
Gly Gly Leu Gly Phe Ala Leu Pro Ala Ala Ile Gly Val Gln Leu Ala
405 410 415
Glu Pro Glu Arg Gln Val Ile Ala Val Ile Gly Asp Gly Ser Ala Asn
420 425 430
Tyr Ser Ile Ser Ala Leu Trp Thr Ala Ala Gln Tyr Asn Ile Pro Thr
435 440 445
Ile Phe Val Ile Met Asn Asn Gly Thr Tyr Gly Ala Leu Arg Trp Phe
450 455 460
Ala Gly Val Leu Glu Ala Glu Asn Val Pro Gly Leu Asp Val Pro Gly
465 470 475 480
Ile Asp Phe Arg Ala Leu Ala Lys Gly Tyr Gly Val Gln Ala Leu Lys
485 490 495
Ala Asp Asn Leu Glu Gln Leu Lys Gly Ser Leu Gln Glu Ala Leu Ser
500 505 510
Ala Lys Gly Pro Val Leu Ile Glu Val Ser Thr Val Ser Pro Val Lys
515 520 525
<210> 24
<211> 1587
<212> DNA
<213> 人工序列
<400> 24
atggcttctg ttcacggtac cacctacgaa ctgctgcgtc gtcagggtat cgacaccgtt 60
ttcggtaacc cgggttctaa cgaactgccg ttcctgaaag acttcccgga agacttccgt 120
tacatcctgg ctctgcagga agcttgcgtt gttggtatcg ctgacggtta cgctcaggct 180
tctcgtaaac cggctttcat caacctgcac tctgctgctg gtaccggtaa cgctatgggt 240
gctctgtcta acgcttggaa ctctcactct ccgctgatcg ttaccgctgg tcagcagacc 300
cgtgctatga tcggtgttga agctctgctg accaacgttg acgctgctaa cctgccgcgt 360
ccgctggtta aatggtctta cgaaccggct tctgctgctg aagttccgca cgctatgtct 420
cgtgctatcc acatggcttc tatggctccg cagggtccgg tttacctgtc tgttccgtac 480
gacgactggg acaaagacgc tgacccgcag tctcaccacc tgttcgaccg tcacgtttct 540
tcttctgttc gtctgaacga ccaggacctg gacatcctgg ttaaagctct gaactctgct 600
tctaacccgg ctatcgttct gggtccggac gttgacgctg ctaacgctaa cgctgactgc 660
gttatgctgg ctgaacgtct gaaagctccg gtttgggttg ctccgtctgc tccgcgttgc 720
ccgttcccga cccgtcaccc gtgcttccgt ggtctgatgc cggctggtat cgctgctatc 780
tctcagctgc tggaaggtca cgacgttgtt ctggttatcg gtgctccggt tttccgttac 840
caccagtacg acccgggtca gtacctgaaa ccgggtaccc gtctgatctc tgttacctgc 900
gacccgctgg aagctgctcg tgctccgatg ggtgacgcta tcgttgctga catcggtgct 960
atggcttctg ctctggctaa cctggttgaa gaatcttctc gtcagctgcc gaccgctgct 1020
ccggaaccgg ctaaagttga ccaggacgct ggtcgtctgc acccggaaac cgttttcgac 1080
accctgaacg acatggctcc ggaaaacgct atctacctga acgaatctac ctctaccacc 1140
gctcagatgt ggcagcgtct gaacatgcgt aacccgggtt cttactactt ctgcgctgct 1200
ggtggtctgg gtttcgctct gccggctgct atcggtgttc agctggctga accggaacgt 1260
caggttatcg ctgttatcgg tgacggttct gctaactact ctatctctgc tctgtggacc 1320
gctgctcagt acaacatccc gaccatcttc gttatcatga acaacggtac ctacggtgct 1380
ctgcgttggt tcgctggtgt tctggaagct gaaaacgttc cgggtctgga cgttccgggt 1440
atcgacttcc gtgctctggc taaaggttac ggtgttcagg ctctgaaagc tgacaacctg 1500
gaacagctga aaggttctct gcaggaagct ctgtctgcta aaggtccggt tctgatcgaa 1560
gtttctaccg tttctccggt taaataa 1587

Claims (7)

1.一种甲醛转化突变蛋白,所述甲醛转化突变蛋白能催化甲醛合成1,3-二羟基丙酮,所述甲醛转化突变蛋白的氨基酸序列是在对应于SEQ ID NO:1的S26、L43、F66、R86、T87、G109、A204、H281、A322、F397、M460、W463、V467、V473、S525位中进行了如下表所示的单位点突变或多位点突变组合,其他氨基酸残基保持不变得到的序列:
Figure DEST_PATH_IMAGE001
2.一种多核苷酸,其特征在于,所述多核苷酸是编码权利要求1任一项所述甲醛转化突变蛋白的多核苷酸。
3.根据权利要求2所示的多核苷酸,其特征在于,所述多核苷酸的核苷酸序列如SEQ IDNO:3-20任一所示。
4.含有权利要求1所述甲醛转化突变蛋白的转基因细胞系或重组菌。
5.含有权利要求2或3所述多核苷酸的重组载体、表达盒、转基因细胞系或重组菌。
6.权利要求1所述甲醛转化突变蛋白、权利要求4所述转基因细胞系或重组菌或权利要求5所述重组载体、表达盒、转基因细胞系或重组菌在催化甲醛缩合成1,3-二羟基丙酮中的应用。
7.权利要求1所述甲醛转化突变蛋白、权利要求4所述转基因细胞系或重组菌或权利要求5所述重组载体、表达盒、转基因细胞系或重组菌分别和碱金属氢氧化物或碱土金属氢氧化物联用在催化甲醛生产乳酸中的应用。
CN202010983978.XA 2020-02-24 2020-09-17 甲醛转化突变蛋白及其应用 Active CN112852765B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202111161482.5A CN113832120B (zh) 2020-02-24 2020-09-17 甲醛转化突变蛋白及其应用
CN202180005890.3A CN114616327B (zh) 2020-02-24 2021-02-09 甲醛转化突变蛋白及其应用
PCT/CN2021/076379 WO2021169814A1 (zh) 2020-02-24 2021-02-09 甲醛转化突变蛋白及其应用

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202010113441 2020-02-24
CN2020101134418 2020-02-24

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN202111161482.5A Division CN113832120B (zh) 2020-02-24 2020-09-17 甲醛转化突变蛋白及其应用

Publications (2)

Publication Number Publication Date
CN112852765A CN112852765A (zh) 2021-05-28
CN112852765B true CN112852765B (zh) 2021-11-12

Family

ID=75995370

Family Applications (4)

Application Number Title Priority Date Filing Date
CN202111161482.5A Active CN113832120B (zh) 2020-02-24 2020-09-17 甲醛转化突变蛋白及其应用
CN202010983978.XA Active CN112852765B (zh) 2020-02-24 2020-09-17 甲醛转化突变蛋白及其应用
CN202010984037.8A Active CN112852766B (zh) 2020-02-24 2020-09-17 一种合成乳酸的方法
CN202180005890.3A Active CN114616327B (zh) 2020-02-24 2021-02-09 甲醛转化突变蛋白及其应用

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202111161482.5A Active CN113832120B (zh) 2020-02-24 2020-09-17 甲醛转化突变蛋白及其应用

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN202010984037.8A Active CN112852766B (zh) 2020-02-24 2020-09-17 一种合成乳酸的方法
CN202180005890.3A Active CN114616327B (zh) 2020-02-24 2021-02-09 甲醛转化突变蛋白及其应用

Country Status (2)

Country Link
CN (4) CN113832120B (zh)
WO (1) WO2021169814A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114591938B (zh) * 2022-04-07 2023-07-25 山东金城医药研究院有限公司 羧化酶突变体及其制备方法和应用
CN115109770B (zh) * 2022-06-30 2023-09-05 中国科学院天津工业生物技术研究所 苯甲醛裂解酶突变体及在制备1,4-二羟基-2-丁酮中的应用

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9123354D0 (en) * 1991-11-04 1991-12-18 Bp Chem Int Ltd Production of hydroxy carboxylic compounds
JP2007228927A (ja) * 2006-03-02 2007-09-13 Kaneka Corp グリコール酸の製造方法
AT503802B1 (de) * 2006-07-26 2008-01-15 Vtu Engineering Planungs Und B Verfahren zur herstellung von milchsäure bzw. eines salzes davon
WO2011137192A1 (en) * 2010-04-27 2011-11-03 The Regents Of The University Of California Production of 1,4-butanediol by recombinant microorganisms
CA2992794A1 (en) * 2015-07-21 2017-01-26 Radhakrishnan Mahadevan Methods and microorganisms for the production of 1,3-butanediol
CN105132400B (zh) * 2015-07-24 2018-10-12 中国科学院天津工业生物技术研究所 具有催化甲醛合成1,3-二羟基丙酮功能的酶及其制备方法
CN105777523B (zh) * 2016-04-07 2018-05-25 农业部环境保护科研监测所 一种温和条件下由糖类制备乳酸的方法
WO2018038667A1 (en) * 2016-08-25 2018-03-01 Medivir Ab Respiratory syncytial virus inhibitors
KR102591904B1 (ko) * 2016-11-24 2023-10-20 토프쉐 에이/에스 글리콜산 및/또는 글리콜레이트의 생성 방법 및 시스템
CN108118037B (zh) * 2016-11-28 2021-08-31 青岛蔚蓝生物集团有限公司 一种耐热性提高的葡萄糖氧化酶突变体
CN106916794B (zh) * 2017-02-22 2019-10-11 中国科学院天津工业生物技术研究所 催化甲醛合成羟基乙醛的酶及其应用
CN107699536B (zh) * 2017-11-27 2021-02-05 南京工业大学 一种基因工程菌及其在生产d-1,2,4-丁三醇中的应用
CN110551701B (zh) * 2018-05-31 2022-08-05 中国科学院天津工业生物技术研究所 羰基还原酶突变体及其在环戊二酮类化合物还原中的应用

Also Published As

Publication number Publication date
CN113832120A (zh) 2021-12-24
CN114616327B (zh) 2024-03-22
CN112852765A (zh) 2021-05-28
CN114616327A (zh) 2022-06-10
CN112852766A (zh) 2021-05-28
CN112852766B (zh) 2022-03-25
WO2021169814A1 (zh) 2021-09-02
CN113832120B (zh) 2024-04-26

Similar Documents

Publication Publication Date Title
CN108467857B (zh) Pet水解酶突变体及其应用
CN109593750B (zh) 一种腈水合酶突变体、含该突变体的基因工程菌及其应用
CN112852765B (zh) 甲醛转化突变蛋白及其应用
CN109504645B (zh) 异亮氨酸双加氧酶、突变体及在合成4-羟基异亮氨酸中的应用
CN109825538A (zh) 一种手性2-氨基-1-丁醇的合成方法
CN109468291B (zh) 一种羰基还原酶EbSDR8突变体及其构建方法和应用
CN113462665B (zh) 一种7α-HSDH酶突变体及其编码基因和应用
CN109055324B (zh) 一种改进的酮还原酶及其应用
JP2020174686A (ja) 酵素を用いた4−アミノ桂皮酸の製造方法
CN108048494B (zh) 一种利用生物酶合成1,3-丙二醇的方法
CN110904088B (zh) 耐高温d-阿洛酮糖3-差向异构酶、突变体及其应用
CN110592035B (zh) 一种羰基还原酶的突变体、重组表达载体及其在生产手性醇中的应用
CN110331173B (zh) 苯丙酮酸脱羧酶突变体m538a在生物发酵生产苯乙醇中的应用
CN108004225B (zh) 一种成团泛菌来源的苯丙氨酸氨基变位酶的突变体
CN113122525B (zh) 一种甲醛转化蛋白及其应用
CN115896081A (zh) 天冬氨酸酶突变体及其应用
CN110846288B (zh) 一种谷胱甘肽双功能酶突变体及其应用
CN111057697B (zh) 耐高温TIM barrel蛋白突变体及其应用
CN114540318A (zh) 具有催化乙醇醛合成乙醇酸功能的酶及其应用
CN109182286B (zh) 一种改进的氰基还原酶及其在合成3-氯吡嗪-2甲胺中的应用
KR101564315B1 (ko) 신규 포름산 탈수소효소 및 이를 이용한 포름산의 생산방법
CN112322597A (zh) 一种羰基还原酶突变体及其应用
CN110804602A (zh) 一种L-天冬氨酸β-脱羧酶突变体及其应用
CN115786296B (zh) 一种内消旋-二氨基庚二酸脱氢酶突变体及生产方法
CN110747190B (zh) 一种马来酸水合酶突变体及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant