CN109312311A - 具有改善的活性的多肽和变体、其相关的材料和方法 - Google Patents

具有改善的活性的多肽和变体、其相关的材料和方法 Download PDF

Info

Publication number
CN109312311A
CN109312311A CN201780017903.2A CN201780017903A CN109312311A CN 109312311 A CN109312311 A CN 109312311A CN 201780017903 A CN201780017903 A CN 201780017903A CN 109312311 A CN109312311 A CN 109312311A
Authority
CN
China
Prior art keywords
ala
polypeptide
seq
leu
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780017903.2A
Other languages
English (en)
Inventor
A.L.博茨
A.福斯特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Invista Technologies SARL Switzerland
Invista Textiles UK Ltd
Original Assignee
Invista Textiles UK Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Invista Textiles UK Ltd filed Critical Invista Textiles UK Ltd
Publication of CN109312311A publication Critical patent/CN109312311A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C59/00Compounds having carboxyl groups bound to acyclic carbon atoms and containing any of the groups OH, O—metal, —CHO, keto, ether, groups, groups, or groups
    • C07C59/147Saturated compounds having only one carboxyl group and containing —CHO groups
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/64Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
    • C12P7/6409Fatty acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y102/00Oxidoreductases acting on the aldehyde or oxo group of donors (1.2)
    • C12Y102/99Oxidoreductases acting on the aldehyde or oxo group of donors (1.2) with other acceptors (1.2.99)
    • C12Y102/99006Carboxylate reductase (1.2.99.6)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Oil, Petroleum & Natural Gas (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本公开涉及具有羧酸还原酶(CAR)活性的多肽,包括催化它们不可逆还原羧酸,如庚二酸和己二酸至其各自的半醛的酶。已经将酶工程化改造成具有比相应的野生型酶更高的活性。本文中提供了新的多肽及与所述多肽相关的其用途。

Description

具有改善的活性的多肽和变体、其相关的材料和方法
交叉引用
本申请要求2016年3月17日提交的美国临时申请No.62/309,689的权益,其全部内容通过引用并入本文。
序列表
本申请包含序列表,其已经以ASCII格式电子提交,并且其在此通过引用完整并入。2017年3月13日创建的所述ASCII拷贝命名为12444_0652-00000_SL.txt,并且大小为87,964字节。
发明领域
本公开涉及具有羧酸还原酶(CAR)活性的多肽,包括催化其可逆还原羧酸,如庚二酸和己二酸至其各自的半醛的酶。已经将酶工程化改造成比相应的野生型酶具有更高的活性。
发明背景
羧酸还原酶(CAR)酶属于氧化还原酶家族,并且特别分类为EC 1.2.99.6。它们在功能上催化羧酸(例如己二酸,庚二酸)还原成其各自的醛和后来还原成醇。
基于序列同源性,每种已知的CAR酶(EC 1.2.99.6)由两个大的功能域组成,即N端腺苷酸/AMP/ATP结合域和C端NAD(P)-结合域,也称为还原酶域(图2)。AMP和NAD结合域包含磷酸泛酰巯基乙胺(phosphopantetheine)附着位点(PP-位点),其含有磷酸泛酰巯基乙胺辅因子,其在翻译后被磷酸泛酰巯基乙胺转移酶(pptase)添加。假定将羧酸催化成醛通过顺序催化机理发生,其中N端域通过形成初始酰基-AMP中间体来催化底物活化。然后,中间体与磷酸泛酰巯基乙胺辅因子的硫醇部分反应以产生共价键合的硫酯。磷酸泛酰巯基乙胺辅助因子充当摇摆至C端还原酶域的臂,其然后催化从酰基-AMP形成的中间体硫酯的还原以完成催化循环。通过BLAST对保守域结构的进一步分析确认N端大域分类成腺苷酸形成域(AFD)I类超家族,其包括磷酸泛酰巯基乙胺结合位点和属于NAD(P)H/NAD(P)(+)结合超家族的C端大域。
在生物合成制造尼龙中间体的背景下,CAR酶活性的要求鉴定为朝向生物合成途径末端的限速步骤。因此,选择CAR酶作为酶工程研究的候选物以改善其活性水平。
发明概述
在以下段落中汇总了本公开的某些实施方案。此列表仅仅例示而非穷尽由本公开提供的所有实施方案。
实施方案1.多肽,其包含SEQ ID NO:1的突变体,由SEQ ID NO:1的突变体组成或基本上由SEQ ID NO:1的突变体组成,其中所述多肽包含以下个别突变中的至少一种:
P369S/P/G/V、S284A/S/G/T、G380D/G/E、G619Y/G/F/L、K692R、A894G/A/V、A892G/A/V/S、P849P/G、A880V/A、C781V/C/A/S及其组合。
实施方案2.实施方案1的多肽,其中所述多肽包含SEQ ID NO:1的变体,由SEQ IDNO:1的变体组成或基本上由SEQ ID NO:1的变体组成,所述SEQ ID NO:1的变体选自以下变体:
P369S G380E G619L K692R(SEQ ID NO:10);
S284G P369V G619Y;
E220K S284A P369S G380E K692R;
P369S G380E G619L;
K692R P849G A892G A894V;
C781V A892G A894V;
K692R P849G A894G;
S284G P369V G619Y K692R P849G A892G A894V;
S284G P369V G619Y C781V A892G A894V;
S284G P369V G619Y K692R P849G A894G;
S284G P369V G619Y K692R;
S284A P369S G380E K692R P849G A892G A894V;
S284A P369S G380E C781VA892G A894V;
S284A P369S G380E K692R P849G A894G;
P369S G380E G619L K692R P849G A892G A894V;和
P369S G380E G619L C781V A892G A894V。
实施方案3.根据实施方案1和2中任一项的多肽,其包含序列,由序列组成或基本上由序列组成,所述序列与SEQ ID NO:1至少70%、至少80%、至少90%、至少95%或至少99%同源。
实施方案4.根据实施方案1和2中任一项的多肽,其包含序列,由序列组成或基本上由序列组成,所述序列与SEQ ID NO:1至少70%、至少80%、至少90%、至少95%或至少99%相同。
实施方案5.根据实施方案1的多肽,其包含SEQ ID NO:1的变体,由SEQ ID NO:1的变体组成或基本上由SEQ ID NO:1的变体组成,所述SEQ ID NO:1的变体选自:
S284A P369S G380E C781V A892G A894V;
P369S G380E G619L K692R P849G A892G A894V;
P369S G380E G619L C781V A892G A894V;和
P369S G380E G619L K692R。
实施方案6.根据实施方案1的多肽,其包含SEQ ID NO:1的P369S G380E G619LK692R变体,由SEQ ID NO:1的P369S G380E G619L K692R变体组成或基本上由SEQ ID NO:1的P369S G380E G619L K692R变体组成。
实施方案7.多肽,其包含SEQ ID NO:2的突变体,由SEQ ID NO:2的突变体组成或基本上由SEQ ID NO:2的突变体组成,其中所述多肽包含以下个别突变中的至少一种:
V331M/L、S284I、M334G/V、L336F、H337D/I/V、E338N、T371F、L379V、L383T/V、G386A、L448E/V、M452I/L、F453A、V474R,V476L、N481D、V491L、A494V、K495V、L520T、E516F/V、G579E/V、L590V、R591G、P592A/G、E596G、D607S、E622W/S,D647G/S、I683Q、I684V、A709H、P711D、T780N/S、P826V、E831I、P832Y、Q866V、G869T、L893V、A902I、L1086A);
及包含所述突变的2、3、4、5、6或7种的其组合。
实施方案8.多肽,其包含SEQ ID NO:2的变体,由SEQ ID NO:2的变体组成或基本上由SEQ ID NO:2的变体组成,所述SEQ ID NO:2的变体选自:
V331M L448E(SEQ ID NO:12);
V331M L448E E516V;
L448EM452I;
L448EV331M;
L448EE516F;
L448EE622W;
P369S G380E Q623L E696R;
V331M L448E E516V E831D;
E516F L448E M452I;和
E516F L520T。
实施方案9.根据实施方案7和8中任一项的多肽,其包含序列,由序列组成或基本上由序列组成,所述序列与SEQ ID NO:2至少70%、至少80%、至少90%、至少95%或至少99%同源。
实施方案10.根据实施方案7和8中任一项的多肽,其包含序列,由序列组成或基本上由序列组成,所述序列与SEQ ID NO:2至少70%、至少80%、至少90%、至少95%或至少99%相同。
实施方案11.根据实施方案7的多肽,其包含SEQ ID NO:2的变体,由SEQ ID NO:2的变体组成或基本上由SEQ ID NO:2的变体组成,所述SEQ ID NO:2的变体选自:
V331M L448E(SEQ ID NO:12);
V331M L448E E516V;和
E516F L520T。
实施方案12.根据实施方案7的多肽,其包含相对于SEQ ID NO:2的L590V、R591G、P592G、P592A或E596G突变中的一种或多种,由相对于SEQ ID NO:2的L590V、R591G、P592G、P592A或E596G突变中的一种或多种组成或基本上由相对于SEQ ID NO:2的L590V、R591G、P592G、P592A或E596G突变中的一种或多种组成。
实施方案13.根据实施方案7的多肽,其包含相对于SEQ ID NO:2的I683Q和I684V突变中的一种或多种,由相对于SEQ ID NO:2的I683Q和I684V突变中的一种或多种组成或基本上由相对于SEQ ID NO:2的I683Q和I684V突变中的一种或多种组成。
实施方案14.根据实施方案7的多肽,其包含相对于SEQ ID NO:2的P826V、E831I、或P832Y突变中的一种或多种,由相对于SEQ ID NO:2的P826V、E831I、或P832Y突变中的一种或多种组成或基本上由相对于SEQ ID NO:2的P826V、E831I、或P832Y突变中的一种或多种组成。
实施方案15.根据实施方案7的多肽,其包含SEQ ID NO:2的Q866V突变、V331ML448E变体;或V331M L448E E516V变体,由SEQ ID NO:2的Q866V突变、V331M L448E变体;或V331M L448E E516V变体组成或基本上由SEQ ID NO:2的Q866V突变、V331M L448E变体;或V331M L448E E516V变体组成。
实施方案16.具有分类为EC 1.2.99.6的羧酸还原酶活性的分子工程化多肽,其包含第一腺苷酸/ATP结合域、第二PP结合域和第三NADP域,其中所述多肽是分类为EC1.2.99.6的野生型羧酸还原酶的变体。
实施方案17.实施方案16的多肽,其中所述变体在以下中包含一种或多种氨基酸突变(i)所述羧酸还原酶的所述腺苷酸/ATP结合域中的一种或多种氨基酸残基;(ii)所述羧酸还原酶的所述NADP结合域中的一种或多种氨基酸残基;和/或所述羧酸还原酶的所述PP结合域中的一种或多种氨基酸残基处;优选在所述羧酸还原酶的所述腺苷酸/ATP结合域。
实施方案18.根据实施方案17的多肽,其中所述野生型羧酸还原酶是SEQ ID NO:1或2的多肽,并且其中:
(i)所述氨基酸突变包含SEQ ID NO:1的一种或多种以下区域中的突变:
所述腺苷酸/AMP/ATP结合(残基49至620);
所述PP结合域(残基627至694);
和所述NAD(P)结合域(残基750至1014);或
(ii)所述氨基酸突变包含SEQ ID NO:2的一种或多种以下区域中的突变:
所述腺苷酸/AMP/ATP结合域(残基49至620);
所述PP结合域(残基631至698);
所述NAD(P)结合域(残基758至1019)。
实施方案19.根据实施方案18的多肽,其中所述多肽在SEQ ID NO:2的一种或多种以下区域处包含一种或多种突变:
331-338(ATP/AMP活性位点区域1a);
370-386(ATP/AMP活性位点区域1b);
448-452(ATP/AMP活性位点区域1c);
516-520(ATP/AMP活性位点区域1d);和
590-596(ATP/AMP活性位点区域1e)。
实施方案20.根据实施方案18的多肽,其中所述多肽在SEQ ID NO:2的一种或多种以下区域处包含一种或多种突变:
826-832(NADP活性位点区域1a);和
866-869(NADP活性位点区域1b)。
实施方案21.根据实施方案18的多肽,其中所述突变选自涵盖L590V、R591G、P592G、P592A和E596G突变的所述腺苷酸/AMP/ATP结合域的区域。
实施方案22.根据实施方案18的多肽,其中所述突变选自涵盖I683Q和I684V突变的所述PP结合域的区域。
实施方案23.根据实施方案18的多肽,其中所述突变选自涵盖P826V、E831I和P832Y突变的所述NAD(P)域的区域。
实施方案24.根据实施方案18的多肽,其中所述突变选自涵盖Q866V突变的所述NAD(P)结合域的区域。
实施方案25.根据实施方案18-24中任一项的多肽,其中所述多肽的氨基酸序列与SEQ ID NO:1的氨基酸序列至少70%、至少80%、至少90%、至少95%或至少99%相同。
实施方案26.根据实施方案18-24中任一项的多肽,其中所述多肽的氨基酸序列具有与SEQ ID NO:2的氨基酸序列至少70%、至少80%、至少90%、至少95%或至少99%的序列同一性。
实施方案27.用于改善多肽的羧酸还原酶活性的方法,其包括:
获得具有羧酸还原酶活性的野生型多肽;
改变所述野生型多肽中的一种或多种氨基酸残基,并从而产生具有改善的羧酸还原酶活性的改善的多肽。
实施方案28.根据实施方案27的方法,其中所述野生型多肽具有ATP结合域、PP结合域和NADP域,并且其中所述改变包括这些域之一种或多种中,优选在所述野生型多肽的所述ATP结合域中的一种或多种氨基酸残基的变化。
实施方案29.根据实施方案28的方法,其中所述野生型多肽是分类为EC 1.2.99.6的酶,优选为SEQ ID NO:1或SEQ ID NO:2的酶。
实施方案30.根据实施方案29的方法,其还包括改变所述ATP结合位点周围的所述ATP结合域区域中的一种或多种氨基酸残基。
实施方案31.根据实施方案27-30中任一项的方法,其中所述改变是或包含SEQ IDNO:2的V331M、L448E和E516V突变中的一种或多种。
实施方案32.根据实施方案27-30中任一项的方法,其中所述改变是或包含SEQ IDNO:2的V331M和L448E突变中的一种或多种。
实施方案33.实施方案27-30中任一项的方法,其中所述野生型羧酸还原酶是SEQID NO:1或2的多肽,并且其中所述改善的多肽包含:
(i)SEQ ID NO:1的以下一种或多种区域中的突变:
所述腺苷酸/AMP/ATP结合(残基49至620);
所述PP结合域(残基627至694);
和所述NAD(P)结合域(残基750至1014);或
(ii)SEQ ID NO:2的以下一种或多种区域中的突变:
所述腺苷酸/AMP/ATP结合域(残基49至620);
所述PP结合域(残基631至698);
所述NAD(P)结合域(残基758至1019)。
实施方案34.根据实施方案33的方法,其中所述多肽在SEQ ID NO:2的一种或多种以下区域处具有一种或多种突变:
331-338(ATP/AMP活性位点区域1a);
370-386(ATP/AMP活性位点区域1b);
448-452(ATP/AMP活性位点区域1c);
516-520(ATP/AMP活性位点区域1d);和
590-596(ATP/AMP活性位点区域1e)。
实施方案35.实施方案27-30中任一项的方法,其中所述野生型羧酸还原酶是SEQID NO:2的多肽,并且其中所述改善的多肽在SEQ ID NO:2的以下一种或多种区域处包含一种或多种突变:
826-832(NADP活性位点区域1a);和
866-869(NADP活性位点区域1b)。
实施方案36.根据实施方案27-30中任一项的方法,其中所述改善的多肽包含SEQID NO:2的三重突变体V331M L448E E516V或四重突变体V331M L448E E516V E831D,由SEQID NO:2的三重突变体V331M L448E E516V或四重突变体V331M L448E E516V E831D组成或基本上由SEQ ID NO:2的三重突变体V331M L448E E516V或四重突变体V331M L448E E516VE831D组成。
实施方案37.根据实施方案27-30中任一项的方法,其中所述改善的多肽包含SEQID NO:2的以下个别突变中的至少一种,由SEQ ID NO:2的以下个别突变中的至少一种组成或基本上由SEQ ID NO:2的以下个别突变中的至少一种组成:
V331M/L、S284I、M334G/V、L336F、H337D/I/V、E338N、T371F、L379V、L383T/V、G386A、L448E/V、M452I/L、F453A、V474R/G、V476L、N481D、V491L、A494V、K495V、L520T、E516F/V、E574D、G579E/V、L590V、R591G、P592A/G、E596G、L602G、D607S、E622W/S、K635W、D647G/S、I683Q、I684V、A709H、P711D、A737N、T780N/S/L、G781D、P826V、E831I、P832Y、Q866V、G869T、L893V、A902I、L1086A及其组合。
实施方案38.根据实施方案27-30中任一项的方法,其中所述改善的多肽包含SEQID NO:2的变体,由SEQ ID NO:2的变体组成或基本上由SEQ ID NO:2的变体组成,所述SEQID NO:2的变体选自:
L448EM452I;
L448EV331M;
L448EE516F;
L448EE622W;
P369S G380E Q623L E696R;
V331M L448E E516V;
V331M L448E E516V E831D;
E516F L448E M452I;
E516F L520T;和
V331M L448E。
实施方案39.根据实施方案27-30中任一项的方法,其中所述改善的多肽包含SEQID NO:2的变体,由SEQ ID NO:2的变体组成或基本上由SEQ ID NO:2的变体组成,所述SEQID NO:2的变体选自:
V331M L448E(SEQ ID NO:12);
V331M L448E E516V;和
E516F L520T。
实施方案40.根据实施方案27-30中任一项的方法,其中所述改善的多肽包含变体,由变体组成或基本上由变体组成,所述变体具有SEQ ID NO:2的L590V、R591G、P592G、P592A或E596G突变中的一种或多种。
实施方案41.根据实施方案27-30中任一项的方法,其中所述改善的多肽包含变体,由变体组成或基本上由变体组成,所述变体具有SEQ ID NO:2的I163Q和I684V突变之一或两者。
实施方案42.根据实施方案27-30中任一项的方法,其中所述改善的多肽包含变体,由变体组成或基本上由变体组成,所述变体具有SEQ ID NO:2的P826V、E831I或P832Y突变中的一种或多种。
实施方案43.根据实施方案27-30中任一项的方法,其中所述改善的多肽包含变体,由变体组成或基本上由变体组成,所述变体具有SEQ ID NO:2的Q866V突变。
实施方案44.根据实施方案1-43中任一项的任一种多肽的改善的多肽或其功能衍生物。
实施方案45.根据实施方案1-43中任一项的任一种多肽的改善的多肽或其功能衍生物,其中相对于所述野生型多肽,所述改善的多肽的羧酸还原酶活性增加至少5%、至少10%、至少10%、至少20%、至少50%、至少100%、至少200%、至少300%、至少400%或至少500%。
实施方案46.根据实施方案1-43中任一项的任一种多肽的改善的多肽或其功能衍生物,其中相对于野生型多肽,所述改善的多肽的羧酸还原酶活性增加10%至250%,优选100%至200%。
实施方案47.根据实施方案45和46中任一项的改善的多肽,其中使用庚二酸和/或己二酸作为底物测量所述羧酸还原酶活性。
实施方案48.根据实施方案45和46中任一项所述的改善的多肽,其中所述多肽能够以比分类为EC 1.2.99.6的天然存在的羧酸还原酶的km小的km将至少一种底物转化为至少一种产物。
实施方案49.根据实施方案45和46中任一项的改善的多肽,其中所述多肽能够以比分类为EC 1.2.99.6的天然存在的羧酸还原酶的kcat(s-1)大的kcat(s-1)将至少一种底物转化为至少一种产物。
实施方案50.根据实施方案45和46中任一项所述的改善的多肽,其中所述多肽能够以大于0.005的kcat(s-1)将至少一种底物转化为至少一种产物。
实施方案51.根据实施方案45和46中任一项的改善的多肽,其中所述改善的多肽能够分别将庚二酸和己二酸转化为庚二酸半醛和己二酸半醛,并且其中所述多肽具有比分类为EC 1.2.99.6的天然存在的羧酸还原酶的kcat(s-1)大的kcat(s-1),任选地其中kcat(s-1)通过辅因子转化(NADPH、NADH和ATP)方法或酸消除或醛积累的测量来确定。
实施方案52.根据实施方案45-51中任一项所述的改善的多肽,其中所述多肽包含至少一种参与所述ATP结合域的活性位点的底物。
实施方案53.根据实施方案52所述的改善的多肽,其中所述底物是庚二酸或己二酸或其衍生物。
实施方案54.核酸构建体或载体,其包含编码具有羧酸还原酶活性的多肽的多核苷酸,其中所述多核苷酸与指导所述多肽产生的一种或多种异源控制序列可操作地连接,并且其中所述具有羧酸还原酶活性的多肽选自:
(a)与SEQ ID NO:1的多肽具有至少70%序列同一性的多肽;
(b)与SEQ ID NO:2的多肽具有至少70%序列同一性的多肽;和
(c)根据实施方案1-24和44-53中任一项的多肽。
实施方案55.核酸分子,其编码实施方案1-26和44-53中任一项的多肽。
实施方案56.载体,其包含实施方案55的核酸分子,任选地表达载体。
实施方案57.用根据实施方案54和56中任一项的载体转化或转导的代谢工程化微生物或宿主细胞。
实施方案58.实施方案57的宿主细胞,其中宿主细胞是原核生物。
实施方案59.实施方案58的宿主细胞,其中所述原核生物是埃希氏菌属(Escherichia);梭菌属(Clostridia);棒状杆菌属(Corynebacteria);贪铜菌属(Cupriavidus);假单胞菌属(Pseudomonas);代尔夫特菌属(Delftia);芽孢杆菌属(Bacillus);乳杆菌属(Lactobacillus);乳球菌属(Lactococcus);和红球菌属(Rhodococcus),或真核生物,选自曲霉属(Aspergillus)、酵母属(Saccharomyces)、毕赤酵母属(Pichia)、耶氏酵母属(Yarrowia)、伊萨酵母属(Issatchenkia)、德巴利酵母属(Debaryomyces)、Arxula和克鲁维酵母属(Kluyveromyces)。
实施方案60.实施方案57的代谢工程化微生物,其中所述微生物选自酵母、真菌、丝状真菌、藻和细菌。
实施方案61.实施方案60的代谢工程化微生物,其中所述细菌选自:埃希氏菌属,如大肠杆菌(Escherichia coli);细菌属梭菌属,如杨氏梭菌(Clostridiumljungdahlii),自产乙醇梭菌(Clostridium autoethanogenum)或克鲁佛梭菌(Clostridium kluyveri);细菌属棒状杆菌属如谷氨酸棒状杆菌(Corynebacteriumglutamicum);细菌属棒状杆菌属,如钩虫贪铜菌(Cupriavidus necator)或耐金属贪铜菌(Cupriavidus metallidurans);细菌属假单胞菌属,例如荧光假单胞菌(Pseudomonasfluorescens),恶臭假单胞菌(Pseudomonas putida)或食油假单胞菌(Pseudomonasoleavorans);细菌属代尔夫特菌属,如食酸代尔夫特菌(Delftia acidovorans);细菌属芽孢杆菌属如枯草芽孢杆菌(Bacillus subtillis);来自细菌属乳杆菌属如德氏乳杆菌(Lactobacillus delbrueckii);或细菌属乳球菌如乳酸乳球菌(Lactococcus lactis)。
实施方案62.组合物,其包含根据实施方案1-26和44-53中任一项的多肽。
实施方案63.实施方案62的组合物,其还包含庚二酸、己二酸或两者。
实施方案64.生产庚二酸半醛的方法,其通过在存在根据实施方案1-26和44-53中任一项的多肽的情况下将庚二酸转化为庚二酸半醛来进行。
实施方案65.生产己二酸半醛的方法,其通过在存在根据实施方案1-26和44-53中任一项的多肽的情况下将己二酸转化为己二酸半醛来进行。
实施方案66.从庚二酸生产庚二酸半醛的方法,其包括步骤(i)在合适的培养基中培养实施方案57-59中任一项的宿主细胞;和(ii)回收庚二酸半醛。
实施方案67.从己二酸生产己二酸半醛的方法,其包括步骤(i)在合适的培养基中培养实施方案57-59中任一项的宿主细胞;和(ii)回收己二酸半醛。
实施方案68.融合蛋白,其包含根据实施方案1-26和44-53中任一项的多肽。
实施方案69.修饰微生物中的庚二醛半醛和/或己二酸半醛生物合成的方法,所述方法包括对所述微生物导入有效量的根据实施方案54和56中任一项的载体,从而修饰所述微生物中的庚二醛半醛和/或己二酸半醛。
实施方案70.组合物,其包含庚二酸和用于将所述庚二酸转化为庚二酸半醛的手段。
实施方案71.组合物,其包含己二酸和用于将所述己二酸转化为己二酸半醛的手段。
实施方案72.生产庚二酸半醛的方法,其包括:
将庚二酸酶促转化为庚二酸半醛的步骤;和
测量和/或收获由此生产的庚二酸半醛。
实施方案73.生产己二酸半醛的方法,其包括:
将己二酸酶促转化为己二酸半醛的步骤;和
测量和/或收获由此生产的己二酸半醛。
实施方案74.装置,其包括庚二酸和用于将所述庚二酸转化为庚二酸半醛的手段。
实施方案75.装置,包括己二酸和用于将所述己二酸转化为己二酸半醛的手段。
实施方案76.组合物,其包含庚二酸半醛和/或己二酸半醛和痕量的实施方案57的代谢工程化微生物或宿主细胞。
实施方案77.根据实施方案66和67中的任一项的方法生产的生物衍生的庚二酸半醛或者己二酸半醛,其中所述生物衍生的庚二酸半醛或己二酸半醛任选具有反映大气二氧化碳摄取来源的碳-12、碳-13和碳-14同位素比率。
实施方案78.产品,其包含从实施方案77的生物衍生的庚二酸半醛或己二酸半醛生产的化学品,其中所述产品包含尼龙中间体、聚酯、药物、生物燃料、香料或食品添加剂。
实施方案79.生物衍生的、基于生物的或发酵衍生的产品,其中所述产品包含:
i.组合物,所述组合物包含在存在实施方案1-26和44-53中任一项的多肽的情况下生产或从由根据实施方案1-26和44-53中任一项的多肽催化的反应产物生产的至少一种生物衍生的、基于生物的或发酵衍生的化合物,或其任何组合,
ii.生物衍生的、基于生物的或发酵衍生的聚合物,其包含i.的生物衍生的、基于生物的或发酵衍生的组合物或化合物,或其任何组合,
iii.生物衍生的、基于生物的或发酵衍生的树脂,其包含i.的生物衍生的、基于生物的或发酵衍生的化合物或生物衍生的、基于生物的或发酵衍生的组合物或其任何组合或ii.的生物衍生的、基于生物的或发酵衍生的聚合物或其任何组合,
iv.模塑物质,其通过模塑ii.的生物衍生的、基于生物的或发酵衍生的聚合物或iii.的生物衍生的、基于生物的或发酵衍生的树脂或其任何组合获得,
v.生物衍生的、基于生物的或发酵衍生的配制剂,其包含i.的生物衍生的、基于生物的或发酵衍生的组合物、i.的生物衍生的、基于生物的或发酵衍生的化合物、ii.的生物衍生的、基于生物的或发酵衍生的聚合物、iii.的生物衍生的、基于生物的或发酵衍生的树脂、或iv的生物衍生的、基于生物的或发酵衍生的模塑物质、或其任何组合,或
vi.生物衍生的、基于生物的或发酵衍生的半固体或非半固体流,其包含i.的生物衍生的、基于生物的或发酵衍生的组合物、i.的生物衍生的、基于生物的或发酵衍生的化合物、ii.的生物衍生的、基于生物的或发酵衍生的聚合物、iii.的生物衍生的、基于生物的或发酵衍生的树脂、v.的生物衍生的、基于生物的或发酵衍生的配制剂、或iv.的生物衍生的、基于生物的或发酵衍生的模塑物质、或其任何组合。
实施方案80.非天然存在的生物化学网络,其包含图1的至少一种底物、至少一种编码具有图1的至少一种酶的活性的多肽的外源核酸和图1的至少一种产物。
从本描述和附图看,本公开的这些和其它方面和实施方案将是显而易见的。
附图简述
本专利或申请文件包含至少一幅彩色附图。具有彩色附图的本专利或专利申请公开的副本将由美国专利商标局在请求和支付必要的费用后提供。
本领域技术人员将理解,下面描述的附图仅用于说明目的。附图不旨在以任何方式限制本教导的范围。
图1:提出的通过CAR将二羧酸(庚二酸和己二酸)催化还原成它们各自的醛。
图2:显示SrotCAR中阳性突变的相对分布的复合同源性模型。基于公共域内的表征结构独立生成三个主要域中的每个。
图3A和3B:天然SrugCAR(SEQ ID NO:1)和SrotCAR(SEQ ID NO:8)氨基酸序列的比对。S.rugCAR69公开为SEQ ID NO:10。
图4:SrotCAR点突变筛选,基于四个重复证明突变、Z因子和平均斜率。
发明详述
所有提及的参考文献都通过引用整体并入本文。
受益于前述描述和相关附图中呈现的教导,本公开所属领域的技术人员将想到本文所阐述的公开的许多修改和其他实施方案。因此,应当理解,本公开不限于所公开的具体实施方案,并且修改和其他实施方案旨在包括在所附权利要求书的范围内。尽管本文中采用了特定术语,但它们仅在一般性和描述性意义上而非出于限制目的使用。
单元、前缀和符号可以以其SI接受的形式表示。除非另有说明,否则核酸以5’至3’取向从左向右书写;氨基酸序列分别以氨基至羧基取向从左到右书写。数字范围包括定义范围的数字。氨基酸可以通过它们通常已知的三字母符号或由IUPAC-IUB生物化学命名委员会推荐的单字母符号表示。同样,核苷酸可以通过它们通常接受的单字母代码来提及。下面定义的术语通过参考整个说明书来更全面定义。
在本说明书和权利要求书中,使用氨基酸残基的常规单字母和三字母代码。为了便于参考,通过使用以下命名法本文描述的多肽:原始氨基酸:位置:取代的氨基酸(例如,V331M,其中V在氨基酸位置331处用M替换)。
定义
除非另外明确定义,否则本文使用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常理解的含义相同的含义。除非另有说明,否则本文采用或考虑的技术是本领域普通技术人员公知的标准方法。除非另有说明,本公开的实践将采用微生物学、组织培养、分子生物学、化学、生物化学和重组DNA技术的常规技术,其在本领域的技术范围内。材料、方法和实例仅是说明性的而非限制性的。以下以例示的方式呈现,并且不旨在限制本公开的范围。
在一些实施方案中,用于描述和要求保护本公开的某些实施方案的表示成分的量、性质如分子量、反应条件和结果等的数字应当理解为在某些情况下通过术语“约”修饰。在一些实施方案中,术语“约”用于指示值包括用于确定该值的装置或方法的平均值的标准偏差。在一些实施方案中,说明书中阐述的数值参数(权利要求以其整体并入其中)是近似值,其可以随具体实施方案试图获得的期望性质而变化。在一些实施方案中,数值参数应当根据报告的有效数字的数目并通过应用普通的舍入技术来解释。尽管阐述本公开的一些实施方案的宽范围的数值范围和参数是近似值,但具体实例中列出的数值尽可能精确地报告。在本公开的一些实施方案中呈现的数值可以含有必然源自它们各自的测试测量中发现的标准偏差的某些误差。本文中对数值范围的描述仅旨在充当单独提及落入范围内的每个单独值的简写方法。除非本文另有说明,否则将各个单独的值并入本说明书中,如同其在本文中单独叙述一样。
术语“保守修饰的变体”或“保守突变”适用于氨基酸和核酸序列两者。就特定的核酸序列而言,保守修饰的变体是指编码氨基酸序列的相同或保守修饰的变体的那些核酸。由于遗传密码的简并性,大量功能相同的核酸编码任何给定的蛋白质。例如,密码子GCA、GCC、GCG和GCU都编码氨基酸丙氨酸。因此,在密码子规定丙氨酸的每个位置处,密码子可以改变为所述的任何相应密码子而不改变编码的多肽。此类核酸变异是“沉默变异”并且代表一种保守修饰的变异。本文中编码多肽的每个核酸序列也描述了核酸的每种可能的沉默变异。普通技术人员将认识到核酸中的每个密码子(除AUG外,AUG通常是甲硫氨酸的唯一密码子;一个例外是红色微球菌(Micrococcus rubens),其中GTG是甲硫氨酸密码子(Ishizuka,et al.,(1993)J.Gen.Microbiol.139:425-32)可以经修饰以产生功能相同的分子。因此,编码本公开多肽的核酸的每个沉默变异隐含在每个描述的多肽序列中并且通过引用并入本文中。
就氨基酸序列而言,技术人员将认识到改变、添加或删除编码序列中的单个氨基酸或少量氨基酸的对核酸、肽、多肽或蛋白质序列的单独取代、缺失或添加在改变导致用化学上相似的氨基酸取代氨基酸时是“保守修饰的变体”。因此,可以如此改变任何数目的氨基酸残基。保守修饰的变体通常提供与衍生它们的未修饰多肽序列等同的生物活性。提供可能功能相似的氨基酸的保守取代表(在本文中也称为“等同氨基酸”)是本领域公知的。
术语“包含”、“具有”和“包括”是开放式连接动词。这些动词中的一种或多种的任何形式或时态也是开放式的。例如,“包含”、“具有”或“包括”一种或多种步骤的任何方法不限于仅拥有那一种或多种步骤,并且还可以覆盖其他未列出的步骤。类似地,“包含”、“具有”或“包括”一种或多种特征的任何组合物不限于仅拥有那一种或多种特征并且可以覆盖其他未列出的特征。除非本文另有说明或上下文另外明显矛盾,否则本文所述的所有方法可以以任何合适的顺序进行。就本文中的某些实施方案而言提供的任何和所有实例或示例性语言(例如,“诸如”)的使用仅旨在更好说明本公开,而不对以其它方式要求保护的本公开的范围构成限制。说明书中的任何语言不应解释为指示任何非要求保护的要素对于本公开的实践是必不可少的。
如本文所用,术语“生物衍生的”意指源自生物生物体或由生物生物体合成,并且可以认为是可再生资源,因为它可以由生物生物体产生。此类生物生物体,特别是本文公开的微生物生物体,可以利用原料或生物质,例如从农业、植物、细菌或动物来源获得的糖或碳水化合物。或者,生物生物体可以利用大气碳。如本文所用,术语“基于生物的”是指如上所述的产物,其全部或部分由本发明的生物衍生的化合物组成。基于生物或生物衍生的产品与石油衍生的产物形成对比,其中此类产品源自石油或石化原料或由石油或石油化学原料合成。
术语“由...组成”是指如本文所述的组合物、方法和其各自的组分,其排除在实施方案的描述中未叙述的任何要素。
如本文所用,“基本上由......组成”是指向对象多核苷酸或多肽包含另外的序列,其中另外的序列不会实质上影响所要求保护的多核苷酸或多肽序列的基本功能。就组合物而言,一般地,术语“基本上由......组成”是指给定实施方案所需要的那些要素,并且另外允许存在不会实质上影响本公开的该实施方案的基本且新颖或功能特征的要素。
“密码子优化”是以改善其表达、G/C含量、RNA二级结构和真核细胞中的翻译,而不改变其编码的氨基酸序列的方式修饰核苷酸序列的过程。采用改变的密码子选择通常来改变翻译效率和/或优化编码序列以在期望宿主中表达或优化异源序列中的密码子选择以在特定宿主中表达。可以使用商品还软件包,诸如可购自Wisconsin Genetics ComputerGroup的“Codon Preference”统计分析本公开的多核苷酸的编码区中的密码子选择。参见Devereaux,et al.,(1984)Nucleic Acids Res.12:387-395)或MacVector 4.1(EastmanKodak Co.,New Haven,Conn.)。因此,本公开提供了至少一种本公开的多核苷酸的编码区的密码子选择频率特征。可以用于确定密码子选择频率的多核苷酸(每个氨基酸的3个核苷酸)的数目可以是3至如本文提供的本公开的多核苷酸数目的任何整数。任选地,多核苷酸是全长序列。用于统计分析的示例性序列数目可以是至少1、5、10、20、50或100。
术语“衍生”包括术语“源自”、“获得”或“可获自”和“从......分离”。
“等同氨基酸”可以基于它们与它们被取代的氨基酸的结构同源性或可能产生的各种变体之间的生物活性的比较测试的结果来确定。作为非限制性实例,下面的列表汇总了经常可能在不导致相应变体的生物活性的显著修饰的情况下进行的可能的取代:
1)丙氨酸(A)、丝氨酸(S)、苏氨酸(T)、缬氨酸(V)、甘氨酸(G)和脯氨酸(P);
2)天冬氨酸(D),谷氨酸(E);
3)天冬酰胺(N),谷氨酰胺(Q);
4)精氨酸(R)、赖氨酸(K)、组氨酸(H);
5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V)和
6)苯丙氨酸(F)、酪氨酸(Y、色氨酸(W)。
还参见Creighton,Proteins,W.H.Freeman and Co.(1984)。
在进行此类变化/取代时,还可以考虑氨基酸的亲水指数。亲水氨基酸指数在赋予蛋白质以相互作用生物学功能中的重要性通常在本领域中是理解的(Kyte andDoolittle,(1982)J Mol Biol.157(1):105-32)。公认的是,氨基酸的相对亲水(hydropathic)特性促成所得蛋白质的二级结构,这继而限定蛋白质与其他分子,例如酶、底物、受体、DNA、抗体和抗原等的相互作用。
本领域已知某些氨基酸可以被具有相似的亲水指数或得分的其他氨基酸取代,并且仍然产生具有相似生物活性的蛋白质,即仍然获得生物学功能等同的蛋白质。每种氨基酸已经基于其疏水性和电荷特征而分配亲水指数(Kyte and Doolittle,同上)。这些是:异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9)和精氨酸(-4.5)。在进行此类改变时,优选其亲水指数在+2内的氨基酸的取代,特别优选在+1内的氨基酸的取代,甚至更特别优选在+0.5内的氨基酸的取代。
本领域还应当理解,可以基于亲水性有效进行相似氨基酸的取代。美国专利No.4,554,101叙述蛋白质的最大局部平均亲水性(如由其相邻氨基酸的亲水性决定)与蛋白质的生物学性质相关。
如美国专利No.4,554,101中所详述,对氨基酸残基赋予了以下亲水性值:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0.+0.1);谷氨酸(+3.0.+0.1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5.+0.1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。
在具体的实施方案中,在叙述的位置处用丙氨酸取代天然氨基酸。还包括编码变体蛋白或多肽的核酸序列。
酶分类(EC)编号:EC编号由国际生物化学和分子生物学联合会(IUBMB)的命名委员会建立,其描述可在万维网上的IUBMB酶命名法网站上获得。EC编号根据催化的反应对酶进行分类。
就多核苷酸或蛋白质而言,“内源”是指在宿主细胞中天然存在的多核苷酸或蛋白质。
如本文所用,“表达”是指基于基因的核酸序列产生多肽的过程。该过程包括转录和翻译两者。
如本文所用,“表达载体”是指包含DNA序列的DNA构建体,所述DNA序列与能够在合适的宿主中实现DNA表达的合适的控制序列可操作地连接。此类控制序列可以包括实现转录的启动子、控制转录的任选操纵子序列、编码mRNA上合适的核糖体结合位点的序列、增强子和控制转录和翻译终止的序列。
常规使用的“表达系统”的实例包括重组杆状病毒、慢病毒、原生动物(例如,真核寄生物蜥蜴利什曼原虫(Leishmania tarentolae))、微生物表达系统,包括基于酵母的(例如毕赤酵母(Pichia Pastoris)、酿酒酵母(Saccharomyces cerevisiae)、Yaerobialipolytica、多形汉逊酵母(Hansenula polymorpha)、曲霉(Aspergillus)和木霉(Trichoderma)真菌)和基于细菌的(例如大肠杆菌(E.Coli)、荧光假单胞菌(Pseudomonasfluorescens)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、巨大芽孢杆菌(Bacillus megaterium)、枯草芽孢杆菌(Bacillus Subtilis)、短杆菌属(Brevibacillus)、谷氨酸棒状杆菌(Corynebacterium glutamicum))、中国仓鼠卵巢(CHO)细胞、CHOK1SVNSO(Lonza)、BHK(幼仓鼠肾)、PerC.6或Per.C6(例如,Percivia,Crucell),不同的HEK 293品系、Expi293FTM细胞(Life Technologies)、GenScript的YeastHIGHTM技术(GenScript)、人神经元前体细胞系AGE1.HN(Probiogen)和其他哺乳动物细胞、植物(例如玉米、苜蓿和烟草)、昆虫细胞、禽蛋、藻类和转基因动物(例如小鼠、大鼠、山羊、绵羊、猪、牛)。这些各种系统的优点和缺点已在文献中综述,并为本领域普通技术人员所知。
如本文所用,术语多肽的“片段”是指全长多肽或蛋白质的较短部分,其大小范围为从四个氨基酸残基到整个氨基酸序列减去1个氨基酸残基。在本公开的某些实施方案中,片段是指多肽或蛋白质的域(例如,底物结合域或催化域)的完整氨基酸序列。
“基因”是指参与产生多肽的DNA区段,并且包括编码区之前和之后的区域以及各个编码区段(外显子)之间的居间序列(内含子)。
“宿主菌株”或“宿主细胞”是指表达载体或DNA构建体的合适宿主,其包含编码根据本发明的多肽的多核苷酸。具体地,宿主菌株可以是细菌细胞、哺乳动物细胞、昆虫细胞和其他克隆或“表达系统”。在本公开的一个实施方案中,“宿主细胞”是指从微生物菌株的细胞参见的细胞和原生质体。应当理解,此类术语不仅意指特定的主题细胞,而且意指此类细胞的后代。因为某些修饰可能由于突变或环境影响而在后代中发生,所以此类后代事实上可以与亲本细胞不同,但仍包括在如本文所用的术语“宿主细胞”的范围内。
就多核苷酸或蛋白质而言,“异源的”是指在宿主细胞中不天然存在的多核苷酸或蛋白质/多肽。在一些实施方案中,蛋白质是商业上重要的工业蛋白质。该术语旨在涵盖由天然存在的基因、突变基因和/或合成基因编码的蛋白质。“外源”多核苷酸或蛋白质可以与宿主细胞异源或同源。
与另一序列具有某种百分比(例如至少90%,91%,92%,93%,94%,95%,96%,97%,98%,或99%)“序列同一性”的多核苷酸或多肽意指当比对时,在比较两个序列时该百分比的碱基或氨基酸残基是相同的。当提及蛋白质使用序列同一性百分比时,认识到不相同的残基位置通常因保守氨基酸取代而不同,其中用氨基酸残基取代具有相似化学性质(例如电荷或疏水性)的其他氨基酸残基,因此不会改变分子的功能特性。当序列在保守取代方面不同时,可以向上调整序列同一性百分比以校正取代的保守性质,并且该过程导致例如,至少90%,91%,92%,93%,94%,95%,96%,97%,98%或99%的“序列同源性”。用于进行此类调节的手段是本领域技术人员公知的。通常,这涉及将保守替代评分为部分而非完全错配,从而增加百分比序列同一性。因此,例如,当对相同的氨基酸给予得分1并且对非保守取代给予得分零时,对保守取代给予0和1之间的得分。计算保守取代的评分,例如,根据Meyers and Miller,(1988)Computer Applic.Biol.Sci.4:11-17的算法,例如如程序PC/GENE(Intelligenetics,Mountain View,Calif.,USA)中执行。可以使用本领域已知的任何合适的软件程序,例如在CURRENT PROTOCOLS IN MOLECULAR BIOLOGY(F.M.Ausubel等(编)1987,增刊30,第7.7.18节)中描述的程序来确定此比对和百分比同源性或同一性。此类程序可以包括GCG Pileup程序、FASTA(Pearson et al.(1988)Proc.Natl,Acad.Sci USA85:2444-2448)和BLAST(BLAST Manual,Altschul et al.,Nat'l Cent.Biotechnol.Inf.,Natl Lib.Med.(NCIB NLM NIH),Bethesda,Md.,and Altschul et al.,(1997)NAR 25:3389-3402)。另一个比对程序是ALIGN Plus(Scientific and Educational Software,Pa.),使用默认参数。可以使用的另一个序列软件程序是序列软件包版本6.0(GeneticsComputer Group,University of Wisconsin,Madison,Wis.)中可用的TFASTA数据搜索程序。
在将核酸序列插入细胞的背景下,“导入”意指“转染”,或“转化”或“转导”,并且包括提及将核酸序列掺入真核或原核细胞中,其中可以将核酸序列掺入细胞的基因组(例如,染色体、质粒、质体或线粒体DNA),转化成自主复制子,或瞬时表达(例如,转染的mRNA)。
如本文所用,代谢工程化微生物是通过将遗传物质导入选择的宿主或亲本微生物,从而修饰或改变微生物的细胞生理学和生物化学产生的生物体。
如本文所用,“核苷酸序列”或“核酸序列”是指寡核苷酸序列或多核苷酸序列及其变体、同源物、片段和衍生物。核苷酸序列可以是基因组、合成或重组起源的,并且可以是双链或单链的,无论代表有义链还是反义链。如本文所用,术语“核苷酸序列”包括基因组DNA、cDNA、合成DNA和RNA。
术语“核酸”包括能够编码多肽的DNA、cDNA、RNA、异双链体和合成分子。RNA包括mRNA、RNA、RNAi、siRNA、cRNA和自催化RNA。核酸可以是单链或双链的,并且可以是化学修饰。术语“核酸”和“多核苷酸”可互换使用。因为遗传密码是简并的,所以可以使用超过一个密码子来编码特定的氨基酸,并且本组合物和方法包括编码特定氨基酸序列的核苷酸序列。核酸包含核苷酸序列,其通常包括含有A、G、C、T或U碱基的核苷酸。然而,核苷酸序列可以包括其他碱基,例如但不限于肌苷、甲基胞嘧啶、甲基肌苷、甲基腺苷和/或硫尿苷,但不限于此。
本领域技术人员将认识到,本公开所涵盖的核酸序列也通过在严格杂交条件下与编码示例的多肽的核酸序列杂交的能力来定义。当核酸的单链形式可以在适当的温度和溶液离子强度条件下与另一种核酸退火时,核酸可与另一种核酸序列杂交。杂交和洗涤条件是本领域公知的(Sambrook,et al.(Molecular cloning:a laboratory manual,ColdSpring Harbor Laboratory;第4版,2012)。在高度严格条件下的杂交意味着与温度和离子强度有关的条件以下述方式选择,使得它们允许在两个互补DNA片段之间维持杂交。仅仅在示例性基础上,为了定义上文描述的多核苷酸片段的目的,杂交步骤的高度严格条件有利地如下。
在两个步骤中进行DNA-DNA或DNA-RNA杂交:(1)在含有5X SSC(1X SSC对应于0.15M NaCl+0.015M柠檬酸钠的溶液)、50%甲酰胺、7%十二烷基硫酸钠(SDS)、10XDenhardt's、5%硫酸葡聚糖和1%鲑鱼精DNA的磷酸盐缓冲液(20mM,pH7.5)中在42℃预杂交3小时;(2)根据探针的长度在某个温度(即:长度为>100个核苷酸的探针为42℃)初步杂交20小时,然后在20℃下在2X SSC+2%SDS中两次20分钟清洗,在20℃下在0.1X SSC+0.1%SDS中一次20分钟清洗。对于长度>100个核苷酸的探针,最后一次清洗在0.1X SSC+0.1%SDS中在60℃下进行30分钟。根据Sambrook等人(Molecular cloning:a laboratorymanual,Cold Spring Harbor Laboratory;第3版,2001)描述的方法,本领域技术人员可以针对更长或更短的寡核苷酸调节上文对于限定大小的多核苷酸描述的高严格杂交条件。严格条件也可以通过添加去稳定剂如甲酰胺来实现。
术语“可操作地连接”及其变体是指不同化合物、分子或其它实体的组合之间,如但不限于:在突变体聚合酶和报告部分(例如荧光染料或纳米颗粒)之间;在核苷酸和报告部分(例如荧光染料)之间;或在启动子和编码序列之间(若它控制序列的转录)具有足够稳定性的化学融合或键合或缔合,以承受在所使用的核苷酸掺入方法中遇到的条件。
“启动子”是参与结合RNA聚合酶以启动基因转录的调节序列。启动子可以是诱导型启动子或组成性启动子。本文使用的示例性启动子是T7启动子,其是诱导型启动子。
当用于提及细胞、核酸、蛋白质或载体时,“重组”指细胞、核酸、蛋白质或载体已经通过引入“异源核酸”或蛋白质或天然核酸或蛋白质的改变而修饰,或细胞源自如此修饰的细胞。因此,例如,重组细胞表达在天然(非重组)形式的细胞中不存在的基因,或表达否则异常表达、表达不足或根本不表达的天然基因。
“选择标志物”是指能够在宿主中表达的基因,其允许容易地选择含有导入的核酸或载体的那些宿主。选择标志物的实例包括但不限于抗微生物剂(例如潮霉素、博来霉素或氯霉素)和/或向宿主细胞赋予代谢优势,如营养优势的基因。
“在转录控制下”是本领域中众所周知的术语,其指多核苷酸序列(通常为DNA序列)的转录依赖于其与有助于转录启动或促进转录的元件可操作地连接。
“在翻译控制下”是本领域中众所周知的术语,其指在mRNA形成后发生的调节过程。
如本文所用,“转化细胞”包括已经通过使用重组DNA技术转化或转导的细胞。转化通常通过将一个或多个核苷酸序列插入细胞而发生。插入的核苷酸序列可以是“异源核苷酸序列”,即是对于待转化的细胞非天然的序列,如融合蛋白。
如本文所用,提及细胞使用的“转化”、“稳定转化”、“转导”和“转基因”是指细胞指具有整合到其基因组中或作为多代维持的附加型质粒的非天然(例如,异源)核酸序列。
“变体”是指多肽和核酸两者。术语“变体”可以与术语“突变体”互换使用。变体包括分别在亲本序列的氨基酸或核苷酸序列中的一个或多个位置处的插入、取代、颠换(transversion)、截短和/或倒位。变体核酸可以包括与能够与本文呈现的核苷酸序列杂交的序列互补的序列。例如,变体序列与在严格条件(例如,50℃和0.2.X SSC(1XSSC=0.15MNaCl,0.015M柠檬酸钠,pH7.0))下能够与本文中呈现的核苷酸序列杂交的序列互补。更具体地,术语变体涵盖与能够在高严格条件(例如65℃和0.1XSSC)下与本文呈现的核苷酸序列杂交的序列互补的序列。
如本文所用,术语“载体”意图指能够转运已经与其连接的另一种核酸的核酸分子。一类载体是“质粒”,其是指可以连接另外的DNA区段的环状双链DNA环。另一类载体是病毒载体,其中另外的DNA片段可以连接到病毒基因组中。某些载体能够在其被引入的宿主细胞中自主复制(例如,具有细菌复制起点的细菌载体和附加体哺乳动物载体)。其它载体(例如,非附加体哺乳动物载体)可以在引入宿主细胞后整合到宿主细胞的基因组中,从而与宿主基因组一起复制。此外,某些载体能够指导它们可操作连接的基因的表达。此类载体在本文中称为“重组表达载体”(或简称为“表达载体”)。通常,重组DNA技术中利用的表达载体通常是质粒的形式。在本说明书中,“质粒”和“载体”可以互换使用,因为质粒是最常用的载体形式。然而,要求保护的实施方案旨在包括表达载体的此类其它形式,如发挥等同功能的病毒载体(例如,复制缺陷型逆转录病毒、腺病毒和腺伴随病毒)。载体还包括克隆载体、穿梭载体、质粒、噬菌体颗粒、盒等。
现在将详细参考各种公开的实施方案。
CAR酶
本公开提供了突变体或变体CAR酶,其在将羧酸(例如庚二酸和己二酸)还原成它们各自的醛时表现出改善的催化活性。图1。它还提供了包含一种或多种域中的一种或多种突变的工程化CAR酶文库,以及与其相关的材料和方法。
每种已知的CAR酶(EC 1.2.99.6)包含两个大的功能域,其是N端AMP结合域(也称为ATP/腺苷酸结合域)和C端NADP(H)结合域。这两个域包围磷酸泛酰巯基乙胺附着位点(PP位点),其含有磷酸泛酰巯基乙胺辅因子,其在翻译后被磷酸泛酰巯基乙胺转移酶(pptase)添加。实施例部分中提供了每个域所涵盖的氨基酸的更详细描述。
在本公开中,将单独或组合的这些CAR域中的每个突变,并且测定所得突变体的催化活性相对于其野生型对应物的催化活性的改善。首先,通过生物多样性筛选鉴定两种不同的活性CAR蛋白。随后,通过靶向序列诱变工程设计化改造每种。它们是来自Segniliparus rugosus的CAR酶(SrugCAR、SrCAR或SrugCAR-wt;EFV11917)和来自Segniliparus rotundus的CAR酶(SrotCAR,ADG99338)。先前至少尚未对后一种蛋白质分配任何功能,但在本文中分类为对庚二酸和己二酸具有活性的CAR酶。
CAR变体
相对于野生型对应物的催化活性,工程化改造两种CAR蛋白以改善其催化活性。这些是SrugCAR(SrCAR,或SrugCAR-wt;EFV11917,对于天然蛋白质为SEQ ID NO:1;对于天然核酸为SEQ ID NO:3;对于优化的核酸为SEQ ID NO:4;对于优化的蛋白质为SEQ ID NO:7)和新表征的SrotCAR(对于天然蛋白质为ADG99338SEQ ID NO:8;对于天然核酸为SEQ IDNO:5;对于优化的核酸为SEQ ID NO:6;对于优化的蛋白质序列为SEQ ID NO:2)。
对于本文中公开的SrugCAR酶,假设腺苷酸/AMP/ATP结合域由残基49至620涵盖。假设PP位点或域由残基627至694涵盖。并且,假设NAD(P)结合域由残基750至1014涵盖。
对于本文公开的SrotCAR酶,假设腺苷酸/AMP/ATP结合域由残基49至620涵盖。假设PP位点或域由残基631至698涵盖。并且,假设NAD(P)结合域由残基758至1019涵盖。
就突变体将羧酸如庚二酸和己二酸还原成它们各自的半醛的能力而言测量催化活性。可以使用本领域普通技术人员可用的任何其他方法来评估该催化活性。然而,出于本公开的目的,优选的方法是在本说明书的实施例部分中描述的方法。
本公开提供了创建本文公开的突变体和文库的各种方法。参见实施例部分。然而,既然本公开提供了许多感兴趣的突变体的实例,用于产生所公开的突变体的任何其他方法可以用于产生这些突变,其中许多方法是本领域公知的。
总共产生并筛选近10,000个SrotCAR变体和超过4100个SrugCAR变体。不切实际的是列出所有改善的变体,并且当存在有本公开中鉴定的许多变体时要特别关注它们中的每一个。也就是说,本领域普通技术人员将理解发明人拥有每个阳性变体,因为每个得到测试并且每个得到鉴定。
SrugCAR变种
在第一种情况下,基于与其他酶的序列同源性将腺苷酸结合域内的220个位置(亚文库SrugCAR 1.1.)、PP位点内的57个位置(亚文库SrugCAR 1.2.)和NAD(P)结合域内的127个位置(亚文库SrugCAR 1.3.)鉴定为用于工程化改造的靶物。在3,654个理论单点突变体中,筛选3,060个。
在一些实施方案中,变体SrugCAR酶具有约120-240%的野生型催化活性,并且选自具有单点突变的以下10种变体中的任一种:
腺苷酸/ATP/AMP结合域变体:P369V,S284D,G380D,G619Y
PP位点变体:K692R
NAD(P)结合域变体:A894G,A892G,P849G,A880V,C781V。
在一些实施方案(Srug CAR 2.1.文库)中,变体包含腺苷酸/AMP结合域的某些残基中的突变(P369V,S284A,G380D,G619Y)与PP位点的某些残基中的突变(K692R)杂交。在一些实施方案中,腺苷酸域中的突变选自分别用V、P、G、S;A、S、G、T;D、G、E;或Y、G、F、L中的任一种替换P369、S284、G380和G619残基的任一种。在一些实施方案中,将这些单突变体中的每个与K692的突变组合成K692R。在一些实施方案中,选择的变体拥有表1中描述的任何排列中的上述单突变的任何组合。
表1:允许突变的SrugCAR2.1重组文库
在一些实施方案(Srug CAR 2.2文库)中,变体包含PP位点(K692R)和NAD(P)结合域的某些残基(A894G,A892G,P849G,A880V或C781V)两者中的突变。见表2。
在一些实施方案中,NAD(P)结合域中的突变选自分别用GAV;GAVS;PG;VA;或VCAS中任一种替换A894,A892,P849,A880,C781残基的任一种。
在一些实施方案中,将这些单突变体中的每个与K692的突变组合成K692R。在一些实施方案中,变体拥有任何排列中的上述单突变的任何组合。
表2允许突变的SrugCAR2.2重组文库
在一些实施方案中,变体选自以下SrugCAR突变体:
SrugCAR-31:S284G P369V G619Y
SrugCAR-51:E220K S284A P369S G380E K692R
SrugCAR-52:P369S G380E G619L
SrugCAR-48:K692R P849G A892G A894V
SrugCAR-41:C781V A892G A894V
SrugCAR-54:K692R P849G A894G
SrugCAR-55:K692R。
在一些实施方案中,变体包含在这两种重组文库间的多种突变组合:
SrugCAR-50:S284G P369V G619Y K692R P849G A892G A894V
SrugCAR-56:S284G P369V G619Y C781V A892G A894V
SrugCAR-58:S284G P369V G619Y K692R P849G A894G
SrugCAR-59:S284G P369V G619Y K692R
SrugCAR-60:S284A P369S G380E K692R P849G A892G A894V
SrugCAR-61:S284A P369S G380E C781V A892G A894V
SrugCAR-63:S284AP369S G380E K692R P849G A894G
SrugCAR-65:P369S G380E G619L K692R P849G A892G A894V
SrugCAR-66:P369S G380E G619L C781V A892G A894V
SrugCAR-69:P369S G380E G619L K692R。
在一些实施方案中,变体选自SrugCAR-61、SrugCAR-65、SrugCAR-66和SrugCAR-69。
在一些实施方案中,变体选自SrugCAR-65、SrugCAR-66和SrugCAR-69。
在一些实施方案中,变体选自SrugCAR-69(对于蛋白质序列为SEQ ID NO:10;对于核酸序列为SEQ ID NO:9)、四重突变体P369S-G380E-G619L-K692R。
Srot CAR变体
将来自Segniliparus rotundus的新鉴定的CAR酶(SrotCAR;SEQ ID NO:2)工程化改造以改善催化活性和表达。本节中的所有突变均涉及SEQ ID NO:2的变型。然而,本公开预期若将相同的突变引入SEQ ID NO:8的天然SrotCAR(其仅在一个位置上与SEQ ID NO:2不同,即S1148而不是L1148),则那些突变也将导致改善的CAR蛋白质。因此,可以通过向SEQID NO:8中引入本公开对SEQ ID NO:2建议的任何相同突变获得的SEQ ID NO:8的所有变体也落入本公开和权利要求书的范围内。因此,本公开清楚地显示发明人拥有这些另外的实施方案中的每一个,即使出于实际原因,它们没有明确地和单独地列举。
在一个实施方案中,将四重SrugCAR-69突变体P369S G380E G619L K692R的相应突变转移至密码子优化的SrotCAR(核酸序列为SEQ ID NO:6,并且氨基酸序列为SEQ IDNO:2)。在这两种酶的序列比对后(图3A和3B),SrotCAR中的相应突变鉴定为P369S-G380E-Q623L-E696R。
此外,腺苷酸化域内的220个位置、PP域内的57个位置和还原酶/NAD(P)结合域内的127个位置鉴定为用于工程化改造的靶物。这对应于404个位置处的3,489种可能的突变。
在一个实施方案中,使用庚二酸和己二酸作为底物筛选4416种不同的克隆。在一个实施方案中,变体可以选自任何最有活性的一级变体(单点,相对于SEQ ID NO:2),如下
V331M/L,S284I,M334G/V,L336F,H337D/I/V,E338N,T371F,L379V,L383T/V,G386A,L448E/V,M452I/L,F453A,V474R,V476L,N481D,V491L,A494V,K495V,L520T,E516F/V,G579E/V,L590V,R591G,P592A/G,E596G,D607S,E622W/S,D647G/S,I683Q,I684V,A709H,P711D,T780N/S,P826V,E831I,P832Y,Q866V,G869T,L893V,A902I,L1086A。
在另一个实施方案中,变体选自下述变体:
E516F/V,L448E/V,M452I,I684V,V331M,和E831I。
在另一个实施方案中,变体选自:E516F,L448E,和M452I。
在一个实施方案中,变体是E622S或E622W。在一个实施方案中,变体是S284I。在一个实施方案中,变体是T371F。
在另一个实施方案中,变体选自:T371F,L379V,L383V,L383T,和G386A。
在另一个实施方案中,变体选自F453A,V474R,V474G,V476L,N481D,V491L,A494V,K495V。在另一个实施方案中,变体是G579E.在另一个实施方案中,变体选自E622W/S,D647S,和D647G。在另一个实施方案中,变体是T780S。
在一个实施方案中,变体是E516F。在一个实施方案中,变体是E516V。
在另一个实施方案中,变体选自:S284I,V331M,M334V,H337I,E622W/S,I684V,和G869T。
在一个实施方案中,变体选自涵盖以下的热点:V331M,V331L,M334V,M334G,L336F,H337I,H337V,H337D,和E338N。
在一个实施方案中,变体选自涵盖以下的热点:L448E,L448V,M452I,和M452L。
在另一个实施方案中,变体选自包含以下的热点:E516F,E516V和L520T。
在另一个实施方案中,变体选自涵盖以下的热点:L590V,R591G,P592G,P592A,和E596G。
在另一个实施方案中,变体选自涵盖以下的热点:I683Q和I684V。
在另一个实施方案中,变体选自涵盖以下的热点:P826V,E831I,和P832Y。
在另一个实施方案中,变体选自涵盖以下的热点:Q866V。
在另一个实施方案中,变体选自以下:
L448E-M452I(具有超过一个突变的突变体也可以称为“L448M452I”变体,即没有分开多个突变的短划线)
E516F-L520T
L448E-V331M
L448E-E516F
L448E-E622W。
在一个实施方案中,变体是L448E。在另一个实施方案中,变体是V331M-L448E-E516V。在另一个实施方案中,变体是V331M-L448E-E516V-E831D。
在另一个实施方案中,变体选自:E516F-L448E-M452和E516F-L520T。
在一个实施方案中,变体是V331M-L448E(对于蛋白质序列为SEQ ID NO:12;对于核酸序列为SEQ ID NO:11)。
SrotCAR的AMP结合域中的进一步突变:
鉴定出几个热点位置(即,富含导致改善的酶活性的突变的区域)和显示对己二酸和庚二酸的活性增加的个别变体。大多数这些位置在AMP/腺苷酸结合域内。它们似乎在ATP的结合位点周围聚簇。不受任何理论的束缚,似乎羧酸底物活化和转移至磷酸泛硫醚残基是限速步骤。但也可能是ATP或底物的结合或转移反应是限速的。
在一个实施方案中,CAR突变体包含ATP结合位点周围的ATP结合域区域中的一种或多种残基中的突变。这些残基包含SEQ ID NO:2的以下氨基酸:
331-338(ATP/AMP活性位点区域1a)
370-386(ATP/AMP活性位点区域1b)
448-452(ATP/AMP活性位点区域1c)
516-520(ATP/AMP活性位点区域1d)
590-596(ATP/AMP活性位点区域1e)
PP位点中的进一步突变
一些实施方案提供了在PP位点中具有突变的CAR酶。一些实施方案包含涵盖SEQID NO:2的氨基酸683-684的PP结合区中的突变。
NAD(P)结合域中的进一步突变
一些实施方案提供相对于SEQ ID NO:2在NAD(P)结合域的以下区域中具有突变的CAR酶:
826-832(NADP活性位点区域1a)
866-869(NADP活性位点区域1b)。在一个实施方案中,相对于野生型多肽的活性,改善的多肽具有至少5%,至少10%,至少20%,至少50%,至少100%,至少200%,至少300%,至少400%或至少500%的羧酸还原酶活性的增加。在一个实施方案中,该活性是比活性。在该上下文中,“比活性”是针对表达水平调节的酶活性。
根据本发明的另一个方面,提供了由本公开的核酸分子编码的分离的多肽(包括突变蛋白、等位变体、片段、衍生物和类似物)。在一个实施方案中,分离的多肽包含对应于如本文公开的多肽序列的多肽序列。在本发明的备选实施方案中,分离的多肽包含与本文公开的多肽序列至少85%相同的多肽序列。优选地,本公开的分离的多肽与本文中公开的多肽序列具有至少50%,60,70%,80%,85%,90%,95%,98%,98.1%,98.2%,98.3%,98.4%,98.5%,98.6%,98.7%,98.8%,98.9%,99%,99.1%,99.2%,99.3%,99.4%,99.5%,99.6%,99.7%,99.8%,99.9%或甚至更高的同一性。
根据本公开的其他实施方案,提供了包含上述多肽序列的片段的分离的多肽。这些片段优选包含至少20个连续氨基酸,更优选至少25,30,35,40,45,50,60,70,80,90,100或甚至更多个连续氨基酸。
本公开的多肽还包括上述多肽序列和异源多肽之间的融合物。异源序列可以例如包括设计用于促进纯化的序列,例如组氨酸标签和/或促进重组表达蛋白的显现的序列。蛋白质融合物的其他非限制性实例包括允许在噬菌体或细胞表面上展示编码蛋白质的那些蛋白质融合物,与固有荧光蛋白质(例如绿色荧光蛋白质(GFP))的融合物以及与IgG Fc区域的融合物。
本公开还提供了能够结合来自一种或多种选定的物种和突变体的CAR的抗体。可以根据标准方法制备针对部分或整个选定CAR的多克隆或单克隆抗体。可以按照标准方案,根据Kohler和Milstein的一般方法制备单克隆抗体。在一个实施方案中,制备与CAR的选定表位起免疫特异性反应的抗体,所述选定表位区分它与其它酶。本发明的多克隆或单克隆抗体可以充当用于培养的细胞或组织中以及在完整生物体中蛋白质的存在和积累的灵敏性检测试剂。
还提供了突变体多肽的衍生物。在一个实施方案中,衍生物多肽是已经例如通过与其它化学部分缀合或复合,通过翻译后修饰(例如磷酸化,乙酰化等)、糖基化修饰(例如添加、除去或改变糖基化)、和/或额外的氨基酸序列的纳入/取代进一步改变的多肽,如本领域将理解的。
另外的氨基酸序列可以包括创建融合蛋白的融合配偶体氨基酸序列。举例来说,融合配偶体氨基酸序列可有助于分离的融合蛋白的检测和/或纯化。非限制性实例包括金属结合(例如多聚组氨酸)融合配偶体、麦芽糖结合蛋白(MBP)、蛋白A、谷胱甘肽S-转移酶(GST)、荧光蛋白序列(例如GFP)、表位标签如myc、FLAG、和血凝素标签。
实施方案考虑的其它衍生物包括但不限于对侧链的修饰、肽或蛋白质合成期间非天然氨基酸和/或其衍生物的掺入,使用交联剂,以及对多肽及其片段施加构象约束的其它方法。
本文公开的多肽的表达
在一个实施方案中,根据本公开的实施例部分中描述的方法表达多肽。根据一些其它实施方案,通过上文描述的方法产生的或通过本领域已知的任何备选方法产生的编码多肽的DNA序列可以以酶形式使用表达载体表达,所述表达载体通常包括编码启动子,操纵子,核糖体结合位点,翻译起始信号的控制序列,以及任选地阻遏物基因或各种激活物基因。对于启动子和宿主细胞的每种组合,有助于表达编码期望多肽的DNA序列的培养条件是可用的。达到期望的细胞密度或多肽的滴度后,停止培养,并使用已知方法回收多肽。或者,直接使用宿主细胞(例如,团粒,悬浮液),即在不分离重组蛋白的情况下。
如本文所述的携带编码多肽的DNA序列的重组表达载体可以是可以方便地进行重组DNA程序的任何载体,并且载体的选择通常取决于接受其导入的宿主细胞。因此,载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、噬菌体或染色体外元件、微染色体或人工染色体。或者,载体可以是当导入宿主细胞时整合到宿主细胞基因组中并与已经整合它的染色体一起复制的载体。
在载体中,DNA序列通常可操作地连接到合适的启动子序列。启动子可以是在选择的宿主细胞中显示转录活性,并且可以源自编码对于宿主细胞同源或异源的蛋白质的基因的任何DNA序列。用于指导如本文所述的编码多肽的DNA序列的转录(特别是在细菌宿主中)的合适启动子的实例是大肠杆菌的lac操纵子的启动子、天蓝色链霉菌(Streptomycescoelicolor)琼脂糖酶基因dagA启动子、解芳烃卡斯特兰尼氏菌的启动子等。为了在真菌宿主中进行转录,有用的启动子的实例是源自编码米曲霉TAKA淀粉酶、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性LDH、黑曲霉酸稳定LDH、黑曲霉葡糖淀粉酶、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶或构巢曲霉乙酰胺酶。可以基于期望的结果来选择启动子。核酸可与组成性、组织优选性、诱导型或其它启动子组合以在宿主细胞或生物体中表达。上述启动子列表并不意味是限制性的。在实施方案中可以使用任何合适的启动子。
在一些实施方案中,所描述的表达载体还可以包含合适的转录终止子,并且在真核生物中可操作地连接到编码如本文所述的多肽的DNA序列的多聚腺苷酸化序列。终止和多聚腺苷酸化序列可以适当地源自与启动子相同的来源或不然。
在一些实施方案中,载体可以进一步包含使载体能够在所讨论的宿主细胞中复制的DNA序列。此类序列的实例是质粒pUC19、pACYC177、pUB110、pE194、pAMB1和pJ702的复制起点。上述复制起点的列表并不意味是限制性的。在实施方案中可以使用任何合适的复制起点。
在一些实施方案中,载体还可以包含选择标志。选择标志基因用于选择经转化的细胞或组织,例如,其产物补足宿主细胞缺陷的基因,如来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性,如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的基因。此外,载体可以包含曲霉选择标志,如amdS、argB、niaD和sC,引起潮霉素抗性的标志物,或可以通过共转化完成选择。上述选择标志的列表并不意味是限制性的。可以在实施方案中使用任何选择标志基因。
用于上文描述的宿主细胞的合适的培养基和条件是本领域已知的。虽然胞内表达在一些方面可以是有利的,例如当使用某些细菌作为宿主细胞时,通常优选表达是胞外或周质的。
核酸
对于如本文公开的多肽及其氨基酸序列,技术人员可以确定编码那些多肽的合适的多核苷酸。本领域普通技术人员将容易理解,由于遗传密码的简并性,存在编码本文所述多肽的许多核苷酸序列。多核苷酸基因的序列可以通过使用遗传密码从多肽序列推导出来。诸如“BackTranslate”(GCGTMPackage,Acclerys,Inc.,San Diego,Calif.)的计算机程序可用于将肽序列转换成编码肽的相应核苷酸序列。此外,编码如本文所述的多肽的合成变体多核苷酸序列可以设计为使得它们将在任何细胞类型(原核或真核)中表达。
因此,一些实施方案涉及多核苷酸,所述多核苷酸包含编码如上文和本文其它地方所述的多肽的核酸序列或基本上由编码如上文和本文其它地方所述的多肽的核酸序列组成。在一些实施方案中,核酸序列是DNA序列(例如cDNA序列)。在其它实施方案中,核酸序列是RNA序列。在一些实施方案中,核酸是编码本文所述的任何多肽的cDNA。编码多肽的核苷酸序列可以通过本领域技术人员熟知的任何合适技术制备,包括但不限于重组DNA技术和化学合成。可以使用商品化的自动化多核苷酸合成仪制备合成多核苷酸。
一个方面涉及包含编码本文所述多肽的核酸序列或其生物活性部分的分离或重组的核酸分子,以及足以用作杂交探针以鉴定编码与本文所述多肽具有序列同源性的区域的核酸分子。作为编码多肽的这些核酸序列的片段的核酸分子也由实施方案涵盖。“片段”是指编码多肽的一部分的核酸序列的一部分。在一些实施方案中,核酸序列的片段可以编码多肽的生物活性部分,或者其可以是片段,该片段可以用作本领域普通技术人员熟知的方法的杂交探针或PCR引物。
在一些实施方案中,已经将核酸密码子优化用于本文所述的任何一种多肽的表达。
在其它实施方案中,核酸是探针,其可以是单链或双链寡核苷酸或多核苷酸,其被适当地标记以检测编码本文所述变体的多核苷酸的互补序列,如在阵列、Northern、或Southern印迹法中。用于检测与固定化核酸杂交的标记核酸的方法是本领域技术人员所熟知的。此类方法包括放射自显影法、化学发光、荧光和比色检测。
在一些实施方案中,多核苷酸包含编码与启动子序列可操作地连接的本文所述的任一种多肽的序列。本文中考虑如本领域已知的组成型或诱导性启动子。启动子可以是天然存在的启动子,或者组合超过一个启动子的元件的杂合启动子。启动子的非限制性实例包括SV40、巨细胞病毒(CMV)和HIV-1LTR启动子。
在一些实施方案中,多核苷酸包含与编码另一种蛋白质的序列可操作连接的编码本文所述的任何一种多肽的序列,所述另一种蛋白质可以是融合蛋白或通过接头分开的另一种蛋白质。在一些实施方案中,接头具有蛋白酶切割位点,如用于因子Xa或凝血酶,其允许相关蛋白酶部分消化本文所述的融合变体多肽,从而从其释放重组多肽。然后,可以通过例如随后的层析分离从融合配偶体中分离释放的多肽。在一些实施方案中,多核苷酸包含与启动子和融合蛋白两者可操作连接的编码本文所述的任何一种多肽的序列。
一些其它实施方案提供质粒、噬菌体、粘粒、酵母或细菌人工染色体形式的或包含质粒、噬菌体、酵母或细菌人工染色体的遗传组分的遗传构建体,如本领域中所熟知的。遗传构建体可适用于分离的核酸在细菌或其它宿主细胞中的维持和繁殖,用于通过本文所述的核酸或编码多肽的重组DNA技术和/或表达(表达载体)进行操作。
一些其它实施方案涉及包含编码本文所述的一种或多种多肽的DNA序列的重组表达载体。在一些实施方案中,表达载体包含与启动子可操作地连接的一个或多个所述DNA序列。合适地,表达载体包含与一个或多个另外的序列可操作连接的编码本文所述多肽之一的核酸。在一些实施方案中,表达载体可以是自我复制的染色体外载体,如质粒,或整合入宿主基因组中的载体。病毒表达载体的非限制性实例包括腺病毒载体、腺相关病毒载体、疱疹病毒载体、逆转录病毒载体、慢病毒载体等。例如,腺病毒载体可以是第一、第二、第三和/或第四代腺病毒载体或gutless腺病毒载体。腺病毒载体可以以非常高的感染性颗粒滴度产生,感染极其多种细胞,有效地将基因转移到不分裂的细胞,并且很少被整合到宿主基因组中,这避免了通过插入诱变的细胞转化的风险。载体可以进一步包括在多核苷酸侧翼的序列,产生包含与真核基因组序列或病毒基因组序列同源的序列的RNA。这将允许将本文所述的多核苷酸引入宿主细胞的基因组中。
整合型克隆载体可以在其要被整合到的宿主细胞的染色体中随机或在预定的靶基因座处整合。
表达载体的具体实施方案是本领域中公知的并且可以在本公开的其它地方找到(参见下文)。
在一些实施方案中,主题多核苷酸编码一种或多种本文所述的突变体多肽。在其他实施方案中,主题多核苷酸编码多肽,所述多肽的氨基酸序列与本文所述的任何一种突变体的氨基酸序列具有至少约85%,至少约90%,至少约95%,至少约98%,或至少约99%或更高的氨基酸序列同一性。
在一些实施方案中,多核苷酸编码具有本文所述突变之一的多肽。在其他实施方案中,多核苷酸编码具有两个或更多个本文所述突变的多肽。
实施方案还涵盖编码公开的多肽的相关物(relative)的核酸分子。编码多肽的核酸序列的“相关物”包括编码本文公开的多肽但由于遗传密码的简并性而保守不同的那些序列。可以通过使用众所周知的分子生物学技术(如聚合酶链式反应(PCR)和杂交技术)来鉴定随后通过培养形成的等位多肽,如下文概述。相关核酸序列还包括已经例如通过使用定点诱变产生但仍编码所公开的多肽的合成衍生的核酸序列。
本领域技术人员将进一步理解,可以通过核酸序列的突变引入变化,从而导致编码多肽的氨基酸序列的改变,而不改变这些蛋白质的生物活性。因此,可以通过将一个或多个核苷酸取代、核苷酸添加和/或核苷酸缺失引入本文公开的相应核酸序列中,使得将一个或多个氨基酸取代,氨基酸添加或氨基酸缺失引入编码的蛋白质中,来创建相关核酸分子。可以通过标准技术,如定点诱变和PCR介导的诱变引入突变。此类相关核酸序列也由本实施方案涵盖。
或者,可以通过沿编码序列的全部或部分随机引入突变,例如通过饱和诱变来制备变体核酸序列,并且可以对得到的突变体筛选赋予改善的活性或催化将己二酸和/或庚二酸还原成相应的醛中增加的比活性的能力以鉴定保留本文所述的多肽的改善的活性的突变体。诱变后,可以重组表达编码的蛋白质,并且可以使用标准测定技术(包括本文所述的那些技术)测定蛋白质的活性。
宿主细胞和生物体
可以使用建立的技术将主题核酸稳定或瞬时导入宿主/工程化细胞中,所述技术包括但不限于电穿孔、磷酸钙沉淀、脂质体介导的转染等。为了稳定转化,主题核酸通常还包括选择标志物,例如几种公知的选择标志物中的任一种,如新霉素抗性等。一些实施方案涉及宿主细胞,其包含编码如本文所述的多肽的外源DNA分子(即,在其它情况下在野生型对应细胞中不存在的分子)。在一些实施方案中,这些宿主细胞可以描述为表达系统。用于表达的合适宿主细胞可以是原核的或真核的。没有限制,合适的宿主细胞可以是哺乳动物细胞(例如HeLa、HEK293T、Jurkat细胞)、酵母细胞(例如酿酒酵母)、与或不与杆状病毒表达系统一起利用的昆虫细胞(例如Sf9,粉纹夜蛾(Trichoplusia ni)或细菌细胞,如大肠杆菌(Origami2(DE3),BL21(DE3))或痘苗病毒宿主。将遗传构建体引入宿主细胞(无论是原核的还是真核的)是本领域公知的,如例如Current Protocols in Molecular BiologyAusubel等编(John Wiley&Sons,Inc.目前更新2014年7月02日)中所述。
另一个实施方案涉及转化或转导的生物体或微生物(即,工程化生物体),如选自植物和昆虫细胞、细菌、酵母、杆状病毒、原生动物、线虫、藻类和转基因哺乳动物(例如,小鼠、大鼠、猪)的生物体。微生物包括来自古细菌、细菌和Eucarya域的原核和真核微生物物种,后者包括酵母和丝状真菌、原生动物、藻类或高等原生生物。术语“微生物细胞”和“微生物”可与术语微生物互换使用。转化的生物体包含实施方案的DNA分子、包含DNA分子的表达盒或包含所公开实施方案的表达盒的载体,其可以稳定掺入或不稳定掺入转化生物体的基因组中。其他合适的生物体还包括合成细胞或由合成基因组产生的细胞,如Venter et al.美国专利公开No.2007/0264688中所述,以及细胞样系统或合成细胞,如美国专利公开No.2007/0269862中所述。
在某些实施方案中,宿主是原核生物,选自埃希氏菌属(Escherichia);梭菌属(Clostridia);棒状杆菌属(Corynebacteria);贪铜菌属(Cupriavidus);假单胞菌属(Pseudomonas);代尔夫特菌属(Delftia);芽孢杆菌属(Bacillus);乳杆菌属(Lactobacillus);乳球菌属(Lactococcus);和红球菌属(Rhodococcus),或真核生物,选自曲霉属(Aspergillus)、酵母属(Saccharomyces)、毕赤酵母属(Pichia)、耶氏酵母属(Yarrowia)、伊萨酵母属(Issatchenkia)、德巴利酵母属(Debaryomyces)、Arxula和克鲁维酵母属(Kluyveromyces)。
在一些实施方案中,宿主微生物是原核生物。例如,原核生物可以来自埃希氏菌属,如大肠杆菌(Escherichia coli);来自细菌属梭菌属,如杨氏梭菌(Clostridiumljungdahlii),自产乙醇梭菌(Clostridium autoethanogenum)或克鲁佛梭菌(Clostridium kluyveri);来自细菌属棒状杆菌属如谷氨酸棒状杆菌(Corynebacteriumglutamicum);来自细菌属棒状杆菌属,如钩虫贪铜菌(Cupriavidus necator)或耐金属贪铜菌(Cupriavidus metallidurans);来自细菌属假单胞菌属,例如荧光假单胞菌(Pseudomonas fluorescens),恶臭假单胞菌(Pseudomonas putida)或食油假单胞菌(Pseudomonas oleavorans);来自细菌属代尔夫特菌属,如食酸代尔夫特菌(Delftiaacidovorans);来自细菌属芽孢杆菌属如枯草芽孢杆菌(Bacillus subtillis);来自细菌属乳杆菌属如德氏乳杆菌(Lactobacillus delbrueckii);或来自细菌属乳球菌如乳酸乳球菌(Lactococcus lactis)。
在一些实施方案中,宿主微生物是真核生物(例如真菌,如酵母)。例如,真核生物可以来自真菌属曲霉属(Aspergillus)诸如黑曲霉(Aspergillus niger);酵母属(Saccharomyces)诸如酿酒酵母(Saccharomyces cerevisiae);来自酵母属毕赤酵母属(Pichia)诸如巴斯德毕赤酵母(Pichia pastoris);来自酵母属耶氏酵母属(Yarrowia)诸如解脂耶氏酵母(Yarrowia lipolytica);来自酵母属伊萨酵母属(Issatchenkia)诸如东方伊萨酵母(Issathenkia orientalis);来自酵母属德巴利酵母属(Debaryomyces)诸如汉斯德巴利酵母(Debaryomyces hansenii);来自酵母属Arxula诸如Arxulaadenoinivorans;或来自酵母属克鲁维酵母属(Kluyveromyces)诸如乳酸克鲁维酵母。
酵母或真菌物种的示例性物种包括选自以下的任何物种:酵母菌目(Saccharomytatales),酵母菌科(Saccaromycetaceae),包括酵母属,克鲁维酵母属(Kluyveromyces)和毕赤酵母属;酵母菌目,Dipodascaceae,包括耶氏酵母属;酵母菌目,裂殖酵母科(Schizosaccaromycetaceae),包括裂殖酵母属(Schizosaccharomyces);散囊菌目(Eurotiales),发菌科(Trichocomaceae),包括曲霉属(Aspergillus);和毛霉目(Mucorales),毛霉科(Mucoraceae科),包括根霉属(Rhizopus)。宿主酵母或真菌的非限制性物种包括酿酒酵母,粟酒裂殖酵母(Schizosaccharomyces pombe)、乳酸克鲁维酵母(Kluyveromyces lactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)、土曲霉(Aspergillus terreus)、黑曲霉(Aspergillus niger)、巴斯德毕赤酵母(Pichiapastoris)、无根根霉(Rhizopus arrhizus)、米根霉(Rhizopus oryzae)、解脂耶氏酵母(Yarrowia lipolytica)等。大肠杆菌是特别有用的宿主生物,因为它是适用于遗传工程的充分表征的微生物。其他特别有用的宿主生物体包括酵母,例如酿酒酵母。应当理解,任何合适的微生物宿主生物体可以用于引入代谢和/或遗传修饰以产生期望的产物。
本公开的另一个实施方案包括制备重组基因的多肽的方法,其包括:a)提供这些宿主细胞/生物体的群体;b)在表达由本公开的编码序列编码的多肽的条件下培养细胞/生物体;c)分离所得多肽。
可以发酵宿主细胞以产生本文所述的突变体或催化由本文所述的CAR酶催化的反应。发酵广泛地指通过宿主细胞将有机物质转化为靶物质,例如,通过在包含碳源的培养基中繁殖重组宿主细胞的培养物,通过重组宿主细胞将碳源转化为脂肪酸或其衍生物。如本文所用,允许生产的条件是指允许宿主细胞产生期望产物,例如脂肪酸或脂肪酸衍生物的任何条件。类似地,表达载体的多核苷酸序列的条件是指允许宿主细胞合成多肽的任何条件。合适的条件包括例如发酵条件。发酵条件可以包括许多参数,包括但不限于温度范围、通气水平、进料速率和培养基组成。这些条件中的每种个别和组合允许宿主细胞生长。发酵可以是需氧的,厌氧的或其变型(例如微需氧)。示例性培养基包括肉汤或凝胶。通常,培养基包括可以直接由宿主细胞代谢的碳源。此外,酶可以在培养基中使用以促进动员(例如,淀粉或纤维素解聚成可发酵的糖)和随后的碳源代谢。对于小规模生产,可以将工程化宿主细胞在例如约100mL、500mL、1L、2L、5L或10L的批次中培养;发酵;并且诱导以表达期望的多核苷酸序列,诸如编码本公开的CAR多肽的多核苷酸序列。对于大规模生产,可以在约10L、100L、1000L、10,000L、100,000L、1,000,000L或更大的批次中培养工程化宿主细胞;发酵;并且诱导以表达期望的多核苷酸序列。或者,可以进行大规模补料分批发酵。
使用方法
本文中所述的多肽、核苷酸和细胞/生物体可用作生产多种产品(例如,合成的、芳香族的、脂肪族的和脂环族的醛和醇;尼龙中间体;以及生产聚酯、药品、生物燃料、香料和食品添加剂)的生物催化剂。此外,它们可用于生产特种化学品,所述特种化学品在其工艺中需要将ω-双官能(即-ω-二羧酸、ω-酯酸、ω-羟基酸、ω-氨基酸)、分支、或芳香族羧酸还原成它们各自的醛。羧酸的生物催化还原对于传统的化学催化是有吸引力的,至少因为底物是水溶性的,封闭化学不是必需的,还原是对映选择性的,并且反应的范围非常广泛。
本发明还提供了合成化学化合物的方法,例如用于将羧酸或其衍生物生物催化还原成其相应的醛产物的那些,以提供将羧酸或其衍生物生物催化还原成其相应的中间副产物,如酰基-AMP类似物例示的方法,或提供生物催化还原己二酸和庚二酸或其前体或衍生物的方法,均使用如本文提供的公开所述的重组CAR。
在一个实施方案中,本公开提供通过在一种或多种本公开多肽的存在下将庚二酸转化为庚二酸半醛来制备庚二酸半醛的方法。在一个实施方案中,本公开提供了通过在一种或多种本公开的多肽存在下将己二酸转化为己二酸半醛来制备己二酸半醛的方法。
此外,本文公开的多肽及其各自的不同域之每种可以用作合理设计具有改善的羧酸还原酶催化活性的蛋白质的构件。
生物制品
包含生物学产生的有机化合物,以及特别地使用本文公开的生物合成途径生物学生产的醛和醇的生物产品或生物衍生产品(例如,根据本公开生产的醛和醇)先前尚未从可再生资源生产,因此是物质的组合物。这些新的生物产品可以基于双重碳同位素指纹法或14C年代测定与源自石油化学碳的有机化合物区分开来。另外,生物来源的碳的特定来源(例如,葡萄糖对甘油)可以通过双重碳同位素指纹法来确定(参见例如美国专利No.7,169,588,其通过引用并入本文)。区分生物产品与基于石油的有机化合物的能力在商业中示踪这些材料中是有益的。例如,包含基于生物学的和基于石油的碳同位素概况两者的有机化合物或化学品可以与仅由基于石油的材料制成的有机化合物和化学品区分。因此,本文的生物产品可以基于其独特的碳同位素概况在商业中跟踪或示踪。通过比较每种燃料中的稳定碳同位素比(13C/12C),可以将生物产品与基于石油的有机化合物区分开来。给定生物产品中的(13C/12C)比率是固定二氧化碳时大气二氧化碳中(13C/12C)比率的结果。它还反映精确的代谢途径。也发生区域变化。石油、C3植物(阔叶)、C4植物(禾本科植物)和海洋碳酸盐均在(13C/12C)和相应的delta13C值中显示显著差异。此外,作为代谢途径的结果,C3和C4植物的脂质物质与源自相同植物的碳水化合物组分的物质不同分析。在测量精度内,13C显示由于同位素分级效应所致的大的变化,其中对生物产品最重要的是光合作用机制。植物中碳同位素比率差异的主要原因与植物中光合作用碳代谢途径的差异密切相关,特别是在初级羧基化(即大气CO2的初始固定)期间发生的反应。两大类植物是那些掺入C3(或Calvin-Benson)光合循环的植物和那些掺入C4(或Hatch-Slack)光合循环的植物。在C3植物中,初级CO2固定或羧基化反应涉及酶核酮糖-1,5-二磷酸羧化酶,并且第一种稳定的产物是3-碳化合物。C3植物如阔叶树材和松柏植物在温带气候区占主导地位。在C4植物中,涉及另一种酶,磷酸烯醇丙酮酸羧基化酶的另外的羧基化反应是主要的羧基化反应。第一种稳定的碳化合物是4-碳酸,其随后脱羧。由此释放的CO2通过C3循环再固定。C4植物的实例是热带禾本科植物、玉米和甘蔗。C4和C3植物都表现出一系列(13C/12C)同位素比率,但典型值对于C4植物为约-7至约-13/mil和对于C3植物为约-19至约-27/mil(参见例如Stuiver et al.,Radiocarbon 19:355(1977))。煤和石油通常落在后一范围内。13C测量标度最初由Pee DeeBelemnite(PDB)石灰石设置的零定义,其中值以与该材料的‰偏差给出。“delta13C”值以‰(每mil)表示,缩写为%o,并如下计算:
delta13C=[(13C/12C)样品-(13C/12C)标准品]/(13C/12C)标准品x 1000
由于PDB参考材料(RM)已经用尽,已经与IAEA、USGS、NIST和其他选定的国际同位素实验室合作开发了一系列替代RM。与PDB的每mil偏差的符号是delta13C。通过对质量44、45和46的分子离子的高精度稳定比质谱法(IRMS)对CO2进行测量。本文所述的组合物包括通过本文所述的任何方法产生的生物产品,包括例如醛和醇产品。具体地,生物产品可具有约-28或更大、约-27或更大、-20或更大、-18或更大、-15或更大、-13或更大、-10或更大、或-8或更大的delta13C。例如,生物产品可具有约-30至约-15、约-27至约-19、约-25至约-21、约-15至约-5、约-13至约-7、或约-13至约-10的delta13C。在其他情况下,生物产品可以具有约-10、-11、-12或-12.3的delta13C。也可以通过比较每种化合物中14C的量将生物产品(包括根据本文公开生产的生物产品)与基于石油的有机化合物区分开。由于14C的核半衰期为5730年,含有“较老”碳的基于石油的燃料可以与含有“较新”碳的生物产品区别开来(参见例如Currie,"Source Apportionment of Atmospheric Particles",Characterizationof Environmental Particles,J.Buffle and H.P.van Leeuwen,Eds.,1of Vol.I of theIUPAC Environmental Analytical Chemistry Series(Lewis Publishers,Inc.)3-74,(1992))。
放射性碳年代测定的基本假设是大气中14C浓度的恒定性导致活生物体中14C的恒定性。然而,由于自1950年以来的大气核试验以及自1850年以来燃烧化石燃料,14C已经获得了第二种地球化学时间特征。在20世纪60年代中期,在核试验的高峰期,它在大气CO2中的浓度以及活生物圈中的浓度大约倍增。此后,它逐渐恢复到约1.2x10-12的稳态宇宙成因(大气)基线同位素速率14C12C,具有7-10年的近似弛豫“半衰期”。(此后一种半衰期不必从字面上理解;相反,必须使用详细的大气核输入/衰减函数来追踪自核时代开始以来大气和生物圈14C的变化。)保持近期生物圈碳的年度年代测定的希望的正是此后一种生物圈14C时间特征。可以通过加速器质谱法(AMS)测量14C,结果以“现代碳的分数”(fM)为单位给出。fM由国家标准与技术研究院(NIST)标准参考物质(SRM)4990B和4990C定义。如本文所用,现代碳的分数(fM)具有与国家标准与技术研究院(NIST)标准参考物质(SRM)4990B和4990C(分别称为草酸标准物HOxI和HOxII)所定义的相同含义。基本定义涉及14C/12C同位素比HOxI(参考AD 1950)的0.95倍。这大致相当于经衰变校正的前工业革命木材。对于目前的活生物圈(植物材料),fM为约1.1。这大致相当于经衰变校正的前工业革命木材。对于目前的活生物圈(植物材料),fM为约1.1。
本文所述的组合物包含可以具有至少约1的fM 14C的生物产品。例如,本公开的生物产品可以具有至少约1.01的fM 14C、约1至约1.5的fM 14C、约1.04至约1.18fM 14C、或约1.111至约1.124的fM 14C。14C的另一种测量称为现代碳的百分比(pMC)。对于使用14C日期的考古学家或地质学家,AD 1950年等于“零岁龄”。这也代表100pMC。大气中的“炸弹碳”在热核武器顶峰时达到1963年正常水平的几乎两倍。自其出现以来已近似它在大气内的分布,显示自AD 1950以来活的植物和动物的值大于100pMC。随着时间的推移,它逐渐减少,今天的值接近107.5pMC。这意味着新鲜的生物质材料如玉米将给出接近107.5pMC的.sup.14C签名(signature)。基于石油的化合物将具有0的pMC值。将化石碳与现今的碳组合将导致目前pMC含量的稀释。通过假设107.5pMC代表现今生物质材料的14C含量并且0pMC代表基于石油的产品的14C含量,对该材料所测量的pMC值将反映两种组分类型的比例。例如,100%源自现今大豆的材料将给出接近107.5pMC的放射性碳签名。若该材料用基于石油的产品稀释50%,则它将给出约54pMC的放射性碳签名。通过指定等于107.5pMC的“100%”和等于0pMC的“0%”得到基于生物学的碳含量。例如,测量99pMC的样品将给出93%的等同的基于生物学的碳含量。此数值称为基于生物学的平均碳结果,并假设分析材料内的所有组分源自现今的生物材料或基于石油的材料。包含如本文所述的一种或多种脂肪醛或醇的生物产品可以具有至少约50,60,70,75,80,85,90,95,96,97,98,99或100的pMC。在其它情况下,本文所述的生物产品可以具有约50和约100;约60和约100;约70和约100;约80和约100;约85和约100;约87和约98;或约90和约95的pMC;在其他情况下,本文所述的生物产品可以具有约90,91,92,93,94或94.2的pMC。
组合物
一些实施方案涉及组合物,其包含单独或组合的一种或多种公开的多肽或核苷酸,包括与野生型CAR多肽组合。在一些实施方案中,组合物包含一种或多种具有改善的催化活性的多肽。在一些实施方案中,组合物包含一种或多种多肽,其在催化将己二酸和/或庚二酸还原成醛中具有增加的比活性。
在一些实施方案中,组合物可以由一种或多种公开的多肽组成,所述多肽来自(1)商业供应商;(2)表达所述多肽的克隆基因;(3)复合肉汤(complex broth)(诸如由培养基中微生物菌株或任何其他宿主细胞生长产生的肉汤,其中菌株/宿主细胞将所公开的多肽分泌到培养基中;(4)与在(3)中培养的菌株/宿主细胞的细胞裂解物;和/或(5)表达所公开多肽的任何其他宿主细胞材料。组合物中不同的公开多肽可以从不同来源获得。
在一些实施方案中,组合物包含己二酸和/或庚二酸和本文所述的一种或多种多肽。在其他实施方案中,这些组合物还包含野生型CAR多肽。
权利要求书中的所有权利要求通过引用整体并入本说明书作为另外的实施方案。
实施例
实施例1
从Segniliparus rugosus实施CAR的靶向诱变
在早期的实验工作中,来自Segniliparus rugosus的酶(SrugCAR、SrCAR、或SrugCAR-wt)看起来具有期望的活性(将羧酸还原为其各自的醛),尽管以对于实际应用不充分的水平。因此,将SrugCAR工程化改造为庚二酸和己二酸至其各自的醛的催化还原改善。
在大肠杆菌BL21(DE3)中优化天然的、加N-His标签的和加C-His标签的SrugCAR变体的表达,并且从M.Kalim Akhtara,b,Nicholas J.Turnerb,1,and Patrik R.Jonesa,Carboxylic acid reductase is a versatile enzyme for the conversion of fattyacids into fuels and chemical commodities PNAS,2013年1月2日,第110卷,第1:87期改编用于检测CAR活性的测定法。简言之,将细胞在补充有相关抗生素的ZYM-505培养基中培养,直至达到OD600 0.6-0.8。随后,用0.1 1mM IPTG诱导蛋白质表达,并将细胞在30℃培养过夜。收获后,将细胞在三个冷冻/融化循环中裂解,并在含有溶菌酶和核酸酶的50mMHepes pH 7.5,2mM MgCl2中重悬。对96孔板,将180μl 50mM HEPES pH 7,2mM庚二酸/己二酸,MgCl2.6H2O(10mM),ATP(1mM)和NADPH(0.5mM)添加至20μl无细胞提取物。随后,在340nm处通过将NADPH辅因子转化为NADP+在25℃用分光光度法监测催化反应。
实施例2
用来自Segniliparus rugosus的酶使用靶向诱变的第一文库的设计
从结构和同源性分析设计诱变文库。通过YASARA计算SrugCAR的模型以便能够补充基于序列的信息。在计算此结构模型时,仅仅8个X射线类似结构可用于模型计算,其显示相应域的低序列同一性(<55%)。由于没有可用的CAR酶的X射线结构,结构模型仅可以用于个别考虑每个域。
保守序列基序和域结构模型的组合分析允许以相当大的概率预测包含推定的活性位点和周围区域/表面的区域。使用这些可用的序列和结构指标作为诱变的简并引物的优选位点。
用于诱变的优选位点的鉴定允许工程化工作的第二步,即第一库的设计。基于如上文所述的序列和结构模型评估的结论,通过对跨越整个酶的突变的广泛筛选开始SrugCAR的工程化改造。选择总共404个位置进行诱变,所述位置覆盖大域和PP位点两者内的推定的底物结合位点的周围区域/表面。将在整个同源序列中具有非常高的保守性的位置(对于AMP/NAD(P)结合域>90%;对于PP位点>80%)排除以保留一般酶功能。
SrugCAR文库1中所有选定位置的氨基酸代表同源序列中每个位置处的分布。用于确定分布的基础是位置特异性迭代BLAST,具有四次迭代和1000个序列。这产生>500个序列,其显示相似的长度和最小约50%的序列同一性。表3中给出了关于SrugCAR文库1策略的概述信息。
表3:重组文库SrugCAR 1的概述设计
实施例3
用来自Segniliparus rugosus的CAR酶对第一文库筛选针对庚二酸/己二酸的较高活性
自3,654个SrugCAR-1的理论突变体,用代表选择位置处的鉴定分布的简并引物产生总共3,060个突变体。通过应用针对SrugCAR-wt酶优化的裂解和测定方案(实施例1)筛选总共(ATP/AMP域:1,140个突变体;PP位点:540个突变体;NAD(P)结合域:1,080个突变体)。结果,在此初步筛选中仅鉴定在标准测定条件下表明>50%增加NADPH吸光度的突变体。通过应用下述程序验证这些,所述程序包括在蛋白质水平(即,考马斯染色的SDS凝胶上的条带强度)上的SrugCAR的标准化(使用含有变性蛋白质的考马斯染色的聚丙烯酰胺凝胶,其密度在分离后获得)以消除可能由于与野生型相比突变体的不同表达水平而发生的任何假阳性。一组10个单突变体在庚二酸和己二酸的情况下显示增加的野生型活性,并进一步用于重组。它们是:P369V、S284A、G380D、AND G619Y(ATP/AMP结合域);K692R(PP-SITE);和A894G、A892G、P849G、A880V、和C781V(NAD(P)结合域)。
实施例4
用来自Segniliparus rugosus的酶得到的重组文库
现在将文库SrugCAR-1中鉴定的有益单突变重组,目的是进一步提高活性。为了增加成功重组的可能性,应当在每个位置处允许一组氨基酸,其包括新的、几个相似的和野生型的氨基酸。然而,在一个步骤中重组所有位置和取代将导致非常大的>73,000个突变体的文库,这在合理的筛选设置中难以管理。因此,决定通过组合不同域的突变逐步进行重组,每个域与PP位点组合,产生两个可以完全筛选的小文库(SrugCAR-2-1和SrugCAR-2-2)(表4)。
表4:重组文库SrugCAR 2-1和SrugCAR 2-2的概述设计
此时,重组文库SrugCAR-2-1和SrugCAR2-2的筛选在优化的测定条件下进行。测定的改善(将ATP浓度从1mM增加至5mM,将NADPH浓度从0.5mM增加至2mM并将酸浓度从2mM增加至20mM)提高了检测的灵敏度和准确度。
来自产生改善的活性的重组文库SrugCAR-2-1和SrugCAR2的以下突变如下:
SrugCAR-2-1
SrugCAR-31:S284G P369V G619Y
SrugCAR-51:E220K S284A P369S G380E K692R
SrugCAR-52:P369S G380E G619L
SrugCAR2-2:
SrugCAR-48:K692R P849G A892G A894V
SrugCAR-41:C781V A892G A894V
SrugCAR-54:K692R P849G A894G
SrugCAR-55:K492R
这7种突变体的改善范围为对于庚二酸的130%直至209%wt-活性和对于己二酸的130%直至176%wt-活性。
第二轮组合突变体:
现在使用对AMP/PP位点(SrugCAR文库2-1)和NAD(P)结合域/PP位点(SrugCAR文库2-2)鉴定的有益突变组进行另一轮重组以进一步增加SrugCAR的比活性。将文库SrugCAR-2-1变体中的每个与每个文库SrugCAR2-2突变体重组。此种组合产生9个多点改善的突变体:
SrugCAR-50:S284G,P369V,G619Y,K692R,P849G,A892G,A894V
SrugCAR-56:S284G,P369V,G619Y C781V,A892G,A894V
SrugCAR-58:S284G,P369V,G619Y,K692R,P849G,A894G
SrugCAR-59:S284G,P369V,G619Y,K692R
SrugCAR-60:S284A,P369S,G380E,K692R,P849G,A892G,A894V
SrugCAR-61:S284A,P369S,G380E,C781V,A892G,A894V
SrugCAR-63:S284A,P369S,G380E,K692R,P849G,A894G
SrugCAR-65:P369S,G380E,G619L,K692R,P849G,A892G,A894V
SrugCAR-66:P369S,G380E,G619L,C781V,A892G,A894V
SrugCAR-69:P369S,G380E,G619L,K692R
(与书写P369S G380E G619L K692R相同,即,没有分开多个突变中的每个的逗号)
然后,将得到的全长基因克隆到表达载体中并在标准表达条件下表达(实施例1)。
实施例5
用来自Segniliparus rugosus的酶的比活性表征
通过应用优化的测定方案(参见实施例3),对这9种重组突变体表征它们对庚二酸和己二酸的比活性。得到的数据显示,在所有域里的重组暗示在一些突变体SrugCAR-61、SrugCAR-65、SrugCAR-66、SrugCAR-69中的叠加改善。根据这些数据并且在这些条件下,SrugCAR-69是显示针对庚二酸和己二酸的最高比活性的突变体。具有突变P369S、G380E、G619L和K692R的最佳优化突变体SrugCAR-69的比活性对应于对于庚二酸的233%wt活性和对于己二酸的214%wt活性。
这些突变主要影响AMP/腺苷酸化域。四个突变中仅一个(K692R)位于PP位点中。
实施例6
从生物多样性中寻找新的羧酸还原酶
研究自生物多样性鉴定在己二酸和庚二酸的情况下有活性的新CAR酶的不同方法。基于CAR酶的域结构的数据库筛选导致7种新型推定的CAR酶的片段的鉴定。将那些基因中的四个克隆到表达载体中并进行功能分析。仅用来自S.rotundus的基因(SrotCAR,ADG99338)获得活性。新鉴定的SrotCAR对己二酸和庚二酸具有活性,这就是对这两种底物显示显著活性的第二种已知的野生型酶。己二酸和庚二酸活性酶两者的初步比较导致仅76%的序列相似性且没有可以解释此种底物特异性的明显的序列模式。然而,可能与结构建模一起更近地检查序列可以进一步深入了解底物特异性,并可以为进一步的工程化改造实验提供有用的信息。对基因组背景的分析揭示了两种具有期望活性的酶之间明显的相似性,这可以有助于进一步的数据库筛选。因此,鉴定出一种具有期望活性的新活性CAR酶,其可以用作改善活性的基础。
实施例7
优化的SrotCAR基因
对于文库生成,基因的非常高(>60%)或非常低的GC含量(<40%)是成问题的。对SrotCAR基因的分析显示天然基因序列具有68%的GC含量。详细分析显示具有GC含量超过80%的几个区域。当要在这些特定区域中引入突变时,这可能在文库生成期间引起严重问题。
因此,优化基因序列以避免具有极高GC含量的区域。另外,针对大肠杆菌的偏好改编密码子选择。优化的基因序列作为合成基因订购并克隆到c-LEcta的专有表达载体pLE1A17中。用两种构建体(SrotCAR_opt和SrotCAR_native基因)转化含有PPT酶基因的大肠杆菌BL21(DE3)细胞。
在摇瓶中表达SrotCAR_biodiv(即,来自实施例6的生物多样性研究的天然基因)(SEQ ID NO:5)、SrotCAR_opt(SEQ ID NO:6)、SrugCAR(SEQ ID NO:3)和SrugCAR_opt(SEQID NO:4),并通过SDS-PAGE比较细胞破碎后可溶性级分中CAR酶的表达水平。因此,优化的SrotCAR_opt基因与来自生物多样性的天然基因相比显示至少高4倍的表达水平,并且与SrugCAR酶相比还显示高约50%的可溶性表达,如使用含有变性蛋白质的考马斯染色的聚丙烯酰胺凝胶测定的,所述变性蛋白质的密度在使用标准方法分离后获得。
实施例8
将SrugCAR-69突变转移至SrotCAR
将SrugCAR-69变体(P369S-G380E-G619L-K692R)的相应突变转移至SrotCAR。在两种酶的序列比对后,SrotCAR中的相应突变是P369S-G380E-Q623L-E696R,产生这些突变并通过序列分析确认。
在摇瓶中表达新的SrotCAR-69变体,并将其活性与SrotCAR模板进行比较。该变体显示15-20%的比活性改善。
实施例9
用Segniliparus rotundis(SrotCAR)设计和筛选第一突变体文库
类似于先前实施例中SrugCAR的第一突变体文库,设计第一SrotC突变体文库。使用许多结构产生同源性模型(图2),所述结构包括但不限于3NI2、2D1S和2D1T作为AMP结合域的支架,3EJE-E、2VSQ-A和1L0I-A作为磷酸泛酰巯基乙胺附着位点(PP位点)的支架和4DQV作为NAD结合域的支架。使用简并引物,其具有每个残基的平均8.6个可能的突变。设计简并引物以特异性包括通过c-Lecta分析计算的突变,目的是产生具有优化的突变体与命中比率的高质量文库。在404个位置处共有3489个可能的突变:
·AMP域
ο在220个不同位置处的1794个理论突变
·PP域
ο在57个不同位置处的585个理论突变
·NAD(P)还原酶域
ο在127个不同位置处的1110个理论突变
总共筛选了4416个克隆。在命中板中收集最有活性的命中中的77个,所述命中板使用4个重复再次针对己二酸和庚二酸筛选。对所有命中变体进行测序并与它们的活性进行比较。鉴定出几个簇或热点(图2),其具有紧密接近的多个突变,例如,在残基331-338之间。大多数非常有益的突变在这些簇之一中。相对于SEQ ID NO:2,这些热点中的一些包含以下残基:
氨基酸位置 活性位点区
331-338 ATP/AMP活性位点区1a
370-386 ATP/AMP活性位点区1b
448-452 ATP/AMP活性位点区1c
516-520 ATP/AMP活性位点区1d
590-596 ATP/AMP活性位点区1e
683-684 PP结合区
826-832 NADP活性位点区1a
866-869 NADP活性位点区1b
最有活性的单点突变体与SrugCAR_opt(E516F/V,L448E/V,M452I,I684V,V331M和E831I)相比显示高60-100%的活性。W622的序列分析显示在该位置处的W和S两者的混合物。应当提到的是,与WT相比,几乎所有选择的命中证明是更有活性的(Z因子>0)。自77个筛选所选择的命中,鉴定出71个不同的突变(参见图4)。那些具有Z因子>0的命中包括S284I,V331L/M,M334G/V,L336F,H337D/I/V,E338N,T371F,L379V,L383T/V,G386A,L448E/V,M452I/L,F453A,V474R/G,V476L,N481D,V491L,A494V,K495V,L520T,E516F/V,G579E/V,L590V,R591G,P592A/G,E596G,D607S,E622W/S,D647G/S,I683Q,I684V,A709H,P711D,T780N/S,P826V,E831I,P832Y,Q866V,G869T,L893V,A902I,L1086A)。在这些中,28个变体显示在1和2个标准偏差之间的相对于WT的己二酸或庚二酸活性改善:I684V,S284I,M452L,G869T H337I,M334V,G869T,P592G,K495V,I683Q,Q866V,K495V,L520T,G579E,L379V,V491L,D647S,P592G,T780S,V331L,M334G,P826V,D647G,D647S,H337V,L590V,R591G,E516V。另外8个变体显示对于任一种或这两种酸,高超过两个标准偏差的活性:E516F,L448E,M452I,L448V,E622W/S,V331M,E831I,T371F。
实施例10
用Segniliparus rotundis(SrotCAR)进行的有益突变的第二代重组
在针对活性改善鉴定最令人感兴趣的热点之后,重组突变。最初,同时选择两种不同的方法:
方法1:最有活性的变体的组合。
方法2:使用简并引物并同时突变两个、四个和五个位置的复杂重组文库。作为模板,选择L448E变体。
331和516处的突变+L448E:9个变体,筛选24个
331、516、684、831处的突变+L448E:288个变体,筛选576个
331、371、516、684、831处的突变+L448E的突变:2304个变体,筛选4608个
通过几个残基的同时突变,可以观察到可能的协作/协同作用,其在其它情况下不能通过最有活性的变体的简单组合找到。
产生几种组合变体。最好的组合是:
·L448E-M452I(ATP/AMP活性位点区1b)
·E516F-L520T(ATP/AMP活性位点区1d)
·L448E-V331M(ATP/AMP活性位点区1B+ATP/AMP活性位点区1a)
·L448E-E516F(ATP/AMP活性位点区1b+(ATP/AMP活性位点区1d)
·L448E-E622W(ATP/AMP活性位点区1b+ATP/PP结合位点连接区域)
还产生并筛选复杂的重组文库。总共筛选了来自复杂重组文库的5208个变体。鉴定出三重突变体(V331M-L448E-E516V)和四重突变体(V331M-L448E-E516V-E831D),其表明进一步改善的协作活性。
实施例11
最终命中变体的表征
在振荡烧瓶中表达以下酶是最终的命中变体:
所有变体的表达水平非常相似,并且与SrotCAR_biodiv基因相比仍然高约4倍,并且与SrugCAR及其变体相比高50%。
对于比活性测量,制备粗提取物制备物并测量对庚二酸和己二酸的活性。根据表达水平的SDS-PAGE分析调节酶量。将活性与SrotCAR野生型进行比较。
通过双重突变体SrotCAR-07V331M-L448E显示对庚二酸的最高活性,与模板相比活性增加近2倍。该变体包括ATP/AMP域中的突变。相同的变体也显示使用己二酸的最高活性之一,与模板相比改善70%。几种变体显示类似高的活性改善。此工程化项目中找到的最有活性的变体是带有V331M-L448E的SrotCAR-07变体。与SrugCAR及其变体相比,它在大肠杆菌中仍显示高约50%的表达。根据该结果,与SrugCAR-69相比,SrotCAR-07的比活性高约50%。
序列No 1:EFV11917|天然Segniliparus rugosus氨基酸序列
SEQ ID NO:2:密码子优化的Segniliparus rotundus CAR氨基酸序列
SEQ ID NO:3:EFV11917|天然Segniliparus rugosus CAR核苷酸序列
SEQ ID NO:4:密码子优化的Segniliparus rugosus CAR核苷酸序列
SEQ ID NO:5:ADG99338天然Segniliparus rotundus CAR核苷酸序列
SEQ ID NO:6:密码子优化的Segniliparus rotundus CAR核苷酸序列
SEQ ID NO:7密码子优化的Segniliparus rugosus CAR氨基酸序列
SEQ ID NO:8ADG99338天然Segniliparus rotundus CAR氨基酸序列
SEQ ID NO:9密码子优化的Segniliparus rugosus CAR-69核苷酸序列
SEQ ID NO:10密码子优化的Segniliparus rugosus CAR-69氨基酸序列
SEQ ID NO:11密码子优化的Segniliparus rotundus CAR V331M+L448E核苷酸序列
SEQ ID NO:12密码子优化的Segniliparus rotundus CAR V331M+L448E氨基酸序列
序列表
<110> INVISTA NORTH AMERICAN S.A R.L.
<120> 具有改善的活性的多肽和变体、其相关的材料和方法
<130> 12444.0652-00304
<140>
<141>
<150> 62/309,689
<151> 2016-03-17
<160> 12
<170> PatentIn version 3.5
<210> 1
<211> 1148
<212> PRT
<213> Segniliparus rugosus
<400> 1
Met Gly Asp Gly Glu Glu Arg Ala Lys Arg Phe Phe Gln Arg Ile Gly
1 5 10 15
Glu Leu Ser Ala Thr Asp Pro Gln Phe Ala Ala Ala Ala Pro Asp Pro
20 25 30
Ala Val Val Glu Ala Val Ser Asp Pro Ser Leu Ser Phe Thr Arg Tyr
35 40 45
Leu Asp Thr Leu Met Arg Gly Tyr Ala Glu Arg Pro Ala Leu Ala His
50 55 60
Arg Val Gly Ala Gly Tyr Glu Thr Ile Ser Tyr Gly Glu Leu Trp Ala
65 70 75 80
Arg Val Gly Ala Ile Ala Ala Ala Trp Gln Ala Asp Gly Leu Ala Pro
85 90 95
Gly Asp Phe Val Ala Thr Val Gly Phe Thr Ser Pro Asp Tyr Val Ala
100 105 110
Val Asp Leu Ala Ala Ala Arg Ser Gly Leu Val Ser Val Pro Leu Gln
115 120 125
Ala Gly Ala Ser Leu Ala Gln Leu Val Gly Ile Leu Glu Glu Thr Glu
130 135 140
Pro Lys Val Leu Ala Ala Ser Ala Ser Ser Leu Glu Gly Ala Val Ala
145 150 155 160
Cys Ala Leu Ala Ala Pro Ser Val Gln Arg Leu Val Val Phe Asp Leu
165 170 175
Arg Gly Pro Asp Ala Ser Glu Ser Ala Ala Asp Glu Arg Arg Gly Ala
180 185 190
Leu Ala Asp Ala Glu Glu Gln Leu Ala Arg Ala Gly Arg Ala Val Val
195 200 205
Val Glu Thr Leu Ala Asp Leu Ala Ala Arg Gly Glu Ala Leu Pro Glu
210 215 220
Ala Pro Leu Phe Glu Pro Ala Glu Gly Glu Asp Pro Leu Ala Leu Leu
225 230 235 240
Ile Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Ala Met Tyr Ser
245 250 255
Gln Arg Leu Val Ser Gln Leu Trp Gly Arg Thr Pro Val Val Pro Gly
260 265 270
Met Pro Asn Ile Ser Leu His Tyr Met Pro Leu Ser His Ser Tyr Gly
275 280 285
Arg Ala Val Leu Ala Gly Ala Leu Ser Ala Gly Gly Thr Ala His Phe
290 295 300
Thr Ala Asn Ser Asp Leu Ser Thr Leu Phe Glu Asp Ile Ala Leu Ala
305 310 315 320
Arg Pro Thr Phe Leu Ala Leu Val Pro Arg Val Cys Glu Met Leu Phe
325 330 335
Gln Glu Ser Gln Arg Gly Gln Asp Val Ala Glu Leu Arg Glu Arg Val
340 345 350
Leu Gly Gly Arg Leu Leu Val Ala Val Cys Gly Ser Ala Pro Leu Ser
355 360 365
Pro Glu Met Arg Ala Phe Met Glu Glu Val Leu Gly Phe Pro Leu Leu
370 375 380
Asp Gly Tyr Gly Ser Thr Glu Ala Leu Gly Val Met Arg Asn Gly Ile
385 390 395 400
Ile Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu
405 410 415
Leu Gly Tyr Arg Thr Thr Asp Lys Pro Tyr Pro Arg Gly Glu Leu Cys
420 425 430
Ile Arg Ser Thr Ser Leu Ile Ser Gly Tyr Tyr Lys Arg Pro Glu Ile
435 440 445
Thr Ala Glu Val Phe Asp Ala Gln Gly Tyr Tyr Lys Thr Gly Asp Val
450 455 460
Met Ala Glu Ile Ala Pro Asp His Leu Val Tyr Val Asp Arg Ser Lys
465 470 475 480
Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Lys Leu
485 490 495
Glu Ala Ala Tyr Gly Thr Ser Pro Tyr Val Lys Gln Ile Phe Val Tyr
500 505 510
Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val Val Val Pro Asn Ala
515 520 525
Glu Val Leu Gly Ala Arg Asp Gln Glu Glu Ala Lys Pro Leu Ile Ala
530 535 540
Ala Ser Leu Gln Lys Ile Ala Lys Glu Ala Gly Leu Gln Ser Tyr Glu
545 550 555 560
Val Pro Arg Asp Phe Leu Ile Glu Thr Glu Pro Phe Thr Thr Gln Asn
565 570 575
Gly Leu Leu Ser Glu Val Gly Lys Leu Leu Arg Pro Lys Leu Lys Ala
580 585 590
Arg Tyr Gly Glu Ala Leu Glu Ala Arg Tyr Asp Glu Ile Ala His Gly
595 600 605
Gln Ala Asp Glu Leu Arg Ala Leu Arg Asp Gly Ala Gly Gln Arg Pro
610 615 620
Val Val Glu Thr Val Val Arg Ala Ala Val Ala Ile Ser Gly Ser Glu
625 630 635 640
Gly Ala Glu Val Gly Pro Glu Ala Asn Phe Ala Asp Leu Gly Gly Asp
645 650 655
Ser Leu Ser Ala Leu Ser Leu Ala Asn Leu Leu His Asp Val Phe Glu
660 665 670
Val Glu Val Pro Val Arg Ile Ile Ile Gly Pro Thr Ala Ser Leu Ala
675 680 685
Gly Ile Ala Lys His Ile Glu Ala Glu Arg Ala Gly Ala Ser Ala Pro
690 695 700
Thr Ala Ala Ser Val His Gly Ala Gly Ala Thr Arg Ile Arg Ala Ser
705 710 715 720
Glu Leu Thr Leu Glu Lys Phe Leu Pro Glu Asp Leu Leu Ala Ala Ala
725 730 735
Lys Gly Leu Pro Ala Ala Asp Gln Val Arg Thr Val Leu Leu Thr Gly
740 745 750
Ala Asn Gly Trp Leu Gly Arg Phe Leu Ala Leu Glu Gln Leu Glu Arg
755 760 765
Leu Ala Arg Ser Gly Gln Asp Gly Gly Lys Leu Ile Cys Leu Val Arg
770 775 780
Gly Lys Asp Ala Ala Ala Ala Arg Arg Arg Ile Glu Glu Thr Leu Gly
785 790 795 800
Thr Asp Pro Ala Leu Ala Ala Arg Phe Ala Glu Leu Ala Glu Gly Arg
805 810 815
Leu Glu Val Val Pro Gly Asp Val Gly Glu Pro Lys Phe Gly Leu Asp
820 825 830
Asp Ala Ala Trp Asp Arg Leu Ala Glu Glu Val Asp Val Ile Val His
835 840 845
Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr His Gln Leu Phe Gly
850 855 860
Pro Asn Val Val Gly Thr Ala Glu Ile Ile Arg Leu Ala Ile Thr Ala
865 870 875 880
Lys Arg Lys Pro Val Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly
885 890 895
Val Glu Pro Ser Ser Phe Glu Glu Asp Gly Asp Ile Arg Ala Val Val
900 905 910
Pro Glu Arg Pro Leu Gly Asp Gly Tyr Ala Asn Gly Tyr Gly Asn Ser
915 920 925
Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Glu Leu Val Gly
930 935 940
Leu Pro Val Ala Val Phe Arg Ser Asp Met Ile Leu Ala His Thr Arg
945 950 955 960
Tyr Thr Gly Gln Leu Asn Val Pro Asp Gln Phe Thr Arg Leu Val Leu
965 970 975
Ser Leu Leu Ala Thr Gly Ile Ala Pro Lys Ser Phe Tyr Gln Gln Gly
980 985 990
Ala Ala Gly Glu Arg Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp
995 1000 1005
Phe Thr Ala Glu Ala Ile Thr Thr Leu Gly Ala Glu Pro Ser Trp
1010 1015 1020
Phe Asp Gly Gly Ala Gly Phe Arg Ser Phe Asp Val Phe Asn Pro
1025 1030 1035
His His Asp Gly Val Gly Leu Asp Glu Phe Val Asp Trp Leu Ile
1040 1045 1050
Glu Ala Gly His Pro Ile Ser Arg Ile Asp Asp His Lys Glu Trp
1055 1060 1065
Phe Ala Arg Phe Glu Thr Ala Val Arg Gly Leu Pro Glu Ala Gln
1070 1075 1080
Arg Gln His Ser Leu Leu Pro Leu Leu Arg Ala Tyr Ser Phe Pro
1085 1090 1095
His Pro Pro Val Asp Gly Ser Val Tyr Pro Thr Gly Lys Phe Gln
1100 1105 1110
Gly Ala Val Lys Ala Ala Gln Val Gly Ser Asp His Asp Val Pro
1115 1120 1125
His Leu Gly Lys Ala Leu Ile Val Lys Tyr Ala Asp Asp Leu Lys
1130 1135 1140
Ala Leu Gly Leu Leu
1145
<210> 2
<211> 1148
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /记录="人工序列描述:合成
多肽"
<400> 2
Met Gly Ser Gly Ala Asp Arg Ala Lys Leu Phe Phe Gln Lys Ile Glu
1 5 10 15
Glu Leu Thr Ala Ala Asp Pro Gln Phe Ala Ala Ala Val Pro Asp Gln
20 25 30
Glu Val Val Ala Ala Val Ser Asp Pro Thr Leu Ser Phe Thr Arg Tyr
35 40 45
Leu Asp Thr Leu Met Arg Gly Tyr Ala Asp Arg Pro Ala Leu Ala His
50 55 60
Arg Val Gly Asp Gly Tyr Ala Thr Ile Ser Tyr Gly Glu Leu Trp Ser
65 70 75 80
Arg Val Gly Ala Ile Ala Ala Ala Trp Ser Ala Asp Gly Leu Glu Pro
85 90 95
Gly Asp Phe Val Ala Thr Ile Gly Phe Thr Ser Pro Asp Tyr Thr Ala
100 105 110
Leu Asp Leu Ala Ala Thr Arg Ser Gly Leu Val Ser Val Pro Leu Gln
115 120 125
Ala Gly Ala Ser Val Ala Gln Leu Ser Ala Ile Leu Glu Glu Thr Ala
130 135 140
Pro Lys Val Phe Ala Ala Ser Ala Glu Ser Leu Glu Gly Ala Val Asp
145 150 155 160
Cys Val Leu Arg Thr Pro Ser Val Gln Arg Leu Val Ile Phe Asp Leu
165 170 175
Arg Asp Asp Ser Pro Glu His Arg Ala Ala Leu Ala Ala Ala Lys Ala
180 185 190
Lys Leu Ala Gln Pro Gln Asn Pro Glu Gln Ala Arg Gly Pro Val Ala
195 200 205
Val Glu Thr Leu Asp Glu Leu Val Ala Arg Gly Ala Ala Leu Pro Glu
210 215 220
Pro Pro Val Phe Glu Pro Ala Glu Gly Glu Asp Pro Leu Ala Leu Leu
225 230 235 240
Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys Gly Ala Met Tyr Ser
245 250 255
Gln Arg Leu Val Ser Arg Phe Trp Pro Arg Thr Pro Val Val Ala Gln
260 265 270
Leu Pro Ser Ile Ser Leu His Tyr Met Pro Leu Ser His Ser Tyr Gly
275 280 285
Arg Ala Val Leu Cys Gly Thr Leu Ala Ala Gly Gly Thr Ala His Phe
290 295 300
Thr Ala His Ser Asp Leu Ser Thr Leu Phe Glu Asp Ile Ala Leu Ala
305 310 315 320
Arg Pro Thr Phe Leu Ala Leu Val Pro Arg Val Cys Glu Met Leu Leu
325 330 335
His Glu Ser Arg Arg Ala Arg Asp Leu Ala Glu Leu Arg Glu Arg Val
340 345 350
Leu Gly Glu Arg Leu Leu Val Ala Val Cys Gly Ser Ala Pro Leu Ala
355 360 365
Pro Glu Thr Arg Ala Phe Met Glu Glu Leu Leu Gly Phe Pro Leu Leu
370 375 380
Asp Gly Tyr Gly Ser Thr Glu Ala Leu Ser Leu Met Arg Asp Gly Val
385 390 395 400
Ile Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu
405 410 415
Leu Gly Tyr Phe Thr Thr Asp Lys Pro His Pro Arg Gly Glu Leu Leu
420 425 430
Ile Arg Ser Glu Ser Leu Val Ser Gly Tyr Tyr Lys Arg Pro Glu Leu
435 440 445
Thr Ala Glu Met Phe Asp Glu Gln Gly Tyr Tyr Lys Thr Gly Asp Val
450 455 460
Met Ala Glu Ile Ala Pro Asp Arg Leu Val Tyr Val Asp Arg Ser Lys
465 470 475 480
Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Lys Leu
485 490 495
Glu Ala Ala Phe Gly Ala Ser Pro Tyr Val Lys Gln Ile Phe Val Tyr
500 505 510
Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val Val Val Pro Asn Ala
515 520 525
Glu Leu Val Gly Arg Leu Asp Thr Val Gln Ala Leu Ala Glu Val Lys
530 535 540
Pro Leu Ile Ala Asp Ser Leu Ala Ala Ile Ala Lys Glu Ser Gly Leu
545 550 555 560
Gln Ser Tyr Glu Val Pro Arg Asp Phe Ile Val Glu Thr Glu Pro Phe
565 570 575
Thr Thr Gly Asn Gly Leu Leu Ser Glu Val Gly Lys Leu Leu Arg Pro
580 585 590
Lys Leu Lys Glu Arg Tyr Gly Glu Arg Leu Glu Ala Leu Tyr Asp Gln
595 600 605
Ile Ala Gln Gly Gln Ala Asp Glu Leu Arg Ala Leu Arg Glu Gln Ala
610 615 620
Gly Glu Arg Pro Val Ile Asp Thr Val Arg Lys Ala Ala Ala Ala Val
625 630 635 640
Val Gly Ser Ser Gly Ala Asp Phe Arg Pro Asp Ala Asn Phe Ala Asp
645 650 655
Leu Gly Gly Asp Ser Leu Ser Ala Leu Gly Phe Ala Asn Leu Leu Gln
660 665 670
Asp Val Phe Gly Val Glu Thr Pro Val Arg Ile Ile Ile Gly Pro Thr
675 680 685
Ala Ser Leu Ala Gly Ile Ala Glu His Ile Glu Arg Ala Leu Gly Gly
690 695 700
Arg Pro Gly Glu Ala Ala Pro Asn Ser Ala Ser Val His Gly Ala Gly
705 710 715 720
Ala Glu Val Ile Arg Ala Ser Asp Leu Thr Leu Asp Lys Phe Leu Asp
725 730 735
Ala Gln Ala Leu Glu Ala Ala Gln Ser Leu Pro Arg Pro Thr Gly Ser
740 745 750
His Arg Thr Val Leu Leu Thr Gly Ala Asn Gly Trp Leu Gly Arg Phe
755 760 765
Leu Ala Leu Glu Gln Leu Gln Arg Leu Glu Ala Thr Gly Gly Lys Leu
770 775 780
Ile Cys Leu Val Arg Gly Lys Asp Ala Ala Ser Ala Arg Ala Arg Val
785 790 795 800
Glu Glu Ala Leu Gly Thr Asp Pro Ala Leu Ala Ala Arg Phe Ala Glu
805 810 815
Leu Ala Ala Asp Arg Leu Glu Val Val Pro Gly Asp Val Gly Glu Pro
820 825 830
Lys Phe Gly Leu Asp Asp Arg Thr Trp Asp Arg Leu Ala Gly Glu Val
835 840 845
Asp Ala Val Val His Ser Gly Ala Leu Val Asn His Val Leu Pro Tyr
850 855 860
His Gln Leu Phe Gly Ser Asn Val Val Gly Val Ala Glu Ile Ile Arg
865 870 875 880
Phe Ala Val Ala Ser Lys Leu Lys Pro Val Ala Tyr Leu Ser Thr Val
885 890 895
Ala Val Ala Ala Gly Ala Asp Pro Ala Ala Phe Asp Glu Asp Gly Asp
900 905 910
Ile Arg Glu Val Val Pro Gln Arg Pro Val Asp Asp Ser Tyr Ala Asn
915 920 925
Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala
930 935 940
His Glu Arg Thr Gly Leu Pro Val Arg Val Phe Arg Ser Asp Met Ile
945 950 955 960
Leu Ala His Arg Gln His Thr Gly Gln Leu Asn Ala Thr Asp Gln Phe
965 970 975
Thr Arg Leu Ile Leu Ser Leu Leu Ala Thr Gly Leu Ala Pro Lys Ser
980 985 990
Phe Tyr Gln Leu Asp Pro Gln Gly Arg Arg Gln Arg Ala His Tyr Asp
995 1000 1005
Gly Ile Pro Val Asp Phe Thr Ala Glu Ala Ile Val Ala Leu Ala
1010 1015 1020
Ala Glu Gly Asn Asn Gly His Arg Ser Tyr Asn Val Phe Asn Pro
1025 1030 1035
His His Asp Gly Val Gly Leu Asp Glu Phe Val Asp Trp Leu Ile
1040 1045 1050
Glu Ala Gly His Pro Ile Thr Arg Ile Glu Asp His Ala Thr Trp
1055 1060 1065
Phe Ala Arg Phe Thr Thr Ala Leu Arg Ala Leu Pro Glu Lys Gln
1070 1075 1080
Arg Gln Leu Ser Leu Leu Pro Leu Ala Gln Val Tyr Ser Phe Pro
1085 1090 1095
His Pro Ala Val Asp Gly Ser Pro Phe Arg Asn Ala Val Phe Arg
1100 1105 1110
Ala Asp Val Gln Arg Ala Arg Ile Gly Lys Asp His Asp Ile Pro
1115 1120 1125
His Leu Thr Arg Glu Leu Ile Leu Lys Tyr Ala Ala Asp Leu Ala
1130 1135 1140
Ala Leu Gly Ser Leu
1145
<210> 3
<211> 3447
<212> DNA
<213> Segniliparus rugosus
<400> 3
atgggcgacg gcgaagagcg ggcgaagcgt ttcttccaga ggatcgggga gctgagcgcg 60
acggacccgc agttcgcggc cgccgcgccg gaccccgccg tggtcgaggc cgtgtcggac 120
ccctcgctct cgttcacccg ctacttggac acgctgatgc gcgggtacgc cgagcgcccg 180
gcgctcgccc accgggtcgg cgcgggatac gagacgatca gctacgggga gctgtgggcg 240
cgggtcgggg cgattgcggc ggcgtggcag gcggacggcc tcgcgccggg cgacttcgtc 300
gccacggtcg gtttcaccag cccggactac gtcgccgtcg accttgcggc cgcgaggtcg 360
gggctggtgt ccgtgccgtt gcaggcgggt gcttcgctcg cccagctcgt cgggatcctc 420
gaggagaccg agccgaaggt gctcgcggcg agcgcgagca gtctcgaagg ggccgttgcc 480
tgcgcgctgg cggccccgag cgtgcagcgg ctcgtcgtgt tcgacctgcg cggcccggac 540
gcttcggaga gcgcggcgga cgagcgccga ggcgccctcg ccgatgccga ggagcagctg 600
gcgcgggccg ggcgggccgt ggtcgtcgag accctcgccg acctggcggc ccgaggcgag 660
gcgctgccgg aagccccgct gttcgagccc gccgagggcg aagacccgct ggccctcttg 720
atctacacgt ccggctcgac cggggccccg aagggggcga tgtactcgca gcgcctggtg 780
tcccagctct gggggcgcac gccggtggtg ccggggatgc cgaacatctc gctgcattac 840
atgccgctga gccactccta cgggcgggcg gtcctcgccg gggcgctctc ggcgggcggg 900
accgcccact tcaccgcgaa cagcgacctt tccaccctct tcgaggacat cgcgctcgcc 960
cgccccacct tcctcgccct ggtccccagg gtctgcgaga tgctgttcca ggagagccag 1020
cgcggccagg acgtcgcgga gctgcgcgaa cgggtgctcg gcggtcggct gctggtcgcg 1080
gtgtgcggct ccgccccgct gtcgccggag atgcgcgcgt tcatggagga ggtgctcggc 1140
ttcccgctgc tcgacggcta cggctcgacc gaggcgctcg gcgtcatgcg caacgggatc 1200
atccagcgcc cgccggtcat cgactacaag ctggtcgacg tgcccgagct gggctatcgc 1260
accactgaca agccctaccc gaggggcgag ctgtgcatcc gctcgacgag cctgatctcc 1320
ggctactaca agcgccccga gatcacagcg gaggtgttcg acgcgcaggg ctactacaag 1380
accggcgacg tgatggccga gatcgcgccg gaccacctgg tgtacgtgga ccggagcaag 1440
aacgtcctca aactctccca aggcgagttc gtcgccgtcg cgaagctcga agccgcgtac 1500
ggcacgagcc cgtacgtgaa gcagatcttc gtctacggca acagcgagcg ctccttcctg 1560
ctcgcggtcg tcgtgccgaa cgccgaagtc ctcggcgcgc gggaccagga ggaggccaag 1620
ccgctcatcg ccgcctcgct gcagaagatc gcgaaagagg ctggcctgca gtcttacgag 1680
gtcccgcgcg acttcttgat cgagaccgag ccgttcacca cgcagaacgg cctgctctcc 1740
gaggtcggca agctgctgcg cccgaagctc aaggcccggt acggcgaggc gctggaggcg 1800
cgctacgacg agatcgcgca cggccaggcg gacgagctgc gcgcgctgcg ggacggcgcg 1860
ggacagcgcc cggtggtcga gaccgtcgtg cgggccgccg tcgcgatctc cggctccgag 1920
ggcgcggagg tcggccctga ggcgaacttc gccgacctcg gcggggactc gctctccgcg 1980
ttgagccttg cgaacttgct gcacgacgtc ttcgaagtcg aggtgccggt gcggatcatc 2040
atcggcccga ccgcctcgct cgccgggatc gccaagcaca tcgaggccga gcgcgccggg 2100
gcgagcgccc cgacggcggc ctccgtgcac ggcgcggggg cgacgaggat ccgagcgagc 2160
gagctgacgc tggagaaatt cctccctgaa gacctgcttg ccgccgcgaa gggccttccg 2220
gccgccgacc aggtccgcac ggtgctcttg acgggcgcga acggctggct cgggcgtttc 2280
ctcgcgttgg aacagctcga acggctcgcc cgatcggggc aggacggcgg gaagctgatc 2340
tgcctggtcc gggggaaaga cgcggctgcg gcgcgcaggc ggatcgaaga aacgctcggc 2400
acggacccgg ccctggccgc caggttcgcc gaacttgccg aggggcggtt ggaagtggtc 2460
ccgggggacg tgggcgagcc gaagttcggc ttggacgacg cggcatggga ccggctggcc 2520
gaggaggtgg acgtcatcgt ccacccggcg gcccttgtga accacgttct gccgtaccac 2580
cagctgttcg ggccgaacgt ggtcggcacg gcggagatca tccggctcgc gatcaccgcc 2640
aagcgcaagc cggtcaccta cctctccacg gtggcggtcg cggcgggcgt ggagccctcc 2700
tccttcgagg aggacggcga catccgggcc gtggtccccg aacggccctt gggcgatggg 2760
tacgcgaacg gctacggcaa cagcaaatgg gcgggggagg tgctgctgcg cgaagcgcac 2820
gagcttgtgg gcctgccggt ggcggtgttc cgctcggaca tgatcctcgc gcacacccgg 2880
tacaccggac agctcaacgt ccccgaccag ttcaccaggc tcgtcctgag ccttttggcc 2940
accgggatcg cgcccaagtc cttctaccag cagggcgcgg cgggcgaacg ccagcgggcg 3000
cattacgacg gcatccccgt ggacttcacc gccgaggcca tcaccacgct cggcgcggag 3060
ccgagctggt tcgacggcgg cgcggggttc cgcagcttcg acgtgttcaa cccgcaccac 3120
gacggggtgg gcttggacga gttcgtggac tggctcatcg aggccgggca tccgatctcc 3180
aggatcgacg accacaagga atggttcgcc cggttcgaga ccgccgtgcg cggcctgccc 3240
gaagcgcagc gccagcattc cctgctgccg ctgttgcgcg cctactcgtt cccgcatccg 3300
cccgtggacg gcagtgtcta tccgaccggg aagttccagg gcgcggtcaa agccgcgcag 3360
gtgggctccg accacgacgt gccgcatctc ggcaaggcgc tgatcgtgaa atacgcggac 3420
gacctgaagg ctctcggact cctctga 3447
<210> 4
<211> 3447
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /记录="人工序列描述:合成
多核苷酸"
<400> 4
atgggcgacg gcgaagaacg tgcgaaacgc tttttccaac gtatcggtga actgtctgcg 60
accgatccgc agtttgcagc agcagctccg gacccggctg tggttgaagc cgtgagtgat 120
ccgtcactgt cgttcacccg ctatctggat acgctgatgc gcggctacgc agaacgtccg 180
gctctggcac atcgtgtggg tgcaggttat gaaaccatca gctacggtga actgtgggcc 240
cgtgttggtg caattgcagc agcatggcag gctgatggtc tggcaccggg tgacttcgtc 300
gcaaccgtgg gttttacgtc cccggattat gttgcagtcg acctggctgc agcacgttca 360
ggtctggtgt cggttccgct gcaagccggt gcatcactgg cccagctggt tggcattctg 420
gaagaaaccg aaccgaaagt cctggcagct tcggcaagct ctctggaagg cgctgttgcg 480
tgcgcactgg cagcaccgag cgtccagcgc ctggtcgtgt ttgatctgcg tggtccggac 540
gcgagcgaat ctgcagctga tgaacgtcgc ggcgcactgg ctgacgcaga agaacagctg 600
gcccgcgcag gtcgtgcagt tgtcgtggaa accctggctg atctggcagc gcgtggcgaa 660
gccctgccgg aagcaccgct gtttgaaccg gcggaaggtg aagatccgct ggccctgctg 720
atctatacca gtggctccac gggtgctccg aaaggtgcga tgtacagtca acgcctggtg 780
tcccagctgt ggggtcgtac cccggttgtc ccgggtatgc cgaacatttc cctgcattat 840
atgccgctgt cacactcgta cggtcgtgcg gttctggctg gtgcactgtc agccggcggt 900
accgcacatt tcacggctaa tagcgatctg tctaccctgt ttgaagacat cgcactggca 960
cgtccgacgt tcctggcact ggttccgcgt gtctgcgaaa tgctgtttca ggaatcgcaa 1020
cgcggccagg atgtggccga actgcgcgaa cgtgttctgg gcggtcgtct gctggtcgca 1080
gtgtgtggta gcgctccgct gtctccggaa atgcgcgcgt tcatggaaga agtgctgggc 1140
tttccgctgc tggatggcta tggttcaacc gaagccctgg gtgtgatgcg caacggcatt 1200
atccagcgtc cgccggttat tgattacaaa ctggttgacg tcccggaact gggttatcgt 1260
accacggata agccgtaccc gcgcggcgaa ctgtgtatcc gtagcacgtc tctgattagc 1320
ggttattaca aacgtccgga aatcaccgcg gaagtgtttg acgcccaggg ttattacaag 1380
acgggcgatg ttatggcgga aattgccccg gatcatctgg tgtatgttga ccgtagcaaa 1440
aatgtgctga agctgtctca aggcgaattc gtcgctgtgg cgaaactgga agcagcttat 1500
ggtacctctc cgtacgtgaa gcagatcttc gtttatggca acagtgaacg ctcctttctg 1560
ctggcagtgg ttgtcccgaa tgcagaagtg ctgggtgctc gtgatcagga agaagcgaaa 1620
ccgctgatcg cggcctccct gcaaaaaatt gcaaaggaag ctggcctgca gagctatgaa 1680
gtgccgcgcg atttcctgat tgaaaccgaa ccgtttacca cgcagaacgg tctgctgtct 1740
gaagttggca agctgctgcg cccgaaactg aaggcgcgtt atggcgaagc gctggaagcc 1800
cgttacgatg aaatcgcgca tggtcaagcc gatgaactgc gtgcgctgcg tgacggtgcc 1860
ggtcagcgtc cggtggttga aaccgtcgtg cgtgcagctg tggcaattag tggctccgaa 1920
ggtgctgaag ttggtccgga agcaaacttt gctgatctgg gcggtgactc actgtcggca 1980
ctgtcgctgg ctaatctgct gcacgatgtg ttcgaagttg aagtcccggt gcgcattatc 2040
attggtccga ccgcgagcct ggcaggtatc gcaaaacata ttgaagcgga acgtgcaggt 2100
gcatcagctc cgacggcagc ctcggttcac ggcgcaggtg caacccgtat tcgtgcatcc 2160
gaactgacgc tggaaaaatt tctgccggaa gacctgctgg cagctgcaaa gggtctgccg 2220
gcagcagatc aagtgcgtac cgttctgctg acgggtgcaa atggttggct gggccgtttc 2280
ctggccctgg aacaactgga acgcctggca cgtagtggtc aggacggcgg taaactgatc 2340
tgcctggtgc gtggcaagga tgctgcagca gcacgtcgcc gtattgaaga aaccctgggt 2400
acggatccgg cactggctgc acgttttgct gaactggcgg aaggtcgtct ggaagttgtc 2460
ccgggtgatg tgggcgaacc gaaattcggc ctggatgacg ccgcatggga tcgtctggcg 2520
gaagaagttg acgtcattgt gcatccggct gcgctggtca accatgtgct gccgtatcac 2580
cagctgtttg gtccgaatgt ggttggcacc gcggaaatca ttcgcctggc catcacggca 2640
aaacgtaaac cggtgaccta cctgagcacg gttgccgtcg ccgcaggtgt tgaaccgagt 2700
tccttcgaag aagatggcga cattcgtgca gtcgtgccgg aacgtccgct gggtgatggt 2760
tatgcaaacg gctacggtaa ttctaaatgg gcaggtgaag tgctgctgcg tgaagcacat 2820
gaactggttg gcctgccggt ggcagttttt cgcagtgaca tgatcctggc gcacacccgt 2880
tatacgggtc aactgaacgt cccggatcag tttacccgtc tggtgctgtc gctgctggca 2940
acgggtattg caccgaaatc tttttatcag caaggtgctg caggtgaacg tcagcgtgca 3000
cactacgatg gcatcccggt ggactttacc gcagaagcta ttaccacgct gggtgccgaa 3060
ccgtcttggt tcgatggcgg tgcaggcttt cgcagtttcg atgtttttaa tccgcatcac 3120
gacggcgttg gtctggatga atttgtcgac tggctgatcg aagcgggtca tccgatcagt 3180
cgtattgatg accacaaaga atggttcgca cgctttgaaa ccgctgtgcg tggcctgccg 3240
gaagcacagc gccaacatag tctgctgccg ctgctgcgtg cctattcctt tccgcacccg 3300
ccggttgatg gttcagtcta cccgacgggt aaattccaag gtgcagtcaa ggcagcacaa 3360
gtgggtagcg atcatgacgt cccgcacctg ggcaaagccc tgattgtgaa gtatgcggat 3420
gacctgaaag ccctgggcct gctgtaa 3447
<210> 5
<211> 3447
<212> DNA
<213> Segniliparus rotundus
<400> 5
atgggcagcg gcgcggatcg ggcgaagctt tttttccaaa agatcgagga gctgaccgcg 60
gcggaccccc agttcgcggc ggcagtgccg gaccaggagg tcgtggcggc ggtttctgat 120
cccacgctct cgttcacccg ctacctggac acgctcatgc ggggctatgc ggaccgcccc 180
gccctcgccc accgggtcgg cgatggttac gcgacgatca gctacgggga gctgtggtcg 240
cgcgtcgggg cgatcgcggc ggcttggagc gcggatggcc tcgaacccgg agatttcgtc 300
gccaccatcg gcttcacgag ccccgattac accgctctcg acttggcggc gaccaggtcc 360
ggcctggtgt ccgtgccgtt gcaggcagga gcttctgtcg cgcagctgtc cgcgatcctc 420
gaagaaaccg cgccgaaggt cttcgcggcg agcgccgaaa gcctcgaagg ggcggtggac 480
tgcgtgctgc ggaccccgag cgtccagcgg ctcgtcatct tcgatctgcg ggacgactcg 540
cccgagcacc gggcggccct cgcggcggcg aaagccaagc tcgcgcagcc ccagaatccc 600
gaacaggcgc gaggacccgt ggccgtggag acgctcgacg agctggtcgc gcgcggcgcg 660
gcgctgcccg agccgcctgt gttcgaaccc gccgagggcg aggacccgtt ggccctgttg 720
atttacacgt caggctcgac cggcaccccc aagggggcca tgtactcgca gcgcctcgtg 780
tcccggttct ggcccaggac cccggtcgtc gcccaactcc cgagtatttc gctgcactac 840
atgcccctca gccactccta tggccgggcg gtcctgtgcg ggacgctcgc cgctggcggg 900
accgcgcatt tcaccgccca cagcgacctt tcgaccctct tcgaggacat cgcgctcgcc 960
cgccccacgt tcctcgcgct ggttcccagg gtgtgcgaga tgctgttgca cgagagccgt 1020
cgggcgcggg acctcgctga actgcgcgaa cgggtgctcg gcgagcggct gttggtggcg 1080
gtgtgcggct ccgcgccgtt ggcgcccgag acgcgggcct tcatggagga gctgctcggc 1140
ttccccttgc tcgacggtta cggttcgacc gaggcgctgt cgctcatgcg ggacggggtg 1200
atccaacgcc cgccggtcat cgattacaaa ctggtcgacg tgcccgagct cggctatttc 1260
accaccgaca agccgcaccc ccggggggag ctgctcatcc gctccgaaag cctcgtctcc 1320
ggctactaca agcgccccga gctgacagcg gagatgttcg acgagcaggg ctactacaaa 1380
accggcgacg tgatggccga gatcgcgccg gaccgcctcg tctacgtgga ccggagcaaa 1440
aacgtcctca agctctccca gggcgagttc gtcgcggtcg cgaagctgga ggccgccttc 1500
ggcgcgagcc cgtatgtcaa gcagatcttc gtctacggca acagcgagcg ctcgttcctg 1560
ctcgcggtgg tcgtgccgaa cgccgaactc gtcggccggc tcgacaccgt ccaggcgctg 1620
gccgaagtga agccgctcat cgcggactcg ctcgccgcga tcgccaaaga gtctggcctg 1680
cagtcctatg aggtcccgcg cgacttcatc gtcgagaccg agccgttcac caccggcaac 1740
ggactgctct ccgaagtcgg caagcttttg cgcccgaagc tcaaggagcg gtacggcgaa 1800
cggctcgaag cgctctacga ccagatcgcg cagggccagg cggatgaact gcgcgcgttg 1860
cgcgagcagg cgggggagcg cccggtgatc gacacagtcc gcaaagccgc cgcagcagtg 1920
gtgggctcca gcggcgcgga ctttcggcct gacgcgaatt tcgccgacct cggcggagac 1980
tcgctctccg cgttgggttt cgcgaacctt ttgcaggacg tgttcggggt cgagacgccc 2040
gttcggatca tcatcggccc gaccgcgtcg ctcgccggga tcgccgagca catcgagcgc 2100
gcgttgggcg gtcgcccggg cgaggcggcg ccgaactcgg cctcggtgca cggcgccggg 2160
gccgaggtga tccgcgcgag cgatctgacg ttggacaaat tcctggacgc gcaggcgctc 2220
gaagctgcgc agagcctgcc caggcccacc ggctcccatc gcaccgtgct gctcaccggc 2280
gcgaacggct ggctcggacg gtttctcgcg ctcgagcagc ttcagcggct cgaagccacc 2340
ggcgggaagc tgatctgctt ggtcaggggc aaagacgcgg cctcggcgcg cgcgcgggtc 2400
gaagaagcgc tcggcaccga cccggcgctc gcggcccggt tcgccgaact cgccgcagac 2460
cggctcgaag tggttcccgg cgacgtcggc gagccgaagt tcggcctgga cgatcgcacc 2520
tgggaccggc ttgcgggcga ggtggacgct gtggtgcact ccggcgcctt ggtgaaccac 2580
gttctgccgt accaccagct cttcgggtcg aacgtggtcg gcgtcgccga gatcatccgc 2640
ttcgccgtcg cctcgaagct caaacctgtc gcctacctct ccaccgtcgc cgtcgcggca 2700
ggcgccgacc ccgccgcatt cgacgaggac ggcgacatcc gcgaagtcgt gccccaacga 2760
cctgtcgacg acagctacgc caacggctac ggcaacagca aatgggccgg cgaggtcctg 2820
ctccgcgaag cgcacgagcg caccggcctg cctgtgcgcg tcttccgctc cgacatgatc 2880
ctcgcccacc ggcaacacac cggccagctc aacgccaccg accaattcac acggctcatc 2940
ctcagcctcc tcgccaccgg cctcgccccg aagtccttct accaactcga cccccaaggc 3000
agacggcaac gggcccacta cgacggcatt cccgtggact tcaccgccga ggccatcgtc 3060
gccctcgccg ccgaaggcaa caacggccac cgcagctaca acgtcttcaa cccccaccac 3120
gacggcgtcg gcttggacga gttcgtcgac tggctcatcg aagccggaca tcccatcacc 3180
cgcatcgaag accacgcgac atggttcgcc cgtttcacga ccgcgctccg cgccctcccg 3240
gaaaaacaac gccagctgtc gctgttgccg cttgcgcagg tgtactcgtt cccgcatccg 3300
gctgttgacg gctcgccgtt ccggaacgcc gtgttccggg ccgatgtgca gagggcgagg 3360
atcggcaagg accacgatat tccgcatctg acgcgggagc tgatcctgaa atacgccgcc 3420
gacctggcag cgctcggctt gttgtag 3447
<210> 6
<211> 3447
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /记录="人工序列描述:合成
多核苷酸"
<400> 6
atgggctctg gagcggatcg cgcgaagctg ttctttcaga aaattgaaga actgactgca 60
gcggacccac aatttgcagc agccgtgccc gatcaggaag tggtggccgc cgtaagcgac 120
ccaactctgt cgtttacccg ttatctcgat accctgatgc gtggctatgc ggatcgtccg 180
gcactggcgc atcgcgttgg tgacggttat gcgaccatct cttacgggga actgtggtca 240
cgcgttggag cgattgctgc agcctggagc gcggatggac tggagccggg tgattttgtg 300
gctacgattg ggttcactag tccggactat accgccctgg atctggcagc gacccgttcc 360
gggctcgtta gcgttccgct gcaggcgggc gctagtgtgg cgcagctgtc ggcgatcctg 420
gaggaaacag cccctaaagt tttcgcagcg agcgccgaaa gcctggaagg tgctgtggat 480
tgcgttttgc gcaccccgag tgtgcagcgc ctggtcattt tcgacttacg ggatgatagc 540
cctgagcatc gcgctgcctt agcggctgca aaagcgaaac ttgctcagcc gcagaatccc 600
gaacaggccc gcgggccggt agcggtagag acactggatg aactggttgc tcgtggtgcg 660
gcacttccgg aacctcctgt ctttgaacca gcggaaggtg aagatccgct ggccctcctg 720
atctacacca gcggttccac cggcacgccg aaaggggcaa tgtactcgca gcgccttgta 780
tctcgcttct ggccccgcac gccggtcgtt gcgcagctgc catccatctc acttcactac 840
atgccgctta gccacagcta tggccgtgcc gtgctgtgtg gcaccctggc ggctggtggt 900
acagcgcact ttacggctca tagcgatctg tccacgctgt ttgaagatat tgccctcgca 960
cgcccgacgt ttctggcact ggtcccgcgt gtctgcgaaa tgctgctcca cgagtcgcgc 1020
cgcgcgcgtg acttagcaga actgcgcgaa cgggttttgg gtgaacgcct gctcgtggcg 1080
gtttgtggta gtgcgcctct tgcgccagaa acccgcgcgt ttatggaaga gctgctgggc 1140
tttccactgc tggatggcta tggctcaacc gaagcgttga gcctgatgcg cgatggcgtg 1200
attcagcgtc ctccggtaat tgactacaaa ttggtggacg tcccggaact gggttacttt 1260
accaccgata aaccgcatcc ccgtggcgaa ctgttgattc gctctgaatc tcttgtaagc 1320
ggttactata aacgtccaga attgacagcg gagatgttcg atgagcaagg ttactacaag 1380
accggcgatg taatggccga aattgccccg gaccgcctgg tctacgttga ccgctccaag 1440
aacgtcctga aactgtcgca aggggaattt gttgccgtgg caaaattgga ggccgcattc 1500
ggcgcaagcc cgtatgtcaa gcagattttc gtctatggta acagtgaacg ctcttttctg 1560
cttgcagtag tcgtaccaaa cgccgaatta gtgggccgtc ttgacacagt tcaagccctg 1620
gccgaagtca aacccttaat cgcagatagt ttagcggcta ttgcgaaaga aagcggcttg 1680
caatcctatg aagtcccgcg cgactttatc gttgaaaccg agccgtttac gacgggcaat 1740
ggcctgcttt ctgaagttgg caaactcctg cggcccaaac tcaaggaacg ttacggtgag 1800
cgcctggagg cgctgtacga tcagattgca cagggccaag ctgacgagtt gcgtgcattg 1860
cgtgaacagg cgggcgaacg cccagtgatc gatacggtgc gcaaagccgc tgccgcggtg 1920
gtggggtcat caggggccga ttttcgccca gatgctaatt tcgcagatct gggaggtgat 1980
agcctgtcag cgctggggtt cgccaattta ctgcaagatg tgttcggcgt tgaaactccg 2040
gtccggatca ttattggacc tactgcgagt ctggcgggca ttgccgaaca tatcgaacgc 2100
gctttaggcg gtcgccctgg cgaagcggca ccaaattcgg caagtgtgca tggcgcgggt 2160
gcagaagtaa tccgcgcatc tgacctgacg ttagacaaat tcttggacgc tcaagcctta 2220
gaagccgcgc agtcgttacc acgtccgaca ggcagccatc ggacggtcct gttgactgga 2280
gcgaatggat ggttagggcg cttcctggcg ctcgagcagt tgcagcgctt agaagccacg 2340
ggcggaaaac tgatctgctt agtgcgcggt aaagacgcag cgtcagcgcg tgcacgcgtg 2400
gaggaagcgc tgggcaccga tcccgcatta gcagcgcgct ttgccgagct ggccgcagat 2460
cgtctggaag ttgttccggg tgacgtgggc gaaccgaagt tcggtctgga cgatcgcacg 2520
tgggatcggc tggctggtga ggtagatgcg gtagtccatt ctggcgcgct ggttaaccac 2580
gttttgccct atcaccagct gttcggcagt aacgtggtgg gcgtggcaga aatcatccgt 2640
ttcgctgtgg cctctaaact taaaccggtg gcctatctct ccactgttgc tgtggctgcg 2700
ggcgccgatc ctgccgcgtt tgatgaagat ggtgacattc gggaggtagt gccgcaacgc 2760
ccggtcgatg actcgtatgc caacggctat ggcaacagca agtgggcggg tgaggtgctg 2820
ttacgcgaag cacacgaacg taccgggctg ccggtgcgtg tctttcgcag tgacatgatt 2880
ctggcccatc gccaacacac cggccagctc aatgcgaccg accagtttac ccgtctgatt 2940
ctgtccttac tggctactgg tttggctcca aaatcgttct atcagttaga tccgcaaggt 3000
cgtcgccagc gtgcacatta cgacggtatt ccggtcgatt ttacggctga ggcgatcgtt 3060
gcccttgccg ccgagggaaa taatgggcac cgttcctata acgtctttaa cccgcaccat 3120
gatggggttg ggctggacga gtttgtggat tggctgatcg aagccggtca tccgattacc 3180
cgcattgagg atcacgccac atggttcgcc cgttttacca ctgcgctgcg ggcgcttcct 3240
gagaaacaac gccagttgtc gttgctccct ctggctcagg tgtatagctt tccccatccg 3300
gcggttgatg gatccccgtt ccgtaacgca gtatttcgtg cggacgtgca acgtgcgcgt 3360
attggtaaag atcatgatat tccgcatctc acccgtgaac tgatcctgaa atatgctgcc 3420
gatctggccg ctctcggctc actttaa 3447
<210> 7
<211> 1148
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /记录="人工序列描述:合成
多肽"
<400> 7
Met Gly Asp Gly Glu Glu Arg Ala Lys Arg Phe Phe Gln Arg Ile Gly
1 5 10 15
Glu Leu Ser Ala Thr Asp Pro Gln Phe Ala Ala Ala Ala Pro Asp Pro
20 25 30
Ala Val Val Glu Ala Val Ser Asp Pro Ser Leu Ser Phe Thr Arg Tyr
35 40 45
Leu Asp Thr Leu Met Arg Gly Tyr Ala Glu Arg Pro Ala Leu Ala His
50 55 60
Arg Val Gly Ala Gly Tyr Glu Thr Ile Ser Tyr Gly Glu Leu Trp Ala
65 70 75 80
Arg Val Gly Ala Ile Ala Ala Ala Trp Gln Ala Asp Gly Leu Ala Pro
85 90 95
Gly Asp Phe Val Ala Thr Val Gly Phe Thr Ser Pro Asp Tyr Val Ala
100 105 110
Val Asp Leu Ala Ala Ala Arg Ser Gly Leu Val Ser Val Pro Leu Gln
115 120 125
Ala Gly Ala Ser Leu Ala Gln Leu Val Gly Ile Leu Glu Glu Thr Glu
130 135 140
Pro Lys Val Leu Ala Ala Ser Ala Ser Ser Leu Glu Gly Ala Val Ala
145 150 155 160
Cys Ala Leu Ala Ala Pro Ser Val Gln Arg Leu Val Val Phe Asp Leu
165 170 175
Arg Gly Pro Asp Ala Ser Glu Ser Ala Ala Asp Glu Arg Arg Gly Ala
180 185 190
Leu Ala Asp Ala Glu Glu Gln Leu Ala Arg Ala Gly Arg Ala Val Val
195 200 205
Val Glu Thr Leu Ala Asp Leu Ala Ala Arg Gly Glu Ala Leu Pro Glu
210 215 220
Ala Pro Leu Phe Glu Pro Ala Glu Gly Glu Asp Pro Leu Ala Leu Leu
225 230 235 240
Ile Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Ala Met Tyr Ser
245 250 255
Gln Arg Leu Val Ser Gln Leu Trp Gly Arg Thr Pro Val Val Pro Gly
260 265 270
Met Pro Asn Ile Ser Leu His Tyr Met Pro Leu Ser His Ser Tyr Gly
275 280 285
Arg Ala Val Leu Ala Gly Ala Leu Ser Ala Gly Gly Thr Ala His Phe
290 295 300
Thr Ala Asn Ser Asp Leu Ser Thr Leu Phe Glu Asp Ile Ala Leu Ala
305 310 315 320
Arg Pro Thr Phe Leu Ala Leu Val Pro Arg Val Cys Glu Met Leu Phe
325 330 335
Gln Glu Ser Gln Arg Gly Gln Asp Val Ala Glu Leu Arg Glu Arg Val
340 345 350
Leu Gly Gly Arg Leu Leu Val Ala Val Cys Gly Ser Ala Pro Leu Ser
355 360 365
Pro Glu Met Arg Ala Phe Met Glu Glu Val Leu Gly Phe Pro Leu Leu
370 375 380
Asp Gly Tyr Gly Ser Thr Glu Ala Leu Gly Val Met Arg Asn Gly Ile
385 390 395 400
Ile Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu
405 410 415
Leu Gly Tyr Arg Thr Thr Asp Lys Pro Tyr Pro Arg Gly Glu Leu Cys
420 425 430
Ile Arg Ser Thr Ser Leu Ile Ser Gly Tyr Tyr Lys Arg Pro Glu Ile
435 440 445
Thr Ala Glu Val Phe Asp Ala Gln Gly Tyr Tyr Lys Thr Gly Asp Val
450 455 460
Met Ala Glu Ile Ala Pro Asp His Leu Val Tyr Val Asp Arg Ser Lys
465 470 475 480
Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Lys Leu
485 490 495
Glu Ala Ala Tyr Gly Thr Ser Pro Tyr Val Lys Gln Ile Phe Val Tyr
500 505 510
Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val Val Val Pro Asn Ala
515 520 525
Glu Val Leu Gly Ala Arg Asp Gln Glu Glu Ala Lys Pro Leu Ile Ala
530 535 540
Ala Ser Leu Gln Lys Ile Ala Lys Glu Ala Gly Leu Gln Ser Tyr Glu
545 550 555 560
Val Pro Arg Asp Phe Leu Ile Glu Thr Glu Pro Phe Thr Thr Gln Asn
565 570 575
Gly Leu Leu Ser Glu Val Gly Lys Leu Leu Arg Pro Lys Leu Lys Ala
580 585 590
Arg Tyr Gly Glu Ala Leu Glu Ala Arg Tyr Asp Glu Ile Ala His Gly
595 600 605
Gln Ala Asp Glu Leu Arg Ala Leu Arg Asp Gly Ala Gly Gln Arg Pro
610 615 620
Val Val Glu Thr Val Val Arg Ala Ala Val Ala Ile Ser Gly Ser Glu
625 630 635 640
Gly Ala Glu Val Gly Pro Glu Ala Asn Phe Ala Asp Leu Gly Gly Asp
645 650 655
Ser Leu Ser Ala Leu Ser Leu Ala Asn Leu Leu His Asp Val Phe Glu
660 665 670
Val Glu Val Pro Val Arg Ile Ile Ile Gly Pro Thr Ala Ser Leu Ala
675 680 685
Gly Ile Ala Lys His Ile Glu Ala Glu Arg Ala Gly Ala Ser Ala Pro
690 695 700
Thr Ala Ala Ser Val His Gly Ala Gly Ala Thr Arg Ile Arg Ala Ser
705 710 715 720
Glu Leu Thr Leu Glu Lys Phe Leu Pro Glu Asp Leu Leu Ala Ala Ala
725 730 735
Lys Gly Leu Pro Ala Ala Asp Gln Val Arg Thr Val Leu Leu Thr Gly
740 745 750
Ala Asn Gly Trp Leu Gly Arg Phe Leu Ala Leu Glu Gln Leu Glu Arg
755 760 765
Leu Ala Arg Ser Gly Gln Asp Gly Gly Lys Leu Ile Cys Leu Val Arg
770 775 780
Gly Lys Asp Ala Ala Ala Ala Arg Arg Arg Ile Glu Glu Thr Leu Gly
785 790 795 800
Thr Asp Pro Ala Leu Ala Ala Arg Phe Ala Glu Leu Ala Glu Gly Arg
805 810 815
Leu Glu Val Val Pro Gly Asp Val Gly Glu Pro Lys Phe Gly Leu Asp
820 825 830
Asp Ala Ala Trp Asp Arg Leu Ala Glu Glu Val Asp Val Ile Val His
835 840 845
Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr His Gln Leu Phe Gly
850 855 860
Pro Asn Val Val Gly Thr Ala Glu Ile Ile Arg Leu Ala Ile Thr Ala
865 870 875 880
Lys Arg Lys Pro Val Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly
885 890 895
Val Glu Pro Ser Ser Phe Glu Glu Asp Gly Asp Ile Arg Ala Val Val
900 905 910
Pro Glu Arg Pro Leu Gly Asp Gly Tyr Ala Asn Gly Tyr Gly Asn Ser
915 920 925
Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Glu Leu Val Gly
930 935 940
Leu Pro Val Ala Val Phe Arg Ser Asp Met Ile Leu Ala His Thr Arg
945 950 955 960
Tyr Thr Gly Gln Leu Asn Val Pro Asp Gln Phe Thr Arg Leu Val Leu
965 970 975
Ser Leu Leu Ala Thr Gly Ile Ala Pro Lys Ser Phe Tyr Gln Gln Gly
980 985 990
Ala Ala Gly Glu Arg Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp
995 1000 1005
Phe Thr Ala Glu Ala Ile Thr Thr Leu Gly Ala Glu Pro Ser Trp
1010 1015 1020
Phe Asp Gly Gly Ala Gly Phe Arg Ser Phe Asp Val Phe Asn Pro
1025 1030 1035
His His Asp Gly Val Gly Leu Asp Glu Phe Val Asp Trp Leu Ile
1040 1045 1050
Glu Ala Gly His Pro Ile Ser Arg Ile Asp Asp His Lys Glu Trp
1055 1060 1065
Phe Ala Arg Phe Glu Thr Ala Val Arg Gly Leu Pro Glu Ala Gln
1070 1075 1080
Arg Gln His Ser Leu Leu Pro Leu Leu Arg Ala Tyr Ser Phe Pro
1085 1090 1095
His Pro Pro Val Asp Gly Ser Val Tyr Pro Thr Gly Lys Phe Gln
1100 1105 1110
Gly Ala Val Lys Ala Ala Gln Val Gly Ser Asp His Asp Val Pro
1115 1120 1125
His Leu Gly Lys Ala Leu Ile Val Lys Tyr Ala Asp Asp Leu Lys
1130 1135 1140
Ala Leu Gly Leu Leu
1145
<210> 8
<211> 1148
<212> PRT
<213> Segniliparus rotundus
<400> 8
Met Gly Ser Gly Ala Asp Arg Ala Lys Leu Phe Phe Gln Lys Ile Glu
1 5 10 15
Glu Leu Thr Ala Ala Asp Pro Gln Phe Ala Ala Ala Val Pro Asp Gln
20 25 30
Glu Val Val Ala Ala Val Ser Asp Pro Thr Leu Ser Phe Thr Arg Tyr
35 40 45
Leu Asp Thr Leu Met Arg Gly Tyr Ala Asp Arg Pro Ala Leu Ala His
50 55 60
Arg Val Gly Asp Gly Tyr Ala Thr Ile Ser Tyr Gly Glu Leu Trp Ser
65 70 75 80
Arg Val Gly Ala Ile Ala Ala Ala Trp Ser Ala Asp Gly Leu Glu Pro
85 90 95
Gly Asp Phe Val Ala Thr Ile Gly Phe Thr Ser Pro Asp Tyr Thr Ala
100 105 110
Leu Asp Leu Ala Ala Thr Arg Ser Gly Leu Val Ser Val Pro Leu Gln
115 120 125
Ala Gly Ala Ser Val Ala Gln Leu Ser Ala Ile Leu Glu Glu Thr Ala
130 135 140
Pro Lys Val Phe Ala Ala Ser Ala Glu Ser Leu Glu Gly Ala Val Asp
145 150 155 160
Cys Val Leu Arg Thr Pro Ser Val Gln Arg Leu Val Ile Phe Asp Leu
165 170 175
Arg Asp Asp Ser Pro Glu His Arg Ala Ala Leu Ala Ala Ala Lys Ala
180 185 190
Lys Leu Ala Gln Pro Gln Asn Pro Glu Gln Ala Arg Gly Pro Val Ala
195 200 205
Val Glu Thr Leu Asp Glu Leu Val Ala Arg Gly Ala Ala Leu Pro Glu
210 215 220
Pro Pro Val Phe Glu Pro Ala Glu Gly Glu Asp Pro Leu Ala Leu Leu
225 230 235 240
Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys Gly Ala Met Tyr Ser
245 250 255
Gln Arg Leu Val Ser Arg Phe Trp Pro Arg Thr Pro Val Val Ala Gln
260 265 270
Leu Pro Ser Ile Ser Leu His Tyr Met Pro Leu Ser His Ser Tyr Gly
275 280 285
Arg Ala Val Leu Cys Gly Thr Leu Ala Ala Gly Gly Thr Ala His Phe
290 295 300
Thr Ala His Ser Asp Leu Ser Thr Leu Phe Glu Asp Ile Ala Leu Ala
305 310 315 320
Arg Pro Thr Phe Leu Ala Leu Val Pro Arg Val Cys Glu Met Leu Leu
325 330 335
His Glu Ser Arg Arg Ala Arg Asp Leu Ala Glu Leu Arg Glu Arg Val
340 345 350
Leu Gly Glu Arg Leu Leu Val Ala Val Cys Gly Ser Ala Pro Leu Ala
355 360 365
Pro Glu Thr Arg Ala Phe Met Glu Glu Leu Leu Gly Phe Pro Leu Leu
370 375 380
Asp Gly Tyr Gly Ser Thr Glu Ala Leu Ser Leu Met Arg Asp Gly Val
385 390 395 400
Ile Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu
405 410 415
Leu Gly Tyr Phe Thr Thr Asp Lys Pro His Pro Arg Gly Glu Leu Leu
420 425 430
Ile Arg Ser Glu Ser Leu Val Ser Gly Tyr Tyr Lys Arg Pro Glu Leu
435 440 445
Thr Ala Glu Met Phe Asp Glu Gln Gly Tyr Tyr Lys Thr Gly Asp Val
450 455 460
Met Ala Glu Ile Ala Pro Asp Arg Leu Val Tyr Val Asp Arg Ser Lys
465 470 475 480
Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Lys Leu
485 490 495
Glu Ala Ala Phe Gly Ala Ser Pro Tyr Val Lys Gln Ile Phe Val Tyr
500 505 510
Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val Val Val Pro Asn Ala
515 520 525
Glu Leu Val Gly Arg Leu Asp Thr Val Gln Ala Leu Ala Glu Val Lys
530 535 540
Pro Leu Ile Ala Asp Ser Leu Ala Ala Ile Ala Lys Glu Ser Gly Leu
545 550 555 560
Gln Ser Tyr Glu Val Pro Arg Asp Phe Ile Val Glu Thr Glu Pro Phe
565 570 575
Thr Thr Gly Asn Gly Leu Leu Ser Glu Val Gly Lys Leu Leu Arg Pro
580 585 590
Lys Leu Lys Glu Arg Tyr Gly Glu Arg Leu Glu Ala Leu Tyr Asp Gln
595 600 605
Ile Ala Gln Gly Gln Ala Asp Glu Leu Arg Ala Leu Arg Glu Gln Ala
610 615 620
Gly Glu Arg Pro Val Ile Asp Thr Val Arg Lys Ala Ala Ala Ala Val
625 630 635 640
Val Gly Ser Ser Gly Ala Asp Phe Arg Pro Asp Ala Asn Phe Ala Asp
645 650 655
Leu Gly Gly Asp Ser Leu Ser Ala Leu Gly Phe Ala Asn Leu Leu Gln
660 665 670
Asp Val Phe Gly Val Glu Thr Pro Val Arg Ile Ile Ile Gly Pro Thr
675 680 685
Ala Ser Leu Ala Gly Ile Ala Glu His Ile Glu Arg Ala Leu Gly Gly
690 695 700
Arg Pro Gly Glu Ala Ala Pro Asn Ser Ala Ser Val His Gly Ala Gly
705 710 715 720
Ala Glu Val Ile Arg Ala Ser Asp Leu Thr Leu Asp Lys Phe Leu Asp
725 730 735
Ala Gln Ala Leu Glu Ala Ala Gln Ser Leu Pro Arg Pro Thr Gly Ser
740 745 750
His Arg Thr Val Leu Leu Thr Gly Ala Asn Gly Trp Leu Gly Arg Phe
755 760 765
Leu Ala Leu Glu Gln Leu Gln Arg Leu Glu Ala Thr Gly Gly Lys Leu
770 775 780
Ile Cys Leu Val Arg Gly Lys Asp Ala Ala Ser Ala Arg Ala Arg Val
785 790 795 800
Glu Glu Ala Leu Gly Thr Asp Pro Ala Leu Ala Ala Arg Phe Ala Glu
805 810 815
Leu Ala Ala Asp Arg Leu Glu Val Val Pro Gly Asp Val Gly Glu Pro
820 825 830
Lys Phe Gly Leu Asp Asp Arg Thr Trp Asp Arg Leu Ala Gly Glu Val
835 840 845
Asp Ala Val Val His Ser Gly Ala Leu Val Asn His Val Leu Pro Tyr
850 855 860
His Gln Leu Phe Gly Ser Asn Val Val Gly Val Ala Glu Ile Ile Arg
865 870 875 880
Phe Ala Val Ala Ser Lys Leu Lys Pro Val Ala Tyr Leu Ser Thr Val
885 890 895
Ala Val Ala Ala Gly Ala Asp Pro Ala Ala Phe Asp Glu Asp Gly Asp
900 905 910
Ile Arg Glu Val Val Pro Gln Arg Pro Val Asp Asp Ser Tyr Ala Asn
915 920 925
Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala
930 935 940
His Glu Arg Thr Gly Leu Pro Val Arg Val Phe Arg Ser Asp Met Ile
945 950 955 960
Leu Ala His Arg Gln His Thr Gly Gln Leu Asn Ala Thr Asp Gln Phe
965 970 975
Thr Arg Leu Ile Leu Ser Leu Leu Ala Thr Gly Leu Ala Pro Lys Ser
980 985 990
Phe Tyr Gln Leu Asp Pro Gln Gly Arg Arg Gln Arg Ala His Tyr Asp
995 1000 1005
Gly Ile Pro Val Asp Phe Thr Ala Glu Ala Ile Val Ala Leu Ala
1010 1015 1020
Ala Glu Gly Asn Asn Gly His Arg Ser Tyr Asn Val Phe Asn Pro
1025 1030 1035
His His Asp Gly Val Gly Leu Asp Glu Phe Val Asp Trp Leu Ile
1040 1045 1050
Glu Ala Gly His Pro Ile Thr Arg Ile Glu Asp His Ala Thr Trp
1055 1060 1065
Phe Ala Arg Phe Thr Thr Ala Leu Arg Ala Leu Pro Glu Lys Gln
1070 1075 1080
Arg Gln Leu Ser Leu Leu Pro Leu Ala Gln Val Tyr Ser Phe Pro
1085 1090 1095
His Pro Ala Val Asp Gly Ser Pro Phe Arg Asn Ala Val Phe Arg
1100 1105 1110
Ala Asp Val Gln Arg Ala Arg Ile Gly Lys Asp His Asp Ile Pro
1115 1120 1125
His Leu Thr Arg Glu Leu Ile Leu Lys Tyr Ala Ala Asp Leu Ala
1130 1135 1140
Ala Leu Gly Leu Leu
1145
<210> 9
<211> 3447
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /记录="人工序列描述:合成
多核苷酸"
<400> 9
atgggcgacg gcgaagaacg tgcgaaacgc tttttccaac gtatcggtga actgtctgcg 60
accgatccgc agtttgcagc agcagctccg gacccggctg tggttgaagc cgtgagtgat 120
ccgtcactgt cgttcacccg ctatctggat acgctgatgc gcggctacgc agaacgtccg 180
gctctggcac atcgtgtggg tgcaggttat gaaaccatca gctacggtga actgtgggcc 240
cgtgttggtg caattgcagc agcatggcag gctgatggtc tggcaccggg tgacttcgtc 300
gcaaccgtgg gttttacgtc cccggattat gttgcagtcg acctggctgc agcacgttca 360
ggtctggtgt cggttccgct gcaagccggt gcatcactgg cccagctggt tggcattctg 420
gaagaaaccg aaccgaaagt cctggcagct tcggcaagct ctctggaagg cgctgttgcg 480
tgcgcactgg cagcaccgag cgtccagcgc ctggtcgtgt ttgatctgcg tggtccggac 540
gcgagcgaat ctgcagctga tgaacgtcgc ggcgcactgg ctgacgcaga agaacagctg 600
gcccgcgcag gtcgtgcagt tgtcgtggaa accctggctg atctggcagc gcgtggcgaa 660
gccctgccgg aagcaccgct gtttgaaccg gcggaaggtg aagatccgct ggccctgctg 720
atctatacca gtggctccac gggtgctccg aaaggtgcga tgtacagtca acgcctggtg 780
tcccagctgt ggggtcgtac cccggttgtc ccgggtatgc cgaacatttc cctgcattat 840
atgccgctgt cacactcgta cggtcgtgcg gttctggctg gtgcactgtc agccggcggt 900
accgcacatt tcacggctaa tagcgatctg tctaccctgt ttgaagacat cgcactggca 960
cgtccgacgt tcctggcact ggttccgcgt gtctgcgaaa tgctgtttca ggaatcgcaa 1020
cgcggccagg atgtggccga actgcgcgaa cgtgttctgg gcggtcgtct gctggtcgca 1080
gtgtgtggta gcgctccgct gtcttctgaa atgcgcgcgt tcatggaaga agtgctggaa 1140
tttccgctgc tggatggcta tggttcaacc gaagccctgg gtgtgatgcg caacggcatt 1200
atccagcgtc cgccggttat tgattacaaa ctggttgacg tcccggaact gggttatcgt 1260
accacggata agccgtaccc gcgcggcgaa ctgtgtatcc gtagcacgtc tctgattagc 1320
ggttattaca aacgtccgga aatcaccgcg gaagtgtttg acgcccaggg ttattacaag 1380
acgggcgatg ttatggcgga aattgccccg gatcatctgg tgtatgttga ccgtagcaaa 1440
aatgtgctga agctgtctca aggcgaattc gtcgctgtgg cgaaactgga agcagcttat 1500
ggtacctctc cgtacgtgaa gcagatcttc gtttatggca acagtgaacg ctcctttctg 1560
ctggcagtgg ttgtcccgaa tgcagaagtg ctgggtgctc gtgatcagga agaagcgaaa 1620
ccgctgatcg cggcctccct gcaaaaaatt gcaaaggaag ctggcctgca gagctatgaa 1680
gtgccgcgcg atttcctgat tgaaaccgaa ccgtttacca cgcagaacgg tctgctgtct 1740
gaagttggca agctgctgcg cccgaaactg aaggcgcgtt atggcgaagc gctggaagcc 1800
cgttacgatg aaatcgcgca tggtcaagcc gatgaactgc gtgcgctgcg tgacctggcc 1860
ggtcagcgtc cggtggttga aaccgtcgtg cgtgcagctg tggcaattag tggctccgaa 1920
ggtgctgaag ttggtccgga agcaaacttt gctgatctgg gcggtgactc actgtcggca 1980
ctgtcgctgg ctaatctgct gcacgatgtg ttcgaagttg aagtcccggt gcgcattatc 2040
attggtccga ccgcgagcct ggcaggtatc gcacgtcata ttgaagcgga acgtgcaggt 2100
gcatcagctc cgacggcagc ctcggttcac ggcgcaggtg caacccgtat tcgtgcatcc 2160
gaactgacgc tggaaaaatt tctgccggaa gacctgctgg cagctgcaaa gggtctgccg 2220
gcagcagatc aagtgcgtac cgttctgctg acgggtgcaa atggttggct gggccgtttc 2280
ctggccctgg aacaactgga acgcctggca cgtagtggtc aggacggcgg taaactgatc 2340
tgcctggtgc gtggcaagga tgctgcagca gcacgtcgcc gtattgaaga aaccctgggt 2400
acggatccgg cactggctgc acgttttgct gaactggcgg aaggtcgtct ggaagttgtc 2460
ccgggtgatg tgggcgaacc gaaattcggc ctggatgacg ccgcatggga tcgtctggcg 2520
gaagaagttg acgtcattgt gcatccggct gcgctggtca accatgtgct gccgtatcac 2580
cagctgtttg gtccgaatgt ggttggcacc gcggaaatca ttcgcctggc catcacggca 2640
aaacgtaaac cggtgaccta cctgagcacg gttgccgtcg ccgcaggtgt tgaaccgagt 2700
tccttcgaag aagatggcga cattcgtgca gtcgtgccgg aacgtccgct gggtgatggt 2760
tatgcaaacg gctacggtaa ttctaaatgg gcaggtgaag tgctgctgcg tgaagcacat 2820
gaactggttg gcctgccggt ggcagttttt cgcagtgaca tgatcctggc gcacacccgt 2880
tatacgggtc aactgaacgt cccggatcag tttacccgtc tggtgctgtc gctgctggca 2940
acgggtattg caccgaaatc tttttatcag caaggtgctg caggtgaacg tcagcgtgca 3000
cactacgatg gcatcccggt ggactttacc gcagaagcta ttaccacgct gggtgccgaa 3060
ccgtcttggt tcgatggcgg tgcaggcttt cgcagtttcg atgtttttaa tccgcatcac 3120
gacggcgttg gtctggatga atttgtcgac tggctgatcg aagcgggtca tccgatcagt 3180
cgtattgatg accacaaaga atggttcgca cgctttgaaa ccgctgtgcg tggcctgccg 3240
gaagcacagc gccaacatag tctgctgccg ctgctgcgtg cctattcctt tccgcacccg 3300
ccggttgatg gttcagtcta cccgacgggt aaattccaag gtgcagtcaa ggcagcacaa 3360
gtgggtagcg atcatgacgt cccgcacctg ggcaaagccc tgattgtgaa gtatgcggat 3420
gacctgaaag ccctgggcct gctgtaa 3447
<210> 10
<211> 1148
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /记录="人工序列描述:合成
多肽"
<400> 10
Met Gly Asp Gly Glu Glu Arg Ala Lys Arg Phe Phe Gln Arg Ile Gly
1 5 10 15
Glu Leu Ser Ala Thr Asp Pro Gln Phe Ala Ala Ala Ala Pro Asp Pro
20 25 30
Ala Val Val Glu Ala Val Ser Asp Pro Ser Leu Ser Phe Thr Arg Tyr
35 40 45
Leu Asp Thr Leu Met Arg Gly Tyr Ala Glu Arg Pro Ala Leu Ala His
50 55 60
Arg Val Gly Ala Gly Tyr Glu Thr Ile Ser Tyr Gly Glu Leu Trp Ala
65 70 75 80
Arg Val Gly Ala Ile Ala Ala Ala Trp Gln Ala Asp Gly Leu Ala Pro
85 90 95
Gly Asp Phe Val Ala Thr Val Gly Phe Thr Ser Pro Asp Tyr Val Ala
100 105 110
Val Asp Leu Ala Ala Ala Arg Ser Gly Leu Val Ser Val Pro Leu Gln
115 120 125
Ala Gly Ala Ser Leu Ala Gln Leu Val Gly Ile Leu Glu Glu Thr Glu
130 135 140
Pro Lys Val Leu Ala Ala Ser Ala Ser Ser Leu Glu Gly Ala Val Ala
145 150 155 160
Cys Ala Leu Ala Ala Pro Ser Val Gln Arg Leu Val Val Phe Asp Leu
165 170 175
Arg Gly Pro Asp Ala Ser Glu Ser Ala Ala Asp Glu Arg Arg Gly Ala
180 185 190
Leu Ala Asp Ala Glu Glu Gln Leu Ala Arg Ala Gly Arg Ala Val Val
195 200 205
Val Glu Thr Leu Ala Asp Leu Ala Ala Arg Gly Glu Ala Leu Pro Glu
210 215 220
Ala Pro Leu Phe Glu Pro Ala Glu Gly Glu Asp Pro Leu Ala Leu Leu
225 230 235 240
Ile Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Ala Met Tyr Ser
245 250 255
Gln Arg Leu Val Ser Gln Leu Trp Gly Arg Thr Pro Val Val Pro Gly
260 265 270
Met Pro Asn Ile Ser Leu His Tyr Met Pro Leu Ser His Ser Tyr Gly
275 280 285
Arg Ala Val Leu Ala Gly Ala Leu Ser Ala Gly Gly Thr Ala His Phe
290 295 300
Thr Ala Asn Ser Asp Leu Ser Thr Leu Phe Glu Asp Ile Ala Leu Ala
305 310 315 320
Arg Pro Thr Phe Leu Ala Leu Val Pro Arg Val Cys Glu Met Leu Phe
325 330 335
Gln Glu Ser Gln Arg Gly Gln Asp Val Ala Glu Leu Arg Glu Arg Val
340 345 350
Leu Gly Gly Arg Leu Leu Val Ala Val Cys Gly Ser Ala Pro Leu Ser
355 360 365
Ser Glu Met Arg Ala Phe Met Glu Glu Val Leu Glu Phe Pro Leu Leu
370 375 380
Asp Gly Tyr Gly Ser Thr Glu Ala Leu Gly Val Met Arg Asn Gly Ile
385 390 395 400
Ile Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu
405 410 415
Leu Gly Tyr Arg Thr Thr Asp Lys Pro Tyr Pro Arg Gly Glu Leu Cys
420 425 430
Ile Arg Ser Thr Ser Leu Ile Ser Gly Tyr Tyr Lys Arg Pro Glu Ile
435 440 445
Thr Ala Glu Val Phe Asp Ala Gln Gly Tyr Tyr Lys Thr Gly Asp Val
450 455 460
Met Ala Glu Ile Ala Pro Asp His Leu Val Tyr Val Asp Arg Ser Lys
465 470 475 480
Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Lys Leu
485 490 495
Glu Ala Ala Tyr Gly Thr Ser Pro Tyr Val Lys Gln Ile Phe Val Tyr
500 505 510
Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val Val Val Pro Asn Ala
515 520 525
Glu Val Leu Gly Ala Arg Asp Gln Glu Glu Ala Lys Pro Leu Ile Ala
530 535 540
Ala Ser Leu Gln Lys Ile Ala Lys Glu Ala Gly Leu Gln Ser Tyr Glu
545 550 555 560
Val Pro Arg Asp Phe Leu Ile Glu Thr Glu Pro Phe Thr Thr Gln Asn
565 570 575
Gly Leu Leu Ser Glu Val Gly Lys Leu Leu Arg Pro Lys Leu Lys Ala
580 585 590
Arg Tyr Gly Glu Ala Leu Glu Ala Arg Tyr Asp Glu Ile Ala His Gly
595 600 605
Gln Ala Asp Glu Leu Arg Ala Leu Arg Asp Leu Ala Gly Gln Arg Pro
610 615 620
Val Val Glu Thr Val Val Arg Ala Ala Val Ala Ile Ser Gly Ser Glu
625 630 635 640
Gly Ala Glu Val Gly Pro Glu Ala Asn Phe Ala Asp Leu Gly Gly Asp
645 650 655
Ser Leu Ser Ala Leu Ser Leu Ala Asn Leu Leu His Asp Val Phe Glu
660 665 670
Val Glu Val Pro Val Arg Ile Ile Ile Gly Pro Thr Ala Ser Leu Ala
675 680 685
Gly Ile Ala Arg His Ile Glu Ala Glu Arg Ala Gly Ala Ser Ala Pro
690 695 700
Thr Ala Ala Ser Val His Gly Ala Gly Ala Thr Arg Ile Arg Ala Ser
705 710 715 720
Glu Leu Thr Leu Glu Lys Phe Leu Pro Glu Asp Leu Leu Ala Ala Ala
725 730 735
Lys Gly Leu Pro Ala Ala Asp Gln Val Arg Thr Val Leu Leu Thr Gly
740 745 750
Ala Asn Gly Trp Leu Gly Arg Phe Leu Ala Leu Glu Gln Leu Glu Arg
755 760 765
Leu Ala Arg Ser Gly Gln Asp Gly Gly Lys Leu Ile Cys Leu Val Arg
770 775 780
Gly Lys Asp Ala Ala Ala Ala Arg Arg Arg Ile Glu Glu Thr Leu Gly
785 790 795 800
Thr Asp Pro Ala Leu Ala Ala Arg Phe Ala Glu Leu Ala Glu Gly Arg
805 810 815
Leu Glu Val Val Pro Gly Asp Val Gly Glu Pro Lys Phe Gly Leu Asp
820 825 830
Asp Ala Ala Trp Asp Arg Leu Ala Glu Glu Val Asp Val Ile Val His
835 840 845
Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr His Gln Leu Phe Gly
850 855 860
Pro Asn Val Val Gly Thr Ala Glu Ile Ile Arg Leu Ala Ile Thr Ala
865 870 875 880
Lys Arg Lys Pro Val Thr Tyr Leu Ser Thr Val Ala Val Ala Ala Gly
885 890 895
Val Glu Pro Ser Ser Phe Glu Glu Asp Gly Asp Ile Arg Ala Val Val
900 905 910
Pro Glu Arg Pro Leu Gly Asp Gly Tyr Ala Asn Gly Tyr Gly Asn Ser
915 920 925
Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Glu Leu Val Gly
930 935 940
Leu Pro Val Ala Val Phe Arg Ser Asp Met Ile Leu Ala His Thr Arg
945 950 955 960
Tyr Thr Gly Gln Leu Asn Val Pro Asp Gln Phe Thr Arg Leu Val Leu
965 970 975
Ser Leu Leu Ala Thr Gly Ile Ala Pro Lys Ser Phe Tyr Gln Gln Gly
980 985 990
Ala Ala Gly Glu Arg Gln Arg Ala His Tyr Asp Gly Ile Pro Val Asp
995 1000 1005
Phe Thr Ala Glu Ala Ile Thr Thr Leu Gly Ala Glu Pro Ser Trp
1010 1015 1020
Phe Asp Gly Gly Ala Gly Phe Arg Ser Phe Asp Val Phe Asn Pro
1025 1030 1035
His His Asp Gly Val Gly Leu Asp Glu Phe Val Asp Trp Leu Ile
1040 1045 1050
Glu Ala Gly His Pro Ile Ser Arg Ile Asp Asp His Lys Glu Trp
1055 1060 1065
Phe Ala Arg Phe Glu Thr Ala Val Arg Gly Leu Pro Glu Ala Gln
1070 1075 1080
Arg Gln His Ser Leu Leu Pro Leu Leu Arg Ala Tyr Ser Phe Pro
1085 1090 1095
His Pro Pro Val Asp Gly Ser Val Tyr Pro Thr Gly Lys Phe Gln
1100 1105 1110
Gly Ala Val Lys Ala Ala Gln Val Gly Ser Asp His Asp Val Pro
1115 1120 1125
His Leu Gly Lys Ala Leu Ile Val Lys Tyr Ala Asp Asp Leu Lys
1130 1135 1140
Ala Leu Gly Leu Leu
1145
<210> 11
<211> 3447
<212> DNA
<213> 人工序列
<220>
<221> 来源
<223> /记录="人工序列描述:合成
多核苷酸"
<400> 11
atgggctctg gagcggatcg cgcgaagctg ttctttcaga aaattgaaga actgactgca 60
gcggacccac aatttgcagc agccgtgccc gatcaggaag tggtggccgc cgtaagcgac 120
ccaactctgt cgtttacccg ttatctcgat accctgatgc gtggctatgc ggatcgtccg 180
gcactggcgc atcgcgttgg tgacggttat gcgaccatct cttacgggga actgtggtca 240
cgcgttggag cgattgctgc agcctggagc gcggatggac tggagccggg tgattttgtg 300
gctacgattg ggttcactag tccggactat accgccctgg atctggcagc gacccgttcc 360
gggctcgtta gcgttccgct gcaggcgggc gctagtgtgg cgcagctgtc ggcgatcctg 420
gaggaaacag cccctaaagt tttcgcagcg agcgccgaaa gcctggaagg tgctgtggat 480
tgcgttttgc gcaccccgag tgtgcagcgc ctggtcattt tcgacttacg ggatgatagc 540
cctgagcatc gcgctgcctt agcggctgca aaagcgaaac ttgctcagcc gcagaatccc 600
gaacaggccc gcgggccggt agcggtagag acactggatg aactggttgc tcgtggtgcg 660
gcacttccgg aacctcctgt ctttgaacca gcggaaggtg aagatccgct ggccctcctg 720
atctacacca gcggttccac cggcacgccg aaaggggcaa tgtactcgca gcgccttgta 780
tctcgcttct ggccccgcac gccggtcgtt gcgcagctgc catccatctc acttcactac 840
atgccgctta gccacagcta tggccgtgcc gtgctgtgtg gcaccctggc ggctggtggt 900
acagcgcact ttacggctca tagcgatctg tccacgctgt ttgaagatat tgccctcgca 960
cgcccgacgt ttctggcact ggtcccgcgt atgtgcgaaa tgctgctcca cgagtcgcgc 1020
cgcgcgcgtg acttagcaga actgcgcgaa cgggttttgg gtgaacgcct gctcgtggcg 1080
gtttgtggta gtgcgcctct tgcgccagaa acccgcgcgt ttatggaaga gctgctgggc 1140
tttccactgc tggatggcta tggctcaacc gaagcgttga gcctgatgcg cgatggcgtg 1200
attcagcgtc ctccggtaat tgactacaaa ttggtggacg tcccggaact gggttacttt 1260
accaccgata aaccgcatcc ccgtggcgaa ctgttgattc gctctgaatc tcttgtaagc 1320
ggttactata aacgtccaga agaaacagcg gagatgttcg atgagcaagg ttactacaag 1380
accggcgatg taatggccga aattgccccg gaccgcctgg tctacgttga ccgctccaag 1440
aacgtcctga aactgtcgca aggggaattt gttgccgtgg caaaattgga ggccgcattc 1500
ggcgcaagcc cgtatgtcaa gcagattttc gtctatggta acagtgaacg ctcttttctg 1560
cttgcagtag tcgtaccaaa cgccgaatta gtgggccgtc ttgacacagt tcaagccctg 1620
gccgaagtca aacccttaat cgcagatagt ttagcggcta ttgcgaaaga aagcggcttg 1680
caatcctatg aagtcccgcg cgactttatc gttgaaaccg agccgtttac gacgggcaat 1740
ggcctgcttt ctgaagttgg caaactcctg cggcccaaac tcaaggaacg ttacggtgag 1800
cgcctggagg cgctgtacga tcagattgca cagggccaag ctgacgagtt gcgtgcattg 1860
cgtgaacagg cgggcgaacg cccagtgatc gatacggtgc gcaaagccgc tgccgcggtg 1920
gtggggtcat caggggccga ttttcgccca gatgctaatt tcgcagatct gggaggtgat 1980
agcctgtcag cgctggggtt cgccaattta ctgcaagatg tgttcggcgt tgaaactccg 2040
gtccggatca ttattggacc tactgcgagt ctggcgggca ttgccgaaca tatcgaacgc 2100
gctttaggcg gtcgccctgg cgaagcggca ccaaattcgg caagtgtgca tggcgcgggt 2160
gcagaagtaa tccgcgcatc tgacctgacg ttagacaaat tcttggacgc tcaagcctta 2220
gaagccgcgc agtcgttacc acgtccgaca ggcagccatc ggacggtcct gttgactgga 2280
gcgaatggat ggttagggcg cttcctggcg ctcgagcagt tgcagcgctt agaagccacg 2340
ggcggaaaac tgatctgctt agtgcgcggt aaagacgcag cgtcagcgcg tgcacgcgtg 2400
gaggaagcgc tgggcaccga tcccgcatta gcagcgcgct ttgccgagct ggccgcagat 2460
cgtctggaag ttgttccggg tgacgtgggc gaaccgaagt tcggtctgga cgatcgcacg 2520
tgggatcggc tggctggtga ggtagatgcg gtagtccatt ctggcgcgct ggttaaccac 2580
gttttgccct atcaccagct gttcggcagt aacgtggtgg gcgtggcaga aatcatccgt 2640
ttcgctgtgg cctctaaact taaaccggtg gcctatctct ccactgttgc tgtggctgcg 2700
ggcgccgatc ctgccgcgtt tgatgaagat ggtgacattc gggaggtagt gccgcaacgc 2760
ccggtcgatg actcgtatgc caacggctat ggcaacagca agtgggcggg tgaggtgctg 2820
ttacgcgaag cacacgaacg taccgggctg ccggtgcgtg tctttcgcag tgacatgatt 2880
ctggcccatc gccaacacac cggccagctc aatgcgaccg accagtttac ccgtctgatt 2940
ctgtccttac tggctactgg tttggctcca aaatcgttct atcagttaga tccgcaaggt 3000
cgtcgccagc gtgcacatta cgacggtatt ccggtcgatt ttacggctga ggcgatcgtt 3060
gcccttgccg ccgagggaaa taatgggcac cgttcctata acgtctttaa cccgcaccat 3120
gatggggttg ggctggacga gtttgtggat tggctgatcg aagccggtca tccgattacc 3180
cgcattgagg atcacgccac atggttcgcc cgttttacca ctgcgctgcg ggcgcttcct 3240
gagaaacaac gccagttgtc gttgctccct ctggctcagg tgtatagctt tccccatccg 3300
gcggttgatg gatccccgtt ccgtaacgca gtatttcgtg cggacgtgca acgtgcgcgt 3360
attggtaaag atcatgatat tccgcatctc acccgtgaac tgatcctgaa atatgctgcc 3420
gatctggccg ctctcggctc actttaa 3447
<210> 12
<211> 1148
<212> PRT
<213> 人工序列
<220>
<221> 来源
<223> /记录="人工序列描述:合成
多肽"
<400> 12
Met Gly Ser Gly Ala Asp Arg Ala Lys Leu Phe Phe Gln Lys Ile Glu
1 5 10 15
Glu Leu Thr Ala Ala Asp Pro Gln Phe Ala Ala Ala Val Pro Asp Gln
20 25 30
Glu Val Val Ala Ala Val Ser Asp Pro Thr Leu Ser Phe Thr Arg Tyr
35 40 45
Leu Asp Thr Leu Met Arg Gly Tyr Ala Asp Arg Pro Ala Leu Ala His
50 55 60
Arg Val Gly Asp Gly Tyr Ala Thr Ile Ser Tyr Gly Glu Leu Trp Ser
65 70 75 80
Arg Val Gly Ala Ile Ala Ala Ala Trp Ser Ala Asp Gly Leu Glu Pro
85 90 95
Gly Asp Phe Val Ala Thr Ile Gly Phe Thr Ser Pro Asp Tyr Thr Ala
100 105 110
Leu Asp Leu Ala Ala Thr Arg Ser Gly Leu Val Ser Val Pro Leu Gln
115 120 125
Ala Gly Ala Ser Val Ala Gln Leu Ser Ala Ile Leu Glu Glu Thr Ala
130 135 140
Pro Lys Val Phe Ala Ala Ser Ala Glu Ser Leu Glu Gly Ala Val Asp
145 150 155 160
Cys Val Leu Arg Thr Pro Ser Val Gln Arg Leu Val Ile Phe Asp Leu
165 170 175
Arg Asp Asp Ser Pro Glu His Arg Ala Ala Leu Ala Ala Ala Lys Ala
180 185 190
Lys Leu Ala Gln Pro Gln Asn Pro Glu Gln Ala Arg Gly Pro Val Ala
195 200 205
Val Glu Thr Leu Asp Glu Leu Val Ala Arg Gly Ala Ala Leu Pro Glu
210 215 220
Pro Pro Val Phe Glu Pro Ala Glu Gly Glu Asp Pro Leu Ala Leu Leu
225 230 235 240
Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys Gly Ala Met Tyr Ser
245 250 255
Gln Arg Leu Val Ser Arg Phe Trp Pro Arg Thr Pro Val Val Ala Gln
260 265 270
Leu Pro Ser Ile Ser Leu His Tyr Met Pro Leu Ser His Ser Tyr Gly
275 280 285
Arg Ala Val Leu Cys Gly Thr Leu Ala Ala Gly Gly Thr Ala His Phe
290 295 300
Thr Ala His Ser Asp Leu Ser Thr Leu Phe Glu Asp Ile Ala Leu Ala
305 310 315 320
Arg Pro Thr Phe Leu Ala Leu Val Pro Arg Met Cys Glu Met Leu Leu
325 330 335
His Glu Ser Arg Arg Ala Arg Asp Leu Ala Glu Leu Arg Glu Arg Val
340 345 350
Leu Gly Glu Arg Leu Leu Val Ala Val Cys Gly Ser Ala Pro Leu Ala
355 360 365
Pro Glu Thr Arg Ala Phe Met Glu Glu Leu Leu Gly Phe Pro Leu Leu
370 375 380
Asp Gly Tyr Gly Ser Thr Glu Ala Leu Ser Leu Met Arg Asp Gly Val
385 390 395 400
Ile Gln Arg Pro Pro Val Ile Asp Tyr Lys Leu Val Asp Val Pro Glu
405 410 415
Leu Gly Tyr Phe Thr Thr Asp Lys Pro His Pro Arg Gly Glu Leu Leu
420 425 430
Ile Arg Ser Glu Ser Leu Val Ser Gly Tyr Tyr Lys Arg Pro Glu Glu
435 440 445
Thr Ala Glu Met Phe Asp Glu Gln Gly Tyr Tyr Lys Thr Gly Asp Val
450 455 460
Met Ala Glu Ile Ala Pro Asp Arg Leu Val Tyr Val Asp Arg Ser Lys
465 470 475 480
Asn Val Leu Lys Leu Ser Gln Gly Glu Phe Val Ala Val Ala Lys Leu
485 490 495
Glu Ala Ala Phe Gly Ala Ser Pro Tyr Val Lys Gln Ile Phe Val Tyr
500 505 510
Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val Val Val Pro Asn Ala
515 520 525
Glu Leu Val Gly Arg Leu Asp Thr Val Gln Ala Leu Ala Glu Val Lys
530 535 540
Pro Leu Ile Ala Asp Ser Leu Ala Ala Ile Ala Lys Glu Ser Gly Leu
545 550 555 560
Gln Ser Tyr Glu Val Pro Arg Asp Phe Ile Val Glu Thr Glu Pro Phe
565 570 575
Thr Thr Gly Asn Gly Leu Leu Ser Glu Val Gly Lys Leu Leu Arg Pro
580 585 590
Lys Leu Lys Glu Arg Tyr Gly Glu Arg Leu Glu Ala Leu Tyr Asp Gln
595 600 605
Ile Ala Gln Gly Gln Ala Asp Glu Leu Arg Ala Leu Arg Glu Gln Ala
610 615 620
Gly Glu Arg Pro Val Ile Asp Thr Val Arg Lys Ala Ala Ala Ala Val
625 630 635 640
Val Gly Ser Ser Gly Ala Asp Phe Arg Pro Asp Ala Asn Phe Ala Asp
645 650 655
Leu Gly Gly Asp Ser Leu Ser Ala Leu Gly Phe Ala Asn Leu Leu Gln
660 665 670
Asp Val Phe Gly Val Glu Thr Pro Val Arg Ile Ile Ile Gly Pro Thr
675 680 685
Ala Ser Leu Ala Gly Ile Ala Glu His Ile Glu Arg Ala Leu Gly Gly
690 695 700
Arg Pro Gly Glu Ala Ala Pro Asn Ser Ala Ser Val His Gly Ala Gly
705 710 715 720
Ala Glu Val Ile Arg Ala Ser Asp Leu Thr Leu Asp Lys Phe Leu Asp
725 730 735
Ala Gln Ala Leu Glu Ala Ala Gln Ser Leu Pro Arg Pro Thr Gly Ser
740 745 750
His Arg Thr Val Leu Leu Thr Gly Ala Asn Gly Trp Leu Gly Arg Phe
755 760 765
Leu Ala Leu Glu Gln Leu Gln Arg Leu Glu Ala Thr Gly Gly Lys Leu
770 775 780
Ile Cys Leu Val Arg Gly Lys Asp Ala Ala Ser Ala Arg Ala Arg Val
785 790 795 800
Glu Glu Ala Leu Gly Thr Asp Pro Ala Leu Ala Ala Arg Phe Ala Glu
805 810 815
Leu Ala Ala Asp Arg Leu Glu Val Val Pro Gly Asp Val Gly Glu Pro
820 825 830
Lys Phe Gly Leu Asp Asp Arg Thr Trp Asp Arg Leu Ala Gly Glu Val
835 840 845
Asp Ala Val Val His Ser Gly Ala Leu Val Asn His Val Leu Pro Tyr
850 855 860
His Gln Leu Phe Gly Ser Asn Val Val Gly Val Ala Glu Ile Ile Arg
865 870 875 880
Phe Ala Val Ala Ser Lys Leu Lys Pro Val Ala Tyr Leu Ser Thr Val
885 890 895
Ala Val Ala Ala Gly Ala Asp Pro Ala Ala Phe Asp Glu Asp Gly Asp
900 905 910
Ile Arg Glu Val Val Pro Gln Arg Pro Val Asp Asp Ser Tyr Ala Asn
915 920 925
Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala
930 935 940
His Glu Arg Thr Gly Leu Pro Val Arg Val Phe Arg Ser Asp Met Ile
945 950 955 960
Leu Ala His Arg Gln His Thr Gly Gln Leu Asn Ala Thr Asp Gln Phe
965 970 975
Thr Arg Leu Ile Leu Ser Leu Leu Ala Thr Gly Leu Ala Pro Lys Ser
980 985 990
Phe Tyr Gln Leu Asp Pro Gln Gly Arg Arg Gln Arg Ala His Tyr Asp
995 1000 1005
Gly Ile Pro Val Asp Phe Thr Ala Glu Ala Ile Val Ala Leu Ala
1010 1015 1020
Ala Glu Gly Asn Asn Gly His Arg Ser Tyr Asn Val Phe Asn Pro
1025 1030 1035
His His Asp Gly Val Gly Leu Asp Glu Phe Val Asp Trp Leu Ile
1040 1045 1050
Glu Ala Gly His Pro Ile Thr Arg Ile Glu Asp His Ala Thr Trp
1055 1060 1065
Phe Ala Arg Phe Thr Thr Ala Leu Arg Ala Leu Pro Glu Lys Gln
1070 1075 1080
Arg Gln Leu Ser Leu Leu Pro Leu Ala Gln Val Tyr Ser Phe Pro
1085 1090 1095
His Pro Ala Val Asp Gly Ser Pro Phe Arg Asn Ala Val Phe Arg
1100 1105 1110
Ala Asp Val Gln Arg Ala Arg Ile Gly Lys Asp His Asp Ile Pro
1115 1120 1125
His Leu Thr Arg Glu Leu Ile Leu Lys Tyr Ala Ala Asp Leu Ala
1130 1135 1140
Ala Leu Gly Ser Leu
1145

Claims (80)

1.多肽,其包含SEQ ID NO:1的突变体,由SEQ ID NO:1的突变体组成或基本上由SEQID NO:1的突变体组成,其中所述多肽包含以下个别突变中的至少一种:
P369S/P/G/V、S284A/S/G/T、G380D/G/E、G619Y/G/F/L、K692R、A894G/A/V、A892G/A/V/S、P849P/G、A880V/A、C781V/C/A/S及其组合。
2.权利要求1的多肽,其中所述多肽包含SEQ ID NO:1的变体,由SEQ ID NO:1的变体组成或基本上由SEQ ID NO:1的变体组成,所述SEQ ID NO:1的变体选自以下变体:
P369S G380E G619L K692R(SEQ ID NO:10);
S284G P369V G619Y;
E220K S284A P369S G380E K692R;
P369S G380E G619L;
K692R P849G A892G A894V;
C781V A892G A894V;
K692R P849G A894G;
S284G P369V G619Y K692R P849G A892G A894V;
S284G P369V G619Y C781V A892G A894V;
S284G P369V G619Y K692R P849G A894G;
S284G P369V G619Y K692R;
S284A P369S G380E K692R P849G A892G A894V;
S284A P369S G380E C781VA892G A894V;
S284A P369S G380E K692R P849G A894G;
P369S G380E G619L K692R P849G A892G A894V;和
P369S G380E G619L C781V A892G A894V。
3.根据权利要求1和2中任一项的多肽,其包含序列,由序列组成或基本上由序列组成,所述序列与SEQ ID NO:1至少70%、至少80%、至少90%、至少95%或至少99%同源。
4.根据权利要求1和2中任一项的多肽,其包含序列,由序列组成或基本上由序列组成,所述序列与SEQ ID NO:1至少70%、至少80%、至少90%、至少95%或至少99%相同。
5.根据权利要求1的多肽,其包含SEQ ID NO:1的变体,由SEQ ID NO:1的变体组成或基本上由SEQ ID NO:1的变体组成,所述SEQ ID NO:1的变体选自:
S284A P369S G380E C781V A892G A894V;
P369S G380E G619L K692R P849G A892G A894V;
P369S G380E G619L C781V A892G A894V;和
P369S G380E G619L K692R。
6.根据权利要求1的多肽,其包含SEQ ID NO:1的P369S G380E G619L K692R变体,由SEQ ID NO:1的P369S G380E G619L K692R变体组成或基本上由SEQ ID NO:1的P369SG380E G619L K692R变体组成。
7.多肽,其包含SEQ ID NO:2的突变体,由SEQ ID NO:2的突变体组成或基本上由SEQID NO:2的突变体组成,其中所述多肽包含以下个别突变中的至少一种:
V331M/L、S284I、M334G/V、L336F、H337D/I/V、E338N、T371F、L379V、L383T/V、G386A、L448E/V、M452I/L、F453A、V474R,V476L、N481D、V491L、A494V、K495V、L520T、E516F/V、G579E/V、L590V、R591G、P592A/G、E596G、D607S、E622W/S,D647G/S、I683Q、I684V、A709H、P711D、T780N/S、P826V、E831I、P832Y、Q866V、G869T、L893V、A902I、L1086A);
及包含所述突变的2、3、4、5、6或7种的其组合。
8.多肽,其包含SEQ ID NO:2的变体,由SEQ ID NO:2的变体组成或基本上由SEQ IDNO:2的变体组成,所述SEQ ID NO:2的变体选自:
V331M L448E(SEQ ID NO:12);
V331M L448E E516V;
L448EM452I;
L448EV331M;
L448EE516F;
L448EE622W;
P369S G380E Q623L E696R;
V331M L448E E516V E831D;
E516F L448E M452I;和
E516F L520T。
9.根据权利要求7和8中任一项的多肽,其包含序列,由序列组成或基本上由序列组成,所述序列与SEQ ID NO:2至少70%、至少80%、至少90%、至少95%或至少99%同源。
10.根据权利要求7和8中任一项的多肽,其包含序列,由序列组成或基本上由序列组成,所述序列与SEQ ID NO:2至少70%、至少80%、至少90%、至少95%或至少99%相同。
11.根据权利要求7的多肽,其包含SEQ ID NO:2的变体,由SEQ ID NO:2的变体组成或基本上由SEQ ID NO:2的变体组成,所述SEQ ID NO:2的变体选自:
V331M L448E(SEQ ID NO:12);
V331M L448E E516V;和
E516F L520T。
12.根据权利要求7的多肽,其包含相对于SEQ ID NO:2的L590V、R591G、P592G、P592A或E596G突变中的一种或多种,由相对于SEQ ID NO:2的L590V、R591G、P592G、P592A或E596G突变中的一种或多种组成或基本上由相对于SEQ ID NO:2的L590V、R591G、P592G、P592A或E596G突变中的一种或多种组成。
13.根据权利要求7的多肽,其包含相对于SEQ ID NO:2的I683Q和I684V突变中的一种或多种,由相对于SEQ ID NO:2的I683Q和I684V突变中的一种或多种组成或基本上由相对于SEQ ID NO:2的I683Q和I684V突变中的一种或多种组成。
14.根据权利要求7的多肽,其包含相对于SEQ ID NO:2的P826V、E831I、或P832Y突变中的一种或多种,由相对于SEQ ID NO:2的P826V、E831I、或P832Y突变中的一种或多种组成或基本上由相对于SEQ ID NO:2的P826V、E831I、或P832Y突变中的一种或多种组成。
15.根据权利要求7的多肽,其包含SEQ ID NO:2的Q866V突变、V331M L448E变体;或V331M L448E E516V变体,由SEQ ID NO:2的Q866V突变、V331M L448E变体;或V331M L448EE516V变体组成或基本上由SEQ ID NO:2的Q866V突变、V331M L448E变体;或V331M L448EE516V变体组成。
16.具有分类为EC 1.2.99.6的羧酸还原酶活性的分子工程化多肽,其包含第一腺苷酸/ATP结合域、第二PP结合域和第三NADP域,其中所述多肽是分类为EC 1.2.99.6的野生型羧酸还原酶的变体。
17.权利要求16的多肽,其中所述变体在以下中包含一种或多种氨基酸突变(i)所述羧酸还原酶的所述腺苷酸/ATP结合域中的一种或多种氨基酸残基;(ii)所述羧酸还原酶的所述NADP结合域中的一种或多种氨基酸残基;和/或所述羧酸还原酶的所述PP结合域中的一种或多种氨基酸残基处;优选在所述羧酸还原酶的所述腺苷酸/ATP结合域。
18.根据权利要求17的多肽,其中所述野生型羧酸还原酶是SEQ ID NO:1或2的多肽,并且其中:
(i)所述氨基酸突变包含SEQ ID NO:1的一种或多种以下区域中的突变:
所述腺苷酸/AMP/ATP结合(残基49至620);
所述PP结合域(残基627至694);
和所述NAD(P)结合域(残基750至1014);或
(ii)所述氨基酸突变包含SEQ ID NO:2的一种或多种以下区域中的突变:
所述腺苷酸/AMP/ATP结合域(残基49至620);
所述PP结合域(残基631至698);
所述NAD(P)结合域(残基758至1019)。
19.根据权利要求18的多肽,其中所述多肽在SEQ ID NO:2的一种或多种以下区域处包含一种或多种突变:
331-338(ATP/AMP活性位点区域1a);
370-386(ATP/AMP活性位点区域1b);
448-452(ATP/AMP活性位点区域1c);
516-520(ATP/AMP活性位点区域1d);和
590-596(ATP/AMP活性位点区域1e)。
20.根据权利要求18的多肽,其中所述多肽在SEQ ID NO:2的一种或多种以下区域处包含一种或多种突变:
826-832(NADP活性位点区域1a);和
866-869(NADP活性位点区域1b)。
21.根据权利要求18的多肽,其中所述突变选自涵盖L590V、R591G、P592G、P592A和E596G突变的所述腺苷酸/AMP/ATP结合域的区域。
22.根据权利要求18的多肽,其中所述突变选自涵盖I683Q和I684V突变的所述PP结合域的区域。
23.根据权利要求18的多肽,其中所述突变选自涵盖P826V、E831I和P832Y突变的所述NAD(P)域的区域。
24.根据权利要求18的多肽,其中所述突变选自涵盖Q866V突变的所述NAD(P)结合域的区域。
25.根据权利要求18-24中任一项的多肽,其中所述多肽的氨基酸序列与SEQ ID NO:1的氨基酸序列至少70%、至少80%、至少90%、至少95%或至少99%相同。
26.根据权利要求18-24中任一项的多肽,其中所述多肽的氨基酸序列具有与SEQ IDNO:2的氨基酸序列至少70%、至少80%、至少90%、至少95%或至少99%的序列同一性。
27.用于改善多肽的羧酸还原酶活性的方法,其包括:
获得具有羧酸还原酶活性的野生型多肽;
改变所述野生型多肽中的一种或多种氨基酸残基,并从而产生具有改善的羧酸还原酶活性的改善的多肽。
28.根据权利要求27的方法,其中所述野生型多肽具有ATP结合域、PP结合域和NADP域,并且其中所述改变包括这些域之一种或多种中,优选在所述野生型多肽的所述ATP结合域中的一种或多种中氨基酸残基的变化。
29.根据权利要求28的方法,其中所述野生型多肽是分类为EC 1.2.99.6的酶,优选为SEQ ID NO:1或SEQ ID NO:2的酶。
30.根据权利要求29的方法,其还包括改变所述ATP结合位点周围的所述ATP结合域区域中的一种或多种氨基酸残基。
31.根据权利要求27-30中任一项的方法,其中所述改变是或包含SEQ ID NO:2的V331M、L448E和E516V突变中的一种或多种。
32.根据权利要求27-30中任一项的方法,其中所述改变是或包含SEQ ID NO:2的V331M和L448E突变中的一种或多种。
33.权利要求27-30中任一项的方法,其中所述野生型羧酸还原酶是SEQ ID NO:1或2的多肽,并且其中所述改善的多肽包含:
(i)SEQ ID NO:1的以下一种或多种区域中的突变:
所述腺苷酸/AMP/ATP结合(残基49至620);
所述PP结合域(残基627至694);
和所述NAD(P)结合域(残基750至1014);或
(ii)SEQ ID NO:2的以下一种或多种区域中的突变:
所述腺苷酸/AMP/ATP结合域(残基49至620);
所述PP结合域(残基631至698);
所述NAD(P)结合域(残基758至1019)。
34.根据权利要求33的方法,其中所述多肽在SEQ ID NO:2的一种或多种以下区域处具有一种或多种突变:
331-338(ATP/AMP活性位点区域1a);
370-386(ATP/AMP活性位点区域1b);
448-452(ATP/AMP活性位点区域1c);
516-520(ATP/AMP活性位点区域1d);和
590-596(ATP/AMP活性位点区域1e)。
35.权利要求27-30中任一项的方法,其中所述野生型羧酸还原酶是SEQ ID NO:2的多肽,并且其中所述改善的多肽在SEQ ID NO:2的以下一种或多种区域处包含一种或多种突变:
826-832(NADP活性位点区域1a);和
866-869(NADP活性位点区域1b)。
36.根据权利要求27-30中任一项的方法,其中所述改善的多肽包含SEQ ID NO:2的三重突变体V331M L448E E516V或四重突变体V331M L448E E516V E831D,由SEQ ID NO:2的三重突变体V331M L448E E516V或四重突变体V331M L448E E516V E831D组成或基本上由SEQ ID NO:2的三重突变体V331M L448E E516V或四重突变体V331M L448E E516V E831D组成。
37.根据权利要求27-30中任一项的方法,其中所述改善的多肽包含SEQ ID NO:2的以下个别突变中的至少一种,由SEQ ID NO:2的以下个别突变中的至少一种组成或基本上由SEQ ID NO:2的以下个别突变中的至少一种组成:
V331M/L、S284I、M334G/V、L336F、H337D/I/V、E338N、T371F、L379V、L383T/V、G386A、L448E/V、M452I/L、F453A、V474R/G、V476L、N481D、V491L、A494V、K495V、L520T、E516F/V、E574D、G579E/V、L590V、R591G、P592A/G、E596G、L602G、D607S、E622W/S、K635W、D647G/S、I683Q、I684V、A709H、P711D、A737N、T780N/S/L、G781D、P826V、E831I、P832Y、Q866V、G869T、L893V、A902I、L1086A及其组合。
38.根据权利要求27-30中任一项的方法,其中所述改善的多肽包含SEQ ID NO:2的变体,由SEQ ID NO:2的变体组成或基本上由SEQ ID NO:2的变体组成,所述SEQ ID NO:2的变体选自:
L448E M452I;
L448E V331M;
L448E E516F;
L448E E622W;
P369S G380E Q623L E696R;
V331M L448E E516V;
V331M L448E E516V E831D;
E516F L448E M452I;
E516F L520T;和
V331M L448E。
39.根据权利要求27-30中任一项的方法,其中所述改善的多肽包含SEQ ID NO:2的变体,由SEQ ID NO:2的变体组成或基本上由SEQ ID NO:2的变体组成,所述SEQ ID NO:2的变体选自:
V331M L448E(SEQ ID NO:12);
V331M L448E E516V;和
E516F L520T。
40.根据权利要求27-30中任一项的方法,其中所述改善的多肽包含变体,由变体组成或基本上由变体组成,所述变体具有SEQ ID NO:2的L590V、R591G、P592G、P592A或E596G突变中的一种或多种。
41.根据权利要求27-30中任一项的方法,其中所述改善的多肽包含变体,由变体组成或基本上由变体组成,所述变体具有SEQ ID NO:2的I163Q和I684V突变之一或两者。
42.根据权利要求27-30中任一项的方法,其中所述改善的多肽包含变体,由变体组成或基本上由变体组成,所述变体具有SEQ ID NO:2的P826V、E831I或P832Y突变中的一种或多种。
43.根据权利要求27-30中任一项的方法,其中所述改善的多肽包含变体,由变体组成或基本上由变体组成,所述变体具有SEQ ID NO:2的Q866V突变。
44.根据权利要求1-43中任一项的任一种多肽的改善的多肽或其功能衍生物。
45.根据权利要求1-43中任一项的任一种多肽的改善的多肽或其功能衍生物,其中相对于所述野生型多肽,所述改善的多肽的羧酸还原酶活性增加至少5%、至少10%、至少10%、至少20%、至少50%、至少100%、至少200%、至少300%、至少400%或至少500%。
46.根据权利要求1-43中任一项的任一种多肽的改善的多肽或其功能衍生物,其中相对于野生型多肽,所述改善的多肽的羧酸还原酶活性增加10%至250%,优选100%至200%。
47.根据权利要求45和46中任一项的改善的多肽,其中使用庚二酸和/或己二酸作为底物测量所述羧酸还原酶活性。
48.根据权利要求45和46中任一项所述的改善的多肽,其中所述多肽能够以比分类为EC 1.2.99.6的天然存在的羧酸还原酶的km小的km将至少一种底物转化为至少一种产物。
49.根据权利要求45和46中任一项的改善的多肽,其中所述多肽能够以比分类为EC1.2.99.6的天然存在的羧酸还原酶的kcat(s-1)大的kcat(s-1)将至少一种底物转化为至少一种产物。
50.根据权利要求45和46中任一项所述的改善的多肽,其中所述多肽能够以大于0.005的kcat(s-1)将至少一种底物转化为至少一种产物。
51.根据权利要求45和46中任一项的改善的多肽,其中所述改善的多肽能够分别将庚二酸和己二酸转化为庚二酸半醛和己二酸半醛,并且其中所述多肽具有比分类为EC1.2.99.6的天然存在的羧酸还原酶的kcat(s-1)大的kcat(s-1),任选地其中kcat(s-1)通过辅因子转化(NADPH、NADH和ATP)方法或酸消除或醛积累的测量来确定。
52.根据权利要求45-51中任一项所述的改善的多肽,其中所述多肽包含至少一种参与所述ATP结合域的活性位点的底物。
53.根据权利要求52所述的改善的多肽,其中所述底物是庚二酸或己二酸或其衍生物。
54.核酸构建体或载体,其包含编码具有羧酸还原酶活性的多肽的多核苷酸,其中所述多核苷酸与指导所述多肽产生的一种或多种异源控制序列可操作地连接,并且其中所述具有羧酸还原酶活性的多肽选自:
(a)与SEQ ID NO:1的多肽具有至少70%序列同一性的多肽;
(b)与SEQ ID NO:2的多肽具有至少70%序列同一性的多肽;和
(c)根据权利要求1-24和44-53中任一项的多肽。
55.核酸分子,其编码权利要求1-26和44-53中任一项的多肽。
56.载体,其包含权利要求55的核酸分子,任选地是表达载体。
57.用根据权利要求54和56中任一项的载体转化或转导的代谢工程化微生物或宿主细胞。
58.权利要求57的宿主细胞,其中宿主细胞是原核生物。
59.权利要求58的宿主细胞,其中所述原核生物是埃希氏菌属(Escherichia);梭菌属(Clostridia);棒状杆菌属(Corynebacteria);贪铜菌属(Cupriavidus);假单胞菌属(Pseudomonas);代尔夫特菌属(Delftia);芽孢杆菌属(Bacillus);乳杆菌属(Lactobacillus);乳球菌属(Lactococcus);和红球菌属(Rhodococcus),或真核生物,其选自曲霉属(Aspergillus)、酵母属(Saccharomyces)、毕赤酵母属(Pichia)、耶氏酵母属(Yarrowia)、伊萨酵母属(Issatchenkia)、德巴利酵母属(Debaryomyces)、Arxula和克鲁维酵母属(Kluyveromyces)。
60.权利要求57的代谢工程化微生物,其中所述微生物选自酵母、真菌、丝状真菌、藻和细菌。
61.权利要求60的代谢工程化微生物,其中所述细菌选自:埃希氏菌属,如大肠杆菌(Escherichia coli);细菌属梭菌属,如杨氏梭菌(Clostridium ljungdahlii),自产乙醇梭菌(Clostridium autoethanogenum)或克鲁佛梭菌(Clostridium kluyveri);细菌属棒状杆菌属如谷氨酸棒状杆菌(Corynebacterium glutamicum);细菌属棒状杆菌属,如钩虫贪铜菌(Cupriavidus necator)或耐金属贪铜菌(Cupriavidus metallidurans);细菌属假单胞菌属,例如荧光假单胞菌(Pseudomonas fluorescens),恶臭假单胞菌(Pseudomonasputida)或食油假单胞菌(Pseudomonas oleavorans);细菌属代尔夫特菌属,如食酸代尔夫特菌(Delftia acidovorans);细菌属芽孢杆菌属如枯草芽孢杆菌(Bacillus subtillis);来自细菌属乳杆菌属如德氏乳杆菌(Lactobacillus delbrueckii);或细菌属乳球菌如乳酸乳球菌(Lactococcus lactis)。
62.组合物,其包含根据权利要求1-26和44-53中任一项的多肽。
63.权利要求62的组合物,其还包含庚二酸、己二酸或两者。
64.生产庚二酸半醛的方法,其通过在存在根据权利要求1-26和44-53中任一项的多肽的情况下将庚二酸转化为庚二酸半醛来进行。
65.生产己二酸半醛的方法,其通过在存在根据权利要求1-26和44-53中任一项的多肽的情况下将己二酸转化为己二酸半醛来进行。
66.从庚二酸生产庚二酸半醛的方法,其包括步骤(i)在合适的培养基中培养根据权利要求57-59中任一项的宿主细胞;和(ii)回收庚二酸半醛。
67.从己二酸生产己二酸半醛的方法,其包括步骤(i)在合适的培养基中培养根据权利要求57-59中任一项的宿主细胞;和(ii)回收己二酸半醛。
68.融合蛋白,其包含根据权利要求1-26和44-53中任一项的多肽。
69.修饰微生物中的庚二醛半醛和/或己二酸半醛生物合成的方法,所述方法包括对所述微生物导入有效量的根据权利要求54和56中任一项的载体,从而修饰所述微生物中的庚二醛半醛和/或己二酸半醛。
70.组合物,其包含庚二酸和用于将所述庚二酸转化为庚二酸半醛的手段。
71.组合物,其包含己二酸和用于将所述己二酸转化为己二酸半醛的手段。
72.生产庚二酸半醛的方法,其包括:
将庚二酸酶促转化为庚二酸半醛的步骤;和
测量和/或收获由此生产的庚二酸半醛。
73.生产己二酸半醛的方法,其包括:
将己二酸酶促转化为己二酸半醛的步骤;和
测量和/或收获由此生产的己二酸半醛。
74.装置,其包括庚二酸和用于将所述庚二酸转化为庚二酸半醛的手段。
75.装置,其包括己二酸和用于将所述己二酸转化为己二酸半醛的手段。
76.组合物,其包含庚二酸半醛和/或己二酸半醛和痕量的根据权利要求57的代谢工程化微生物或宿主细胞。
77.根据权利要求66和67中任一项的方法生产的生物衍生的庚二酸半醛或者己二酸半醛,其中所述生物衍生的庚二酸半醛或己二酸半醛任选具有反映大气二氧化碳摄取来源的碳-12、碳-13和碳-14同位素比率。
78.产品,其包含从权利要求77的生物衍生的庚二酸半醛或己二酸半醛生产的化学品,其中所述产品包含尼龙中间体、聚酯、药物、生物燃料、香料或食品添加剂。
79.生物衍生的、基于生物的或发酵衍生的产品,其中所述产品包含:
i.组合物,所述组合物包含在存在权利要求1-26和44-53中任一项的多肽的情况下生产或从由根据权利要求1-26和44-53中任一项的多肽催化的反应产物生产的至少一种生物衍生的、基于生物的或发酵衍生的化合物,或其任何组合,
ii.生物衍生的、基于生物的或发酵衍生的聚合物,其包含i.的生物衍生的、基于生物的或发酵衍生的组合物或化合物,或其任何组合,
iii.生物衍生的、基于生物的或发酵衍生的树脂,其包含i.的生物衍生的、基于生物的或发酵衍生的化合物或生物衍生的、基于生物的或发酵衍生的组合物或其任何组合或ii.的生物衍生的、基于生物的或发酵衍生的聚合物或其任何组合,
iv.模塑物质,其通过模塑ii.的生物衍生的、基于生物的或发酵衍生的聚合物或iii.的生物衍生的、基于生物的或发酵衍生的树脂或其任何组合获得,
v.生物衍生的、基于生物的或发酵衍生的配制剂,其包含i.的生物衍生的、基于生物的或发酵衍生的组合物、i.的生物衍生的、基于生物的或发酵衍生的化合物、ii.的生物衍生的、基于生物的或发酵衍生的聚合物、iii.的生物衍生的、基于生物的或发酵衍生的树脂、或iv的生物衍生的、基于生物的或发酵衍生的模塑物质、或其任何组合,或
vi.生物衍生的、基于生物的或发酵衍生的半固体或非半固体流,其包含i.的生物衍生的、基于生物的或发酵衍生的组合物、i.的生物衍生的、基于生物的或发酵衍生的化合物、ii.的生物衍生的、基于生物的或发酵衍生的聚合物、iii.的生物衍生的、基于生物的或发酵衍生的树脂、v.的生物衍生的、基于生物的或发酵衍生的配制剂、或iv.的生物衍生的、基于生物的或发酵衍生的模塑物质、或其任何组合。
80.非天然存在的生物化学网络,其包含图1的至少一种底物、至少一种编码具有图1的至少一种酶的活性的多肽的外源核酸和图1的至少一种产物。
CN201780017903.2A 2016-03-17 2017-03-16 具有改善的活性的多肽和变体、其相关的材料和方法 Pending CN109312311A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201662309689P 2016-03-17 2016-03-17
US62/309,689 2016-03-17
PCT/US2017/022697 WO2017161112A1 (en) 2016-03-17 2017-03-16 Carboxylic acid reductase polypeptides and variants having improved activity, materials and processes relating thereto

Publications (1)

Publication Number Publication Date
CN109312311A true CN109312311A (zh) 2019-02-05

Family

ID=58461464

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780017903.2A Pending CN109312311A (zh) 2016-03-17 2017-03-16 具有改善的活性的多肽和变体、其相关的材料和方法

Country Status (4)

Country Link
US (1) US10538746B2 (zh)
EP (1) EP3430133A1 (zh)
CN (1) CN109312311A (zh)
WO (1) WO2017161112A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109312311A (zh) * 2016-03-17 2019-02-05 英威达纺织(英国)有限公司 具有改善的活性的多肽和变体、其相关的材料和方法
CN118339281A (zh) * 2021-10-27 2024-07-12 基因组股份公司 工程化酶及制备和使用方法

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102131921A (zh) * 2008-08-05 2011-07-20 帝斯曼知识产权资产管理有限公司 生产己二酰基-7-adca的菌株
WO2014105797A2 (en) * 2012-12-31 2014-07-03 Invista North America S.A.R.L. Methods of producing 7-carbon chemicals via pyruvate and succinate semialdehyde aldol condensation
US20140186902A1 (en) * 2011-12-16 2014-07-03 Invista North America S. A R.L. METHODS OF PRODUCING 6-CARBON CHEMICALS VIA CoA-DEPENDENT CARBON CHAIN ELONGATION ASSOCIATED WITH CARBON STORAGE
CN103987840A (zh) * 2011-08-08 2014-08-13 国际香料香精公司 用于香草醛或香草醛β-D-葡萄糖苷的生物合成的组合物和方法
CN104704113A (zh) * 2012-04-02 2015-06-10 Reg生命科学有限责任公司 Car酶及脂肪醇的改良生产
CN105026570A (zh) * 2012-12-31 2015-11-04 英威达技术有限责任公司 通过氧化裂解从长链脂肪酸生产7-碳化学物的方法
WO2015175698A1 (en) * 2014-05-13 2015-11-19 Invista North America S.á.r.l. Methods of procucing 6-carbon chemicals from long chain fatty acids via oxidative cleavage
US10538746B2 (en) * 2016-03-17 2020-01-21 INVISTA North America S.à r.l. Polypeptides and variants having improved activity, materials and processes relating thereto
CN112004934A (zh) * 2018-03-30 2020-11-27 英威达纺织(英国)有限公司 用于生物合成制造碳基化学品的材料和方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4554101A (en) 1981-01-09 1985-11-19 New York Blood Center, Inc. Identification and preparation of epitopes on antigens and allergens on the basis of hydrophilicity
US6428767B1 (en) 1995-05-12 2002-08-06 E. I. Du Pont De Nemours And Company Method for identifying the source of carbon in 1,3-propanediol
WO2008024129A2 (en) 2005-12-06 2008-02-28 J. Craig Venter Institute Synthetic genomes
JP2009521229A (ja) 2005-12-23 2009-06-04 ジェイ.クレイグ ベンター インスティチュート 細胞又は細胞様システムへのゲノム若しくは部分ゲノムのインストール

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102131921A (zh) * 2008-08-05 2011-07-20 帝斯曼知识产权资产管理有限公司 生产己二酰基-7-adca的菌株
CN103987840A (zh) * 2011-08-08 2014-08-13 国际香料香精公司 用于香草醛或香草醛β-D-葡萄糖苷的生物合成的组合物和方法
US20140186902A1 (en) * 2011-12-16 2014-07-03 Invista North America S. A R.L. METHODS OF PRODUCING 6-CARBON CHEMICALS VIA CoA-DEPENDENT CARBON CHAIN ELONGATION ASSOCIATED WITH CARBON STORAGE
US9102960B2 (en) * 2011-12-16 2015-08-11 Invista North America S.á.r.l. Methods of producing 6-carbon chemicals via CoA-dependent carbon chain elongation associated with carbon storage
CN104704113A (zh) * 2012-04-02 2015-06-10 Reg生命科学有限责任公司 Car酶及脂肪醇的改良生产
WO2014105797A2 (en) * 2012-12-31 2014-07-03 Invista North America S.A.R.L. Methods of producing 7-carbon chemicals via pyruvate and succinate semialdehyde aldol condensation
CN105026569A (zh) * 2012-12-31 2015-11-04 英威达技术有限责任公司 通过丙酮酸和琥珀酸半醛羟醛缩合生产7-碳化学物的方法
CN105026570A (zh) * 2012-12-31 2015-11-04 英威达技术有限责任公司 通过氧化裂解从长链脂肪酸生产7-碳化学物的方法
WO2015175698A1 (en) * 2014-05-13 2015-11-19 Invista North America S.á.r.l. Methods of procucing 6-carbon chemicals from long chain fatty acids via oxidative cleavage
US10538746B2 (en) * 2016-03-17 2020-01-21 INVISTA North America S.à r.l. Polypeptides and variants having improved activity, materials and processes relating thereto
CN112004934A (zh) * 2018-03-30 2020-11-27 英威达纺织(英国)有限公司 用于生物合成制造碳基化学品的材料和方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
AKHTAR MK等: "Carboxylic acid reductase is a versatile enzyme for the conversion of fatty acids into fuels and chemical commodities", 《PROC NATL ACAD SCI U S A》 *
GENBANK DATABASE: "oxidoreductase [Segniliparus rotundus]", 《GENBANK DATABASE》 *
KIM JS等: "Differential immune responses to Segniliparus rotundus and Segniliparus rugosus infection and analysis of their comparative virulence profiles", 《PLOS ONE》 *
邓小艳等: "植物吡咯啉-5-羧酸还原酶——潜在的除草作用靶标", 《农药》 *

Also Published As

Publication number Publication date
EP3430133A1 (en) 2019-01-23
US20170298325A1 (en) 2017-10-19
WO2017161112A1 (en) 2017-09-21
WO2017161112A8 (en) 2017-10-12
US10538746B2 (en) 2020-01-21

Similar Documents

Publication Publication Date Title
CN111936623B (zh) 用于生物合成制造庚二酸的材料与方法和合成多肽的利用
CN104284974B (zh) 用于产生丙二酸的重组宿主细胞
Glatigny et al. Cloning and Molecular Characterization of hxA, the Gene Coding for the Xanthine Dehydrogenase (Purine Hydroxylase I) of Aspergillus nidulans (∗)
CN104220591B (zh) 来自芽孢杆菌的甲醇脱氢酶
CN110312796A (zh) 角鲨烯何帕烯环化酶及其用于生产降龙涎香醚的用途
CN105051189B (zh) 具有改善特性的酰基-acp还原酶
US10358664B2 (en) Mutant host cells for the production of 3-hydroxypropionic acid
CN109182238A (zh) 用于生产脂肪酸和脂肪酸衍生产物的微生物及方法
CN109477082A (zh) 3-甲基巴豆酸脱羧酶(mdc)变体
US9951299B2 (en) Cutinase variants and polynucleotides encoding same
CN104955944A (zh) 具有改善的酯合酶特性的酶变体
CN103857791A (zh) 脱氢酶变体和编码它们的多核苷酸
CN109312311A (zh) 具有改善的活性的多肽和变体、其相关的材料和方法
CN108239626A (zh) 一种高酯化活力的脂肪酶突变体
CN103797111A (zh) 用于正丙醇产生的微生物
CN107109347A (zh) 用于生产3‑羟基丙酸的重组宿主细胞
Bramwell et al. Propionyl-CoA carboxylase from Streptomyces coelicolor A3 (2): cloning of the gene encoding the biotinlcontaining subunit
CN104379734B (zh) 具有改进的转化效率的细菌突变体
CN108603182A (zh) Calb变体
KR101366763B1 (ko) meso-2,3-부탄다이올 제조방법
KR101743210B1 (ko) 지방산 생산능이 향상된 재조합 미생물 및 이를 이용한 지방산의 제조방법
US8728804B2 (en) Polypeptides having succinyl-CoA: acetoacetate transferase activity and polynucleotides encoding same
CN112501164A (zh) 一种高效降解羽毛并合成人工血红素蛋白的基因模块及应用
CN112011524B (zh) 5-氨基乙酰丙酸合成酶突变体及其宿主细胞和应用
CN109715815A (zh) 二磷酸甲羟戊酸脱羧酶变异体、和利用了该变异体的烯烃化合物的制造方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190205

WD01 Invention patent application deemed withdrawn after publication