CN118119706A - 具有d-阿洛酮糖3-差向异构酶活性的多肽 - Google Patents

具有d-阿洛酮糖3-差向异构酶活性的多肽 Download PDF

Info

Publication number
CN118119706A
CN118119706A CN202280057025.8A CN202280057025A CN118119706A CN 118119706 A CN118119706 A CN 118119706A CN 202280057025 A CN202280057025 A CN 202280057025A CN 118119706 A CN118119706 A CN 118119706A
Authority
CN
China
Prior art keywords
ala
leu
gly
asp
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280057025.8A
Other languages
English (en)
Inventor
Z·Z·兹韦格哈弗特
D·S·塔菲克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ambrosia Biotech
Original Assignee
Ambrosia Biotech
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ambrosia Biotech filed Critical Ambrosia Biotech
Publication of CN118119706A publication Critical patent/CN118119706A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y501/00Racemaces and epimerases (5.1)
    • C12Y501/03Racemaces and epimerases (5.1) acting on carbohydrates and derivatives (5.1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/24Preparation of compounds containing saccharide radicals produced by the action of an isomerase, e.g. fructose

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供了具有3‑差向异构酶活性(诸如D‑阿洛酮糖3‑差向异构酶活性)的多肽,编码其的多核苷酸,以及包含其的转基因细胞。进一步提供了生产D‑阿洛酮糖的方法。

Description

具有D-阿洛酮糖3-差向异构酶活性的多肽
相关申请的交叉引用
本申请要求享有2021年6月27日提交的名称为“POLYPEPTIDES WITH D-PSICOSE3-EPIMERASE ACTIVITY”的美国临时专利申请号63/215,472的优先权权益,其内容通过引用以其全部并入本文。
技术领域
本发明涉及具有3-差向异构酶活性的分离的多肽、编码该多肽的多核苷酸及其使用方法。
背景技术
常规糖诸如蔗糖的过量摄入可以对人类健康产生影响。需要替代品来降低糖摄入量。自然界中存在量有限的诸如单糖等稀有糖可作为这种替代品。稀有糖是食品和药品中有用的添加剂和化合物,并且稀有糖的有益代谢健康效应已在人体试验、动物实验和体外实验中显示出来。稀有糖的化学合成存在几个缺点,包括反应条件过激、产生过量化学废物、形成不需要的副产物和难以纯化的过程。相比之下,通过酶途径生物合成稀有糖更环境友好,具有温和的反应条件和高特异性。催化酮糖和酮糖衍生物差向异构化的酶在稀有糖的生物合成中起着重要作用。在稀有糖中,D-阿洛酮糖(D-psicose)(D-核糖-2-己酮糖(D-ribo-2-hexulose)或D-阿洛酮糖(D-allulose))是作为蔗糖的更健康替代品研究最深入的一种糖,其具有70%的相对甜度,但只有蔗糖的能量的0.3%和高溶解度。这种糖最近获得了美国食品和药物管理局(FDA)公认的安全(GRAS)状态,并且申请欧盟批准作为食品成分正在研究中。
来自D-塔格糖-差向异构酶(DTE)和D-阿洛酮糖3-差向异构酶(DPE,也称为D-阿洛酮糖3-差向异构酶(D-allulose 3-epimerase)(DAE))家族的酶催化D-果糖在C3位置向D-阿洛酮糖的可逆转化。此外,还已知L-核酮糖3-差向异构酶(LRE)可将D-果糖转化为D-阿洛酮糖。这些已知的3-差向异构酶的最佳催化效率需要理想的pH和温度范围(pH在7.0至8.0之间,并且温度在55℃至70℃之间)。然而,这些最佳范围可能导致D-果糖和D-阿洛酮糖二者的降解。稳定的D-果糖和D-阿洛酮糖在这些温度范围内需要低pH条件和能够在酸性环境中起作用的酶。这种酶可以在嗜酸生物中发现。
嗜酸菌是种类繁多的生态和经济上重要的生物,其在酸性自然环境和人工环境中茁壮成长。它们具有调节细胞内的pH值的细胞适应网络。嗜酸菌的几种胞外酶在比细胞质pH低得多的pH下起作用。在低pH下稳定的诸如淀粉酶、蛋白酶、连接酶、纤维素酶、木聚糖酶、α-葡萄糖苷酶、内切葡聚糖酶和酯酶等酶已知来自各种嗜酸微生物。然而,能够在低pH条件下催化反应的酶是稀有的。需要寻找新的酸稳定酶来源。一个这种来源可以在当今现存的嗜酸菌酶的祖先中发现。
天然存在的酶表现出高催化活性速率,是负责保护手性的对映异构纯催化剂,在酶催化中提供对映选择性,并且由于其可生物降解性,具有很小的环境影响。尽管有这些优点,但用于催化反应的酶的可用性是有限的,因为在自然界中并不总是能找到具有所需性质的酶。
祖先序列重建(ASR)使用同源氨基酸序列输入来推断祖先氨基酸序列。ASR为可能会影响活性和稳定性的远离活性位点的氨基酸替换提供了一种信息工具。使用这种方法进行酶设计包括基于公共数据库中可用的同源氨基酸序列的比较来推断祖先序列,人工合成编码推断的氨基酸序列的基因,以及在合适的宿主生物中表达该基因。结合经验分析,这种方法用于定义祖先蛋白质的各种物理性质,包括热稳定性和底物特异性,并鉴定关键氨基酸残基。祖先设计创造了具有自然界中未发现的期望特性的酶,并且可以通过将推定的祖先氨基酸替换到天然酶中来改善天然酶,而不会损害催化活性。这导致了ASR应用于在工业过程中可能有用的蛋白质和酶的工程化中。
仍然非常需要具有3-差向异构酶活性的新型多肽,其能够在低pH条件下将D-果糖转化为D-阿洛酮糖。
发明内容
在一个方面,提供了一种多肽,其包含选自以下的氨基酸序列:
(i)SEQ ID No.:1-12和14-16,或与其具有至少88%序列同源性的功能类似物;和
(ii)SEQ ID No.13,或与其具有至少92%序列同源性的功能类似物。
在一个实施方式中,多肽的特征在于具有3-差向异构酶活性。
在一个实施方式中,3-差向异构酶活性包括D-阿洛酮糖3-差向异构酶活性。
在一个实施方式中,肽是分离的多肽或合成的多肽。
在另一个方面,提供了一种编码本发明多肽的多核苷酸。
在一个实施方式中,多核苷酸包含选自SEQ ID No.:17-32的核酸序列。
在一个实施方式中,多核苷酸是分离的多核苷酸或人工多核苷酸。
在另一个方面,提供了一种质粒或表达载体,其包含本发明的多核苷酸。
在另一个方面,提供了一种转基因细胞、转化细胞或转染细胞,其包含:本发明的多肽;本发明的多核苷酸;本发明的质粒或表达载体;或(a)至(c)的任意组合。
在一个实施方式中,转基因细胞或所述转染细胞选自地衣芽孢杆菌、酿酒酵母菌、粟酒裂殖酵母菌、恶臭假单胞菌、毕赤酵母菌、曲霉菌、里氏木霉菌、谷氨酸杆菌、大肠杆菌和枯草芽孢杆菌。
在另一个方面,提供了源自本发明的转基因细胞或转染细胞的提取物,或其任意部分。
在一个实施方式中,提取物包含所述多核苷酸、所述多肽或两者。
在另一个方面,提供了一种转基因植物、转基因植物组织或植物部分,其包含:本发明的多肽;本发明的多核苷酸;本发明的质粒或表达载体;本发明的转基因细胞或转染细胞;或(a)至(d)的任意组合。
在另一个方面,提供了一种组合物,其包含:
a.本发明的多肽
b.本发明的多核苷酸
c.本发明的质粒或表达载体
d.本发明的转基因细胞或转染细胞
e.本发明的提取物
f.本发明的转基因植物组织或植物部分;或
g.(a)至(f)的任意组合,
以及可接受的载体。
在一个实施方式中,组合物进一步包含二价金属阳离子。
在一个实施方式中,二价阳离子选自:Co2+、Mg2+、Mn2+、Mo2+、Ni2+及其任意组合。
在一个实施方式中,组合物进一步包含水性溶剂。
在一个实施方式中,多肽结合到固体载体上。
在一个实施方式中,结合是通过共价键或非共价相互作用。
在一个实施方式中,组合物进一步包含能够结合所述多肽和所述固体载体二者的化学试剂。
在一个实施方式中,组合物进一步包含果糖、D-阿洛酮糖或两者。
在另一个方面,提供了一种合成具有3-差向异构酶活性的多肽的方法,其包括以下步骤:提供包含质粒或表达载体的细胞,该质粒或表达载体包含与选自SEQ ID No.:17-32的核酸序列具有至少70%序列同一性的核酸序列;和培养来自步骤(a)的所述细胞,使得由所述质粒或表达载体编码的多肽被表达,从而合成多肽。
在一个实施方式中,方法进一步包括选自以下的至少一个步骤:回收所述多肽,至少部分纯化多肽,固定所述多肽,及其任意组合。
在一个实施方式中,细胞是原核细胞或真核细胞。
在一个实施方式中,细胞是转基因细胞或用本发明的质粒或表达载体转染的细胞。
在一个实施方式中,方法包括步骤(a)之前的步骤,其包括用所述质粒或表达载体导入或转染所述细胞。
在另一个方面,提供了一种生产D-阿洛酮糖的方法,其包括以下步骤:使本发明的组合物与有效量的果糖接触,从而获得反应混合物;并且使所述反应混合物经受适于将所述果糖至少部分转化为D-阿洛酮糖的条件,从而产生D-阿洛酮糖。
在一个实施方式中,条件包括:(i)温度在25℃至75℃之间;(ii)pH在3至9之间,或(i)和(ii)两者。
在一个实施方式中,经受包括使所述反应混合物与二价金属阳离子接触。
在一个实施方式中,二价阳离子选自Co2+、Mg2+、Mn2+、Mo2+、Ni2+及其任意组合。
在一个实施方式中,二价金属阳离子在所述反应混合物中以0.1mM至10mM的浓度范围存在。
在一个实施方式中,方法进一步包括以下步骤:其包含从所述反应混合物中分离所述D-阿洛酮糖。
在一个实施方式中,分离包括提取、沉淀、膜过滤或其任意组合。
除非另有定义,否则本文使用的所有技术和/或科学术语具有与本发明所属领域的技术人员通常理解的相同含义。虽然与本文所述方法或材料相似或等同的方法和材料可用于本发明的实施方式的实践或测试,但以下描述了示例性方法和/或材料。如有冲突,专利说明书(包括定义)将起控制作用。此外,材料、方法和实施例仅是说明性的,并且不旨在必然是限制性的。
根据下文给出的详细描述,本发明的进一步实施方式和全部适用范围将变得显而易见。然而,应该理解的是,仅通过说明的方式给出详细描述和具体实例,同时指示本发明的优选实施方式,因为本领域技术人员根据该详细描述将明白在本发明的精神和范围内的各种变化和修改。
附图说明
图1包括C3_N58(对应于SEQ ID No.:11)的Ni-sepharose FF柱分离的色谱图。实线(通过箭头标记)表示280nm处的吸光度。数字1-5描绘了不同的分离阶段:1-样品加载;2-洗涤;3-用含有25mM咪唑的缓冲液洗涤;4-用含有150mM咪唑缓冲液的缓冲液洗脱;5-剥离。
图2包括C3_N72(对应于SEQ ID No.:13)的Ni-sepharose FF柱分离的色谱图。分离如先前在图1中所述进行。
图3包括C4_N116(对应于SEQ ID No.:16)的Ni-sepharose FF柱分离的色谱图。分离如先前在图1中所述进行。
图4包括C3N58、C3N72和C4N116多肽(分别对应于SEQ ID No.:11、13和16)的SDS-PAGE的考马斯染色的显微照片。
图5包括在中性条件下(pH 7)含有D-果糖水溶液(作为底物)和C3_N72多肽(对应于SEQ ID No.:13)的粗反应混合物的HPLC(高效液相色谱)色谱图。在不同反应时间(0、5、10、15、30、45、60和120min)取等分试样。HPLC色谱图显示D-果糖(在7.6min处的峰)转化为阿洛酮糖(在6.3min处)。
图6包括在温和酸性条件下(pH 6)含有D-果糖(作为底物)水溶液和C3_N72多肽(对应于SEQ ID No.:13)的粗反应混合物的HPLC(高效液相色谱)色谱图。在不同反应时间(0、5、10、15、30、45、60和120min)取等分试样。HPLC色谱图显示D-果糖(在7.6min处的峰)转化为阿洛酮糖(在6.3min处)。
图7呈现了显示本发明的示例性多肽的催化活性的图,如中试规模实验所评估的。批号A是指SEQ ID No.:11,批号B是指SEQ ID No.:13。
图8A-B呈现了显示在pH=6(图8B)和pH=7(图8A)下进行测试的与商业对照(来自P.Cichorri的DT3E)相比本发明示例性多肽(SEQ ID No.:12,指定为N68cons)的催化活性随时间变化的图。
具体实施方式
在一些实施方式中,本发明涉及具有3-差向异构酶活性的多肽、编码该多肽的多核苷酸及其使用方法。
根据一些实施方式,提供了一种由以下编码的多肽:(a)本文公开的多核苷酸;或(b)本文公开的质粒或表达载体。
在一些实施方式中,多肽包含选自SEQ ID No.1-16的氨基酸序列,或与其具有至少88%同源性的功能类似物。在一些实施方式中,本发明的多肽包含选自以下的氨基酸序列:(i)SEQ ID No.:1-12和14-16,或与其具有至少88%序列同源性的功能类似物;和(ii)SEQ ID No.13,或与其具有至少92%序列同源性的功能类似物。在一些实施方式中,本发明的多肽包含选自SEQ ID No.:1-16的氨基酸序列或与其具有至少88%、至少89%、至少90%、至少95%、至少97%、至少99%或100%序列同源性(包括其间的任何范围)的功能类似物。
在一些实施方式中,本发明的多肽包含选自SEQ ID No.:4、9、10、11、12、13、14和16的氨基酸序列或与其具有至少88%、至少89%、至少90%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同源性(包括其间的任何范围)的功能类似物。在一些实施方式中,本发明的多肽包含选自SEQ ID No.:11、12和16的氨基酸序列或与其具有至少88%、至少89%、至少90%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同源性(包括其间的任何范围)的功能类似物。在一些实施方式中,本发明的多肽包含选自SEQ ID No.:11、12、13和16的氨基酸序列或与其具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同源性(包括其间的任何范围)的功能类似物。
在一些实施方式中,本发明的多肽包含选自SEQ ID No.:4、9、10、11、12、13、14和16的氨基酸序列或与其具有至少88%、至少89%、至少90%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同源性(包括其间的任何范围)的功能类似物;其中本发明的多肽为同源四聚体或同源八聚体的形式。
在一些实施方式中,本发明的多肽是同源四聚体或同源八聚体的形式;其中多肽包含选自SEQ ID No.:11、12、13和16的氨基酸序列或与其具有至少88%、至少89%、至少90%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同源性(包括其间的任何范围)的功能类似物。
在一些实施方式中,本发明的多肽包含SEQ ID No.13的氨基酸序列或与其具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、至少100%序列同源性(包括其间的任何范围)的功能类似物。
在一些实施方式中,功能类似物包含与SEQ ID No.1-16中的任一个具有至少80%、至少85%、至少88%、至少89%、至少90%、至少92%、至少95%、至少97%、至少99%或100%同源性或同一性的氨基酸序列。每种可能性都代表本发明的单独实施方式。
如本文所用,术语功能类似物是指任何多肽,其特征在于具有如本文所述的本发明多肽的3-差向异构酶活性,并且与其具有如本文所述的序列同源性。在一些实施方式中,术语功能类似物是指任何多肽,其特征在于具有如本文所述的本发明多肽的3-差向异构酶活性,并且与其具有至少88%或至少92%的序列同源性。
在一些实施方式中,本发明的多肽包含选自SEQ ID No.1-16的氨基酸序列,或包含与其至少70%、至少75%、至少80%、至少85%、至少88%同源性(包括其间的任何范围)的功能类似物,其中多肽是寡聚体,其包含至少3、至少4、至少5、至少6、至少8个多肽单体。在一些实施方式中,本发明的多肽是包含4至8、4至6、6至8或更多个多肽单体的寡聚体。在一些实施方式中,多肽单体中的每个包含选自SEQ ID No.1-16的氨基酸序列。在一些实施方式中,多肽单体中的每个包含相同的氨基酸序列。在一些实施方式中,多肽单体中的至少一个包含不同的氨基酸序列。
在一些实施方式中,本发明的多肽为同源四聚体形式。在一些实施方式中,本发明的多肽为同源八聚体形式。在一些实施方式中,多肽单体通过非共价键或非共价相互作用彼此结合。在一些实施方式中,多肽单体通过静电相互作用彼此结合。
不受任何特定理论或机制约束的情况下,推断氨基酸序列的E-195和K-196之间的静电相互作用是形成寡聚体的原因,其中寡聚体如本文所述。
本文所用的术语“类似物”是指与本发明的多肽相似但不完全相同的多肽,其仍然能够结合果糖或仍然包含果糖结合口袋。类似物可能具有导致不同于本发明的多肽的氨基酸序列的氨基酸序列的缺失或突变。应该理解的是,所有本发明的多肽的类似物仍然能够结合果糖或仍然包含果糖结合口袋。进一步地,类似物可以类似于本发明的多肽的片段,然而,在这种情况下,该片段必须包含本发明的多肽的至少50个连续氨基酸。
如本文所用,术语“类似物”包括具有与本文中具体显示的序列中的一种基本相同的氨基酸序列的任何肽,其中一个或多个残基被功能相似的残基保守取代,并显示出本文所述的能力。保守取代的实例包括用一种非极性(疏水性)残基(诸如异亮氨酸、缬氨酸、亮氨酸或甲硫氨酸)取代另一种,用一种极性(亲水性)残基取代另一种,诸如精氨酸和赖氨酸之间、谷氨酰胺和天冬酰胺之间、甘氨酸和丝氨酸之间,用一种碱性残基(诸如赖氨酸、精氨酸或组氨酸)取代另一种,或用一种酸性残基(诸如天冬氨酸或谷氨酸)取代另一种。每种可能性都代表了本发明的单独实施方式。
在一些实施方式中,多肽是分离的多肽或合成的多肽。
如本文所用,术语“肽”、“多肽”和“蛋白质”可互换,并且是指氨基酸残基的聚合物。在另一个实施方式中,如本文所用的术语“肽”、“多肽”和“蛋白质”包括天然肽、拟肽物(通常包括非肽键或其他合成修饰)以及肽类似物类肽和半类肽或其任意组合。在另一个实施方式中,所述的肽、多肽和蛋白质具有修饰,使其在生物体内时更稳定或更能够渗透到细胞中。在一个实施方式中,术语“肽”、“多肽”和“蛋白质”适用于天然存在的氨基酸聚合物。在另一个实施方式中,术语“肽”、“多肽”和“蛋白质”适用于其中一种或多种氨基酸残基是相应天然存在的氨基酸的人工化学类似物的氨基酸聚合物。
如本文所用,术语“分离蛋白质”是指基本上不含污染细胞组分诸如碳水化合物、脂质或与核酸性质相关的其他蛋白质杂质的蛋白质。通常,分离蛋白质的制剂含有高纯度形式的蛋白质,例如,至少约80%纯、至少约90%纯、至少约95%纯、大于95%纯或大于99%纯。在一些实施方式中,分离蛋白质是合成的蛋白质。蛋白质合成是本领域公知的,并且可以例如通过在转化的细胞中异源表达进行,诸如本文所示例。
在一些实施方式中,所述多肽包含以下氨基酸序列或由其组成:MKFAICNETFQPDAPPLWPLEKAFAYARELGYTGIEFAPFDATDVSAERRAEVRELLEKYQLESIGLHWLLAKTELTSPDAAVRDRTSEYLAELARLCRDLGGSVMCGVLGSPQQRNLLPGVTHDQAMEYAADVIRAAMPALEDHGVTLALEPLGPAEGDFLLTAESGIQLAQMIDSPHVRLHLDVKAMSLEAKPIPDIIRDSADYLAHFHANDPNKRGPGMGDVDFVPIFQALQEINYQGWVSVEVFDYEPGVVERLARESISYMQRCLDKLYSSVSGGERPPPDN(SEQ ID NO:1)。
在一些实施方式中,多肽包含以下氨基酸序列或由其组成:MKFAICQELFEPDAPPLTDWAEQCRIIAEVGYTGIEVAPFDLASVPAATLTEMRNTAERHGLEIIGLHWLLAKTNLTSPDAAVRTATADYLKLLADTCAALGGRVLAGVFGSPQQRNLLAGVTTEQAMDFAAEVFRAAMPTFAERDVVLCMEPLTPKETDFINTCADAVALMQMVDHPSFVLHQDVKAMLLAESDVPELIHRHKDICGHFHVNDTNLLGPGMGETDYHPILKALLEVGYDGWVSVEVFDYSPGAVEKIAKKSMDYMQQVLSDLYKAVSGVSGPPCDN(SEQ ID NO:2)。
在一些实施方式中,多肽包含以下氨基酸序列或由其组成:MKLGIHSFVWTGGSTQEDLEGAMEKSHELGYDLIEFPRLDPKKFDVAWLAKRLEDSGLKVVVTMGLPLDGDISSEDADVVKSGEQILDDAVAVTRDLGGEKLGGILFSAHGKYQSMPTRKGWDNSVAVMRKVADRAKAAGVTLNLEIVNRFESNLLNTTAQGLAFIEDTGSDNIFLHLDTFHMNIEEADPAQAIRHAGDKLGYFHIGESNRGYLGAGTIDFPPIFDALVAIGYEDYVTFESFSSEVVDKDLSITTGIWRNTWTDNVEVARHAKAFIEARYGEARRKAQIA(SEQ ID NO:3)。
在一些实施方式中,多肽包含下述氨基酸序列或由其组成:MRLGIHSFVWTGGQTQEGLEMALEKSAEHGYRLIEFAYLRPEKFDLDRLAKKAQSLDLEIAVTMGLPLDADVSSEDADVVARGKAMLADAVKAVRDIGGNKLGGILYSAHTKYNRMPTQRGWKNSVEAIAKTAEIAKACGVDLVLEVVNRFETNLLNTTAQGLKFIEDVGSDDVRLHLDTFHMNIEEADPAAAIRLAGDKLGYFHIGENNRGYLGDGVIDFDAIFDALLDIGYDRDIVFESFSSAVVDEGLSLACAIWRDTWTDNDELAAHAKQFIELKYDEAQRRRATN(SEQ ID NO:4)。
在一些实施方式中,多肽包含或由以下氨基酸序列组成:MRLGIHSFVWTGGQTQSMLEEAMEKSASCGYNLIEFAYLRPEKFDLDALAKRAQALKLDIAVTMGLPFSHDVSSEDADTVKAGEGMLADAVRAVRDIGGSKLGGILYSAHSKYSRMPTKKGWDNSVAAIAKTADLAKSAGVDLVLEVVNRFETNLLNTTAQGLAFIEQVGSEHVRLHLDTFHMNIEEANVAAAIRLAGDKIGYFHIGESNRGYLGDGNINFDLIFDALLDIDYQRDITFESFSGAVVDEGLSLACAIWRDTWTENMPLAQHAKQFIDLKMDEAKRRRATV(SEQ ID NO:5)。
在一些实施方式中,多肽包含以下氨基酸序列或由其组成:MRLGIHSFVWTGGQTQEGLEMALEKSAEHGYRCIEFAYLRPELFDLDRLARKSQSLDVQIGVTMGLPLDKDVSSEDPDVVAAGKQMLADAVRAVRDVGGDKLGGILYSAHTKYNRQPTADGWKNSVEAIAETGEIAKAAGVDLVLEVVNRFETNLLNTTAQGLKFIDDTGSDHVRLHLDTFHMQIEEANPAAAIRLAGDKLGYFHIGESNRGYLGDGTIDWDPIFDALLDIGYDRDVVFESFSTAIVDEGLSLACAIWRDTWTENDELAAHAKQFIELKWAEAQRRRATN(SEQ ID NO:6)。
在一些实施方式中,多肽包含以下氨基酸序列或由其组成:MRLGIHSFVWTGGQTQEGLEMALEKSAEHGYRTIEFAYLRPELFDLDRLARKAQSLDVEIGVTMGLPLDKDVSSEDRDVVARGKQMLADAVRAVRDIGGNKLGGILYSAHTKYNRLPTADGWKNSVEAIAETGEIAKAAGVDLVLEVVNRFETNLLNTTAQGLKFIDDVGSDHVRLHLDTFHMNIEEANPAAAIRLAGDKLGYFHIGESNRGYLGDGNIDFDLIFDALLDIDYQRDVVFESFSTAIVDEGLSLACAIWRDTWTENDPLAAHAKQFIELKYAEAQRRRATN(SEQ ID NO:7)。
在一些实施方式中,多肽包含以下氨基酸序列或由其组成:MRLGIHSFVWTGGQTQEGLEMALNKTAEHGYRTIEFAYLRPEKFNLDRLAKLAQSLDVEIGVTMGLPLDKDVSSEDAAAVAAGKQMLADAVRAVRDIGGNKLGGILYSAHTKYNRQPTKKGWDNSVAAIAATAEIAKEAGVDLVLEVVNRFETNLLNTTAQGLKFISEVGSDHVRLHLDTFHMNIEEANPAAAIRLAGDKIGYFHIGESNRGYLGDGVINFDLIFDALTDIDYKRDIVFESFSTAVVDEGLSLACAIWRDTWTDNDELAAHAKRYIELKYDEAKRRRATN(SEQ ID NO:8)。
在一些实施方式中,所述多肽包含以下氨基酸序列或由其组成:MKLGIHSFVWTGGTTQEDLEGAMEKSHDLGYGLIEFPRLDPKKFDVSWLAKRLEDYGLKVVVTMGLPLDGDISSEDAAVVKRGEQILDDAVAITRDLGGEKLGGIIFSAHTKYQSMPTRKGWDNSVAALSRVADRAKAAGVSLNLEIVNRFESNLLNTTAQGLAFIEETGSDNIFLHLDTFHMNIEEADPAQAIRLAGDKLGYFHIGESNRGYLGSGVINFPAIFDALVAIGYEDWITFESFSSEVVDEDLSITCAIWRNTWTDNVEVARLAKAFIEARYGEARRKAQTA(SEQ ID NO:9)。
在一些实施方式中,所述多肽包含或由以下氨基酸序列组成:MQIGAHGLVFTGTFDEAGLRRAIEGTKHAGFDLIEIPLMDVDGFDSALAGRMLADNDLAVTASLGLTAATDLTSEDPAVVAAGERMLERCLDHVAAMGGDVLCGVIYSAMQKYMAPATERGIANSQAAIARLAEKAAERGIRLSLEVVNRYESNVFNTGRGALAFLDGVGRDDVSVHLDTYHMNIEESDLFQPVHDVAGRLGYVHIGESHRGYLGTGTVDFGTFFRALHDVRYDGPVVFESFSSAVVSAELSNTLGIWRNLWEDSDDLAAHANRFIRDGLHAVRTIDL(SEQ ID NO:10)。
在一些实施方式中,多肽包含以下氨基酸序列或由其组成:MDIGCHGLVWTGSFDAQGIRLAAQKTKEAGFDLIEYPLMDPFTFDTEAAVSALAEHGLKASASLGLSDSTDVTSTDPEVVAAGEALLLRAVDVLADMGGTHLCGVIYSAMKKYMEPVTAEGLENSKRTIGRVADHAADRGVNVSLEVVNRYETNVLNTARQAIRFVADVDRPNLGIHLDTYHMNIEESDMFAPVLDAGEVLHYVHIGESHRGYLGTGSVDFDNFFKALGRIGYDGPITFESFSSAVVAPDLSRMLGIWRNLWTDNADLGAHANRFIRDKLTAVETISL(SEQ ID NO:11)。
在一些实施方式中,多肽包含以下氨基酸序列或由其组成:MEYGGHALVWAGDWSPEGARQAISGAARAGYDYIEIALLDPWKVDVAMTKDLLQEYGLRAHASLGLSPTTDVTSTDPAIVAKGDELLRKATDVLHALGGTELCGVIYCALGKYPGPASKENRANSVAAMQRLADYAADKGININLEVVNRYETNIMNTGIEGLKFLEEVNRPNAYLHLDTYHMNIEEDGMEKAVLAAGDRLGYVHIGESHRGYLGSGNVDFDTFFAALKKINYQGPITFESFSSAVVDPALSNALCVWRNLWSDSDDLAKKALKFMKARYSGNSQRSP(SEQ ID NO:12)。
在一些实施方式中,多肽包含以下氨基酸序列或由其组成:MEYGGHALVWSGDWTPEGARKAISGAARAGYDYIEIALLDPWKVDVALTKDLLQEYNLRAHASLGLSAATDVTSTDPAIVAKGDELLRKATDVLHAIGGTELCGVIYCALGKYPGPASKENRANSVAAMQRLADYAADKGININLEVVNRYETNIMNTGLEGLAFLDEVNRPNAYLHLDTYHMNIEEDGMEKSVLAAKDRLGYVHIGESHRGYLGTGNVDFDSFFAALKKIDYQGPITFESFSSEVVDPKLSNTLCVWRNLWHDSDDLAKKALRFMKERYPGNPQRSP(SEQ ID NO:13)。
在一些实施方式中,所述多肽包含以下氨基酸序列或由其组成:MKYGGHALVWSGDWTPEGARQAISGAARAGYDYIEIALLDPWKVDVALTKDLLQEFNLRAHASLGLSAATDVTSTDMAIVAKGDELLRKATDVLAAIGGKELCGVIYCALGKYPGPASKENRNNSVAAMQRLADYAADKDININLEVVNRYETNIINTGIEGLAFLDEVDRPNAYLHLDTYHMNIEEDGMEKSVLAAKDRLGYVHIGESHRGYLGTGNVDFDTFFAALKKIGYQGPITFESFSSEVVDPNLSNTLCVWRNLWHDSDDLAKKALQFMKERYSGNPQRSP(SEQ ID NO:14)。
在一些实施方式中,所述多肽包含以下氨基酸序列或由其组成:MKFGIHSMVWVGDWSPEHARHAIASSAEAGYDLIELAAIDPATFDVDLTAKLLAEHGIQASASLGLDAATDVSSEDPDVVAAGRARLRDALALVRDTGGTMLCGVIYSALRKYDAPVTERGLANSQETIAALADEAAASGITIGLEFCNRYETNVLNTTAQTLAFIAAVDRPNVMAHLDTYHMNIEEPSMSEPVLAAAGRLGYVHVGESHRGAPGTGSIPWDEFFGALRECGYDGIVTFESFSSEVVHPSFSNTLAIWRNLWTDNRKLATGALAFMRAHLRAAGGRGA(SEQ ID NO:15)。
在一些实施方式中,多肽包含以下氨基酸序列或由其组成:MKLGIHALVWVGGWTPEEAELAISSTARAGYDLIEIPALDPSRIDVASTREMLERHGLQASVSLGLAPDTDINSEDVACVDRGRDVLMRALEVSSGIGSTYLGGVIFGAMTKYSAPTTERARANSVAVIKELAQEARGCGTTIGLEFVNRYESNLLNTAQQTLDYLDLVGEDNVVVHADVYHMNIEETDFRTPILACGDRLGYVHVGESHRGYLGTGSVNFPEFFGALKEVGYAGPITFESFSSSVVDPLLSNTLAIWRNLWSDSTDLATQAHAFISAGLADDGGRGA(SEQ ID NO:16)。
在一些实施方式中,多肽进一步包含标签。在一些实施方式中,标签为N'-端标签。在一些实施方式中,标签为C'-端标签。在一些实施方式中,标签为亲和标签。在一些实施方式中,标签为聚组氨酸标签。在一些实施方式中,聚组氨酸标签包含4至10个组氨酸残基。在一些实施方式中,聚组氨酸标签包含6-8个组氨酸残基。在一些实施方式中,聚组氨酸标签包含6个组氨酸残基。
本文中互换使用的术语“同源性”或“同一性”是指两个氨基酸序列或两个核酸序列之间的序列同一性,其中同一性是更严格的比较。短语“同一性或同源性百分比”和“同一性或同源性%”是指两个或多个氨基酸序列或核酸序列比较中发现的序列同一性的百分比。两个或多个序列可以是0-100%相同,也可以是其间的任何值。可以通过比较每个序列中可以比对以用于与参考序列比较的位置来确定同一性。当被比较序列中的某个位置被相同的核苷酸碱基或氨基酸占据时,则该分子在该位置是相同的。氨基酸序列的同一程度是氨基酸序列共享位置上相同氨基酸数量的函数。核酸序列之间的同一程度是核酸序列共享位置上相同或匹配核苷酸数量的函数。氨基酸序列的同源性程度是多肽序列共享位置上氨基酸数量的函数。
以下为计算两个序列之间的同源性或序列同一性(本文中可互换使用这两个术语)的非限制性实例。为了进行最佳比较,对序列进行比对(例如,可以在第一和第二氨基酸或核酸序列中的一个或两个中导入间隙,以进行最佳比对,并且为了比较的目的,可以忽略非同源序列)。使用GCG软件包中的GAP程序和Blossum 62评分矩阵(其中间隙罚分为12,间隙扩展罚分为4,帧移间隙罚分为5),将最佳比对确定为最好得分。然后比较相应氨基酸位置或核苷酸位置的氨基酸残基或核苷酸。当第一个序列中的某个位置被与第二个序列中相应位置相同的氨基酸残基或核苷酸占据时,则这两个分子在该位置是相同的。两个序列之间的同一性百分比是序列共享的相同位置数量的函数。
在一些实施方式中,本文所述的同源性或同一性%使用基本局部比对搜索工具(BLAST)计算或确定。在一些实施方式中,本文所述的同源性或同一性%使用Blossum 62评分矩阵计算或确定。
在一些实施方式中,所述多肽包含或特征在于3-差向异构酶活性。在一些实施方式中,多肽包含或特征在于D-阿洛酮糖3-差向异构酶活性。
如本文所用,术语“3-差向异构酶”是指催化酮糖单糖的C3位的异构化的酶,并且包括D-塔格糖-3-差向异构酶(DTEase)家族的酶。通常,D-阿洛酮糖是在DTEase家族酶的催化下通过D-果糖的异构化产生。DTEase家族酶包括DTEase、D-阿洛酮糖3-差向异构酶(DAEase)和酮糖3-差向异构酶。所有这些酶具有催化D-果糖转化为D-阿洛酮糖的相同特征,并具有高度保守的活性中心和具有相似特征的关键氨基酸残基。
如本文所用,术语“D-阿洛酮糖3-差向异构酶”是指具有D-阿洛酮糖3-差向异构酶活性(EC 5.1.3.30)的酶,其通过催化D-果糖的C3位置的差向异构化促进D-果糖转化为D-阿洛酮糖。该酶对D-果糖是高度特异性的,并且对D-塔格糖显示出非常低的活性(参见EC5.1.3.31,D-塔格糖3-差向异构酶)。该酶需要金属离子辅因子(例如,Mn2+、Co2+、Mg2+)和/或在金属离子辅因子(例如,Mn2+、Co2+、Mg2+)存在的情况下增强。D-阿洛酮糖3-差向异构酶也被称为DPEase、DPE、D-阿洛酮糖3-差向异构酶或DAE。
根据一些实施方式,提供了一种编码本发明的多肽的多核苷酸。在一些实施方式中,该多核苷酸包含含有选自SEQ ID No.:17-32的序列的核酸序列。
在一些实施方式中,多核苷酸是分离的多核苷酸。在一些实施方式中,多核苷酸是DNA分子。在一些实施方式中,多核苷酸是分离的DNA分子。在一些实施方式中,DNA分子是分离的DNA分子。在一些实施方式中,DNA分子是互补DNA(cDNA)分子。
如本文所用,术语“分离的多核苷酸”和“分离的DNA分子”是指基本上不含污染细胞组分诸如碳水化合物、脂质或自然界中与核酸相关的其他蛋白质杂质的核酸分子。通常,分离的DNA或RNA制剂含有高纯度形式的核酸,例如,至少约80%纯、至少约90%纯、至少约95%纯、大于95%纯或大于99%纯。在一些实施方式中,分离的多核苷酸是DNA、RNA和cDNA中的任何一种。在一些实施方式中,分离的多核苷酸是合成的多核苷酸。多核苷酸的合成是本领域公知的。
术语“核酸”在本领域中是公知的。本文使用的“核酸”通常是指任何包含核苷酸的DNA、RNA或其衍生物或类似物的分子(例如,链)。核苷酸由核苷和磷酸基团组成。核苷的含氮碱基包括,例如,DNA(例如,腺嘌呤“A”、鸟嘌呤“G”、胸腺嘧啶“T”或胞嘧啶“C”)或RNA(例如,A、G、尿嘧啶“U”或C)中发现的天然存在的嘌呤或嘧啶核苷。
术语“核酸分子”包括但不限于单链RNA(ssRNA)、双链RNA(dsRNA)、单链DNA(ssDNA)、双链DNA(dsDNA)、小RNA、环状核酸、基因组DNA或RNA片段、降解的核酸、扩增产物、修饰的核酸、质粒或细胞器核酸,以及诸如寡核苷酸等的人工核酸。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGAAGTTTGCGATTTGTAATGAGACTTTCCAGCCAGACGCTCCGCCGTTATGGCCTCTTGAGAAAGCATTCGCTTATGCGCGTGAACTTGGTTACACCGGTATCGAATTCGCACCTTTTGATGCGACAGACGTAAGTGCAGAACGGCGGGCCGAGGTGCGCGAGCTTCTTGAAAAATACCAGCTCGAATCTATTGGTTTACATTGGCTGTTAGCTAAAACAGAGCTCACTTCCCCGGATGCAGCTGTACGGGATCGGACTTCCGAGTATCTGGCGGAACTGGCACGTCTTTGCCGGGATCTTGGCGGTTCCGTGATGTGCGGCGTCCTGGGTTCGCCACAACAGCGGAACTTACTGCCGGGGGTAACTCACGACCAGGCAATGGAATATGCAGCCGATGTAATCCGCGCGGCGATGCCGGCCTTAGAAGACCACGGGGTAACTCTCGCTCTCGAACCGTTAGGCCCGGCAGAGGGGGACTTCTTGCTGACTGCCGAATCGGGTATTCAGTTAGCTCAGATGATCGACTCCCCGCATGTACGTCTTCATTTGGATGTTAAAGCAATGAGTCTCGAAGCGAAGCCGATTCCAGATATTATCCGGGATTCTGCAGATTACTTGGCGCACTTCCATGCAAACGACCCAAATAAGCGGGGCCCTGGCATGGGCGACGTTGACTTCGTCCCTATCTTTCAGGCTTTACAGGAAATTAACTACCAAGGCTGGGTATCCGTGGAAGTATTTGATTATGAACCAGGTGTGGTTGAACGCCTTGCCCGTGAATCCATTTCATACATGCAACGGTGTCTGGACAAACTTTATTCCTCGGTATCGGGTGGCGAACGCCCGCCTCCAGACAAC(SEQ ID NO:17)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGAAATTTGCGATTTGCCAGGAACTGTTCGAGCCGGATGCGCCGCCGCTCACAGACTGGGCCGAGCAATGTCGGATCATCGCGGAGGTCGGCTACACCGGGATTGAGGTTGCTCCTTTTGATTTAGCTTCAGTACCGGCGGCAACACTTACTGAAATGCGGAATACGGCAGAGCGCCATGGCCTTGAAATTATCGGGCTGCATTGGTTGCTCGCGAAGACGAATCTTACATCTCCTGATGCCGCCGTGCGGACCGCTACAGCCGACTACTTGAAGTTATTAGCGGATACCTGCGCCGCTCTGGGGGGTCGGGTGCTCGCCGGGGTTTTTGGCTCACCTCAACAACGGAACTTGTTGGCAGGCGTAACAACCGAACAAGCAATGGATTTTGCTGCAGAAGTATTTCGGGCTGCCATGCCAACGTTTGCGGAGCGGGATGTGGTCCTCTGCATGGAGCCGCTCACACCGAAGGAGACTGATTTTATTAACACCTGCGCTGACGCTGTTGCGCTGATGCAAATGGTTGACCACCCAAGTTTCGTCCTTCACCAAGATGTAAAAGCAATGCTGCTTGCCGAGAGTGATGTGCCAGAGCTGATCCACCGTCATAAAGATATCTGCGGCCATTTTCACGTTAATGACACTAATTTACTTGGGCCAGGTATGGGGGAAACGGACTATCATCCAATTCTGAAGGCGTTACTGGAAGTCGGTTATGACGGTTGGGTTTCCGTCGAAGTGTTCGACTATTCACCAGGGGCAGTCGAGAAGATTGCGAAGAAATCGATGGATTATATGCAGCAAGTATTGTCCGATCTCTATAAGGCGGTTTCAGGTGTGTCTGGTCCGCCATGCGATAAC(SEQ ID NO:18)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGAAGTTAGGGATTCACAGTTTCGTATGGACTGGGGGGTCCACTCAAGAAGACTTAGAAGGTGCTATGGAAAAGAGCCATGAATTAGGCTATGATTTAATCGAGTTTCCGCGTCTGGACCCGAAGAAATTCGATGTAGCTTGGCTCGCCAAACGCCTGGAAGATTCTGGTCTGAAAGTAGTGGTGACCATGGGTTTACCACTTGATGGCGATATCTCATCAGAGGACGCAGACGTGGTGAAATCTGGTGAACAAATTCTGGATGACGCTGTAGCGGTCACCCGTGATTTAGGTGGCGAGAAACTTGGTGGTATCTTGTTTTCGGCCCACGGGAAGTATCAATCAATGCCAACACGGAAAGGTTGGGATAATAGTGTTGCCGTAATGCGGAAAGTAGCAGATCGTGCGAAGGCGGCGGGTGTAACACTCAACCTGGAGATTGTCAATCGGTTCGAGTCAAACTTGTTGAATACGACAGCACAGGGTTTAGCATTTATCGAAGACACGGGTTCTGATAACATTTTTTTACATTTAGATACGTTTCACATGAACATTGAGGAAGCTGATCCGGCACAAGCCATCCGTCATGCCGGCGACAAACTTGGTTATTTCCATATTGGGGAGTCGAACCGGGGGTATTTAGGCGCGGGGACTATCGACTTCCCGCCGATTTTCGACGCGCTGGTAGCGATTGGCTACGAAGACTACGTCACCTTCGAGTCATTCTCCTCCGAAGTAGTCGACAAAGATTTATCTATCACAACGGGTATTTGGCGGAATACCTGGACAGATAATGTCGAGGTGGCACGTCACGCTAAAGCATTCATTGAGGCACGGTATGGTGAAGCTCGTCGTAAGGCACAGATCGCG(SEQ ID NO:19)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGCGGTTGGGTATTCACTCGTTCGTGTGGACGGGTGGCCAGACGCAGGAGGGGTTAGAAATGGCGCTGGAGAAGTCAGCGGAACACGGCTACCGGTTAATCGAGTTTGCGTACCTGCGGCCGGAAAAGTTCGACCTGGATCGTCTCGCAAAGAAAGCCCAATCCCTCGACTTAGAGATTGCAGTAACAATGGGTTTACCTCTCGATGCGGATGTATCCTCTGAAGATGCAGATGTAGTCGCTCGGGGGAAAGCTATGTTAGCGGACGCGGTCAAGGCTGTACGTGATATTGGGGGCAATAAATTAGGGGGTATTCTCTATTCAGCCCACACCAAATATAATCGTATGCCGACGCAGCGGGGCTGGAAGAATAGTGTAGAAGCTATTGCAAAGACTGCGGAGATTGCCAAGGCGTGCGGCGTTGACTTAGTGCTGGAAGTGGTCAATCGGTTTGAGACAAATTTGTTGAACACAACCGCGCAAGGTCTTAAGTTCATTGAAGACGTAGGCTCCGACGATGTACGTTTACATCTCGATACCTTCCACATGAATATTGAAGAGGCAGATCCGGCAGCGGCTATTCGTCTTGCAGGGGATAAGCTGGGCTACTTTCACATTGGTGAAAACAACCGGGGGTACCTGGGTGACGGGGTTATCGACTTCGATGCTATCTTCGACGCGCTTTTGGACATCGGTTATGATCGGGACATCGTCTTTGAGTCTTTCTCCAGTGCCGTAGTTGACGAGGGGCTGTCGCTGGCATGTGCAATTTGGCGTGATACGTGGACTGATAATGATGAATTGGCGGCACATGCGAAGCAATTCATTGAGTTAAAATACGATGAAGCGCAACGTCGTCGTGCTACTAAT(SEQ ID NO:20)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGCGCTTAGGGATTCACTCTTTTGTCTGGACTGGGGGGCAAACGCAAAGTATGTTAGAAGAGGCAATGGAAAAATCAGCAAGCTGCGGGTATAATCTGATTGAGTTCGCTTACCTCCGCCCTGAGAAGTTTGACCTCGATGCGTTAGCAAAGCGTGCCCAGGCATTAAAATTAGACATTGCGGTCACCATGGGGTTACCTTTCTCTCACGATGTCTCATCTGAGGACGCTGACACTGTTAAGGCAGGTGAGGGGATGCTCGCAGATGCAGTGCGCGCCGTTCGGGATATCGGCGGTTCAAAGCTCGGTGGTATTTTGTACTCCGCTCACTCCAAGTACAGCCGGATGCCGACGAAGAAAGGGTGGGATAATTCCGTAGCGGCCATCGCCAAGACGGCGGACTTAGCTAAGTCAGCCGGTGTAGATCTTGTTCTTGAGGTTGTTAACCGTTTTGAGACTAATCTGCTTAATACGACAGCACAGGGCTTGGCCTTCATTGAGCAGGTTGGGTCTGAACACGTGCGTCTCCATCTTGATACCTTCCACATGAATATTGAAGAGGCGAATGTCGCAGCCGCGATCCGTTTAGCTGGTGATAAGATCGGGTACTTCCACATTGGTGAAAGTAATCGGGGTTATCTCGGGGATGGTAATATTAACTTTGACCTTATCTTTGATGCTCTGCTCGATATTGACTATCAACGTGACATCACATTTGAGTCCTTTTCTGGCGCGGTTGTTGATGAGGGGCTGTCTCTGGCTTGCGCGATTTGGCGGGACACCTGGACAGAAAATATGCCTTTAGCCCAGCACGCAAAACAGTTCATCGATCTTAAGATGGACGAGGCCAAGCGCCGTCGTGCAACGGTG(SEQ ID NO:21)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGCGCCTTGGTATTCACTCTTTTGTCTGGACGGGTGGCCAGACGCAAGAAGGGTTAGAGATGGCGTTGGAGAAGAGCGCTGAACATGGTTATCGGTGTATTGAGTTTGCGTACCTCCGGCCAGAGTTATTCGATTTGGATCGGTTGGCGCGTAAATCGCAGAGTCTCGACGTGCAAATTGGGGTCACAATGGGTTTGCCACTTGACAAAGACGTAAGCTCCGAAGACCCTGATGTAGTTGCGGCGGGGAAGCAGATGCTCGCCGACGCGGTACGCGCAGTCCGGGACGTAGGCGGTGACAAGCTGGGCGGCATCTTATATAGTGCGCACACAAAATATAACCGCCAACCTACAGCGGATGGTTGGAAAAATTCGGTTGAAGCCATCGCCGAGACTGGGGAAATCGCTAAGGCCGCCGGTGTAGATTTGGTGTTGGAAGTGGTGAACCGCTTTGAAACCAATCTGCTCAATACAACCGCGCAGGGGTTAAAGTTCATTGATGATACAGGCAGCGATCATGTCCGTCTGCACCTTGATACATTTCACATGCAAATTGAGGAAGCTAATCCTGCTGCGGCCATTCGTCTGGCTGGCGATAAGCTGGGGTATTTTCACATCGGTGAGTCCAACCGGGGCTACTTGGGGGACGGCACTATCGACTGGGACCCTATCTTTGACGCTTTGCTGGATATTGGTTATGATCGTGATGTGGTTTTCGAATCGTTCAGCACCGCTATCGTCGATGAAGGTCTTAGTTTGGCCTGCGCAATTTGGCGCGATACCTGGACGGAAAACGATGAGTTGGCAGCACACGCTAAGCAATTCATCGAACTCAAGTGGGCCGAGGCTCAGCGTCGGCGCGCGACCAAC(SEQ ID NO:22)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGCGCTTAGGCATTCATTCTTTCGTCTGGACCGGGGGTCAAACCCAGGAGGGGTTGGAAATGGCTTTGGAAAAATCTGCAGAGCACGGCTATCGGACTATCGAGTTTGCGTACCTGCGCCCAGAATTGTTTGACTTGGACCGGCTGGCTCGTAAAGCGCAGTCCCTGGACGTGGAGATCGGGGTAACGATGGGCTTACCGTTAGATAAGGATGTGTCTTCGGAGGACCGTGACGTTGTAGCACGGGGTAAGCAAATGCTCGCCGATGCAGTCCGGGCAGTTCGTGACATTGGGGGCAATAAATTGGGGGGTATCTTATACTCCGCACATACTAAGTACAATCGGCTGCCGACTGCAGATGGGTGGAAAAACTCGGTGGAAGCGATCGCGGAAACTGGGGAGATCGCCAAAGCGGCTGGCGTTGACCTTGTGCTTGAGGTGGTCAACCGCTTCGAGACGAACCTCCTGAATACCACCGCACAGGGTCTTAAATTCATCGACGACGTGGGTAGCGATCACGTTCGCCTTCATTTGGACACGTTCCACATGAACATCGAGGAAGCGAATCCTGCCGCTGCGATTCGCCTTGCTGGTGATAAACTCGGTTATTTCCATATTGGCGAGTCTAACCGCGGGTACCTCGGGGATGGGAATATCGACTTCGACTTAATTTTTGATGCTTTGCTGGATATTGACTACCAACGTGACGTTGTCTTTGAATCATTTAGTACTGCAATCGTTGATGAGGGGCTTAGTTTAGCATGCGCTATCTGGCGGGATACGTGGACTGAAAACGATCCTCTGGCGGCGCACGCGAAACAATTCATTGAACTTAAGTACGCTGAGGCACAGCGCCGTCGCGCCACCAAC(SEQ ID NO:23)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGCGCTTAGGCATTCATTCATTTGTATGGACGGGCGGCCAAACGCAGGAAGGCTTAGAAATGGCGCTCAACAAGACTGCTGAGCACGGCTATCGCACAATTGAGTTCGCTTACCTGCGCCCAGAGAAATTTAACTTAGATCGGCTTGCCAAGCTTGCGCAGAGCCTTGATGTCGAAATCGGTGTGACTATGGGGCTGCCGCTTGATAAGGATGTGAGCAGTGAGGATGCAGCAGCCGTTGCAGCTGGGAAACAAATGCTTGCAGATGCGGTTCGCGCTGTTCGTGATATTGGGGGCAATAAATTGGGGGGCATTTTATACTCCGCCCACACCAAGTATAACCGCCAGCCGACTAAAAAAGGCTGGGACAATAGTGTGGCCGCAATCGCAGCCACAGCGGAGATTGCCAAAGAGGCGGGCGTCGATTTGGTCCTTGAGGTGGTGAATCGCTTTGAGACAAACTTATTAAACACTACTGCGCAGGGCCTGAAGTTTATTAGTGAAGTCGGGTCGGACCATGTACGGCTTCATCTGGATACATTTCACATGAACATCGAGGAGGCCAACCCAGCAGCCGCGATTCGGTTAGCGGGGGATAAAATTGGGTACTTCCACATCGGCGAGAGCAATCGCGGTTACCTTGGCGATGGGGTTATTAACTTCGATCTCATTTTTGACGCATTGACCGATATCGACTACAAGCGTGATATCGTCTTCGAAAGTTTTTCGACCGCCGTGGTAGATGAAGGGCTCTCTCTCGCATGTGCGATTTGGCGTGACACCTGGACAGATAACGATGAGCTCGCCGCTCATGCGAAGCGGTATATTGAGCTCAAGTACGATGAAGCCAAACGTCGCCGCGCCACAAAC(SEQ ID NO:24)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGAAGCTTGGCATTCACTCATTCGTGTGGACCGGGGGTACCACCCAGGAAGATCTTGAAGGCGCGATGGAGAAGAGCCATGATCTTGGTTACGGCTTGATTGAATTTCCACGTCTCGATCCTAAAAAGTTTGACGTGTCCTGGCTCGCTAAACGCTTGGAAGATTACGGCCTGAAAGTGGTAGTCACTATGGGCCTCCCTTTAGATGGGGACATCAGTTCTGAGGACGCCGCGGTTGTCAAACGGGGTGAGCAGATCCTTGACGACGCCGTTGCCATCACTCGTGATCTCGGCGGCGAGAAATTGGGCGGCATTATCTTCTCCGCTCACACGAAGTACCAATCAATGCCTACTCGCAAAGGGTGGGACAACAGTGTGGCTGCTCTGAGCCGCGTGGCTGATCGCGCTAAAGCAGCAGGGGTTAGCCTGAATCTTGAAATCGTGAACCGTTTTGAATCAAACCTTCTCAACACTACTGCCCAAGGGCTCGCATTCATTGAAGAAACTGGCTCTGATAATATCTTTCTCCACTTGGACACCTTTCACATGAACATCGAGGAAGCTGACCCAGCCCAAGCTATTCGCTTAGCCGGTGACAAGCTGGGTTACTTCCACATTGGGGAATCAAATCGGGGCTACTTAGGGTCAGGTGTGATCAACTTCCCGGCAATTTTCGACGCCCTTGTCGCAATTGGCTACGAGGATTGGATTACGTTCGAGAGCTTTAGCAGTGAGGTGGTAGATGAAGATCTTAGTATTACCTGTGCTATCTGGCGCAATACTTGGACTGATAACGTAGAGGTAGCCCGGCTCGCCAAAGCGTTTATCGAAGCGCGTTACGGGGAAGCCCGTCGTAAGGCTCAGACCGCG(SEQ ID NO:25)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGCAAATCGGTGCGCATGGGTTAGTCTTCACCGGTACCTTCGATGAGGCGGGGCTCCGCCGCGCGATCGAAGGCACTAAACACGCTGGTTTCGACCTTATTGAGATCCCGCTCATGGACGTAGATGGCTTCGACTCTGCTTTAGCTGGTCGGATGTTGGCCGACAACGATCTCGCGGTCACAGCGTCTCTGGGCTTGACTGCGGCAACAGATTTAACGAGCGAAGATCCTGCTGTTGTAGCTGCTGGGGAACGGATGTTAGAGCGCTGCTTAGACCACGTCGCTGCTATGGGCGGGGACGTACTCTGTGGCGTGATTTATAGCGCTATGCAAAAATATATGGCACCTGCGACCGAACGGGGGATCGCTAATAGTCAAGCTGCTATTGCACGGCTTGCGGAGAAGGCGGCGGAGCGCGGTATTCGTCTTAGTCTCGAAGTTGTTAACCGGTACGAATCAAACGTCTTTAACACTGGGCGTGGTGCGCTTGCCTTCCTCGACGGTGTTGGTCGGGATGACGTCTCTGTCCATTTAGACACCTATCACATGAATATTGAAGAGAGTGATCTCTTTCAACCGGTCCATGATGTTGCAGGTCGCTTGGGGTACGTTCATATTGGTGAATCGCATCGCGGCTACTTAGGCACCGGTACTGTGGACTTCGGTACTTTCTTTCGTGCCCTGCATGACGTGCGTTATGACGGGCCAGTCGTCTTTGAGTCCTTTTCGTCCGCAGTGGTCAGTGCAGAACTCTCAAATACATTGGGGATTTGGCGCAACCTCTGGGAAGACAGCGACGATTTGGCAGCACATGCTAATCGTTTCATTCGTGACGGCCTTCACGCTGTCCGTACAATTGATTTG(SEQ ID NO:26)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGGACATTGGGTGTCATGGTTTAGTGTGGACCGGCTCATTTGACGCTCAGGGCATCCGTCTCGCGGCCCAGAAAACCAAGGAAGCCGGTTTCGATCTGATTGAATATCCACTTATGGATCCGTTCACCTTTGACACTGAGGCCGCGGTGAGCGCCCTTGCGGAGCATGGCTTGAAAGCAAGTGCGAGCCTCGGTCTGTCGGACTCAACAGATGTGACTTCTACCGATCCGGAAGTGGTCGCGGCAGGCGAAGCCTTACTGCTGCGGGCGGTCGATGTTCTTGCTGATATGGGTGGTACACACTTGTGTGGCGTAATCTACAGTGCTATGAAAAAGTATATGGAGCCTGTAACAGCCGAAGGCTTGGAGAACAGCAAGCGGACTATCGGCCGTGTCGCTGATCATGCAGCGGACCGTGGTGTAAACGTGAGTCTTGAGGTGGTTAATCGGTATGAGACCAATGTATTGAACACTGCGCGGCAGGCGATCCGGTTCGTTGCGGACGTAGACCGGCCGAATCTCGGCATTCATTTGGACACGTACCACATGAACATCGAGGAGAGTGACATGTTTGCCCCTGTCTTAGACGCGGGTGAAGTCCTCCATTACGTTCATATCGGTGAATCGCATCGCGGCTACCTTGGCACAGGGTCCGTAGATTTCGACAATTTTTTCAAAGCCCTCGGCCGTATTGGTTACGATGGTCCAATCACATTCGAGTCGTTTTCGAGCGCCGTAGTTGCTCCAGACCTTTCGCGTATGTTAGGCATCTGGCGTAACTTATGGACCGACAATGCAGATTTAGGCGCACATGCGAATCGGTTCATCCGTGATAAGCTTACCGCAGTTGAAACTATTAGCCTC(SEQ ID NO:27)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGGAGTATGGGGGCCACGCGCTTGTATGGGCAGGCGACTGGTCTCCAGAGGGCGCACGGCAAGCTATTTCGGGTGCGGCCCGGGCAGGTTATGACTACATTGAGATCGCCCTCCTCGACCCTTGGAAAGTTGATGTAGCGATGACCAAAGATCTGCTCCAGGAATACGGTCTTCGTGCTCATGCGAGCTTAGGTCTTAGTCCGACCACCGATGTAACGTCAACCGACCCAGCTATTGTAGCGAAGGGGGATGAACTGCTGCGTAAGGCTACAGATGTTCTCCATGCACTCGGGGGGACGGAACTTTGCGGCGTTATTTACTGTGCGTTAGGTAAGTACCCAGGGCCAGCCTCAAAAGAAAACCGCGCAAATAGCGTAGCAGCAATGCAACGCTTGGCTGACTATGCGGCTGACAAGGGCATTAATATTAATTTAGAAGTAGTCAACCGGTATGAGACAAACATTATGAATACAGGGATCGAAGGCTTAAAATTTCTGGAGGAGGTGAACCGGCCAAACGCGTACCTCCACTTGGACACTTATCACATGAACATTGAAGAGGATGGTATGGAGAAGGCTGTTTTAGCCGCAGGGGATCGTCTCGGGTACGTGCATATCGGGGAGTCCCACCGTGGCTATTTGGGTTCTGGCAACGTGGACTTTGATACGTTCTTCGCTGCATTAAAGAAGATTAACTATCAGGGCCCGATTACTTTTGAGTCTTTCTCTTCTGCCGTAGTCGACCCTGCGCTGTCAAACGCGCTTTGCGTCTGGCGCAATTTGTGGAGCGATTCCGACGACCTTGCGAAGAAAGCATTGAAGTTTATGAAGGCTCGTTATTCGGGGAACTCTCAACGCAGCCCG(SEQ ID NO:28)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGGAATACGGCGGTCATGCCTTAGTGTGGTCTGGGGACTGGACGCCGGAAGGTGCTCGTAAGGCGATTTCCGGTGCAGCACGGGCGGGTTACGACTATATTGAAATCGCACTCCTTGATCCTTGGAAAGTAGATGTCGCCTTAACTAAAGATTTATTGCAAGAGTACAATCTCCGTGCTCACGCATCGTTAGGTCTCTCTGCAGCAACAGACGTCACTAGTACGGACCCTGCCATTGTAGCCAAAGGCGACGAGCTGTTACGCAAGGCGACGGACGTTCTTCACGCCATCGGGGGCACAGAACTCTGCGGTGTAATCTACTGTGCACTGGGCAAGTATCCAGGGCCAGCCAGTAAAGAAAATCGCGCGAATAGTGTCGCGGCTATGCAACGGCTGGCGGACTACGCAGCGGACAAGGGGATTAACATCAACCTGGAGGTTGTCAATCGCTATGAGACAAACATCATGAACACTGGCCTGGAAGGGCTGGCATTTCTGGACGAGGTCAATCGTCCTAATGCGTATCTCCACTTAGATACTTATCACATGAACATCGAAGAAGATGGCATGGAAAAGTCGGTACTCGCCGCCAAAGATCGGCTGGGTTACGTGCACATTGGCGAGTCTCACCGCGGCTATCTCGGGACTGGCAATGTCGATTTCGATTCCTTCTTTGCTGCATTAAAAAAGATTGACTATCAGGGTCCAATCACTTTTGAGAGCTTCTCCTCGGAGGTAGTTGACCCTAAGCTGAGTAATACGTTGTGTGTATGGCGGAACCTCTGGCATGACTCTGACGATCTCGCGAAAAAAGCACTCCGGTTCATGAAGGAGCGGTATCCAGGGAACCCACAACGGTCGCCT(SEQ ID NO:29)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGAAGTACGGTGGCCATGCCTTGGTATGGAGCGGTGATTGGACGCCAGAAGGCGCTCGCCAAGCCATCTCGGGGGCGGCTCGCGCTGGGTACGACTATATCGAAATCGCGTTACTGGACCCATGGAAAGTAGACGTAGCTTTGACCAAGGACCTCCTGCAGGAGTTTAACTTACGTGCTCACGCGAGTCTGGGCCTGAGCGCAGCCACGGATGTCACCAGTACAGACATGGCTATCGTGGCCAAGGGGGATGAGCTGCTTCGCAAAGCCACCGACGTACTGGCGGCGATCGGCGGGAAAGAGCTGTGTGGGGTTATTTACTGTGCCCTTGGCAAATACCCAGGTCCTGCCTCGAAAGAGAATCGGAACAACAGTGTCGCTGCGATGCAACGTCTTGCGGATTATGCCGCAGATAAGGACATCAATATCAATTTGGAGGTAGTTAACCGCTACGAGACAAACATTATCAACACAGGTATCGAAGGTTTAGCATTTCTGGATGAGGTGGATCGCCCGAATGCCTATCTTCACTTGGACACTTACCACATGAATATCGAGGAAGATGGGATGGAGAAGTCCGTACTCGCGGCTAAAGACCGCCTCGGCTATGTTCACATCGGCGAATCCCATCGGGGCTATCTTGGCACAGGCAATGTAGATTTTGATACTTTCTTTGCAGCCTTAAAGAAAATTGGGTATCAAGGGCCAATTACATTTGAGTCCTTCAGTTCTGAGGTCGTTGACCCTAACCTGTCGAATACGCTGTGTGTCTGGCGCAATTTGTGGCATGACTCGGATGACCTCGCGAAAAAGGCCTTGCAATTCATGAAGGAGCGCTACTCGGGTAACCCGCAACGGAGTCCG(SEQ ID NO:30)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGAAGTTTGGGATCCATTCAATGGTGTGGGTGGGGGACTGGAGTCCTGAACACGCGCGCCATGCCATCGCCTCAAGTGCTGAAGCGGGCTACGATTTAATCGAGTTGGCTGCAATCGACCCGGCTACGTTCGATGTAGATCTGACCGCGAAACTTCTTGCTGAGCACGGGATTCAAGCGTCGGCTTCCCTTGGTCTTGATGCGGCGACCGACGTATCAAGCGAAGACCCGGATGTGGTGGCCGCTGGGCGCGCTCGCTTGCGGGACGCTTTGGCTCTCGTCCGGGATACCGGTGGCACGATGCTTTGTGGCGTTATTTACTCCGCTCTGCGGAAGTACGACGCACCGGTAACTGAGCGTGGTTTAGCCAATTCACAAGAGACCATTGCAGCACTCGCGGACGAGGCCGCGGCTTCCGGTATTACTATCGGGCTGGAGTTCTGCAACCGTTATGAAACGAACGTACTTAACACGACCGCCCAGACTTTGGCGTTCATCGCAGCCGTGGATCGCCCTAACGTTATGGCTCACTTAGATACCTACCACATGAACATTGAAGAACCGTCTATGTCTGAGCCTGTTCTTGCAGCGGCTGGCCGCCTTGGTTACGTCCATGTTGGTGAGTCTCACCGCGGCGCGCCTGGTACTGGTAGTATCCCATGGGACGAGTTCTTCGGTGCCCTCCGTGAGTGTGGGTATGATGGTATTGTGACTTTTGAGAGTTTTTCTTCTGAAGTTGTTCACCCTAGTTTTTCCAACACATTGGCCATCTGGCGGAACCTGTGGACTGACAATCGCAAACTTGCAACCGGTGCTCTTGCTTTTATGCGGGCCCATTTGCGGGCCGCTGGCGGTCGCGGGGCC(SEQ ID NO:31)。
在一些实施方式中,多核苷酸包含以下核酸序列或由其组成:ATGAAACTCGGGATTCATGCATTAGTGTGGGTAGGTGGTTGGACACCTGAGGAAGCTGAACTCGCCATTAGTAGCACGGCGCGCGCAGGGTACGATCTCATTGAAATCCCTGCGCTGGACCCGTCGCGTATTGACGTTGCTTCCACCCGGGAGATGCTTGAGCGCCATGGTTTGCAAGCAAGCGTGTCCCTGGGTCTCGCTCCTGACACCGACATCAATTCGGAAGATGTAGCGTGTGTAGATCGTGGCCGGGATGTCTTGATGCGTGCACTGGAGGTTAGTTCTGGCATCGGTTCCACATACCTTGGGGGCGTAATTTTCGGGGCTATGACTAAGTACAGCGCCCCTACCACAGAGCGGGCCCGCGCAAATAGCGTGGCGGTAATCAAGGAGTTGGCCCAAGAAGCCCGTGGCTGCGGGACAACGATTGGGCTTGAATTTGTTAATCGGTACGAGAGTAACTTATTAAATACTGCTCAACAAACCCTGGACTACTTGGATCTCGTAGGGGAAGATAACGTGGTGGTACACGCTGATGTATATCACATGAACATCGAGGAGACGGATTTCCGCACACCGATTCTGGCTTGCGGCGACCGTCTGGGCTATGTTCACGTAGGCGAATCCCACCGTGGTTACCTGGGTACAGGTTCGGTAAACTTTCCTGAATTTTTCGGTGCTTTGAAGGAAGTCGGGTATGCAGGGCCTATCACCTTTGAATCATTCTCCTCCAGCGTCGTTGACCCTCTGTTGAGCAATACATTGGCGATCTGGCGTAATCTTTGGAGTGACAGCACAGATCTGGCCACTCAGGCGCATGCATTTATCTCGGCAGGCTTGGCGGATGATGGGGGGCGTGGTGCC(SEQ ID NO:32)。
在一些实施方式中,多核苷酸编码3-差向异构酶多肽。在一些实施方式中,多核苷酸编码D-阿洛酮糖3-差向异构酶多肽。
如本文所用,术语“3-差向异构酶”是指能够催化酮糖单糖的C3位的异构化的任何肽、多肽或蛋白质。
根据一些实施方式,提供了一种包含本文公开的多核苷酸的人工核酸分子。
在一些实施方式中,人工核酸包括人工载体。
在一些实施方式中,人工载体包括质粒。在一些实施方式中,人工载体包括或为含有人工核酸分子的土壤杆菌。在一些实施方式中,人工载体为表达载体。在一些实施方式中,人工载体为植物表达载体。在一些实施方式中,人工载体为细菌表达载体。在一些实施方式中,人工载体为真菌表达载体。在一些实施方式中,人工载体为酵母表达载体。在一些实施方式中,人工载体用于表达如本文所公开的编码核酸序列的3-差向异构酶。在一些实施方式中,人工载体用于表达如本所公开的编码核酸序列的D-阿洛酮糖3-差向异构酶。在一些实施方式中,人工载体用于在细胞、组织或生物中异源表达编码如本文所公开的核酸序列的3-差向异构酶。在一些实施方式中,人工载体用于在细胞、组织或生物中异源表达编码如本文所公开的核酸序列的D-阿洛酮糖3-差向异构酶。在一些实施方式中,人工载体用于在细胞、组织或生物中产生或生产D-阿洛酮糖。
本领域技术人员公知细胞内多核苷酸的表达。在许多方法中,可以通过转染、病毒感染或直接改变细胞基因组来实现。在一些实施方式中,多核苷酸存在于表达载体中,诸如质粒或病毒载体中。载体核酸序列通常至少包含在细胞中繁殖的复制起点,以及任选地另外的要素,诸如异源多核苷酸序列、表达控制要素(例如,启动子、增强子)、选择性标记(例如,抗生素抗性)、聚腺嘌呤序列。
载体可以是经由非病毒方法或经由病毒方法递送的DNA质粒。病毒载体可以是逆转录病毒载体、疱疹病毒载体、腺病毒载体、腺相关病毒载体、病毒科病毒载体或痘病毒载体。也可以使用大麦条纹花叶病毒(BSMV)、烟草脆裂病毒和甘蓝曲叶病毒(CbLCV)。启动子在植物细胞中可以是活性的。启动子可以是病毒启动子。
在一些实施方式中,通过标准方法将载体导入细胞,该标准方法包括电穿孔(例如,如From et al.,Proc.Natl.Acad.Sci.USA82,5824(1985)中所述)、热休克、病毒载体感染、小颗粒高速弹道穿透,其中核酸在小珠或颗粒基质内或表面上(Klein et al.,Nature327.70-73(1987)),诸如包被颗粒和针状颗粒的生物射弹使用、土壤杆菌Ti质粒和/或类似物。如本文所用的术语“启动子”是指围绕RNA聚合酶(即,RNA聚合酶II)起始位点聚集的一组转录控制模块。启动子由离散的功能模块组成,每个模块由DNA的大约7-20个碱基对组成,并包含转录激活剂或阻遏蛋白的一个或多个识别位点。启动子可以延伸到转录起始位点的上游或下游,并且可以是从几个碱基对到几千个碱基对范围内的任何尺寸。
在一些实施方式中,多核苷酸由RNA聚合酶II(RNAP II和Pol II)转录。RNAP II是在真核细胞中发现的一种酶,已知催化DNA的转录以合成mRNA和大多数snRNA和microRNA的前体。
用于在细菌宿主细胞中指导本发明核酸构建体转录的合适启动子的实例是获得自淀粉样芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖合酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌crylllA基因(Agaisse和Lereclus,1994,Molecular Microbiology 13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon et al.,1988,Gene 69:301 -315)、天蓝色链霉菌琼脂糖酶(Streptomyces coelicolor agarase)基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff et al.,1978,Proc.Natl.Acad.Sci.USA75:3727-3731)以及tac启动子(DeBoeret al.,1983,Proc.Natl.Acad.Sci.USA 80:21 -25)的启动子。进一步的启动子在"Usefulproteins from recombinant bacteria",Gilbert et al.,1980,Scientific American242:74-94;以及在Sambrook et al.,1989,同上中描述。串联启动子的实例在WO 99/43835中公开。
在一些实施方式中,使用植物表达载体。在一个实施方式中,多肽编码序列的表达由多个启动子驱动。在一些实施方式中,使用病毒启动子,诸如CaMV的35S RNA和19S RNA启动子[Brisson et al.,Nature 310:511-514(1984)],或TMV的外壳蛋白启动子[Takamatsuet al.,EMBO J.6:307-311(1987)]。在另一个实施方式中,使用植物启动子,诸如,例如,RUBISCO的小亚单元[Coruzzi et al.,EMBO J.3:1671-1680(1984);和Brogli et al.,Science 224:838-843(1984)]或热休克启动子,例如,大豆hspl7.5-E或hspl7.3-B[Gurleyet al.,Mol.Cell.Biol.6:559-565(1986)]。在一个实施方式中,使用Ti质粒、Ri质粒、植物病毒载体、直接DNA转化、显微注射、电穿孔法以及本领域技术人员熟知的其他技术将构建体导入到植物细胞。参见,例如,Weissbach&Weissbach[Methods for Plant MolecularBiology,Academic Press,NY,Section VIII,pp 421-463(1988)]。本发明也可以使用本领域公知的其他表达系统,诸如昆虫和哺乳动物宿主细胞系统。
在一些实施方式中,本发明使用含有来自真核病毒(诸如逆转录病毒)的调控元件的表达载体。例如,SV40载体可包括pSVT7和pMT2。在一些实施方式中,源自牛乳头瘤病毒的载体包括pBV-lMTHA,而源自Epstein Bar病毒的载体包括pHEBO和p205。其他示例性载体包括pMSG、pAV009/A+、pMTO10/A+、pMAMneo-5、杆状病毒pDSVE以及允许在SV-40早期启动子、SV-40晚期启动子、金属硫蛋白启动子、鼠乳腺肿瘤病毒启动子、Rous肉瘤病毒启动子、多角体蛋白启动子,或显示在真核细胞中有效表达的其他启动子的指导下表达蛋白的任何其他载体。
在一些实施方式中,重组病毒载体——其具有诸如全身感染和靶向特异性等优点,用于体内表达。在一个实施方式中,全身感染是例如逆转录病毒的生命周期中固有的,并且是单个感染的细胞产生感染邻近细胞的许多子代病毒颗粒的过程。在一个实施方式中,结果是大部分未被原始病毒颗粒初始感染的大面积区域迅速被感染。在一个实施方式中,产生的病毒载体不能全身传播。在一个实施方式中,如果期望目的是将特定基因导入仅定位数量的靶细胞,则此特性可能有用。
在一些实施方式中,使用植物病毒载体。在一些实施方式中,使用野生型病毒。在一些实施方式中,使用解构病毒,诸如,本领域已知的病毒。在一些实施方式中,使用土壤杆菌将本发明的载体导入病毒。
各种方法可用于将本发明的表达载体导入细胞。这些方法在以下文献中有一般描述:Sambrook et al.,Molecular Cloning:ALaboratory Manual,Cold Springs HarborLaboratory,New York(1989,1992),Ausubel et al.,Current Protocols in MolecularBiology,John Wiley and Sons,Baltimore,Md.(1989),Chang et al.,Somatic GeneTherapy,CRC Press,Ann Arbor,Mich.(1995),Vega et al.,Gene Targeting,CRC Press,Ann Arbor Mich.(1995),Vectors:ASurvey of Molecular Cloning Vectors and TheirUses,Butterworths,Boston Mass.(1988)和Gilboa et at.[Biotechniques 4(6):504-512,1986],并且包括,例如,稳定或瞬时转染、脂质体转染、电穿孔、土壤杆菌Ti质粒和重组病毒载体的感染。此外,正-负选择方法请参见美国专利号5,464,764和5,487,992。
应当理解,除了包含插入的编码序列(编码多肽)的转录和翻译所需的要素外,本发明的表达构建体还可以包含工程化以优化表达的多肽的稳定性、生产、纯度、产量或活性的序列。
在一些实施方式中,人工载体包括编码蛋白质的多核苷酸,其包含如本文所述的氨基酸序列。
根据一些实施方式,提供了一种转基因细胞或转染细胞,其包含:(a)本文公开的多核苷酸;(b)本文公开的人工核酸分子;(c)本文公开的质粒或土壤杆菌;(d)本文公开的蛋白质;或其任意组合。
如本文所用,术语“转化的细胞”、“转基因细胞”或“转染细胞”是指经过人类操作以便包括外源多核苷酸的任何细胞。在一些实施方式中,外源多核苷酸被整合到细胞的基因组中(例如,在基因组或基因水平上进行操作)。在一些实施方式中,外源多核苷酸未被整合到细胞的基因组中。在一些实施方式中,转化的细胞、转基因细胞或转染细胞已经将外源多核苷酸,诸如本文所公开的分离的DNA分子导入其中。在一些实施方式中,转化的细胞、转基因细胞或转染细胞包括具有导入其中的人工载体的细胞。在一些实施方式中,转基因细胞或转染细胞是经历基因组突变或修饰的细胞。在一些实施方式中,转基因细胞或转染细胞是经历CRISPR基因组编辑的细胞。在一些实施方式中,转基因细胞或转染细胞是经历其基因组的至少一个碱基对的靶向突变的细胞。在一些实施方式中,外源多核苷酸(例如,本文所公开的分离的DNA分子)或载体被稳定整合到细胞中。在一些实施方式中,转基因细胞或转染细胞表达本发明的多核苷酸。在一些实施方式中,转基因细胞或转染细胞表达本发明的载体。在一些实施方式中,转基因细胞或转染细胞表达本发明的蛋白质。在一些实施方式中,转基因细胞或转染细胞是缺乏本发明的多核苷酸的细胞,其已被转化或基因修饰以包含本发明的多核苷酸。在一些实施方式中,如本文所述,使用CRISPR技术修饰细胞的基因组。
在一些实施方式中,细胞是单细胞生物、多细胞生物的细胞和培养物中的细胞。
在一些实施方式中,单细胞生物包括真菌或细菌。
在一些实施方式中,真菌是酵母细胞。
在一些实施方式中,转化的细胞、转基因细胞或转染细胞选自地衣芽孢杆菌、酿酒酵母菌、粟酒裂殖酵母菌、恶臭假单胞菌、毕赤酵母菌、曲霉菌、里氏木霉菌、谷氨酸棒状杆菌、大肠杆菌或枯草芽孢杆菌。
在一些实施方式中,细胞是植物细胞。在一些实施方式中,细胞包括植物细胞系。在一些实施方式中,细胞是昆虫细胞。在一些实施方式中,细胞包括昆虫细胞系。
适用于转化和/或异源表达的植物和/或昆虫细胞系的类型是常见的,并且对本领域普通技术人员来说是显而易见的。昆虫细胞系的非限制性实例包括但不限于,Sf-9细胞、SR+施耐德细胞、S2细胞等。
根据一些实施方式,提供了一种源自本文公开的转基因细胞或转染细胞的提取物,或其任何部分。
在一些实施方式中,提取物包括本发明的多核苷酸、本文公开的分离的DNA分子、本文公开的蛋白质或其任意组合。
根据一些实施方式,提供了源自本文公开的转基因细胞或转染细胞的匀浆物、裂解物、提取物、其任意组合或其任何部分。
对细胞或细胞培养物进行提取、裂解、匀化、分级或其任意组合的方法和/或手段是常见的,并且对于细胞生物学和生物化学领域的普通技术人员来说是显而易见的。非限制性实例包括但不限于,压力裂解(例如,诸如使用法式压榨机)、酶裂解、可溶-不溶相分离(诸如,用于获得上清液和沉淀物)、基于洗涤剂的裂解、溶剂(例如,极性或非极性溶剂)、液相色谱质谱等。
根据另一个方面,提供了转基因植物、转基因植物组织或植物部分,其包含:(a)本发明的核酸序列;(b)本文公开的质粒或表达载体;(c)本发明的多肽;(d)本文公开的转基因细胞或转染细胞;或(e)(a)至(d)的任意组合。
根据一些实施方式,提供了一种组合物,其包含本文公开的:(a)本发明的多肽;(b)本发明的多核苷酸(例如,分离的DNA分子);(c)质粒或表达载体;(d)本文所述的转基因细胞;(e)转基因细胞或转染细胞的提取物;或(f)(a)至(e)的任意组合,以及可接受的载体。
在一些实施方式中,组合物进一步包含二价金属阳离子。
在一些实施方式中,二价阳离子选自:Co2+、Mg2+、Mn2+、Mo2+或Ni2+
在一些实施方式中,可接受的载体是或包括水性溶剂。
在一些实施方式中,多肽结合到固体载体上。在一些实施方式中,本发明组合物中的多肽(例如,共价地或非共价地)结合到固体载体上。
在一些实施方式中,通过共价键进行结合。在一些实施方式中,多肽与固体载体共价结合。在一些实施方式中,结合包括直接或间接结合。在一些实施方式中,间接结合是通过化学接头或试剂进行的。在一些实施方式中,结合是通过非共价相互作用(例如,静电相互作用)进行的。
在一些实施方式中,组合物进一步包含能够结合多肽和固体载体的化学试剂。在一些实施方式中,组合物进一步包含能够结合多肽和固体载体的化学试剂。
在一些实施方式中,组合物进一步包括果糖、D-阿洛酮糖或两者。
如本文所用,术语“载体”、“赋形剂”或“佐剂”是指组合物(例如,药物或营养品)中不是活性剂的任何成分。如本文所用,术语“可接受的载体”是指无毒、惰性、固体、半固体或液体填料、稀释剂、包封材料、任何类型的制剂辅料,或仅指无菌水介质,诸如盐水。可用作可接受的载体的材料的一些实例包括糖——诸如乳糖、葡萄糖和蔗糖,淀粉——诸如玉米淀粉和马铃薯淀粉,纤维素及其衍生物——诸如羧甲基纤维素钠、乙基纤维素和醋酸纤维素;粉状黄蓍胶;麦芽、明胶、滑石;赋形剂——诸如可可脂和栓剂蜡;油——诸如花生油、棉籽油、红花油、芝麻油、橄榄油、玉米油和大豆油;二醇类——诸如丙二醇,多元醇——诸如甘油、山梨醇、甘露醇和聚乙二醇;酯类——如油酸乙酯和月桂酸乙酯、琼脂;缓冲剂,诸如氢氧化镁和氢氧化铝;藻酸;无热源水;等渗盐水,林格氏溶液;乙醇和磷酸盐缓冲溶液,以及用于药物制剂的其他无毒相容物质。本文可用作载体的物质的一些非限制性实例包括糖、淀粉、纤维素及其衍生物、粉状黄蓍胶、麦芽、明胶、滑石、硬脂酸、硬脂酸镁、硫酸钙、植物油、多元醇、藻酸、无热源水、等渗盐水、磷酸盐缓冲溶液、可可脂(栓剂基质)、乳化剂(例如,卡波姆、羟丙基纤维素、月桂基硫酸钠)以及其他用于其他药物制剂的无毒相容物质。也可能存在润湿剂和润滑剂,诸如十二烷基硫酸钠,以及着色剂、调味剂、赋形剂、稳定剂、抗氧化剂和防腐剂。任何无毒、惰性和有效的载体都可以用来配制本文所述的组合物。
载体可总共占本文所述组合物的约0.1重量%至约99.99999重量%。
合成方法
根据一些实施方式,提供了一种合成具有3-差向异构酶活性的多肽的方法,其包括以下步骤:(a)提供包含质粒或表达载体的细胞,该质粒或表达载体包含与选自SEQ IDNo.:17-32的核酸序列具有至少70%序列同一性的核酸序列;和(b)培养来自步骤(a)的细胞,使得由质粒或表达载体编码的多肽被表达,从而合成多肽。
在一些实施方式中,方法进一步包括选自以下的至少一个步骤:回收多肽、至少部分纯化多肽、固定化多肽及其任意组合。
在一些实施方式中,固定化是指固定在固体载体上。在一些实施方式中,多肽包含与固体载体具有增加的结合亲和力的氨基酸序列。在一些实施方式中,多肽包含与固体载体具有反应性的化学部分。
在一些实施方式中,方法包括在培养基中培养转基因细胞或转染细胞,并提取转基因细胞或转染细胞。
在一些实施方式中,方法包括以下步骤:(a)在培养基中培养转基因细胞或转染细胞;和(b)提取转基因细胞或转染细胞,从而从转基因细胞或转染细胞中获得提取物。
在一些实施方式中,转基因细胞或转染细胞包含质粒或表达载体,该质粒或表达载体包含与SEQ ID No.17-32中的任一序列具有至少70%、至少75%、至少80%、至少85%、至少89%、至少92%、至少95%或至少99%或其间的任何值和范围的同源性或同一性的核酸序列。每种可能性都代表本发明的单独实施方式。
在一些实施方式中,转基因细胞或转染细胞包含本文公开的本发明多核苷酸或其多种。
在一些实施方式中,转基因细胞或转染细胞包含本文所公开的多核苷酸、包含其的质粒或表达载体,或其任意组合。
在一些实施方式中,细胞是转化的细胞、转基因细胞或用本文所公开的多核苷酸转染的细胞。
在一些实施方式中,细胞是原核细胞或真核细胞。
在一些实施方式中,细胞是转化的细胞、转基因细胞或用本文所公开的质粒或表达载体转染的细胞。
在一些实施方式中,方法进一步包括步骤(a)之前的步骤,其包括用本文公开的质粒或表达载体导入或转染细胞。
用人工核酸分子或载体导入或转染细胞的方法是常见的,并且对本领域普通技术人员来说是显而易见的。
在一些实施方式中,导入或转染包括将包含本文公开的多核苷酸的质粒或表达载体转移到细胞中;或修饰细胞的基因组以包括本文公开的多核苷酸。在一些实施方式中,转移包括转染。在一些实施方式中,转移包括转化。在一些实施方式中,转移包括脂质体转染。在一些实施方式中,转移包括核转染。在一些实施方式中,转移包括病毒感染。
如本文所用,术语“转染”和“导入”是可互换的。
在一些实施方式中,导入不涉及病毒或病毒衍生的颗粒和/或方法。
根据一些实施方式,提供了一种用于生产D-阿洛酮糖的方法,其包括以下步骤:(a)将本文公开的组合物与有效量的果糖接触,从而获得反应混合物;和(b)使反应混合物经受适合于果糖至少部分转化为D-阿洛酮糖的条件,从而产生D-阿洛酮糖。在一些实施方式中,步骤a在水溶液(本文也称为“反应混合物”)中进行。在一些实施方式中,水溶液的pH在3至9之间,在5至9之间,在5.5至9之间,在5.5至8之间,在5.5至7.5之间,在6至9之间,在6至8之间,在6至7.5之间,包括其间的任何范围。
在一些实施方式中,反应混合物中多肽的w/w浓度为0.1至10g/L、0.1至1g/L、0.2至1g/L、0.2至0.5g/L,包括其间的任何范围。
如本文所用,术语“部分”是指范围%为0.01至99%。
在一个实施方式中,条件包括:(i)温度在25℃至75℃之间,在30℃至70℃之间;在40℃至60℃之间,在45℃至75℃之间,在45℃至70℃之间,在45℃至60℃之间,在40℃至55℃之间,在约40℃至约50℃之间;(ii)pH在3至9之间,在5至9之间,在5.5至9之间,在5.5至8之间,在5.5至7.5之间,在6至9之间,在6至8之间,在6至7.5之间,或(i)和(ii)两者。
在一些实施方式中,如本文所述,经受包括使反应混合物与二价金属阳离子接触。
在一些实施方式中,二价金属阳离子在反应混合物中以0.1mM至10mM范围内的浓度存在。
在一些实施方式中,方法进一步包括包含从反应混合物中分离D-阿洛酮糖的步骤。
在一些实施方式中,分离包括:提取、沉淀、膜过滤或其任意组合。
根据一些实施方式,方法包括使果糖与以下中的任一种接触:本文所述的本发明的多肽或其功能类似物、包含其的细胞或衍生自其的提取物,从而产生D-阿洛酮糖。
在一些实施方式中,培养包括用有效量的果糖补充细胞。在一些实施方式中,补充是通过其中培养细胞的生长或培养基进行的。
在一些实施方式中,接触是在无细胞系统中进行的。
本领域普通技术人员将明白,利用本文公开的本发明的多核苷酸或其多种以及本发明的蛋白质或其多种的合适无细胞系统的类型。
在一些实施方式中,方法进一步包括步骤(b)之前的步骤,其包括将培养的转基因细胞或培养的转染细胞从培养基中分离。
从培养基中分离细胞的方法是常见的,并且可以包括但不限于,离心、超速离心或其他对本领域普通技术人员来说显而易见的方法。
根据一些实施方式,提供了根据本文公开的方法获得的转化细胞、转基因细胞或转染细胞的提取物。
在一些实施方式中,提取物包括其中培养转化细胞、转基因细胞或转染细胞的培养基的提取物。
在一些实施方式中,提取物包括转化细胞、转基因细胞或转染细胞的提取物,包括其任何部分。
在一些实施方式中,提取物包括转化细胞、转基因细胞或转染细胞中的任一种的裂解物、匀浆物、极性提取物、非极性提取物、其任何部分或其任意组合。在一些实施方式中,提取物进一步包括其中培养转化细胞、转基因细胞或转染细胞的培养基,或载体,其中载体如本文所述。
根据一些实施方式,提供了根据本文公开的方法获得的分离自培养的转基因细胞或培养的转染细胞的培养基或其部分。
根据一些实施方式,提供了一种组合物,其包含(a)本文公开的提取物;(b)本文公开的培养基或其部分;或(c)(a)和(b)的任意组合,以及本文所述的可接受的载体。
在一些实施方式中,部分包括级分或其复数。
一般概念
如果提供了值的范围,则应理解为,除非上下文另有明确规定,否则该范围的上限和下限之间的每个中间值(至下限单位的十分之一)以及该所述范围中任何其他所述范围或中间值均包含在本发明范围内。这些较小范围的上限和下限可以独立地包含在较小范围内,并且也包含在本发明范围内,但须符合所述范围内的任何特别排除的上下限。如果所述范围包括上下限中的一个或两个,除那些所包括的上下限中的一个或两个之外的范围也包括在本发明中。
如本文所用,当与数值组合时,术语“约”是指提及值的正负10%。例如,约1000纳米(nm)的长度是指1000nm±100nm的长度。
值得注意的是,如本文和所附权利要求中所用,单数形式“一(a)”、“一个(an)”和“所述(the)”包括复数指示物,除非上下文另有明确规定。因此,例如,“多核苷酸”的提及包括多个这种多核苷酸,而“多肽”的提及包括对本领域技术人员已知的一种或多种多肽及其等同物的提及,等等。应进一步注意的是,权利要求可以撰写为排除任何可选要素。因此,这种叙述旨在与权利要求要素的叙述或“否定”限制的使用有关作为使用排他性术语如“仅”、“只”等的在先基础。
在使用类似于“A、B和C中的至少一个”的惯例的情况下,一般来说,这种结构意味着本领域技术人员会理解该惯例(例如,“具有A、B和C中的至少一个的系统”将包括但不限于仅具有A的系统、仅具有B的系统、仅具有C的系统、A和B一起的系统、A和C一起的系统、B和C一起的系统和/或A、B和C一起的系统等)。本领域技术人员还将进一步理解,几乎任何表示两个或多个替代术语的析取词和/或短语,无论是在说明书、权利要求书还是附图中,都应该被理解为考虑了包括一个术语、任一术语或两个术语的可能性。例如,短语“A或B”将被理解为包括“A”或“B”或“A和B”的可能性。
应理解的是,为了清楚起见在分开的实施方式的背景下描述的本发明的某些特征也可以在单个实施方式中组合提供。相反,为了简洁起见在单个实施方式的背景下描述的本发明的各种特征也可以分开提供或以任何合适的子组合形式提供。与本发明有关的实施方式的所有组合都特别包括在本发明中,并且在本文中公开,就像每个和每一个组合是单独且明确公开的。此外,各种实施方式及其要素的所有子组合也具体包含在本发明中,并在本文中公开,就像每个和每一个这种子组合是在本文中单独且明确公开。
本领域普通技术人员在检查以下实施例后,本发明的其他目的、优点和新颖特征将变得显而易见,这些实施例不旨在是限制性的。此外,本文上面描述的和权利要求部分中所述的本发明的各种实施方式和方面中的每个均在以下实施例中找到实验支持。
上文所述的本发明的各种实施方式和方面以及所附权利要求部分所要求保护的本发明的各种实施方式和方面在以下实施例中找到实验支持。
实施例
一般来说,本文使用的术语和本发明中使用的实验室步骤包括分子、生化、微生物和重组DNA技术。这些技术在文献中有详细的解释。例如,参见"Molecular Cloning:Alaboratory Manual"Sambrook et al.,(1989;"Current Protocols in MolecularBiology"Volumes I-III Ausubel,R.M.,ed.(1994);Ausubel et al.,"CurrentProtocols in Molecular Biology",John Wiley and Sons,Baltimore,Maryland(1989);Perbal,"A Practical Guide to Molecular Cloning",John Wiley&Sons,New York(1988);Watson et al.,"Recombinant DNA",Scientific American Books,New York;Birren et al.(eds)"Genome Analysis:A Laboratory Manual Series",Vols.1-4,ColdSpring Harbor Laboratory Press,New York(1998);U.S.Pat.Nos.4,666,828;4,683,202;4,801,531;5,192,659和5,272,057中提出的方法;"Cell Biology:A LaboratoryHandbook",Volumes I-IIICellis,J.E.,ed.(1994);"Culture of Animal Cells-AManual of Basic Technique",Freshney,Wiley-Liss,N.Y.(1994),第三版;"CurrentProtocols in Immunology"Volumes I-III Coligan J.E.,ed.(1994);Stites et al.(eds),"Basic and Clinical Immunology"(8th Edition),Appleton&Lange,Norwalk,CT(1994);Mishell和Shiigi(eds),"Strategies for Protein Purification andCharacterization-A Laboratory Course Manual"CSHL Press(1996);所有这些都通过引用并入本文。遍及本文提供了其他一般参考文献。
材料和方法
生长培养基制备
重组细胞的生长按照本领域中所述进行。例如,参见,Chang-Su Park et.al.,2016,JBioscience Bioengineering vol.121(2)和WO2018116266。简而言之,在37℃下,将转化的克隆(携带表达载体)在绝佳肉汤(Terrific Broth,TB)培养基或含有卡那霉素的确定培养基中生长过夜。过夜培养物被重新接种,并在TB(Kan+)中生长至0.6-0.9OD6oo。在发酵过程中通过添加IPTG诱导本发明多肽在转化细胞中的表达。通过裂解、离心、再悬浮和安装在柱上从细胞中提取和分离多肽。培养基和缓冲液的成分和浓度是本领域已知的,并且,例如,可以包含:
绝佳肉汤(TB)
每升水中的配方:分别将胰蛋白胨(12.0g);酵母提取物(24.0g);和100%甘油(5ml)置于900ml高压釜中。
分别将磷酸氢二钾[K2HPO4](12.54g)和磷酸二氢钾[KH2PO4](2.39g)置于100ml高压釜中。
裂解缓冲液
氯化钠[100-500mM];1Tris[10-100mM];吐温20Tris[10-100mM];NaCl[100-500mM]和咪唑[25-500mM];pH 6-9。
透析/储存缓冲液
培养物的OD600值超过约0.6-0.9。将体积相当于1O.D.的样品收集到Eppendorf管中,并且用作时间零点(T0)。
将TON培养物转移至离心管中,在4℃下以8000rpm离心10min。
所有后续阶段均在冷却条件下进行。
倾析上清液,用20ml冷的0.9% NaCl重新悬浮颗粒,然后在4℃下以14,000rpm离心10min。
将样品重新悬浮在40-80ml裂解缓冲液中,并超声处理3-4次。
此后,在4℃下以14,000rpm对样品进行离心20min。在装柱之前,使用0.44μm的过滤器对液体进行过滤。
结果
本发明的示例性多肽已经在AKTA纯化器上分离和纯化,如下所述:
Ni-sepharose FF柱批次记录–Exp_20:B1_C3_N58(SEQ ID NO:11)(图1)
制剂:
负载级分:Exp_20:B1_C3_N58(F003)
柱平衡:流速:1-5ml/min
οTris 10-100mM,NaCl 100-500mM(pH 6.0-9.0)
柱负载:流速:1-5ml/min
负载级分负载的体积。
柱清洗:缓冲液A:Tris 10-100mM,100-500mM NaCl(pH 6.0-9.0)+10-125mM咪唑
洗脱:缓冲液A:Tris 10-100mM,100-500mM NaCl(pH 6.0-9.0)+125-450mM咪唑
剥离:缓冲液B
再生:流速:1-5ml/min
a.6CV 0.5M NaOH
b.10CV RO
c.4CV 20%乙醇
如图1所描绘,实线(箭头标记)表示蛋白质的芳香氨基酸残基在280nm处的吸光度。数字1-5描绘了不同的分离阶段:1——样品(裂解物)的负载;2——用缓冲液A洗涤、分离未结合的蛋白质;3——用含有25mM咪唑的缓冲液A洗涤、分离低亲和力的非特异性结合蛋白质;4——用含有125-450mM咪唑的缓冲液A洗脱、分离高亲和力的结合蛋白质(包括his标记的蛋白质);5——使用缓冲液B剥离以分离高亲和力的结合蛋白质(his标记的蛋白质),然后用0.5M NaOH进行变性洗涤,以清洗和再生柱。
在SDS-PAGE上解析不同的蛋白质级分,并用考马斯蓝染液染色(图4):T0——表示在质粒基因表达的IPTG诱导之前收集的细胞裂解物;To.n——表示在IPTG诱导超过12小时后收集的细胞裂解物;负载——表示负载在镍柱上的细胞可溶性级分;UB——表示通过柱并含有未与镍树脂结合的所有未结合蛋白的级分;W5%——表示用10-125mM咪唑洗涤柱,并含有与镍树脂弱结合(非特异性结合)的所有蛋白;EL——表示通过用125-450mM咪唑洗涤柱,实现与镍树脂强结合(特异性结合)的蛋白的洗脱。
为了验证由D-果糖形成阿洛酮糖的效率,将10-100mM D-果糖与2-200μg的本发明的多肽在含有0.2-20mM MgCl2的磷酸缓冲液(pH 6-9)中混合。反应在37℃下温育0-120min。使用Omega 3μm SUGAR 100A LC柱250×4.6mm(Phenomenex)通过HPLC色谱法评估果糖转化为阿洛酮糖的转化率。通过运行流动相组成(DDW:ACN)的等度流对粗反应混合物进行分析。阿洛酮糖的保留时间(RT)为6.3min,并且果糖的保留时间为7.6min(图5)。如图5所呈现,反应开始10min后,反应混合物中可以检测到大量的阿洛酮糖。
进行了重复实验,即,用本发明的C3_N72多肽(SEQ ID No.:13)检测D-果糖产生阿洛酮糖,但这次使用温和酸性(pH 5-6)条件(图6)。如图6所呈现,反应开始30min后检测到大量阿洛酮糖。
本发明的示例性多肽(SEQ ID No.:4、9、10、11、12、13、14和16)显示出显著的D-果糖转化为阿洛酮糖的催化活性。为此,从上述多肽中,3种多肽(SEQ ID No.:11、12和13)在pH值约5.5至约7的范围内显示出最大的催化活性。进一步推断本发明多肽的起作用pH范围在约5至约9之间。
如下文所述,已利用本发明的示例性多肽(SEQ ID No.:11和13)进行了评估D-果糖转化为阿洛酮糖的试点实验。该实验的结果呈现在图7中。如图7所显示,所测试的多肽在反应开始后仅15min就诱导了约25%的转化率(约60g果糖转化为等量的阿洛酮糖),导致形成约60g/L阿洛酮糖。
简而言之,将含有200g D-果糖、K2HPO4(3.99g)、KH2PO4(2.72g)、MgCl2(0.41g)以及本发明的示例性多肽(0.42g/L)的进料溶液(总体积约1L)导入反应器中。反应在约50℃下在温和搅拌下进行。如上所述,通过HPLC确定转化率。
此外,发明人证明,与对照(来自假单胞菌Chicorri的D-塔格糖-3-差向异构酶)——其具有与来自ADM的商业酶相同的序列——相比,本发明测试的多肽具有优异的转化率。如图8A-B所示,与pH 6和7的对照相比,本发明的示例性多肽(SEQ ID No.:12)显示出显著更高的转化率(约高4至6倍的转化率)。如图8A所示,在pH 7下,测试的多肽在2h的反应时间后表现出超过20%的转化率。本发明其他多肽(例如,SEQ ID No.:11和13)显示出甚至更高的催化性能(数据未显示)。
虽然本发明结合其具体实施方式进行了描述,但显然本领域技术人员将明白许多替代、修改和变化。因此,其意图包括所有这些属于所附权利要求的精神和广泛范围的替代、修改和变化。
序列表
<110> 安布罗西亚生物公司
<120> 具有D-阿洛酮糖3-差向异构酶活性的多肽
<130> ZIS-P-001-PCT
<150> US 63/215,472
<151> 2021-06-27
<160> 32
<170> PatentIn version 3.5
<210> 1
<211> 287
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 1
Met Lys Phe Ala Ile Cys Asn Glu Thr Phe Gln Pro Asp Ala Pro Pro
1 5 10 15
Leu Trp Pro Leu Glu Lys Ala Phe Ala Tyr Ala Arg Glu Leu Gly Tyr
20 25 30
Thr Gly Ile Glu Phe Ala Pro Phe Asp Ala Thr Asp Val Ser Ala Glu
35 40 45
Arg Arg Ala Glu Val Arg Glu Leu Leu Glu Lys Tyr Gln Leu Glu Ser
50 55 60
Ile Gly Leu His Trp Leu Leu Ala Lys Thr Glu Leu Thr Ser Pro Asp
65 70 75 80
Ala Ala Val Arg Asp Arg Thr Ser Glu Tyr Leu Ala Glu Leu Ala Arg
85 90 95
Leu Cys Arg Asp Leu Gly Gly Ser Val Met Cys Gly Val Leu Gly Ser
100 105 110
Pro Gln Gln Arg Asn Leu Leu Pro Gly Val Thr His Asp Gln Ala Met
115 120 125
Glu Tyr Ala Ala Asp Val Ile Arg Ala Ala Met Pro Ala Leu Glu Asp
130 135 140
His Gly Val Thr Leu Ala Leu Glu Pro Leu Gly Pro Ala Glu Gly Asp
145 150 155 160
Phe Leu Leu Thr Ala Glu Ser Gly Ile Gln Leu Ala Gln Met Ile Asp
165 170 175
Ser Pro His Val Arg Leu His Leu Asp Val Lys Ala Met Ser Leu Glu
180 185 190
Ala Lys Pro Ile Pro Asp Ile Ile Arg Asp Ser Ala Asp Tyr Leu Ala
195 200 205
His Phe His Ala Asn Asp Pro Asn Lys Arg Gly Pro Gly Met Gly Asp
210 215 220
Val Asp Phe Val Pro Ile Phe Gln Ala Leu Gln Glu Ile Asn Tyr Gln
225 230 235 240
Gly Trp Val Ser Val Glu Val Phe Asp Tyr Glu Pro Gly Val Val Glu
245 250 255
Arg Leu Ala Arg Glu Ser Ile Ser Tyr Met Gln Arg Cys Leu Asp Lys
260 265 270
Leu Tyr Ser Ser Val Ser Gly Gly Glu Arg Pro Pro Pro Asp Asn
275 280 285
<210> 2
<211> 287
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 2
Met Lys Phe Ala Ile Cys Gln Glu Leu Phe Glu Pro Asp Ala Pro Pro
1 5 10 15
Leu Thr Asp Trp Ala Glu Gln Cys Arg Ile Ile Ala Glu Val Gly Tyr
20 25 30
Thr Gly Ile Glu Val Ala Pro Phe Asp Leu Ala Ser Val Pro Ala Ala
35 40 45
Thr Leu Thr Glu Met Arg Asn Thr Ala Glu Arg His Gly Leu Glu Ile
50 55 60
Ile Gly Leu His Trp Leu Leu Ala Lys Thr Asn Leu Thr Ser Pro Asp
65 70 75 80
Ala Ala Val Arg Thr Ala Thr Ala Asp Tyr Leu Lys Leu Leu Ala Asp
85 90 95
Thr Cys Ala Ala Leu Gly Gly Arg Val Leu Ala Gly Val Phe Gly Ser
100 105 110
Pro Gln Gln Arg Asn Leu Leu Ala Gly Val Thr Thr Glu Gln Ala Met
115 120 125
Asp Phe Ala Ala Glu Val Phe Arg Ala Ala Met Pro Thr Phe Ala Glu
130 135 140
Arg Asp Val Val Leu Cys Met Glu Pro Leu Thr Pro Lys Glu Thr Asp
145 150 155 160
Phe Ile Asn Thr Cys Ala Asp Ala Val Ala Leu Met Gln Met Val Asp
165 170 175
His Pro Ser Phe Val Leu His Gln Asp Val Lys Ala Met Leu Leu Ala
180 185 190
Glu Ser Asp Val Pro Glu Leu Ile His Arg His Lys Asp Ile Cys Gly
195 200 205
His Phe His Val Asn Asp Thr Asn Leu Leu Gly Pro Gly Met Gly Glu
210 215 220
Thr Asp Tyr His Pro Ile Leu Lys Ala Leu Leu Glu Val Gly Tyr Asp
225 230 235 240
Gly Trp Val Ser Val Glu Val Phe Asp Tyr Ser Pro Gly Ala Val Glu
245 250 255
Lys Ile Ala Lys Lys Ser Met Asp Tyr Met Gln Gln Val Leu Ser Asp
260 265 270
Leu Tyr Lys Ala Val Ser Gly Val Ser Gly Pro Pro Cys Asp Asn
275 280 285
<210> 3
<211> 290
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 3
Met Lys Leu Gly Ile His Ser Phe Val Trp Thr Gly Gly Ser Thr Gln
1 5 10 15
Glu Asp Leu Glu Gly Ala Met Glu Lys Ser His Glu Leu Gly Tyr Asp
20 25 30
Leu Ile Glu Phe Pro Arg Leu Asp Pro Lys Lys Phe Asp Val Ala Trp
35 40 45
Leu Ala Lys Arg Leu Glu Asp Ser Gly Leu Lys Val Val Val Thr Met
50 55 60
Gly Leu Pro Leu Asp Gly Asp Ile Ser Ser Glu Asp Ala Asp Val Val
65 70 75 80
Lys Ser Gly Glu Gln Ile Leu Asp Asp Ala Val Ala Val Thr Arg Asp
85 90 95
Leu Gly Gly Glu Lys Leu Gly Gly Ile Leu Phe Ser Ala His Gly Lys
100 105 110
Tyr Gln Ser Met Pro Thr Arg Lys Gly Trp Asp Asn Ser Val Ala Val
115 120 125
Met Arg Lys Val Ala Asp Arg Ala Lys Ala Ala Gly Val Thr Leu Asn
130 135 140
Leu Glu Ile Val Asn Arg Phe Glu Ser Asn Leu Leu Asn Thr Thr Ala
145 150 155 160
Gln Gly Leu Ala Phe Ile Glu Asp Thr Gly Ser Asp Asn Ile Phe Leu
165 170 175
His Leu Asp Thr Phe His Met Asn Ile Glu Glu Ala Asp Pro Ala Gln
180 185 190
Ala Ile Arg His Ala Gly Asp Lys Leu Gly Tyr Phe His Ile Gly Glu
195 200 205
Ser Asn Arg Gly Tyr Leu Gly Ala Gly Thr Ile Asp Phe Pro Pro Ile
210 215 220
Phe Asp Ala Leu Val Ala Ile Gly Tyr Glu Asp Tyr Val Thr Phe Glu
225 230 235 240
Ser Phe Ser Ser Glu Val Val Asp Lys Asp Leu Ser Ile Thr Thr Gly
245 250 255
Ile Trp Arg Asn Thr Trp Thr Asp Asn Val Glu Val Ala Arg His Ala
260 265 270
Lys Ala Phe Ile Glu Ala Arg Tyr Gly Glu Ala Arg Arg Lys Ala Gln
275 280 285
Ile Ala
290
<210> 4
<211> 290
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 4
Met Arg Leu Gly Ile His Ser Phe Val Trp Thr Gly Gly Gln Thr Gln
1 5 10 15
Glu Gly Leu Glu Met Ala Leu Glu Lys Ser Ala Glu His Gly Tyr Arg
20 25 30
Leu Ile Glu Phe Ala Tyr Leu Arg Pro Glu Lys Phe Asp Leu Asp Arg
35 40 45
Leu Ala Lys Lys Ala Gln Ser Leu Asp Leu Glu Ile Ala Val Thr Met
50 55 60
Gly Leu Pro Leu Asp Ala Asp Val Ser Ser Glu Asp Ala Asp Val Val
65 70 75 80
Ala Arg Gly Lys Ala Met Leu Ala Asp Ala Val Lys Ala Val Arg Asp
85 90 95
Ile Gly Gly Asn Lys Leu Gly Gly Ile Leu Tyr Ser Ala His Thr Lys
100 105 110
Tyr Asn Arg Met Pro Thr Gln Arg Gly Trp Lys Asn Ser Val Glu Ala
115 120 125
Ile Ala Lys Thr Ala Glu Ile Ala Lys Ala Cys Gly Val Asp Leu Val
130 135 140
Leu Glu Val Val Asn Arg Phe Glu Thr Asn Leu Leu Asn Thr Thr Ala
145 150 155 160
Gln Gly Leu Lys Phe Ile Glu Asp Val Gly Ser Asp Asp Val Arg Leu
165 170 175
His Leu Asp Thr Phe His Met Asn Ile Glu Glu Ala Asp Pro Ala Ala
180 185 190
Ala Ile Arg Leu Ala Gly Asp Lys Leu Gly Tyr Phe His Ile Gly Glu
195 200 205
Asn Asn Arg Gly Tyr Leu Gly Asp Gly Val Ile Asp Phe Asp Ala Ile
210 215 220
Phe Asp Ala Leu Leu Asp Ile Gly Tyr Asp Arg Asp Ile Val Phe Glu
225 230 235 240
Ser Phe Ser Ser Ala Val Val Asp Glu Gly Leu Ser Leu Ala Cys Ala
245 250 255
Ile Trp Arg Asp Thr Trp Thr Asp Asn Asp Glu Leu Ala Ala His Ala
260 265 270
Lys Gln Phe Ile Glu Leu Lys Tyr Asp Glu Ala Gln Arg Arg Arg Ala
275 280 285
Thr Asn
290
<210> 5
<211> 290
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 5
Met Arg Leu Gly Ile His Ser Phe Val Trp Thr Gly Gly Gln Thr Gln
1 5 10 15
Ser Met Leu Glu Glu Ala Met Glu Lys Ser Ala Ser Cys Gly Tyr Asn
20 25 30
Leu Ile Glu Phe Ala Tyr Leu Arg Pro Glu Lys Phe Asp Leu Asp Ala
35 40 45
Leu Ala Lys Arg Ala Gln Ala Leu Lys Leu Asp Ile Ala Val Thr Met
50 55 60
Gly Leu Pro Phe Ser His Asp Val Ser Ser Glu Asp Ala Asp Thr Val
65 70 75 80
Lys Ala Gly Glu Gly Met Leu Ala Asp Ala Val Arg Ala Val Arg Asp
85 90 95
Ile Gly Gly Ser Lys Leu Gly Gly Ile Leu Tyr Ser Ala His Ser Lys
100 105 110
Tyr Ser Arg Met Pro Thr Lys Lys Gly Trp Asp Asn Ser Val Ala Ala
115 120 125
Ile Ala Lys Thr Ala Asp Leu Ala Lys Ser Ala Gly Val Asp Leu Val
130 135 140
Leu Glu Val Val Asn Arg Phe Glu Thr Asn Leu Leu Asn Thr Thr Ala
145 150 155 160
Gln Gly Leu Ala Phe Ile Glu Gln Val Gly Ser Glu His Val Arg Leu
165 170 175
His Leu Asp Thr Phe His Met Asn Ile Glu Glu Ala Asn Val Ala Ala
180 185 190
Ala Ile Arg Leu Ala Gly Asp Lys Ile Gly Tyr Phe His Ile Gly Glu
195 200 205
Ser Asn Arg Gly Tyr Leu Gly Asp Gly Asn Ile Asn Phe Asp Leu Ile
210 215 220
Phe Asp Ala Leu Leu Asp Ile Asp Tyr Gln Arg Asp Ile Thr Phe Glu
225 230 235 240
Ser Phe Ser Gly Ala Val Val Asp Glu Gly Leu Ser Leu Ala Cys Ala
245 250 255
Ile Trp Arg Asp Thr Trp Thr Glu Asn Met Pro Leu Ala Gln His Ala
260 265 270
Lys Gln Phe Ile Asp Leu Lys Met Asp Glu Ala Lys Arg Arg Arg Ala
275 280 285
Thr Val
290
<210> 6
<211> 290
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 6
Met Arg Leu Gly Ile His Ser Phe Val Trp Thr Gly Gly Gln Thr Gln
1 5 10 15
Glu Gly Leu Glu Met Ala Leu Glu Lys Ser Ala Glu His Gly Tyr Arg
20 25 30
Cys Ile Glu Phe Ala Tyr Leu Arg Pro Glu Leu Phe Asp Leu Asp Arg
35 40 45
Leu Ala Arg Lys Ser Gln Ser Leu Asp Val Gln Ile Gly Val Thr Met
50 55 60
Gly Leu Pro Leu Asp Lys Asp Val Ser Ser Glu Asp Pro Asp Val Val
65 70 75 80
Ala Ala Gly Lys Gln Met Leu Ala Asp Ala Val Arg Ala Val Arg Asp
85 90 95
Val Gly Gly Asp Lys Leu Gly Gly Ile Leu Tyr Ser Ala His Thr Lys
100 105 110
Tyr Asn Arg Gln Pro Thr Ala Asp Gly Trp Lys Asn Ser Val Glu Ala
115 120 125
Ile Ala Glu Thr Gly Glu Ile Ala Lys Ala Ala Gly Val Asp Leu Val
130 135 140
Leu Glu Val Val Asn Arg Phe Glu Thr Asn Leu Leu Asn Thr Thr Ala
145 150 155 160
Gln Gly Leu Lys Phe Ile Asp Asp Thr Gly Ser Asp His Val Arg Leu
165 170 175
His Leu Asp Thr Phe His Met Gln Ile Glu Glu Ala Asn Pro Ala Ala
180 185 190
Ala Ile Arg Leu Ala Gly Asp Lys Leu Gly Tyr Phe His Ile Gly Glu
195 200 205
Ser Asn Arg Gly Tyr Leu Gly Asp Gly Thr Ile Asp Trp Asp Pro Ile
210 215 220
Phe Asp Ala Leu Leu Asp Ile Gly Tyr Asp Arg Asp Val Val Phe Glu
225 230 235 240
Ser Phe Ser Thr Ala Ile Val Asp Glu Gly Leu Ser Leu Ala Cys Ala
245 250 255
Ile Trp Arg Asp Thr Trp Thr Glu Asn Asp Glu Leu Ala Ala His Ala
260 265 270
Lys Gln Phe Ile Glu Leu Lys Trp Ala Glu Ala Gln Arg Arg Arg Ala
275 280 285
Thr Asn
290
<210> 7
<211> 290
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 7
Met Arg Leu Gly Ile His Ser Phe Val Trp Thr Gly Gly Gln Thr Gln
1 5 10 15
Glu Gly Leu Glu Met Ala Leu Glu Lys Ser Ala Glu His Gly Tyr Arg
20 25 30
Thr Ile Glu Phe Ala Tyr Leu Arg Pro Glu Leu Phe Asp Leu Asp Arg
35 40 45
Leu Ala Arg Lys Ala Gln Ser Leu Asp Val Glu Ile Gly Val Thr Met
50 55 60
Gly Leu Pro Leu Asp Lys Asp Val Ser Ser Glu Asp Arg Asp Val Val
65 70 75 80
Ala Arg Gly Lys Gln Met Leu Ala Asp Ala Val Arg Ala Val Arg Asp
85 90 95
Ile Gly Gly Asn Lys Leu Gly Gly Ile Leu Tyr Ser Ala His Thr Lys
100 105 110
Tyr Asn Arg Leu Pro Thr Ala Asp Gly Trp Lys Asn Ser Val Glu Ala
115 120 125
Ile Ala Glu Thr Gly Glu Ile Ala Lys Ala Ala Gly Val Asp Leu Val
130 135 140
Leu Glu Val Val Asn Arg Phe Glu Thr Asn Leu Leu Asn Thr Thr Ala
145 150 155 160
Gln Gly Leu Lys Phe Ile Asp Asp Val Gly Ser Asp His Val Arg Leu
165 170 175
His Leu Asp Thr Phe His Met Asn Ile Glu Glu Ala Asn Pro Ala Ala
180 185 190
Ala Ile Arg Leu Ala Gly Asp Lys Leu Gly Tyr Phe His Ile Gly Glu
195 200 205
Ser Asn Arg Gly Tyr Leu Gly Asp Gly Asn Ile Asp Phe Asp Leu Ile
210 215 220
Phe Asp Ala Leu Leu Asp Ile Asp Tyr Gln Arg Asp Val Val Phe Glu
225 230 235 240
Ser Phe Ser Thr Ala Ile Val Asp Glu Gly Leu Ser Leu Ala Cys Ala
245 250 255
Ile Trp Arg Asp Thr Trp Thr Glu Asn Asp Pro Leu Ala Ala His Ala
260 265 270
Lys Gln Phe Ile Glu Leu Lys Tyr Ala Glu Ala Gln Arg Arg Arg Ala
275 280 285
Thr Asn
290
<210> 8
<211> 290
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 8
Met Arg Leu Gly Ile His Ser Phe Val Trp Thr Gly Gly Gln Thr Gln
1 5 10 15
Glu Gly Leu Glu Met Ala Leu Asn Lys Thr Ala Glu His Gly Tyr Arg
20 25 30
Thr Ile Glu Phe Ala Tyr Leu Arg Pro Glu Lys Phe Asn Leu Asp Arg
35 40 45
Leu Ala Lys Leu Ala Gln Ser Leu Asp Val Glu Ile Gly Val Thr Met
50 55 60
Gly Leu Pro Leu Asp Lys Asp Val Ser Ser Glu Asp Ala Ala Ala Val
65 70 75 80
Ala Ala Gly Lys Gln Met Leu Ala Asp Ala Val Arg Ala Val Arg Asp
85 90 95
Ile Gly Gly Asn Lys Leu Gly Gly Ile Leu Tyr Ser Ala His Thr Lys
100 105 110
Tyr Asn Arg Gln Pro Thr Lys Lys Gly Trp Asp Asn Ser Val Ala Ala
115 120 125
Ile Ala Ala Thr Ala Glu Ile Ala Lys Glu Ala Gly Val Asp Leu Val
130 135 140
Leu Glu Val Val Asn Arg Phe Glu Thr Asn Leu Leu Asn Thr Thr Ala
145 150 155 160
Gln Gly Leu Lys Phe Ile Ser Glu Val Gly Ser Asp His Val Arg Leu
165 170 175
His Leu Asp Thr Phe His Met Asn Ile Glu Glu Ala Asn Pro Ala Ala
180 185 190
Ala Ile Arg Leu Ala Gly Asp Lys Ile Gly Tyr Phe His Ile Gly Glu
195 200 205
Ser Asn Arg Gly Tyr Leu Gly Asp Gly Val Ile Asn Phe Asp Leu Ile
210 215 220
Phe Asp Ala Leu Thr Asp Ile Asp Tyr Lys Arg Asp Ile Val Phe Glu
225 230 235 240
Ser Phe Ser Thr Ala Val Val Asp Glu Gly Leu Ser Leu Ala Cys Ala
245 250 255
Ile Trp Arg Asp Thr Trp Thr Asp Asn Asp Glu Leu Ala Ala His Ala
260 265 270
Lys Arg Tyr Ile Glu Leu Lys Tyr Asp Glu Ala Lys Arg Arg Arg Ala
275 280 285
Thr Asn
290
<210> 9
<211> 290
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 9
Met Lys Leu Gly Ile His Ser Phe Val Trp Thr Gly Gly Thr Thr Gln
1 5 10 15
Glu Asp Leu Glu Gly Ala Met Glu Lys Ser His Asp Leu Gly Tyr Gly
20 25 30
Leu Ile Glu Phe Pro Arg Leu Asp Pro Lys Lys Phe Asp Val Ser Trp
35 40 45
Leu Ala Lys Arg Leu Glu Asp Tyr Gly Leu Lys Val Val Val Thr Met
50 55 60
Gly Leu Pro Leu Asp Gly Asp Ile Ser Ser Glu Asp Ala Ala Val Val
65 70 75 80
Lys Arg Gly Glu Gln Ile Leu Asp Asp Ala Val Ala Ile Thr Arg Asp
85 90 95
Leu Gly Gly Glu Lys Leu Gly Gly Ile Ile Phe Ser Ala His Thr Lys
100 105 110
Tyr Gln Ser Met Pro Thr Arg Lys Gly Trp Asp Asn Ser Val Ala Ala
115 120 125
Leu Ser Arg Val Ala Asp Arg Ala Lys Ala Ala Gly Val Ser Leu Asn
130 135 140
Leu Glu Ile Val Asn Arg Phe Glu Ser Asn Leu Leu Asn Thr Thr Ala
145 150 155 160
Gln Gly Leu Ala Phe Ile Glu Glu Thr Gly Ser Asp Asn Ile Phe Leu
165 170 175
His Leu Asp Thr Phe His Met Asn Ile Glu Glu Ala Asp Pro Ala Gln
180 185 190
Ala Ile Arg Leu Ala Gly Asp Lys Leu Gly Tyr Phe His Ile Gly Glu
195 200 205
Ser Asn Arg Gly Tyr Leu Gly Ser Gly Val Ile Asn Phe Pro Ala Ile
210 215 220
Phe Asp Ala Leu Val Ala Ile Gly Tyr Glu Asp Trp Ile Thr Phe Glu
225 230 235 240
Ser Phe Ser Ser Glu Val Val Asp Glu Asp Leu Ser Ile Thr Cys Ala
245 250 255
Ile Trp Arg Asn Thr Trp Thr Asp Asn Val Glu Val Ala Arg Leu Ala
260 265 270
Lys Ala Phe Ile Glu Ala Arg Tyr Gly Glu Ala Arg Arg Lys Ala Gln
275 280 285
Thr Ala
290
<210> 10
<211> 288
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 10
Met Gln Ile Gly Ala His Gly Leu Val Phe Thr Gly Thr Phe Asp Glu
1 5 10 15
Ala Gly Leu Arg Arg Ala Ile Glu Gly Thr Lys His Ala Gly Phe Asp
20 25 30
Leu Ile Glu Ile Pro Leu Met Asp Val Asp Gly Phe Asp Ser Ala Leu
35 40 45
Ala Gly Arg Met Leu Ala Asp Asn Asp Leu Ala Val Thr Ala Ser Leu
50 55 60
Gly Leu Thr Ala Ala Thr Asp Leu Thr Ser Glu Asp Pro Ala Val Val
65 70 75 80
Ala Ala Gly Glu Arg Met Leu Glu Arg Cys Leu Asp His Val Ala Ala
85 90 95
Met Gly Gly Asp Val Leu Cys Gly Val Ile Tyr Ser Ala Met Gln Lys
100 105 110
Tyr Met Ala Pro Ala Thr Glu Arg Gly Ile Ala Asn Ser Gln Ala Ala
115 120 125
Ile Ala Arg Leu Ala Glu Lys Ala Ala Glu Arg Gly Ile Arg Leu Ser
130 135 140
Leu Glu Val Val Asn Arg Tyr Glu Ser Asn Val Phe Asn Thr Gly Arg
145 150 155 160
Gly Ala Leu Ala Phe Leu Asp Gly Val Gly Arg Asp Asp Val Ser Val
165 170 175
His Leu Asp Thr Tyr His Met Asn Ile Glu Glu Ser Asp Leu Phe Gln
180 185 190
Pro Val His Asp Val Ala Gly Arg Leu Gly Tyr Val His Ile Gly Glu
195 200 205
Ser His Arg Gly Tyr Leu Gly Thr Gly Thr Val Asp Phe Gly Thr Phe
210 215 220
Phe Arg Ala Leu His Asp Val Arg Tyr Asp Gly Pro Val Val Phe Glu
225 230 235 240
Ser Phe Ser Ser Ala Val Val Ser Ala Glu Leu Ser Asn Thr Leu Gly
245 250 255
Ile Trp Arg Asn Leu Trp Glu Asp Ser Asp Asp Leu Ala Ala His Ala
260 265 270
Asn Arg Phe Ile Arg Asp Gly Leu His Ala Val Arg Thr Ile Asp Leu
275 280 285
<210> 11
<211> 288
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 11
Met Asp Ile Gly Cys His Gly Leu Val Trp Thr Gly Ser Phe Asp Ala
1 5 10 15
Gln Gly Ile Arg Leu Ala Ala Gln Lys Thr Lys Glu Ala Gly Phe Asp
20 25 30
Leu Ile Glu Tyr Pro Leu Met Asp Pro Phe Thr Phe Asp Thr Glu Ala
35 40 45
Ala Val Ser Ala Leu Ala Glu His Gly Leu Lys Ala Ser Ala Ser Leu
50 55 60
Gly Leu Ser Asp Ser Thr Asp Val Thr Ser Thr Asp Pro Glu Val Val
65 70 75 80
Ala Ala Gly Glu Ala Leu Leu Leu Arg Ala Val Asp Val Leu Ala Asp
85 90 95
Met Gly Gly Thr His Leu Cys Gly Val Ile Tyr Ser Ala Met Lys Lys
100 105 110
Tyr Met Glu Pro Val Thr Ala Glu Gly Leu Glu Asn Ser Lys Arg Thr
115 120 125
Ile Gly Arg Val Ala Asp His Ala Ala Asp Arg Gly Val Asn Val Ser
130 135 140
Leu Glu Val Val Asn Arg Tyr Glu Thr Asn Val Leu Asn Thr Ala Arg
145 150 155 160
Gln Ala Ile Arg Phe Val Ala Asp Val Asp Arg Pro Asn Leu Gly Ile
165 170 175
His Leu Asp Thr Tyr His Met Asn Ile Glu Glu Ser Asp Met Phe Ala
180 185 190
Pro Val Leu Asp Ala Gly Glu Val Leu His Tyr Val His Ile Gly Glu
195 200 205
Ser His Arg Gly Tyr Leu Gly Thr Gly Ser Val Asp Phe Asp Asn Phe
210 215 220
Phe Lys Ala Leu Gly Arg Ile Gly Tyr Asp Gly Pro Ile Thr Phe Glu
225 230 235 240
Ser Phe Ser Ser Ala Val Val Ala Pro Asp Leu Ser Arg Met Leu Gly
245 250 255
Ile Trp Arg Asn Leu Trp Thr Asp Asn Ala Asp Leu Gly Ala His Ala
260 265 270
Asn Arg Phe Ile Arg Asp Lys Leu Thr Ala Val Glu Thr Ile Ser Leu
275 280 285
<210> 12
<211> 288
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 12
Met Glu Tyr Gly Gly His Ala Leu Val Trp Ala Gly Asp Trp Ser Pro
1 5 10 15
Glu Gly Ala Arg Gln Ala Ile Ser Gly Ala Ala Arg Ala Gly Tyr Asp
20 25 30
Tyr Ile Glu Ile Ala Leu Leu Asp Pro Trp Lys Val Asp Val Ala Met
35 40 45
Thr Lys Asp Leu Leu Gln Glu Tyr Gly Leu Arg Ala His Ala Ser Leu
50 55 60
Gly Leu Ser Pro Thr Thr Asp Val Thr Ser Thr Asp Pro Ala Ile Val
65 70 75 80
Ala Lys Gly Asp Glu Leu Leu Arg Lys Ala Thr Asp Val Leu His Ala
85 90 95
Leu Gly Gly Thr Glu Leu Cys Gly Val Ile Tyr Cys Ala Leu Gly Lys
100 105 110
Tyr Pro Gly Pro Ala Ser Lys Glu Asn Arg Ala Asn Ser Val Ala Ala
115 120 125
Met Gln Arg Leu Ala Asp Tyr Ala Ala Asp Lys Gly Ile Asn Ile Asn
130 135 140
Leu Glu Val Val Asn Arg Tyr Glu Thr Asn Ile Met Asn Thr Gly Ile
145 150 155 160
Glu Gly Leu Lys Phe Leu Glu Glu Val Asn Arg Pro Asn Ala Tyr Leu
165 170 175
His Leu Asp Thr Tyr His Met Asn Ile Glu Glu Asp Gly Met Glu Lys
180 185 190
Ala Val Leu Ala Ala Gly Asp Arg Leu Gly Tyr Val His Ile Gly Glu
195 200 205
Ser His Arg Gly Tyr Leu Gly Ser Gly Asn Val Asp Phe Asp Thr Phe
210 215 220
Phe Ala Ala Leu Lys Lys Ile Asn Tyr Gln Gly Pro Ile Thr Phe Glu
225 230 235 240
Ser Phe Ser Ser Ala Val Val Asp Pro Ala Leu Ser Asn Ala Leu Cys
245 250 255
Val Trp Arg Asn Leu Trp Ser Asp Ser Asp Asp Leu Ala Lys Lys Ala
260 265 270
Leu Lys Phe Met Lys Ala Arg Tyr Ser Gly Asn Ser Gln Arg Ser Pro
275 280 285
<210> 13
<211> 288
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 13
Met Glu Tyr Gly Gly His Ala Leu Val Trp Ser Gly Asp Trp Thr Pro
1 5 10 15
Glu Gly Ala Arg Lys Ala Ile Ser Gly Ala Ala Arg Ala Gly Tyr Asp
20 25 30
Tyr Ile Glu Ile Ala Leu Leu Asp Pro Trp Lys Val Asp Val Ala Leu
35 40 45
Thr Lys Asp Leu Leu Gln Glu Tyr Asn Leu Arg Ala His Ala Ser Leu
50 55 60
Gly Leu Ser Ala Ala Thr Asp Val Thr Ser Thr Asp Pro Ala Ile Val
65 70 75 80
Ala Lys Gly Asp Glu Leu Leu Arg Lys Ala Thr Asp Val Leu His Ala
85 90 95
Ile Gly Gly Thr Glu Leu Cys Gly Val Ile Tyr Cys Ala Leu Gly Lys
100 105 110
Tyr Pro Gly Pro Ala Ser Lys Glu Asn Arg Ala Asn Ser Val Ala Ala
115 120 125
Met Gln Arg Leu Ala Asp Tyr Ala Ala Asp Lys Gly Ile Asn Ile Asn
130 135 140
Leu Glu Val Val Asn Arg Tyr Glu Thr Asn Ile Met Asn Thr Gly Leu
145 150 155 160
Glu Gly Leu Ala Phe Leu Asp Glu Val Asn Arg Pro Asn Ala Tyr Leu
165 170 175
His Leu Asp Thr Tyr His Met Asn Ile Glu Glu Asp Gly Met Glu Lys
180 185 190
Ser Val Leu Ala Ala Lys Asp Arg Leu Gly Tyr Val His Ile Gly Glu
195 200 205
Ser His Arg Gly Tyr Leu Gly Thr Gly Asn Val Asp Phe Asp Ser Phe
210 215 220
Phe Ala Ala Leu Lys Lys Ile Asp Tyr Gln Gly Pro Ile Thr Phe Glu
225 230 235 240
Ser Phe Ser Ser Glu Val Val Asp Pro Lys Leu Ser Asn Thr Leu Cys
245 250 255
Val Trp Arg Asn Leu Trp His Asp Ser Asp Asp Leu Ala Lys Lys Ala
260 265 270
Leu Arg Phe Met Lys Glu Arg Tyr Pro Gly Asn Pro Gln Arg Ser Pro
275 280 285
<210> 14
<211> 288
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 14
Met Lys Tyr Gly Gly His Ala Leu Val Trp Ser Gly Asp Trp Thr Pro
1 5 10 15
Glu Gly Ala Arg Gln Ala Ile Ser Gly Ala Ala Arg Ala Gly Tyr Asp
20 25 30
Tyr Ile Glu Ile Ala Leu Leu Asp Pro Trp Lys Val Asp Val Ala Leu
35 40 45
Thr Lys Asp Leu Leu Gln Glu Phe Asn Leu Arg Ala His Ala Ser Leu
50 55 60
Gly Leu Ser Ala Ala Thr Asp Val Thr Ser Thr Asp Met Ala Ile Val
65 70 75 80
Ala Lys Gly Asp Glu Leu Leu Arg Lys Ala Thr Asp Val Leu Ala Ala
85 90 95
Ile Gly Gly Lys Glu Leu Cys Gly Val Ile Tyr Cys Ala Leu Gly Lys
100 105 110
Tyr Pro Gly Pro Ala Ser Lys Glu Asn Arg Asn Asn Ser Val Ala Ala
115 120 125
Met Gln Arg Leu Ala Asp Tyr Ala Ala Asp Lys Asp Ile Asn Ile Asn
130 135 140
Leu Glu Val Val Asn Arg Tyr Glu Thr Asn Ile Ile Asn Thr Gly Ile
145 150 155 160
Glu Gly Leu Ala Phe Leu Asp Glu Val Asp Arg Pro Asn Ala Tyr Leu
165 170 175
His Leu Asp Thr Tyr His Met Asn Ile Glu Glu Asp Gly Met Glu Lys
180 185 190
Ser Val Leu Ala Ala Lys Asp Arg Leu Gly Tyr Val His Ile Gly Glu
195 200 205
Ser His Arg Gly Tyr Leu Gly Thr Gly Asn Val Asp Phe Asp Thr Phe
210 215 220
Phe Ala Ala Leu Lys Lys Ile Gly Tyr Gln Gly Pro Ile Thr Phe Glu
225 230 235 240
Ser Phe Ser Ser Glu Val Val Asp Pro Asn Leu Ser Asn Thr Leu Cys
245 250 255
Val Trp Arg Asn Leu Trp His Asp Ser Asp Asp Leu Ala Lys Lys Ala
260 265 270
Leu Gln Phe Met Lys Glu Arg Tyr Ser Gly Asn Pro Gln Arg Ser Pro
275 280 285
<210> 15
<211> 288
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 15
Met Lys Phe Gly Ile His Ser Met Val Trp Val Gly Asp Trp Ser Pro
1 5 10 15
Glu His Ala Arg His Ala Ile Ala Ser Ser Ala Glu Ala Gly Tyr Asp
20 25 30
Leu Ile Glu Leu Ala Ala Ile Asp Pro Ala Thr Phe Asp Val Asp Leu
35 40 45
Thr Ala Lys Leu Leu Ala Glu His Gly Ile Gln Ala Ser Ala Ser Leu
50 55 60
Gly Leu Asp Ala Ala Thr Asp Val Ser Ser Glu Asp Pro Asp Val Val
65 70 75 80
Ala Ala Gly Arg Ala Arg Leu Arg Asp Ala Leu Ala Leu Val Arg Asp
85 90 95
Thr Gly Gly Thr Met Leu Cys Gly Val Ile Tyr Ser Ala Leu Arg Lys
100 105 110
Tyr Asp Ala Pro Val Thr Glu Arg Gly Leu Ala Asn Ser Gln Glu Thr
115 120 125
Ile Ala Ala Leu Ala Asp Glu Ala Ala Ala Ser Gly Ile Thr Ile Gly
130 135 140
Leu Glu Phe Cys Asn Arg Tyr Glu Thr Asn Val Leu Asn Thr Thr Ala
145 150 155 160
Gln Thr Leu Ala Phe Ile Ala Ala Val Asp Arg Pro Asn Val Met Ala
165 170 175
His Leu Asp Thr Tyr His Met Asn Ile Glu Glu Pro Ser Met Ser Glu
180 185 190
Pro Val Leu Ala Ala Ala Gly Arg Leu Gly Tyr Val His Val Gly Glu
195 200 205
Ser His Arg Gly Ala Pro Gly Thr Gly Ser Ile Pro Trp Asp Glu Phe
210 215 220
Phe Gly Ala Leu Arg Glu Cys Gly Tyr Asp Gly Ile Val Thr Phe Glu
225 230 235 240
Ser Phe Ser Ser Glu Val Val His Pro Ser Phe Ser Asn Thr Leu Ala
245 250 255
Ile Trp Arg Asn Leu Trp Thr Asp Asn Arg Lys Leu Ala Thr Gly Ala
260 265 270
Leu Ala Phe Met Arg Ala His Leu Arg Ala Ala Gly Gly Arg Gly Ala
275 280 285
<210> 16
<211> 288
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 16
Met Lys Leu Gly Ile His Ala Leu Val Trp Val Gly Gly Trp Thr Pro
1 5 10 15
Glu Glu Ala Glu Leu Ala Ile Ser Ser Thr Ala Arg Ala Gly Tyr Asp
20 25 30
Leu Ile Glu Ile Pro Ala Leu Asp Pro Ser Arg Ile Asp Val Ala Ser
35 40 45
Thr Arg Glu Met Leu Glu Arg His Gly Leu Gln Ala Ser Val Ser Leu
50 55 60
Gly Leu Ala Pro Asp Thr Asp Ile Asn Ser Glu Asp Val Ala Cys Val
65 70 75 80
Asp Arg Gly Arg Asp Val Leu Met Arg Ala Leu Glu Val Ser Ser Gly
85 90 95
Ile Gly Ser Thr Tyr Leu Gly Gly Val Ile Phe Gly Ala Met Thr Lys
100 105 110
Tyr Ser Ala Pro Thr Thr Glu Arg Ala Arg Ala Asn Ser Val Ala Val
115 120 125
Ile Lys Glu Leu Ala Gln Glu Ala Arg Gly Cys Gly Thr Thr Ile Gly
130 135 140
Leu Glu Phe Val Asn Arg Tyr Glu Ser Asn Leu Leu Asn Thr Ala Gln
145 150 155 160
Gln Thr Leu Asp Tyr Leu Asp Leu Val Gly Glu Asp Asn Val Val Val
165 170 175
His Ala Asp Val Tyr His Met Asn Ile Glu Glu Thr Asp Phe Arg Thr
180 185 190
Pro Ile Leu Ala Cys Gly Asp Arg Leu Gly Tyr Val His Val Gly Glu
195 200 205
Ser His Arg Gly Tyr Leu Gly Thr Gly Ser Val Asn Phe Pro Glu Phe
210 215 220
Phe Gly Ala Leu Lys Glu Val Gly Tyr Ala Gly Pro Ile Thr Phe Glu
225 230 235 240
Ser Phe Ser Ser Ser Val Val Asp Pro Leu Leu Ser Asn Thr Leu Ala
245 250 255
Ile Trp Arg Asn Leu Trp Ser Asp Ser Thr Asp Leu Ala Thr Gln Ala
260 265 270
His Ala Phe Ile Ser Ala Gly Leu Ala Asp Asp Gly Gly Arg Gly Ala
275 280 285
<210> 17
<211> 861
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 17
atgaagtttg cgatttgtaa tgagactttc cagccagacg ctccgccgtt atggcctctt 60
gagaaagcat tcgcttatgc gcgtgaactt ggttacaccg gtatcgaatt cgcacctttt 120
gatgcgacag acgtaagtgc agaacggcgg gccgaggtgc gcgagcttct tgaaaaatac 180
cagctcgaat ctattggttt acattggctg ttagctaaaa cagagctcac ttccccggat 240
gcagctgtac gggatcggac ttccgagtat ctggcggaac tggcacgtct ttgccgggat 300
cttggcggtt ccgtgatgtg cggcgtcctg ggttcgccac aacagcggaa cttactgccg 360
ggggtaactc acgaccaggc aatggaatat gcagccgatg taatccgcgc ggcgatgccg 420
gccttagaag accacggggt aactctcgct ctcgaaccgt taggcccggc agagggggac 480
ttcttgctga ctgccgaatc gggtattcag ttagctcaga tgatcgactc cccgcatgta 540
cgtcttcatt tggatgttaa agcaatgagt ctcgaagcga agccgattcc agatattatc 600
cgggattctg cagattactt ggcgcacttc catgcaaacg acccaaataa gcggggccct 660
ggcatgggcg acgttgactt cgtccctatc tttcaggctt tacaggaaat taactaccaa 720
ggctgggtat ccgtggaagt atttgattat gaaccaggtg tggttgaacg ccttgcccgt 780
gaatccattt catacatgca acggtgtctg gacaaacttt attcctcggt atcgggtggc 840
gaacgcccgc ctccagacaa c 861
<210> 18
<211> 861
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 18
atgaaatttg cgatttgcca ggaactgttc gagccggatg cgccgccgct cacagactgg 60
gccgagcaat gtcggatcat cgcggaggtc ggctacaccg ggattgaggt tgctcctttt 120
gatttagctt cagtaccggc ggcaacactt actgaaatgc ggaatacggc agagcgccat 180
ggccttgaaa ttatcgggct gcattggttg ctcgcgaaga cgaatcttac atctcctgat 240
gccgccgtgc ggaccgctac agccgactac ttgaagttat tagcggatac ctgcgccgct 300
ctggggggtc gggtgctcgc cggggttttt ggctcacctc aacaacggaa cttgttggca 360
ggcgtaacaa ccgaacaagc aatggatttt gctgcagaag tatttcgggc tgccatgcca 420
acgtttgcgg agcgggatgt ggtcctctgc atggagccgc tcacaccgaa ggagactgat 480
tttattaaca cctgcgctga cgctgttgcg ctgatgcaaa tggttgacca cccaagtttc 540
gtccttcacc aagatgtaaa agcaatgctg cttgccgaga gtgatgtgcc agagctgatc 600
caccgtcata aagatatctg cggccatttt cacgttaatg acactaattt acttgggcca 660
ggtatggggg aaacggacta tcatccaatt ctgaaggcgt tactggaagt cggttatgac 720
ggttgggttt ccgtcgaagt gttcgactat tcaccagggg cagtcgagaa gattgcgaag 780
aaatcgatgg attatatgca gcaagtattg tccgatctct ataaggcggt ttcaggtgtg 840
tctggtccgc catgcgataa c 861
<210> 19
<211> 870
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 19
atgaagttag ggattcacag tttcgtatgg actggggggt ccactcaaga agacttagaa 60
ggtgctatgg aaaagagcca tgaattaggc tatgatttaa tcgagtttcc gcgtctggac 120
ccgaagaaat tcgatgtagc ttggctcgcc aaacgcctgg aagattctgg tctgaaagta 180
gtggtgacca tgggtttacc acttgatggc gatatctcat cagaggacgc agacgtggtg 240
aaatctggtg aacaaattct ggatgacgct gtagcggtca cccgtgattt aggtggcgag 300
aaacttggtg gtatcttgtt ttcggcccac gggaagtatc aatcaatgcc aacacggaaa 360
ggttgggata atagtgttgc cgtaatgcgg aaagtagcag atcgtgcgaa ggcggcgggt 420
gtaacactca acctggagat tgtcaatcgg ttcgagtcaa acttgttgaa tacgacagca 480
cagggtttag catttatcga agacacgggt tctgataaca tttttttaca tttagatacg 540
tttcacatga acattgagga agctgatccg gcacaagcca tccgtcatgc cggcgacaaa 600
cttggttatt tccatattgg ggagtcgaac cgggggtatt taggcgcggg gactatcgac 660
ttcccgccga ttttcgacgc gctggtagcg attggctacg aagactacgt caccttcgag 720
tcattctcct ccgaagtagt cgacaaagat ttatctatca caacgggtat ttggcggaat 780
acctggacag ataatgtcga ggtggcacgt cacgctaaag cattcattga ggcacggtat 840
ggtgaagctc gtcgtaaggc acagatcgcg 870
<210> 20
<211> 870
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 20
atgcggttgg gtattcactc gttcgtgtgg acgggtggcc agacgcagga ggggttagaa 60
atggcgctgg agaagtcagc ggaacacggc taccggttaa tcgagtttgc gtacctgcgg 120
ccggaaaagt tcgacctgga tcgtctcgca aagaaagccc aatccctcga cttagagatt 180
gcagtaacaa tgggtttacc tctcgatgcg gatgtatcct ctgaagatgc agatgtagtc 240
gctcggggga aagctatgtt agcggacgcg gtcaaggctg tacgtgatat tgggggcaat 300
aaattagggg gtattctcta ttcagcccac accaaatata atcgtatgcc gacgcagcgg 360
ggctggaaga atagtgtaga agctattgca aagactgcgg agattgccaa ggcgtgcggc 420
gttgacttag tgctggaagt ggtcaatcgg tttgagacaa atttgttgaa cacaaccgcg 480
caaggtctta agttcattga agacgtaggc tccgacgatg tacgtttaca tctcgatacc 540
ttccacatga atattgaaga ggcagatccg gcagcggcta ttcgtcttgc aggggataag 600
ctgggctact ttcacattgg tgaaaacaac cgggggtacc tgggtgacgg ggttatcgac 660
ttcgatgcta tcttcgacgc gcttttggac atcggttatg atcgggacat cgtctttgag 720
tctttctcca gtgccgtagt tgacgagggg ctgtcgctgg catgtgcaat ttggcgtgat 780
acgtggactg ataatgatga attggcggca catgcgaagc aattcattga gttaaaatac 840
gatgaagcgc aacgtcgtcg tgctactaat 870
<210> 21
<211> 870
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 21
atgcgcttag ggattcactc ttttgtctgg actggggggc aaacgcaaag tatgttagaa 60
gaggcaatgg aaaaatcagc aagctgcggg tataatctga ttgagttcgc ttacctccgc 120
cctgagaagt ttgacctcga tgcgttagca aagcgtgccc aggcattaaa attagacatt 180
gcggtcacca tggggttacc tttctctcac gatgtctcat ctgaggacgc tgacactgtt 240
aaggcaggtg aggggatgct cgcagatgca gtgcgcgccg ttcgggatat cggcggttca 300
aagctcggtg gtattttgta ctccgctcac tccaagtaca gccggatgcc gacgaagaaa 360
gggtgggata attccgtagc ggccatcgcc aagacggcgg acttagctaa gtcagccggt 420
gtagatcttg ttcttgaggt tgttaaccgt tttgagacta atctgcttaa tacgacagca 480
cagggcttgg ccttcattga gcaggttggg tctgaacacg tgcgtctcca tcttgatacc 540
ttccacatga atattgaaga ggcgaatgtc gcagccgcga tccgtttagc tggtgataag 600
atcgggtact tccacattgg tgaaagtaat cggggttatc tcggggatgg taatattaac 660
tttgacctta tctttgatgc tctgctcgat attgactatc aacgtgacat cacatttgag 720
tccttttctg gcgcggttgt tgatgagggg ctgtctctgg cttgcgcgat ttggcgggac 780
acctggacag aaaatatgcc tttagcccag cacgcaaaac agttcatcga tcttaagatg 840
gacgaggcca agcgccgtcg tgcaacggtg 870
<210> 22
<211> 870
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 22
atgcgccttg gtattcactc ttttgtctgg acgggtggcc agacgcaaga agggttagag 60
atggcgttgg agaagagcgc tgaacatggt tatcggtgta ttgagtttgc gtacctccgg 120
ccagagttat tcgatttgga tcggttggcg cgtaaatcgc agagtctcga cgtgcaaatt 180
ggggtcacaa tgggtttgcc acttgacaaa gacgtaagct ccgaagaccc tgatgtagtt 240
gcggcgggga agcagatgct cgccgacgcg gtacgcgcag tccgggacgt aggcggtgac 300
aagctgggcg gcatcttata tagtgcgcac acaaaatata accgccaacc tacagcggat 360
ggttggaaaa attcggttga agccatcgcc gagactgggg aaatcgctaa ggccgccggt 420
gtagatttgg tgttggaagt ggtgaaccgc tttgaaacca atctgctcaa tacaaccgcg 480
caggggttaa agttcattga tgatacaggc agcgatcatg tccgtctgca ccttgataca 540
tttcacatgc aaattgagga agctaatcct gctgcggcca ttcgtctggc tggcgataag 600
ctggggtatt ttcacatcgg tgagtccaac cggggctact tgggggacgg cactatcgac 660
tgggacccta tctttgacgc tttgctggat attggttatg atcgtgatgt ggttttcgaa 720
tcgttcagca ccgctatcgt cgatgaaggt cttagtttgg cctgcgcaat ttggcgcgat 780
acctggacgg aaaacgatga gttggcagca cacgctaagc aattcatcga actcaagtgg 840
gccgaggctc agcgtcggcg cgcgaccaac 870
<210> 23
<211> 870
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 23
atgcgcttag gcattcattc tttcgtctgg accgggggtc aaacccagga ggggttggaa 60
atggctttgg aaaaatctgc agagcacggc tatcggacta tcgagtttgc gtacctgcgc 120
ccagaattgt ttgacttgga ccggctggct cgtaaagcgc agtccctgga cgtggagatc 180
ggggtaacga tgggcttacc gttagataag gatgtgtctt cggaggaccg tgacgttgta 240
gcacggggta agcaaatgct cgccgatgca gtccgggcag ttcgtgacat tgggggcaat 300
aaattggggg gtatcttata ctccgcacat actaagtaca atcggctgcc gactgcagat 360
gggtggaaaa actcggtgga agcgatcgcg gaaactgggg agatcgccaa agcggctggc 420
gttgaccttg tgcttgaggt ggtcaaccgc ttcgagacga acctcctgaa taccaccgca 480
cagggtctta aattcatcga cgacgtgggt agcgatcacg ttcgccttca tttggacacg 540
ttccacatga acatcgagga agcgaatcct gccgctgcga ttcgccttgc tggtgataaa 600
ctcggttatt tccatattgg cgagtctaac cgcgggtacc tcggggatgg gaatatcgac 660
ttcgacttaa tttttgatgc tttgctggat attgactacc aacgtgacgt tgtctttgaa 720
tcatttagta ctgcaatcgt tgatgagggg cttagtttag catgcgctat ctggcgggat 780
acgtggactg aaaacgatcc tctggcggcg cacgcgaaac aattcattga acttaagtac 840
gctgaggcac agcgccgtcg cgccaccaac 870
<210> 24
<211> 870
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 24
atgcgcttag gcattcattc atttgtatgg acgggcggcc aaacgcagga aggcttagaa 60
atggcgctca acaagactgc tgagcacggc tatcgcacaa ttgagttcgc ttacctgcgc 120
ccagagaaat ttaacttaga tcggcttgcc aagcttgcgc agagccttga tgtcgaaatc 180
ggtgtgacta tggggctgcc gcttgataag gatgtgagca gtgaggatgc agcagccgtt 240
gcagctggga aacaaatgct tgcagatgcg gttcgcgctg ttcgtgatat tgggggcaat 300
aaattggggg gcattttata ctccgcccac accaagtata accgccagcc gactaaaaaa 360
ggctgggaca atagtgtggc cgcaatcgca gccacagcgg agattgccaa agaggcgggc 420
gtcgatttgg tccttgaggt ggtgaatcgc tttgagacaa acttattaaa cactactgcg 480
cagggcctga agtttattag tgaagtcggg tcggaccatg tacggcttca tctggataca 540
tttcacatga acatcgagga ggccaaccca gcagccgcga ttcggttagc gggggataaa 600
attgggtact tccacatcgg cgagagcaat cgcggttacc ttggcgatgg ggttattaac 660
ttcgatctca tttttgacgc attgaccgat atcgactaca agcgtgatat cgtcttcgaa 720
agtttttcga ccgccgtggt agatgaaggg ctctctctcg catgtgcgat ttggcgtgac 780
acctggacag ataacgatga gctcgccgct catgcgaagc ggtatattga gctcaagtac 840
gatgaagcca aacgtcgccg cgccacaaac 870
<210> 25
<211> 870
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 25
atgaagcttg gcattcactc attcgtgtgg accgggggta ccacccagga agatcttgaa 60
ggcgcgatgg agaagagcca tgatcttggt tacggcttga ttgaatttcc acgtctcgat 120
cctaaaaagt ttgacgtgtc ctggctcgct aaacgcttgg aagattacgg cctgaaagtg 180
gtagtcacta tgggcctccc tttagatggg gacatcagtt ctgaggacgc cgcggttgtc 240
aaacggggtg agcagatcct tgacgacgcc gttgccatca ctcgtgatct cggcggcgag 300
aaattgggcg gcattatctt ctccgctcac acgaagtacc aatcaatgcc tactcgcaaa 360
gggtgggaca acagtgtggc tgctctgagc cgcgtggctg atcgcgctaa agcagcaggg 420
gttagcctga atcttgaaat cgtgaaccgt tttgaatcaa accttctcaa cactactgcc 480
caagggctcg cattcattga agaaactggc tctgataata tctttctcca cttggacacc 540
tttcacatga acatcgagga agctgaccca gcccaagcta ttcgcttagc cggtgacaag 600
ctgggttact tccacattgg ggaatcaaat cggggctact tagggtcagg tgtgatcaac 660
ttcccggcaa ttttcgacgc ccttgtcgca attggctacg aggattggat tacgttcgag 720
agctttagca gtgaggtggt agatgaagat cttagtatta cctgtgctat ctggcgcaat 780
acttggactg ataacgtaga ggtagcccgg ctcgccaaag cgtttatcga agcgcgttac 840
ggggaagccc gtcgtaaggc tcagaccgcg 870
<210> 26
<211> 864
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 26
atgcaaatcg gtgcgcatgg gttagtcttc accggtacct tcgatgaggc ggggctccgc 60
cgcgcgatcg aaggcactaa acacgctggt ttcgacctta ttgagatccc gctcatggac 120
gtagatggct tcgactctgc tttagctggt cggatgttgg ccgacaacga tctcgcggtc 180
acagcgtctc tgggcttgac tgcggcaaca gatttaacga gcgaagatcc tgctgttgta 240
gctgctgggg aacggatgtt agagcgctgc ttagaccacg tcgctgctat gggcggggac 300
gtactctgtg gcgtgattta tagcgctatg caaaaatata tggcacctgc gaccgaacgg 360
gggatcgcta atagtcaagc tgctattgca cggcttgcgg agaaggcggc ggagcgcggt 420
attcgtctta gtctcgaagt tgttaaccgg tacgaatcaa acgtctttaa cactgggcgt 480
ggtgcgcttg ccttcctcga cggtgttggt cgggatgacg tctctgtcca tttagacacc 540
tatcacatga atattgaaga gagtgatctc tttcaaccgg tccatgatgt tgcaggtcgc 600
ttggggtacg ttcatattgg tgaatcgcat cgcggctact taggcaccgg tactgtggac 660
ttcggtactt tctttcgtgc cctgcatgac gtgcgttatg acgggccagt cgtctttgag 720
tccttttcgt ccgcagtggt cagtgcagaa ctctcaaata cattggggat ttggcgcaac 780
ctctgggaag acagcgacga tttggcagca catgctaatc gtttcattcg tgacggcctt 840
cacgctgtcc gtacaattga tttg 864
<210> 27
<211> 864
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 27
atggacattg ggtgtcatgg tttagtgtgg accggctcat ttgacgctca gggcatccgt 60
ctcgcggccc agaaaaccaa ggaagccggt ttcgatctga ttgaatatcc acttatggat 120
ccgttcacct ttgacactga ggccgcggtg agcgcccttg cggagcatgg cttgaaagca 180
agtgcgagcc tcggtctgtc ggactcaaca gatgtgactt ctaccgatcc ggaagtggtc 240
gcggcaggcg aagccttact gctgcgggcg gtcgatgttc ttgctgatat gggtggtaca 300
cacttgtgtg gcgtaatcta cagtgctatg aaaaagtata tggagcctgt aacagccgaa 360
ggcttggaga acagcaagcg gactatcggc cgtgtcgctg atcatgcagc ggaccgtggt 420
gtaaacgtga gtcttgaggt ggttaatcgg tatgagacca atgtattgaa cactgcgcgg 480
caggcgatcc ggttcgttgc ggacgtagac cggccgaatc tcggcattca tttggacacg 540
taccacatga acatcgagga gagtgacatg tttgcccctg tcttagacgc gggtgaagtc 600
ctccattacg ttcatatcgg tgaatcgcat cgcggctacc ttggcacagg gtccgtagat 660
ttcgacaatt ttttcaaagc cctcggccgt attggttacg atggtccaat cacattcgag 720
tcgttttcga gcgccgtagt tgctccagac ctttcgcgta tgttaggcat ctggcgtaac 780
ttatggaccg acaatgcaga tttaggcgca catgcgaatc ggttcatccg tgataagctt 840
accgcagttg aaactattag cctc 864
<210> 28
<211> 864
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 28
atggagtatg ggggccacgc gcttgtatgg gcaggcgact ggtctccaga gggcgcacgg 60
caagctattt cgggtgcggc ccgggcaggt tatgactaca ttgagatcgc cctcctcgac 120
ccttggaaag ttgatgtagc gatgaccaaa gatctgctcc aggaatacgg tcttcgtgct 180
catgcgagct taggtcttag tccgaccacc gatgtaacgt caaccgaccc agctattgta 240
gcgaaggggg atgaactgct gcgtaaggct acagatgttc tccatgcact cggggggacg 300
gaactttgcg gcgttattta ctgtgcgtta ggtaagtacc cagggccagc ctcaaaagaa 360
aaccgcgcaa atagcgtagc agcaatgcaa cgcttggctg actatgcggc tgacaagggc 420
attaatatta atttagaagt agtcaaccgg tatgagacaa acattatgaa tacagggatc 480
gaaggcttaa aatttctgga ggaggtgaac cggccaaacg cgtacctcca cttggacact 540
tatcacatga acattgaaga ggatggtatg gagaaggctg ttttagccgc aggggatcgt 600
ctcgggtacg tgcatatcgg ggagtcccac cgtggctatt tgggttctgg caacgtggac 660
tttgatacgt tcttcgctgc attaaagaag attaactatc agggcccgat tacttttgag 720
tctttctctt ctgccgtagt cgaccctgcg ctgtcaaacg cgctttgcgt ctggcgcaat 780
ttgtggagcg attccgacga ccttgcgaag aaagcattga agtttatgaa ggctcgttat 840
tcggggaact ctcaacgcag cccg 864
<210> 29
<211> 864
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 29
atggaatacg gcggtcatgc cttagtgtgg tctggggact ggacgccgga aggtgctcgt 60
aaggcgattt ccggtgcagc acgggcgggt tacgactata ttgaaatcgc actccttgat 120
ccttggaaag tagatgtcgc cttaactaaa gatttattgc aagagtacaa tctccgtgct 180
cacgcatcgt taggtctctc tgcagcaaca gacgtcacta gtacggaccc tgccattgta 240
gccaaaggcg acgagctgtt acgcaaggcg acggacgttc ttcacgccat cgggggcaca 300
gaactctgcg gtgtaatcta ctgtgcactg ggcaagtatc cagggccagc cagtaaagaa 360
aatcgcgcga atagtgtcgc ggctatgcaa cggctggcgg actacgcagc ggacaagggg 420
attaacatca acctggaggt tgtcaatcgc tatgagacaa acatcatgaa cactggcctg 480
gaagggctgg catttctgga cgaggtcaat cgtcctaatg cgtatctcca cttagatact 540
tatcacatga acatcgaaga agatggcatg gaaaagtcgg tactcgccgc caaagatcgg 600
ctgggttacg tgcacattgg cgagtctcac cgcggctatc tcgggactgg caatgtcgat 660
ttcgattcct tctttgctgc attaaaaaag attgactatc agggtccaat cacttttgag 720
agcttctcct cggaggtagt tgaccctaag ctgagtaata cgttgtgtgt atggcggaac 780
ctctggcatg actctgacga tctcgcgaaa aaagcactcc ggttcatgaa ggagcggtat 840
ccagggaacc cacaacggtc gcct 864
<210> 30
<211> 864
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 30
atgaagtacg gtggccatgc cttggtatgg agcggtgatt ggacgccaga aggcgctcgc 60
caagccatct cgggggcggc tcgcgctggg tacgactata tcgaaatcgc gttactggac 120
ccatggaaag tagacgtagc tttgaccaag gacctcctgc aggagtttaa cttacgtgct 180
cacgcgagtc tgggcctgag cgcagccacg gatgtcacca gtacagacat ggctatcgtg 240
gccaaggggg atgagctgct tcgcaaagcc accgacgtac tggcggcgat cggcgggaaa 300
gagctgtgtg gggttattta ctgtgccctt ggcaaatacc caggtcctgc ctcgaaagag 360
aatcggaaca acagtgtcgc tgcgatgcaa cgtcttgcgg attatgccgc agataaggac 420
atcaatatca atttggaggt agttaaccgc tacgagacaa acattatcaa cacaggtatc 480
gaaggtttag catttctgga tgaggtggat cgcccgaatg cctatcttca cttggacact 540
taccacatga atatcgagga agatgggatg gagaagtccg tactcgcggc taaagaccgc 600
ctcggctatg ttcacatcgg cgaatcccat cggggctatc ttggcacagg caatgtagat 660
tttgatactt tctttgcagc cttaaagaaa attgggtatc aagggccaat tacatttgag 720
tccttcagtt ctgaggtcgt tgaccctaac ctgtcgaata cgctgtgtgt ctggcgcaat 780
ttgtggcatg actcggatga cctcgcgaaa aaggccttgc aattcatgaa ggagcgctac 840
tcgggtaacc cgcaacggag tccg 864
<210> 31
<211> 864
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 31
atgaagtttg ggatccattc aatggtgtgg gtgggggact ggagtcctga acacgcgcgc 60
catgccatcg cctcaagtgc tgaagcgggc tacgatttaa tcgagttggc tgcaatcgac 120
ccggctacgt tcgatgtaga tctgaccgcg aaacttcttg ctgagcacgg gattcaagcg 180
tcggcttccc ttggtcttga tgcggcgacc gacgtatcaa gcgaagaccc ggatgtggtg 240
gccgctgggc gcgctcgctt gcgggacgct ttggctctcg tccgggatac cggtggcacg 300
atgctttgtg gcgttattta ctccgctctg cggaagtacg acgcaccggt aactgagcgt 360
ggtttagcca attcacaaga gaccattgca gcactcgcgg acgaggccgc ggcttccggt 420
attactatcg ggctggagtt ctgcaaccgt tatgaaacga acgtacttaa cacgaccgcc 480
cagactttgg cgttcatcgc agccgtggat cgccctaacg ttatggctca cttagatacc 540
taccacatga acattgaaga accgtctatg tctgagcctg ttcttgcagc ggctggccgc 600
cttggttacg tccatgttgg tgagtctcac cgcggcgcgc ctggtactgg tagtatccca 660
tgggacgagt tcttcggtgc cctccgtgag tgtgggtatg atggtattgt gacttttgag 720
agtttttctt ctgaagttgt tcaccctagt ttttccaaca cattggccat ctggcggaac 780
ctgtggactg acaatcgcaa acttgcaacc ggtgctcttg cttttatgcg ggcccatttg 840
cgggccgctg gcggtcgcgg ggcc 864
<210> 32
<211> 864
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 32
atgaaactcg ggattcatgc attagtgtgg gtaggtggtt ggacacctga ggaagctgaa 60
ctcgccatta gtagcacggc gcgcgcaggg tacgatctca ttgaaatccc tgcgctggac 120
ccgtcgcgta ttgacgttgc ttccacccgg gagatgcttg agcgccatgg tttgcaagca 180
agcgtgtccc tgggtctcgc tcctgacacc gacatcaatt cggaagatgt agcgtgtgta 240
gatcgtggcc gggatgtctt gatgcgtgca ctggaggtta gttctggcat cggttccaca 300
taccttgggg gcgtaatttt cggggctatg actaagtaca gcgcccctac cacagagcgg 360
gcccgcgcaa atagcgtggc ggtaatcaag gagttggccc aagaagcccg tggctgcggg 420
acaacgattg ggcttgaatt tgttaatcgg tacgagagta acttattaaa tactgctcaa 480
caaaccctgg actacttgga tctcgtaggg gaagataacg tggtggtaca cgctgatgta 540
tatcacatga acatcgagga gacggatttc cgcacaccga ttctggcttg cggcgaccgt 600
ctgggctatg ttcacgtagg cgaatcccac cgtggttacc tgggtacagg ttcggtaaac 660
tttcctgaat ttttcggtgc tttgaaggaa gtcgggtatg cagggcctat cacctttgaa 720
tcattctcct ccagcgtcgt tgaccctctg ttgagcaata cattggcgat ctggcgtaat 780
ctttggagtg acagcacaga tctggccact caggcgcatg catttatctc ggcaggcttg 840
gcggatgatg gggggcgtgg tgcc 864

Claims (37)

1.一种多肽,其包含选自以下的氨基酸序列:
(i)SEQ ID No.:1-12和14-16,或与其具有至少88%序列同源性的功能类似物;和
(ii)SEQ ID No.:13,或与其具有至少92%序列同源性的功能类似物。
2.根据权利要求1所述的多肽,其特征在于具有3-差向异构酶活性。
3.根据权利要求2所述的多肽,其中所述3-差向异构酶活性包括D-阿洛酮糖3-差向异构酶活性,并且其中所述多肽包含选自SEQ ID No.:4、9、10、11、12、13、14和16的氨基酸序列。
4.根据权利要求1至3中任一项所述的多肽,其为分离的多肽或合成多肽,并且其中所述多肽包含选自SEQ ID No.:11、12和13的氨基酸序列。
5.一种编码根据权利要求1至4中任一项所述的多肽的多核苷酸。
6.根据权利要求5所述的多核苷酸,其包含选自SEQ ID No.:17-32的核酸序列。
7.根据权利要求5或6所述的多核苷酸,其为分离的多核苷酸或人工多核苷酸。
8.包含权利要求5至7中任一项所述的多核苷酸的质粒或表达载体。
9.一种转基因细胞、转化细胞或转染细胞,其包含:
a.权利要求1至4中任一项所述的多肽;
b.权利要求5至7中任一项所述的多核苷酸;
c.权利要求8所述的质粒或表达载体;或
d.(a)至(c)的任意组合。
10.根据权利要求9所述的转基因细胞、转化细胞或转染细胞,其为单细胞生物、多细胞生物的细胞和培养物中的细胞中的任意一种。
11.根据权利要求10所述的转基因细胞、转化细胞或转染细胞,其中所述单细胞生物包括真菌或细菌。
12.根据权利要求11所述的转基因细胞、转化细胞或转染细胞,其中所述真菌为酵母细胞。
13.根据权利要求9至12中任一项所述的转基因细胞、转化细胞或转染细胞,其中所述转基因细胞或所述转染细胞选自地衣芽孢杆菌、酿酒酵母菌、粟酒裂殖酵母菌、恶臭假单胞菌、毕赤酵母菌、曲霉菌、里氏木霉菌、谷氨酸杆菌、大肠杆菌和枯草芽孢杆菌。
14.根据权利要求9至13中任一项所述的转基因细胞、转化细胞或转染细胞,其中所述多细胞生物的细胞包括植物细胞。
15.衍生自权利要求9至14中任一项所述的转基因细胞或转染细胞的提取物,或其任何部分。
16.根据权利要求15所述的提取物,其包含所述多核苷酸、所述多肽或两者。
17.一种转基因植物、转基因植物组织或植物部分,其包含:
a.权利要求1至4中任一项所述的多肽;
b.权利要求5至7中任一项所述的多核苷酸;
c.权利要求8所述的质粒或表达载体;
d.权利要求9至14中任一项所述的转基因细胞或转染细胞;或
e.(a)至(d)的任意组合。
18.一种组合物,其包含:
a.权利要求1至4中任一项所述的多肽;
b.权利要求5至7中任一项所述的多核苷酸;
c.权利要求8所述的质粒或表达载体;
d.权利要求9至14中任一项所述的转基因细胞或转染细胞;
e.权利要求15或16所述的提取物;
f.权利要求17所述的转基因植物组织或植物部分;或
g.(a)至(f)的任意组合,
以及可接受的载体。
19.根据权利要求18所述的组合物,其进一步包含二价金属阳离子。
20.根据权利要求19所述的组合物,其中所述二价阳离子选自:Co2+、Mg2+、Mn2+、Mo2+、Ni2+及其任意组合。
21.根据权利要求18至20中任一项所述的组合物,其进一步包含水性溶剂。
22.根据权利要求18至21中任一项所述的组合物,其中所述多肽结合至固体载体。
23.根据权利要求22所述的组合物,其中所述结合是通过共价键或非共价相互作用。
24.根据权利要求22或23所述的组合物,其进一步包含能够结合所述多肽和所述固体载体的化学试剂。
25.根据权利要求18至24中任一项所述的组合物,其进一步包含果糖、D-阿洛酮糖或两者。
26.一种合成具有3-差向异构酶活性的多肽的方法,其包括以下步骤:
a.提供包含质粒或表达载体的细胞,所述质粒或表达载体包含与选自SEQ ID No.:17-32的核酸序列具有至少70%序列同一性的核酸序列;和
b.培养来自步骤(a)的所述细胞,使得所述质粒或表达载体编码的多肽被表达,
从而合成所述多肽。
27.根据权利要求26所述的方法,其进一步包括至少一个选自以下的步骤:回收所述多肽,至少部分纯化所述多肽,固定化所述多肽,及其任意组合。
28.根据权利要求26或27所述的方法,其中所述细胞为原核细胞或真核细胞。
29.根据权利要求26至28中任一项所述的方法,其中所述细胞为转基因细胞或用权利要求8所述的质粒或表达载体转染的细胞。
30.根据权利要求26至29中任一项所述的方法,其进一步包括步骤(a)之前的步骤,其包括用所述质粒或表达载体导入或转染所述细胞。
31.一种生产D-阿洛酮糖的方法,其包括以下步骤:
a.将权利要求18至24中任一项所述的组合物与有效量的果糖接触,从而获得反应混合物;和
b.使所述反应混合物经受适于将所述果糖至少部分转化为D-阿洛酮糖的条件,
从而产生D-阿洛酮糖。
32.根据权利要求31所述的方法,其中所述条件包括:(i)温度在25℃至75℃之间;(ii)pH为在3至8.5之间,或(i)和(ii)两者。
33.根据权利要求31或32所述的方法,其中所述经受包括使所述反应混合物与二价金属阳离子接触。
34.根据权利要求33所述的方法,其中所述二价阳离子选自:Co2+、Mg2+、Mn2+、Mo2+、Ni2+及其任意组合。
35.根据权利要求33或34所述的方法,其中所述二价金属阳离子在所述反应混合物中以0.1mM至10mM范围内的浓度存在。
36.根据权利要求31至35中任一项所述的方法,其进一步包括包含从所述反应混合物中分离所述D-阿洛酮糖的步骤。
37.根据权利要求36所述的方法,其中所述分离包括:提取、沉淀、膜过滤或其任意组合。
CN202280057025.8A 2021-06-27 2022-06-27 具有d-阿洛酮糖3-差向异构酶活性的多肽 Pending CN118119706A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202163215472P 2021-06-27 2021-06-27
US63/215,472 2021-06-27
PCT/IL2022/050690 WO2023275867A1 (en) 2021-06-27 2022-06-27 Polypeptides with d-psicose 3-epimerase activity

Publications (1)

Publication Number Publication Date
CN118119706A true CN118119706A (zh) 2024-05-31

Family

ID=84690946

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280057025.8A Pending CN118119706A (zh) 2021-06-27 2022-06-27 具有d-阿洛酮糖3-差向异构酶活性的多肽

Country Status (5)

Country Link
EP (1) EP4363569A1 (zh)
KR (1) KR20240025675A (zh)
CN (1) CN118119706A (zh)
IL (1) IL309783A (zh)
WO (1) WO2023275867A1 (zh)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105637089B (zh) * 2013-09-03 2021-06-15 罗盖特兄弟公司 D-阿洛酮糖3-差向异构酶的改进的变体及其用途
HUE058347T2 (hu) * 2015-05-22 2022-07-28 Archer Daniels Midland Co Epimeráz enzimek alkalmazása fruktóz allulózzá történõ átalakítására

Also Published As

Publication number Publication date
WO2023275867A1 (en) 2023-01-05
EP4363569A1 (en) 2024-05-08
KR20240025675A (ko) 2024-02-27
IL309783A (en) 2024-02-01

Similar Documents

Publication Publication Date Title
JP6254728B2 (ja) イソプレンシンターゼおよびそれをコードするポリヌクレオチド、ならびにイソプレンモノマーの製造方法
CN112080480B (zh) 糖基转移酶突变体及其应用
DK2483415T3 (en) RECOMBINANT C1 B-glucosidase FOR MANUFACTURE OF sugars from cellulosic BIOMASS
KR101200571B1 (ko) 테라박터 속 유래의 신규한 진세노시드 글리코시다제 및 이의 용도
US9902983B2 (en) Agarooligosaccharide hydrolase and method for producing 3,6-anhydro-L-galactose and galactose from agarose by using same
JP7241368B2 (ja) アオサ多糖リアーゼおよびそのコード遺伝子と応用
CN108103039B (zh) 一组岩藻糖基转移酶突变体及其筛选方法和应用
JP7404537B2 (ja) アルロースエピマー化酵素変異体、その製造方法及びそれを利用したアルロースの製造方法
CN111836900A (zh) 从海藻生产葡萄糖及昆布多糖寡糖的新型β-葡萄糖苷酶
KR20210126019A (ko) 엔지니어링된 아릴 설페이트-의존 효소
CN113151211A (zh) 一种α-1,3-岩藻糖基转移酶突变体及利用该突变体制备3-岩藻糖基乳糖的应用
CN108531470B (zh) 一种硫酸岩藻多糖裂解酶tflfm及其制备方法和应用
CN112342178B (zh) 重组微生物、其制备方法及在生产塔格糖中的应用
JP7251838B2 (ja) 3’,3’-cGAMPの実践的酵素合成法
CN118119706A (zh) 具有d-阿洛酮糖3-差向异构酶活性的多肽
CN115074349B (zh) 一种广藿香醇合酶突变体及其编码基因以及应用
CN114277024B (zh) 一种新型三萜合酶及其应用
CN105969751B (zh) 一种β-葡萄糖苷酶基因及其应用
CN112553175B (zh) 糖基转移酶ugt76g1突变体的制备及其应用
CN108251406B (zh) L-鼠李树胶糖-1-磷酸醛缩酶及其在催化合成稀有糖d-阿洛酮糖中的应用
CN115044568B (zh) 高稳定型的蔗糖磷酸化酶突变体及其应用
CN109354627B (zh) 一种提高海藻糖水解酶产量的方法
KR102141174B1 (ko) 아밀로수크라제의 발현 시스템 및 이를 이용한 투라노스의 생산
KR101352626B1 (ko) 신규한 올리고알긴산 분해효소 및 이를 이용한 알긴산 유래 단당의 효소적 생산방법
WO2017132924A1 (zh) 一种用于生物合成异戊二烯和异戊烯的酶及其突变体

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination