CN112831481B - 糖基转移酶以及催化糖链延伸的方法 - Google Patents

糖基转移酶以及催化糖链延伸的方法 Download PDF

Info

Publication number
CN112831481B
CN112831481B CN201911153934.8A CN201911153934A CN112831481B CN 112831481 B CN112831481 B CN 112831481B CN 201911153934 A CN201911153934 A CN 201911153934A CN 112831481 B CN112831481 B CN 112831481B
Authority
CN
China
Prior art keywords
pnugt29
leu
glu
ser
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911153934.8A
Other languages
English (en)
Other versions
CN112831481A (zh
Inventor
周志华
李超静
杨成帅
严兴
王平平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenghe Everything Suzhou Biotechnology Co ltd
Original Assignee
Shenghe Everything Shanghai Biotechnology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenghe Everything Shanghai Biotechnology Co ltd filed Critical Shenghe Everything Shanghai Biotechnology Co ltd
Priority to CN201911153934.8A priority Critical patent/CN112831481B/zh
Publication of CN112831481A publication Critical patent/CN112831481A/zh
Application granted granted Critical
Publication of CN112831481B publication Critical patent/CN112831481B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1048Glycosyltransferases (2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P33/00Preparation of steroids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及负责糖链延伸的一组高活性的糖基转移酶及其应用。具体地,提供了糖基转移酶及其衍生多肽,可以高效催化在四环三萜类化合物底物C‑20位第一个糖基和C‑6位第一个糖基上延伸糖链的反应,获得人参皂苷Rb1、人参皂苷Rb3、皂苷DMGG、皂苷DMGX、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、绞股蓝皂苷XIII、绞股蓝皂苷IX、三七皂苷U和、三七皂苷R1、三七皂苷R2、三七皂苷R3、3‑O‑β‑(D‑吡喃木糖基)‑β‑(D‑吡喃葡萄糖基)‑CK、20‑O‑葡糖基人参皂苷Rf、Rd‑C20‑O‑Rha,人参皂苷Rg2和人参皂苷Re等人参皂苷产物。本发明糖基转移酶还可应用于构建人工合成人参皂苷及多种新人参皂苷及其衍生物。

Description

糖基转移酶以及催化糖链延伸的方法
技术领域
本发明涉及生物技术和植物生物学领域,具体地,本发明涉及一组糖基转移酶及其应用。
背景技术
人参皂苷是从人参属植物(如人参、三七和西洋参等)和绞股蓝中分离到的皂苷的总称,是一类三萜化合物。人参皂苷亦可以根据其分离的来源称为人参皂苷,三七皂苷和绞股蓝皂苷。人参皂苷是这些药用植物中的主要生物活性成份。目前,已经分离出了约150种皂苷。从结构上来看,人参皂苷主要是皂苷元经过糖基化后形成的生物活性小分子。人参皂苷的皂苷元只有有限的几种,主要是达玛烷型四环三萜的原人参二醇和原人参三醇,以及齐墩果烷酸。皂苷元通过糖基化后,可以提高水溶性,改变其亚细胞定位,并产生出不同的生物活性。绝大部分原人参二醇型皂苷是在C3和/或C20位羟基进行糖基化修饰,而原人参三醇型皂苷是在C6和/或C20的羟基上进行糖基化修饰。不同类型的糖基以及不同程度的糖基化修饰产生了分子结构繁多的人参皂苷。
具有不同糖基化修饰方式的人参皂苷具有不同的生物活性。例如Rb1,Rb2和Rb3分别是在Rd的C20-O-Glc延伸一分子葡萄糖、阿拉伯糖和木糖。实验证实丰富皂苷Rb1具有保护神经细胞和抗炎症抗氧化的功效;Rb2具有抑制肿瘤血管生成与肿瘤转移、降低糖尿病小鼠血糖以及降低血脂的功效;Rb3具有减缓心肌缺血和抗抑郁的功效。Rg2是在Rh1的C20-O-Glc延伸一分子鼠李糖,Rg2具有抗老年痴呆的功效。
人参皂苷以人参或者三七的总皂苷或者丰富皂苷为原料,依赖化学、酶和微生物发酵的水解方法进行制备。由于野生的人参资源已基本耗竭,人参皂苷资源目前来源于人参或三七的人工栽培,而其人工栽培的生长周期长(一般需要5-7年以上),并且受到地域的限制,还经常受到病虫害而需要施用大量的农药,所以,人参或三七的人工栽培有严重的连作障碍(人参或三七种植地需要休耕5-15年以上才能克服连作障碍),所以人参皂苷的产量、品质及安全性都面临挑战。
合成生物学的发展为植物来源的天然产物的异源合成提供了新的机遇。以酵母为底盘,通过代谢途径的组装和优化,已经实现了用廉价的单糖来发酵合成青蒿酸或者双氢青蒿酸,继而再通过一步化学转化的方法生产青蒿素,这表明合成生物学在天然产物的药物合成方面具有的巨大潜力。利用酵母底盘细胞通过合成生物学方法异源合成人参皂苷单体,原料为廉价的单糖,制备过程为安全性可调控的发酵过程,避免了任何外来污染(例如,原料植物人工种植时使用的农药),因此,通过合成生物学技术制备人参皂苷单体,不仅具有成本优势,而且,可以保证成品的品质与安全性。利用合成生物学技术制备足够量的各种高纯度的天然与非天然的人参皂苷单体,用于活性测定及临床实验,促进稀有人参皂苷的创新药物研发。
近年来通过对人参、三七和西洋参的转录组和功能基因组研究,人参皂苷皂苷元合成途径的解析已经有了非常大的进展。2006年,日本和韩国科学家分别鉴定了将环氧角鲨烯转化为达玛烯二醇的萜环化酶元件达(玛烯二醇合成酶,PgDDS)。2011年到2012年,韩国科学家又鉴定了把达玛烯二醇氧化为原人参二醇以及把原人参二醇进一步氧化为原人参三醇的细胞色素P450元件CYP716A4和CYP716A53v2。
利用合成生物学方法来人工合成这些具有药用活性的人参皂苷,不仅需要构建合成皂苷元的代谢途径,还需要鉴定催化人参皂苷的糖基化的UDP-糖基转移酶。UDP-糖基转移酶的功能是将糖基供体(核苷二磷酸糖,例如UDP-葡萄糖、UDP-鼠李糖、UDP-木糖和UDP-阿拉伯糖)上的糖基转移到不同的糖基受体上。从目前已测序的植物基因组分析,植物基因组往往编码了上百种以上不同的糖基转移酶。由于UDP-糖基转移酶可能催化的底物(包括糖基供体和糖基受体)非常多样,这个UDP-糖基转移酶的功能鉴定带来了很大的困难。直到2014年,第一个参与人参皂苷糖基化的UDP-糖基转移酶(UGTPg1)才被中国学者鉴定出来,它可以在原人参二醇型人参皂苷的C20羟基转入一个葡萄糖基。随后,随后,韩国科学家又在人参中克隆两个UDP-糖基转移酶元件(PgUGT74AE2和PgUGT94Q2),它们可以在原人参二醇型皂苷的C3位上分别转入一个葡萄糖基和进行一个葡萄糖基的延伸。几乎与此同时,中国学者也独立地从人参中克隆了两个与PgUGT74AE2和PgUGT94Q2具有相同功能的糖基转移酶元件UGTPg45和UGTPg29。2015年中国学者又进一步鉴定了能在原人参三醇C6位转入一个葡萄糖基的UDP-糖基转移酶元件(UGTPg100)。中国学者在专利(PCT/CN2015/081111和PCT/CN2018/087678)公开了可以在原人参二醇型和原人参三醇型皂苷的C20位进行糖基延伸,以及在原人参三醇型皂苷的C6位进行糖基延伸的糖基转移酶,但是其活性还比较低,不能完全满足应用的需求。
在这种背景下,本发明人进一步从三七中筛选获得了一组高活性的糖基转移酶,对人参中能在原人参二醇型和原人参三醇型皂苷的C20延伸一个葡萄糖基或者木糖糖基的糖基转移酶以及能在原人参三醇型皂苷的C6延伸一个木糖糖基的糖基转移酶进行了克隆和鉴定。该糖基转移酶可用于包括人参皂苷Rb1、人参皂苷Rb3、人参皂苷Rg2、人参皂苷Re、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、三七皂苷U、三七皂苷R1、三七皂苷R2和三七皂苷R3等人参皂苷的高效制备。
发明内容
本发明提供了高效的糖基转移酶及其应用,用于催化四环三萜类化合物糖基化反应。
本发明一方面提供了一种分离的多肽,所述多肽包含:
(a)SEQ ID NO:4、6、8、10、12、14、16、18中任一条或多条所示氨基酸序列;或
(b)(a)的衍生多肽,所述衍生多肽选自以下多肽的一个或多个:
(b1)将SEQ ID NO:4、6、8、10、12、14、16、18中任一条或多条添加标签序列、信号序列或分泌信号序列后形成的、并具有糖基转移酶活性的多肽;
(b2)氨基酸序列与SEQ ID NO:4、6、8、10、12、14、16、18中任一条或多条中所示氨基酸序列的同源性≥80%,并具有糖基转移酶活性的多肽;
(b3)将SEQ ID NO:4、6、8、10、12、14、16、18中任一条所示氨基酸序列的多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的,具有糖基转移酶活性的多肽。
在一个或多个实施方案中,所述多肽用于体外糖基化。在一个或多个实施方案中,所述多肽选自SEQ ID NO:4、6、8、10、12、14、16、18中任一所示氨基酸序列。
本发明另一方面提供分离的多核苷酸,所述多核苷酸选自以下的一种或多种:
(A)编码本文所述多肽的核苷酸序列;
(B)编码如SEQ ID NO:4、6、8、10、12、14、16、18所示多肽或其衍生多肽的核苷酸序列;
(C)如SEQ ID NO:3、5、7、9、11、13、15、17所示的核苷酸序列;
(D)与SEQ ID NO:3、5、7、9、11、13、15、17所示序列有至少80%(较佳地至少90%)相同性的核苷酸序列;
(E)在SEQ ID NO:3、5、7、9、11、13、15、17所示序列的5’端和/或3’端截短或添加1-60个(较佳地1-30,更佳地1-10个)核苷酸所形成的核苷酸序列;
(F)(A)-(E)任一所述的核苷酸序列的互补序列;
(G)(A)-(F)所述序列的长20-50个碱基的片段。
在一个或多个实施方案中,所述多核苷酸序列选自SEQ ID NO:3、5、7、9、11、13、15、17中任一或其互补序列。
在一个或多个实施方案中,SEQ ID NO:3、5、7、9、11、13、15、17所示的核苷酸序列分别编码SEQ ID NO:4、6、8、10、12、14、16、18所示的多肽。
本发明另一方面提供了一种核酸构建物,该核酸构建物包含本文所述的多核苷酸,或表达本发明所述的分离的多肽。优选地,所述核酸构建物是表达载体或同源重组载体。
本发明另一方面提供宿主细胞,所述宿主细胞:
(1)表达本文所述的多肽或衍生多肽;
(2)含有本文所述多核苷酸序列;和/或
(3)含有本文所述的核酸构建物。
在一个或多个实施方案中,宿主细胞为原核细胞或真核细胞。
在一个或多个实施方案中,宿主细胞为真核细胞,如酵母细胞或植物细胞。在一个或多个实施方案中,宿主细胞为酿酒酵母细胞。在一个或多个实施方案中,宿主细胞为人参细胞或三七细胞。
在一个或多个实施方案中,宿主细胞为原核细胞,如大肠杆菌。
在一个或多个实施方案中,宿主细胞不是天然产生式(II)、(IV)、(VI)化合物的细胞。
在另一优选例中,所述的宿主细胞不是天然产生以下物质中的一种或多种的细胞:人参皂苷Rd、人参皂苷Rb1、人参皂苷Rb3、皂苷DMGG、皂苷DMGX、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、绞股蓝皂苷XIII、绞股蓝皂苷IX、三七皂苷U和、三七皂苷R1、和三七皂苷R2、三七皂苷R3、3-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-PPD;3-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-CK、20-O-葡糖基人参皂苷Rf。
在一个或多个实施方案中,所述宿主细胞还具有选自下述的特征:
(a)表达达玛烯二醇和/或原人参二醇类皂苷和/或原人参三醇类皂苷合成代谢途径中的关键酶与该酶具有50%序列相同性的突变体;
(b)表达包含(a)所述酶的功能片段或与该片段具有50%序列相同性的突变体的多肽;
(c)含有(a)所述酶或(b)所述多肽的多核苷酸或其互补序列,和/或(d)含有包含(c)所述编码序列的核酸构建物。
在一个或多个实施方案中,原人参二醇类皂苷包含人参皂苷、Rb1、Rb2、Rb3、Rc、Rd、Rg3、Rh2和CK。在一个或多个实施方案中,原人参三醇类皂苷包含人参皂苷F1、Re、Rg1、Rg2、Rh1。
在一个或多个实施方案中,达玛烯二醇合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因。
在一个或多个实施方案中,人参皂苷CK合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因和P450CYP716A47的还原酶基因和四环三萜C20位的糖基转移酶UGTPg1(Genbank accession number KF377585.1),或其组合。
在一个或多个实施方案中,人参皂苷F1合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因、P450CYP716A47的还原酶基因、及细胞色素P450 CYP716A53V2基因及其还原酶基因和四环三萜C20位的糖基转移酶UGTPg1,或其组合。
在一个或多个实施方案中,人参皂苷Rg1合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因和P450CYP716A47的还原酶基因和四环三萜C20位和C6的糖基转移酶UGTPg1和UGTPg100(Genbank accession numberAKQ76388.1),或其组合。
在一个或多个实施方案中,人参皂苷Re合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因和P450CYP716A47的还原酶基因和四环三萜C20位和C6的糖基转移酶UGTPg1和UGTPg100(Genbank accession numberAKQ76388.1)以及本文中催化C6位糖基延伸的糖基转移酶,或其组合。
在一个或多个实施方案中,人参皂苷Rb1合成代谢途径中的关键基因包括(但不限于):达玛烯二醇合成酶基因、细胞色素P450 CYP716A47基因及其还原酶基因和四环三萜C20位和C3的糖基转移酶UGTPg1和UGTPg45(Genbank accession number A0A0D5ZDC8.1),四环三萜负责C3位糖基延伸的糖基转移酶UGTPg29(Genbank accession numberAKA44579.1)以及本文中催化C20位糖基延伸的糖基转移酶,或其组合。
本发明提供本文所述多肽在催化以下反应中的用途:
将来自糖基供体的糖基转移到四环三萜类化合物的以下位点:
(i)C-6位的第一个糖基上;或
(ii)C-20位的第一个糖基上。
在一个或多个实施方案中,本发明提供多肽在催化反应中的用途,所述多肽包含SEQ ID NO:4、6、8、10中任一条或多条所示氨基酸序列或与其具有50%相同性的突变体,所述反应将来自糖基供体的糖基转移到四环三萜类化合物的C-6位的第一个糖基上。
在一个或多个实施方案中,本发明提供多肽在催化反应中的用途,所述多肽包含SEQ ID NO:12、14、16、18中任一条或多条所示氨基酸序列或与其具有50%相同性的突变体,所述反应将来自糖基供体的糖基转移到四环三萜类化合物的C-20位的第一个糖基上。
本发明提供本文所述多肽、多核苷酸或核酸构建物在制备催化以下反应的催化制剂中的用途:
将来自糖基供体的糖基转移到四环三萜类化合物的以下位点:
(i)C-6位的第一个糖基上;或
(ii)C-20位的第一个糖基上。
在一个或多个实施方案中,本发明提供多肽和/或其编码序列在制备催化反应的催化制剂中的用途,所述多肽包含SEQ ID NO:4、6、8、10中任一条或多条所示氨基酸序列或与其具有50%相同性的突变体,所述反应将来自糖基供体的糖基转移到四环三萜类化合物的C-6位的第一个糖基上。
在一个或多个实施方案中,本发明提供多肽和/或其编码序列在制备催化反应的催化制剂中的用途,所述多肽包含SEQ ID NO:12、14、16、18中任一条或多条所示氨基酸序列或与其具有50%相同性的突变体,所述反应将来自糖基供体的糖基转移到四环三萜类化合物的C-20位的第一个糖基上。
在一个或多个实施方案中,所述反应为:将本文所述式(I)化合物转化为本文所述式(II)化合物的反应,或本文所述式(III)化合物转化为本文所述式(IV)化合物的反应,或者本文所述式(V)化合物转化为本文所述式(VI)化合物的反应。
优选地,本发明提供多肽的用途,所述多肽用于催化以下反应,或用于制备催化以下反应的催化制剂:在糖基转移酶存在下,将糖基供体的糖基转移到四环三萜类化合物的C-6位的第一个糖基上,所述糖基转移酶包含SEQ ID NO:4、6、8、10中任一条或多条所示氨基酸序列或其衍生多肽。
在一个或多个实施方案中,所述衍生多肽选自以下多肽的一个或多个:
(a)具有SEQ ID NO:4、6、8、10中任一条或多条所示氨基酸序列的多肽;
(b)将SEQ ID NO:4、6、8、10添加标签序列、信号序列或分泌信号序列后形成的、并具有糖基转移酶活性的衍生多肽;
(c)氨基酸序列与SEQ ID NO:4、6、8、10中任一条或多条中所示氨基酸序列的同源性≥80%,并具有糖基转移酶活性的衍生多肽。
(d)将SEQ ID NO:4、6、8、10中任一条所示氨基酸序列的多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的、并具有糖基转移酶活性的衍生多肽。
优选地,本发明提供多肽或其衍生多肽的用途,所述多肽用于催化以下反应,或用于制备催化以下反应的催化制剂:在糖基转移酶存在下,将糖基供体的糖基转移到四环三萜类化合物的C-20位的第一个糖基上,所述糖基转移酶包含SEQ ID NO:12、14、16、18中任一条或多条所示氨基酸序列或其衍生多肽。
在一个或多个实施方案中,所述衍生多肽选自以下多肽的一个或多个:
(a)具有SEQ ID NO:12、14、16、18中任一条或多条所示氨基酸序列的多肽;
(b)将SEQ ID NO:12、14、16、18添加标签序列、信号序列或分泌信号序列后形成的、并具有糖基转移酶活性的衍生多肽;
(c)氨基酸序列与SEQ ID NO:12、14、16、18中任一条或多条中所示氨基酸序列的同源性≥80%,并具有糖基转移酶活性的衍生多肽。
(d)将SEQ ID NO:12、14、16、18中任一条所示氨基酸序列的多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的、并具有糖基转移酶活性的衍生多肽。
在一个或多个实施方案中,糖基供体包括选自下组的核苷二磷酸糖:UDP-葡萄糖,ADP-葡萄糖,TDP-葡萄糖,CDP-葡萄糖,GDP-葡萄糖,UDP-乙酰基葡萄糖,ADP-乙酰基葡萄糖,TDP-乙酰基葡萄糖,CDP-乙酰基葡萄糖,GDP-乙酰基葡萄糖,UDP-木糖,ADP-木糖,TDP-木糖,CDP-木糖,GDP-木糖,UDP-半乳糖醛酸,ADP-半乳糖醛酸,TDP-半乳糖醛酸,CDP-半乳糖醛酸,GDP-半乳糖醛酸,UDP-半乳糖,ADP-半乳糖,TDP-半乳糖,CDP-半乳糖,GDP-半乳糖,UDP-阿拉伯糖,ADP-阿拉伯糖,TDP-阿拉伯糖,CDP-阿拉伯糖,GDP-阿拉伯糖,UDP-鼠李糖,ADP-鼠李糖,TDP-鼠李糖,CDP-鼠李糖,GDP-鼠李糖,UDP-木糖,ADP-木糖,TDP-木糖,CDP-木糖,GDP-木糖,或其他核苷二磷酸己糖或核苷二磷酸戊糖,或其组合。
在一个或多个实施方案中,所述的糖基供体包括选自下组的尿苷二磷酸(UDP)糖:UDP-葡萄糖,UDP-半乳糖醛酸,UDP-半乳糖,UDP-阿拉伯糖,UDP-鼠李糖,UDP-木糖,或其他尿苷二磷酸己糖或尿苷二磷酸戊糖,或其组合。
在一个或多个实施方案中,所述分离的多肽用于催化下述一种或多种反应或用于制备催化下述一种或多种反应的催化制剂:
(A)
其中,R1为H、单糖糖基或多糖糖基;R2为H或OH;R3为单糖糖基;R4为单糖糖基,所述多肽选自SEQ ID NO:12、14、16、18或其衍生多肽。在一个或多个实施方案中,所述单糖包括葡萄糖(Glc)、鼠李糖(Rha)、乙酰基葡萄糖(Glc(6)Ac)、阿拉伯呋喃糖(Araf)、阿拉伯吡喃糖(Arap)、或木糖(Xyl)等。
在一个或多个实施方案中,所述多糖包括Glc(2-1)Glc、Glc(6-1)Glc、Glc(6)Ac、Glc(2-1)Rha、Glc(6-1)Arap、Glc(6-1)Xyl、Glc(6-1)Araf、Glc(3-1)Glc(3-1)、Glc(2-1)Glu(6)Ac、Glc(6-1)Arap(4-1)Xyl、Glc(6-1)Arap(2-1)Xyl或Glc(6-1)Arap(3-1)Xyl等由2、3或4个单糖组成的多糖。
在一个或多个实施方案中,R1-R4经取代后的化合物如下表所示:
底物 R1 R2 R3 R4 产物
CK H OH Glc Glc 绞股蓝皂苷LXXV
DMG H H Glc Glc DMGG
F2 Glc OH Glc Glc 绞股蓝皂苷XVII
Rd Glc(2-1)Glc OH Glc Glc Rb1
CK H OH Glc Xyl 绞股蓝皂苷XIII
DMG H H Glc Xyl DMGX
F2 Glc OH Glc Xyl 绞股蓝皂苷IX
Rd Glc(2-1)Glc OH Glc Xyl Rb3
Rd Glc(2-1)Glc OH Glc Rha Rd-C20-O-Rha
即当所述的R1为H,R2为OH,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷CK(CK);
当所述的R1为H,R2为OH,R3和R4为葡萄糖基时,所述的式(II)化合物为绞股蓝皂苷LXXV;
当所述的R1为H,R2为OH,R3为葡萄糖基,R4为木糖基时,所述的式(II)化合物为绞股蓝皂苷XIII;
当R1和R2都为H,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷DMG;
当R1和R2都为H,R3和R4为葡萄糖基时,所述的式(II)化合物为皂苷DMGG(20-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-达玛烯二醇)(20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-dammarenediol);
当R1和R2都为H,R3为葡萄糖基,R4为木糖基时,所述的式(II)化合物为皂苷DMGX(20-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-达玛烯二醇)(20-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-dammarenediol);
当R1为葡萄糖基,R2为OH,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷F2(F2);
当R1为葡萄糖基,R2为OH,R3和R4为葡萄糖基时,所述的式(II)化合物为绞股蓝皂苷XVII;
当R1为葡萄糖基,R2为OH,R3为葡萄糖基,R4为木糖基时,所述的式(II)化合物为绞股蓝皂苷IX;
当R1为两个葡萄糖基,R2为OH,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷Rd;
当R1为两个葡萄糖基,R2为OH,R3和R4为葡萄糖基时,所述的式(II)化合物为人参皂苷Rb1;
当R1为两个葡萄糖基,R2为OH,R3为葡萄糖基,R4为木糖基时,所述的式(II)化合物为人参皂苷Rb3;或
当R1为两个葡萄糖基,R2为OH,R3为葡萄糖基,R4为鼠李糖基时,所述的式(II)化合物为Rd-C20-O-Rha;
(B)
其中,R1为H、单糖糖基或多糖糖基,R2为单糖糖基,R3为单糖糖基,所述的多肽选自SEQ ID NO:12、14、16、18或其衍生多肽。
在一个或多个实施方案中,R1-R3经取代后的化合物如下表所示:
底物 R1 R2 R3 产物
F1 H Glc Glc 三七皂苷U
Rg1 Glc Glc Glc 三七皂苷R3
即当R1为H时,R2为葡萄糖基时,所述的式(III)化合物为人参皂苷F1(F1);
当R1为H时,R2和R3为葡萄糖基时,所述的式(IV)化合物为三七皂苷U;
当R1和R2为葡萄糖基时,所述的式(III)化合物为人参皂苷Rg1(Rg1);或
当R1,R2和R3为葡萄糖基时,所述的式(IV)化合物为三七皂苷R3(R3);
(C)
其中,R1和R2为H或者糖基,R3和R4为单糖糖基;所述多肽选自SEQ ID NO:4、6、8、10或其衍生多肽。
在一个或多个实施方案中,R1-R4经取代后的化合物如下表所示:
底物 R1 R2 R3 R4 产物
Rg1 H Glc Glc Xyl 三七皂苷R1
Rg1 H Glc Glc Glc 20-O-葡糖基人参皂苷Rf
Rg1 H Glc Glc Rha 人参皂苷Re
Rh1 H H Glc Xyl 三七皂苷R2
Rh1 H H Glc Glc 人参皂苷Rf
Rh1 H H Glc Rha 人参皂苷Rg2
即当R1为H时,R2和R3为葡萄糖基时,所述的式(V)化合物为人参皂苷Rg1;
当R1为H时,R2和R3为葡萄糖基,R4为木糖基时,所述的式(VI)化合物为三七皂苷R1;
当R1为H时,R2和R3为葡萄糖基,R4为葡萄糖基时,所述的式(VI)化合物为皂苷20-O-葡糖基人参皂苷Rf(20-O-Glucosylginsenoside Rf);
当R1为H时,R2和R3为葡萄糖基,R4为鼠李糖基时,所述的式(VI)化合物为三七皂苷Re;
当R1和R2为H,R3为葡萄糖基时,所述的式(V)化合物为人参皂苷Rh1;
当R1和R2为H,R3为葡萄糖基,R4为木糖基时,所述的式(VI)化合物为三七皂苷R2;
当R1和R2为H,R3和R4位葡萄糖基时,所述的式(VI)化合物为人参皂苷Rf。
当R1和R2为H,R3为葡萄糖基,R4为鼠李糖基时,所述的式(VI)化合物为三七皂苷Rg2;
在一个或多个实施方案中,所述的单糖糖基选自:葡萄糖基、木糖、半乳糖醛酸基、半乳糖基、阿拉伯糖基、鼠李糖基,以及其他己糖基或戊糖基。
在一个或多个实施方案中,所述反应式中(I)、(III)、(V)化合物包括但不限于:S构型或R构型的达玛烷型四环三萜类化合物、羊毛脂烷型四环三萜类化合物、去水甘遂烷(apotirucallane)型四环三萜、甘遂烷型四环三萜类化合物、环阿屯烷(环阿尔廷烷)型四环三萜类化合物、葫芦烷四环三萜类化合物、或楝烷型四环三萜类化合物。
在一个或多个实施方案中,所述反应式中(II)、(IV)、(VI)化合物包括人参皂苷Rd、人参皂苷Rb1、人参皂苷Rb3、皂苷DMGG、皂苷DMGX、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、绞股蓝皂苷XIII、绞股蓝皂苷IX、三七皂苷U、三七皂苷R1、和三七皂苷R2、三七皂苷R3、3-O-β-(D-吡喃木糖基(xylopyranosyl))-β-(D-吡喃葡萄糖基(glucopyranosyl))-PPD;3-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-CK、20-O-葡糖基人参皂苷Rf、Rd-C20-O-Rha、人参皂苷Rg2和人参皂苷Re。
本发明另一方面提供了一种进行糖基转移催化反应的方法,包括步骤:在本文所述的多肽或其衍生多肽存在的条件下,进行糖基转移催化反应。
在一个或多个实施方案中,所述的方法还包括步骤:在糖基供体以及本文所述多肽或其衍生多肽的存在下,将所述的式(I)化合物转化为所述的式(II)化合物,或式(III)化合物转化为所述的式(IV)化合物,或者式(V)化合物转化为所述的式(VI)化合物。
在一个或多个实施方案中,所述的方法还包括将所述的多肽或其衍生多肽分别加入催化反应;和/或将所述的多肽或其衍生多肽同时加入催化反应。
在一个或多个实施方案中,所述的方法还包括将编码所述多肽的核苷酸序列与达玛稀二醇和/或原人参二醇和/或原人参三醇合成代谢途径中的关键基因在宿主细胞中共表达,从而获得所述的式(II)、(IV)、(VI)化合物。在一个或多个实施方案中,所述的宿主细胞为酵母菌或大肠杆菌。
在一个或多个实施方案中,所述的多肽为具有SEQ ID NO.:4、6、8、10、12、14、16、18所示氨基酸序列的多肽及其衍生多肽。
在一个或多个实施方案中,编码所述多肽的核苷酸序列如SEQ ID NO.:3、5、7、9、11、13、15、17所示。
在一个或多个实施方案中,所述方法还包括:向反应体系中提供用于调节酶活性的添加物。
在一个或多个实施方案中,所述的用于调节酶活性的添加物是:提高酶活性或抑制酶活性的添加物。
在一个或多个实施方案中,所述的用于调节酶活性的添加物选自下组:Ca2+、Co2+、Mn2+、Ba2+、Al3+、Ni2+、Zn2+、或Fe2+
在一个或多个实施方案中,所述的用于调节酶活性的添加物是:可以生成Ca2+、Co2 +、Mn2+、Ba2+、Al3+、Ni2+、Zn2+、或Fe2+的物质。
在一个或多个实施方案中,所述的糖基供体是核苷二磷酸糖,选自下组:UDP-葡萄糖,ADP-葡萄糖,TDP-葡萄糖,CDP-葡萄糖,GDP-葡萄糖,UDP-木糖,ADP-木糖,TDP-木糖,CDP-木糖,GDP-木糖,UDP-半乳糖醛酸,UDP-乙酰基葡萄糖,ADP-乙酰基葡萄糖,TDP-乙酰基葡萄糖,CDP-乙酰基葡萄糖,GDP-乙酰基葡萄糖,ADP-半乳糖醛酸,TDP-半乳糖醛酸,CDP-半乳糖醛酸,GDP-半乳糖醛酸,UDP-半乳糖,ADP-半乳糖,TDP-半乳糖,CDP-半乳糖,GDP-半乳糖,UDP-阿拉伯糖,ADP-阿拉伯糖,TDP-阿拉伯糖,CDP-阿拉伯糖,GDP-阿拉伯糖,UDP-鼠李糖,ADP-鼠李糖,TDP-鼠李糖,CDP-鼠李糖,GDP-鼠李糖,或其他核苷二磷酸己糖或核苷二磷酸戊糖,或其组合。
在一个或多个实施方案中,所述的糖基供体是尿苷二磷酸糖,选自下组:UDP-葡萄糖,UDP-木糖,UDP-半乳糖醛酸,UDP-半乳糖,UDP-阿拉伯糖,UDP-鼠李糖,或其他尿苷二磷酸己糖或尿苷二磷酸戊糖,或其组合。
在一个或多个实施方案中,反应体系的pH为:pH4.0-10.0,优选pH为5.5-9.0。
在一个或多个实施方案中,反应体系的温度为:10℃-105℃,优选20℃-50℃。
在一个或多个实施方案中,所述糖基催化反应的底物为式(I)、(III)、(V)化合物,且所述的产物分别为(II)、(IV)、(VI)合物;
在一个或多个实施方案中,式(I)化合物为人参皂苷CK,并且式(II)化合物为绞股蓝皂苷LXXV(20-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-原人参二醇)(20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-protopanaxadiol)。
在一个或多个实施方案中,式(I)化合物为人参皂苷DMG,并且式(II)化合物为一种新的人参皂苷DMGG(20-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-达玛烯二醇)(20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-dammarenediol)。
在一个或多个实施方案中,式(I)化合物为人参皂苷F2,并且式(II)化合物为绞股蓝皂苷XVII(3-O-β-(D-吡喃葡萄糖基)-20-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-原人参二醇)(3-O-β-(D-glucopyranosyl)-20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-protopanaxadiol)。
在一个或多个实施方案中,式(I)化合物为人参皂苷Rd,并且式(II)化合物为人参皂苷Rb1(3-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-20-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-原人参二醇)(3-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-protopanaxadiol)。
在一个或多个实施方案中,式(I)化合物为人参皂苷Rd,并且式(II)化合物为人参皂苷Rb3(3-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-20-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-原人参二醇)(3-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-20-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-protopanaxadiol)。
在一个或多个实施方案中,式(I)化合物为人参皂苷Rd,并且式(II)化合物为Rd-C20-O-Rha。
在一个或多个实施方案中,式(I)化合物为人参皂苷CK,并且式(II)化合物为绞股蓝皂苷XIII。
在一个或多个实施方案中,式(I)化合物为人参皂苷DMG,并且式(II)化合物为人参皂苷DMGX(20-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-达玛烯二醇)(20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-dammarenediol)。
在一个或多个实施方案中,式(I)化合物为人参皂苷F2,并且式(II)化合物为绞股蓝皂苷IX。
在一个或多个实施方案中,式(I)化合物为人参皂苷CK,并且式(II)化合物为人参皂苷F3;在另一优选例中,所述的式(III)化合物为人参皂苷F1,并且式(IV)化合物为三七皂苷U(20-O-β-(D-吡喃葡萄糖基)-β-(D-吡喃葡萄糖基)-原人参三醇)(20-O-β-(D-glucopyranosyl)-β-(D-glucopyranosyl)-protopanaxatriol)。
在一个或多个实施方案中,式(III)化合物为人参皂苷Rg1,并且式(IV)化合物为三七皂苷R3。
在一个或多个实施方案中,式(V)化合物为人参皂苷Rg1,并且式(VI)化合物为三七皂苷R1(6-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-20-O-β-(D-吡喃葡萄糖基)-原人参三醇)(6-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-20-O-β-(D-glucopyranosyl)-protopanaxatriol)。
在一个或多个实施方案中,式(V)化合物为人参皂苷Rg1,并且式(VI)化合物为20-O-葡糖基人参皂苷Rf。
在一个或多个实施方案中,式(V)化合物为人参皂苷Rh1、并且式(VI)化合物为三七皂苷R2(6-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-原人参三醇)(6-O-β-(D-xylopyranosyl)-β-(D-glucopyranosyl)-protopanaxatriol)。
在一个或多个实施方案中,式(V)化合物为人参皂苷Rh1,并且式(VI)化合物为人参皂苷Rf。
在一个或多个实施方案中,所述的式(III)化合物为人参皂苷Rg1,并且式(IV)化合物为三七皂苷R3。
本发明另一方面提供一种体外糖基化方法,包括步骤:在糖基转移酶存在下,将糖基供体的糖基转移到四环三萜类化合物的糖基上,从而形成糖基化的四环三萜类化合物,其中,所述糖基转移酶包含:(a)SEQ ID NO:4、6、8、10、12、14、16、18中任一条或多条所示氨基酸序列;或(b)(a)的衍生多肽,所述衍生多肽选自以下多肽的一个或多个:(b1)将SEQ IDNO:4、6、8、10、12、14、16、18中任一条或多条添加标签序列、信号序列或分泌信号序列后形成的、并具有糖基转移酶活性的多肽;(b2)氨基酸序列与SEQ ID NO:4、6、8、10、12、14、16、18中任一条或多条中所示氨基酸序列的同源性至少80%,并具有糖基转移酶活性的多肽;(b3)将SEQ ID NO:4、6、8、10、12、14、16、18中任一条所示氨基酸序列的多肽经过一个或多个氨基酸残基的取代、缺失或添加而形成的,具有糖基转移酶活性的多肽。优选地,所述糖基供体选自以下的一种或多种:UDP-葡萄糖,UDP-半乳糖醛酸,UDP-半乳糖,UDP-阿拉伯糖,UDP-鼠李糖,UDP-木糖,或其他尿苷二磷酸己糖或尿苷二磷酸戊糖。
本发明另一方面还提供本文所述宿主细胞在制备糖基转移酶、催化试剂、或式(II)、(IV)、(VI)化合物中的用途。
本发明另一方面还提供生产糖基转移酶或式(II)、(IV)或(VI)化合物的方法,包括孵育本文所述的宿主细胞。
本发明另一方面还提供本文所述宿主细胞的用途,用于制备酶催化试剂,或产生糖基转移酶、或作为催化细胞、或产生式(II)、(IV)、(VI)化合物。
本发明另一方面提供一种产生转基因植物的方法,包括步骤:将本文所述宿主细胞再生为植物,其中所述宿主细胞为植物细胞。在一个或多个实施方案中,所述宿主细胞为人参细胞。在一个或多个实施方案中,所述宿主细胞为三七细胞。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示实施例1所示的以三七cDNA为模板扩增所得产物的DNA琼脂糖凝胶电泳检测结果。
图2通过Western Blot显示糖基转移酶在大肠杆菌中的表达情况。(A)PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20在大肠杆菌中的表达情况。对照,代表空载体pET28a大肠杆菌重组子的裂解液上清;Marker,代表蛋白质分子量标准;gGT29-7,代表糖基转移酶BL21-gGT29-7大肠杆菌重组子的裂解液上清;PNUGT29-17,代表BL21-PNUGT29-17大肠杆菌重组子的裂解液上清;PNUGT29-18,代表BL21-PNUGT29-18大肠杆菌重组子的裂解液上清;PNUGT29-19,代表BL21-PNUGT29-19大肠杆菌重组子的裂解液上清;PNUGT29-20,代表BL21-PNUGT29-20大肠杆菌重组子的裂解液上清。(B)PNUGT29-22、PNUGT29-23、PNUGT29-24在大肠杆菌中的表达情况。Marker,代表蛋白分子量标准;对照,代表空载体pET28a大肠杆菌重组子的裂解液上清;gGT29-32,BL21-gGT29-32大肠杆菌重组子的裂解液上清;gGT29-34,代表BL21-gGT29-34大肠杆菌重组子的裂解液上清;PNUGT29-21,代表BL21-PNUGT29-21大肠杆菌重组子的裂解液上清;PNUGT29-22,代表BL21-PNUGT29-22大肠杆菌重组子的裂解液上清;PNUGT29-23,代表BL21-PNUGT29-23大肠杆菌重组子的裂解液上清;PNUGT29-24,代表BL21-PNUGT29-24大肠杆菌重组子的裂解液上清。箭头所指为蛋白marker迁移后50kDa或45kDa、65kDa的位置。
图3显示糖基转移酶PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20催化以原人参三醇型人参皂苷Rh1为糖基受体,UDP-Glc为糖基供体的转糖基反应的TLC(A)和HPLC图谱(B)。对照,代表以pet28a空载体重组子的裂解液上清作为酶液;gGT29-7、PNUGT29-17、PNUGT29-18、PNUGT29-19和PNUGT29-20分别代表BL21-gGT29-7,BL21-PNUGT29-17,BL21-PNUGT29-18,BL21-PNUGT29-19和BL21-PNUGT29-20的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置。
图4显示PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20催化以原人参三醇型人参皂苷Rh1为糖基受体,UDP-Xyl为糖基供体的转糖基反应的TLC图谱(A)和HPLC图谱(B)。对照,代表以pet28a空载体重组子的裂解液上清作为酶液;gGT29-7、PNUGT29-17、PNUGT29-18、PNUGT29-19和PNUGT29-20分别代表BL21-gGT29-7,BL21-PNUGT29-17,BL21-PNUGT29-18,BL21-PNUGT29-19和BL21-PNUGT29-20的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置。
图5显示PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20催化以原人参三醇型人参皂苷Rh1为糖基受体,UDP-Rha为糖基供体的转糖基反应的TLC图谱(A)和HPLC图谱(B)。对照,代表以pet28a空载体重组子的裂解液上清作为酶液;gGT29-7、PNUGT29-17、PNUGT29-18、PNUGT29-19和PNUGT29-20分别代表BL21-gGT29-7,BL21-PNUGT29-17,BL21-PNUGT29-18,BL21-PNUGT29-19和BL21-PNUGT29-20的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置。
图6显示糖基转移酶PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24,以原人参二醇型人参皂苷Rd为糖基受体,UDP-Glc为糖基供体的转糖基反应的TLC图谱(A)和HPLC图谱(B)。对照代表以pet28a空载体重组子的裂解液上清作为酶液;gGT29-32、gGT29-34、PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24,分别代表BL21-gGT29-32,BL21-gGT29-34,BL21-PNUGT29-21,BL21-PNUGT29-22,BL21-PNUGT29-23和BL21-PNUGT29-24的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置。
图7显示糖基转移酶PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24,以原人参二醇型人参皂苷Rd为糖基受体,UDP-Xyl为糖基供体的转糖基反应的TLC图谱(A)和HPLC图谱(B)。对照,代表以pet28a空载体重组子的裂解液上清作为酶液;gGT29-32、gGT29-34、PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24,分别代表BL21-gGT29-32,BL21-gGT29-34,BL21-PNUGT29-21,BL21-PNUGT29-22,BL21-PNUGT29-23和BL21-PNUGT29-24的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置。
图8显示PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24,以原人参二醇型人参皂苷Rd为糖基受体,UDP-Rha为糖基供体的转糖基反应的TLC图谱(A)和HPLC(图谱)。对照代表以pet28a空载体重组子的裂解液上清作为酶液;gGT29-32、gGT29-34、PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24,分别代表BL21-gGT29-32,BL21-gGT29-34,BL21-PNUGT29-21,BL21-PNUGT29-22,BL21-PNUGT29-23和BL21-PNUGT29-24的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置。
图9显示PNUGT29-21、人参糖基转移酶gGT29-32(PCT/CN2018/087678)以及绞股蓝糖基转移酶lGpUGT23,分别以原人参二醇型人参皂苷Rd为糖基受体,UDPG为糖基供体的转糖基反应的TLC图谱。对照代表以pet28a空载体重组子的裂解液上清作为酶液;gGT29-32、PNUGT29-21和lGpUGT23,分别代表BL21-gGT29-32,BL21-PNUGT29-21,和BL21-lGpUGT23的裂解液上清作为酶液。箭头所指为皂苷标准品的迁移位置。
具体实施方式
本发明人经过广泛而深入的研究,首次提供了新的糖基转移酶、其相应的糖基转移催化位点。具体地,本发明的糖基转移酶PNUGT29-17(SEQ ID NO:4)、PNUGT29-18(SEQ IDNO:6)、PNUGT29-19(SEQ ID NO:8)、PNUGT29-20(SEQ ID NO:10)、PNUGT29-21(SEQ ID NO:12)、PNUGT29-22(SEQ ID NO:14)、PNUGT29-23(SEQ ID NO:16)、PNUGT29-24(SEQ ID NO:18)能特异和高效地催化四环三萜化合物底物的C-20位或C-6位在第一个糖基的羟基糖基化,以延伸糖链。
本发明的糖基转移酶特别能够分别将人参皂苷CK,DMG,F2,Rd,F1,Rh1和Rg1分别转化为具有其它活性的人参皂苷Rd、人参皂苷Rb1、人参皂苷Rb3、皂苷DMGG、皂苷DMGX、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、绞股蓝皂苷XIII、绞股蓝皂苷IX、三七皂苷U和、三七皂苷R1、和三七皂苷R2、三七皂苷R3、3-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-PPD;3-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-CK、20-O-葡糖基人参皂苷Rf、Rd-C20-O-Rha,人参皂苷Rg2和人参皂苷Re。
定义
如本文所用,术语“活性多肽”、“本发明的多肽及其衍生多肽”、“本发明的酶”、“糖基转移酶”可互换使用,均指PNUGT29-17(SEQ ID NO:4)、PNUGT29-18(SEQ ID NO:6)、PNUGT29-19(SEQ ID NO:8)、PNUGT29-20(SEQ ID NO:10)、PNUGT29-21(SEQ ID NO:12)、PNUGT29-22(SEQ ID NO:14)、PNUGT29-23(SEQ ID NO:16)、PNUGT29-24(SEQ ID NO:18)多肽或其衍生多肽。
如本文所用,“分离的多肽”或“活性多肽”是指所述多肽基本上不含天然与其相关的其它蛋白、脂类、糖类或其它物质。本领域的技术人员能用标准的蛋白质纯化技术纯化所述多肽。基本上纯的多肽在非还原聚丙烯酰胺凝胶上能产生单一的主带。所述多肽的纯度还可以用氨基酸序列进行进一步分析。
本发明的活性多肽可以是重组多肽、天然多肽、合成多肽。本发明的多肽可以是天然纯化的产物,或是化学合成的产物,或使用重组技术从原核或真核宿主(例如,细菌、酵母、植物)中产生。根据重组生产方案所用的宿主,本发明的多肽可以是糖基化的,或可以是非糖基化的。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。
本发明还包括所述多肽的片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持所述多肽相同的生物学功能或活性的多肽。
本发明的多肽片段、衍生物或类似物可以是(i)有一个或多个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,而这样的取代的氨基酸残基可以是也可以不是由遗传密码编码的,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)成熟多肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合到此多肽序列而形成的多肽(如前导序列或分泌序列或用来纯化此多肽的序列或蛋白原序列,或与抗原IgG片段的形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
术语“变体”或“突变体”是指与参照序列相比,通过一个或多个氨基酸的插入、缺失或取代使氨基酸序列发生变化但保留至少一种生物活性的肽或多肽。本文任一实施方案所述的突变体包括与参照序列(如本文所述的SEQ ID NO:3、5、7、9、11、13、15、17)具有至少70%,优选至少80%,优选至少85%,优选至少90%,优选至少95%,优选至少97%的序列相同性并保留参照序列的生物学活性(如作为糖基转移酶)的氨基酸序列。可采用例如NCBI的BLASTp计算两条比对的序列之间的序列相同性。突变体还包括在参照序列的氨基酸序列中具有一个或多个突变(插入、缺失或取代)、同时仍保留参照序列生物学活性的氨基酸序列。所述多个突变通常指1-10个以内,例如1-8个、1-5个或1-3个。取代优选是保守性取代。例如,在本领域中,用性能相近或相似的氨基酸进行保守性取代时,通常不会改变蛋白质或多肽的功能。“性能相近或相似的氨基酸”包括例如,具有相似侧链的氨基酸残基的家族,这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不带电荷的极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、具有β-分支侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)和具有芳香侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,在本发明多肽中用来自同一侧链类的另一氨基酸残基替换一个或几个位点,将不会在实质上影响其活性。
本文中,原人参二醇类皂苷包含人参皂苷Rb1、Rb2、Rb3、Rc、Rd、Rg3、Rh2和CK。原人参三醇类皂苷包含人参皂苷Re、Rg1、Rg2、Rh1。
本发明的活性多肽具有糖基转移酶活性,并且能够催化以下一种或多种反应:
(A)
其中,R1为H、单糖糖基或多糖糖基;R2为H或OH;R3为单糖糖基;R4为单糖糖基;所述的多肽选自SEQ ID NO:12、14、16、18或其衍生多肽。
在另一优选例中,所述的单糖包括葡萄糖(Glc)、鼠李糖(Rha)、乙酰基葡萄糖(Glc(6)Ac)、阿拉伯呋喃糖(Araf)、阿拉伯吡喃糖(Arap)或木糖(Xyl)等。
在另一优选例中,所述的多糖包括Glc(2-1)Glc、Glc(6-1)Glc、Glc(6)Ac、Glc(2-1)Rha、Glc(6-1)Arap、Glc(6-1)Xyl、Glc(6-1)Araf、Glc(3-1)Glc(3-1)、Glc(2-1)
Glu(6)Ac、Glc(6-1)Arap(4-1)Xyl、Glc(6-1)Arap(2-1)Xyl或Glc(6-1)Arap(3-1)Xyl等2-4个单糖组成的多糖。
R1-R4经取代后的化合物如下表所示:
/>
即当所述的R1为H,R2为OH,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷CK(CK);
当R1和R2都为H,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷DMG;
当R1为葡萄糖基,R2为OH,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷F2(F2);或
当R1为两个葡萄糖基,R2为OH,R3为葡萄糖基时,所述的式(I)化合物为人参皂苷Rd;
(B)
其中,R1为H,单糖糖基或多糖糖基,R2单糖糖基,R3为单糖糖基,所述的多肽选自SEQ ID NO:12、14、16、18或其衍生多肽;
R1-R3经取代后的化合物如下表所示:
底物 R1 R2 R3 产物
F1 H Glc Glc 三七皂苷U
Rg1 Glc Glc Glc 三七皂苷R3
即当R1为H时,R2为葡萄糖基时,所述的式(III)化合物为人参皂苷F1(F1);或当R1和R2为葡萄糖基时,所述的式(III)化合物为人参皂苷Rg1(Rg1);
(C)
其中,R1和R2为H或者糖基,R3和R4为糖基。所述的多肽选自SEQ ID NOs.:4、6、8、10或其衍生多肽;
R1-R4经取代后的化合物如下表所示:
底物 R1 R2 R3 R4 产物
Rg1 H Glc Glc Xyl 三七皂苷R1
Rg1 H Glc Glc Glc 20-O-葡糖基人参皂苷Rf
Rg1 H Glc Glc Rha 人参皂苷Re
Rh1 H H Glc Xyl 三七皂苷R2
Rh1 H H Glc Rha 人参皂苷Rg2
即当R1为H时,R2和R3为葡萄糖基时,所述的式(V)化合物为人参皂苷Rg1;
当R1和R2为H,R3为葡萄糖基时,所述的式(V)化合物为人参皂苷Rh1。
本文所述的多肽序列优选为如SEQ ID NO:4、6、8、10、12、14、16、18所示的多肽。该多肽还包括具有与所示多肽具有相同功能的、SEQ ID NO:4、6、8、10、12、14、16、18序列的变异形式及衍生多肽。这些变异形式包括(但并不限于):一个或多个(通常为1-50个,较佳地1-30个,更佳地1-20个,最佳地1-10个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加一个或数个(通常为20个以内,较佳地为10个以内,更佳地为5个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加一个或数个氨基酸通常也不会改变蛋白质的功能。该术语还包括人本发明多肽的活性片段和活性衍生物。本发明还提供所述多肽的类似物。这些类似物与天然本发明多肽多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。这些多肽包括天然或诱导的遗传变异体。诱导变异体可以通过各种技术得到,如通过辐射或暴露于诱变剂而产生随机诱变,还可通过定点诱变法或其他已知分子生物学的技术。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
本发明的PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20、PNUGT29-21、PNUGT29-22、PNUGT29-23、PNUGT29-24蛋白的氨基端或羧基端还可含有一个或多个多肽片段,作为蛋白标签。任何合适的标签都可以用于本发明。例如,所述的标签可以是FLAG、HA、HA1、c-Myc、Poly–His、Poly-Arg、Strep-TagII、AU1、EE、T7、4A6、ε、B、gE、以及Ty1。这些标签可用于对蛋白进行纯化。表1列出了其中的一些标签及其序列。
表1
标签 残基数 序列
Poly-Arg 5-6个(通常5个) RRRRR
Poly-His 2-10个(通常6个) HHHHHH
FLAG 8个 DYKDDDDK
Strep-TagII 8个 WSHPQFEK
C-myc 10个 WQKLISEEDL
GST 220个 后面6个LVPRGS
为了使翻译的蛋白分泌表达(如分泌到细胞外),还可在所述PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20、PNUGT29-21、PNUGT29-22、PNUGT29-23、PNUGT29-24的氨基酸氨基末端添加上信号肽序列,如pelB信号肽等。信号肽在多肽从细胞内分泌出来的过程中可被切去。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与SEQ ID NO:3、5、7、9、11、13、15、17所示的编码区序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO:4、6、8、10、12、14、16、18的蛋白质,但与SEQ ID NO:3、5、7、9、11、13、15、17分别所示的编码区序列有差别的核酸序列。
编码SEQ ID NO:4、6、8、10、12、14、16、18的成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。
术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。
本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码的多肽的功能。
本发明还涉及与上述的序列杂交且两个序列之间具有至少50%,较佳地至少70%,更佳地至少80%、85%、90%、95%相同性的多核苷酸。本发明特别涉及在严格条件(或严紧条件)下与本发明所述多核苷酸可杂交的多核苷酸。在本发明中,“严格条件”是指:(1)在较低离子强度和较高温度下的杂交和洗脱,如0.2×SSC,0.1%SDS,60℃;或(2)杂交时加有变性剂,如50%(v/v)甲酰胺,0.1%小牛血清/0.1%Ficoll,42℃等;或(3)仅在两条序列之间的相同性至少在90%以上,更好是95%以上时才发生杂交。并且,可杂交的多核苷酸编码的多肽与SEQ ID NO:4、6、8、10、12、14、16、18所示的成熟多肽有相同的生物学功能和活性。
本发明还涉及与上述的序列杂交的核酸片段。如本文所用,“核酸片段”的长度至少含15个核苷酸,较好是至少30个核苷酸,更好是至少50个核苷酸,最好是至少100个核苷酸以上。核酸片段可用于核酸的扩增技术(如PCR)以确定和/或分离编码PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20、PNUGT29-21、PNUGT29-22、PNUGT29-23、PNUGT29-24蛋白的多聚核苷酸。
本发明中的多肽和多核苷酸优选以分离的形式提供,更佳地被纯化至均质。
本发明的PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20、PNUGT29-21、PNUGT29-22、PNUGT29-23、PNUGT29-24核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。编码本发明蛋白(或其片段,或其衍生物)的DNA序列也可完全通过化学合成来获取。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。此外,还可通过化学合成将突变引入本发明氨基酸或核酸序列中。
应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。特别是很难从文库中得到全长的cDNA时,可优选使用RACE法(RACE-cDNA末端快速扩增法),用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
本发明也涉及核酸构建物,该核酸构建物含有本文所述的多核苷酸,以及与这些序列操作性连接的一个或多个调控序列或基因组同源重组所需的序列。本发明所述的多核苷酸可以多种方式被操作以保证所述多肽或蛋白的表达。在将核酸构建物插入载体之前可根据表达载体的不同或要求而对核酸构建物进行操作。利用重组DNA方法来改变多核苷酸序列的技术是本领域已知的。
在某些实施方案中,所述核酸构建物是载体。载体可以是克隆载体,也可以是表达载体,或者是基因敲入载体。本发明的多核苷酸可被克隆入许多类型的载体,例如,质粒、噬菌粒、噬菌体衍生物、动物病毒和粘粒。克隆载体可用于提供本发明蛋白或多肽的编码序列。表达载体可以以细菌载体或病毒载体形式提供给细胞。通常通过可操作地连接本发明的多核苷酸至启动子,并将构建体并入表达载体,实现本发明多核苷酸的表达。该载体对于复制和整合真核细胞可为合适的。典型的表达载体包含可用于调节期望核酸序列表达的表达控制序列。
基因敲入载体用于将本文所述多核苷酸序列整合到基因组的感兴趣区域。通常情况下,基因敲入载体除含有所述多核苷酸序列外,还可含有基因组同源重组所需的5’同源臂和3’同源臂。在一些实施方案中,本文的核酸构建物含有5’同源臂、本文所述多核苷酸序列和3’同源臂。在使用基因敲入载体时,可同时利用CRISPR/Cas9技术将多核苷酸序列同源重组到感兴趣的位置。CRISPR/Cas9技术通过设计针对目的基因的向导RNA从而引导Cas9核酸酶对插入位置的基因组进行修饰,造成该基因修饰区域同源重组效率增加,将包含在基因敲入载体中的目的片段同源重组到目的位点。本领域周知CRISPR/Cas9技术的步骤以及所用的试剂,例如Cas9核酸酶。
本领域的技术人员熟知的方法能用于构建核酸构建物。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。这些启动子的代表性例子有:大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
本发明的多核苷酸在高等真核细胞中表达时,如果在载体中插入增强子序列时将会使转录得到增强。增强子是DNA的顺式作用因子,通常大约有10到300个碱基对,作用于启动子以增强基因的转录。可举的例子包括在复制起始点晚期一侧的100到270个碱基对的SV40增强子、在复制起始点晚期一侧的多瘤增强子以及腺病毒增强子等。
通过常规的重组DNA技术,可利用本发明的多聚核苷酸序列表达或生产本文所述多肽。一般来说有以下步骤:(1)用本发明的编码PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20、PNUGT29-21、PNUGT29-22、PNUGT29-23、PNUGT29-24多肽的多核苷酸(或变异体),或用含有该多核苷酸的表达载体转化或转导合适的宿主细胞;(2)在合适的培养基中培养的宿主细胞;(3)从培养基或细胞中分离、纯化蛋白质。术语“重组表达载体”指本领域熟知的细菌质粒、噬菌体、酵母质粒、植物细胞病毒、哺乳动物细胞病毒如腺病毒、逆转录病毒或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,链霉菌属;鼠伤寒沙门氏菌的细菌细胞;真菌细胞如酵母;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。本领域一般技术人员都清楚如何选择适当的载体、启动子、增强子和宿主细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
本发明还提供构建转基因植物的方法,包括将含有本文所述多肽或多核苷酸的宿主细胞再生为植物,所述宿主细胞是植物细胞。本领域周知再生植物细胞的方法和试剂。
本发明还提供构建转基因植物的方法,包括用本文所述多核苷酸或核酸构建物转化植物,在植物的后代中通过杂交、筛选获得表达本文所述多肽、包含所述多核苷酸或包含所述核酸构建物的转基因阳性植物。本领域周知用核酸转化植物以及植物杂交和筛选转基因阳性植物的方法。
应用
本发明涉及的活性多肽或糖基转移酶可用于人工合成已知人参皂苷及新人参皂苷及其衍生物,能够将CK,DMG,F2,Rd,F1,Rh1和Rg1等分别转化为人参皂苷Rd、人参皂苷Rb1、人参皂苷Rb3、皂苷DMGG、皂苷DMGX、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、绞股蓝皂苷XIII、绞股蓝皂苷IX、三七皂苷U和、三七皂苷R1、和三七皂苷R2、三七皂苷R3、3-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-PPD、3-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-CK、20-O-葡糖基人参皂苷Rf、Rd-C20-O-Rha、人参皂苷Rg2和人参皂苷Re。
本发明的主要优点:
(1)本发明的糖基转移酶可以特异性和高效地将四环三萜化合物底物的C-20位的第一个糖基上/或C-6的第一个糖基上转入糖基以延伸糖链;
(2)本发明的糖基转移酶特别能够分别将CK,DMG,F2,Rd,F1,Rh1和Rg1转化为具有活性的人参皂苷Rd、人参皂苷Rb1、人参皂苷Rb3、皂苷DMGG、皂苷DMGX、绞股蓝皂苷LXXV、绞股蓝皂苷XVII、绞股蓝皂苷XIII、绞股蓝皂苷IX、三七皂苷U和、三七皂苷R1、和三七皂苷R2、三七皂苷R3、3-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-PPD、3-O-β-(D-吡喃木糖基)-β-(D-吡喃葡萄糖基)-CK、20-O-葡糖基人参皂苷Rf、Rd-C20-O-Rha、人参皂苷Rg2和人参皂苷Re。
(3)人参皂苷Rb1具有保护神经细胞和抗炎症抗氧化的功效;人参皂苷Rb3具有减缓心肌缺血和抗抑郁的功效。三七皂苷R1是三七皂苷的主要活性成分,具有抗炎的功效。三七皂苷R2具有神经保护功效。人参皂苷Re和Rg2防治神经退行性疾病的活性。
(4)催化效率高。与专利PCT/CN2015/081111和PCT/CN2018/087678披露的糖基转移酶相比,PNUGT29-17,PNUGT29-18,PNUGT29-19,PNUGT29-20以UDP-鼠李糖为糖基供体催化Rh1的C6位延伸糖链的活性至少提高了3.2倍(表5);PNUGT29-17,PNUGT29-18,PNUGT29-19,PNUGT29-20以UDP-葡萄糖为糖基供体催化Rh1的C6位延伸糖链的活性至少提高了1.6倍(表5)。PNUGT29-21,PNUGT29-22,PNUGT29-23和PNUGT29-24以UDP-葡萄糖为糖基供体催化Rd的C20位延伸糖链的活性至少提高了2.1倍(表6)。
实施例
实施例1,三七糖基转移酶及其编码基因的分离
提取三七RNA并进行反转录,获得三七的cDNA。以该cDNA为模板使用引物对1(SEQID NO:1和SEQ ID NO:2)或引物对2(SEQ ID NO:19和SEQ ID NO:20)或者引物对3(SEQ IDNO:21和SEQ ID NO:22)或者引物对4(SEQ ID NO:23和SEQ ID NO:24)进行PCR扩增,获得1.3-1.4kb的扩增产物。DNA聚合酶选用宝生物工程有限公司的高保真的DNA聚合酶PrimeSTAR PCR产物经琼脂糖凝胶电泳检测(图1)。
在紫外下照射,切下目标DNA条带。然后采用AxyPrep DNA Gel Extraction Kit(AXYGEN公司)从琼脂糖凝胶中回收DNA即为扩增出的DNA片段。将此DNA片段用宝生物工程有限公司的rTaq DNA聚合酶在末端加A后与市售的克隆载体pMD18-T Vector连接,连接产物转化实验室制备的大肠杆菌Top10感受态细胞,将转化后的大肠杆菌菌液涂布在添加氨苄青霉素100ug/mL的LB平板上,并进一步通过PCR和酶切验证重组克隆。分别选取其中若干个克隆提取重组质粒后进行测序,获得8个不同的核酸序列,分别命名为PNUGT29-17(SEQID NO:3)、PNUGT29-18(SEQ ID NO:5)、PNUGT29-19(SEQ ID NO:7)、PNUGT29-20(SEQ IDNO:9)、PNUGT29-21(SEQ ID NO:11)、PNUGT29-22(SEQ ID NO:13)、PNUGT29-23(SEQ ID NO:15)、PNUGT29-24(SEQ ID NO:17)。用Geneious软件寻找开放阅读框(ORF)。通过序列比对,ORF编码了糖基转移酶第1家族保守功能域PSPG盒,表明是糖基转移酶基因。所得蛋白质氨基酸序列PNUGT29-17(SEQ ID NO:4)、PNUGT29-18(SEQ ID NO.:6)、PNUGT29-19(SEQ IDNO:8)、PNUGT29-20(SEQ ID NO:10)、PNUGT29-21(SEQ ID NO:12)、PNUGT29-22(SEQ ID NO:14)、PNUGT29-23(SEQ ID NO:16)、PNUGT29-24(SEQ ID NO:18),具体信息见表2。
表2
实施例2,三七的糖基转移酶在大肠杆菌中表达
分别以实施例1构建的含有PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20、PNUGT29-21、PNUGT29-22、PNUGT29-23、PNUGT29-24基因的质粒PNUGT29-17-pMD18T、PNUGT29-18-pMD18T、PNUGT29-19-pMD18T、PNUGT29-20-pMD18T、PNUGT29-21-pMD18T、PNUGT29-22-pMD18T、PNUGT29-23-pMD18T、PNUGT29-24-pMD18T为模板,以表3所示扩增目标基因PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20、PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24。
表3
表达载体pET28a(购自Merck公司)用NcoI/SalI酶切后,将PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20、PNUGT29-21、PNUGT29-22、PNUGT29-23、PNUGT29-24克隆到pET28a中(一步法克隆试剂盒,购自诺维赞),分别构建大肠杆菌表达载体PNUGT29-17-pET28a,PNUGT29-18-pET28a,PNUGT29-19-pET28a,PNUGT29-20-pET28a,PNUGT29-21-pET28a,PNUGT29-22-pET28a,PNUGT29-23-pET28a和PNUGT29-24-pET28a表达载体。利用pET28a上的6×His tag序列使重组蛋白PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20、PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24的C末端分别带有6×His tag标签。质粒分别转化到市售的E.coli BL21中,构建重组菌株BL21-PNUGT29-17、BL21-PNUGT29-18、BL21-PNUGT29-19、BL21-PNUGT29-20、BL21-PNUGT29-21、BL21-PNUGT29-22、BL21-PNUGT29-23、和BL21-PNUGT29-24。接种一个重组子到LB培养基中,37℃ 200rpm培养至OD600约0.6-0.8,使菌液降温至4℃,加入终浓度为200μM的IPTG,18℃ 120rpm诱导表达16h。4℃离心收集菌体,超声破碎细胞,4℃ 12000g离心10min收集细胞裂解液上清,取样品进行western blot检测蛋白表达情况。抗6×His tag Western Blot(图2)表明,在45-55kD之间有明显条带,糖基转移酶PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20、PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24在大肠杆菌中均有可溶表达。
实施例3,糖基转移酶PNUGT29-17、PNUGT29-18、PNUGT29-19和PNUGT29-20体外转糖基活性和产物鉴定
以实施例2中重组大肠杆菌BL21-PNUGT29-17、BL21-PNUGT29-18、BL21-PNUGT29-19和BL21-PNUGT29-20的细胞裂解液上清为粗酶液来进行转糖基反应,转空载体pET28a重组大肠杆菌的细胞裂解液作为对照。选取专利PCT/CN2015/081111来源的人参糖基转移酶gGT29-7,作阳性对照。按照表4所呈现的反应体系进行体外转糖基化测试,35℃,反应过夜。
反应结果分别用薄层层析(TLC),高效液相色谱(HPLC)进行检测:
表4.酶活测定反应体系
如图3所示,以原人参三醇型人参皂苷Rh1为糖基受体,UDP-Glc为糖基供体,三七源PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20催化其生成Rf,且它们的催化效率均明显优于之前公开的糖基转移酶gGT29-7(PCT/CN2015/081111)的催化效果,并且HPLC的结果与TLC结果一致。因此,PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20和gGT29-7一样,能够催化Rh1的C6-O-Glc延伸一分子葡萄糖生成人参皂苷Rf。
如图4所示,以原人参三醇型人参皂苷Rh1为糖基受体,UDP-Xyl为糖基供体,PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20催化其生成R2,且它们的催化效率均明显优于之前公开的gGT29-7的催化效果,并且HPLC的结果与TLC结果一致。因此,PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20和gGT29-7一样,能够催化Rh1的C6-O-Glc延伸一分子木糖生成三七皂苷R2。
如图5所示,以原人参三醇型人参皂苷Rh1为糖基受体,UDP-Rha为糖基供体,gGT29-7和三七源PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20催化其生成Rg2,且三七来源的PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20均明显高于人参gGT29-7的催化效果,HPLC的结果与TLC结果一致。因此,三七源PNUGT29-17、PNUGT29-18、PNUGT29-19、PNUGT29-20和gGT29-7一样,能够催化Rh1的C6-O-Glc延伸一分子鼠李糖生成人参皂苷Rg2。
实施例4,糖基转移酶PNUGT29-22、PNUGT29-23和PNUGT29-24体外转糖基活性和产物鉴定
以实施例2中重组大肠杆菌BL21-PNUGT29-21、BL21-PNUGT29-22、BL21-PNUGT29-23、和BL21-PNUGT29-24的细胞裂解液上清为粗酶液来进行转糖基反应,转空载体pET28a重组大肠杆菌的细胞裂解液作为阴性对照。选取专利PCT/CN2018/087678来源的糖基转移酶gGT29-32,gGT29-34重组大肠杆菌的细胞裂解液作阳性对照。按照表4所呈现的反应体系进行体外转糖基化测试,35℃,反应过夜。反应结果分别用薄层层析(TLC),高效液相色谱(HPLC)进行检测。
如图6所示,以原人参二醇型人参皂苷Rd为糖基受体,UDP-Glc为糖基供体,PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24均催化其生成Rb1,且它们的催化效率均明显高于之前公开的糖基转移酶gGT29-32和gGT29-34的催化效果,且HPLC的结果与TLC结果一致。因此,PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24和之前公开的糖基转移酶gGT29-32和gGT29-34(PCT/CN2018/087678)一样,均催化Rd的C20-O-Glc延伸一分子葡萄糖生成人参皂苷Rb1。
如图7所示,以原人参二醇型人参皂苷Rd为糖基受体,UDP-Xyl为糖基供体,PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24均催化其生成Rb3,其中PNUGT29-22和PNUGT29-24催化效率比较低,且HPLC的结果与TLC结果一致。因此,三七来源的PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24和gGT29-32,之前公布的糖基转移酶gGT29-34一样,均催化Rd的C20-O-Glc延伸一分子木糖生成人参皂苷Rb3。
如图8所示,以原人参二醇型人参皂苷Rd为糖基受体,UDP-Rha为糖基供体,PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24均催化其生成Rd-C20-O-Rha,其中PNUGT29-22和PNUGT29-24催化效果微弱,且HPLC的结果与TLC结果一致。因此,三七来源的PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24和之前公布的糖基转移酶gGT29-32和gGT29-34一样,均催化Rd的C20-O-Glc延伸一分子鼠李糖生成人参皂苷Rd-C20-O-Rha。
实施例5,催化C6延伸的糖基转移酶的效率比较
将糖基转移酶PNUGT29-17、PNUGT29-18、PNUGT29-19和PNUGT29-20与目前已经公开的催化C6延伸的糖基转移酶gGT29-4,gGT29-5,gGT29-7,gGT29-7(N343G,A359P),gGT29-9,gGT29-11,gGT29-13,gGT29-17,gGT29-18,gGT29-24和gGT29-25的催化效率进行比较。按照实例2对这些糖基转移酶进行表达并制备粗酶液。按实施例3进行酶催化反应,其中反应时间为1小时,并用HPLC对产物进行定量测定。按以下公式进行催化效率的计算:
转化效率(%)=产物量/(底物量+产物量)
如表5显示,与专利PCT/CN2015/081111和PCT/CN2018/087678披露的糖基转移酶相比,PNUGT29-17,PNUGT29-18,PNUGT29-19,PNUGT29-20以UDP-鼠李糖为糖基供体催化Rh1的C6位延伸糖链的活性至少提高了3.2倍;PNUGT29-17,PNUGT29-18,PNUGT29-19,PNUGT29-20以UDP-葡萄糖为糖基供体催化Rh1的C6位延伸糖链的活性至少提高了1.6倍。
表5.催化C6位糖基延伸的糖基转移酶的催化效率比较
实施例6,催化C20延伸的糖基转移酶的效率比较
将本专利催化C20延伸的糖基转移酶PNUGT29-21、PNUGT29-22、PNUGT29-23和PNUGT29-24与目前已经公开的催化C20延伸的糖基转移酶gGT29-32,gGT29-34,gGT29-38,gGT29-39,gGT29-45,PNUGT29-1,PNUGT29-2,PNUGT29-3,PNUGT29-4,PNUGT29-5,PNUGT29-6,PNUGT29-7,PNUGT29-8,PNUGT29-9,PNUGT29-14和PNUGT29-15的催化效率进行比较。按照实例2对这些糖基转移酶进行表达并制备粗酶液。按实施例4进行酶催化反应,其中反应时间为1小时,并用HPLC对产物进行定量测定。按以下公式进行催化效率的计算:
转化效率(%)=产物量/(底物量+产物量)
如表6所示,与专利PCT/CN2018/087678披露的糖基转移酶相比,PNUGT29-21,PNUGT29-22,PNUGT29-23和PNUGT29-24以UDP-葡萄糖为糖基供体催化Rd的C20位延伸糖链的活性至少提高了2.1倍。
表6.催化C20位糖基延伸的糖基转移酶的转化效率比较
实施例7,绞股蓝糖基转移酶克隆,表达,以及活性比较
以绞股蓝cDNA为模板使用引物对(SEQ ID NO:41和SEQ ID NO:42)进行PCR扩增,获得1.3-1.4kb的扩增产物。将此DNA片段用宝生物工程有限公司的rTaq DNA聚合酶在末端加A后与市售的克隆载体pMD18-T Vector连接,连接产物转化实验室制备的大肠杆菌Top10感受态细胞,将转化后的大肠杆菌菌液涂布在添加氨苄青霉素100ug/mL的LB平板上,并进一步通过PCR和酶切验证重组克隆。分别选取其中若干个克隆提取重组质粒后进行测序,获得1个核酸序列,命名为lGpUGT23(SEQ ID NO:45),其氨基酸序列命名为lGpUGT23(SEQ IDNO:46)。
以上述构建的含有lGpUGT23基因的质粒lGpUGT23-pMD18T为模板,以引物对(SEQID NO:43和SEQ ID NO:44)扩增目标基因lGpUGT23。并将PCR产物连接至经NcoI/SalI酶切后的表达载体pET28a上(一步法克隆试剂盒,购自诺维赞),从而构建大肠杆菌表达载体lGpUGT23-pET28a表达载体。利用pET28a上的6×His tag序列使重组蛋白lGpUGT23的C末端分别带有6×His tag标签。质粒转化到市售的E.coli BL21中,构建重组菌株BL21-lGpUGT23。接种一个重组子到LB培养基中,37℃ 200rpm培养至OD600约0.6-0.8,使菌液降温至4℃,加入终浓度为200μM的IPTG,18℃ 120rpm诱导表达16h。4℃离心收集菌体,超声破碎细胞,4℃ 12000g离心10min收集细胞裂解液上清,取样品进行western blot检测证明糖基转移酶lGpUGT23可以在大肠杆菌中可溶表达。
以上述重组大肠杆菌BL21-lGpUGT23的细胞裂解液上清为粗酶液来进行转糖基反应,转空载体pET28a重组大肠杆菌的细胞裂解液作为对照。选取糖基转移酶gGT29-32(PCT/CN2018/087678)和实施例4中的糖基转移酶PNUGT29-21的重组大肠杆菌的细胞裂解液作阳性对照。按照表4所呈现的反应体系进行体外转糖基化测试。反应结果分别用薄层层析(TLC),高效液相色谱(HPLC)进行检测。
如图9所示,以原人参二醇型人参皂苷Rd为糖基受体,UDP-Glc为糖基供体时,PNUGT29-21、gGT29-32以及来自绞股蓝的lGpUGT23均催化Rd的C20-O-Glc延伸一分子葡萄糖生成人参皂苷Rb1。但lGpUGT23的催化效率明显低于PNUGT29-21和gGT29-32的催化效果。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 中国科学院上海生命科学研究院
<120> 糖基转移酶以及催化糖链延伸的方法
<130> 198710
<160> 46
<170> SIPOSequenceListing 1.0
<210> 1
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 1
atggataacc aagaagctag a 21
<210> 2
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 2
ctattgttca tctttcttct tc 22
<210> 3
<211> 1341
<212> DNA
<213> Artificial Sequence
<400> 3
atggataacc aagaaggtag aatcagtata gttatgctgc catttttagc ccatggccac 60
atttctccat tctttgagct agccaagcat ctctcaaaaa gaaattgtaa tatattcctc 120
tgttctaccc caatcaatct tagctccatc aagaacagaa tatctgataa ggattcctct 180
gcttctataa aactagtaga gcttcatctt ccatcttccc ctgatcttcc tcctcactac 240
cacaccacaa atggcctccc ttcccatctc atggtcccac tcagaaacgc ctttgaaaca 300
gcagccccca ccttctctga aatccttaaa accttaaacc ctgatttgct tatttatgat 360
ttcaatccct catgggcacc ggagatcgct tcgtctcaca atattccggc agtttgtttc 420
ataattgggg gagcagcctc cttttccatg agcctacata gtttcaaaaa cccaggtgaa 480
aaatacccat ttctagattt tgatgataac agtaatatta cccctgaacc accttcagca 540
gataacatga agttattact tgattttatg acttgtttcg aacgatcttg cgacattatt 600
ttgattaaga gttttagaga actagaaggg aaatattttg atttttattc tactttatct 660
gataaaactt tggttcctgt tggtccactc gttcaagatc ctatgggcca taatgaagat 720
ccaaaaacag agcagtttat aaactggctt gacaaaaggg ctgaatctac agtggtgttt 780
gtctgctttg gaagtgagta ttttctctcc aatgaggaat tggaagaagt agcaattggg 840
ctagagatta gcatggttaa tttcatatgg gctgtgagat taattgaagg agagaaaaaa 900
ggggttttac cagaggggtt tgttcaaagg gtaggagaca gaggattggt tgtggagggg 960
tgggctccac aggcaagaat tttaggacat tcaagcaccg gtgggtttgt gagccattgt 1020
gggtggagtt ctattacgga gagtatgaag tttggggttc cagtaattgc catggccagg 1080
cattttgatc agcctttgaa tgctaagctg gcggcggagg ttggtgtggg catggaggtt 1140
gtgagagatg aaaatgggaa gtataagaga gaagatattg caggggtaat aagaaaagtc 1200
gtggtggaga aaagtgggga ggttatgagg aggaaagcaa gggaattgag tgagaaaatg 1260
aaagagaaag gagaggaaga gattgatagg gcagtggagg agctagtaca aatttgtaag 1320
aagaagaaag atgaacaata g 1341
<210> 4
<211> 446
<212> PRT
<213> Artificial Sequence
<400> 4
Met Asp Asn Gln Glu Gly Arg Ile Ser Ile Val Met Leu Pro Phe Leu
1 5 10 15
Ala His Gly His Ile Ser Pro Phe Phe Glu Leu Ala Lys His Leu Ser
20 25 30
Lys Arg Asn Cys Asn Ile Phe Leu Cys Ser Thr Pro Ile Asn Leu Ser
35 40 45
Ser Ile Lys Asn Arg Ile Ser Asp Lys Asp Ser Ser Ala Ser Ile Lys
50 55 60
Leu Val Glu Leu His Leu Pro Ser Ser Pro Asp Leu Pro Pro His Tyr
65 70 75 80
His Thr Thr Asn Gly Leu Pro Ser His Leu Met Val Pro Leu Arg Asn
85 90 95
Ala Phe Glu Thr Ala Ala Pro Thr Phe Ser Glu Ile Leu Lys Thr Leu
100 105 110
Asn Pro Asp Leu Leu Ile Tyr Asp Phe Asn Pro Ser Trp Ala Pro Glu
115 120 125
Ile Ala Ser Ser His Asn Ile Pro Ala Val Cys Phe Ile Ile Gly Gly
130 135 140
Ala Ala Ser Phe Ser Met Ser Leu His Ser Phe Lys Asn Pro Gly Glu
145 150 155 160
Lys Tyr Pro Phe Leu Asp Phe Asp Asp Asn Ser Asn Ile Thr Pro Glu
165 170 175
Pro Pro Ser Ala Asp Asn Met Lys Leu Leu Leu Asp Phe Met Thr Cys
180 185 190
Phe Glu Arg Ser Cys Asp Ile Ile Leu Ile Lys Ser Phe Arg Glu Leu
195 200 205
Glu Gly Lys Tyr Phe Asp Phe Tyr Ser Thr Leu Ser Asp Lys Thr Leu
210 215 220
Val Pro Val Gly Pro Leu Val Gln Asp Pro Met Gly His Asn Glu Asp
225 230 235 240
Pro Lys Thr Glu Gln Phe Ile Asn Trp Leu Asp Lys Arg Ala Glu Ser
245 250 255
Thr Val Val Phe Val Cys Phe Gly Ser Glu Tyr Phe Leu Ser Asn Glu
260 265 270
Glu Leu Glu Glu Val Ala Ile Gly Leu Glu Ile Ser Met Val Asn Phe
275 280 285
Ile Trp Ala Val Arg Leu Ile Glu Gly Glu Lys Lys Gly Val Leu Pro
290 295 300
Glu Gly Phe Val Gln Arg Val Gly Asp Arg Gly Leu Val Val Glu Gly
305 310 315 320
Trp Ala Pro Gln Ala Arg Ile Leu Gly His Ser Ser Thr Gly Gly Phe
325 330 335
Val Ser His Cys Gly Trp Ser Ser Ile Thr Glu Ser Met Lys Phe Gly
340 345 350
Val Pro Val Ile Ala Met Ala Arg His Phe Asp Gln Pro Leu Asn Ala
355 360 365
Lys Leu Ala Ala Glu Val Gly Val Gly Met Glu Val Val Arg Asp Glu
370 375 380
Asn Gly Lys Tyr Lys Arg Glu Asp Ile Ala Gly Val Ile Arg Lys Val
385 390 395 400
Val Val Glu Lys Ser Gly Glu Val Met Arg Arg Lys Ala Arg Glu Leu
405 410 415
Ser Glu Lys Met Lys Glu Lys Gly Glu Glu Glu Ile Asp Arg Ala Val
420 425 430
Glu Glu Leu Val Gln Ile Cys Lys Lys Lys Lys Asp Glu Gln
435 440 445
<210> 5
<211> 1341
<212> DNA
<213> Artificial Sequence
<400> 5
atggataacc aagaagctag aatcagtata gttatgctgc catttttagc ccatggccac 60
atttctccat tctttgagct agccaagcat ctctcaaaaa gaaattgtaa tatattcctc 120
tgttctaccc caatcaatct tagctccatc aagaacagaa tatctgataa ggattcctct 180
gcttctataa aactagtaga gcttcatctt ccatcttccc ctgatcttcc tcctcactac 240
cacaccacaa atggcctccc ttcccatctc atggtcccac tcagaaacgc ctttgaaaca 300
gcagccccca ccttctctga aatccttaaa accttaaacc ctgatttgct tatttatgat 360
ttcaatccct catgggcacc ggagatcgct tcgtctcaca atattccggc agtttgtttc 420
ataattgggg gagcagcctc cttttccatg agcctacata gtttcaaaaa cccaggtgaa 480
aaatacccat ttctagattt tgatgataac agtaatatta cccctgaacc accttcagca 540
gataacatga agttattact tgattttatg acttgtttcg aacgatcttg cgacattatt 600
ttgattaaga gttttagaga actagaaggg aaatattttg atttttattc tactttatct 660
gataaaactt tggttcctgt tggtccactc gttcaagatc ctatgggcca taatgaagat 720
ccaaaaacag agcagtttat aaactggctt gacaaaaggg ctgaatctac agtggtgttt 780
gtctgctttg gaagtgagta ttttctctcc aatgaggaat tggaagaagt agcaattggg 840
ctagagatta gcatggttaa tttcatatgg gctgtgagat taattgaagg agagaaaaaa 900
ggggttttac cagaggggtt tgttcaaagg gtaggagaca gaggattggt tgtggagggg 960
tgggctccac aggcaagaat tttaggacat tcaagcaccg gtgggtttgt gagccattgt 1020
gggtggagtt ctattacgga gagtatgaag tttggggttc cagtaattgc catggccagg 1080
cattttgatc agcctttgaa tgctaagctg gcggcggagg ttggtgtggg catggaggtt 1140
gtgagagatg aaaatgggaa gtataagaga gaagatattg caggggtaat aagaaaagtc 1200
gtggtggaga aaagtgggga ggttatgagg aggaaagcaa gggaattgag tgagaaaatg 1260
aaagagaaag gagaggaaga gattgatagg gcagtggagg agctagtaca aatttgtaag 1320
aagaagaaag atgaacaata g 1341
<210> 6
<211> 446
<212> PRT
<213> Artificial Sequence
<400> 6
Met Asp Asn Gln Glu Ala Arg Ile Ser Ile Val Met Leu Pro Phe Leu
1 5 10 15
Ala His Gly His Ile Ser Pro Phe Phe Glu Leu Ala Lys His Leu Ser
20 25 30
Lys Arg Asn Cys Asn Ile Phe Leu Cys Ser Thr Pro Ile Asn Leu Ser
35 40 45
Ser Ile Lys Asn Arg Ile Ser Asp Lys Asp Ser Ser Ala Ser Ile Lys
50 55 60
Leu Val Glu Leu His Leu Pro Ser Ser Pro Asp Leu Pro Pro His Tyr
65 70 75 80
His Thr Thr Asn Gly Leu Pro Ser His Leu Met Val Pro Leu Arg Asn
85 90 95
Ala Phe Glu Thr Ala Ala Pro Thr Phe Ser Glu Ile Leu Lys Thr Leu
100 105 110
Asn Pro Asp Leu Leu Ile Tyr Asp Phe Asn Pro Ser Trp Ala Pro Glu
115 120 125
Ile Ala Ser Ser His Asn Ile Pro Ala Val Cys Phe Ile Ile Gly Gly
130 135 140
Ala Ala Ser Phe Ser Met Ser Leu His Ser Phe Lys Asn Pro Gly Glu
145 150 155 160
Lys Tyr Pro Phe Leu Asp Phe Asp Asp Asn Ser Asn Ile Thr Pro Glu
165 170 175
Pro Pro Ser Ala Asp Asn Met Lys Leu Leu Leu Asp Phe Met Thr Cys
180 185 190
Phe Glu Arg Ser Cys Asp Ile Ile Leu Ile Lys Ser Phe Arg Glu Leu
195 200 205
Glu Gly Lys Tyr Phe Asp Phe Tyr Ser Thr Leu Ser Asp Lys Thr Leu
210 215 220
Val Pro Val Gly Pro Leu Val Gln Asp Pro Met Gly His Asn Glu Asp
225 230 235 240
Pro Lys Thr Glu Gln Phe Ile Asn Trp Leu Asp Lys Arg Ala Glu Ser
245 250 255
Thr Val Val Phe Val Cys Phe Gly Ser Glu Tyr Phe Leu Ser Asn Glu
260 265 270
Glu Leu Glu Glu Val Ala Ile Gly Leu Glu Ile Ser Met Val Asn Phe
275 280 285
Ile Trp Ala Val Arg Leu Ile Glu Gly Glu Lys Lys Gly Val Leu Pro
290 295 300
Glu Gly Phe Val Gln Arg Val Gly Asp Arg Gly Leu Val Val Glu Gly
305 310 315 320
Trp Ala Pro Gln Ala Arg Ile Leu Gly His Ser Ser Thr Gly Gly Phe
325 330 335
Val Ser His Cys Gly Trp Ser Ser Ile Thr Glu Ser Met Lys Phe Gly
340 345 350
Val Pro Val Ile Ala Met Ala Arg His Phe Asp Gln Pro Leu Asn Ala
355 360 365
Lys Leu Ala Ala Glu Val Gly Val Gly Met Glu Val Val Arg Asp Glu
370 375 380
Asn Gly Lys Tyr Lys Arg Glu Asp Ile Ala Gly Val Ile Arg Lys Val
385 390 395 400
Val Val Glu Lys Ser Gly Glu Val Met Arg Arg Lys Ala Arg Glu Leu
405 410 415
Ser Glu Lys Met Lys Glu Lys Gly Glu Glu Glu Ile Asp Arg Ala Val
420 425 430
Glu Glu Leu Val Gln Ile Cys Lys Lys Lys Lys Asp Glu Gln
435 440 445
<210> 7
<211> 1341
<212> DNA
<213> Artificial Sequence
<400> 7
atggataacc aaaagggtag aatcagtata gttatgctgc catttttagc ccatggccac 60
atttctccat tctttgagct agccaagcat ctctcaaaaa gaaattgtaa tatattcctc 120
tgttctaccc caatcaatct tagctccatc aagaacagaa tatctgataa ggattcctct 180
gcttctataa aactagtaga gcttcatctt ccatcttccc ctgatcttcc tcctcactac 240
cacaccacaa atggcctccc ttcccatctc atggtcccac tcagaaacgc ctttgaaaca 300
gcagccccca ccttctctga aatccttaaa accttaaacc ctgatttgct tatttatgat 360
ttcaatccct catgggcacc ggagatcgct tcgtctcaca atattccggc agtttgtttc 420
ataattgggg gagcagcctc cttttccatg agcctacata gtttcaaaaa cccaggtgaa 480
aaatacccat ttctagattt tgatgataac agtaatatta cccctgaacc accttcagca 540
gataacatga agttattact tgattttatg acttgtttcg aacgatcttg cgacattatt 600
ttgattaaga gttttagaga actagaaggg aaatattttg atttttattc tactttatct 660
gataaaactt tggttcctgt tggtccactc gttcaagatc ctatgggcca taatgaagat 720
ccaaaaacag agcagtttat aaactggctt gacaaaaggg ctgaatctac agtggtgttt 780
gtctgctttg gaagtgagta ttttctctcc aatgaggaat tggaagaagt agcaattggg 840
ctagagatta gcatggttaa tttcatatgg gctgtgagat taattgaagg agagaaaaaa 900
ggggttttac cagaggggtt tgttcaaagg gtaggagaca gaggattggt tgtggagggg 960
tgggctccac aggcaagaat tttaggacat tcaagcaccg gtgggtttgt gagccattgt 1020
gggtggagtt ctattacgga gagtatgaag tttggggttc cagtaattgc catggccagg 1080
cattttgatc agcctttgaa tgctaagctg gcggcggagg ttggtgtggg catggaggtt 1140
gtgagagatg aaaatgggaa gtataagaga gaagatattg caggggtaat aagaaaagtc 1200
gtggtggaga aaagtgggga ggttatgagg aggaaagcaa gggaattgag tgagaaaatg 1260
aaagagaaag gagaggaaga gattgatagg gcagtggagg agctagtaca aatttgtaag 1320
aagaagaaag atgaacaata g 1341
<210> 8
<211> 446
<212> PRT
<213> Artificial Sequence
<400> 8
Met Asp Asn Gln Lys Gly Arg Ile Ser Ile Val Met Leu Pro Phe Leu
1 5 10 15
Ala His Gly His Ile Ser Pro Phe Phe Glu Leu Ala Lys His Leu Ser
20 25 30
Lys Arg Asn Cys Asn Ile Phe Leu Cys Ser Thr Pro Ile Asn Leu Ser
35 40 45
Ser Ile Lys Asn Arg Ile Ser Asp Lys Asp Ser Ser Ala Ser Ile Lys
50 55 60
Leu Val Glu Leu His Leu Pro Ser Ser Pro Asp Leu Pro Pro His Tyr
65 70 75 80
His Thr Thr Asn Gly Leu Pro Ser His Leu Met Val Pro Leu Arg Asn
85 90 95
Ala Phe Glu Thr Ala Ala Pro Thr Phe Ser Glu Ile Leu Lys Thr Leu
100 105 110
Asn Pro Asp Leu Leu Ile Tyr Asp Phe Asn Pro Ser Trp Ala Pro Glu
115 120 125
Ile Ala Ser Ser His Asn Ile Pro Ala Val Cys Phe Ile Ile Gly Gly
130 135 140
Ala Ala Ser Phe Ser Met Ser Leu His Ser Phe Lys Asn Pro Gly Glu
145 150 155 160
Lys Tyr Pro Phe Leu Asp Phe Asp Asp Asn Ser Asn Ile Thr Pro Glu
165 170 175
Pro Pro Ser Ala Asp Asn Met Lys Leu Leu Leu Asp Phe Met Thr Cys
180 185 190
Phe Glu Arg Ser Cys Asp Ile Ile Leu Ile Lys Ser Phe Arg Glu Leu
195 200 205
Glu Gly Lys Tyr Phe Asp Phe Tyr Ser Thr Leu Ser Asp Lys Thr Leu
210 215 220
Val Pro Val Gly Pro Leu Val Gln Asp Pro Met Gly His Asn Glu Asp
225 230 235 240
Pro Lys Thr Glu Gln Phe Ile Asn Trp Leu Asp Lys Arg Ala Glu Ser
245 250 255
Thr Val Val Phe Val Cys Phe Gly Ser Glu Tyr Phe Leu Ser Asn Glu
260 265 270
Glu Leu Glu Glu Val Ala Ile Gly Leu Glu Ile Ser Met Val Asn Phe
275 280 285
Ile Trp Ala Val Arg Leu Ile Glu Gly Glu Lys Lys Gly Val Leu Pro
290 295 300
Glu Gly Phe Val Gln Arg Val Gly Asp Arg Gly Leu Val Val Glu Gly
305 310 315 320
Trp Ala Pro Gln Ala Arg Ile Leu Gly His Ser Ser Thr Gly Gly Phe
325 330 335
Val Ser His Cys Gly Trp Ser Ser Ile Thr Glu Ser Met Lys Phe Gly
340 345 350
Val Pro Val Ile Ala Met Ala Arg His Phe Asp Gln Pro Leu Asn Ala
355 360 365
Lys Leu Ala Ala Glu Val Gly Val Gly Met Glu Val Val Arg Asp Glu
370 375 380
Asn Gly Lys Tyr Lys Arg Glu Asp Ile Ala Gly Val Ile Arg Lys Val
385 390 395 400
Val Val Glu Lys Ser Gly Glu Val Met Arg Arg Lys Ala Arg Glu Leu
405 410 415
Ser Glu Lys Met Lys Glu Lys Gly Glu Glu Glu Ile Asp Arg Ala Val
420 425 430
Glu Glu Leu Val Gln Ile Cys Lys Lys Lys Lys Asp Glu Gln
435 440 445
<210> 9
<211> 1341
<212> DNA
<213> Artificial Sequence
<400> 9
atggataacc aaaagggtag aatcaatata gttatgctgc catttttagc ccatggccac 60
atttctccat tctttgagct agccaagcat ctctcaaaaa gaaattgtaa tatattcctc 120
tgttctaccc caatcaatct tagctccatc aagaacagaa tatctgataa ggattcctct 180
gcttctataa aactagtaga gcttcatctt ccatcttccc ctgatcttcc tcctcactac 240
cacaccacaa atggcctccc ttcccatctc atggtcccac tcagaaacgc ctttgaaaca 300
gcagccccca ccttctctga aatccttaaa accttaaacc ctgatttgct tatttatgat 360
ttcaatccct catgggcacc ggagatcgct tcgtctcaca atattccggc agtttgtttc 420
ataattgggg gagcagcctc cttttccatg agcctacata gtttcaaaaa cccaggtgaa 480
aaatacccat ttctagattt tgatgataac agtaatatta cccctgaacc accttcagca 540
gataacatga agttattact tgattttatg acttgtttcg aacgatcttg cgacattatt 600
ttgattaaga gttttagaga actagaaggg aaatattttg atttttattc tactttatct 660
gataaaactt tggttcctgt tggtccactc gttcaagatc ctatgggcca taatgaagat 720
ccaaaaacag agcagtttat aaactggctt gacaaaaggg ctgaatctac agtggtgttt 780
gtctgctttg gaagtgagta ttttctctcc aatgaggaat tggaagaagt agcaattggg 840
ctagagatta gcatggttaa tttcatatgg gctgtgagat taattgaagg agagaaaaaa 900
ggggttttac cagaggggtt tgttcaaagg gtaggagaca gaggattggt tgtggagggg 960
tgggctccac aggcaagaat tttaggacat tcaagcaccg gtgggtttgt gagccattgt 1020
gggtggagtt ctattacgga gagtatgaag tttggggttc cagtaattgc catggccagg 1080
cattttgatc agcctttgaa tgctaagctg gcggcggagg ttggtgtggg catggaggtt 1140
gtgagagatg aaaatgggaa gtataagaga gaagatattg caggggtaat aagaaaagtc 1200
gtggtggaga aaagtgggga ggttatgagg aggaaagcaa gggaattgag tgagaaaatg 1260
aaagagaaag gagaggaaga gattgatagg gcagtggagg agctagtaca aatttgtaag 1320
aagaagaaag atgaacaata g 1341
<210> 10
<211> 446
<212> PRT
<213> Artificial Sequence
<400> 10
Met Asp Asn Gln Lys Gly Arg Ile Asn Ile Val Met Leu Pro Phe Leu
1 5 10 15
Ala His Gly His Ile Ser Pro Phe Phe Glu Leu Ala Lys His Leu Ser
20 25 30
Lys Arg Asn Cys Asn Ile Phe Leu Cys Ser Thr Pro Ile Asn Leu Ser
35 40 45
Ser Ile Lys Asn Arg Ile Ser Asp Lys Asp Ser Ser Ala Ser Ile Lys
50 55 60
Leu Val Glu Leu His Leu Pro Ser Ser Pro Asp Leu Pro Pro His Tyr
65 70 75 80
His Thr Thr Asn Gly Leu Pro Ser His Leu Met Val Pro Leu Arg Asn
85 90 95
Ala Phe Glu Thr Ala Ala Pro Thr Phe Ser Glu Ile Leu Lys Thr Leu
100 105 110
Asn Pro Asp Leu Leu Ile Tyr Asp Phe Asn Pro Ser Trp Ala Pro Glu
115 120 125
Ile Ala Ser Ser His Asn Ile Pro Ala Val Cys Phe Ile Ile Gly Gly
130 135 140
Ala Ala Ser Phe Ser Met Ser Leu His Ser Phe Lys Asn Pro Gly Glu
145 150 155 160
Lys Tyr Pro Phe Leu Asp Phe Asp Asp Asn Ser Asn Ile Thr Pro Glu
165 170 175
Pro Pro Ser Ala Asp Asn Met Lys Leu Leu Leu Asp Phe Met Thr Cys
180 185 190
Phe Glu Arg Ser Cys Asp Ile Ile Leu Ile Lys Ser Phe Arg Glu Leu
195 200 205
Glu Gly Lys Tyr Phe Asp Phe Tyr Ser Thr Leu Ser Asp Lys Thr Leu
210 215 220
Val Pro Val Gly Pro Leu Val Gln Asp Pro Met Gly His Asn Glu Asp
225 230 235 240
Pro Lys Thr Glu Gln Phe Ile Asn Trp Leu Asp Lys Arg Ala Glu Ser
245 250 255
Thr Val Val Phe Val Cys Phe Gly Ser Glu Tyr Phe Leu Ser Asn Glu
260 265 270
Glu Leu Glu Glu Val Ala Ile Gly Leu Glu Ile Ser Met Val Asn Phe
275 280 285
Ile Trp Ala Val Arg Leu Ile Glu Gly Glu Lys Lys Gly Val Leu Pro
290 295 300
Glu Gly Phe Val Gln Arg Val Gly Asp Arg Gly Leu Val Val Glu Gly
305 310 315 320
Trp Ala Pro Gln Ala Arg Ile Leu Gly His Ser Ser Thr Gly Gly Phe
325 330 335
Val Ser His Cys Gly Trp Ser Ser Ile Thr Glu Ser Met Lys Phe Gly
340 345 350
Val Pro Val Ile Ala Met Ala Arg His Phe Asp Gln Pro Leu Asn Ala
355 360 365
Lys Leu Ala Ala Glu Val Gly Val Gly Met Glu Val Val Arg Asp Glu
370 375 380
Asn Gly Lys Tyr Lys Arg Glu Asp Ile Ala Gly Val Ile Arg Lys Val
385 390 395 400
Val Val Glu Lys Ser Gly Glu Val Met Arg Arg Lys Ala Arg Glu Leu
405 410 415
Ser Glu Lys Met Lys Glu Lys Gly Glu Glu Glu Ile Asp Arg Ala Val
420 425 430
Glu Glu Leu Val Gln Ile Cys Lys Lys Lys Lys Asp Glu Gln
435 440 445
<210> 11
<211> 1344
<212> DNA
<213> Artificial Sequence
<400> 11
atggatatcg agaaaggtag aatcagtata gttatgctac catttttagc ccatggtcac 60
atatctccat tctttgagct agccaagcat ctctcaaaaa gaaattgcaa tatattcctc 120
tgttctaccc caatcaatct tagctccatc aagaacagag tatctgataa ggattcctct 180
gcttcaataa aactagtaga gcttcatctt ccatcttccc ctgatcttcc tcctcagtac 240
cacaccacaa atggcctccc ttcccatctc atggtcccac tcaaaaacgc ctttgaaaca 300
gtaggcccca ccttctctga aatccttaaa accttagacc ctgatttgct tatttatgat 360
ttcaatccct catgggcacc ggagatcgct ttgtctcaca atattccggc agtttatttc 420
ctaacctcgg cagcagccac ctcttccgtg gccctacgtg ctttgaaaaa cccaggtgaa 480
aaatacccat ttccagattt ttatgataac agtaatatta cccctgaacc accttctgca 540
gataaaatga agctatttca tgattttgtt gcttgtttca aacgatcttg cgacattatt 600
ttgattaaga gttttagaga actagaagga aaatatattg atttgctttc cactttatct 660
aagaaaactt tggttcctgt tggtccactc gttcaagatc ctatgggaca tgatgaagat 720
ccaaaaacag ggcatcttat aaactggctt gacaaaaggg ctgaatctac agtggtgttt 780
gtctgctttg gaagtgagta ttttccctcc aatgaggaat tggaagaagt agcaattggg 840
ctagagatta gcatggttaa tttcatattg gctgtgagat ttcttgaagg agagaaaaaa 900
ggggttttac cagaggggtt tgttcaaagg gtaggagaca gaggattggt tgtggagggt 960
tgggctccac aggcaagaat tttaggacat tcaagcaccg gtgggtttgt gagccattgt 1020
gggtggagtt ctattatgga gagtgtgaag tttggggttc cagtaattgc catggccagg 1080
catcttgatc agcctttgaa tgctaagctg gcggcggagg tcggtgtggg catggaggtt 1140
gtgagagatg aaaatgggaa gtataagaga gaagcgattg cagaggtaat aagaaaagtc 1200
gtgatggaga aaaatgggga ggttatcagg aggaaagcaa gggaattgag tgagaaaatg 1260
aaagagacag gagagcaaga gattggtagg gcagtggagg agctagtaca aatttgtaag 1320
atgaagaaag acgcacaata ttaa 1344
<210> 12
<211> 447
<212> PRT
<213> Artificial Sequence
<400> 12
Met Asp Ile Glu Lys Gly Arg Ile Ser Ile Val Met Leu Pro Phe Leu
1 5 10 15
Ala His Gly His Ile Ser Pro Phe Phe Glu Leu Ala Lys His Leu Ser
20 25 30
Lys Arg Asn Cys Asn Ile Phe Leu Cys Ser Thr Pro Ile Asn Leu Ser
35 40 45
Ser Ile Lys Ser Arg Val Ser Asp Lys Asp Ser Ser Ala Ser Ile Lys
50 55 60
Leu Val Glu Leu His Leu Pro Ser Ser Pro Asp Leu Pro Pro Gln Tyr
65 70 75 80
His Thr Thr Asn Gly Leu Pro Ser His Leu Met Val Pro Leu Lys Asn
85 90 95
Ala Phe Glu Thr Val Gly Pro Thr Phe Ser Glu Ile Leu Lys Thr Leu
100 105 110
Asp Pro Asp Leu Leu Ile Tyr Asp Phe Asn Pro Ser Trp Ala Pro Glu
115 120 125
Ile Ala Leu Ser His Asn Ile Pro Ala Val Tyr Phe Leu Thr Ser Ala
130 135 140
Ala Ala Thr Ser Ser Val Ala Leu Arg Ala Leu Lys Asn Pro Gly Glu
145 150 155 160
Lys Tyr Pro Phe Pro Asp Phe Tyr Asp Asn Ser Asn Ile Thr Pro Glu
165 170 175
Pro Pro Ser Ala Asp Lys Met Lys Leu Phe His Asp Phe Val Ala Cys
180 185 190
Phe Lys Arg Ser Cys Asp Ile Ile Leu Ile Lys Ser Phe Arg Glu Leu
195 200 205
Glu Gly Lys Tyr Ile Asp Leu Leu Ser Thr Leu Ser Lys Lys Thr Leu
210 215 220
Val Pro Val Gly Pro Leu Val Gln Asp Pro Leu Gly His Asp Glu Asp
225 230 235 240
Pro Lys Thr Gly His Leu Ile Asn Trp Leu Asp Lys Arg Ala Glu Ser
245 250 255
Thr Val Val Phe Val Cys Phe Gly Ser Glu Tyr Phe Pro Ser Asn Glu
260 265 270
Glu Leu Glu Glu Val Ala Ile Gly Leu Glu Ile Ser Met Val Asn Phe
275 280 285
Ile Leu Ala Val Arg Phe Leu Glu Gly Glu Lys Lys Gly Val Leu Pro
290 295 300
Glu Gly Phe Val Gln Arg Val Gly Asp Arg Gly Leu Val Val Glu Gly
305 310 315 320
Trp Ala Pro Gln Ala Arg Ile Leu Gly His Ser Ser Thr Gly Gly Phe
325 330 335
Val Ser His Cys Gly Trp Ser Ser Ile Met Glu Ser Val Lys Phe Gly
340 345 350
Val Pro Val Ile Ala Met Ala Arg His Leu Asp Gln Pro Leu Asn Ala
355 360 365
Lys Leu Ala Ala Glu Val Gly Val Gly Met Glu Val Val Arg Asp Glu
370 375 380
Asn Gly Lys Tyr Thr Arg Glu Ala Ile Ala Glu Val Ile Arg Lys Val
385 390 395 400
Val Met Glu Lys Asn Gly Glu Val Ile Arg Arg Lys Ala Arg Glu Leu
405 410 415
Ser Asp Lys Met Lys Glu Lys Gly Glu Gln Glu Ile Gly Arg Ala Val
420 425 430
Glu Glu Leu Val Gln Ile Cys Lys Met Lys Lys Asp Ala Gln Tyr
435 440 445
<210> 13
<211> 1344
<212> DNA
<213> Artificial Sequence
<400> 13
atggatatcg agaaaggtag aatcagtata gttatgctgc catttttagc ccatggtcac 60
atatctccat tttttgagct agccaagcat ctctcaaaaa gaaattgcaa tatattcctc 120
tgttctaccc caatcaatct tagctccatc aagaacagag tatctgataa ggattcctct 180
gcttctataa aactagtaga gcttcatctt ccatcttccc ctcatcttcc tcctcagtac 240
cacaccacaa atggcctccc ttcccatctc atggtcccac tcaaaaacgc ctttgaaaca 300
gtaggcccca ccttctctga aatccttaaa accttagacc ctgatttgct tatttatgat 360
ttcaatccct catgggcacc ggagatcgct ttgtctcaca atattccggc agtttatttc 420
ctaacctcgg cagcagccac ctcttccgtg gccctacgtg ctttgaaaaa cccaggtgaa 480
aaatacccat ttccagattt ttatgataac agtaatatta cccctgaacc accttctgca 540
gataaaatga agctatttca tgattttgtt gcttgtttca aacgatcttg cgacattatt 600
ttgattaaga gttttagaga actagaaggg aaatatattg atttgctttc cactttatct 660
aagaaaactt tggttcctgt tggtccactc gttcaagatc ctttgggaca tgatgaagat 720
ccaaaaacag ggcatcttat aaactggctt gacaaaaggg ctgaatctac agtggtgttt 780
gtctgctttg gaagtgagta ttttccctcc aatgaggaat tggaagaagt agcaattggg 840
ctagagatta gcatggttaa tttcatattg gctgtgagat ttcttgaagg agagaaaaca 900
ggggttttac cagaggggtt tgttcaaagg gtaggagaca gaggattggt tgtggagggg 960
tgggctccac aggcaagaat tttaggacat tcaagcaccg gtgggtttgt gagccattgt 1020
gggtggagtt ctattatgga gagtgtgaag tttggggttc cagtaattgc catggccagg 1080
catcttgatc agcctttgaa tgctaagctg gcggcggagg tcggtgtggg catggaggtt 1140
gtgagagatg aaaatgggaa gtataagaga gaagcgattg cagaggtaat aagaaaagtc 1200
gtgatggaga aaaatgggga ggttatcagg aggaaagcaa gggaattgag tgagaaaatg 1260
aaagagacag gagagcaaga gattggtagg gcagtggagg agctagtaca aatttgtaag 1320
atgaagaaag acgcacaata ttaa 1344
<210> 14
<211> 447
<212> PRT
<213> Artificial Sequence
<400> 14
Met Asp Ile Glu Lys Gly Arg Ile Ser Ile Val Met Leu Pro Phe Leu
1 5 10 15
Ala His Gly His Ile Ser Pro Phe Phe Glu Leu Ala Lys His Leu Ser
20 25 30
Lys Arg Asn Cys Asn Ile Phe Leu Cys Ser Thr Pro Ile Asn Leu Ser
35 40 45
Ser Ile Lys Asn Arg Val Ser Asp Lys Asp Ser Ser Ala Ser Ile Lys
50 55 60
Leu Val Glu Leu His Leu Pro Ser Ser Pro His Leu Pro Pro Gln Tyr
65 70 75 80
His Thr Thr Asn Gly Leu Pro Ser His Leu Met Val Pro Leu Lys Asn
85 90 95
Ala Phe Glu Thr Val Gly Pro Thr Phe Ser Glu Ile Leu Lys Thr Leu
100 105 110
Asp Pro Asp Leu Leu Ile Tyr Asp Phe Asn Pro Ser Trp Ala Pro Glu
115 120 125
Ile Ala Leu Ser His Asn Ile Pro Ala Val Tyr Phe Leu Thr Ser Ala
130 135 140
Ala Ala Thr Ser Ser Val Ala Leu Arg Ala Leu Lys Asn Pro Gly Glu
145 150 155 160
Lys Tyr Pro Phe Pro Asp Phe Tyr Asp Asn Ser Asn Ile Thr Pro Glu
165 170 175
Pro Pro Ser Ala Asp Lys Met Lys Leu Phe His Asp Phe Val Ala Cys
180 185 190
Phe Lys Arg Ser Cys Asp Ile Ile Leu Ile Lys Ser Phe Arg Glu Leu
195 200 205
Glu Gly Lys Tyr Ile Asp Leu Leu Ser Thr Leu Ser Lys Lys Thr Leu
210 215 220
Val Pro Val Gly Pro Leu Val Gln Asp Pro Leu Gly His Asp Glu Asp
225 230 235 240
Pro Lys Thr Gly His Leu Ile Asn Trp Leu Asp Lys Arg Ala Glu Ser
245 250 255
Thr Val Val Phe Val Cys Phe Gly Ser Glu Tyr Phe Pro Ser Asn Glu
260 265 270
Glu Leu Glu Glu Val Ala Ile Gly Leu Glu Ile Ser Met Val Asn Phe
275 280 285
Ile Leu Ala Val Arg Phe Leu Glu Gly Glu Lys Thr Gly Val Leu Pro
290 295 300
Glu Gly Phe Val Gln Arg Val Gly Asp Arg Gly Leu Val Val Glu Gly
305 310 315 320
Trp Ala Pro Gln Ala Arg Ile Leu Gly His Ser Ser Thr Gly Gly Phe
325 330 335
Val Ser His Cys Gly Trp Ser Ser Ile Met Glu Ser Val Lys Phe Gly
340 345 350
Val Pro Val Ile Ala Met Ala Arg His Leu Asp Gln Pro Leu Asn Ala
355 360 365
Lys Leu Ala Ala Glu Val Gly Val Gly Met Glu Val Val Arg Asp Glu
370 375 380
Asn Gly Lys Tyr Lys Arg Glu Ala Ile Ala Glu Val Ile Arg Lys Val
385 390 395 400
Val Met Glu Lys Asn Gly Glu Val Ile Arg Arg Lys Ala Arg Glu Leu
405 410 415
Ser Glu Lys Met Lys Glu Thr Gly Glu Gln Glu Ile Gly Arg Ala Val
420 425 430
Glu Glu Leu Val Gln Ile Cys Lys Met Lys Lys Asp Ala Gln Tyr
435 440 445
<210> 15
<211> 1344
<212> DNA
<213> Artificial Sequence
<400> 15
atggatatcg agaaaggtag aatcagtata gttatgctac catttttagc ccatggtcac 60
atatctccat tctttgagct agccaagcat ctctcaaaaa gaaattgcaa tatattcctc 120
tgttctaccc caatcaatct tagctccatc aagaacagag tatctgataa ggattcctct 180
gcttcaataa aactagtaga gcttcatctt ccatcttccc ctgatcttcc tcctcagtac 240
cacaccacaa atggcctccc ttcccatctc atggtcccac tcaaaaacgc ctttgaaaca 300
gtaggcccca ccttctctga aatccttaaa accttagacc ctgatttgct tatttatgat 360
ttcaatccct catgggcacc ggagatcgct ttgtctcaca atattccggc agtttatttc 420
ctaacctcgg cagcagccac ctcttccgtg gccctacgtg ctttgaaaaa cccaggtgaa 480
aaatacccat ttccagattt ttatgataac agtaatatta cccctgaacc accttctgca 540
gataaaatga agctatttca tgattttgtt gcttgtttca aacgatcttg cgacattatt 600
ttgattaaga gttttagaga actagaaggg aaatatattg atttgctttc cactttatct 660
aagaaaactt tggttcctgt tggtccactc gttcaagatc ctttgggaca tgatgaagat 720
ccaaaaacag ggcatcttat aaactggctt gacaaaaggg ctgaatctac agtggtgttt 780
gtctgctttg gaagtgagta ttttccctcc aatgaggaat tggaagaagt agcaattggg 840
ctagagatta gcatggttaa tttcatattg gctgtgagat ttcttgaagg agagaaaaaa 900
ggggttttac cagaggggtt tgttcaaagg gtaggagaca gaggattggt tgtggagggg 960
tgggctccac aggcaagaat tttaggacat tcaagcaccg gtgggtttgt gagccattgt 1020
gggtggagtt ctattatgga gagtgtgaag tttggggttc cagtaattgc catggccagg 1080
catcttgatc agcctttgaa tgctaagctg gcggcggagg tcggtgtggg catggaggtt 1140
gtgagagatg aaaatgggaa gtataagaga gaagcgattg cagaggtaat aagaaaagtc 1200
gtgatggaga aaaatgggga ggttatcagg aggaaagcaa gggaattgag tgagaaaatg 1260
aaagagacag gagaggaaga gattggtagg gcagtggagg agctagtaca aatttgtaag 1320
atgaagaaag acgcacaata ttaa 1344
<210> 16
<211> 447
<212> PRT
<213> Artificial Sequence
<400> 16
Met Asp Ile Glu Lys Gly Arg Ile Ser Ile Val Met Leu Pro Phe Leu
1 5 10 15
Ala His Gly His Ile Ser Pro Phe Phe Glu Leu Ala Lys His Leu Ser
20 25 30
Lys Arg Asn Cys Asn Ile Phe Leu Cys Ser Thr Pro Ile Asn Leu Ser
35 40 45
Ser Ile Lys Asn Arg Val Ser Asp Lys Asp Ser Ser Ala Ser Ile Lys
50 55 60
Leu Val Glu Leu His Leu Pro Ser Ser Pro Asp Leu Pro Pro Gln Tyr
65 70 75 80
His Thr Thr Asn Gly Leu Pro Ser His Leu Met Val Pro Leu Lys Asn
85 90 95
Ala Phe Glu Thr Val Gly Pro Thr Phe Ser Glu Ile Leu Lys Thr Leu
100 105 110
Asp Pro Asp Leu Leu Ile Tyr Asp Phe Asn Pro Ser Trp Ala Pro Glu
115 120 125
Ile Ala Leu Ser His Asn Ile Pro Ala Val Tyr Phe Leu Thr Ser Ala
130 135 140
Ala Ala Thr Ser Ser Val Ala Leu Arg Ala Leu Lys Asn Pro Gly Glu
145 150 155 160
Lys Tyr Pro Phe Pro Asp Phe Tyr Asp Asn Ser Asn Ile Thr Pro Glu
165 170 175
Pro Pro Ser Ala Asp Lys Met Lys Leu Phe His Asp Phe Val Ala Cys
180 185 190
Phe Lys Arg Ser Cys Asp Ile Ile Leu Ile Lys Ser Phe Arg Glu Leu
195 200 205
Glu Gly Lys Tyr Ile Asp Leu Leu Ser Thr Leu Ser Lys Lys Thr Leu
210 215 220
Val Pro Val Gly Pro Leu Val Gln Asp Pro Leu Gly His Asp Glu Asp
225 230 235 240
Pro Lys Thr Gly His Leu Ile Asn Trp Leu Asp Lys Arg Ala Glu Ser
245 250 255
Thr Val Val Phe Val Cys Phe Gly Ser Glu Tyr Phe Pro Ser Asn Glu
260 265 270
Glu Leu Glu Glu Val Ala Ile Gly Leu Glu Ile Ser Met Val Asn Phe
275 280 285
Ile Leu Ala Val Arg Phe Leu Glu Gly Glu Lys Lys Gly Val Leu Pro
290 295 300
Glu Gly Phe Val Gln Arg Val Gly Asp Arg Gly Leu Val Val Glu Gly
305 310 315 320
Trp Ala Pro Gln Ala Arg Ile Leu Gly His Ser Ser Thr Gly Gly Phe
325 330 335
Val Ser His Cys Gly Trp Ser Ser Ile Met Glu Ser Val Lys Phe Gly
340 345 350
Val Pro Val Ile Ala Met Ala Arg His Leu Asp Gln Pro Leu Asn Ala
355 360 365
Lys Leu Ala Ala Glu Val Gly Val Gly Met Glu Val Val Arg Asp Glu
370 375 380
Asn Gly Lys Tyr Lys Arg Glu Ala Ile Ala Glu Val Ile Arg Lys Val
385 390 395 400
Val Met Glu Lys Asn Gly Glu Val Ile Arg Arg Lys Ala Arg Glu Leu
405 410 415
Ser Glu Lys Met Lys Glu Thr Gly Glu Glu Glu Ile Gly Arg Ala Val
420 425 430
Glu Glu Leu Val Gln Ile Cys Lys Met Lys Lys Asp Ala Gln Tyr
435 440 445
<210> 17
<211> 1344
<212> DNA
<213> Artificial Sequence
<400> 17
atggatatcg aaaaaggtag aatcagtata gttatgctgc catttttagc ccatggtcac 60
atatctccat tctttgagct agccaagcat ctctcaaaaa gaaattgcaa tatattcctc 120
tgttctaccc caatcaatct tagctccatc aagaacagag tatctgataa ggattcctct 180
gcttctataa aactagtaga gcttcatctt ccatcttccc ctgatcttcc tcctcagtac 240
cacaccacaa atggcctccc ttcccatctc atggtcccac tcaaaaacgc ctttgaaaca 300
gtaggcccca ccttctctga aatccttaaa accttagacc ctgatttgct tatttatgat 360
ttcaatccct catgggcacc ggagatcgct ttgtctcaca atattccggc agtttatttc 420
ctaacctcgg cagcagccac ctcttccgtg gccctacgtg ctttgaaaaa cccaggtgaa 480
aaatacccat ttccagattt ttatgataac agtaatatta cccctgaacc accttctgca 540
gataaaatga agctatttca tgattttgtt gcttgtttca aacgatcttg cgacattatt 600
ttgattaaga gttttagaga actagaaggg aaatatattg atttgctttc cactttatct 660
aagaaaactt tggttcctgt tggtccactc gttcaagatc ctttgggaca tgatgaagat 720
ccaaaaacag ggcatcttat aaactggctt gacaaaaggg ctgaatctac agtggtgttt 780
gtctgctttg gaagtgagta ttttccctcc aatgaggaat tggaagaagt agcaattggg 840
ctagagatta gcatggttaa tttcatattg gctgttagat ttcttgaagg agagaaaaaa 900
ggggttttac cagaagggtt tgttcaaagg gtaggagaca gaggattggt tgtggagggg 960
tgggctccac aggcaagaat tttaggacat tcaagccccg gtgggtttgt gagccattgt 1020
gggtggagtt ttattatgga gagtgtgaag tttggggttc cagtaattgc catggccagg 1080
catcttgatc agcctttgaa tgctaagctg gcggcggagg ttggtgtggg catggaggtt 1140
gtgagagatg aaaatgggaa gtatacgaga gaagcgattg cagaggtaat aagaaaagtt 1200
gtgatggaga aaaatgggga ggttatcagg aggaaagcaa gggaattgag tgataaaatg 1260
aaagagaaag gagagcaaga gattggtagg gcagtggagg agctagtaca aatttgtaag 1320
atgaagaaag acgcacaata ttaa 1344
<210> 18
<211> 447
<212> PRT
<213> Artificial Sequence
<400> 18
Met Asp Ile Glu Lys Gly Arg Ile Ser Ile Val Met Leu Pro Phe Leu
1 5 10 15
Ala His Gly His Ile Ser Pro Phe Phe Glu Leu Ala Lys His Leu Ser
20 25 30
Lys Arg Asn Cys Asn Ile Phe Leu Cys Ser Thr Pro Ile Asn Leu Ser
35 40 45
Ser Ile Lys Asn Arg Val Ser Asp Lys Asp Ser Ser Ala Ser Ile Lys
50 55 60
Leu Val Glu Leu His Leu Pro Ser Ser Pro Asp Leu Pro Pro Gln Tyr
65 70 75 80
His Thr Thr Asn Gly Leu Pro Ser His Leu Met Val Pro Leu Lys Asn
85 90 95
Ala Phe Glu Thr Val Gly Pro Thr Phe Ser Glu Ile Leu Lys Thr Leu
100 105 110
Asp Pro Asp Leu Leu Ile Tyr Asp Phe Asn Pro Ser Trp Ala Pro Glu
115 120 125
Ile Ala Leu Ser His Asn Ile Pro Ala Val Tyr Phe Leu Thr Ser Ala
130 135 140
Ala Ala Thr Ser Ser Val Ala Leu Arg Ala Leu Lys Asn Pro Gly Glu
145 150 155 160
Lys Tyr Pro Phe Pro Asp Phe Tyr Asp Asn Ser Asn Ile Thr Pro Glu
165 170 175
Pro Pro Ser Ala Asp Lys Met Lys Leu Phe His Asp Phe Val Ala Cys
180 185 190
Phe Lys Arg Ser Cys Asp Ile Ile Leu Ile Lys Ser Phe Arg Glu Leu
195 200 205
Glu Gly Lys Tyr Ile Asp Leu Leu Ser Thr Leu Ser Lys Lys Thr Leu
210 215 220
Val Pro Val Gly Pro Leu Val Gln Asp Pro Leu Gly His Asp Glu Asp
225 230 235 240
Pro Lys Thr Gly His Leu Ile Asn Trp Leu Asp Lys Arg Ala Glu Ser
245 250 255
Thr Val Val Phe Val Cys Phe Gly Ser Glu Tyr Phe Pro Ser Asn Glu
260 265 270
Glu Leu Glu Glu Val Ala Ile Gly Leu Glu Ile Ser Met Val Asn Phe
275 280 285
Ile Leu Ala Val Arg Phe Leu Glu Gly Glu Lys Lys Gly Val Leu Pro
290 295 300
Glu Gly Phe Val Gln Arg Val Gly Asp Arg Gly Leu Val Val Glu Gly
305 310 315 320
Trp Ala Pro Gln Ala Arg Ile Leu Gly His Ser Ser Pro Gly Gly Phe
325 330 335
Val Ser His Cys Gly Trp Ser Phe Ile Met Glu Ser Val Lys Phe Gly
340 345 350
Val Pro Val Ile Ala Met Ala Arg His Leu Asp Gln Pro Leu Asn Ala
355 360 365
Lys Leu Ala Ala Glu Val Gly Val Gly Met Glu Val Val Arg Asp Glu
370 375 380
Asn Gly Lys Tyr Thr Arg Glu Ala Ile Ala Glu Val Ile Arg Lys Val
385 390 395 400
Val Met Glu Lys Asn Gly Glu Val Ile Arg Arg Lys Ala Arg Glu Leu
405 410 415
Ser Asp Lys Met Lys Glu Lys Gly Glu Gln Glu Ile Gly Arg Ala Val
420 425 430
Glu Glu Leu Val Gln Ile Cys Lys Met Lys Lys Asp Ala Gln Tyr
435 440 445
<210> 19
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 19
atggataacc aagaaggtag a 21
<210> 20
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 20
ctattgttca tctttcttct tc 22
<210> 21
<211> 20
<212> DNA
<213> Artificial Sequence
<400> 21
atggatatcg agaaaggtag 20
<210> 22
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 22
ttaatattgt gcgtctttct tc 22
<210> 23
<211> 21
<212> DNA
<213> Artificial Sequence
<400> 23
atggatatcg aaaaaggtag a 21
<210> 24
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 24
ttaatattgt gcgtctttct tc 22
<210> 25
<211> 41
<212> DNA
<213> Artificial Sequence
<400> 25
actttaagaa ggagatatac catggataac caagaaggta g 41
<210> 26
<211> 39
<212> DNA
<213> Artificial Sequence
<400> 26
gcggccgcaa gcttgtcgac ttgttcatct ttcttcttc 39
<210> 27
<211> 41
<212> DNA
<213> Artificial Sequence
<400> 27
actttaagaa ggagatatac catggataac caagaagcta g 41
<210> 28
<211> 39
<212> DNA
<213> Artificial Sequence
<400> 28
gcggccgcaa gcttgtcgac ttgttcatct ttcttcttc 39
<210> 29
<211> 41
<212> DNA
<213> Artificial Sequence
<400> 29
actttaagaa ggagatatac catggataac caaaagggta g 41
<210> 30
<211> 39
<212> DNA
<213> Artificial Sequence
<400> 30
gcggccgcaa gcttgtcgac ttgttcatct ttcttcttc 39
<210> 31
<211> 41
<212> DNA
<213> Artificial Sequence
<400> 31
actttaagaa ggagatatac catggataac caaaagggta g 41
<210> 32
<211> 39
<212> DNA
<213> Artificial Sequence
<400> 32
gcggccgcaa gcttgtcgac ttgttcatct ttcttcttc 39
<210> 33
<211> 41
<212> DNA
<213> Artificial Sequence
<400> 33
actttaagaa ggagatatac catggatatc gagaaaggta g 41
<210> 34
<211> 39
<212> DNA
<213> Artificial Sequence
<400> 34
gcggccgcaa gcttgtcgac atattgtgcg tctttcttc 39
<210> 35
<211> 41
<212> DNA
<213> Artificial Sequence
<400> 35
actttaagaa ggagatatac catggatatc gagaaaggta g 41
<210> 36
<211> 39
<212> DNA
<213> Artificial Sequence
<400> 36
gcggccgcaa gcttgtcgac atattgtgcg tctttcttc 39
<210> 37
<211> 41
<212> DNA
<213> Artificial Sequence
<400> 37
actttaagaa ggagatatac catggatatc gagaaaggta g 41
<210> 38
<211> 39
<212> DNA
<213> Artificial Sequence
<400> 38
gcggccgcaa gcttgtcgac atattgtgcg tctttcttc 39
<210> 39
<211> 41
<212> DNA
<213> Artificial Sequence
<400> 39
actttaagaa ggagatatac catggatatc gaaaaaggta g 41
<210> 40
<211> 39
<212> DNA
<213> Artificial Sequence
<400> 40
gcggccgcaa gcttgtcgac atattgtgcg tctttcttc 39
<210> 41
<211> 24
<212> DNA
<213> Artificial Sequence
<400> 41
atgaagaaaa ttttgatgtt tcca 24
<210> 42
<211> 22
<212> DNA
<213> Artificial Sequence
<400> 42
ttatattttt gcttgacaaa gc 22
<210> 43
<211> 44
<212> DNA
<213> Artificial Sequence
<400> 43
ctttaagaag gagatatacc atgaagaaaa ttttgatgtt tcca 44
<210> 44
<211> 41
<212> DNA
<213> Artificial Sequence
<400> 44
cgagtgcggc cgcaagcttt tatatttttg cttgacaaag c 41
<210> 45
<211> 1350
<212> DNA
<213> Artificial Sequence
<400> 45
atgaagaaaa ttttgatgtt tccatggttg gcttttggcc atatctcacc atttctagag 60
atggcaaaga ggctgtctaa gttcaatttt cacatttaca tttgttcttc accaataaac 120
cttcaatcca ttaaaccaaa actctcagat gaatattctt cttccattga attgatagag 180
attcatcttc catctttacc agatcttcct cctcacttgc acactaccaa tggcttatct 240
tctcatttaa tgccaacttt gttgaaagcc tttgacatgt ctgccccaga attcaccacc 300
attttacata atcttaaacc agatttactc atcaatgaca ttttacaacc atgggctact 360
caaatagctt cctccctcaa tatccctgtt actcatttca ttatagctgg tgttattact 420
ctcggttttg ctctccagtc tcacaatcct gaaatcccga taccggacgt ggatctgggt 480
tatcactggt tcttcaagaa gatgataaat tcaggagctt ctgaagaacc agattccgat 540
tataatttga atcgcttgtg gaaaacctta gttggtttag gacatttatc aaacaccatt 600
cttgcaaaca cttttactga attagaaagt gatcacatca attatctctc tctgttgtta 660
aacaagaagg ttcttccaat tggaccttta gttcagaaac tcacctcaat tccaaatcca 720
aacgacgaag aaaagaaacc agaaccccta gaatggcttg ataagaaaag ccctaaatca 780
acagtttacg tttcgtttgg gagcgaatgt tacctttcga aagaggacat ggaagagcta 840
gcacatggat tagaacaaag cggggcgaat ttcatatggg taattagatt tccgaaagga 900
gaaaagaaaa cgatgagaga tgaattaccg gaaggttatt tagaaagagt tggagaaaga 960
gggatggtaa ttgaaggatg ggcaccacag atgagaattc tagagcattc tagcgtcgga 1020
gggttcgtca gtcattgtgg atggaattca atggcggaag cggcggtgat aggagtaccg 1080
atcatcgctt taccgatgca gcttgatcag ccatggaatg ggaaaattgc agaacaatgc 1140
ggcattggtg tggtggcgaa gagaggggaa gaaggagaaa taatgagaga ggaaataagg 1200
gaagtcatta aagaagtggt gtttgaagaa aaaggagaga aaatgagaaa gaaagtgaaa 1260
gagattagtg cagtgttgaa ggagaaagag ggtgaaatca cagatgggtt ggtgaatgag 1320
ttgaatttgc tttgtcaagc aaaaatataa 1350
<210> 46
<211> 449
<212> PRT
<213> Artificial Sequence
<400> 46
Met Lys Lys Ile Leu Met Phe Pro Trp Leu Ala Phe Gly His Ile Ser
1 5 10 15
Pro Phe Leu Glu Met Ala Lys Arg Leu Ser Lys Phe Asn Phe His Ile
20 25 30
Tyr Ile Cys Ser Ser Pro Ile Asn Leu Gln Ser Ile Lys Pro Lys Leu
35 40 45
Ser Asp Glu Tyr Ser Ser Ser Ile Glu Leu Ile Glu Ile His Leu Pro
50 55 60
Ser Leu Pro Asp Leu Pro Pro His Leu His Thr Thr Asn Gly Leu Ser
65 70 75 80
Ser His Leu Met Pro Thr Leu Leu Lys Ala Phe Asp Met Ser Ala Pro
85 90 95
Glu Phe Thr Thr Ile Leu His Asn Leu Lys Pro Asp Leu Leu Ile Asn
100 105 110
Asp Ile Leu Gln Pro Trp Ala Thr Gln Ile Ala Ser Ser Leu Asn Ile
115 120 125
Pro Val Thr His Phe Ile Ile Ala Gly Val Ile Thr Leu Gly Phe Ala
130 135 140
Leu Gln Ser His Asn Pro Glu Ile Pro Ile Pro Asp Val Asp Leu Gly
145 150 155 160
Tyr His Trp Phe Phe Lys Lys Met Ile Asn Ser Gly Ala Ser Glu Glu
165 170 175
Pro Asp Ser Asp Tyr Asn Leu Asn Arg Leu Trp Lys Thr Leu Val Gly
180 185 190
Leu Gly His Leu Ser Asn Thr Ile Leu Ala Asn Thr Phe Thr Glu Leu
195 200 205
Glu Ser Asp His Ile Asn Tyr Leu Ser Leu Leu Leu Asn Lys Lys Val
210 215 220
Leu Pro Ile Gly Pro Leu Val Gln Lys Leu Thr Ser Ile Pro Asn Pro
225 230 235 240
Asn Asp Glu Glu Lys Lys Pro Glu Pro Leu Glu Trp Leu Asp Lys Lys
245 250 255
Ser Pro Lys Ser Thr Val Tyr Val Ser Phe Gly Ser Glu Cys Tyr Leu
260 265 270
Ser Lys Glu Asp Met Glu Glu Leu Ala His Gly Leu Glu Gln Ser Gly
275 280 285
Ala Asn Phe Ile Trp Val Ile Arg Phe Pro Lys Gly Glu Lys Lys Thr
290 295 300
Met Arg Asp Glu Leu Pro Glu Gly Tyr Leu Glu Arg Val Gly Glu Arg
305 310 315 320
Gly Met Val Ile Glu Gly Trp Ala Pro Gln Met Arg Ile Leu Glu His
325 330 335
Ser Ser Val Gly Gly Phe Val Ser His Cys Gly Trp Asn Ser Met Ala
340 345 350
Glu Ala Ala Val Ile Gly Val Pro Ile Ile Ala Leu Pro Met Gln Leu
355 360 365
Asp Gln Pro Trp Asn Gly Lys Ile Ala Glu Gln Cys Gly Ile Gly Val
370 375 380
Val Ala Lys Arg Gly Glu Glu Gly Glu Ile Met Arg Glu Glu Ile Arg
385 390 395 400
Glu Val Ile Lys Glu Val Val Phe Glu Glu Lys Gly Glu Lys Met Arg
405 410 415
Lys Lys Val Lys Glu Ile Ser Ala Val Leu Lys Glu Lys Glu Gly Glu
420 425 430
Ile Thr Asp Gly Leu Val Asn Glu Leu Asn Leu Leu Cys Gln Ala Lys
435 440 445
Ile

Claims (15)

1.一种体外糖基化方法,其特征在于,包括步骤:
在糖基转移酶存在下,将糖基供体的糖基转移到四环三萜类化合物的C6位的第一个糖基上,从而形成糖基化的四环三萜类化合物,其中,所述糖基转移酶选自:
(a) SEQ ID NO:6所示氨基酸序列;或
(b) (a)的衍生多肽,所述衍生多肽是将SEQ ID NO:6所示序列添加标签序列、信号序列或分泌信号序列后形成的、并具有糖基转移酶活性的多肽;
所述糖基供体是UDP-葡萄糖、UDP-木糖或UDP-鼠李糖,所述四环三萜类化合物是C6位具有一个葡萄糖基修饰的原人参三醇型皂苷。
2.如权利要求1所述的方法,其特征在于,所述四环三萜类化合物是原人参三醇型人参皂苷Rh1或Rg1。
3.一种分离的多肽,其特征在于,所述多肽选自:
(a) SEQ ID NO:6所示氨基酸序列;或
(b) (a)的衍生多肽,所述衍生多肽是将SEQ ID NO:6所示序列添加标签序列、信号序列或分泌信号序列后形成的、并具有糖基转移酶活性的多肽。
4.一种分离的多核苷酸,其特征在于,所述多核苷酸选自以下的一种或多种:
(A)编码权利要求3所述多肽的核苷酸序列;
(B)编码如SEQ ID NO: 6所示多肽或其衍生多肽的核苷酸序列,所述衍生多肽是将SEQID NO:6所示序列添加标签序列、信号序列或分泌信号序列后形成的、并具有糖基转移酶活性的多肽;
(C)如SEQ ID NO:5所示的核苷酸序列;
(D) (A)-(C)任一所述的核苷酸序列的互补序列。
5.一种核酸构建物,其特征在于,所述核酸构建物包含权利要求4所述的多核苷酸,或表达权利要求3所述的多肽。
6.如权利要求5所述的核酸构建物,其特征在于,所述核酸构建物是表达载体或同源重组载体。
7.一种宿主细胞,其特征在于,所述宿主细胞:
(1)表达权利要求3所述的多肽;
(2)含有权利要求4所述的多核苷酸;或
(3)含有权利要求5或6所述的核酸构建物,
所述宿主细胞不是植物细胞。
8.如权利要求7所述的宿主细胞,其特征在于,所述宿主细胞还具有选自以下的一个或多个特征:
(a)表达达玛稀二醇和/或原人参二醇类皂苷和/或原人参三醇类皂苷合成代谢途径中的关键酶;
(b)含有编码(a)所述酶的多核苷酸或其互补序列,
(c)含有包含(b)所述多核苷酸的核酸构建物。
9.权利要求3所述的多肽在催化以下反应中的用途:
将来自糖基供体的糖基转移到四环三萜类化合物的C-6位的第一个糖基上,所述糖基供体是UDP-葡萄糖、UDP-木糖或UDP-鼠李糖,所述四环三萜类化合物是C6位具有一个葡萄糖基修饰的原人参三醇型皂苷。
10.如权利要求9所述的用途,其特征在于,所述四环三萜类化合物是原人参三醇型人参皂苷Rh1或Rg1。
11.权利要求3所述的多肽或编码其的多核苷酸在制备催化以下反应的催化制剂中的用途:
将来自糖基供体的糖基转移到四环三萜类化合物的C-6位的第一个糖基上,所述糖基供体是UDP-葡萄糖、UDP-木糖或UDP-鼠李糖,所述四环三萜类化合物是C6位具有一个葡萄糖基修饰的原人参三醇型皂苷。
12.如权利要求11所述的用途,其特征在于,所述四环三萜类化合物是原人参三醇型人参皂苷Rh1或Rg1。
13.权利要求7或8所述宿主细胞的用途,其特征在于,所述宿主细胞用于产生糖基转移酶,或作为催化细胞,或催化C6位具有一个葡萄糖基修饰的原人参三醇型皂苷的C-6位的第一个糖基的糖基化。
14.一种产生转基因植物的方法,包括步骤:将植物细胞再生为植物,所述植物细胞:
(1)表达权利要求3所述的多肽;
(2)含有权利要求4所述的多核苷酸;或
(3)含有权利要求5或6所述的核酸构建物。
15.如权利要求14所述的方法,其特征在于,所述植物细胞为人参细胞或三七细胞。
CN201911153934.8A 2019-11-22 2019-11-22 糖基转移酶以及催化糖链延伸的方法 Active CN112831481B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911153934.8A CN112831481B (zh) 2019-11-22 2019-11-22 糖基转移酶以及催化糖链延伸的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911153934.8A CN112831481B (zh) 2019-11-22 2019-11-22 糖基转移酶以及催化糖链延伸的方法

Publications (2)

Publication Number Publication Date
CN112831481A CN112831481A (zh) 2021-05-25
CN112831481B true CN112831481B (zh) 2024-01-19

Family

ID=75921565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911153934.8A Active CN112831481B (zh) 2019-11-22 2019-11-22 糖基转移酶以及催化糖链延伸的方法

Country Status (1)

Country Link
CN (1) CN112831481B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115678952A (zh) * 2021-07-30 2023-02-03 生合万物(苏州)生物科技有限公司 鼠李糖高度专一的糖基转移酶及其应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014051214A1 (en) * 2012-09-27 2014-04-03 Korea Advanced Institute Of Science And Technology Novel udp-glycosyltransferase derived from ginseng and use thereof
CN105177100A (zh) * 2014-06-09 2015-12-23 中国科学院上海生命科学研究院 一组糖基转移酶及其应用
CN105985938A (zh) * 2015-01-30 2016-10-05 中国科学院上海生命科学研究院 糖基转移酶突变蛋白及其应用
CN107058446A (zh) * 2012-12-06 2017-08-18 中国科学院上海生命科学研究院 一组糖基转移酶及其应用
WO2018210349A1 (zh) * 2017-05-19 2018-11-22 中国科学院上海生命科学研究院 一组催化糖链延伸的udp-糖基转移酶及其应用

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014051214A1 (en) * 2012-09-27 2014-04-03 Korea Advanced Institute Of Science And Technology Novel udp-glycosyltransferase derived from ginseng and use thereof
CN107058446A (zh) * 2012-12-06 2017-08-18 中国科学院上海生命科学研究院 一组糖基转移酶及其应用
CN105177100A (zh) * 2014-06-09 2015-12-23 中国科学院上海生命科学研究院 一组糖基转移酶及其应用
CN105985938A (zh) * 2015-01-30 2016-10-05 中国科学院上海生命科学研究院 糖基转移酶突变蛋白及其应用
WO2018210349A1 (zh) * 2017-05-19 2018-11-22 中国科学院上海生命科学研究院 一组催化糖链延伸的udp-糖基转移酶及其应用
CN108949711A (zh) * 2017-05-19 2018-12-07 中国科学院上海生命科学研究院 一组催化糖链延伸的udp-糖基转移酶及其应用
CN110225971A (zh) * 2017-05-19 2019-09-10 中国科学院上海生命科学研究院 一组催化糖链延伸的udp-糖基转移酶及其应用

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"Characterization of Panax ginseng UDP-Glycosyltransferases Catalyzing Protopanaxatriol and Biosyntheses of Bioactive Ginsenosides F1 and Rh1 in Metabolically Engineered Yeasts";Wei Wei et al.;《Molecular Plant 》;20150529;第8卷;第1412-1424页 *
"人参糖基转移酶 PgUGT74AE2 催化生成新型人参三醇皂苷研究";张婷婷等;《药学学报》;20181231;第53卷(第9期);第1565-1570页 *

Also Published As

Publication number Publication date
CN112831481A (zh) 2021-05-25

Similar Documents

Publication Publication Date Title
US20230203458A1 (en) Group of udp-glycosyltransferase for catalyzing carbohydrate chain elongation and application thereof
JP6479084B2 (ja) 一連の糖転移酵素およびその応用
CN104232723B (zh) 一组糖基转移酶及其应用
WO2015188742A2 (zh) 一组糖基转移酶及其应用
CN105087739B (zh) 一种新的制备稀有人参皂苷的催化体系及其应用
JP7086107B2 (ja) 糖転移酵素、突然変異体およびその使用
CN112831481B (zh) 糖基转移酶以及催化糖链延伸的方法
WO2023006109A1 (zh) 鼠李糖高度专一的糖基转移酶及其应用
CN114507646B (zh) 细胞色素p450突变体蛋白及其应用
CN113444703B (zh) 催化糖链延伸的糖基转移酶突变体及其应用
KR20220058286A (ko) 패니바실러스 무실라지노서스 유래 엔도-1,4-베타 글루코시데이즈 및 이의 용도

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20210803

Address after: Room 913, building 2, No. 300, Fenglin Road, Xuhui District, Shanghai 200032

Applicant after: Zhou Zhihua

Address before: No.4 building, No.300 Fenglin Road, Xuhui District, Shanghai 200032

Applicant before: Center for excellence and innovation in molecular plant science, Chinese Academy of Sciences

TA01 Transfer of patent application right
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20211025

Address after: 200032 Shanghai city Xuhui District Fenglin Road No. 300

Applicant after: Center for excellence and innovation in molecular plant science, Chinese Academy of Sciences

Address before: Room 913, building 2, No. 300, Fenglin Road, Xuhui District, Shanghai 200032

Applicant before: Zhou Zhihua

TA01 Transfer of patent application right

Effective date of registration: 20220621

Address after: Room 805, building 6, juke Biological Park, No. 333 Guiping Road, Xuhui District, Shanghai 200233

Applicant after: Shenghe everything (Suzhou) Biotechnology Co.,Ltd.

Address before: 200032 Shanghai city Xuhui District Fenglin Road No. 300

Applicant before: Center for excellence and innovation in molecular plant science, Chinese Academy of Sciences

TA01 Transfer of patent application right
CB02 Change of applicant information

Address after: 201318 floor 1-2, building 2, Lane 500, Furonghua Road, Pudong New Area, Shanghai

Applicant after: Shenghe Everything (Shanghai) Biotechnology Co.,Ltd.

Address before: Room 805, building 6, juke Biological Park, No. 333 Guiping Road, Xuhui District, Shanghai 200233

Applicant before: Shenghe everything (Suzhou) Biotechnology Co.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant