CN112424218A - 甜菊糖苷转运 - Google Patents

甜菊糖苷转运 Download PDF

Info

Publication number
CN112424218A
CN112424218A CN201980028987.9A CN201980028987A CN112424218A CN 112424218 A CN112424218 A CN 112424218A CN 201980028987 A CN201980028987 A CN 201980028987A CN 112424218 A CN112424218 A CN 112424218A
Authority
CN
China
Prior art keywords
rebaudioside
variant
amino acid
molar concentration
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980028987.9A
Other languages
English (en)
Inventor
约翰尼斯·古斯塔夫·恩斯特·范莱文
维克托·马里厄斯·波尔
普利斯希勒·扎尔特简斯
乔斯·范沃格特
芮妮·马赛尔·德钟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN112424218A publication Critical patent/CN112424218A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • C12N9/0038Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12N9/0042NADPH-cytochrome P450 reductase (1.6.2.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/02Oxidoreductases acting on NADH or NADPH (1.6) with a heme protein as acceptor (1.6.2)
    • C12Y106/02004NADPH-hemoprotein reductase (1.6.2.4), i.e. NADP-cytochrome P450-reductase

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本公开提供了一种能够产生甜菊糖苷的重组细胞,其中所述细胞包含编码亲本多肽的变体的核酸,其中所述变体具有甜菊糖苷转运介导活性,其中所述变体包含的氨基酸序列当与所述亲本多肽的氨基酸序列比对时包含对与所述亲本多肽的氨基酸序列中的任何氨基酸相对应的氨基酸残基的至少一个修饰,其中如果与所述亲本多肽比较,当在相同条件下测量时,所述变体具有改进的细胞外产生莱鲍迪甙M和任选的其他甜菊糖苷的能力。

Description

甜菊糖苷转运
技术领域
本公开涉及一种能够产生甜菊糖苷的重组细胞。本公开还涉及一种用于制备甜菊糖苷的方法,涉及一种包含甜菊糖苷的发酵液,涉及甜菊糖苷和甜菊糖苷组合物并且涉及包含甜菊糖苷或组合物的食物、饲料或饮料。本公开还涉及一种甜菊糖苷转运多肽的变体,涉及编码所述变体的核酸并且涉及用于产生所述变体的方法。
背景技术
多年生草本植物甜叶菊(Stevia rebaudiana Bert.)的叶子积聚大量甜味强的化合物,所述化合物被称为甜菊糖苷(steviol glycoside)。虽然这些化合物的生物学功能尚不清楚,但它们作为替代性高效甜味剂具有商业意义。这些甜的甜菊糖苷的功能和感官特性似乎优于许多高效甜味剂的功能和感官特性。此外,研究表明甜菊苷能够降低II型糖尿病患者的血糖水平并且能够降低轻度高血压患者的血压。
甜菊糖苷在甜叶菊的叶中积聚,在叶中它们可能占叶干重的10%至20%。甜菊苷(Stevioside)和莱鲍迪甙A(Rebaudioside A)均为热和pH稳定的,并且适用于碳酸饮料并且可以应用于许多其他食物中。甜菊苷比蔗糖甜110倍至270倍,莱鲍迪甙A比蔗糖甜150倍至320倍。此外,莱鲍迪甙D也是一种高效的二萜糖苷甜味剂,其在甜叶菊的叶中积聚。它可能比蔗糖甜约200倍。莱鲍迪甙M是另一种高效的二萜糖苷甜味剂。它在某些甜叶菊变种的叶中以痕量存在,但被认为与其他甜菊糖苷相比具有优良的口味特性。具体地,莱鲍迪甙M似乎缺乏其他甜菊糖苷,特别是莱鲍迪甙A,的典型的苦、甘草后味。
传统上从甜叶菊(Stevia)植株中提取甜菊糖苷。在甜叶菊中,赤霉酸(GA)生物合成中的中间体(-)-贝壳杉烯酸((-)-kaurenoic acid)被转化为四环二萜甜菊醇,该四环二萜甜菊醇然后通过多步糖基化途径来形成各种甜菊糖苷。
在甜叶菊植株中,产量是可变的,并受农业和环境条件的影响。此外,如果与莱鲍迪甙A相比则具有改善的甜味和感官特性的莱鲍迪甙D和莱鲍迪甙M,仅以痕量存在于植物提取物中。
另外,甜叶菊的种植需要大量的土地面积、收获前较长的时间、密集型劳力以及用于糖苷的提取和纯化的附加成本。所有这些方面使得从植物提取物中生产甜菊糖苷的可持续性较低并且在经济上的吸引力较小。
因此,最近,人们对使用发酵方法生产甜菊糖苷的兴趣日益浓厚。WO2013/110673和WO2015/007748描述了可用于生产至少甜菊糖苷(例如莱鲍迪甙A、莱鲍迪甙D和莱鲍迪甙M)的微生物。
为了可以生产更高量的甜菊糖苷和/或生产附加的或新的甜菊糖苷和/或更高量的特定甜菊糖苷和/或具有所需比率的不同甜菊糖苷的甜菊糖苷混合物,期望进一步改良此类微生物。
具体地,由于每当微生物不能或仅部分地能够输出或分泌甜菊糖苷到细胞外时,从发酵液中回收和纯化甜菊糖苷是很复杂的,因此需要具有改良的重组地产生甜菊糖苷到细胞外的能力的微生物。
WO2014/122328 A1描述了一些重组微生物,所述重组微生物能够使用一种或多种内源转运体或转录因子基因的改变表达,或过表达一种或多种异源转运体来产生甜菊糖苷,从而导致感兴趣的甜菊糖苷的分泌增加。
WO2016023844 A1公开了一种能够合成甜菊糖苷的重组宿主,所述重组宿主包含编码转运体多肽的基因和/或编码调节至少一种转运体基因的表达的转录因子多肽的基因;
其中编码转运体多肽的基因和/或编码调节至少一种转运体基因的表达的转录因子多肽的基因的表达被修饰,并且重组宿主将合成的甜菊糖苷的至少一部分从所述宿主转运到培养基中。
WO2017/025362 A1描述了一种能够产生甜菊糖苷的重组宿主细胞,所述重组宿主细胞包含:
(a)编码糖流出转运体(Sugar Efflux Transporter,SET)多肽的基因;和/或
(b)编码糖转运体SWEET(Sugar Transporter SWEET,SWEET)多肽的基因;其中所述基因中的至少一种是重组基因。
WO2017/025649 A1和WO2017/025648 A1公开了一些重组宿主细胞,其中来自东方伊萨酵母(Issatchenkia orientalis)和解脂耶氏酵母(Yarrowia lipolytica)的转运体基因分别被过表达以增加到细胞外的甜菊糖苷转运。或者替代地,此类重组宿主经修饰以减少所述基因的表达,以在细胞内保留更多的甜菊糖苷,然后将所述甜菊糖苷进一步糖基化为包含更高数量的糖部分的甜菊糖苷。
尽管有现有技术中的这些公开内容,但仍需要具有改良的重组地产生甜菊糖苷到细胞外的能力的其他微生物,特别是与其他甜菊糖苷相比优先产生莱鲍迪甙M到细胞外的微生物。
附图说明
图1描绘了用于从解脂耶氏酵母菌株STVP001中缺失如在SEQ ID 1中所定义的内源转运体YALI0E25201的策略。
图2描述了用于引入在菌株STVP002中引入的YALI0E25201转运体或转运体变体的策略。
图3列出了导致甜菊糖苷生物合成的潜在途径的示意图。
序列表说明
SEQ ID NO:1列出了属于解脂耶氏酵母转运体YALI0E25201的开放阅读框(ORF)的多核苷酸序列,其包含单个内含子。
SEQ ID NO:2列出了解脂耶氏酵母转运体YALI0E25201的基因组序列,所述基因组序列包含在ORF上游的1000bp侧翼序列、ORF和在ORF下游的终止子序列(300bp),之后是999bp侧翼序列。
SEQ ID NO:3列出了内源性解脂耶氏酵母转运体YALI0E25201的氨基酸序列。
SEQ ID NO:4列出了在解脂耶氏酵母菌株STVP001和STVP002中过表达的截短的3-羟基-3-甲基戊二酰辅酶A还原酶的氨基酸序列。
SEQ ID NO:5列出了在解脂耶氏酵母菌株STVP001和STVP002中过表达的变异香叶酰香叶酰-二磷酸合酶的氨基酸序列。
SEQ ID NO:6列出了在解脂耶氏酵母菌株STVP001和STVP002中过表达的变异贝壳杉烯酸13-羟化酶的氨基酸序列。
发明内容
发明人已经出人意料地发现,可以修饰甜菊糖苷转运蛋白以产生具有改良的介导甜菊糖苷转运的能力的变体多肽。具体地,如果与亲本多肽相比,该变体具有与介导其他甜菊糖苷的转运的能力相比,改良的介导莱鲍迪甙M到细胞外的转运的能力。因此,如果与表达亲本多肽的重组细胞的发酵液相比,表达变体多肽的重组细胞的发酵液富含莱鲍迪甙M。因此,本公开允许产生富含莱鲍迪甙M含量的甜菊糖苷组合物,而无需复杂的回收和纯化过程,因为所述组合物可以直接从发酵液中回收,而无需事先破坏重组细胞。
已知ABC转运体通常是非特异性和混杂类型的转运体。例如,发现从解脂耶氏酵母分离的ABC型转运体在重组细胞中有效地将甜菊糖苷转运到细胞外(WO2017/025648)。该后一观察结果本身是令人惊讶的,因为解脂耶氏酵母并不天然地产生甜菊糖苷。甚至更令人惊讶地,发明人现已发现,可以对ABC转运体进行工程改造以使其更特异,例如更特异于某些类型的甜菊糖苷(例如莱鲍迪甙M)。
在第一方面中,本公开提供了一种亲本多肽的变体,其中所述变体具有甜菊糖苷转运介导活性,其中所述变体包含的氨基酸序列当与所述亲本多肽的氨基酸序列比对时包含对与所述亲本多肽的所述氨基酸序列中的任何氨基酸相对应的氨基酸残基的至少一个修饰,其中当在相同条件下测量时:
a)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少0.1;和/或
b)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比;和/或
c)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比;
其中参考细胞是表达所述亲本多肽的重组细胞。本公开还提供了编码根据第一方面的变体的核酸序列。
本公开还提供了一种亲本多肽的变体,其中所述变体具有甜菊糖苷转运介导活性,其中所述变体包含的氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含对与以下位置的氨基酸中的任何氨基酸对应的氨基酸残基的至少一个修饰:
15、19、26、29、31、32、33、37、46、56、59、107,135、136、141、145、148、150、151、153、199、200、204、206、207、210、211、255、257、258、262、267、268、272、273、276、277、278、281、282、283、284、292、294、296、297、298、299、300、302、303、306、307、309、310、311、315、318、319、320、321、322、323、324、326、328、375、376、378、379、380、382、384、386、387、389、408、410、411、413、414、415、416、417、419、420、421、422、423、424、425、427、428、429、853、854、857、859、862、864、869、890、891、892、894、903、906、968、969、972、974、977、986、996、998、999、1001、1003、1004、1010、1012、1016、1017、1018、1019、1020、1021、1059、1060、1061、1062、1063、1075、1076、1107、1108、1111、1112、1115、1118、1120、1123、1127、1128、1179、1200,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
在一个实施方式中,亲本多肽和变体多肽均具有甜菊糖苷转运介导活性。
在第二方面中,本公开提供了一种产生根据第一方面的变体多肽的方法,所述方法包括:
a)提供亲本多肽,任选地其中所述亲本多肽具有甜菊糖苷转运介导活性;
b)修饰所述亲本多肽序列中的至少一个氨基酸残基以产生变体多肽序列,任选地其中在所述亲本多肽序列中的修饰发生在序列的与螺旋跨膜区对应的部分中;以及任选地
c)选择当在重组细胞中表达时具有甜菊糖苷转运介导活性并且具有以下特征的变体多肽:
i)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少0.1;和/或
ii)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比;和/或
iii)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比;
其中参考细胞是表达所述亲本多肽的重组细胞,任选地其中根据i)、ii)和iii)的比率中的莱鲍迪甙M、莱鲍迪甙A和总甜菊糖苷的摩尔浓度是细胞外产生的摩尔浓度。
在第三方面中,本发明提供了一种能够产生甜菊糖苷的重组细胞,其中所述细胞包含编码根据第一方面的变体的核苷酸序列。
在又一方面中,本公开提供了一种产生能够产生根据第三方面的甜菊糖苷的重组细胞的方法,其中所述细胞包含编码根据第一方面的亲本多肽的变体的多核苷酸序列,所述方法包括:a)提供细胞;以及b)用编码根据第一方面的变体多肽的核酸或核酸构建体修饰或转染所述细胞,从而得到根据第三方面的重组细胞。
在其他方面中,本公开提供了:
-一种编码根据第一方面的变体的核酸和一种编码根据第一方面的变体多肽的核酸构建体
-一种用于制备甜菊糖苷的方法,所述方法包括发酵根据第三方面的重组细胞;
-一种发酵液,所述发酵液包含通过所述用于制备甜菊糖苷的方法可获得的甜菊糖苷;
-一种通过所述用于制备甜菊糖苷的方法可获得的甜菊糖苷;
-一种包含所述甜菊糖苷中的一种或多种甜菊糖苷的组合物;
-一种包含所述甜菊糖苷或组合物的食物、饲料或饮料。
具体实施方式
变体多肽和编码所述变体的核酸
在第一方面中,本公开提供了一种亲本多肽的变体,其中所述变体具有甜菊糖苷转运介导活性,其中所述变体包含的氨基酸序列当与所述亲本多肽的氨基酸序列比对时包含对与所述亲本多肽的所述氨基酸序列中的任何氨基酸相对应的氨基酸残基的至少一个修饰,其中当在相同条件下测量时:
a)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少0.1;和/或
b)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比;和/或
c)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比;
其中参考细胞是表达所述亲本多肽的重组细胞。
根据本发明的变体多肽以及任选的亲本多肽是被鉴定为具有甜菊糖苷转运介导活性的多肽。出于本公开的目的,具有甜菊糖苷转运介导活性的多肽(即,介导甜菊糖苷转运的多肽)是对一种或多种甜菊糖苷跨细胞膜的转运具有影响的多肽。所述影响可以是直接的,即多肽可以是转运体蛋白或包含功能性转运体区域。或者替代地,所述影响可以是间接的,即所述多肽不是转运体蛋白,但是其活性仍然对甜菊糖苷转运具有影响。
典型地,所述影响将使得增加具有甜菊糖苷转运介导活性的多肽的表达水平增加了一种或多种甜菊糖苷跨细胞膜的转运量(与具有较低的多肽表达水平的对应细胞相比)。相反地,降低多肽的表达水平可以减少一种或多种甜菊糖苷跨细胞膜的转运量(与具有较高多肽表达水平的相应细胞相比)。
通常,变体多肽以及任选的亲本多肽可以是转运蛋白或转运体。转运体(也称为转运蛋白、转运体蛋白或膜转运蛋白)是参与细胞中化合物跨生物膜的移动的蛋白质。取决于由转运蛋白在膜内所假定的拓扑结构,它们可以一方面被分类为通道或成孔剂,另一方面被分类为载体。通道在膜的两侧同时打开或关闭并且允许穿过所述膜的被动扩散,而载体不是同时在膜的两侧打开的并且它们能够抗化学梯度地穿过生物膜转运化合物。后者可以通过主要主动转运(其需要从细胞内部的偶联化学反应(例如ATP水解)释放的能量)或次要主动转运发生,所述次要主动转运涉及使用共转运离子或溶质的电化学势并且不需要由细胞产生的能量。
转运蛋白是跨膜蛋白,并且是本领域技术人员所已知的。转运蛋白根据由国际生物化学与分子生物学联合会(International Union of Biochemistry and MolecularBiology)批准的分类系统(Saier等人,2014)进行分类,并且这是本领域技术人员所已知的。可以通过转运体分类数据库(http://www.tcdb.org/)在线查询分类系统。根据本公开,变体多肽以及任选的亲本多肽可以是如由转运体分类数据库所分类的转运蛋白。在一个实施方式中,变体多肽以及任选的亲本多肽可以是属于以下类别中的任何类别的转运蛋白:TC1转运体(通道/孔转运体);TC2转运体(电化学势驱动的转运体);TC3转运体(主要主动转运体);TC4转运体(组易位体);TC5转运体(跨膜电载体);TC8转运体(转运中所涉及的辅助因子);或TC9转运体(不完全表征的转运系统)。
根据转运体分类数据库,转运系统基于五个标准进行分类,并且这些标准中的每一个标准对应于特定类型的转运体的TC编号内的五个数字或字母中的一者。转运体是根据以下编号TCn.m.x.y.z.指示的;其中n、m、x、y和z具有以下含义:n(数字)对应于转运体类别;m(字母)对应于转运体子类别;x(数字)对应于转运体家族(或超家族);y(数字)对应于存在转运体的亚家族,并且z对应于被转运的底物或底物范围。
在一个实施方式中,变体多肽以及任选的亲本多肽是属于以下类别中的任何类别以及属于其中的任何子类别、超家族、家族或亚家族的转运蛋白:TC1转运体(通道/孔转运体);TC2转运体(电化学势驱动的转运体);TC3转运体(主要主动转运体);TC4转运体(组易位体);TC5转运体(跨膜电子载体);TC8转运体(转运中所涉及的辅助因子);或TC9转运体(不完全表征的转运系统)。主要类型的转运体蛋白之间是ATP结合盒(ABC)转运体(Wilkens2015)、主要易化子超家族(MFS)转运体(Yang 2015)、小多药耐药性(SMR)转运体(Bay等人,2007)、属于耐药-结瘤-细胞分裂(Resistance-Nodulation-Cell division,RND)家族的转运体,以及多抗微生物挤出蛋白(Multi-Antimicrobial-Extrusion Protein,MATE)。ABC转运体是原核生物和真核生物两者中最大的转运体家族之一,并且是本领域技术人员已知的(Wilkens 2015)。这些转运体是取决于ATP水解的主要主动转运体,组织在两个核苷酸结合结构域(NBD)和两个跨膜结构域(TMD)中。根据SEQ ID NO:3的解脂耶氏酵母内源性转运体YALI0E25201是ABC转运体的示例。
所有转运蛋白的特征在于多个(即至少两个,通常多于两个)具有α-螺旋二级结构的跨膜结构域。因此,在一个实施方式中,当在重组宿主细胞中表达时,亲本多肽或变体多肽具有多个具有α-螺旋二级结构的跨膜结构域。
通常,根据本公开的亲本多肽或变体多肽可以是甜菊糖苷转运蛋白,通常是选自ATP结合盒(ABC)转运体、主要易化子超家族(MFS)转运体、小多药耐药性(SMR)转运体、属于耐药-结瘤-细胞分裂(RND)家族的转运体、多抗微生物挤出蛋白的转运蛋白。
根据本公开的变体多肽以及任选的亲本多肽具有跨重组细胞的膜的甜菊糖苷转运介导活性。
亲本多肽可以就以下意义而言是天然的:其天然存在于细胞中,获得自或可从细胞(例如如下文所公开的重组细胞)中分离。或者替代地,亲本多肽可以是与重组细胞异源的。如本文所用的术语“异源”是指非天然存在于细胞中的核酸或氨基酸序列。换句话说,所述核酸或氨基酸序列与宿主细胞中天然存在的核酸或氨基酸序列不同。
在另一个实施方式中,亲本多肽可以是转运蛋白模板或最接近的同源物,其可以通过在例如Uniprot的公共数据库中进行BLAST搜索找到。例如,亲本多肽可以是由多序列比对设计的共有序列。执行多重序列比对的方法是本领域已知的并且在本文中定义。
在本文中,术语“变体”或“突变体”可互换地使用。它们可以指多肽或核酸。变体包括在相对于亲本序列的一个或多个位置处的取代、插入、缺失、截短、颠换和/或倒位。可以例如通过位点饱和诱变、扫描诱变、插入诱变、随机诱变、定点诱变和定向进化以及各种其他重组或合成方法来产生变体。变体多肽可与亲本多肽有少数氨基酸残基不同,并且可以由它们与参考多肽(例如亲本多肽)的一级氨基酸序列同源性/同一性的水平来定义。优选地,变体多肽与参考多肽(例如亲本多肽)具有至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%的氨基酸序列同一性。用于确定同一性百分比的方法是本领域已知的并且在本文中进行了描述。通常,变体保留了亲本多肽的特征性,但是在一些特定方面具有改变的特性。
关于核酸,该术语是指编码变体多肽的核酸,该核酸与参考核酸具有指定的同源性/同一性程度,或在严格条件下与参考核酸或其补体杂交。优选地,变异核酸与参考核酸具有至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%的核酸序列同一性。用于确定同一性百分比的方法是本领域已知的并且在本文中进行了描述。
根据第一方面的实施方式,变体包含这样的氨基酸序列,所述氨基酸序列当与亲本多肽(或任何参考多肽,例如根据SEQ ID NO:3的氨基酸序列的多肽)的氨基酸序列比对时包含对与亲本多肽的氨基酸序列中的任何氨基酸对应的氨基酸残基的至少一个修饰。
措辞“氨基酸序列与亲本多肽的序列中列出的氨基酸序列比对”(或与参考多肽(例如根据SEQ ID NO:3的氨基酸序列的多肽)中列出的氨基酸序列比对)是指将变体氨基酸序列和亲本多肽的氨基酸序列(或例如SEQ ID NO:3所示的氨基酸序列)通过合适的方法进行比对,所述方法允许a)将所述序列彼此比较,以及b)鉴定如果与亲本多肽或参考多肽的氨基酸序列(例如SEQ ID NO:3所示的氨基酸序列)比较,所述变体的氨基酸序列中存在相同氨基酸(相同位置)、或存在另一种氨基酸(取代)、或存在一个或多个额外氨基酸(插入或延伸)或不存在氨基酸(缺失或截短)的位置。因此,在本公开的上下文中,修饰是当用合适的方法比对时对与亲本多肽或参考多肽中存在的任何氨基酸相对应的氨基酸残基的取代、添加或缺失。允许比较两个氨基酸序列的合适方法可以是本领域技术人员已知的任何合适的成对序列比对方法,优选全局成对序列比对方法(Global Pairwise SequenceAlignment method)。一种优选的全局成对序列比对方法是基于如本文所述的Needleman-Wunsch比对算法(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)的EMBOSS Needle方法(旨在找到两个序列沿它们的整个长度的最佳比对(包括空位))。在一个实施方式中,使用来自EMBOSS包的NEEDLE程序,使用EBLOSUM62作为取代矩阵,使用为10的空位开放罚分和为0.5的空位延伸罚分,将氨基酸序列与亲本多肽或参考多肽的氨基酸序列(例如,如SEQ ID NO:3所示的氨基酸序列)进行比对。
已令人惊奇地发现,当与其他甜菊糖苷比较时,根据本公开的第一方面的变体多肽具有改善的介导莱鲍迪甙M到细胞外的转运的能力。可以通过以下方式来测量该能力:测量由表达该变体的重组细胞所产生的莱鲍迪甙M的摩尔浓度与其他甜菊糖苷(例如莱鲍迪甙A或总甜菊糖苷)的摩尔浓度之间的比率,以及将其与当在相同条件下测量时由表达亲本多肽的重组细胞产生的莱鲍迪甙M的摩尔浓度与其他甜菊糖苷(例如莱鲍迪甙A或总甜菊糖苷)的摩尔浓度之间的比率进行比较。优选地,在根据本公开的重组细胞中,由表达该变体的重组细胞所产生的莱鲍迪甙M的摩尔浓度与其他甜菊糖苷(例如莱鲍迪甙A或总甜菊糖苷)的摩尔浓度之间的比率高于当在相同条件下测量时由表达亲本多肽的重组细胞产生的莱鲍迪甙M的摩尔浓度与其他甜菊糖苷(例如莱鲍迪甙A或总甜菊糖苷)的摩尔浓度之间的比率。
在本说明书的上下文中,当提及莱鲍迪甙M或莱鲍迪甙A或总甜菊糖苷时,措词“由重组细胞产生的”是指在打开细胞以释放细胞内含物并且任选地在去除未溶解的细胞质材料(例如细胞壁)之后的发酵液中发现的莱鲍迪甙M或莱鲍迪甙A或总甜菊糖苷。
优选地,在根据本公开的重组细胞中,由表达该变体的重组细胞在细胞外产生的莱鲍迪甙M的摩尔浓度与其他甜菊糖苷(例如莱鲍迪甙A或总甜菊糖苷)的摩尔浓度之间的比率高于当在相同条件下测量时由表达亲本多肽的重组细胞在细胞外产生的莱鲍迪甙M的摩尔浓度与其他甜菊糖苷(例如莱鲍迪甙A或总甜菊糖苷)的摩尔浓度之间的比率。
在本说明书的上下文中,措词“由重组细胞在细胞外产生的”是指在去除完整细胞后的发酵液(即在去除之前不在发酵液中释放细胞内含物的情况下)中发现的莱鲍迪甙M(或莱鲍迪甙A或总甜菊糖苷)。
在本公开的上下文中,“在相同条件下测量”或“在相同条件下分析”是指变体多肽和亲本多肽以相同方式和相同类型的细胞在重组细胞中表达;在相同条件下培养表达该变体的重组细胞和表达亲本多肽的重组细胞;并且由表达该变体的重组细胞产生的莱鲍迪甙M和/或其他甜菊糖苷的量(摩尔浓度)和由表达亲本多肽的重组细胞产生的莱鲍迪甙M和/或其他甜菊糖苷的量(摩尔浓度)是分别使用相同条件,优选地通过使用相同测定和/或方法,更优选地在相同实验内测量的。
通常,当变体多肽或亲本多肽使用相同类型的表达盒(即其中编码变体的多核苷酸或编码亲本多肽的多核苷酸以相同的方式,优选以相同的拷贝数连接至相同类型的控制序列的表达盒,其中所述表达盒优选地整合在重组细胞中的基因组的相同基因座中)在重组细胞中表达时,变体多肽和亲本多肽以相同的方式在重组细胞中表达。
在本公开的上下文中,相同类型的细胞是指相同属、相同物种和具有相同遗传背景的细胞。
为了确定由表达变体多肽或亲本多肽的重组细胞产生的甜菊糖苷(例如莱鲍迪甙M和/或莱鲍迪甙A和/或总甜菊醇苷)的浓度(例如摩尔浓度),可以使用本领域技术人员已知的方法。在一个实施方式中,用于测量甜菊糖苷的测定是在实施例中描述的测定。
在一个实施方式中,可以根据以下方案来测量由表达变体或表达亲本多肽的重组宿主细胞在细胞外产生的甜菊糖苷的浓度(例如摩尔浓度):
a)在允许重组细胞生长并产生甜菊糖苷的条件下,优选在其中甜菊糖苷可溶的条件下,使细胞在合适的营养培养基中生长固定的时间段;
b)回收细胞外产生的甜菊糖苷,并测量甜菊糖苷的摩尔浓度。
在另一个实施方式中,可以根据以下方案来测量由表达变体或表达亲本多肽的重组细胞产生的甜菊糖苷的(摩尔)浓度:
a)在允许重组细胞生长并产生甜菊糖苷的条件下,使细胞在合适的营养培养基中生长固定的时间段;
b)回收由所述细胞产生的甜菊糖苷并测量甜菊糖苷的摩尔浓度。
为了在允许重组细胞生长并产生甜菊糖苷的条件下使细胞在合适的营养培养基中生长固定的时间段,应该应用对于所述宿主而言合适的生长条件。这些已经针对上面提到的生物体进行了描述,并且应该是本领域技术人员已知的。生长和/或生产培养基应使生物体达到一定的生物质浓度,以便可以确定产物的可定量的量。营养培养基还应允许产生甜菊糖苷所需的基因的表达。合适的培养基可以取决于重组细胞而不同。公开了合适的培养基的示例。
通常出于筛选目的,使用摇瓶、培养板或微量滴定板(MTP)。也可以使用其他系统,例如珠粒、液滴、发酵器等。对于需要氧气的生物体,生长器皿必须适合用于需氧发酵或微需氧发酵。通常搅动诸如摇瓶或MTP的生长器皿,以允许气体(例如氧气、二氧化碳)在液相与气相之间转移。也可以使用搅拌。可用空气或其他气体混合物对发酵器进行喷洗,所述喷洗可能与通过叶轮进行搅动组合。
优选地,培养基应设计为使得避免高粘度,以允许充分混合和气体转移。很高浓度或量的底物(例如,含有葡萄糖、蔗糖、乙醇、甘油、油、淀粉)可能导致很高浓度的生物质,这可能负面地影响混合、气体转移和溶氧。这进一步取决于在此条件下菌株产生甜菊糖苷的效率(底物上产物的产量)。当设计适当的培养基时,应考虑到这一点。为了评估细胞外产生,应使用不超过产物在培养液中的溶解度极限的条件。然后可以通过(例如通过离心或过滤)将细胞与液相分离并确定上清液或滤液中甜菊糖苷的浓度,来确定细胞外浓度。
为了回收细胞外产生的甜菊糖苷,可以遵循以下工序:
在生长后,将确定的细胞培养物等分试样以1500g离心10分钟;在离心后,将上清液转移并在33%的乙腈中稀释,并例如根据本领域已知的方法,例如使用液相色谱质谱联用仪(LC-MS)或使用液相色谱紫外联用(LC-UV)来确定甜菊糖苷的浓度。
为了回收由细胞产生的甜菊糖苷,可以遵循以下工序:在生长后,将确定的细胞培养物等分试样均质化并在90℃处理10分钟,然后冷却至室温,用乙腈稀释至33%乙腈的浓度,混合,以1500g离心10分钟,并且例如根据本领域已知的方法,例如使用LC-MS或LC-UV确定所得上清液的甜菊糖苷浓度。
为了通过LC-MS确定甜菊糖苷的摩尔浓度,可以使用超高效液相色谱质谱系统联用(UPLC-MS),例如使用配备有反相C18柱的UPLC。合适类型的质谱仪可以是三重四极杆质谱仪(TQ MS)。
甜菊糖苷浓度可以使用联接至配备有电喷雾电离源的TQ质谱仪的UPLC确定,对于除了莱鲍迪甙A和甜茶苷以外的所有研究的甜菊糖苷,所述电喷雾电离源在去质子化分子[M-H]-处在MRM模式下以负离子模式操作,莱鲍迪甙A和甜茶苷在[M-H-己糖]处监测。
待分析和定量的甜菊糖苷可以使用以下条件进行分离:使用2.1×100mm的粒径为1.8μm的基于二氧化硅的C18反相柱(例如Acquity
Figure GDA0002911608450000151
HSS T3柱或具有相同特征的替代柱),使用以(A)50mM乙酸铵在LC-MS级水中的溶液和(B)LC-MS级乙腈、使用以下梯度:在0.5分钟内从30%至35%B,在35%B处保持0.8分钟,在0.7分钟内从35%B至95%B,在95%B处保持0.5分钟进行梯度洗脱,用30%B重新平衡1.5分钟;使用0.6ml/min的流速、使用5μl的进样量和50℃的柱温;使用在10-600ng/ml范围内的组分外部校准线对甜菊糖苷进行定量,其中将对应的分析样品稀释,使得所需组分的浓度落在校准线的线性范围内;其中样品中乙腈的浓度为33%;其中使用二次校准线(由此迫使原点通过零)、使用TargetLynx软件(Waters)计算样品中各组分的浓度,并使用加权函数1/x。本文指出的LC或UPLC梯度表示为体积百分比,即%v/v。
经验证的参考物(标准物质)可用于莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙D、甜菊苷、甜菊双糖苷、甜茶苷、莱鲍迪甙M和甜菊醇-13-单苷。
甜菊糖苷也可以使用根据食品化学药典(Food Chemical Codex,FCC)方法开发的LC-UV方法确定,以便定量莱鲍迪甙A和其他甜菊糖苷(莱鲍迪甙M、莱鲍迪甙B、莱鲍迪甙D、甜菊苷、甜菊双糖苷、甜茶苷)。可以使用与光电二极管阵列检测器(PDA检测器)(例如如由Waters提供的)联接的UPLC(例如,如由Waters提供的)来分析甜菊糖苷。待分析和定量的甜菊糖苷是通过以下方式分离的:使用4.6×150mm的粒径为3μm的基于二氧化硅的反相双官能键合的C18(dC18)柱(例如dC18Waters Atlantis或具有相同特征的替代柱)并在210nm处进行检测,使用具有(A)在纯水中的25%乙腈+0.00166%乙酸溶液,和B)LC-MS级乙腈作为流动相的洗脱梯度、使用以下梯度:0%B(=100%A)持续2分钟,在11分钟内从0%B至46%B,在0.1分钟内从46%B至98%B,保持在98%B处4分钟,在0.1分钟内从98%B至0%B,以100%A重新平衡所述柱5分钟;使用1ml/min的流速、使用10μl的进样量和50℃的柱温;使用在2-100μg/ml的范围内的组分外部校准线对所需的组分进行定量,其中将对应的分析样品相应地稀释,使得所需组分的浓度在校准线的线性范围中;其中样品中的乙腈浓度为25%。
经验证的参考物(标准物质)可用于莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙D、甜菊苷、甜菊双糖苷、甜茶苷、莱鲍迪甙M和甜菊醇-13-单苷。
在一个实施方式中,在根据本公开的亲本多肽的变体中,当在相同条件下测量时,由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由表达所述亲本多肽的重组细胞产生的莱鲍迪甙M的摩尔浓度之间的比率为至少0.1、0.3、0.5,优选地至少0.8,更优选地至少1。更优选地,当在相同条件下测量时,所述比率大于1,例如至少1.1、1.2、1.5,或至少2、2.5、3、3.5、4、5、6、7、8、9,或至少10、20、30、50、100、1000或更大。
在一个实施方式中,在根据本公开的亲本多肽的变体中,当在相同条件下测量时,由表达所述变体的重组细胞在细胞外产生的莱鲍迪甙M的摩尔浓度与由表达所述亲本多肽的重组细胞在细胞外产生的莱鲍迪甙M的摩尔浓度之间的比率为至少0.1、0.3、0.5,优选地至少0.8,更优选地至少1。更优选地,当在相同条件下测量时,所述比率大于1,例如至少1.1、1.2、1.5,或至少2、2.5、3、3.5、4、5、6、7、8、9,或至少10、20、30、50、100、1000或更大。
在一个实施方式中,在根据本公开的亲本多肽的变体中,当在相同条件下测量时,由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比率高于由表达所述亲本多肽的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比率。优选地,由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比率是由表达所述亲本多肽的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比率的至少1.1倍,或至少1.2倍、1.5倍,或至少2倍、2.5倍、3倍、3.5倍、4倍、5倍、6倍、7倍、8倍、9倍,或至少10倍、20倍、30倍、50倍、100倍、1000倍或更多倍。
在一个实施方式中,在根据本公开的亲本多肽的变体中,当在相同条件下测量时,由表达所述变体的重组细胞在细胞外产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比率高于由表达所述亲本多肽的重组细胞在细胞外产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比率。优选地,由表达所述变体的重组细胞在细胞外产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比率是由表达所述亲本多肽的重组细胞在细胞外产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比率的至少1.1倍,或至少1.2倍、1.5倍,或至少2倍、2.5倍、3倍、3.5倍、4倍、5倍、6倍、7倍、8倍、9倍,或至少10倍、20倍、30倍、50倍、100倍、1000倍或更多倍。
在一个实施方式中,在根据本公开的亲本多肽的变体中,当在相同条件下测量时,由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比率高于由表达所述亲本多肽的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比率。优选地,由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比率是由表达所述亲本多肽的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比率的至少1.1倍,或至少1.2倍、1.5倍,或至少2倍、2.5倍、3倍、3.5倍、4倍、5倍、6倍、7倍、8倍、9倍,或至少10倍、20倍、30倍、50倍、100倍、1000倍或更多倍。在本公开的上下文中,总甜菊糖苷包括莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙D、莱鲍迪甙M、甜菊苷、甜菊双糖苷、甜茶苷和甜菊醇-13-单苷。
在一个实施方式中,在根据本公开的亲本多肽的变体中,当在相同条件下测量时,由表达所述变体的重组细胞在细胞外产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比率高于由表达所述亲本多肽的重组细胞在细胞外产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比率。优选地,由表达所述变体的重组细胞在细胞外产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比率是由表达所述亲本多肽的重组细胞在细胞外产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比率的至少1.1倍,或至少1.2倍、1.5倍,或至少2倍、2.5倍、3倍、3.5倍、4倍、5倍、6倍、7倍、8倍、9倍,或至少10倍、20倍、30倍、50倍、100倍、1000倍或更多倍。在本公开的上下文中,总甜菊糖苷包括莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙D、莱鲍迪甙M、甜菊苷、甜菊双糖苷、甜茶苷和甜菊醇-13-单苷。
在本公开的上下文中,措辞“总甜菊糖苷”是指由重组细胞产生的甜菊糖苷的总量,所述甜菊糖苷包括但不限于莱鲍迪甙M、莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙D、甜菊苷、甜菊双糖苷、甜茶苷和甜菊醇-13-单苷。在一个实施方式中,总甜菊糖苷的摩尔浓度是指莱鲍迪甙M、莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙D、甜菊苷、甜菊双糖苷、甜茶苷和甜菊醇-13-单苷的摩尔浓度的总和。
在一个实施方式中,其中变体具有甜菊糖苷转运介导活性的亲本多肽的变体是包含这样的氨基酸序列的变体,所述氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含对与根据SEQ ID NO:3的氨基酸序列中的任何氨基酸对应的氨基酸残基的至少一个修饰,其中当在相同条件下测量时:
a)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少0.1;和/或
b)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比;和/或
c)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比;
其中参考细胞是表达所述亲本多肽的重组细胞。在第一方面的一个实施方式中,变体中的氨基酸序列修饰发生在所述序列的一部分中,所述部分当在重组细胞中表达时与螺旋跨膜区相对应。
在一个实施方式中,该变体包含这样的氨基酸序列,所述氨基酸序列当与SEQ IDNO:3所示的氨基酸序列比对时包含对与在根据SEQ ID NO:3的氨基酸序列中14-67位;135-156位;159-160位;199-215位;255-258位;262-284位;291-312位;314-328位;375-390位;407-429位;852-869位;890-908位;958-980位;986-1014位;1012-1021位;1059-1062位;1067-1080位;1104-1125位;1127-1128位处的任何氨基酸对应的氨基酸残基的至少一个修饰,所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
在一个实施方式中,本公开提供了一种亲本多肽的变体,其中所述变体具有甜菊糖苷转运介导活性,任选地为如前文所述的变体,其中所述变体包含的氨基酸序列当与SEQID NO:3所示的氨基酸序列比对时包含对与以下位置的氨基酸中的任何氨基酸对应的氨基酸残基的至少一个修饰:
15、19、26、29、31、32、33、37、46、56、59、107,135、136、141、145、148、150、151、153、199、200、204、206、207、210、211、255、257、258、262、267、268、272、273、276、277、278、281、282、283、284、292、294、296、297、298、299、300、302、303、306、307、309、310、311、315、318、319、320、321、322、323、324、326、328、375、376、378、379、380、382、384、386、387、389、408、410、411、413、414、415、416、417、419、420、421、422、423、424、425、427、428、429、853、854、857、859、862、864、869、890、891、892、894、903、906、968、969、972、974、977、986、996、998、999、1001、1003、1004、1010、1012、1016、1017、1018、1019、1020、1021、1059、1060、1061、1062、1063、1075、1076、1107、1108、1111、1112、1115、1118、1120、1123、1127、1128、1179、1200,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
在一个实施方式中,变体的氨基酸序列中的修饰是取代、添加或缺失。
在一个实施方式中,根据本公开的变体包含这样的氨基酸序列,所述氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含以下中的一者或多者
在15位处的A或V、在19位处的G、在26位处的Q或W、在29位处的F、在31位处的Y或A、在32位处的N、在33位处的I、在37位处的G、在46位处的T、在56位处的T、在59位处的L、在107位处的R、在135位处的C、在136位处的Y、在141位处的K、在145位处的I、在148位处的Q、在150位处的L、在151位处的G、在153位处的L或P、在199位处的T、在200位处的Y、在204位处的F、在206位处的I、在207位处的W、在210位处的G或V、在211位处的L、在255位处的A、在257位处的C或L、在258位处的N或Q或S、在262位处的F或I、在267位处的G或L、在268位处的Q或S或T、在272位处的G、在273位处的Y、在276位处的G、在277位处的S、在278位处的V、在281位处的N、在282位处的N、在283位处的F、在284位处的G或S、在292位处的T、在294位处的T、在296位处的T、在297位处的S、在298位处的K或L、在299位处的L或T或V、在300位处的M、在302位处的F或Q或S或T或V、在303位处的M或R或T、在306位处的F或I或M或S、在307位处的I或L、在309位处的M、在310位处的C或N、在311位处的T或W、在315位处的A、在318位处的K、在319位处的K、在320位处的A、在321位处的N、在322位处的A或E或L或V、在323位处的W、在324位处的A、在326位处的E、在328位处的E、在375位处的F或K或H或L或N、在376位处的W、在378位处的I或N或T或V、在379位处的Y、在380位处的E或R、在382位处的G或S或T或W、在384位处的G或N或S或T、在386位处的I或L、在387位处的A、在389位处的M、在408位处的G、在410位处的A、在411位处的F或G、在413位处的I、在414位处的F或G或R、在415位处的V、在416位处的W、在417位处的A或S或T或W、在419位处的G或M、在420位处的G或S、在421位处的F或I、在422位处的M、在423位处的A或Q、在424位处的L或S、在425位处的A或H或L或M或V、在427位处的M、在428位处的M、在429位处的M或S、在853位处的V、在854位处的G或S、在857位处的P、在859位处的A或P或S、在862位处的T、在864位处的A、在869位处的V、在890位处的P、在891位处的T、在892位处的F或V、在894位处的Q或Y、在903位处的N、在906位处的V、在968位处的Q、在969位处的N、在972位处的Q、在974位处的Q、在977位处的A或Q、在986位处的H、在996位处的Y、在998位处的A或G、在999位处的N或T、在1001位处的Y、在1003位处的I、在1004位处的T、在1010位处的T、在1012位处的L、在1016位处的E、在1017位处的A、在1018位处的L或V、在1019位处的G、在1020位处的A、在1021位处的A或N或W、在1059位处的E、在1060位处的T、在1061位处的G、在1062位处的L、在1063位处的L、在1075位处的S或L、在1076位处的A或G、在1107位处的Y、在1108位处的K或Q、在1111位处的K、在1112位处的N、在1115位处的G、在1118位处的A或F或W、在1120位处的M、在1123位处的P、在1127位处的A或N、在1128位处的D、在1179位处的N、在1200位处的I,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
在一个优选的实施方式中,根据第一方面的变体包含这样的氨基酸序列,所述氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含对与根据SEQ ID NO:3的氨基酸序列中的任何氨基酸对应的氨基酸残基的至少两个修饰,或当与亲本多肽或另一参考多肽的氨基酸序列比对时包含对与所述亲本多肽或另一参考多肽的氨基酸序列中的任何氨基酸对应的氨基酸残基的至少两个修饰,其中当在相同条件下测量时:
a)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少1.2;和/或
b)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比是由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比的至少1.2倍;和/或
c)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比是由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比的至少1.2倍;
其中所述至少两个修饰是对与以下位置的氨基酸中的任何氨基酸相对应的氨基酸残基的取代
322、375、376、378、382、384、386、420、421、424、425、429、890、891、969、977、1060、1107、1111、1112、1115、1118、1120、1179,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的,其中参考细胞是表达所述亲本多肽的重组细胞。
优选地,所述变体包含这样的氨基酸序列,所述氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含以下中的一者或多者
322位处的A或E或L或V、375位处的F或K或H或L或N、376位处的W、378位处的I或N或T或V、382位处的G或S或T或W、384位处的G或N或S或T、386位处的I或L、420位处的G或S、421位处的F或I、424位处的L或S、425位处的A或H或L或M或V、429位处的M或S、890位处的P、891位处的T、969位处的N、977位处的A或Q、1060位处的T、1107位处的Y、1111位处的K、1112位处的N、1115位处的G、1118位处的A或F或W、1120位处的M、1179位处的N,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
在一个实施方式中,根据第一方面的变体包含这样的氨基酸序列,所述氨基酸序列当与SEQ ID NO:3所示的氨基酸序列或与亲本多肽或另一参考多肽的氨基酸序列比对时,包含如在本文公开的实施方式(实施方式12)中指示的修饰的组合。
在第一方面的一个实施方式中,亲本多肽与SEQ ID NO:3所示的氨基酸序列具有至少10%、至少20%、至少30%、至少40%、至少50%的序列同一性。优选地,亲本多肽与SEQID NO:3所示的氨基酸序列具有至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%的序列同一性。在一个实施方式中,亲本多肽包含SEQ ID NO:3所示的氨基酸序列。在第一方面的另一个实施方式中,变体多肽与亲本多肽的氨基酸序列(例如与SEQID NO:3所示的氨基酸序列)具有至少10%、至少20%、至少30%、至少40%、至少50%的序列同一性。优选地,变体多肽与亲本多肽的氨基酸序列具有至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或甚至至少99%的序列同一性。
可以使用数学算法来完成两个序列之间的序列比较和序列同一性百分比确定。本领域技术人员将意识到事实上几种不同的计算机程序可用于比对两个序列和确定两个序列之间的同一性(Kruskal,J.B.(1983),在D.Sankoff和J.B.Kruskal(编辑),Time warps,string edits and macromolecules:the theory and practice of sequencecomparison,第1-44页,Addison Wesley中的An overview of sequence comparison)。可以使用用于两个序列的比对的Needleman和Wunsch算法来确定两个氨基酸序列之间或两个核苷酸序列之间的序列同一性百分比(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列都可以通过算法来进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE中实现。出于本公开的目的,使用来自EMBOSS程序包的NEEDLE程序(2.8.0版或更高版本,EMBOSS:The European MolecularBiology Open Software Suite(2000)Rice,P.Longden,I.和Bleasby,A.Trends inGenetics 16,(6),第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列,使用EBLOSUM62来用于取代矩阵。对于核苷酸序列,使用EDNAFULL。所使用的任选参数是为10的空位开放罚分和为0.5的空位延伸罚分。技术人员将理解,当使用不同的算法时,所有这些不同的参数将产生略微不同的结果,但是两个序列的总体同一性百分比不会显著改变。
如上所述通过程序NEEDLE进行比对后,查询序列与本公开序列之间的序列同一性百分比计算如下:比对中对应位置(其显示两个序列中的相同氨基酸或相同核苷酸)的数目除以减去比对中的空位总数后的比对总长度。如本文所定义的同一性可以通过使用NOBRIEF选项从NEEDLE获得,并在程序的输出中标记为“最长同一性”。
本公开的核酸序列和蛋白质序列可以进一步用作“查询序列”以对公共数据库执行搜索,以例如鉴定其他家族成员或相关序列。可以使用Altschul等人,(1990)J.Mol.Biol.215:403-10的BLASTN和BLASTX程序(2.0版)来执行此类搜索。可以用得分=100、字长=12的BLASTN程序来执行BLAST核苷酸搜索,以获得与本公开的核酸分子同源的核苷酸序列。可以用得分=50、字长=3的BLASTX程序来执行BLAST蛋白质搜索,以获得与本公开蛋白质分子同源的氨基酸序列。为了获得用于比较目的的空位比对,可以利用空位BLAST,如在Altschul等人,(1997)Nucleic Acids Res.25(17):3389-3402中所述。当利用BLAST和Gapped BLAST程序时,可以使用相应程序(例如,BLASTX和BLASTN)的默认参数。参见国家生物技术信息中心(National Center for Biotechnology Information)的主页http://www.ncbi.nlm.nih.gov/。
产生变体多肽的方法
在第二方面中,本公开提供了一种产生根据本公开的变体多肽的方法,所述方法包括:
a)提供亲本多肽,任选地其中所述亲本多肽具有甜菊糖苷转运介导活性;
b)修饰所述亲本多肽序列中的至少一个氨基酸残基以产生变体多肽序列,任选地其中在所述亲本多肽序列中的修饰发生在序列的与螺旋跨膜区对应的部分中;以及任选地
c)选择当在重组细胞中表达时具有甜菊糖苷转运介导活性并且具有以下特征的变体多肽:
i)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少0.1;和/或
ii)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比;和/或
iii)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比;
其中参考细胞是表达所述亲本多肽的重组细胞,任选地其中根据i)、ii)和iii)的比率中的莱鲍迪甙M、莱鲍迪甙A和总甜菊糖苷的摩尔浓度是细胞外产生的摩尔浓度。
根据第二方面的方法的步骤a)包括提供亲本多肽。亲本多肽通常是如本文先前所定义的。通常,在第二方面的方法中用作模板的亲本多肽至少在一定程度上具有介导甜菊糖苷跨细胞膜转运的能力。优选地,亲本多肽是如本文先前所定义的转运蛋白。在一个实施方式中,亲本多肽是如本文先前所定义的ABC转运体。
根据第二方面的方法的步骤b)包括修饰亲本多肽序列中的至少一个氨基酸残基以产生变体多肽序列。在第二方面的一个实施方式中,变体中的氨基酸序列修饰发生在所述序列的一部分中,所述部分当在重组细胞中表达时与螺旋跨膜区相对应。在一个实施方式中,可以优选地在跨膜区中引入突变,并且在工程改造ABC转运体的情况下,优选地在跨膜区中以及任选地在跨膜结构域与ATP结合盒结构域之间的位置中引入突变。
在一个实施方式中,步骤b)包括修饰亲本多肽序列中的至少一个氨基酸残基以产生变体多肽序列,优选地包括鉴定亲本多肽中的一个或多个待修饰的氨基酸残基,以及修饰所述亲本多肽序列中的至少一个氨基酸残基以产生变体多肽序列。为了鉴定出其中可引入修饰的有希望的位置,可以使用包含其二级、三级和/或四级结构的亲本多肽的模型,优选地,由亲本多肽在生物膜中假定的结构的模型。例如,可以使用膜转运蛋白的晶体结构。在没有晶体结构可用的情况下,可以使用同源性建模程序,例如Yasara或SWISS-MODEL。SWISS-MODEL是一种全自动蛋白质结构同源性建模服务器,其可通过ExPASy网络服务器访问或从程序DeepView(Swiss Pdb-Viewer)访问,例如可在https://swissmodel.expasy.org/处访问。Yasara可在http://www.yasara.org/homologymodeling.htm得到。在没有晶体结构或合适的结构同源性模型可用于指定有希望的位置的情况下,例如在参与甜菊糖苷结合和/或靶分子特异性的跨膜区中,例如可以使用已知的结构和/或通过运行跨膜预测程序例如TMHMM(http://www.cbs.dtu.dk/services/TMHMM/),通过多序列分析来估计包含蛋白质转运体(例如ABC转运体)的跨膜区域(Krogh等人,2001;Sonnhammer等人,1998)。在不能可靠地预测所述区域中的有希望的位置的情况下,可以例如使用单位点饱和诱变、部分饱和诱变或通过进行丙氨酸扫描来扫描大量位置,以找到用于在第一工程改造轮次中甜菊糖苷化合物的转运体特异性和/或选择性工程改造的热点位置。在随后的诱变和筛选轮次中,可进一步提高转运体性能,例如通过预先确定的热点位置的组合诱变,在先前轮次中未涵盖全部氨基酸多样性的情况下通过在热点位置处探索更多的氨基酸多样性,或通过两个或更多个热点位置的组合。一旦鉴定出用于修饰的有希望位置,就修饰这些位置中的氨基酸,例如用其他氨基酸取代,或者从所述多肽序列中缺失氨基酸或将氨基酸添加到所述多肽序列中,优选地用预期积极地改进变体跨膜转运甜菊糖苷(例如莱鲍迪甙M)的能力的其他氨基酸取代。一旦已经建立了变体的多肽序列,多肽变体就可以根据本领域技术人员已知的方法合成,并根据技术人员已知的方法在重组细胞中表达。
根据第二方面的方法的步骤c)包括选择当在相同条件下测量时,当在重组细胞中表达时具有甜菊糖苷转运介导活性并具有以下特征的变体多肽:
i)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少0.1;和/或
ii)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比;和/或
iii)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比;
其中参考细胞是表达所述亲本多肽的重组细胞,任选地其中根据i)、ii)和iii)的比率中的莱鲍迪甙M、莱鲍迪甙A和总甜菊糖苷的摩尔浓度是细胞外产生的摩尔浓度。i、ii、iii中提及的比率可以如在本发明的第一方面中以及在本公开的实施方式的列表(实施方式15至18)中所描述的那样确定。
在根据第二方面的一个实施方式中,在步骤b)中修饰亲本多肽序列中的至少一个氨基酸残基以产生变体多肽序列包括:
I)将亲本多肽的氨基酸序列与SEQ ID NO:3所示的氨基酸序列进行比对,
II)修饰,例如取代、添加或缺失与以下位置的氨基酸中的任何氨基酸对应的一个或多个氨基酸残基,
15、19、26、29、31、32、33、37、46、56、59、107,135、136、141、145、148、150、151、153、199、200、204、206、207、210、211、255、257、258、262、267、268、272、273、276、277、278、281、282、283、284、292、294、296、297、298、299、300、302、303、306、307、309、310、311、315、318、319、320、321、322、323、324、326、328、375、376、378、379、380、382、384、386、387、389、408、410、411、413、414、415、416、417、419、420、421、422、423、424、425、427、428、429、853、854、857、859、862、864、869、890、891、892、894、903、906、968、969、972、974、977、986、996、998、999、1001、1003、1004、1010、1012、1016、1017、1018、1019、1020、1021、1059、1060、1061、1062、1063、1075、1076、1107、1108、1111、1112、1115、1118、1120、1123、1127、1128、1179、1200,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
本公开的第一方面的优选实施方式也可以应用于本公开的第二方面。
本公开还涉及一种编码如在第一方面中所公开的亲本多肽的变体的核酸序列。编码根据本公开的变体多肽的核酸序列可以是“分离的核酸”。“分离的核酸”或“分离的多核苷酸”是与两个编码序列均不紧邻的DNA或RNA,该核酸或多核苷酸在其所来源于的生物体的天然存在的基因组中与该两个编码序列紧邻(一个位于5'末端,另一个位于3'末端)。因此,在一个实施方式中,分离的核酸包括与编码序列紧邻的5'非编码(例如,启动子)序列中的一些或全部。此外,“分离的核酸片段”是不作为片段天然存在并且在天然状态下不能被发现的核酸片段。
本公开还涉及一种核酸构建体,所述核酸构建体包含编码如本文所公开的变体多肽的多核苷酸序列。
术语“核酸构建体”在本文中表示单链或双链核酸分子,其来源于天然存在的基因或经过修饰以含有这样的核酸区段,所述核酸区段以天然不存在的方式组合和并置。核酸构建体可以被分离、合成制备、或诱变。当核酸构建体含有表达编码序列所需的所有控制序列时,术语核酸构建体与术语“表达盒”同义,其中所述控制序列可操作地连接至所述编码序列。
如本文所公开的核酸构建体可以是表达盒,其中编码如本文所公开的变体多肽的核酸可操作地连接至至少一个控制序列,该至少一个控制序列能够指导根据第一方面的变体在合适的重组细胞中表达。
术语“表达”包括参与一种或多种多肽产生的任何步骤,所述步骤包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。术语“活性增加”或“过表达”在本文中可互换使用。
“表达盒”包含编码多肽的核酸,该核酸可操作地连接至允许所述核酸在细胞中或体外表达的合适控制序列。通常,表达盒将包含编码多肽的多核苷酸,该多核苷酸可操作地连接至至少启动子和终止子序列。
表达盒可以是自主复制载体(例如质粒),即其复制独立于基因组复制的载体。或者,该表达盒可以是这样的表达盒,所述表达盒当被引入细胞中时完全或部分地整合到细胞的基因组中。在后一种情况下,该表达盒可包含一个或多个靶向序列以指导到基因组中的整合。
表达盒可包含或可不包含一个或多个选择性标记,该一个或多个选择性标记允许容易地选择转化细胞。
“选择性标记”是这样的基因,该基因允许选择用此类基因转化的细胞并提供杀生物剂或病毒抗性、重金属抗性、营养缺陷体的原营养等。
优选的选择性标记包括但不限于那些赋予药物抗性或补充细胞缺陷的标记。它们包括例如能用于转化大多数丝状真菌和酵母的通用标记基因,例如编码乙酰胺酶的核酸,或提供抗生素抗性的基因。
或者,可以使用特定的选择性标记,例如需要对应的突变株的营养缺陷型标记。优选地,在引入表达构建体后使选择标记从转化的细胞中缺失,以获得不含选择性标记基因的转化细胞。
术语“选择性标记”适用范围扩及用于筛选的标记基因,即一旦被引入细胞中就赋予细胞可见表型并导致细胞看起来不同的标记基因。用于筛选的标记的示例是编码荧光蛋白的基因,该基因使细胞在适当的光源下发荧光。如本文所用的术语“控制序列”是指在特定生物体内或体外参与编码序列表达的调节的组分。控制序列的示例是转录起始序列、终止序列、启动子、前导序列、信号肽、前肽、前原肽或增强子序列;夏因-达尔加诺序列(Shine-Delgarno sequence)、阻遏物或激活物序列;有效的RNA处理信号,例如剪接和多腺苷酸化信号;稳定化细胞质mRNA的序列;增强翻译效率的序列(例如,核糖体结合位点);增强蛋白质稳定性的序列;以及当需要时,增强蛋白质分泌的序列。
本文所用的术语“可操作地连接”是指两个或更多个组分(例如核酸序列或多肽序列)物理连接并与彼此具有功能关系,该功能关系允许该两个或更多个组分以其预期方式起作用。例如,如果启动子能够调节编码序列的转录或表达,则该启动子可操作地连接至编码序列,在这种情况下该编码序列应被理解为处于该启动子的“控制之下”。
重组细胞
在第三方面中,本公开提供了一种能够产生甜菊糖苷的重组细胞,其中所述细胞包含编码亲本多肽的变体的核酸,其中所述变体具有甜菊糖苷转运介导活性,其中所述变体包含的氨基酸序列当与所述亲本多肽的氨基酸序列比对时包含对与所述亲本多肽的氨基酸序列中的任何氨基酸相对应的氨基酸残基的至少一个修饰,其中当在相同条件下测量时:
a)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少0.1;和/或
b)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比;和/或
c)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比;
其中参考细胞是表达所述亲本多肽的重组细胞。
当关于核酸或蛋白质使用时,术语“重组”是指该核酸或蛋白质如果与其天然形式相比则已经通过人工干预进行了序列修饰。当涉及细胞时,术语“重组”表示该细胞的基因组如果与其天然形式相比则已经通过人为干预进行了序列修饰。术语“重组”与“经遗传修饰的”同义。
在第三方面的细胞中使用的变体多肽和亲本多肽是根据本公开的第一方面中描述的那些,并且本公开的第一和第二方面的优选实施方式也适用于第三方面。
根据第三方面的重组细胞包含编码如本文所公开的变体多肽的多核苷酸或如本文所公开的核酸构建体。术语“多核苷酸”、“核酸”在本文可互换使用。
可以通过常规转化或转染技术将如本文所公开的核酸构建体或多核苷酸引入细胞,例如原核或真核细胞中。在本文中,术语“转化”和“转染”旨在指代本领域技术人员众所周知的用于将外来核酸(例如,DNA)引入重组细胞中的多种本领域公认的技术。用于转化或转染重组细胞的合适方法可以在Sambrook等人(Molecular Cloning:A LaboratoryManual,第二版,Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,1989),Davis等人,Basic Methods in MolecularBiology(1986)和其他实验室手册中找到。
如本文所定义的“细胞”是适用于遗传操纵的生物体,并且其可以以可用于目标产物工业生产的细胞密度进行培养。合适的生物体可以是微生物,例如可以保持在发酵装置中的微生物。关于本公开,应当理解的是,生物(诸如微生物、真菌、藻类或植物)也包括具有相同生理性质的此类物种的同义词或基名(basonyms),如由国际原核生物命名法(International Code of Nomenclature of Prokaryotes)或关于藻类、真菌和植物的国际命名法(International Code of Nomenclature)(Melbourne法)所限定的。细胞可以是在自然界中存在的细胞,或者是源自亲本细胞的遗传操纵或经典诱变后的细胞。
本文所公开的细胞可以是原核、古细菌或真核细胞。
原核细胞可以是但不限于细菌细胞。细菌细胞可以是革兰氏阴性或革兰氏阳性细菌。细菌的示例包括但不限于属于以下属的细菌:芽孢杆菌属(Bacillus)(例如,枯草芽孢杆菌(B.subtilis)、解淀粉芽孢杆菌(B.amyloliquefaciens)、地衣芽孢杆菌(B.licheniformis)、潘蒂芽孢杆菌(B.puntis)、巨大芽孢杆菌(B.megaterium)、耐盐芽孢杆菌(B.halodurans)、短小芽孢杆菌(B.pumilus))、不动杆菌属(Acinetobacter)、诺卡氏菌属(Nocardia)、黄色杆菌属(Xanthobacter)、埃希氏菌属(Escherichia)(例如,大肠杆菌(E.coli))、链霉菌属(Streptomyces)、欧文氏菌属(Erwinia)、克雷伯氏菌属(Klebsiella)、沙雷氏菌属(Serratia)(例如,粘质沙雷氏菌(S.marcessans))、假单胞菌属(Pseudomonas)(例如,铜绿假单胞菌(P.aeruginosa)、荧光假单胞菌(P.fluorescens))、沙门氏菌属(Salmonella)(例如,鼠伤寒沙门氏菌(S.typhimurium)、伤寒沙门氏菌(S.typhi))、鱼腥藻属(Anabaena)、柄杆菌属(Caulobactert)、葡糖杆菌属(Gluconobacter)、红杆菌属(Rhodobacter)、副球菌属(Paracoccus)、短杆菌属(Brevibacterium)、棒状杆菌属(Corynebacterium)、根瘤菌属(Rhizobium)(中华根瘤菌属(Sinorhizobium))、黄杆菌属(Flavobacterium)、克雷伯氏菌属(Klebsiella)、肠杆菌属(Enterobacter)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、甲基杆菌属(Methylobacterium)、葡萄球菌属(Staphylococcus)。细菌还包括但不限于光合细菌(例如,绿色非硫细菌、绿色硫细菌、紫色硫细菌和紫色非硫细菌)。
真核细胞可以是但不限于真菌(例如酵母或丝状真菌)、藻类、植物细胞、细胞系。
真核细胞可以是真菌,例如丝状真菌或酵母。丝状真菌菌株包括但不限于以下菌株:支顶孢属(Acremonium)、曲霉属(Aspergillus)(例如,黑曲霉(A.niger)、米曲霉(Aoryzae)、构巢曲霉(A.nidulans))、伞菌属(Agaricus)、短梗霉属(Aureobasidium)、鬼伞属(Coprinus)、隐球菌属(Cryptococcus)、棒囊壳属(Corynascus)、金孢子菌属(Chrysosporium)、丝梗霉属(Filibasidium)、镰刀菌属(Fusarium)、腐质霉属(Humicola)、巨座壳属(Magnaporthe)、红曲霉属(Monascus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、被孢霉属(Mortierella)、新美鞭菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)(例如,产黄青霉(P.chrysogenum)、沙门柏干酪青霉(P.camemberti))、瘤胃壶菌属(Piromyces)、平革菌属(Phanerochaete)、侧耳属(Pleurotus)、柄孢壳菌属(Podospora)、密孔菌属(Pycnoporus)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、粪壳菌属(Sordaria)、篮状菌属(Talaromyces)、踝节菌属(Rasamsonia)(例如,踝节菌属埃默森蓝状菌(Rasamsoniaemersonii))、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)和木霉属(Trichoderma)。
酵母细胞可以选自以下属:酵母属(Saccharomyces)(例如,酿酒酵母(S.cerevisiae)、贝酵母(S.bayanus)、巴氏酵母(S.pastorianus)、卡氏酵母(S.carlsbergensis))、克鲁维酵母属(Kluyveromyces)、假丝酵母属(Candida)(例如,皱褶假丝酵母(C.rugosa)、拉考夫假丝酵母(C.revkaufi)、铁红假丝酵母(C.pulcherrima)、热带假丝酵母(C.tropicalis)、产朊假丝酵母(C.utilis))、毕赤酵母属(Pichia)(例如,巴斯德毕赤酵母(P.pastoris))、裂殖酵母属(Schizosaccharomyces)、伊萨酵母属(Issatchenkia)、接合酵母属(Zygosaccharomyces)、汉逊酵母(Hansenula)、克勒克酵母属(Kloeckera)、许旺酵母属(Schwanniomyces)、以及耶氏酵母属(Yarrowia)(例如,解脂耶氏酵母(Y.lipolytica),原来被分类为解脂假丝酵母(Candida lipolytica))。
细胞可以是藻类、微藻或海洋真核生物。所述细胞可以是网黏菌纲细胞,优选地为破囊壶菌目的,更优选地为破囊壶菌家族的,更优选选地为选自由以下项组成的组的属的成员:橙黄壶菌属(Aurantiochytrium)、Oblongichytrium、裂殖壶菌属(Schizochytrium)、壶菌属(Thraustochytrium)、和吾肯氏壶菌属(Ulkenia),甚至更优选地裂殖壶菌属(Schizochytrium sp.)ATCC编号20888。
在一个实施方式中,如本文所公开的重组细胞属于以下属中的一者:酵母属、曲霉属、毕赤酵母属、克鲁维酵母属、假丝酵母属、汉逊酵母属(Hansenula)、腐质霉属(Humicola)、伊萨酵母属、毛孢子菌属(Trichosporon)、酒香酵母属(Brettanomyces)、管囊酵母属(Pachysolen)、耶氏酵母属、Yamadazyma或埃希氏菌属,例如酿酒酵母细胞、解脂耶氏酵母细胞、克鲁斯假丝酵母(Candida krusei)细胞、东方伊萨酵母细胞或大肠杆菌细胞。
在一个实施方式中,细胞表达或过表达根据第一方面的变体多肽。在本文中,“过表达的”、“过表达”等意味着重组宿主细胞比不过表达所述多肽的对应细胞表达更多的所述多肽,或者替代地,所述多肽在通常不表达所述蛋白质的细胞中表达。或者替代地,可以通过表达具有较高比活性的变体多肽来实现过表达。本领域技术人员知道如何实现如本文所定义的变体多肽的过表达。
通常,根据本公开的重组细胞能够产生糖基化的二萜,例如甜菊糖苷。例如,根据本公开的重组细胞可以能够产生例如以下物质中的一种或多种:甜菊醇-13-单苷、甜菊醇-19-单苷、13-[(β-D-吡喃葡萄糖基)氧)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-二苷、甜菊双糖苷、莱鲍迪甙A、莱鲍迪甙E、莱鲍迪甙D或莱鲍迪甙M。通常,重组细胞能够产生莱鲍迪甙M;莱鲍迪甙A和/或其他甜菊糖苷,包括莱鲍迪甙B、莱鲍迪甙D、甜菊苷、甜菊双糖苷、甜茶苷、甜菊醇-13-单苷中的一者或多者。
根据本公开的重组细胞可以包含编码具有UDP-糖基转移酶(UGT)活性的一种或多种多肽的一种或多种重组核酸序列。
出于本公开的目的,具有UGT活性的多肽是具有糖基转移酶活性(EC 2.4)的多肽,即可以充当用于将单糖单元从活化的核苷酸糖(也称为“糖基供体”)转移到糖基受体分子(通常是醇)的催化剂。UGT的糖基供体通常是核苷酸糖尿苷二磷酸葡萄糖(尿嘧啶-二磷酸葡萄糖、UDP-葡萄糖)。
可以选择此类附加UGT,以产生所需的甜菊糖苷。甜菊糖苷形成的示意图在Humphrey等人,Plant Molecular Biology(2006)61:47-62和Mohamed等人,J.PlantPhysiology 168(2011)1136-1141中列出。另外,图3列出了甜菊糖苷形成的示意图。
因此,根据本公开的重组细胞可以包含一个或多个重组核酸序列,所述一个或多个重组核酸序列编码以下物质:
(i)具有UGT74G1活性的多肽;
(ii)具有UGT2活性的多肽;
(ii)具有UGT85C2活性的多肽;以及
(iii)具有UGT76G1活性的多肽。
适用于在甜菊糖苷生产中使用的重组细胞可包含编码能够催化将C-13-葡萄糖加成至甜菊醇的多肽的核苷酸序列。也就是说,适用于在本公开的方法中使用的重组酵母可以包含UGT,所述UGT能够催化将甜菊醇转化成甜菊醇单苷的反应。
这种适用于在甜菊糖苷生产中使用的重组细胞可以包含编码具有由UDP-糖基转移酶(UGT)UGT85C2所示的活性的多肽的核苷酸序列,由此所述核苷酸序列在酵母转化后赋予该酵母将甜菊醇转化为甜菊醇单苷的能力。
UGT85C2活性是将葡萄糖单元转移到甜菊醇的13-OH。
因此,合适的UGT85C2可以充当尿苷5'-二磷酸葡糖基:甜菊醇13-OH转移酶,以及尿苷5'-二磷酸葡糖基:甜菊醇-19-0-葡糖苷13-OH转移酶。功能性UGT85C2多肽还可催化利用除甜菊醇和甜菊醇-19-O-葡糖苷以外的甜菊糖苷底物的葡糖基转移酶反应。此类序列在本文中可以称为UGT1序列。
适用于本公开的重组细胞可以包含编码具有UGT2活性的多肽的核苷酸序列。
具有UGT2活性的多肽是这样的多肽,所述多肽充当尿苷5'-二磷酸葡糖基:甜菊醇-13-O-葡糖苷转移酶(也称为甜菊醇-13-单葡糖苷1,2-转葡糖基酶),从而将葡萄糖部分转移至受体分子甜菊醇-13-O-葡糖苷的13-O-葡萄糖的C-2'。通常,合适的UGT2多肽还充当尿苷5'-二磷酸葡糖基:甜茶苷转移酶,从而将葡萄糖部分转移至受体分子甜茶苷的13-O-葡萄糖的C-2'。
具有UGT2活性的多肽还可以催化利用除甜菊醇13-0-葡糖苷和甜茶苷以外的甜菊糖苷底物的反应,例如,功能性UGT2多肽可以利用甜菊苷作为底物,从而将葡萄糖部分转移到19-O-葡萄糖残基的C-2'以产生莱鲍迪甙E。功能性UGT2多肽也可以利用莱鲍迪甙A作为底物,从而将葡萄糖部分转移到19-O-葡萄糖残基的C-2'以产生莱鲍迪甙D。然而,功能性UGT2多肽通常不会将葡萄糖部分转移至在C-13位处具有1,3-结合的葡萄糖的甜菊醇化合物,即通常不会发生将葡萄糖部分转移至甜菊醇1,3-二糖苷和1,3-甜菊苷。具有UGT2活性的多肽可包括UGT2多肽,该多肽可优先催化甜菊醇-13-单苷转化成甜菊双糖苷和/或催化甜茶苷转化成甜菊苷,这可有助于将生产转向莱鲍迪甙A。或者替代地,具有UGT2活性的多肽可包括UGT2多肽,其可优先催化甜菊苷转化成莱鲍迪甙E或催化甜茶苷转化成在19位处具有附加糖的化合物,这可能有助于将生产转向莱鲍迪甙M。也就是说,偏好于在13位处添加糖部分可有助于将生产转向莱鲍迪甙A,而偏好于在19位处添加糖部分可有助于将生产转向莱鲍迪甙M。特定UGT2的示例是在WO2016146711的SEQ ID NO:1、SEQ ID NO:3、SEQ IDNO:6、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:14、SEQ ID NO:17、SEQ ID NO:20、SEQ IDNO:22或SEQ ID NO:25中所述的那些。
具有UGT2活性的多肽还可从尿苷二磷酸葡萄糖以外的供体转移糖部分。例如,具有UGT2活性的多肽充当尿苷5'-二磷酸D-木糖基:甜菊醇-13-O-葡萄糖苷转移酶,从而将木糖部分转移至受体分子甜菊醇-13-O-葡糖苷的13-O-葡萄糖的C-2'。作为另一个示例,具有UGT2活性的多肽可以充当尿苷5'-二磷酸L-鼠李糖基:甜菊醇-13-0-葡糖苷转移酶,从而将鼠李糖部分转移到受体分子甜菊醇的13-O-葡萄糖的C-2'。
适用于在根据本公开的产生甜菊糖苷的方法中使用的重组细胞可以包含编码具有UGT活性的多肽的核苷酸序列,可以包含编码能够催化将C-19-葡萄糖加成至甜菊双糖苷的多肽的核苷酸序列。也就是说,本公开的重组酵母可包含UGT,其能够催化其中甜菊双糖苷转化为甜菊苷的反应。因此,此类重组酵母可能能够将甜菊双糖苷转化为甜菊苷。此类核苷酸序列的表达可以赋予重组酵母产生至少甜菊苷的能力。
因此,适用于在根据本公开的产生甜菊糖苷的方法中使用的重组细胞还可包含编码具有由UDP-糖基转移酶(UGT)UGT74G1所示的活性的多肽的核苷酸序列,由此所述核苷酸序列在酵母转化时赋予细胞将甜菊双糖苷转换为甜菊苷的能力。
合适的UGT74G1多肽可能能够将葡萄糖单元转移至甜菊醇的13-OH或19-COOH。合适的UGT74G1多肽可以充当尿苷5'-二磷酸葡糖基:甜菊醇19-COOH转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-13-O-葡糖苷19-COOH转移酶。功能性UGT74G1多肽还可以催化糖基转移酶反应,该糖基转移酶反应利用除甜菊醇、甜菊醇-13-O-葡糖苷以外的甜菊糖苷底物,或转移来自除尿苷二磷酸葡萄糖以外的供体的糖部分。此类的序列在本文中可以称为UGT3序列。
适用于在根据本公开的产生甜菊糖苷的方法中使用的重组细胞可以包含这样的核苷酸序列,所述核苷酸序列编码能够催化在甜菊苷的C-13位处的葡萄糖的C-3'的糖基化的多肽。也就是说,适用于在本公开的方法中使用的重组酵母可以包含UGT,所述UGT能够催化将甜菊苷转化为莱鲍迪甙A的反应。因此,这种重组酵母可以能够将甜菊苷转化为莱鲍迪甙A。此类核苷酸序列的表达可以赋予酵母产生至少莱鲍迪甙A的能力。
因此,适用于在根据本公开的产生甜菊糖苷的方法中使用的重组细胞还可包含编码具有由UDP-糖基转移酶(UGT)UGT76G1所示的活性的多肽的核苷酸序列,由此所述核苷酸序列在酵母转化时赋予所述酵母将甜菊苷转换为莱鲍迪甙A的能力。
合适的UGT76G1将葡萄糖部分加成到受体分子甜菊醇1,2糖苷的C-13-O-葡萄糖的C-3'。因此,UGT76G1例如充当尿苷5'-二磷酸葡糖基:甜菊醇13-0-1,2葡糖苷C-3'葡糖基转移酶,以及尿苷5'-二磷酸葡糖基:甜菊醇-19-0-葡糖基、13-0-1,2二苷C-3'葡糖基转移酶。功能性UGT76G1多肽还可以催化葡糖基转移酶反应,该葡糖基转移酶反应利用含有除了葡萄糖以外的糖的甜菊糖苷底物,例如甜菊醇鼠李糖苷和甜菊醇木糖苷。此类序列在本文中可以称为UGT4序列。UGT4可以替代地或另外地能够将RebD转换为RebM。
用于在根据本公开的产生甜菊糖苷的方法中使用的重组细胞通常包含编码至少一种具有UGT1活性的多肽、至少一种具有UGT2活性的多肽、至少一种具有UGT3活性的多肽和至少一种具有UGT4活性的多肽的核苷酸序列。这些核酸序列中的一种或多种核酸序列可以是重组的。给定的核酸可以编码具有上述活性中的一种或多种活性的多肽。例如,核酸可编码具有上述活性中的两种、三种或四种活性的多肽。优选地,用于在本公开的方法中使用的重组酵母包含UGT1、UGT2和UGT3和UGT4活性。合适的UGT1、UGT2、UGT3和UGT4序列在WO2015/007748的表1中描述。
根据本公开的重组细胞可包含两种或更多种核酸序列,该两种或更多种核酸序列编码具有任何一种UGT活性(例如UGT1、UGT2、UGT3或UGT4活性)的多肽。当根据本公开的重组细胞包含两种或更多种核酸序列,该两种或更多种核酸序列编码具有任何一种UGT活性的多肽,这些核酸序列可以相同或不同和/或可以编码相同或不同的多肽。具体地,根据本公开的重组细胞可以包含编码两个不同的UGT2多肽的核酸序列。
根据本公开的重组细胞可以包含编码以下物质中的一者或多者的一种或多种重组核苷酸序列。
具有对映-古巴焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;以及
具有对映-贝壳杉烯氧化酶活性的多肽。
根据本公开的重组细胞可包含编码具有贝壳杉烯酸13-羟化酶活性的多肽的重组核苷酸序列。
出于本公开的目的,具有对映-古巴焦磷酸合酶(EC 5.5.1.13)的多肽能够催化以下化学反应:
Figure GDA0002911608450000391
该酶具有一种底物香叶酰香叶酰焦磷酸(geranylgeranyl pyrophosphate),和一种产物对映-古巴焦磷酸(ent-copalyl pyrophosphate)。该酶参与赤霉素生物合成。该酶属于异构酶家族,特别是分子内裂解酶的类别。该酶类别的学名是对映-古巴焦磷酸裂解酶(脱环)。常用的其他名称包括有对映-古巴焦磷酸合酶、对映-贝壳杉烯合酶A和对映-贝壳杉烯合酶A。
编码对映-古巴焦磷酸合酶的合适核酸序列可例如包含WO2015/007748的SEQID.NO:1、SEQ ID.NO:3、SEQ ID.NO:5、SEQ ID.NO:7、SEQ ID.NO:17、SEQ ID.NO:19、SEQID.NO:59、SEQ ID.NO:61、SEQ ID.NO:141、SEQ ID.NO:142、SEQ ID.NO:151、SEQ ID.NO:152、SEQ ID.NO:153、SEQ ID.NO:154、SEQ ID.NO:159、SEQ ID.NO:160、SEQ ID.NO:182或SEQ ID.NO:184所示的序列。
出于本公开的目的,具有对映-贝壳杉烯合酶活性(EC 4.2.3.19)的多肽是能够催化以下化学反应的多肽:
对映-古巴焦磷酸对映-贝壳杉烯+二磷酸盐
因此,该酶具有一种底物对映-古巴焦磷酸和两种产物对映-贝壳杉烯和焦磷酸酯。
该酶属于裂解酶家族,尤其是作用于磷酸盐的那些碳-氧裂解酶。该酶类别的学名是对映-古巴焦磷酸焦磷酸裂解酶(环化,形成对映-贝壳杉烯)。常用的其他名称包括对映-贝壳杉烯合酶B、对映-贝壳杉烯合成酶B、对映-古巴焦磷酸焦磷酸裂解酶,以及(环化)。该酶参与二萜类生物合成。
编码对映-贝壳杉烯合酶的合适的核酸序列可以例如包含WO2015/007748的SEQID.NO:9、SEQ ID.NO:11、SEQ ID.NO:13、SEQ ID.NO:15、SEQ ID.NO:17、SEQ ID.NO:19、SEQID.NO:63、SEQ ID.NO:65、SEQ ID.NO:143、SEQ ID.NO:144、SEQ ID.NO:155、SEQ ID.NO:156、SEQ ID.NO:157、SEQ ID.NO:158、SEQ ID.NO:159、SEQ ID.NO:160、SEQ ID.NO:183或SEQ ID.NO:184所示的序列。
对映-古巴焦磷酸合酶也可具有与同一蛋白质分子相关的不同对映-贝壳杉烯合酶活性。由对映-贝壳杉烯合酶催化的反应是赤霉素生物合成途径中的下一步。两种类型的酶活性是不同的,并且用于抑制蛋白质的对映-贝壳杉烯合酶活性的定点诱变导致了对映-古巴焦磷酸酯的积聚。
因此,在根据本公开的重组细胞中使用的单个核苷酸序列可以编码具有对映-古巴焦磷酸合酶活性和对映-贝壳杉烯合酶活性的多肽。或者,两种活性可以被编码为两个不同的单独核苷酸序列。
出于本公开的目的,具有对映-贝壳杉烯氧化酶活性(EC 1.14.13.78)的多肽是能够催化对映-贝壳杉烯的4-甲基的三次连续氧化以产生贝壳杉烯酸的多肽。这种活性通常需要细胞色素P450的存在。
编码对映-贝壳杉烯氧化酶的合适核酸序列可以例如包含WO2015/007748的SEQID.NO:21、SEQ ID.NO:23、SEQ ID.NO:25、SEQ ID.NO:67、SEQ ID.NO:85、SEQ ID.NO:145、SEQ ID.NO:161、SEQ ID.NO:162、SEQ ID.NO:163、SEQ ID.NO:180或SEQ ID.NO:186所示的序列。
编码贝壳杉烯酸13-羟化酶的合适的核酸序列可以例如包含如WO2015/007748的SEQ ID.NO:27、SEQ ID.NO:29、SEQ ID.NO:31、SEQ ID.NO:33、SEQ ID.NO:69、SEQ ID.NO:89、SEQ ID.NO:91、SEQ ID.NO:93、SEQ ID.NO:95、SEQ ID.NO:97、SEQ ID.NO:146、SEQID.NO:164、SEQ ID.NO:165、SEQ ID.NO:166、SEQ ID.NO:167或SEQ ID.NO:185所示的序列。其他合适的贝壳杉烯酸13-羟化酶是WO2017/060318或PCT/EP2017/081390中所述的变体多肽。
根据本公开的重组细胞可以包含编码具有如本文所公开的细胞色素p450还原酶活性(CPR)的多肽的重组核酸序列。也就是说,根据本公开的重组细胞可以能够表达编码具有细胞色素p450还原酶活性的多肽的核苷酸序列。
在根据本公开的重组细胞中,该重组细胞产生香叶酰香叶酰焦磷酸(GGPP)的能力可以被上调。在本公开的上下文中,上调意味着重组细胞比等同的非重组细胞产生更多的GGPP。
因此,根据本公开的重组细胞可以包含一种或多种编码羟甲基戊二酰-辅酶A还原酶、法呢基-焦磷酸合酶和香叶酰香叶酰二磷酸合酶的核苷酸序列,由此所述一种或多种核苷酸序列在转化微生物后赋予该微生物产生升高水平的GGPP的能力。因此,根据本公开的重组细胞可包含一种或多种编码羟甲基戊二酰辅酶A还原酶、法呢基-焦磷酸合成酶和香叶酰香叶酰二磷酸合酶中的一种或多种的重组核酸序列。
因此,根据本公开的重组细胞可包含编码以下物质中的一种或多种的核酸序列:
具有羟甲基戊二酰-辅酶A还原酶活性的多肽;
具有法呢基-焦磷酸合酶活性的多肽;
具有香叶酰香叶酰二磷酸合酶活性的多肽。
本文所定义的“细胞”是适用于遗传操纵的生物体,并且是可以以可用于目标产物工业生产的细胞密度进行培养的生物体。合适的细胞可以是微生物,例如可以保持在发酵装置中的微生物。细胞可以是在自然界中存在的细胞,或者是源自亲本细胞的遗传操纵或经典诱变后的细胞。
在本文中,重组细胞是用如本文所定义的一种或多种核苷酸序列遗传修饰或转化/转染的细胞。一种或多种此类核苷酸序列的存在可以改变微生物产生甜菊醇或甜菊糖苷,特别是一种或多种甜菊糖苷的能力。非重组细胞,即未经转化/转染或遗传修饰的细胞,其通常不包含使得细胞能够产生甜菊糖苷的核酸序列中的一种或多种核苷酸序列。因此,非重组细胞通常是不天然产生甜菊糖苷的细胞,但是天然产生甜菊醇或甜菊糖苷并且已经根据本公开进行了修饰(并且因此具有表达如本文所公开的变体多肽的能力)的细胞被认为是根据本公开的重组细胞。
具体地,选自由对映-古巴焦磷酸合酶、对映-贝壳杉烯合酶、对映-贝壳杉烯氧化酶和贝壳杉烯酸13-羟化酶、UGT、羟甲基戊二酰-辅酶A还原酶、法呢基-焦磷酸合酶、香叶酰香叶酰二磷酸合酶和细胞色素p450还原酶组成的组的酶对于细胞可以是天然的,并且可能不需要用编码这些酶的核苷酸序列中的一种或多种核苷酸序列进行转化来赋予细胞产生甜菊醇或甜菊糖苷的能力。根据本公开的优选细胞可以是天然(即,以其非重组形式)能够产生GGPP的重组细胞。
对由细胞或重组细胞进行的甜菊醇或甜菊糖苷产生的进一步改善可通过传统菌株改良获得。
因此,在又一方面中,本公开提供了一种产生能够产生根据第三方面的甜菊糖苷的重组细胞的方法,其中所述细胞包含编码根据第一方面的亲本多肽的变体的多核苷酸序列,所述方法包括:a)提供细胞;以及b)用编码根据第一方面的变体多肽的核酸或核酸构建体并且任选地用如本文所定义的一种或多种核酸修饰或转染所述细胞,从而得到根据第三方面的重组细胞。
甜菊糖苷生产
在另一方面中,本公开提供了一种用于制备甜菊醇或甜菊糖苷的方法,所述方法包括在合适的营养培养基中培养如本文所公开的重组细胞,以及任选地回收甜菊醇或甜菊糖苷。
术语“培养”是指这样的方法,其中微生物处于在适合于所述微生物的生长和/或繁殖和/或适于由所述微生物产生感兴趣的化合物的条件下的营养培养基中。这些方法是本领域中已知的。例如,当微生物能够表达/产生感兴趣的化合物时,可以通过在合适的培养基中和允许表达和/或分离感兴趣的化合物的条件下执行的实验室或工业发酵罐中的摇瓶培养、小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养微生物。合适的营养培养基包含碳源、氮源和另外的化合物(例如无机盐(例如磷酸盐)、微量元素和/或维生素)(参见例如Bennett,J.W.和LaSure,L.编辑,More Gene Manipulations in Fungi,Academic Press,CA,1991),并且可以在需氧或厌氧条件下执行。
营养培养基方便地包含碳源、氮源,以及微生物生长和/或产物形成所需的附加化合物。例如,可能需要附加化合物来诱导产物(例如甜菊糖苷)的产生。根据本公开的重组细胞可以能够在本领域已知的任何合适的碳源上生长并将其转化成甜菊糖苷,例如甜菊糖苷。重组细胞可以能够直接转化植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、麦芽糖、麦芽糊精、核糖、核酮糖或淀粉、淀粉衍生物、糖蜜、蔗糖、葡萄糖、乳糖、甘油三酯、脂肪酸、油或甘油。因此,优选的细胞表达诸如以下酶:将纤维素转化为葡萄糖单体和将半纤维素转化为木糖和阿拉伯糖单体所必需的纤维素酶(内切纤维素酶和外切纤维素酶)和半纤维素酶(例如内切和外切木聚糖酶、阿拉伯聚糖);能够将果胶转化为葡糖醛酸和半乳糖醛酸的果胶酶;或将淀粉转化为葡萄糖单体的淀粉酶。优选地,该重组细胞能够转化选自由葡萄糖、木糖、阿拉伯糖、蔗糖、乳糖和甘油组成的组的碳源。重组细胞可以例如是如WO03/062430、WO06/009434、EP1499708B1、WO2006096130或WO04/099381中所述的真核宿主细胞。
甜菊糖苷可以是例如甜菊醇-13-单苷、甜菊醇-19-单苷、13-[(β-D-吡喃葡萄糖基)氧)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-二苷、甜菊双糖苷、莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙C、莱鲍迪甙E、莱鲍迪甙D或莱鲍迪甙M。
在用于产生甜菊糖苷的方法中使用的发酵或营养培养基可以是允许特定宿主细胞生长的任何合适的营养培养基。发酵培养基的基本成分是本领域技术人员已知的,并且可以适用于所选的宿主细胞。
要添加到根据本公开的培养过程中的碳和氮源的总量可以取决于例如微生物的需要和/或发酵过程的持续时间而变化。
在培养过程中碳和氮源之间的比率可以相当大地变化,其中用于碳和氮源之间的最佳比率的一个决定因素是待形成产品的元素组成。
微生物的生长和/或产物形成所需的附加化合物(如磷酸盐、硫酸盐)或微量元素(如铁、铜锌等)和/或维生素(例如硫胺素、核黄素等)可以以可在不同种类的微生物之间(即在真菌、酵母和细菌之间)变化的量添加。另外,要添加的附加化合物的量可以由所形成的产物的类型确定。
优选地,营养培养基包含选自由以下项组成的组的碳源:植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、果糖、麦芽糖、麦芽糊精、核糖、核酮糖或淀粉、淀粉衍生物、葡萄糖、蔗糖、乳糖、糖蜜、脂肪酸、甘油三酸酯和甘油。优选地,营养培养基还包含氮源,例如尿素(ureum)、豆粕、玉米浆、酵母提取物、硝酸盐、尿素(urea)、氨或铵盐(例如硫酸铵、氯化铵、硝酸铵或磷酸铵)。营养培养基应使生物体达到一定的生物质浓度,以便可以确定产物的可定量的量。该培养基还应允许产生甜菊糖苷所需的基因的表达。合适的培养基可以取决于重组细胞而不同。
如本文所公开的产生甜菊糖苷的方法可以分批、补料分批或连续方式进行。也可以采用单独进行水解和发酵(SHF)的方法或同时进行糖化和发酵(SSF)的方法。这些发酵过程模式的组合也可能实现最佳生产率。如果将淀粉、纤维素、半纤维素或果胶用作该发酵方法中的碳源,则SSF方法可为特别有吸引力的,在该方法中,可能需要添加水解酶(诸如纤维素酶、半纤维素酶或果胶酶)以水解底物。优选地,培养基应设计为使得避免高粘度,以允许充分混合和气体转移。很高浓度或很大量的碳源可能导致很高浓度的生物质,这可能负面地影响混合、气体转移和溶氧。很高浓度或很大量的碳源还可导致甜菊糖苷的生产水平超过溶解度极限。这进一步取决于在此条件下菌株产生甜菊糖苷的效率(底物上产物的产量)。当设计适当的培养基时,应考虑到这一点。
如本文所公开的产生甜菊糖苷的方法可以以任何规模执行。例如,发酵过程可以在实验室规模上在摇瓶、培养板或微量滴定板(MTP)上执行。通常,它可以在工业规模上执行,通常使用各种大小的发酵器。工业规模的过程应理解为涵盖发酵体积≥0.01m3、或≥0.1m3、或≥0.5m3、或≥5m3,优选地≥10m3,更大地或≥25m3,更大地或≥50m3、或≥100m3、或≥200m3的培养过程。
通常,可以将微生物发酵过程(例如根据本公开的用于产生甜菊糖苷的过程)分为针对生物质形成的生长阶段和针对由微生物产生产物(例如甜菊糖苷)的产生阶段(也表示为主要发酵)。本领域技术人员应理解,发酵的两个阶段可能没有在时间上严格分开,而是可能在一定程度上重叠。此外,本领域技术人员应理解,在微生物培养的任何阶段期间,将在某种程度上产生产物。
发酵过程中的生长阶段通常包括接种物的制备和种子发酵。
接种物的制备可以通过将生产微生物从培养瓶中无菌转移到发酵培养基中发生,并且可以以多种方式执行,例如包括使用摇瓶、鼓泡塔或搅拌发酵罐。
接种阶段中的典型发酵温度可以在20℃-40℃之间的范围内,例如20℃-30℃或30℃-40℃或25℃-35℃。
通常,在发酵的该阶段中,pH通常低于8、低于7.5,或至多7。在其他实施方式中,该相中的pH可为至多6.5、至多6、至多5.5或至多5。
通常,在接种阶段期间的发酵可以是生长速率受限的,之后是氧受限或碳受限的阶段,直到发酵过程扩大规模至种子发酵为止。该第一接种物制备步骤可以以较小规模作为接种物而以较大规模重复进行,直到已经产生了足够的生物质为止。
因此,在充分生长之后,可以将生物质转移至种子发酵器,在其中可发生进一步生长(即种子发酵)。种子发酵通常可以在搅动下并且通常在氧气的存在下发生。该工艺步骤可以在各种设置下执行,所述各种设置为例如连续发酵、分批发酵或补料分批发酵,优选地分批或补料分批发酵。发酵的该阶段可以在例如鼓泡塔或搅拌的发酵器中进行。可以施加氧或碳限制条件。培养基可包含如本文先前所讨论的任何合适的营养物,包括确定的盐和/或维生素,例如硫胺素。此外,培养基可包含消泡剂。通常,用于发酵的该阶段中的培养基可以在使用前在缺乏碳源的情况下(例如在缺乏葡萄糖的情况下)在优选低于5或更低的pH下在发酵器中灭菌,然后用任何合适的碱(例如使用气态或液态氨)调节至发酵的pH。也可以将空发酵器进行灭菌,并且可以添加(例如通过热激或过滤器灭菌)预先灭菌的培养基。种子发酵中的pH可以保持低于8、或低于7、或低于6、或低于5、或低于4。碳源(例如葡萄糖)或本文先前所提及的任何其他碳源的量可以在0-200g/kg之间,或至多50g/kg、60g/kg、70g/kg、80g/kg、90g/kg、100g/kg、110g/kg、120g/kg、130g/kg、140g/kg、150g/kg、160g/kg、170g/kg、180g/kg,或至少5g/kg、10g/kg、20g/kg、30g/kg、40g/kg。该阶段中的发酵温度和pH可以在与用于接种物制备的温度和/或pH相同的范围内。当分批碳源(例如葡萄糖)被消耗完或几乎消耗完时,可以添加葡萄糖或其他碳源,或者发酵可以进行到主要阶段(或生产生阶段)。
在添加其他碳源的情况下,则后者可以连续或重复分批方式发生。通常,在种子发酵中,第一阶段可以是生长受限的阶段,之后是氧受限或碳受限。可施加消泡剂可以控制起泡。该种子制备步骤可以以较小规模作为接种物而以较大规模重复进行,直到已经产生了足够的生物质为止。
主要发酵通常将是产生产物(例如甜菊醇-糖苷)的阶段。该阶段通常可以连续或补料分批过程执行。通常,该阶段可以在鼓泡塔或搅拌的发酵器中执行。通常,主发酵将包括以不同限制为特征的更多阶段。通常,第一阶段可以是生长速率受限的分批过程,之后是任选的氧受限阶段。可以省去氧受限阶段。第二阶段或第三阶段通常可以是碳受限的产生阶段,例如葡萄糖受限的产生阶段。培养基可具有如针对种子发酵阶段所述的组成。在使用之前,可以如针对种子发酵阶段所公开的那样对培养基进行灭菌并且调节pH。在培养基灭菌之后,可以以如先前针对种子发酵阶段所描述的量添加碳源。
制备甜菊糖苷的方法中使用的重组细胞可以是如上文所定义的任何合适的重组细胞。在该过程中使用重组真核细胞可为有利的,因为它们对噬菌体感染不敏感。另外,真核宿主细胞可以在低pH下生长以防止细菌污染。
如本文所公开的重组细胞可以是兼性厌氧微生物。兼性厌氧重组宿主可以有氧繁殖至高细胞浓度。然后可以以高细胞密度进行该厌氧阶段,所述高细胞密度大大减少了所需的发酵体积,并且可以使需氧微生物污染的风险最小化。
如本文所公开的用于产生甜菊糖苷的发酵方法可以是需氧或厌氧发酵方法。
厌氧发酵方法在本文中定义为在不存在氧或基本上不消耗氧,优选消耗小于5mmol/L/h、2.5mmol/L/h或1mmol/L/h的情况下运行的发酵方法,并且其中有机分子充当电子供体和电子受体两者。如本文所公开的发酵方法还可以首先在需氧条件下运行,随后在厌氧条件下运行。
发酵方法也可以在限氧或微需氧的条件下运行。或者,该发酵方法可以首先在需氧条件下进行,然后在限氧条件下进行。限氧发酵方法是氧消耗受到氧从气体到液体的转换限制的方法。限氧程度由进入气流的量和组成以及所用发酵设备的实际混合/质量传递特性确定。
在根据本公开的方法中的甜菊糖苷的产生可发生在宿主细胞的生长阶段期间、静止(稳态)阶段期间或这两个阶段期间。可以在不同温度下运行该发酵过程。
生产甜菊糖苷的方法可以在对于重组宿主而言最合适的温度下进行。每个转化的重组宿主的最佳生长温度可能不同,并且是本领域技术人员已知的。该最佳温度可能高于野生型生物体的最佳温度,以使该生物体在非无菌条件下以最小的感染敏感性和最低的冷却成本有效地生长。或者,该方法可以在对于重组宿主的生长不是最佳的温度下进行。
根据本公开的产生甜菊糖苷的方法可以在任何合适的pH值下进行。如果重组宿主是酵母,则发酵培养基中的pH的值优选低于6、优选低于5.5、优选低于5、优选低于4.5、优选低于4、优选低于pH 3.5或低于pH 3.0,或低于pH 2.5,优选高于pH 2。在这些低pH值下进行发酵的优点是可以防止发酵培养基中污染细菌的生长。
这种过程可以以工业规模进行。这种方法的产物是一种或多种甜菊糖苷,诸如以下中的一种或多种:例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D-吡喃葡萄糖基)氧)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-二苷、甜菊双糖苷、莱鲍迪甙A、莱鲍迪甙E、莱鲍迪甙D或莱鲍迪甙M。
可以通过本领域已知的方法,例如通过蒸馏、真空萃取、溶剂萃取、结晶或蒸发,来从发酵培养基中回收一种或多种甜菊糖苷。
在根据本公开的制备甜菊糖苷的方法中,可能实现高于5mg/l发酵液,优选地高于10mg/l,优选地高于20mg/l,优选地高于30mg/l发酵液,优选地高于40mg/l,更优选地高于50mg/l,优选地高于60mg/l,优选地高于70,优选地高于80mg/l,优选地高于100mg/l,优选地高于1g/l,优选地高于5g/l,优选高于10g/l,但通常低于70g/l的浓度。
本公开还提供了包含通过如本文所公开的制备甜菊醇或甜菊糖苷的方法可获得的甜菊糖苷的发酵液。在一种或多种甜菊糖苷在微生物中产生的情况下,可能需要处理此类细胞以释放该一种或多种甜菊糖苷。然而,在优选的实施方式中,如本公开的其他方面中所公开的,甜菊糖苷,尤其是reb M的细胞外产生得到了改良。因此,在细胞外产生至少一种甜菊糖苷,例如reb M。
在本公开的上下文中,“发酵液”、“培养液”或“发酵液体”可以互换地使用。发酵液通常包括培养基、本公开的重组细胞和任选的由重组细胞产生的产物(例如甜菊糖苷)。
本公开还提供了通过如本文所公开的用于制备甜菊糖苷的方法获得的或从如本文所公开的发酵液可获得的甜菊糖苷。这种甜菊糖苷可以是非天然存在的甜菊糖苷,也就是说不是在植物中产生的甜菊糖苷。优选地,甜菊糖苷包含至少reb M。
还提供了一种组合物,所述组合物包含通过如本文所公开的用于制备甜菊醇或甜菊糖苷的方法获得的或从如本文所公开的发酵液获得的一种或多种甜菊糖苷。在此类组合物中,一种或多种甜菊糖苷可以是非天然存在的甜菊糖苷,也就说不是在植物中产生的甜菊糖苷。优选地,包含通过本文公开的用于制备甜菊糖苷的方法获得的一种或多种甜菊糖苷的组合物富含莱鲍迪甙M。
通过如本文所公开的发酵方法产生的甜菊糖苷或组合物可用于此类化合物的任何已知应用中。具体地,它们可以例如在例如食品或饮料中用作甜味剂。因此,根据本公开,提供了一种食物、饲料或饮料,所述食物、饲料或饮料包含含有如本文所公开的一种或多种甜菊糖苷的组合物。
例如,如本文所公开的甜菊糖苷或组合物可配制在软饮料中,作为餐桌甜味剂,或配制在口香糖、诸如酸奶(例如原味酸奶)等乳制品、蛋糕、谷物或基于谷物的食品、营养食品、药品、食用凝胶、糖果产品、化妆品、牙膏或其他口腔组合物等之中。另外,根据本公开的甜菊糖苷或组合物可用作的甜味剂不仅可用于饮料、食品和其他专用于人类食用的产品,而且还可以用于具有改善特征的动物饲料和草料中。
因此,本发明尤其提供了一种食品、饲料或饮料,所述食品、饲料或饮料包含根据如本文所公开的方法制备的甜菊糖苷。
在食物、饮料、药品、化妆品、餐桌产品、口香糖的制造过程中,可以使用常规方法,诸如混合、捏合、溶解、酸洗、渗透、渗滤、喷洒、雾化、灌输以及其他方法。
甜菊糖苷或本公开的组合物可以以干燥形式或液体形式使用。其可以在食物产品热处理之前或之后添加。甜味剂的量取决于使用目的。其可以单独添加或与其他化合物组合添加。
可以将根据如本文所公开的的方法产生的化合物与一种或多种其他无热量或有热量甜味剂混合。这种混合可用于改善风味或时间特性或稳定性。多种无热量和有热量甜味剂均可适合与如本文所公开的甜菊糖苷或组合物共混。例如,无热量甜味剂为诸如罗汉果苷、莫那甜、阿斯巴甜、安赛蜜盐、甜蜜素、三氯蔗糖、糖精盐或赤藓糖醇。适合与如本文所公开的甜菊糖苷或组合物混合的有热量甜味剂包括糖醇和碳水化合物,诸如蔗糖、葡萄糖、果糖和HFCS。也可以使用甜味的氨基酸,诸如甘氨酸、丙氨酸或丝氨酸。
如本文所公开的甜菊糖苷或组合物可以与诸如天然甜味剂抑制剂等甜味剂抑制剂组合使用。它可以与诸如氨基酸或其盐等鲜味增强剂组合。
可以将如本文所公开的甜菊糖苷或组合物与多元醇或糖醇、碳水化合物、生理活性物质或功能性成分(例如类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧化剂、营养物、类黄酮、异硫氰酸酯、苯酚、植物甾醇(sterol)或甾烷醇(stanol)(植物甾醇(phytosterol)和植物甾烷醇(phytostanol))、多元醇、益生元、益生菌、植物雌激素、大豆蛋白、硫化物/硫醇,氨基酸,蛋白质,维生素,矿物质和/或基于诸如心血管、降胆固醇或抗炎等健康益处分类的物质组合。
具有如本文所公开的甜菊糖苷或组合物的组合物可以包含调味剂、芳香组分、核苷酸、有机酸、有机酸盐、无机酸、苦味化合物、蛋白质或蛋白质水解产物、表面活性剂、类黄酮、收敛剂化合物、维生素、膳食纤维、抗氧化剂、脂肪酸和/或盐。
可以将如本文所公开的甜菊糖苷或组合物用作高强度甜味剂,以产生具有改善的口味特征的零热量、低热量或糖尿病饮料和食物产品。它也可以用于饮料、食品、药品和其他不能使用糖的产品中。
另外,如本文所公开的甜菊糖苷或组合物可用作的甜味剂不仅可用于饮料、食品和其他专用于人类食用的产品,而且还可以用于具有改善特征的动物饲料和草料中。
其中如本文所公开的甜菊糖苷或组合物可以用作甜味化合物的产品的示例可以是酒精饮料,诸如伏特加、葡萄酒、啤酒、白酒、清酒等;天然果汁、提神饮料、碳酸软饮料、减肥饮料、零卡路里饮料、低卡路里饮料和食物、酸奶饮料、速溶果汁、速溶咖啡、粉末型速溶饮料、罐装产品、糖浆、发酵大豆酱、酱油、醋、调味品、蛋黄酱、番茄酱、咖喱、汤、速食肉汤、酱油粉、醋粉、多种类型的饼干、香米饼、咸饼干、面包、巧克力、焦糖、糖果、口香糖、果冻、布丁、蜜饯和腌菜、鲜奶油、果酱、橘子酱、糖花膏、奶粉、冰淇淋、冰糕、包装在瓶中的蔬菜和水果、罐装和煮熟的豆类、在甜味酱中煮熟的肉和食物、农业蔬菜食品、海鲜、火腿、香肠、鱼火腿、鱼香肠、鱼酱、油炸鱼制品、干制海产品、冷冻食品、腌渍海带、腊肉、烟草、医药产品等。原则上它可具有无限应用。
带甜味的组合物包含饮料,其非限制性示例包括非碳酸化和碳酸饮料,诸如可乐、姜汁汽水、根汁汽水、苹果汁、水果味软饮料(例如,柑橘味软饮料,如柠檬莱姆或橙汁)、软饮料粉等;来自水果或蔬菜的果汁、包括榨汁等的果汁、含有果粒的果汁、水果饮料、果汁饮料、含果汁的饮料、具有水果调味料的饮料、蔬菜汁、含蔬菜的汁以及含水果和蔬菜的混合果汁;运动饮料、能量饮料、接近水的饮料等(例如,具有天然或合成调味剂的水);茶类或喜欢型饮料,诸如咖啡、可可、红茶、绿茶、乌龙茶等;含乳组分的饮料,诸如乳饮料、含乳成分咖啡、牛奶咖啡、奶茶、果奶饮料、饮用酸奶、乳酸菌饮料等;以及乳制品。
通常,甜味组合物中存在的甜味剂的量取决于甜味组合物的具体类型及其所需的甜度而广泛变化。本领域的普通技术人员可容易确定加入到甜味组合物中的甜味剂的适当量。
如本文所公开的甜菊糖苷或组合物可以以干燥形式或液体形式使用。其可以在食物产品热处理之前或之后添加。甜味剂的量取决于使用目的。其可以单独添加或与其他化合物组合添加。
在食物、饮料、药品、化妆品、餐桌产品、口香糖的制造过程中,可以使用常规方法,诸如混合、捏合、溶解、酸洗、渗透、渗滤、喷洒、雾化、灌输以及其他方法。
因此,本发明的组合物可以通过本领域技术人员已知的提供成分的均质或均质混合物的任何方法来制备。这些方法包括干混、喷雾干燥、附聚、湿法制粒、压实、共结晶等。
在固体形式时,如本文所公开的甜菊糖苷或组合物可以以适于递送到待甜化的食物中的任何形式提供给消费者,所述形式包括小袋、小包、散装袋或盒、方块、片剂、喷雾或可溶解的条。该组合物可以单位剂量或散装形式递送。
对于液体甜味剂体系和组合物而言,应开发方便范围的流体、半流体、糊状和膏状形式、使用任何形状或形式的适当包装材料的适当包装,其便于携带或分配或储存或运输含有任何上述甜味剂产品或上述产生的产品的组合的任何组合。
该组合物可以包括各种填充剂、功能成分、着色剂、调味剂。
在下文中呈现了本公开的实施方式的以下列表,然而这些列表并非旨在限制。
本公开的实施方式
1.一种亲本多肽的变体,其中所述变体具有甜菊糖苷转运介导活性,其中所述变体包含的氨基酸序列当与所述亲本多肽的氨基酸序列比对时包含对与所述亲本多肽的所述氨基酸序列中的任何氨基酸相对应的氨基酸残基的至少一个修饰,其中当在相同条件下测量时:
a)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少0.1;和/或
b)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比;和/或
c)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比;
其中参考细胞是表达所述亲本多肽的重组细胞。
2.根据前述实施方式中任一项所述的变体,所述变体是选自以下的转运蛋白:ATP结合盒(ABC)转运体、主要易化子超家族(MFS)转运体、小多药耐药性(SMR)转运体、属于耐药-结瘤-细胞分裂(RND)家族的转运体、多抗微生物挤出蛋白,更优选地为ATP结合盒(ABC)转运体。
3.根据前述实施方式中任一项所述的变体,其中所述亲本多肽是选自以下的转运蛋白:ATP结合盒(ABC)转运体、主要易化子超家族(MFS)转运体、小多药耐药性(SMR)转运体、属于耐药-结瘤-细胞分裂(RND)家族的转运体、多抗微生物挤出蛋白,更优选地为ATP结合盒(ABC)转运体。
4.任选地根据前述实施方式中任一项所述的亲本多肽的变体,其中所述变体具有甜菊糖苷转运介导活性,其中所述变体包含的氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含对与根据SEQ ID NO:3的氨基酸序列中的任何氨基酸相对应的氨基酸残基的至少一个修饰,其中当在相同条件下测量时:
a)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少0.1;和/或
b)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比;和/或
c)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比;
其中参考细胞是表达所述亲本多肽的重组细胞。
5.根据前述实施方式中任一项所述的变体,其中所述修饰发生在螺旋跨膜区中,优选地其中所述变体包含这样的氨基酸序列,所述氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含对与在根据SEQ ID NO:3的氨基酸序列中14-67位;135-156位;159-160位;199-215位;255-258位;262-284位;291-312位;314-328位;375-390位;407-429位;852-869位;890-908位;958-980位;986-1014位;1012-1021位;1059-1062位;1067-1080位;1104-1125位;1127-1128位处的任何氨基酸对应的氨基酸残基的至少一个修饰,所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
6.一种亲本多肽的变体,其中所述变体具有甜菊糖苷转运介导活性,任选地为根据前述实施方式中任一项所述的变体,其中所述变体包含的氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含对与以下位置的氨基酸中的任何氨基酸对应的氨基酸残基的至少一个修饰:
15、19、26、29、31、32、33、37、46、56、59、107,135、136、141、145、148、150、151、153、199、200、204、206、207、210、211、255、257、258、262、267、268、272、273、276、277、278、281、282、283、284、292、294、296、297、298、299、300、302、303、306、307、309、310、311、315、318、319、320、321、322、323、324、326、328、375、376、378、379、380、382、384、386、387、389、408、410、411、413、414、415、416、417、419、420、421、422、423、424、425、427、428、429、853、854、857、859、862、864、869、890、891、892、894、903、906、968、969、972、974、977、986、996、998、999、1001、1003、1004、1010、1012、1016、1017、1018、1019、1020、1021、1059、1060、1061、1062、1063、1075、1076、1107、1108、1111、1112、1115、1118、1120、1123、1127、1128、1179、1200,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
7.根据前述实施方式中任一项所述的变体,其中所述修饰是对与以下位置的氨基酸中的任何氨基酸对应的氨基酸残基的取代、添加或缺失
15、19、26、29、31、32、33、37、46、56、59、107,135、136、141、145、148、150、151、153、199、200、204、206、207、210、211、255、257、258、262、267、268、272、273、276、277、278、281、282、283、284、292、294、296、297、298、299、300、302、303、306、307、309、310、311、315、318、319、320、321、322、323、324、326、328、375、376、378、379、380、382、384、386、387、389、408、410、411、413、414、415、416、417、419、420、421、422、423、424、425、427、428、429、853、854、857、859、862、864、869、890、891、892、894、903、906、968、969、972、974、977、986、996、998、999、1001、1003、1004、1010、1012、1016、1017、1018、1019、1020、1021、1059、1060、1061、1062、1063、1075、1076、1107、1108、1111、1112、1115、1118、1120、1123、1127、1128、1179、1200,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
8.根据前述实施方式中任一项所述的变体,其中所述变体包含的氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含以下中的一者或多者
在15位处的A或V、在19位处的G、在26位处的Q或W、在29位处的F、在31位处的Y或A、在32位处的N、在33位处的I、在37位处的G、在46位处的T、在56位处的T、在59位处的L、在107位处的R、在135位处的C、在136位处的Y、在141位处的K、在145位处的I、在148位处的Q、在150位处的L、在151位处的G、在153位处的L或P、在199位处的T、在200位处的Y、在204位处的F、在206位处的I、在207位处的W、在210位处的G或V、在211位处的L、在255位处的A、在257位处的C或L、在258位处的N或Q或S、在262位处的F或I、在267位处的G或L、在268位处的Q或S或T、在272位处的G、在273位处的Y、在276位处的G、在277位处的S、在278位处的V、在281位处的N、在282位处的N、在283位处的F、在284位处的G或S、在292位处的T、在294位处的T、在296位处的T、在297位处的S、在298位处的K或L、在299位处的L或T或V、在300位处的M、在302位处的F或Q或S或T或V、在303位处的M或R或T、在306位处的F或I或M或S、在307位处的I或L、在309位处的M、在310位处的C或N、在311位处的T或W、在315位处的A、在318位处的K、在319位处的K、在320位处的A、在321位处的N、在322位处的A或E或L或V、在323位处的W、在324位处的A、在326位处的E、在328位处的E、在375位处的F或K或H或L或N、在376位处的W、在378位处的I或N或T或V、在379位处的Y、在380位处的E或R、在382位处的G或S或T或W、在384位处的G或N或S或T、在386位处的I或L、在387位处的A、在389位处的M、在408位处的G、在410位处的A、在411位处的F或G、在413位处的I、在414位处的F或G或R、在415位处的V、在416位处的W、在417位处的A或S或T或W、在419位处的G或M、在420位处的G或S、在421位处的F或I、在422位处的M、在423位处的A或Q、在424位处的L或S、在425位处的A或H或L或M或V、在427位处的M、在428位处的M、在429位处的M或S、在853位处的V、在854位处的G或S、在857位处的P、在859位处的A或P或S、在862位处的T、在864位处的A、在869位处的V、在890位处的P、在891位处的T、在892位处的F或V、在894位处的Q或Y、在903位处的N、在906位处的V、在968位处的Q、在969位处的N、在972位处的Q、在974位处的Q、在977位处的A或Q、在986位处的H、在996位处的Y、在998位处的A或G、在999位处的N或T、在1001位处的Y、在1003位处的I、在1004位处的T、在1010位处的T、在1012位处的L、在1016位处的E、在1017位处的A、在1018位处的L或V、在1019位处的G、在1020位处的A、在1021位处的A或N或W、在1059位处的E、在1060位处的T、在1061位处的G、在1062位处的L、在1063位处的L、在1075位处的S或L、在1076位处的A或G、在1107位处的Y、在1108位处的K或Q、在1111位处的K、在1112位处的N、在1115位处的G、在1118位处的A或F或W、在1120位处的M、在1123位处的P、在1127位处的A或N、在1128位处的D、在1179位处的N、在1200位处的I,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
9.根据前述实施方式中任一项所述的变体,其中所述变体包含的氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含对与根据SEQ ID NO:3的氨基酸序列中的任何氨基酸相对应的氨基酸残基的至少两个修饰,其中当在相同条件下测量时:
a)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少1.2;和/或
b)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比是由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比的至少1.2倍;和/或
c)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比是由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比的至少1.2倍;
其中所述至少两个修饰是对与以下位置的氨基酸中的任何氨基酸相对应的氨基酸残基的取代
322、375、376、378、382、384、386、420、421、424、425、429、890、891、969、977、1060、1107、1111、1112、1115、1118、1120、1179,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的,其中参考细胞是表达所述亲本多肽的重组细胞。
10.根据前述实施方式中任一项所述的变体,其中根据实施方式1a)、1b)、1c)、4a)、4b)、4c)、9a)、9b)、9c)的比率中的莱鲍迪甙M、莱鲍迪甙A和总甜菊糖苷的摩尔浓度是细胞外产生的摩尔浓度。
11.根据前述实施方式中任一项所述的变体,其中所述变体包含的氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含以下中的一者或多者
322位处的A或E或L或V、375位处的F或K或H或L或N、376位处的W、378位处的I或N或T或V、382位处的G或S或T或W、384位处的G或N或S或T、386位处的I或L、420位处的G或S、421位处的F或I、424位处的L或S、425位处的A或H或L或M或V、429位处的M或S、890位处的P、891位处的T、969位处的N、977位处的A或Q、1060位处的T、1107位处的Y、1111位处的K、1112位处的N、1115位处的G、1118位处的A或F或W、1120位处的M、1179位处的N,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
12.根据前述实施方式中任一项所述的变体,其中所述变体包含的氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含在以下位置处的氨基酸取代的以下组合:
-107和141;优选地在107位处的R和在141位处的K;或者
-322和382;优选地在322位处的E或在382位处的G;或者
-322、382和384;优选地在322位处的E、在382位处的G、和在384位处的S或T;或者
-322、382和420;优选地在322位处的E、在382位处的G和在420位处的G;或者
-322、382和429;优选地在322位处的E、在382位处的G和在429位处的S;或者
-322、382和890;优选地在322位处的E、在382位处的G和在890位处的P;或者
-322、382和891;优选地在322位处的E、在382位处的G和在891位处的T;或者
-322、382、969和1060;优选地在322位处的E、在382位处的G、在969位处的N和在1060位处的T;或者
-322、382和977;优选地在322位处的E、在382位处的G和在977位处的A或Q;或者
-322、382和1107;优选地在322位处的E、在382位处的G和在1107位处的Y;或者
-322、382、1111和1179;优选地在322位处的E、在382位处的G、在111位处的K和在1179位处的N;或者
-322、382和1112;优选地在322位处的E、在382位处的G和在1112位处的N;或者
-322、382和1115;优选地在322位处的E、在382位处的G和在1115位处的G;或者
-322、382和1118;优选地在322位处的E、在382位处的G和在1118位处的A;或者
-375、969和1060;优选地在375位处的F、在969位处的N和在1060位处的T;或者
-375和977;优选地在375位处的F和在977位处的A;或者
-375和1107;优选地在375位处的F和在1107位处的Y;或者
-375、1111和1179;优选在375位处的F、在1111位处的K和在1179位处的N;或者
-376、969和1060;优选地在376位处的W、在969位处的N和在1060位处的T;或者
-376和977;优选地在376位处的W和在977位处的A;或者
-376和1107;优选地在376位处的W和在1107位处的Y;或者
-376、1111和1179;优选地在376位处的W、在1111位处的K和在1179位处的N;或者
-376和1112;优选地在376位处的W和在1112位处的N;或者
-378、969和1060;优选地在378位处的T、在969位处的N和在1060位处的T;或者
-378和977;优选地在378位处的T和在977位处的A;或者
-378和1107;优选地在378位处的T和在位置1107位处的Y;或者
-378、1111和1179;优选地在378位处的T、在1111位处的K和在1179位处的N;或者
-378和1112;优选地在378位处的T和在1112位处的N;或者
-384和420;优选地在384位处的S或T和在420位处的G;或者
-384和429;优选地在384位处的S或T和在429位处的S;或者
-384和890;优选地在384位处的S或T和在890位处的P;或者
-384和891;优选地在384位处的S和在891位处的T;或者
-384、969和1060;优选地在384位处的G或N或T、在969位处的N和在1060位处的T;或者
-384和977;优选地在384位处的G或N或S或T和在977位处的A;或优选地在384位处的S和在977位处的A或Q;或优选地在384位处的T和在977位处的Q;或者
-384和1107;优选地在384位处的G或N或S或T和在1107位处的Y;或者
-384、1111和1179;优选地在384位处的G或N或S或T、在1111位处的K和在1179位处的N;或者
-384和1112;优选地在384位处的G或N或S或T和在1112位处的N;或者
-384和1115;优选地在384位处的S或T和在1115位处的G;或者
-384和1118;优选地在384位处的S或T和在1118位处的A;或者
-386、969和1060;优选地在386位处的I或L、在969位处的N和在1060位处的T;或者
-386和977;优选地在386位处的L和在977位处的A;或者
-386和1107;优选地在在386位处的I或L和在1107位处的Y;或者
-386、1111和1179;优选地在386位处的I或L、在1111位处的K和在1179位处的N;或者
-386和1112;优选地在386位处的I或L和在1112位处的N;或者
-420和429;优选地在420位处的G和在429位处的S;或者
-420和891;优选地在420位处的G和在891位处的T;或者
-420和890;优选地在420位处的G和在890位处的P;或者
-420、969和1060;优选地在420位处的G、在969位处的N和在1060位处的T;或者
-420和977;优选地在420位处的G和在977位处的A或Q;或者
-420和1107;优选地在420位处的G和在1107位处的Y;或者
-420、1111和1179;优选地在420位处的G、在1111位处的K和在1179位处的N;或者
-420和1112;优选地在420位处的G和在1112位处的N;或者
-420和1115;优选地在420处的G和在1115处的G;或者
-420和1118;优选地在420位处的G和在1118位处的A;或者
-421、969和1060;优选地在421位处的F、在969位处的N和在1060位处的T;或者
-421和977;优选地在421位处的F和在977位处的A;或者
-421、1111和1179;优选地在421位处的F、在1111位处的K和在1179位处的N;或者
-421和1112;优选地在421位处的F和在1112位处的N;或者
-424、969和1060;优选地在424位处的L、在969位处的N和在1060位处的T;或者
-424和977;优选地在424位处的L和在977位处的A;或者
-424和1107;优选地在424位处的L和在1107位处的Y;或者
-424、1111和1179;优选地在424位处的L、在1111位处的K和在1179位处的N;或者
-424和1112;优选地在424位处的L和在1112位处的N;或者
-425、969和1060;优选地在425位处的A或L或M、在969位处的N和在1060位处的T;或者
-425和1107;优选地在425位处的A或L或M和在1107位处的Y;或者
-425、1111和1179;优选地在425位处的A或L或M、在1111位处的K和在1179位处的N;或者
-425和1112;优选地在425位处的A或L或M和在1112位处的N;或者
-429和890;优选地在429位处的S和在890位处的P;或者
-429、969和1060;优选地在429位处的S、在969位处的N和在1060位处的T;或者
-429和1107;优选地在429位处的S和在1107位处的Y;或者
-429、1111和1179;优选地在429位处的S、在1111位处的K和在1179位处的N;或者
-429和1112;优选地在429位处的S和在1112位处的N;或者
-429和1115;优选地在429位处的S和在1115位处的G;或者
-429和1118;优选地在429位处的S和在1118位处的A;或者
-890、969和1060;优选地在890位处的P、在969位处的N和在1060位处的T;或者
-890、1111和1179;优选在890位处的P、在1111位处的K和在1179位处的N;或者
-890和1112;优选地在890位处的P和在1112位处的N;或者
-891、969和1060;优选地在891位处的T、在969位处的N和在1060位处的T;或者
-891、1111和1179;优选地在891位处的T、在1111位处的K和在1179位处的N;或者
-891和1112;优选地在891位处的T和在1112位处的N;或者
-892和986;优选地在892位处的F和在986位处的H;或者
-969、977和1060;优选地在969位处的N、在977位处的A或Q和在1060位处的T;或者
-969、998和1060;优选地在969位处的N、在998位处的A和在1060位处的T;或者
-969和1060;优选地在969位处的N和在1060位处的T;或者
-969、1060和1107;优选地在969位处的N、在1060位处的T和在1107位处的Y;或者
-969、1060和1108;优选地在969位处的N、在1060位处的T和在1108位处的K;或者
-969、1060和1112;优选地在969位处的N、在1060位处的T和在1112位处的N;或者
-969、1060、1111和1179;优选地在969位处的N、在1060位处的T、在1111位处的K和在1179位处的N;或者
-969、1060和1115;优选地在969位处的N、在1060位处的T和在1115位处的G;或者
-969、1060和1118;优选地在969位处的N、在1060位处的T和在1118位处的A;或者
-969、1060和1120;优选地在969位处的N、在1060位处的T和在1120位处的M;或者
-977和1107;优选地在977位处的A和在1107位处的Y;或者
-977、1111和1179;优选地在977位处的A或Q、在1111位处的K和在1179位处的N;或者
-977和1112;优选地在977位处的A或Q和在1112位处的N;或者
-998、1111和1179;优选地在998位处的A、在1111位处的K和在1179位处的N;或者
-998和1112;优选地在998位处的A和在1112位处的N;或者
-1075和1076;优选地在1075位处的L和在1076位处的A;或者
-1107、1111和1179;优选地在1107位处的Y、在1111位处的K和在1179位处的N;或者
-1107和1112;优选地在1107位处的Y和在1112位处的N;或者
-1108、1111和1179;优选地在1108位处的K、在1111位处的K和在1179位处的N;或者
-1108和1112;优选地在1108位处的K和在1112位处的N;或者
-1108和1200;优选地在1108位处的Q和在1200位处的I;或者
-1108和1200;优选地在1108位处的Q和在1200位处的I;或者
-1111和1179;优选地在1111位处的K和在1179位处的N;或者
-1111、1112和1179;优选地在1111位处的K、在1112位处的N和在1179位处的N;或者
-1111、1115和1179;优选地在1111位处的K、在1115位处的G和在1179位处的N;或者
-1111、1118和1179;优选地在1111位处的K、在1118位处的A和在1179位处的N;或者
-1111、1120和1179;优选地在1111位处的K、在1120位处的M和在1179位处的N;或者
-1112和1115;优选地在1112位处的N和在1115位处的G;或者
-1112和1118;优选地在1112位处的N和在1118位处的A;或者
-1112和1120;优选地在1112位处的N和在1120位处的M。
13.根据前述实施方式中任一项所述的变体,其中所述亲本多肽包含SEQ ID NO:3所示的氨基酸序列或包含与SEQ ID NO:3所示的氨基酸序列具有至少50%序列同一性的氨基酸序列。
14.根据前述实施方式中任一项所述的变体,其中所述变体多肽与SEQ ID NO:3所示的氨基酸序列具有至少50%的序列同一性。
15.根据前述实施方式中任一项所述的变体,其中由表达所述变体的重组细胞产生或由表达所述亲本多肽的重组细胞产生的莱鲍迪甙M的摩尔浓度、莱鲍迪甙A的摩尔浓度和总甜菊糖苷的摩尔浓度是通过以下方式确定的:
a)在允许所述重组细胞生长并产生甜菊糖苷的条件下,使所述重组细胞在合适的营养培养基中生长固定的时间段;
b)通过以下方式回收由所述细胞产生的所述甜菊糖苷:将细胞培养物均质化并在90℃处理10分钟以释放细胞内含物,冷却至室温,以1500g离心10分钟以将上清液与细胞碎片分离,分离出所述上清液;
c)测量步骤b)中获得的所述上清液中莱鲍迪甙M、莱鲍迪甙A和总甜菊糖苷的摩尔浓度。
16.根据前述实施方式中任一项所述的变体,其中由表达所述变体的重组细胞在细胞外产生或由表达所述亲本多肽的重组细胞产生的莱鲍迪甙M的摩尔浓度、莱鲍迪甙A的摩尔浓度和总甜菊糖苷的摩尔浓度是通过以下方式确定的:
a)在允许重组细胞生长并产生甜菊糖苷的条件下,优选在其中甜菊糖苷可溶的条件下,使重组细胞在合适的营养培养基中生长固定的时间段;
b)通过以下方式来回收由所述细胞在细胞外产生的甜菊糖苷:将细胞培养物以1500g离心10分钟以使上清液与完整细胞分离,分离出所述上清液;
c)测量步骤b)中获得的所述上清液中莱鲍迪甙M、莱鲍迪甙A和总甜菊糖苷的摩尔浓度。
17.根据实施方式15或16所述的变体,其中在步骤c)中使用联接至配备有电喷雾电离源的TQ质谱仪的UPLC测量所述上清液中莱鲍迪甙M、莱鲍迪甙A和总甜菊糖苷的摩尔浓度,对于除了莱鲍迪甙A和甜茶苷以外的甜菊糖苷,所述电喷雾电离源在去质子化分子[M-H]-处在MRM模式下以负离子模式操作,莱鲍迪甙A和甜茶苷在[M-H-己糖]处监测,所述测量包括以下步骤:用乙腈将根据实施方式15b)或16b)获得的所述上清液稀释至33%v/v乙腈的浓度;使用2.1×100mm的粒径为1.8μm的基于二氧化硅的C18反相柱,使用具有(A)50mM乙酸铵在LC-MS级水中的溶液和(B)LC-MS级乙腈的梯度洗脱,使用以下梯度:在0.5分钟内从30%v/v B至35%v/v B,保持在35%v/v B持续0.8分钟、在0.7分钟内从35%v/v B至95%v/v B,保持在95%v/v B持续0.5分钟,用30%v/v B重新平衡1.5分钟来分离所述上清液中的甜菊糖苷;使用0.6ml/min的流速、使用5μl的进样量和50℃的柱温;使用在10-600ng/ml范围内的组分外部校准线对所述甜菊糖苷进行定量,其中将对应的分析样品稀释为使得所需组分的浓度落入校准线的线性范围内。
18.根据实施方式15或16所述的变体,其中在步骤c)中使用联接至光电二极管阵列检测器的UPLC测量所述上清液中莱鲍迪甙M、莱鲍迪甙A和总甜菊糖苷的摩尔浓度,所述测量包括以下步骤:用乙腈将根据实施方式15b)或16b)获得的所述上清液稀释至25%v/v乙腈的浓度;使用4.6×150mm的粒径为3μm的基于二氧化硅的反相双官能键合的C18柱分离上清液中的甜菊糖苷并在210nm处检测,使用具有(A)在纯净水中的25%v/v乙腈+0.00166%v/v乙酸溶液和B)LC-MS级乙腈作为流动相的洗脱梯度,使用以下梯度:0%v/v B(=100%A)持续2分钟,在11分钟内从0%v/v B至46%v/v B,在0.1分钟内46%v/v B至98%v/v B,保持在98%v/v B持续4分钟,在0.1分钟内从98%v/v B至0%v/v B,用100%v/v A将所述柱重新平衡5分钟;使用1ml/min的流速、使用10μl的进样量和50℃的柱温;使用在2-100μg/ml范围内的组分外部校准线对所述甜菊糖苷进行定量,其中将对应的分析样品稀释为使得所需组分的浓度落入校准线的线性范围内。
19.一种编码根据前述实施方式中任一项所述的变体多肽的核酸序列。
20.一种核酸构建体,所述核酸构建体包含根据实施方式19所述的核酸序列,任选地其中编码变体多肽的核酸可操作地连接至至少一个能够指导所述变体在合适的重组细胞中表达的控制序列。
21.一种产生根据前述实施方式中任一项所述的变体多肽的方法,所述方法包括:
a)提供亲本多肽,任选地其中所述亲本多肽具有甜菊糖苷转运介导活性;
b)修饰所述亲本多肽序列中的至少一个氨基酸残基以产生变体多肽序列,任选地其中在所述亲本多肽序列中的修饰发生在序列的与螺旋跨膜区对应的部分中;以及任选地
c)选择当在重组细胞中表达时具有甜菊糖苷转运介导活性并且当在相同条件下测量时具有以下特征的变体多肽:
i)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少0.1;和/或
ii)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比;和/或
iii)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比;
其中参考细胞是表达所述亲本多肽的重组细胞,任选地其中根据i)、ii)和iii)的比率中的莱鲍迪甙M、莱鲍迪甙A和总甜菊糖苷的摩尔浓度是细胞外产生的摩尔浓度。
22.根据实施方式21所述的产生变体多肽的方法,其中在产生所述变体的所述方法的步骤b)中修饰所述亲本多肽序列中的至少一个氨基酸残基以产生变体多肽序列包括:
I)将亲本多肽的氨基酸序列与SEQ ID NO:3所示的氨基酸序列进行比对,
II)修饰与以下位置处的氨基酸中的任何氨基酸对应的氨基酸残基,
15、19、26、29、31、32、33、37、46、56、59、107,135、136、141、145、148、150、151、153、199、200、204、206、207、210、211、255、257、258、262、267、268、272、273、276、277、278、281、282、283、284、292、294、296、297、298、299、300、302、303、306、307、309、310、311、315、318、319、320、321、322、323、324、326、328、375、376、378、379、380、382、384、386、387、389、408、410、411、413、414、415、416、417、419、420、421、422、423、424、425、427、428、429、853、854、857、859、862、864、869、890、891、892、894、903、906、968、969、972、974、977、986、996、998、999、1001、1003、1004、1010、1012、1016、1017、1018、1019、1020、1021、1059、1060、1061、1062、1063、1075、1076、1107、1108、1111、1112、1115、1118、1120、1123、1127、1128、1179、1200,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
23.根据实施方式21或22中任一项所述的产生变体多肽的方法,其中在产生所述变体的所述方法的步骤c)中获得的所述变体多肽是根据实施方式1至18中任一项所述的变体多肽。
24.一种能够产生甜菊糖苷的重组细胞,其中所述细胞包含编码根据实施方式1至18中任一项所述的亲本多肽的变体或通过根据实施方式21至23中任一项所述的方法可获得的亲本多肽的变体的核酸。
25.根据实施方式24所述的重组细胞,其中所述细胞表达或过表达所述变体多肽。
26.根据实施方式24或25中任一项所述的重组细胞,所述重组细胞包含一个或多个编码以下物质的重组核苷酸序列。
具有对映-古巴焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
27.根据实施方式24至26中任一项所述的重组细胞,所述重组细胞包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。
28.根据实施方式24至27中任一项所述的重组细胞,所述重组细胞包含编码以下物质中的一者或多者的重组核酸序列:
(i)具有UGT74G1活性的多肽;
(ii)具有UGT2活性的多肽;
(iii)具有UGT85C2活性的多肽;和
(iv)具有UGT76G1活性的多肽。
29.根据实施方式24至28中任一项所述的重组细胞,其中所述细胞属于以下属中的一者:酵母属、曲霉属、毕赤酵母属、克鲁维酵母属、假丝酵母属、汉逊酵母属、腐质霉属、伊萨酵母属、毛孢子菌属、酒香酵母属、管囊酵母属、耶氏酵母属、Yamadazyma或埃希氏菌属。
30.根据实施方式29所述的重组细胞,其中所述重组细胞是酿酒酵母细胞、解脂耶氏酵母细胞、克鲁斯假丝酵母细胞、东方伊萨酵母细胞或大肠杆菌细胞。
31.根据实施方式24至30中任一项所述的重组细胞,其中所述细胞产生香叶酰香叶酰焦磷酸(GGPP)的能力被上调。
32.根据实施方式24至31中任一项所述的重组细胞,所述重组细胞包含编码以下物质中的一者或多者的核酸序列:
具有羟甲基戊二酰-辅酶A还原酶活性的多肽;或者
具有法呢基-焦磷酸合酶活性的多肽。
33.一种产生根据实施方式24至32中任一项所述的能够产生甜菊糖苷的重组细胞的方法,其中所述细胞包含编码根据实施方式1至18中任一项所述的亲本多肽的变体的多核苷酸序列,所述方法包括:a)提供细胞;以及b)用根据实施方式19所述的核酸或用根据实施方式20所述的核酸构建体,任选地用根据实施方式26至28、31或32中任一项所述的一种或多种核酸修饰或转染所述细胞,从而产生根据实施方式24至32中任一项所述的重组细胞。
34.一种用于制备甜菊糖苷的方法,所述方法包括在合适的发酵培养基中发酵根据实施方式24至32中任一项所述的重组细胞,以及任选地回收所述甜菊糖苷。
35.根据实施方式34所述的用于制备甜菊糖苷的方法,其中所述方法是以工业规模进行的。
36.一种发酵液,所述发酵液包含通过根据实施方式34或35的方法可获得的甜菊糖苷。
37.一种通过根据实施方式34或35所述的方法可获得的或从根据实施方式36所述的发酵液获得的甜菊糖苷。
38.一种组合物,所述组合物包含通过根据实施方式34或35的方法获得的一种或多种甜菊糖苷。
39.一种食物、饲料或饮料,所述食物、饲料或饮料包含根据实施方式37所述的甜菊糖苷或根据实施方式38所述的组合物。
给出了以下实施例,然而所述实施例并不旨在限制本公开的范围。
实施例
用于测量甜菊糖苷的测定
液相色谱与质谱联用(LC-MS)测定
在联接至配备有电喷雾电离源的XEVO-TQ质谱仪(Waters)的Acquity UPLC(Waters)上分析甜菊糖苷,对于除了莱鲍迪甙A和甜茶苷以外的所有研究的甜菊糖苷,所述电喷雾电离源在去质子化分子[M-H]-处在MRM模式下以负离子模式操作,莱鲍迪甙A和甜茶苷在[M-H-己糖]处监测。
色谱分离是使用2.1×100mm的粒径为1.8μm的Acquity
Figure GDA0002911608450000702
HSS T3柱,使用具有(A)50mM乙酸铵在LC-MS级水中的溶液和B)LC-MS级乙腈作为流动相的梯度洗脱实现的。4分钟梯度从30%B开始,在0.5分钟内线性增加到35%B,并保持在35%B处持续0.8分钟,然后在0.7分钟内线性增加到95%B,并保持在95%B处持续0.5分钟,然后用30%B重新平衡持续1.5分钟。将流速保持在0.6ml/min,使用5μl的进样量,并将柱温设置为50℃。使用在10-600ng/ml范围内的组分外部校准线来对所需组分进行定量。将对应的分析样品相应地稀释,使所需组分的浓度落在校准线的线性范围内。样品中乙腈的终浓度为33%。使用TargetLynx软件(Waters),使用二次校准线(由此由此迫使原点通过零)计算样品中各组分的浓度,并使用加权函数1/x。
对于莱鲍迪甙A、莱鲍迪甙B、莱鲍迪甙D、甜菊苷、甜菊双糖苷、甜茶苷使用可商购的参考物(标准物质)。莱鲍迪甙M和甜菊醇-13-单苷的参考物(标准物质)由DSM提供。
实施例1.转运体变体受体耶氏酵母菌株的构建。
以与专利申请WO2015/007748的实施例7中所描述的解脂耶氏酵母STV2019菌株相当的方式构造解脂耶氏酵母菌株STVP001。解脂耶氏酵母菌株STVP001包含用于产生甜菊糖苷(包括莱鲍迪甙A(RebA)和莱鲍迪甙M(RebM))的所有元件。所述菌株具有表1中所列基因的过表达的一个或几个拷贝。
表1.甜菊糖苷生物合成途径中所涉及的酶的多肽序列
Figure GDA0002911608450000701
Figure GDA0002911608450000711
使用表2中列出的启动子和终止子来表达表1中的基因。
表2.启动子和终止子的多核苷酸序列
Figure GDA0002911608450000721
从菌株STVP001中缺失编码解脂耶氏酵母内源性转运体YALI0E25201的基因的ORF(如SEQ ID NO:1中所定义)和终止子序列。根据图1中所描绘的策略,将两个DNA元件转化到菌株STVP001中。每个DNA元件(左侧和右侧DNA元件)都包含约1kb的侧翼区,所述侧翼区分别与YALI0E25201 ORF的下游区域(对于右侧元件)或上游区域(对于左侧元件)相同。每个元件还包含与另一DNA元件的一部分相同的侧翼区,以允许两个DNA元件在基因组位置处彼此重组。具体地,左侧DNA元件还包含绿色荧光蛋白(GFP)表达盒和HygB标记表达盒的一部分,而右侧元件包含HygB标记表达盒的一部分,该部分与左侧DNA元件的对应部分部分地重叠。SEQ ID NO:2描述了SEQ ID NO:1的ORF,所述ORF包含在5'末端处的1kb侧翼区(与左侧元件的5'端相同)和在3'末端处的终止子(300bp)和999kb侧翼区(后者与右侧元件的3'端相同)。这些DNA元件在YALI0E25201的基因组位置处的双重交叉导致了基因组中YALI0E25201的缺失,以及绿色荧光蛋白(GFP)表达盒和功能性HygB标记盒的整合。
在含有100μg/ml潮霉素的琼脂平板上选择转化体。诊断性PCR证实了YALI0E25201ORF的缺失。光学地确认GFP的存在。YALI0E25201缺失菌株被命名为STVP002
实施例2.在菌株STVP001和STVP002中产生RebA和RebM
为了确定缺失YALI0E25201转运体的影响,执行生产测试。使用牙签在每孔含有200μl YEP以及葡萄糖的96孔半深孔板上接种菌落材料。将该板用透气密封件密封,并在Infors培养箱中在30℃、80%湿度下以750rpm振荡孵育48小时。将40μl预培养物用于接种2.5ml矿物培养基(基于Verduyn,Yeast,第8卷,501-517(1992)),但是其中使用尿素代替硫酸铵用作氮源),处于pH 6下,用葡萄糖作为碳源。将该24孔板用透气密封件密封,并在Infors培养箱中在30℃、80%湿度下以500rpm振荡孵育120小时。
由菌株STVP001和STVP002分泌的甜菊糖苷浓度的定量
在生长后,通过将板以1500g离心10分钟来沉淀24孔培养物的细胞。在离心后,转移上清液并以33%乙腈稀释,并使用液相色谱-质谱联用仪(LC-MS)测定甜菊糖苷浓度。表3中显示了菌株STVP001和STVP002的上清液中RebA和RebM的定量。
菌株STVP001和STVP002中的细胞内甜菊糖苷的定量
从24孔板中的沉淀物中倾析出24孔培养物的剩余上清液。为了洗涤细胞,向每个孔中加入2.5ml的PBS,并将细胞沉淀重悬。通过将板以1500g离心10分钟来使细胞沉淀,并倾析上清液。向每个孔中加入2.5ml的Milli-Q水,并将细胞沉淀重悬。从24孔板中收获1ml重悬的细胞沉淀,并在96孔半深板中重新排列。将容纳有沉淀级分的96孔半深板在水浴中于90℃孵育10分钟,并冷却至室温。向每个孔中的1ml沉淀级分中加入0.5ml的100%乙腈,从而产生1.5倍稀释和33%的乙腈浓度。通过将平板以1500g离心10分钟来将沉淀级分的细胞碎片离心沉淀。将所得的上清液进一步用33%乙腈稀释,并使用液相色谱-质谱联用法(LC-MS)测定甜菊糖苷浓度。表4中显示了菌株STVP001和STVP002中的细胞内总甜菊糖苷以及RebA和RebM的定量。
表3.菌株STVP001和STVP002的上清液中RebA和RebM的定量。以摩尔浓度为单位测定各数值,并将所述数值归一化为菌株STVP001中的摩尔浓度。
菌株 RebA RebM
STVP001 100 100
STVP002 20 53
表3中的结果表明,YALI0E25201的缺失对RebA和RebM的细胞外产生具有深远的负面影响。对RebA的影响大于对RebM的影响。
表4.菌株STVP001和YALI0E25201缺失菌株STVP002中的细胞内甜菊糖苷浓度。以摩尔浓度为单位测定各数值,并将所述数值归一化为菌株STVP001中的摩尔浓度。总甜菊糖苷包含RebA、RebM、RebD、RebB、甜菊苷、甜菊双糖苷、甜茶苷、甜菊醇-13-单苷。
菌株 总甜菊糖苷 RebA RebM
STVP001 100 100 100
STVP002 695 339 1248
表4中的结果表明,YALI0E25201的缺失对甜菊糖苷的细胞内浓度具有深远的影响,其中在YALI0E25201-转运体-缺失菌株STVP002中甜菊糖苷浓度要高得多。因此,YALI0E25201转运体的缺失导致了甜菊糖苷的细胞内积累。对于RebM的影响更为明显。
这些结果一起表明,YALI0E25201转运体是甜菊糖苷的高度相关转运体。YALI0E25201转运体的缺失导致了甜菊糖苷的细胞内浓度的几倍增加,以及RebM的细胞内浓度的几倍增加。结果进一步说明,就细胞外RebM产生而言,产生RebM的宿主受益于具有RebM输出机制。
实施例3.在菌株STVP002中引入转运体
将YALI0E25201转运体或转运体变体引入菌株STVP002中。根据图2所示的策略,将两个DNA元件(左侧和右侧DNA元件)转化到STVP002菌株中。左侧DNA元件含有与YALI0E25201上游的1kb相同的1kb序列、转运体ORF、YALI0E25201终止子(300bp)以及KanMX标记盒的一部分。右侧DNA元件含有KanMX标记盒的一部分,该部分与左侧DNA片段的一部分部分地重叠;以及与YALI0E25201终止子下游的1kb相同的1kb序列。这些DNA元件在YALI0E25201的基因组位置(菌株STVP002中整合GFP和HygB的位置)处的双重交叉,使得能够缺失GFP和HygB,其中转运体ORF和功能性KanMX标记盒的引入整合在所述基因组中。因此,转运体的表达受天然YALI0E25201启动子和终止子(300bp)的控制。
在含有400μg/ml G418的琼脂平板上选择转化体。进一步选择有荧光损失(GFP损失)的转化体。
实施例4.表达转运体变体的菌株STVP002中RebM的细胞外产生
为了确定变异转运体表达对RebM产生、RebA产生和总甜菊糖苷产生的影响,执行以下实验。在每孔含有200μl YEP以及葡萄糖的96孔半深孔板上接种菌落材料。对于每个转运体变体,除了野生型YALI0E25201(其以240倍执行)以外,均接种三个、四个或五个重复培养物。将该板用透气密封件密封,并在Infors培养箱中在30℃、80%湿度下以750rpm振荡孵育48小时。用40μl的预培养物接种2.5ml的矿物质培养基(在实施例2中所述)。将该板用透气密封件密封,并在Infors培养箱中在30℃、80%湿度下以500rpm振荡孵育120小时。在生长后,通过将板以1500g离心10分钟来沉淀24孔培养物的细胞。在离心后,转移上清液并以33%乙腈稀释,并使用液相色谱-质谱联用法(LC-MS)测定甜菊糖苷浓度。
通过减去对应板的控制中值来归一化结果参数以校正各板之间的影响。随后,添加原始测量的总体控制中值以维持原始实验的基线。使用格鲁布斯检验(Grubbs'test)检测异常值,并去除所述异常值。然后将结果参数在剩余的有效重复孔上取平均。使用具有不等方差的单尾学生t检验来确定突变体是否显著(p值<0.05)优于对照。
分析用野生型转运体序列转化的STVP002的240个重复的细胞外生产。这些重复中的一个重复被作为异常值丢弃,导致有239个有效重复。分析一式三份、一式四份或一式五份重复的转运体变体转化体。对于表5中的使用变异转运体的转化体的数据,所有数据均来自至少三个重复孔,并且大部分来自四个或五个有效重复孔。对于每个使用变异转运体的转化体,将所产生的RebM、所产生的RebM与所产生的RebA的比率以及所产生的RebM与总甜菊糖苷产量(包含RebA、RebB、RebD、RebM、甜菊苷、甜菊双糖苷、甜茶苷、甜菊醇-13-单苷)的比率与使用野生型序列的转化体进行比较。执行学生t检验以确立对于每个使用变异转运体的转化体对比使用野生型转运体的转化体,所产生的RebM、所产生的RebM与所产生的RebA的比率以及所产生RebM与总甜菊糖苷的比率的改进的显著性。
表5.在用转运体变体转化的菌株STVP002的上清液中产生的RebM浓度、产生的RebM浓度/RebA浓度的比率以及产生的RebM浓度/总甜菊糖苷(包含RebA、RebB、RebD、RebM、甜菊苷、甜菊双糖苷、甜茶苷、甜菊醇-13-单苷)的浓度的比率如每行中所指示。各数值表示针对用野生型转运体YALI0E25201(具有根据SEQ ID NO:3的氨基酸序列)转化的菌株STVP002中的生产(表5的第一行)归一化的摩尔浓度。
Figure GDA0002911608450000771
Figure GDA0002911608450000781
Figure GDA0002911608450000791
Figure GDA0002911608450000801
Figure GDA0002911608450000811
表5中第一列中的氨基酸位置(标题为“氨基酸位置”)是指变体中参照SEQ ID NO:3的氨基酸位置。在第二列(“野生型氨基酸”)给出的是在第一列中所指示的位置处在野生型中所存在的氨基酸。在第三列(“氨基酸取代”)给出了氨基酸取代,因此给出了所述氨基酸位置的变异氨基酸。如果在第一列和第二列中列出了多于一个位置,则第一氨基酸取代(在第三列中)对应于第一位置(在第一列和第二列中),第二氨基酸取代对应于第二位置,等等。第四列(“RebM”)指示在表达具有所示氨基酸取代的变体的重组细胞中测量的RebM的摩尔浓度(所述摩尔浓度是如果与表达根据SEQ ID NO:3的亲本多肽的重组细胞相比时归一化的,即表达根据SEQ ID NO:3的亲本多肽的重组细胞中的RebM的摩尔浓度被设置为100)。第五列(“RebM的p值”)表示针对RebM的摩尔浓度计算出的p值。第六列(“比率RebM/RebA”)和第七列(“比率RebM/RebA的p值”)分别表示RebM与RebA的摩尔浓度之比(所述比率是如果与在相同条件下测量时在表达根据SEQ ID NO:3的亲本多肽的重组细胞中的同一比率相比时归一化的,即表达根据SEQ ID NO:3的亲本多肽的重组细胞中的同一比率被设定为100)和对应的p值。第八列(“比率RebM/总甜菊糖苷”)和第九列(“比率RebM/总甜菊糖苷的p值”)分别表示RebM与总甜菊糖苷的摩尔浓度之比(所述比率是如果与在相同条件下测量时在表达根据SEQ ID NO:3的亲本多肽的重组细胞中的同一比率相比时归一化的,即表达根据SEQ ID NO:3的亲本多肽的重组细胞中的同一比率被设定为100)和对应的p值。表5中的结果表明,令人惊讶地,表5中列出的使用转运体变体的转化体导致了更高的RebM细胞外产量,和/或与RebA相比更高的RebM细胞外产量,和/或与总甜菊糖苷相比更高的RebM细胞外产量。在表5中列出的转运体变体中的大多数转运体变体中,所有这三个标准均相对于野生型序列得到了改良。
蛋白质的某些片段中的变异导致了具有很大幅度的特别高的改善频率,例如在氨基酸位置375-386、411-425、906-1180中。
实施例5.表达具有突变的组合的转运体变体的菌株STVP002中RebM的细胞外产生
为了确定变异转运体表达对细胞外RebM、RebA和总甜菊糖苷产生的影响,执行生产测试。在每孔含有200μl YEP以及葡萄糖的96孔半深孔板上接种菌落材料。对于每个转运体变体,除了野生型YALI0E25201(其以240倍执行)以外,均接种十二个重复培养物。将该板用透气密封件密封,并在Infors培养箱中在30℃、80%湿度下以750rpm振荡孵育48小时。将40μl预培养物用于接种2.5ml矿物培养基(Verduyn,Yeast,第8卷,501-517(1992),但使用尿素代替硫酸铵用作氮源),处于pH 6下,用葡萄糖作为碳源。将该板用透气密封件密封,并在Infors培养箱中在30℃、80%湿度下以500rpm振荡孵育120小时。在生长后,通过将板以1500g离心10分钟来沉淀24孔培养物的细胞。在离心后,转移上清液并以33%乙腈稀释,并使用液相色谱-质谱联用法(LC-MS)测定甜菊糖苷浓度。
通过减去对应板的控制中值来归一化结果参数以校正各板之间的影响。随后,添加原始测量的总体控制中值以维持原始实验的基线。使用格鲁布斯检验(Grubbs'test)检测异常值,并去除所述异常值。然后将结果参数在剩余的有效重复孔上取平均。使用具有不等方差的单尾学生t检验来确定突变体是否显著(p值<0.05)优于对照。
分析用野生型转运体序列转化的STVP002的240个重复的细胞外生产。其中没有异常值被丢弃。分析十二个重复的转运体变体转化体。对于表6中使用变异转运体的转化体的数据,所有数据均来自至少8个有效重复孔,并且大部分来自12个有效重复孔。对于每个使用变异转运体的转化体,将所产生的RebM、所产生的RebM与所产生的RebA的比率以及所产生的RebM与总甜菊糖苷产量(包含RebA、RebB、RebD、RebM、甜菊苷、甜菊双糖苷、甜茶苷、甜菊醇-13-单苷)的比率与使用野生型序列的转化体进行比较。执行学生t检验以确立对于每个使用变异转运体的转化体对比使用野生型转运体的转化体,所产生的RebM、所产生的RebM与所产生的RebA的比率以及所产生RebM与总甜菊糖苷的比率的改进的显著性。
表6.在用转运体转化的菌株STVP002的上清液中产生的RebM浓度、产生的RebM浓度/RebA浓度的比率以及产生的RebM浓度/总甜菊糖苷(包含RebA、RebB、RebD、RebM、甜菊苷、甜菊双糖苷、甜茶苷、甜菊醇-13-单苷)的浓度的比率。各数值表示针对用野生型转运体YALI0E25201转化的菌株STVP002中的生产(表6的第一条目)归一化的摩尔浓度。
Figure GDA0002911608450000831
Figure GDA0002911608450000841
Figure GDA0002911608450000851
Figure GDA0002911608450000861
Figure GDA0002911608450000871
Figure GDA0002911608450000881
表6中的结果表明,令人惊讶地,表6中列出的使用转运体变体的转化体导致了更高的RebM产量,和/或与RebA相比更高的RebM产量,和/或与总甜菊糖苷相比更高的RebM产量。在表5中列出的转运体变体中的大多数转运体变体中,这三个标准中的至少两个均相对于野生型序列得到了改良。
一些变体似乎具有比对RebA转运更高的对RebM转运的特异性,但较低的总体活性。在该实施例中描述的转运体变体是使用天然的YALI025201启动子表达的。在使用较强启动子表达所述转运体时,预期总体活性将恢复,或甚至超过参考菌株中所看到的水平。因此,通过使用较高的表达,可以保留特异性(例如比对RebA转运更高的对RebM转运的特异性),但仍增加细胞的总体转运活性。
实施例6.表达具有单个突变和突变的组合的转运体变体的菌株STVP002中RebM的细胞外产生
为了确定变异转运体表达对RebM、RebA和总甜菊糖苷产生的影响,执行生产测试。在每孔含有200μl YEP以及葡萄糖的96孔半深孔板上接种菌落材料。对于每个转运体变体,除了野生型YALI0E25201(其以272倍执行)以外,均接种十二个重复培养物(当允许所述数量的转运体时)。将该板用透气密封件密封,并在Infors培养箱中在30℃、80%湿度下以750rpm振荡孵育48小时。将40μl预培养物用于接种2.5ml矿物培养基(Verduyn,Yeast,第8卷,501-517(1992),但使用尿素代替硫酸铵用作氮源),处于pH 6下,用葡萄糖作为碳源。将该板用透气密封件密封,并在Infors培养箱中在30℃、80%湿度下以500rpm振荡孵育120小时。在生长后,通过将板以1500g离心10分钟来沉淀24孔培养物的细胞。在离心后,转移上清液并以33%乙腈稀释,并使用液相色谱-质谱联用法(LC-MS)测定甜菊糖苷浓度。
通过减去对应板的控制中值来归一化结果参数以校正各板之间的影响。随后,添加原始测量的总体控制中值以维持原始实验的基线。使用格鲁布斯检验(Grubbs'test)检测异常值,并去除所述异常值。然后将结果参数在剩余的有效重复孔上取平均。使用具有不等方差的单尾学生t检验来确定突变体是否显著(p值<0.05)优于对照。
分析用野生型转运体序列转化的STVP002的272个重复的细胞外生产。这些中的31个作为异常值被丢弃。分析十二个重复的转运体变体转化体(当允许所述数量的转化体时)。对于一些设计,少于12个可用。对于表7中使用变异转运体的转化体的数据,所有数据均来自至少四个有效重复孔,并且大部分来自至少10个有效重复孔。对于每个使用变异转运体的转化体,将所产生的RebM、所产生的RebM与所产生的RebA的比率以及所产生的RebM与总甜菊糖苷产量(包含RebA、RebB、RebD、RebM、甜菊苷、甜菊双糖苷、甜茶苷、甜菊醇-13-单苷)的比率与使用野生型序列的转化体进行比较。执行学生t检验以确立对于每个使用变异转运体的转化体对比使用野生型转运体的转化体,所产生的RebM、所产生的RebM与所产生的RebA的比率以及所产生RebM与总甜菊糖苷的比率的改进的显著性。
表7.在用转运体转化的菌株STVP002的上清液中产生的RebM浓度、产生的RebM浓度/RebA浓度的比率以及产生的RebM浓度/总甜菊糖苷(包含RebA、RebB、RebD、RebM、甜菊苷、甜菊双糖苷、甜茶苷、甜菊醇-13-单苷)的浓度的比率。各数值表示针对用野生型转运体YALI0E25201转化的菌株STVP002中的生产(表7的第一条目)归一化的摩尔浓度。
Figure GDA0002911608450000901
Figure GDA0002911608450000911
Figure GDA0002911608450000921
Figure GDA0002911608450000931
Figure GDA0002911608450000941
Figure GDA0002911608450000951
表7中的结果表明,表7中列出的使用转运体变体的转化体导致了更高的RebM产量,与RebA相比更高的RebM产量,和/或与总甜菊糖苷相比更高的RebM产量。表7中列出的所有变体具有相对于RebA更高的RebM细胞外产生,并且具有相对于总甜菊糖苷更高的RebM细胞外产生。另外,表7中列出的21种转运体变体也比参考转运体具有更高的细胞外RebM产生。
许多变体看起来具有较低的总体活性。在该实施例中描述的转运体变体是使用天然的YALI025201启动子表达的。在使用较强启动子表达所述转运体时,预期总体活性将恢复,或甚至超过参考菌株中所看到的水平。因此,通过使用较高的表达,可以保留特异性(例如比对RebA转运更高的对RebM转运的特异性),但仍增加细胞的总体转运活性。
参考文献
Bay D.C.等人,Biochimica et Biophysica Acta,(2008)1778:1814-1838.
Krogh A.等人,Journal of Molecular Biology,(2001)305(3):567-580.
Saier M.H.等人,Nucleic Acids Research,(2014)42:D251-D258.
Sonnhammer E.L.L.等人“A hidden Markov model for predictingtransmembrane helices in protein sequences”in Glasgow J.等人Proceedings ofthe Sixth International Conference on Intelligent Systems for MolecularBiology,(1998)175-182;Menlo Park,CA,AAAI Press.
Wilkens S.,F1000Prime Reports,(2015)7:14(doi:10.12703/P7-14).
WO 2013/110673 A1.
WO 2014/122328 A1.
WO 2015/007748 A1.
WO 2016/023844 A1
Yang N.,Annual Review of Biophysics,(2015)44:257-283.
序列表
<110> 帝斯曼知识产权资产管理有限公司
<120> 甜菊糖苷转运
<130> 32869-WO-PCT
<150> EP18170193.9
<151> 2018-04-30
<160> 6
<170> PatentIn第3.5版
<210> 1
<211> 4296
<212> DNA
<213> 解脂耶氏酵母(Yarrowia lipolytica)
<220>
<221> misc_特征
<223> 属于解脂耶氏酵母转运体YALI0E25201的开放阅读框的多核苷酸序列
<400> 1
atgggtaaaa ccgaagtgac acaggagagt ctagaatgcg ggtcggtcac gtcctcgctg 60
gggaaaaagc ccttctccat catcacactc ttcaccggca gacgcattcc tccggtacct 120
actgaaaaac cagattcggc cgaagaacgg gccgggattc tgtcaaaatt gacctggcaa 180
tggcttagtc cattgttgaa agtgagtatg gctataggat aacttctgat gtcttcttca 240
atactaacac agactggtta cttacgaaac attgaacgtg aggatctgta taaagtgaga 300
gagagaaact cggcggctgt gatccagcag cgacttgaat ccaatctcga aaaacaatac 360
gccaagtacc acgccaaact gctcaagaaa ggactctcgg agcaagaggc gcatctcaag 420
ctgcaagatt cagccaaacc cctcgtcttg gctcttaacc agacgttttt ttggaagttc 480
tggctagccg gactgtttgc cctagtcaag gacctctgtg gaatcgcctc agctatggtg 540
tcacgtgttc tgatcgaata cattcaagac agatatctct acagggggac agaccgggaa 600
cctaaggtcg gccgaggagt cggcccctcg ataggcctat ttctactggc cgtaggagtc 660
actttcttct tcaaccacat gttctacaat gtcaagatgg ttggagctca ggctcgtgca 720
gctctggtgg ccgtcatcta cagcaagagt acccgtttga gcgccaaggg ccgagctcaa 780
tacaccacag gcaagatcac aaacttggca gctattgacg cacatcgagt tgatctcagt 840
tgtgaatctt tccactacat tactatcttt ttgcctgttg tgggttgtgc cattgctgta 900
ctcgtggtca acctcaaggt cgcagctcta gttggaattg cgaccatgat tgtcttgatc 960
tttgtcgtcg caggcatcac catcttctct atgaagctgc gagccatcat tgtcaagctc 1020
acggataagc gagtcacgta tatccgagaa gctctgcagt cgattagaat catcaagtac 1080
tacggctggg aggttcctta ctgtgacaag atcaagaagg tgcgtcttga cgagacccgt 1140
aactacgcca agatgggctc gattcgagga acagccattg gtatgtttca ggcactccct 1200
attttggcag gagcgttgtc tttcatcacc tacgctgctc taggtcatgg aactgatcct 1260
gctcgaatgt tctcttctct gacgcttttc aatttactcc tgcctgctct tgctgttctt 1320
ccccaggccc tccaggctgc tggagacgct cgagtggctc tcagacgtat ccagcggttc 1380
cttggggccg aggagtcgac tcccactaca gtttttgacg ctactcttga atctactgat 1440
gacgctgtga ttgtggaaga cgcctctttc atctggccag aagttgtcga tgataagagc 1500
gacaaagaga aggctaaaga tgcaaagaag gaggaaaagg ataagaagaa ggccgagaag 1560
aaggccaaga aggcggccaa gaaggcggcc aaggagatcg cggtggttgt ggaagaggag 1620
gtggaacacg aaaagaccga gggatccagt gagtctgaaa agggtactct taagtcgact 1680
ttcaagggct tcaacaacct gtctttcaaa atcaagcggg gtgaatttgt cgttgttacc 1740
ggtcccattg gttctggaaa gtcgtctctt cttgctgcca tcactggatc tatggttttg 1800
acaggcggtt ccgtgcgagt gtcgtccaca gagtggattg gatgtctgga gccgtggatt 1860
caaaacgcca cagttcgaga taacattgtg tttgggcgaa aattcgactc tgaatggtat 1920
agaactgtgg ttactgcctg tcagctgagc caggatctca aaataatgac tcacggagac 1980
aataccatga ttggagagcg aggcatcaca gtttcgggcg gtcaaaaagc tcgaatcaac 2040
ctcgcacgtg ctatatatgg aaaccccgag attctcatca tggacgacgt cctgtcggct 2100
gtggacgctc gagtaggtgc tggtattgtg gacgattgtc ttcgaggctt agccaagaac 2160
tccactcgaa ttctggccac ccatcagctg tctgtgctgc ctaaggctga tcatgtgatt 2220
ttcatggatg ccgaaggcca gtttcatatt ggtacgtacc aagagctgga ggctgacaat 2280
gagcagttca aggctctttt ggcggctggt tccatgtcca aggaggaggt ggttgctgtc 2340
gacgagactg aggttgttat tgaaggcgat cttgaagacg actgcgataa caaggaggag 2400
tatgaggatg cagctgagac catttccatt ttggcagatg ccactcaaga gctgcaaaag 2460
gtgaccacta cagtctcggc atttgaggag aacgataaca tgatggagga agaagagcga 2520
atgagagatg cagttggttt gcatgtgtac tggcagtatt ttcgtcaggc caaccccagt 2580
agggtcaagg taatgatgtt cattggcatg atcttcattt ccatgattgt gattgccttt 2640
ctgtttgtct tcacatctgt atggctctcg ttctggacag gtgaccgttt ccatgcctcc 2700
agaaacttct acaccggaat ttacatcatg ctgggtattc ttctgcttct tgctgtggca 2760
ggatacatga ttgtcaatga gatcaactct gccatggcag caagaaatct acacaatcat 2820
gctttggact cggtgttcgc tgcacgaact tctttcttcg ataccactcc tcagggtcgt 2880
atcatcaacc ggttcacccg agacacagac tctctggata acgagctggc tatgcgattg 2940
actatgttgt tctttggcgt ctccgcattc ttctccaact tcctgcttac ttgtgtctac 3000
gttccttatg tgactcttgt gcttgtccct gtcggttttg tcttctacgt ttctctaggt 3060
tactaccgaa agtcagctcg tgaagtcaag cgaattgact ccattgaacg gtcgcacatg 3120
atgagtgtct tcaacgagtc catttccggt atgcccgtca tcatcatgta caaggcccag 3180
catcggctca tgaacaagct tcaggctact ctcgatgata tggacagtgc ctacttcctc 3240
actgctgcaa accagcgatg gctgtctctc cgtctggatg gtctgggttc tttggtcgtt 3300
ctggtggcca ctattcttgt tgctgtcgga gtctttgatc tcaccccttc caacatgggt 3360
ctgatcattt ccgcggcctc ctttatcccc gaagtcatgt ctatggttgc ccaggccgtt 3420
gctgaactcg aaaactgcat gaacgccaca gagcgaattc tttactacaa ggacaacatt 3480
cctgctgagg ctgctcgaga agtggacggt acagagctcg accagcgacc caactggcct 3540
gagcagggag ccatcagctt caacaatgtg tccatgaagt accgagatgg acttccttac 3600
gtgctcaagt cattgtctgt cgactttcag ggaggacaca aggtgggtat ctgtggacga 3660
acaggagccg gtaagagtac catcttgcag actctgtatc gaattgtgga gcttgctgag 3720
ggttctatta ctattgatgg tgttgacatt tcgactattg gactgcatca gcttcggtct 3780
cagttgtcca tcattcccca ggagccagtt ttgttcctgg gcaccatccg gtctaatttg 3840
gatcctctgg agcaatactc tgatgctgag ctatggggtt ctctacgacg gtctggactt 3900
ctcgatgaag gagagactga gggtaagttt catctggatc aaaaggtgga ggctgacggc 3960
agcaacttct ctctaggtga gcgacagctg ctgactctag cccgagcact gcttagaaac 4020
accaaaattt tggtgctgga cgaagccaca tcaaatgtcg actacaagac ggacaagctg 4080
gttcaggaga ccatttcacg ggagtttggc cactgcacga ttctgtgtat cgcccatcga 4140
ctgcgaacca ttgccaagta tgatcgtatt ttggtgcttg agtccggcga gatcaaccag 4200
tacgacacgc cctggaactt gtacaacgac aaggagggta ttttccgagg tatgtgtgac 4260
acctccgggt tgaacgaggt agacttcaac aagtga 4296
<210> 2
<211> 6595
<212> DNA
<213> 解脂耶氏酵母(Yarrowia lipolytica)
<220>
<221> misc_特征
<223> 解脂耶氏酵母转运体YALI0E25201的基因组序列,所述基因组序列包含在ORF上游的1000 bp侧翼序列、ORF和在ORF下游的终止子序列(300 bp),之后是999 bp侧翼序列
<400> 2
cacaaagtac aatacaagta catactgtac ctgtgagtca tagtgacatg agaaaccatc 60
gaaggggcac acactcactc acactgtgaa ttggctctgg tcgactgcct gatgctccta 120
taatcgatct acacaccaac tcctttctca tccgcatgga tatagtttca tatcagtgtg 180
catggtgcaa aacgccgttt gccacccaat agtgttctgt gcactaattt gacagcgaat 240
ttgccactgt ggggaacgtg gggaggaact ggaactacgg tactcgttcg aagttccgat 300
ccgaccggtg tgtgtcgagc aatggagtct gtgaaacctg tagtggtgct cgtggtggtg 360
gtggtggtgg ttgcacttgc agcatgtaag cagctgacgc gtcgcttaat agcacagtca 420
gttcgtatac tgtgatactt caatggtgtc aggaaggtga agaaacaacg ggtaataggg 480
catgttccat ttattttgaa cttgctgctt gaagtaggtt tggagactgc gttcggtgca 540
ttagcttctt gatatggagg cacggctctt cggggtccga ggtcgtggat agaagttgga 600
aagaggttct cggggttctt gtagatgaaa aaaacgacga agttgagata attaaacact 660
gtggagaaga gatatcgact gctgtgggtc acataacctc ttatatacgc gccaattctt 720
tcaccaaccc gcaagtcccc aaactcaatc cagaagacta tcaattttag acatgtatcg 780
gtcacatcaa tcgccgataa ccaaccagca agtggggaga cgccaccttt ttctcgcagc 840
ttttatactc ggcactgcgg cgttgctact taacctcctt gaatctcgat tggactgcta 900
gatcattgag atcagtcgac aaacagctca gatcagccac agatcagaca gctgatttca 960
gatcatcagt ttctcacacc acaccctcag tcttccacac atgggtaaaa ccgaagtgac 1020
acaggagagt ctagaatgcg ggtcggtcac gtcctcgctg gggaaaaagc ccttctccat 1080
catcacactc ttcaccggca gacgcattcc tccggtacct actgaaaaac cagattcggc 1140
cgaagaacgg gccgggattc tgtcaaaatt gacctggcaa tggcttagtc cattgttgaa 1200
agtgagtatg gctataggat aacttctgat gtcttcttca atactaacac agactggtta 1260
cttacgaaac attgaacgtg aggatctgta taaagtgaga gagagaaact cggcggctgt 1320
gatccagcag cgacttgaat ccaatctcga aaaacaatac gccaagtacc acgccaaact 1380
gctcaagaaa ggactctcgg agcaagaggc gcatctcaag ctgcaagatt cagccaaacc 1440
cctcgtcttg gctcttaacc agacgttttt ttggaagttc tggctagccg gactgtttgc 1500
cctagtcaag gacctctgtg gaatcgcctc agctatggtg tcacgtgttc tgatcgaata 1560
cattcaagac agatatctct acagggggac agaccgggaa cctaaggtcg gccgaggagt 1620
cggcccctcg ataggcctat ttctactggc cgtaggagtc actttcttct tcaaccacat 1680
gttctacaat gtcaagatgg ttggagctca ggctcgtgca gctctggtgg ccgtcatcta 1740
cagcaagagt acccgtttga gcgccaaggg ccgagctcaa tacaccacag gcaagatcac 1800
aaacttggca gctattgacg cacatcgagt tgatctcagt tgtgaatctt tccactacat 1860
tactatcttt ttgcctgttg tgggttgtgc cattgctgta ctcgtggtca acctcaaggt 1920
cgcagctcta gttggaattg cgaccatgat tgtcttgatc tttgtcgtcg caggcatcac 1980
catcttctct atgaagctgc gagccatcat tgtcaagctc acggataagc gagtcacgta 2040
tatccgagaa gctctgcagt cgattagaat catcaagtac tacggctggg aggttcctta 2100
ctgtgacaag atcaagaagg tgcgtcttga cgagacccgt aactacgcca agatgggctc 2160
gattcgagga acagccattg gtatgtttca ggcactccct attttggcag gagcgttgtc 2220
tttcatcacc tacgctgctc taggtcatgg aactgatcct gctcgaatgt tctcttctct 2280
gacgcttttc aatttactcc tgcctgctct tgctgttctt ccccaggccc tccaggctgc 2340
tggagacgct cgagtggctc tcagacgtat ccagcggttc cttggggccg aggagtcgac 2400
tcccactaca gtttttgacg ctactcttga atctactgat gacgctgtga ttgtggaaga 2460
cgcctctttc atctggccag aagttgtcga tgataagagc gacaaagaga aggctaaaga 2520
tgcaaagaag gaggaaaagg ataagaagaa ggccgagaag aaggccaaga aggcggccaa 2580
gaaggcggcc aaggagatcg cggtggttgt ggaagaggag gtggaacacg aaaagaccga 2640
gggatccagt gagtctgaaa agggtactct taagtcgact ttcaagggct tcaacaacct 2700
gtctttcaaa atcaagcggg gtgaatttgt cgttgttacc ggtcccattg gttctggaaa 2760
gtcgtctctt cttgctgcca tcactggatc tatggttttg acaggcggtt ccgtgcgagt 2820
gtcgtccaca gagtggattg gatgtctgga gccgtggatt caaaacgcca cagttcgaga 2880
taacattgtg tttgggcgaa aattcgactc tgaatggtat agaactgtgg ttactgcctg 2940
tcagctgagc caggatctca aaataatgac tcacggagac aataccatga ttggagagcg 3000
aggcatcaca gtttcgggcg gtcaaaaagc tcgaatcaac ctcgcacgtg ctatatatgg 3060
aaaccccgag attctcatca tggacgacgt cctgtcggct gtggacgctc gagtaggtgc 3120
tggtattgtg gacgattgtc ttcgaggctt agccaagaac tccactcgaa ttctggccac 3180
ccatcagctg tctgtgctgc ctaaggctga tcatgtgatt ttcatggatg ccgaaggcca 3240
gtttcatatt ggtacgtacc aagagctgga ggctgacaat gagcagttca aggctctttt 3300
ggcggctggt tccatgtcca aggaggaggt ggttgctgtc gacgagactg aggttgttat 3360
tgaaggcgat cttgaagacg actgcgataa caaggaggag tatgaggatg cagctgagac 3420
catttccatt ttggcagatg ccactcaaga gctgcaaaag gtgaccacta cagtctcggc 3480
atttgaggag aacgataaca tgatggagga agaagagcga atgagagatg cagttggttt 3540
gcatgtgtac tggcagtatt ttcgtcaggc caaccccagt agggtcaagg taatgatgtt 3600
cattggcatg atcttcattt ccatgattgt gattgccttt ctgtttgtct tcacatctgt 3660
atggctctcg ttctggacag gtgaccgttt ccatgcctcc agaaacttct acaccggaat 3720
ttacatcatg ctgggtattc ttctgcttct tgctgtggca ggatacatga ttgtcaatga 3780
gatcaactct gccatggcag caagaaatct acacaatcat gctttggact cggtgttcgc 3840
tgcacgaact tctttcttcg ataccactcc tcagggtcgt atcatcaacc ggttcacccg 3900
agacacagac tctctggata acgagctggc tatgcgattg actatgttgt tctttggcgt 3960
ctccgcattc ttctccaact tcctgcttac ttgtgtctac gttccttatg tgactcttgt 4020
gcttgtccct gtcggttttg tcttctacgt ttctctaggt tactaccgaa agtcagctcg 4080
tgaagtcaag cgaattgact ccattgaacg gtcgcacatg atgagtgtct tcaacgagtc 4140
catttccggt atgcccgtca tcatcatgta caaggcccag catcggctca tgaacaagct 4200
tcaggctact ctcgatgata tggacagtgc ctacttcctc actgctgcaa accagcgatg 4260
gctgtctctc cgtctggatg gtctgggttc tttggtcgtt ctggtggcca ctattcttgt 4320
tgctgtcgga gtctttgatc tcaccccttc caacatgggt ctgatcattt ccgcggcctc 4380
ctttatcccc gaagtcatgt ctatggttgc ccaggccgtt gctgaactcg aaaactgcat 4440
gaacgccaca gagcgaattc tttactacaa ggacaacatt cctgctgagg ctgctcgaga 4500
agtggacggt acagagctcg accagcgacc caactggcct gagcagggag ccatcagctt 4560
caacaatgtg tccatgaagt accgagatgg acttccttac gtgctcaagt cattgtctgt 4620
cgactttcag ggaggacaca aggtgggtat ctgtggacga acaggagccg gtaagagtac 4680
catcttgcag actctgtatc gaattgtgga gcttgctgag ggttctatta ctattgatgg 4740
tgttgacatt tcgactattg gactgcatca gcttcggtct cagttgtcca tcattcccca 4800
ggagccagtt ttgttcctgg gcaccatccg gtctaatttg gatcctctgg agcaatactc 4860
tgatgctgag ctatggggtt ctctacgacg gtctggactt ctcgatgaag gagagactga 4920
gggtaagttt catctggatc aaaaggtgga ggctgacggc agcaacttct ctctaggtga 4980
gcgacagctg ctgactctag cccgagcact gcttagaaac accaaaattt tggtgctgga 5040
cgaagccaca tcaaatgtcg actacaagac ggacaagctg gttcaggaga ccatttcacg 5100
ggagtttggc cactgcacga ttctgtgtat cgcccatcga ctgcgaacca ttgccaagta 5160
tgatcgtatt ttggtgcttg agtccggcga gatcaaccag tacgacacgc cctggaactt 5220
gtacaacgac aaggagggta ttttccgagg tatgtgtgac acctccgggt tgaacgaggt 5280
agacttcaac aagtgaaaaa ttacgatgag ggtagacagt ctgagatgag actgataaat 5340
tatagagaaa aaatgtttga ttatagcagt agtgaatgta ttgtatgtaa taagtggcca 5400
atcttggaat ggtggcctcc gtattaattc ttaccgaact cgtagtcacc tttgtaaagc 5460
gacagtgtct gttcacattg ggtcaaacat gtaaatattg tagctacgta gtctatagtc 5520
ctaagagaac gataccatag aaaatcgatt tccacagccg atcttttttg tcggtggcaa 5580
tcagtacttt tctttttctc aatattcgca ccgttcacaa ttacctcaaa ttgcttttcg 5640
gaagttgaga taggatcggg tcgggagtgt ttcggaagcg ggtcgggccg aaaaagccgt 5700
taccgggttt ccgaaactgc ctctgaaaag atgtggaatc acatggggga gtattagcag 5760
tgcctttgag atgtttcggt tgagctctgc ttagctttca ttaggcaaga gccgtgcttg 5820
atagatttct cgagcatgta gctcatacta gctcttgcac cattgaggtg aggtgaatga 5880
ggtgctgtat ccgtttttga tgacaccaat tgataataat tgtgagttat ggcaacgcaa 5940
agagtttgtt agaatgatag cagagaaatt ccatgcgaaa caccgctata tggcttgttt 6000
ggcagagtcc tacttcagct gtggtgttca tgccgaacta tagtatgtac gagaacaaag 6060
tagcccatta caatcacaag cggtcgtcga tactcaatca aaaataaacg tccagccaat 6120
gctacatcaa agacaccctt caaacagcat ctggacccgc agacttgcca ctatggatgc 6180
aggacgttaa ggggtggcat caagccgcag agagactata cgagtcttgg ctaactgtaa 6240
ttaggtgaca attgagagtg atgtccactg ataggctact tttacgagtg ataagtgaga 6300
gcgatagcct cggcgtctaa aaagggagca caatgagtgt cttattacga gtacggtgat 6360
atacattgtt gttcatctat agtttggatg tgtgtcaggt gcccgttttt atcagttcac 6420
cctacgagta catacagtat gtacttgtac agtacactta caagatctag tttgaccatg 6480
caactgaaca gaatacaact aaacagattt agttacacgc atacacacaa tagggtgtat 6540
aacctcagat atcagtccca tacttatagt actgtattgt tgtccttcac attct 6595
<210> 3
<211> 1414
<212> PRT
<213> 解脂耶氏酵母(Yarrowia lipolytica)
<220>
<221> MISC_特征
<223> 解脂耶氏酵母转运体YALI0E25201的氨基酸序列
<400> 3
Met Gly Lys Thr Glu Val Thr Gln Glu Ser Leu Glu Cys Gly Ser Val
1 5 10 15
Thr Ser Ser Leu Gly Lys Lys Pro Phe Ser Ile Ile Thr Leu Phe Thr
20 25 30
Gly Arg Arg Ile Pro Pro Val Pro Thr Glu Lys Pro Asp Ser Ala Glu
35 40 45
Glu Arg Ala Gly Ile Leu Ser Lys Leu Thr Trp Gln Trp Leu Ser Pro
50 55 60
Leu Leu Lys Thr Gly Tyr Leu Arg Asn Ile Glu Arg Glu Asp Leu Tyr
65 70 75 80
Lys Val Arg Glu Arg Asn Ser Ala Ala Val Ile Gln Gln Arg Leu Glu
85 90 95
Ser Asn Leu Glu Lys Gln Tyr Ala Lys Tyr His Ala Lys Leu Leu Lys
100 105 110
Lys Gly Leu Ser Glu Gln Glu Ala His Leu Lys Leu Gln Asp Ser Ala
115 120 125
Lys Pro Leu Val Leu Ala Leu Asn Gln Thr Phe Phe Trp Lys Phe Trp
130 135 140
Leu Ala Gly Leu Phe Ala Leu Val Lys Asp Leu Cys Gly Ile Ala Ser
145 150 155 160
Ala Met Val Ser Arg Val Leu Ile Glu Tyr Ile Gln Asp Arg Tyr Leu
165 170 175
Tyr Arg Gly Thr Asp Arg Glu Pro Lys Val Gly Arg Gly Val Gly Pro
180 185 190
Ser Ile Gly Leu Phe Leu Leu Ala Val Gly Val Thr Phe Phe Phe Asn
195 200 205
His Met Phe Tyr Asn Val Lys Met Val Gly Ala Gln Ala Arg Ala Ala
210 215 220
Leu Val Ala Val Ile Tyr Ser Lys Ser Thr Arg Leu Ser Ala Lys Gly
225 230 235 240
Arg Ala Gln Tyr Thr Thr Gly Lys Ile Thr Asn Leu Ala Ala Ile Asp
245 250 255
Ala His Arg Val Asp Leu Ser Cys Glu Ser Phe His Tyr Ile Thr Ile
260 265 270
Phe Leu Pro Val Val Gly Cys Ala Ile Ala Val Leu Val Val Asn Leu
275 280 285
Lys Val Ala Ala Leu Val Gly Ile Ala Thr Met Ile Val Leu Ile Phe
290 295 300
Val Val Ala Gly Ile Thr Ile Phe Ser Met Lys Leu Arg Ala Ile Ile
305 310 315 320
Val Lys Leu Thr Asp Lys Arg Val Thr Tyr Ile Arg Glu Ala Leu Gln
325 330 335
Ser Ile Arg Ile Ile Lys Tyr Tyr Gly Trp Glu Val Pro Tyr Cys Asp
340 345 350
Lys Ile Lys Lys Val Arg Leu Asp Glu Thr Arg Asn Tyr Ala Lys Met
355 360 365
Gly Ser Ile Arg Gly Thr Ala Ile Gly Met Phe Gln Ala Leu Pro Ile
370 375 380
Leu Ala Gly Ala Leu Ser Phe Ile Thr Tyr Ala Ala Leu Gly His Gly
385 390 395 400
Thr Asp Pro Ala Arg Met Phe Ser Ser Leu Thr Leu Phe Asn Leu Leu
405 410 415
Leu Pro Ala Leu Ala Val Leu Pro Gln Ala Leu Gln Ala Ala Gly Asp
420 425 430
Ala Arg Val Ala Leu Arg Arg Ile Gln Arg Phe Leu Gly Ala Glu Glu
435 440 445
Ser Thr Pro Thr Thr Val Phe Asp Ala Thr Leu Glu Ser Thr Asp Asp
450 455 460
Ala Val Ile Val Glu Asp Ala Ser Phe Ile Trp Pro Glu Val Val Asp
465 470 475 480
Asp Lys Ser Asp Lys Glu Lys Ala Lys Asp Ala Lys Lys Glu Glu Lys
485 490 495
Asp Lys Lys Lys Ala Glu Lys Lys Ala Lys Lys Ala Ala Lys Lys Ala
500 505 510
Ala Lys Glu Ile Ala Val Val Val Glu Glu Glu Val Glu His Glu Lys
515 520 525
Thr Glu Gly Ser Ser Glu Ser Glu Lys Gly Thr Leu Lys Ser Thr Phe
530 535 540
Lys Gly Phe Asn Asn Leu Ser Phe Lys Ile Lys Arg Gly Glu Phe Val
545 550 555 560
Val Val Thr Gly Pro Ile Gly Ser Gly Lys Ser Ser Leu Leu Ala Ala
565 570 575
Ile Thr Gly Ser Met Val Leu Thr Gly Gly Ser Val Arg Val Ser Ser
580 585 590
Thr Glu Trp Ile Gly Cys Leu Glu Pro Trp Ile Gln Asn Ala Thr Val
595 600 605
Arg Asp Asn Ile Val Phe Gly Arg Lys Phe Asp Ser Glu Trp Tyr Arg
610 615 620
Thr Val Val Thr Ala Cys Gln Leu Ser Gln Asp Leu Lys Ile Met Thr
625 630 635 640
His Gly Asp Asn Thr Met Ile Gly Glu Arg Gly Ile Thr Val Ser Gly
645 650 655
Gly Gln Lys Ala Arg Ile Asn Leu Ala Arg Ala Ile Tyr Gly Asn Pro
660 665 670
Glu Ile Leu Ile Met Asp Asp Val Leu Ser Ala Val Asp Ala Arg Val
675 680 685
Gly Ala Gly Ile Val Asp Asp Cys Leu Arg Gly Leu Ala Lys Asn Ser
690 695 700
Thr Arg Ile Leu Ala Thr His Gln Leu Ser Val Leu Pro Lys Ala Asp
705 710 715 720
His Val Ile Phe Met Asp Ala Glu Gly Gln Phe His Ile Gly Thr Tyr
725 730 735
Gln Glu Leu Glu Ala Asp Asn Glu Gln Phe Lys Ala Leu Leu Ala Ala
740 745 750
Gly Ser Met Ser Lys Glu Glu Val Val Ala Val Asp Glu Thr Glu Val
755 760 765
Val Ile Glu Gly Asp Leu Glu Asp Asp Cys Asp Asn Lys Glu Glu Tyr
770 775 780
Glu Asp Ala Ala Glu Thr Ile Ser Ile Leu Ala Asp Ala Thr Gln Glu
785 790 795 800
Leu Gln Lys Val Thr Thr Thr Val Ser Ala Phe Glu Glu Asn Asp Asn
805 810 815
Met Met Glu Glu Glu Glu Arg Met Arg Asp Ala Val Gly Leu His Val
820 825 830
Tyr Trp Gln Tyr Phe Arg Gln Ala Asn Pro Ser Arg Val Lys Val Met
835 840 845
Met Phe Ile Gly Met Ile Phe Ile Ser Met Ile Val Ile Ala Phe Leu
850 855 860
Phe Val Phe Thr Ser Val Trp Leu Ser Phe Trp Thr Gly Asp Arg Phe
865 870 875 880
His Ala Ser Arg Asn Phe Tyr Thr Gly Ile Tyr Ile Met Leu Gly Ile
885 890 895
Leu Leu Leu Leu Ala Val Ala Gly Tyr Met Ile Val Asn Glu Ile Asn
900 905 910
Ser Ala Met Ala Ala Arg Asn Leu His Asn His Ala Leu Asp Ser Val
915 920 925
Phe Ala Ala Arg Thr Ser Phe Phe Asp Thr Thr Pro Gln Gly Arg Ile
930 935 940
Ile Asn Arg Phe Thr Arg Asp Thr Asp Ser Leu Asp Asn Glu Leu Ala
945 950 955 960
Met Arg Leu Thr Met Leu Phe Phe Gly Val Ser Ala Phe Phe Ser Asn
965 970 975
Phe Leu Leu Thr Cys Val Tyr Val Pro Tyr Val Thr Leu Val Leu Val
980 985 990
Pro Val Gly Phe Val Phe Tyr Val Ser Leu Gly Tyr Tyr Arg Lys Ser
995 1000 1005
Ala Arg Glu Val Lys Arg Ile Asp Ser Ile Glu Arg Ser His Met
1010 1015 1020
Met Ser Val Phe Asn Glu Ser Ile Ser Gly Met Pro Val Ile Ile
1025 1030 1035
Met Tyr Lys Ala Gln His Arg Leu Met Asn Lys Leu Gln Ala Thr
1040 1045 1050
Leu Asp Asp Met Asp Ser Ala Tyr Phe Leu Thr Ala Ala Asn Gln
1055 1060 1065
Arg Trp Leu Ser Leu Arg Leu Asp Gly Leu Gly Ser Leu Val Val
1070 1075 1080
Leu Val Ala Thr Ile Leu Val Ala Val Gly Val Phe Asp Leu Thr
1085 1090 1095
Pro Ser Asn Met Gly Leu Ile Ile Ser Ala Ala Ser Phe Ile Pro
1100 1105 1110
Glu Val Met Ser Met Val Ala Gln Ala Val Ala Glu Leu Glu Asn
1115 1120 1125
Cys Met Asn Ala Thr Glu Arg Ile Leu Tyr Tyr Lys Asp Asn Ile
1130 1135 1140
Pro Ala Glu Ala Ala Arg Glu Val Asp Gly Thr Glu Leu Asp Gln
1145 1150 1155
Arg Pro Asn Trp Pro Glu Gln Gly Ala Ile Ser Phe Asn Asn Val
1160 1165 1170
Ser Met Lys Tyr Arg Asp Gly Leu Pro Tyr Val Leu Lys Ser Leu
1175 1180 1185
Ser Val Asp Phe Gln Gly Gly His Lys Val Gly Ile Cys Gly Arg
1190 1195 1200
Thr Gly Ala Gly Lys Ser Thr Ile Leu Gln Thr Leu Tyr Arg Ile
1205 1210 1215
Val Glu Leu Ala Glu Gly Ser Ile Thr Ile Asp Gly Val Asp Ile
1220 1225 1230
Ser Thr Ile Gly Leu His Gln Leu Arg Ser Gln Leu Ser Ile Ile
1235 1240 1245
Pro Gln Glu Pro Val Leu Phe Leu Gly Thr Ile Arg Ser Asn Leu
1250 1255 1260
Asp Pro Leu Glu Gln Tyr Ser Asp Ala Glu Leu Trp Gly Ser Leu
1265 1270 1275
Arg Arg Ser Gly Leu Leu Asp Glu Gly Glu Thr Glu Gly Lys Phe
1280 1285 1290
His Leu Asp Gln Lys Val Glu Ala Asp Gly Ser Asn Phe Ser Leu
1295 1300 1305
Gly Glu Arg Gln Leu Leu Thr Leu Ala Arg Ala Leu Leu Arg Asn
1310 1315 1320
Thr Lys Ile Leu Val Leu Asp Glu Ala Thr Ser Asn Val Asp Tyr
1325 1330 1335
Lys Thr Asp Lys Leu Val Gln Glu Thr Ile Ser Arg Glu Phe Gly
1340 1345 1350
His Cys Thr Ile Leu Cys Ile Ala His Arg Leu Arg Thr Ile Ala
1355 1360 1365
Lys Tyr Asp Arg Ile Leu Val Leu Glu Ser Gly Glu Ile Asn Gln
1370 1375 1380
Tyr Asp Thr Pro Trp Asn Leu Tyr Asn Asp Lys Glu Gly Ile Phe
1385 1390 1395
Arg Gly Met Cys Asp Thr Ser Gly Leu Asn Glu Val Asp Phe Asn
1400 1405 1410
Lys
<210> 4
<211> 500
<212> PRT
<213> 人工序列
<220>
<223> 截短的 3-羟基-3-甲基戊二酰辅酶A还原酶
<400> 4
Met Thr Gln Ser Val Lys Val Val Glu Lys His Val Pro Ile Val Ile
1 5 10 15
Glu Lys Pro Ser Glu Lys Glu Glu Asp Thr Ser Ser Glu Asp Ser Ile
20 25 30
Glu Leu Thr Val Gly Lys Gln Pro Lys Pro Val Thr Glu Thr Arg Ser
35 40 45
Leu Asp Asp Leu Glu Ala Ile Met Lys Ala Gly Lys Thr Lys Leu Leu
50 55 60
Glu Asp His Glu Val Val Lys Leu Ser Leu Glu Gly Lys Leu Pro Leu
65 70 75 80
Tyr Ala Leu Glu Lys Gln Leu Gly Asp Asn Thr Arg Ala Val Gly Ile
85 90 95
Arg Arg Ser Ile Ile Ser Gln Gln Ser Asn Thr Lys Thr Leu Glu Thr
100 105 110
Ser Lys Leu Pro Tyr Leu His Tyr Asp Tyr Asp Arg Val Phe Gly Ala
115 120 125
Cys Cys Glu Asn Val Ile Gly Tyr Met Pro Leu Pro Val Gly Val Ala
130 135 140
Gly Pro Met Asn Ile Asp Gly Lys Asn Tyr His Ile Pro Met Ala Thr
145 150 155 160
Thr Glu Gly Cys Leu Val Ala Ser Thr Met Arg Gly Cys Lys Ala Ile
165 170 175
Asn Ala Gly Gly Gly Val Thr Thr Val Leu Thr Gln Asp Gly Met Thr
180 185 190
Arg Gly Pro Cys Val Ser Phe Pro Ser Leu Lys Arg Ala Gly Ala Ala
195 200 205
Lys Ile Trp Leu Asp Ser Glu Glu Gly Leu Lys Ser Met Arg Lys Ala
210 215 220
Phe Asn Ser Thr Ser Arg Phe Ala Arg Leu Gln Ser Leu His Ser Thr
225 230 235 240
Leu Ala Gly Asn Leu Leu Phe Ile Arg Phe Arg Thr Thr Thr Gly Asp
245 250 255
Ala Met Gly Met Asn Met Ile Ser Lys Gly Val Glu His Ser Leu Ala
260 265 270
Val Met Val Lys Glu Tyr Gly Phe Pro Asp Met Asp Ile Val Ser Val
275 280 285
Ser Gly Asn Tyr Cys Thr Asp Lys Lys Pro Ala Ala Ile Asn Trp Ile
290 295 300
Glu Gly Arg Gly Lys Ser Val Val Ala Glu Ala Thr Ile Pro Ala His
305 310 315 320
Ile Val Lys Ser Val Leu Lys Ser Glu Val Asp Ala Leu Val Glu Leu
325 330 335
Asn Ile Ser Lys Asn Leu Ile Gly Ser Ala Met Ala Gly Ser Val Gly
340 345 350
Gly Phe Asn Ala His Ala Ala Asn Leu Val Thr Ala Ile Tyr Leu Ala
355 360 365
Thr Gly Gln Asp Pro Ala Gln Asn Val Glu Ser Ser Asn Cys Ile Thr
370 375 380
Leu Met Ser Asn Val Asp Gly Asn Leu Leu Ile Ser Val Ser Met Pro
385 390 395 400
Ser Ile Glu Val Gly Thr Ile Gly Gly Gly Thr Ile Leu Glu Pro Gln
405 410 415
Gly Ala Met Leu Glu Met Leu Gly Val Arg Gly Pro His Ile Glu Thr
420 425 430
Pro Gly Ala Asn Ala Gln Gln Leu Ala Arg Ile Ile Ala Ser Gly Val
435 440 445
Leu Ala Ala Glu Leu Ser Leu Cys Ser Ala Leu Ala Ala Gly His Leu
450 455 460
Val Gln Ser His Met Thr His Asn Arg Ser Gln Ala Pro Thr Pro Ala
465 470 475 480
Lys Gln Ser Gln Ala Asp Leu Gln Arg Leu Gln Asn Gly Ser Asn Ile
485 490 495
Cys Ile Arg Ser
500
<210> 5
<211> 327
<212> PRT
<213> 人工序列
<220>
<223> 变异香叶酰香叶酰二磷酸合酶
<400> 5
Met Asp Tyr Asn Ser Ala Asp Phe Lys Glu Ile Trp Gly Lys Ala Ala
1 5 10 15
Asp Thr Ala Leu Leu Gly Pro Tyr Asn Tyr Leu Ala Asn Asn Arg Gly
20 25 30
His Asn Ile Arg Glu His Leu Ile Ala Ala Phe Gly Ala Val Ile Lys
35 40 45
Val Asp Lys Ser Asp Leu Glu Thr Ile Ser His Ile Thr Lys Ile Leu
50 55 60
His Asn Ser Ser Leu Leu Val Asp Asp Val Glu Asp Asn Ser Met Leu
65 70 75 80
Arg Arg Gly Leu Pro Ala Ala His Cys Leu Phe Glu Val Pro Gln Thr
85 90 95
Ile Asn Ser Val Asn Tyr Met Tyr Phe Val Ala Leu Gln Glu Val Leu
100 105 110
Lys Leu Lys Ser Tyr Asp Ala Val Ser Ile Phe Thr Glu Glu Met Ile
115 120 125
Asn Leu His Arg Gly Gln Gly Met Asp Leu Tyr Trp Arg Glu Thr Leu
130 135 140
Thr Cys Pro Ser Glu Asp Glu Tyr Leu Glu Met Val Val His Lys Thr
145 150 155 160
Gly Gly Leu Phe Arg Leu Ala Leu Arg Leu Met Leu Ser Val Ala Ser
165 170 175
Lys Gln Glu Asp His Glu Lys Ile Asn Phe Asp Leu Thr His Leu Thr
180 185 190
Asp Thr Leu Gly Val Ile Tyr Gln Ile Leu Asp Asp Tyr Leu Asn Leu
195 200 205
Gln Ser Thr Glu Leu Thr Glu Asn Lys Gly Phe Cys Glu Asp Ile Ser
210 215 220
Glu Gly Lys Phe Ser Phe Pro Leu Ile His Ser Ile Arg Thr Asn Pro
225 230 235 240
Asp Asn His Glu Ile Leu Asn Ile Leu Lys Gln Arg Thr Ser Asp Ala
245 250 255
Ser Leu Lys Lys Tyr Ala Val Asp Tyr Met Arg Thr Glu Thr Lys Ser
260 265 270
Phe Asp Tyr Cys Leu Lys Arg Ile Gln Ala Met Ser Leu Lys Ala Ser
275 280 285
Ser Tyr Ile Asp Asp Leu Ala Ala Ala Gly His Asp Val Ser Lys Leu
290 295 300
Arg Ala Ile Leu His Tyr Phe Val Ser Thr Ser Asp Cys Glu Glu Arg
305 310 315 320
Lys Tyr Phe Glu Asp Ala Gln
325
<210> 6
<211> 525
<212> PRT
<213> 人工序列
<220>
<223> 变异贝壳杉烯酸13-羟化酶
<400> 6
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Asn Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Thr Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Arg Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Ser Leu
115 120 125
Asp Leu Gly Arg Ile Thr His Val Thr Lys Arg Leu Ala Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Val Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Glu Ala Glu Gly Gly Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Asn Phe Ser Lys Gly Lys Ala Ile Phe Ser Lys Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Arg Glu Cys Lys Asp Thr His Lys Lys Asp Leu Leu Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Glu Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ala
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525

Claims (16)

1.一种亲本多肽的变体,其中所述变体具有甜菊糖苷转运介导活性,其中所述变体包含的氨基酸序列当与所述亲本多肽的氨基酸序列比对时包含对与所述亲本多肽的所述氨基酸序列中的任何氨基酸相对应的氨基酸残基的至少一个修饰,其中当在相同条件下测量时:
a)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少0.1;和/或
b)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比;和/或
c)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比高于由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比;
其中参考细胞是表达所述亲本多肽的重组细胞。
2.一种亲本多肽的变体,其中所述变体具有甜菊糖苷转运介导活性,任选地为根据权利要求1所述的变体,其中所述变体包含的氨基酸序列当与SEQ ID NO:3所示的氨基酸序列比对时包含对与以下位置的氨基酸中的任何氨基酸对应的氨基酸残基的至少一个修饰:
15、19、26、29、31、32、33、37、46、56、59、107,135、136、141、145、148、150、151、153、199、200、204、206、207、210、211、255、257、258、262、267、268、272、273、276、277、278、281、282、283、284、292、294、296、297、298、299、300、302、303、306、307、309、310、311、315、318、319、320、321、322、323、324、326、328、375、376、378、379、380、382、384、386、387、389、408、410、411、413、414、415、416、417、419、420、421、422、423、424、425、427、428、429、853、854、857、859、862、864、869、890、891、892、894、903、906、968、969、972、974、977、986、996、998、999、1001、1003、1004、1010、1012、1016、1017、1018、1019、1020、1021、1059、1060、1061、1062、1063、1075、1076、1107、1108、1111、1112、1115、1118、1120、1123、1127、1128、1179、1200,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
3.根据前述权利要求中任一项所述的变体,其中所述变体包含的氨基酸序列当与SEQID NO:3所示的氨基酸序列比对时包含对与根据SEQ ID NO:3的氨基酸序列中的任何氨基酸相对应的氨基酸残基的至少两个修饰,其中当在相同条件下测量时:
a)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与由参考细胞产生的莱鲍迪甙M的摩尔浓度之间的比为至少1.2;和/或
b)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比是由参考细胞产生的莱鲍迪甙M的摩尔浓度与莱鲍迪甙A的摩尔浓度之间的比的至少1.2倍;和/或
c)由表达所述变体的重组细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比是由参考细胞产生的莱鲍迪甙M的摩尔浓度与总甜菊糖苷的摩尔浓度之间的比的至少1.2倍;
其中所述至少两个修饰是对与以下位置的氨基酸中的任何氨基酸相对应的氨基酸残基的取代
322、375、376、378、382、384、386、420、421、424、425、429、890、891、969、977、1060、1107、1111、1112、1115、1118、1120、1179,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的,其中参考细胞是表达所述亲本多肽的重组细胞。
4.根据前述权利要求中任一项所述的变体,其中根据权利要求1a)、1b)、1c)、3a)、3b)、3c)的比率中的莱鲍迪甙M、莱鲍迪甙A和总甜菊糖苷的摩尔浓度是细胞外产生的摩尔浓度。
5.根据前述权利要求中任一项所述的变体,其中所述变体包含的氨基酸序列当与SEQID NO:3所示的氨基酸序列比对时包含以下中的一者或多者
322位处的A或E或L或V、375位处的F或K或H或L或N、376位处的W、378位处的I或N或T或V、382位处的G或S或T或W、384位处的G或N或S或T、386位处的I或L、420位处的G或S、421位处的F或I、424位处的L或S、425位处的A或H或L或M或V、429位处的M或S、890位处的P、891位处的T、969位处的N、977位处的A或Q、1060位处的T、1107位处的Y、1111位处的K、1112位处的N、1115位处的G、1118位处的A或F或W、1120位处的M、1179位处的N,
所述位置是参照SEQ ID NO:3所示的氨基酸序列定义的。
6.一种能够产生甜菊糖苷的重组细胞,其中所述细胞包含编码根据权利要求1至5中任一项所述的亲本多肽的变体的核酸。
7.根据权利要求6所述的重组细胞,其中所述细胞表达或过表达所述变体多肽。
8.根据权利要求6或7中任一项所述的重组细胞,所述重组细胞包含编码以下物质中的一个或多个的重组核苷酸序列:
具有对映-古巴焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;以及
具有贝壳杉烯酸13-羟化酶活性的多肽。
9.根据权利要求6至8中任一项所述的重组细胞,所述重组细胞包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。
10.根据权利要求6至9中任一项所述的重组细胞,所述重组细胞包含编码以下物质中的一者或多者的重组核酸序列:
(i)具有UGT74G1活性的多肽;
(ii)具有UGT2活性的多肽;
(iii)具有UGT85C2活性的多肽;和
(iv)具有UGT76G1活性的多肽。
11.根据权利要求6至10中任一项所述的重组细胞,其中所述重组细胞是酿酒酵母细胞、解脂耶氏酵母细胞、克鲁斯假丝酵母细胞、东方伊萨酵母细胞或大肠杆菌细胞。
12.根据权利要求6至11中任一项所述的重组细胞,其中所述细胞产生香叶酰香叶酰焦磷酸(GGPP)的能力被上调。
13.根据权利要求6至12中任一项所述的重组细胞,所述重组细胞包含编码以下物质中的一者或多者的核酸序列:
具有羟甲基戊二酰-辅酶A还原酶活性的多肽;或者
具有法呢基-焦磷酸合酶活性的多肽。
14.一种制备甜菊糖苷的方法,所述方法包括在合适的发酵培养基中发酵根据权利要求6至13中任一项所述的重组细胞,以及任选地回收所述甜菊糖苷。
15.一种发酵液,所述发酵液包含可通过根据权利要求14所述的方法获得的甜菊糖苷。
16.一种可通过根据权利要求14所述的方法获得或从根据权利要求15所述的发酵液获得的甜菊糖苷。
CN201980028987.9A 2018-04-30 2019-04-29 甜菊糖苷转运 Pending CN112424218A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP18170193 2018-04-30
EP18170193.9 2018-04-30
PCT/EP2019/060897 WO2019211230A1 (en) 2018-04-30 2019-04-29 Steviol glycoside transport

Publications (1)

Publication Number Publication Date
CN112424218A true CN112424218A (zh) 2021-02-26

Family

ID=62116232

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980028987.9A Pending CN112424218A (zh) 2018-04-30 2019-04-29 甜菊糖苷转运

Country Status (4)

Country Link
US (2) US11608364B2 (zh)
EP (1) EP3788059A1 (zh)
CN (1) CN112424218A (zh)
WO (1) WO2019211230A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114561310A (zh) * 2022-03-17 2022-05-31 江南大学 一种生产甜茶苷的酿酒酵母及其应用
CN115725528A (zh) * 2021-08-30 2023-03-03 弈柯莱生物科技(上海)股份有限公司 一种糖基转移酶及其应用

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112018074999A2 (pt) 2016-08-12 2019-03-12 Amyris, Inc. glicosiltransferase dependente de udp para a produção de alta eficiência de rebaudiosídeo
AU2021367159A1 (en) 2020-10-22 2023-05-04 Cargill, Incorporated Microorganisms for diterpene production

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107567492A (zh) * 2015-03-16 2018-01-09 帝斯曼知识产权资产管理有限公司 Udp‑糖基转移酶
CN107922465A (zh) * 2015-08-13 2018-04-17 帝斯曼知识产权资产管理有限公司 甜菊醇糖苷转运

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4334352B2 (ja) 2002-01-23 2009-09-30 ロイヤル ネダルコ ベスローテン フェンノートシャップ ペントース糖の発酵
SE0202090D0 (sv) 2002-05-08 2002-07-04 Forskarpatent I Syd Ab A modifierd yeast consuming L-arabinose
CA2524387C (en) 2003-05-02 2012-12-04 Natureworks Llc Modified yeast cells expressing exogenous xylose isomerase
WO2006009434A1 (en) 2004-07-16 2006-01-26 Technische Universiteit Delft Metabolic engineering of xylose fermenting eukaryotic cells
CA2602084C (en) 2005-03-11 2016-08-09 Forskarpatent I Syd Ab Arabinose- and xylose-fermenting saccharomyces cerevisiae strains
AU2013211605B2 (en) 2012-01-23 2017-04-06 Dsm Ip Assets B.V. Diterpene production
EP2954061B1 (en) 2013-02-11 2023-11-22 Evolva SA Efficient production of steviol glycosides in recombinant hosts
EP3885443A1 (en) 2013-07-15 2021-09-29 DSM IP Assets B.V. Diterpene production
CN106572688B (zh) 2014-08-11 2022-01-25 埃沃尔瓦公司 在重组宿主中生产甜菊醇糖苷
AU2016307066A1 (en) 2015-08-07 2018-02-08 Evolva Sa Production of steviol glycosides in recombinant hosts
US20180230505A1 (en) 2015-08-13 2018-08-16 Dsm Ip Assets B.V. Steviol glycoside transport
EP3359654B1 (en) 2015-10-05 2022-01-05 DSM IP Assets B.V. Kaurenoic acid hydroxylases
BR112018074999A2 (pt) 2016-08-12 2019-03-12 Amyris, Inc. glicosiltransferase dependente de udp para a produção de alta eficiência de rebaudiosídeo

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107567492A (zh) * 2015-03-16 2018-01-09 帝斯曼知识产权资产管理有限公司 Udp‑糖基转移酶
CN107922465A (zh) * 2015-08-13 2018-04-17 帝斯曼知识产权资产管理有限公司 甜菊醇糖苷转运

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115725528A (zh) * 2021-08-30 2023-03-03 弈柯莱生物科技(上海)股份有限公司 一种糖基转移酶及其应用
CN115725528B (zh) * 2021-08-30 2024-01-12 弈柯莱生物科技(集团)股份有限公司 一种糖基转移酶及其应用
CN114561310A (zh) * 2022-03-17 2022-05-31 江南大学 一种生产甜茶苷的酿酒酵母及其应用
CN114561310B (zh) * 2022-03-17 2022-12-02 江南大学 一种生产甜茶苷的酿酒酵母及其应用
WO2023173566A1 (zh) * 2022-03-17 2023-09-21 江南大学 一种生产甜茶苷的酿酒酵母及其应用

Also Published As

Publication number Publication date
US11608364B2 (en) 2023-03-21
US20210238235A1 (en) 2021-08-05
EP3788059A1 (en) 2021-03-10
WO2019211230A1 (en) 2019-11-07
US20230227510A1 (en) 2023-07-20

Similar Documents

Publication Publication Date Title
US11459548B2 (en) UDP-glycosyltransferases
US20190226000A1 (en) Diterpene production in yarrowia
AU2013211605B2 (en) Diterpene production
US11608364B2 (en) Steviol glycoside transport
US11293043B2 (en) Steviol glycoside transport
US11203764B2 (en) Kaurenoic acid hydroxylases
CN107429238A (zh) 来自番茄的udp‑糖基转移酶
EP3334752B1 (en) Steviol glycoside transport
CN110892068B (zh) Udp-糖基转移酶
US11913034B2 (en) Kaurenoic acid hydroxylases
US10760085B2 (en) Kaurenoic acid hydroxylases
CN116848239A (zh) 用于二萜生产的微生物

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination