CN1668639A - 涉及二酮哌嗪衍生物合成的多核苷酸和由所述多核苷酸编码的多肽 - Google Patents

涉及二酮哌嗪衍生物合成的多核苷酸和由所述多核苷酸编码的多肽 Download PDF

Info

Publication number
CN1668639A
CN1668639A CNA038171325A CN03817132A CN1668639A CN 1668639 A CN1668639 A CN 1668639A CN A038171325 A CNA038171325 A CN A038171325A CN 03817132 A CN03817132 A CN 03817132A CN 1668639 A CN1668639 A CN 1668639A
Authority
CN
China
Prior art keywords
seq
polynucleotide
leu
ala
biosystem
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA038171325A
Other languages
English (en)
Inventor
M·贡德里
R·热内
S·洛特吕
J-L·佩尔诺代
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Commissariat a lEnergie Atomique et aux Energies Alternatives CEA
US Atomic Energy Commission (AEC)
Original Assignee
US Atomic Energy Commission (AEC)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by US Atomic Energy Commission (AEC) filed Critical US Atomic Energy Commission (AEC)
Publication of CN1668639A publication Critical patent/CN1668639A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)

Abstract

本发明涉及二酮哌嗪衍生物合成中涉及的新的分离的天然或合成的多核苷酸和由所述多核苷酸编码的多肽、含有所述多核苷酸的载体、用所述多核苷酸转化的微生物、所述多核苷酸和所述多肽的用途、以及合成二酮哌嗪衍生物的方法,所述二酮哌嗪衍生物包含环二肽和3-及6-位被α,β不饱和氨基酸侧链取代的二酮哌嗪衍生物。

Description

涉及二酮哌嗪衍生物合成的 多核苷酸和由所述多核苷酸编码的多肽
本发明涉及二酮哌嗪衍生物合成中涉及的新的分离的天然或合成的多核苷酸和由所述多核苷酸编码的多肽、含有所述多核苷酸的载体、用所述多核苷酸转化的微生物、所述多核苷酸和所述多肽的应用、以及合成二酮哌嗪衍生物的方法,所述二酮哌嗪衍生物包含环二肽和3-及6-位被α、β不饱和氨基酸侧链取代的二酮哌嗪衍生物。
为了本发明的目的,术语“二酮哌嗪衍生物”意指具有在3-和6-位被氨基酸取代的二酮哌嗪环(哌嗪-2,5-二酮或2,5-二氧代哌嗪或2,5-DKP)的分子。环状二氨基酸(环二肽或环状二肽)这一特殊情况下,3-和6-位的取代基为氨基酸侧链。在双脱氢环状二氨基酸(双脱氢环状二肽)这一特殊情况下,3-和6-位的取代基为α,β-不饱和氨基酸侧链(附图1)。
二酮哌嗪衍生物由一个化合物家族构成,这些化合物主要由微生物例如细菌、酵母、丝状真菌和地衣产生。也已从海洋生物,例如海绵和海星分离出了其它化合物。在人类中已经证实了这些衍生物的一个例子:环(L-His-L-Pro)。
二酮哌嗪衍生物具有从简单环二肽到复杂得多的结构的非常多变的结构。
简单环二肽仅构成二酮哌嗪衍生物中的一小部分,绝大多数二酮哌嗪衍生物具有更为复杂的结构,其中主环和/或侧链包含多种修饰:导入基于碳的、羟基、硝基、环氧基、乙酰基或甲氧基,和形成二硫桥或杂环。在两个碳原子间形成双键也是非常普遍的。源自海洋的特定衍生物中掺入了卤素原子。
下表I中给出了一些掺入环二肽的氨基酸例子:
                                   表I
          环二肽                    生物
环(Gly-L-Pro) Luidia clathrata
环(L-Pro-L-Leu) 褐座坚壳菌(Rosellinia necatrix)
环(L-Ala-L-Val) 棕曲霉(Aspergillus ochraceus)
环(L-Ala-L-Leu) 黑曲霉(Aspergillus niger)
环(D-Ala-N-甲基-L-Leu) Beauveria nivea
环(L-Pro-L-Val)环(L-Pro-L-Leu) 赤者色(Aspergillus ochraceus)褐座坚壳菌
环(D-Val-L-Trp) 薛氏曲霉(Aspergillus chevalieri)
环(L-Phe-L-Phe) 变黑青霉(Penicillium nigricans)诺尔斯链霉素
环(ΔPhe-ΔLeu)(白诺斯菌素) 诺尔斯链霉菌
环(L-Pro-L-Tyr) 链格孢菌(Alternaria alternata)
环(L-Pro-L-Trp) 短密青霉(Penicillium brevicompactum)
环(L-Ser-L-Ser) Streptomyces orchidaceus
环(L-Arg-D-Pro) 假单孢菌属(Pseudomonas sp.)
苯基组氨酸roquefortine 娄格法尔特氏青霉(Penicillium roquefortii
环(L-Trp-ΔAba) 壮观链霉菌(Streptomyces spectabilis)
环(4-甲基-D-Pro-L-Nva) Calyx cf.podatypa
环(ΔAla-L-Val) 绿脓杆菌(Pseudomonas aeruginosa)
关于二酮哌嗪衍生物的生理作用已知得非常少。已描述,由绿脓杆菌产生的环(ΔAla-L-Val)可能涉及细菌间的信号交流。其它化合物被描述成涉及病原微生物毒力或与铁结合或具有神经生物学特性。
二酮哌嗪衍生物自发现以来就已被证明是有益的,其中一些具有如,例如抗细菌、抗真菌、抗病毒、免疫抑制或抗肿瘤活性的生物学特性。
下表II给出了一些具有已知生物活性的二酮哌嗪衍生物的例子:
                                          表II
       分子                  生物         活性
Ambewelamides A和B Usnea sp. 细胞毒性
阿拉诺丁 Arachniotus aureus 抗病毒
双环霉素 Streptomyces sapporonensis 抗细菌(抑制转录终止)
环(Δ-Ala-L-Leu) 青霉属菌(F70614) 抑制α-葡糖苷酶
环(N-甲基-Tyr)2 灰色链霉菌(Streptomyces griseus) 抑制钙蛋白酶
环(Trp-Δ-Aba) 壮观链霉菌(Streptomyces spectabilis) 抑制谷胱甘肽-S-转移酶
支霉菌素 黄曲霉(Aspergillus flavus) 除草、抗真菌、抗细菌、抗病毒
Haematocin Nectria haematococca 抗真菌
Hyalodendrin 不整青霉(Penicillium turbatum) 抗生素
Mycelianamide 青霉属菌 抗细菌(抑制丁基胆碱脂酶)
苯基组氨酸 焦曲霉(Aspergillus ustus)(NSC-FO38) 抑制微管多聚化
Tan-1496 A、C和E Microphaeropsis sp.(FL-16144) 抑制拓扑异构酶抗细菌(革兰氏阳性)
Verticillin A 粘帚霉菌属(Gliocladium sp.)(SCF-1168) 抑制c-fos原癌基因的诱导
XR334 链霉菌属(X01/4/100) 抑制PAI-I
尽管对这些分子已经展开了广泛的研究,但是有关它们的合成却所知甚少。通常已知的是,在细菌和真菌中,这些分子经非核糖体生物合成途径产生。在某些情况中,有可能显示在分子中发生二酮哌嗪环形成,该分子已由酶经硫酯键预激活,而且对于该分子由于脯氨酸残基的存在而促成了环化反应所必需的肽键顺式构象。在其它情况中,已经证明氨基酸残基的N-烷化,特别式N-甲基化,也促成肽键的顺式构象。
因此,截至目前完成的所有这些研究已经证明,构调节前体分子的构象的该前体分子的一级结构是二酮哌嗪环的形成得以发生、以及导致产生最终的二酮哌嗪衍生物的过程的基础。
然而,存在不含脯氨酸残基或N-烷基化残基的二酮哌嗪衍生物。为对这样的衍生物举例,可以提及白诺斯菌素、或环(ΔPhe-ΔLeu)、由诺尔斯链霉菌(Streptomyces noursei)产生的抗生素。已知诺尔斯链霉菌中存在一种酶活性,它催化产生白诺斯菌素的最后步骤,也即α,β-不饱和残基的形成(Gondry等,Eur.J.Biochem.,2001,268,1712-1721)。然而,这一酶活性需要环状形式的底物,环[L-Phe-L-Leu],该底物不含脯氨酸残基或任何N-烷基化残基,而且它的合成途径是未知的。
因此,二酮哌嗪衍生物呈现极高的结构多样性和富于变化的生物活性,这使得它们成为发现和开发新的药物的有益分子。
为此,必需能得到大量这样的分子。
诚然,已经描述了二酮哌嗪衍生物的化学合成途径,但是对于大多数复杂衍生物来说,产量很低且该过程并非总被能产业化。
对二酮哌嗪衍生物,尤其是环二肽,的天然合成途径的理解可能会使在生产者生物中进行合理的遗传改良成为可能,并可以开拓通过生产和纯化产量的优化来取代或改良已有合成方法(经化学或生物技术途径)的前景。此外,对涉及二酮哌嗪衍生物生物合成途径的酶的本性和/或特异性的修饰可能创造出具有原始分子结构以及优化的生物特性的新衍生物。
本发明包含在此范围内。
在对白诺斯菌素合成途径的研究中,本发明人证实了一条多核苷酸(下文称作BamH1多核苷酸(SEQ ID NO.5)),该多核苷酸包含四个开放阅读框,各阅读框各自编码负责在诺尔斯链霉菌和异源宿主例如变青链霉菌中从L-苯丙氨酸和L-亮氨酸合成白诺斯菌素以及运输白诺斯菌素各步骤的多肽(参见附图2和3)。
本发明人已能显示:
-第一个开放阅读框orf1(albA,SEQ ID NO.1)编码一个涉及如在Gondry等,(Eur.J.Biochem.,2001,268,1712-1721(α,β-不饱和)中所描述的环二肽氧化酶(CDO)活性的多肽(AlbA,SEQ IDNO.6);
-第二个开放阅读框orf2(albB,SEQ ID NO.2)编码一个被翻译成AlbA多肽活性所需的两个同种型(AlbB1,SEQ ID NO.7和AlbB1、SEQ ID NO.8)的多肽。基本以等量表达的这两个AlbB同种型彼此间的区别在于由于使用两个不同的起始密码子而产生的位于AlbB1 N-末端的5个附加氨基酸。对于AlbB1,去除了起始甲硫氨酸;
-第三个开放阅读框orf3(albC,SEQ ID NO.3)编码一个与肽合成酶无相似性并能催化两个氨基酸残基缩合以形成环状二肽的多肽(AlbC,SEQ ID NO.9)。例如在诺尔斯链霉菌中,albC催化L-苯丙氨酸与L-亮氨酸或两个苯丙氨酸的缩合从而形成环状二肽(L-Phe-L-Leu),该环状二肽是形成白诺斯菌素和环状二肽环(L-Phe-L-Phe)所需的前体。在这种特别情况中,albC催化既非脯氨酸也非N-烷基化残基的氨基酸残基的环化,和
-第四个开放阅读框orf4(albD,SEQ ID NO.4)编码一个不直接涉及导致从氨基酸形成α,β-不饱和二酮哌嗪衍生物的反应过程的多肽(AlbD,SEQ ID NO.10),但是该多肽可能涉及所述衍生物的运输机制。
本发明人由此表明,对于α,β-不饱和二酮哌嗪衍生物的合成,特别是对于白诺斯菌素在诺尔斯链霉菌中的合成来说,仅有albA、albB和albC这三个开放阅读框是绝对必需的。
因此,本发明的主题是一种分离的天然或合成的多核苷酸,其特征在于它包含至少分别对应于序列SEQ ID NO.1、SEQ ID NO.2和SEQID NO.3的albA、albB和albC这三个开放阅读框。
该多核苷酸编码合成α,β-不饱和二酮哌嗪衍生物所必需的酶。
根据本发明的有利实施方式,所述多核苷酸还包含对应于序列SEQ ID NO.4的开放阅读框albD。
该多核苷酸编码α,β-不饱和二酮哌嗪衍生物的合成、运输及分泌所需的酶。
根据本发明的一种特定形式,该多核苷酸对应于序列SEQ IDNO.5。该多核苷酸(BamH1多核苷酸)含albA、albB、albC和albD这四个开放阅读框,并由此编码α,β-不饱和二酮哌嗪衍生物的合成、运输及分泌所需的酶。
本发明的主题还是一种分离的天然或合成的多核苷酸,其特征在于它包含分别对应于序列SEQ ID NO.2、SEQ ID NO.3和SEQ ID NO.4的三个开放阅读框albB、albC和albD中的至少一个。
因此,包含开放阅读框albC(SEQ ID NO.3)的多核苷酸编码一种允许两个可以相同或不同的氨基酸发生环化以形成环状二肽的酶。包含开放阅读框albC和albD(SEQ ID NO.3和SEQ ID NO.4)的多核苷酸编码一种首先允许两个可以相同或不同的氨基酸发生环化以形成环状二肽、其次允许所述多肽运输的酶。
本发明的主题还是一种对应于序列SEQ ID NO.2(albB,318核苷酸)、SEQ ID NO.3(albC,720核苷酸)或SEQ ID NO.4(albD,834核苷酸)中任一序列的分离的天然或合成的多核苷酸。
本发明的主题还是如上述定义的多核苷酸的片段。术语“片段”意指任一具有至少15个核酸的序列。
根据本发明的多核苷酸可以获自DNA文库,特别是微生物DNA文库,更特别是诺尔斯链霉菌DNA文库。本发明的多核苷酸还可通过对诺尔斯链霉菌总DNA进行聚合酶链式反应(PCR)获得。本发明的多核苷酸可通过对诺尔斯链霉菌总RNA进行RT-PCR获得。
本发明的主题也是其中插入了上述任一多核苷酸的载体。因此,本发明的载体可以包含:含有三个或四个分别相应于序列SEQ IDNO.1、SEQ ID NO.2、SEQ ID NO.3和/或SEQ ID NO.4的开放阅读框albA、albB、albC和/或albD的多核苷酸,含有分别对应于序列SEQ ID NO.2、SEQ ID NO.3和SEQ ID NO.4的这三个开放阅读框albB、albC或albD中至少一个的多核苷酸,对应于至少分别对应于序列SEQ ID NO.2、SEQ ID NO.3和SEQ ID NO.4的这三个开放阅读框albB、albC或albD中至少一个的任一多核苷酸,对应于序列SEQ ID NO.5的BamH1多核苷酸,或所述多核苷酸的片段。
所用载体可以是现有技术中已知的任一载体。作为可以在本发明中使用的载体,值得特别提及的是质粒、粘粒、细菌人工染色体(BAC)、放线菌的整合元件、病毒或噬菌体。
所述载体还可以含有任何对于载体复制和/或由多核苷酸编码的多肽的表达所需的调控序列(启动子、终止位点,等)。
本发明的主题还是至少一种如上述所定义的多核苷酸、或其片段作为在生物中探测对应序列的探针或作为扩增这些序列的引物的用途。
当所述多核苷酸或所述片段用作引物时,它们还包含反义序列。
上述探针或引物的一种优选用途是在其它生物中调查与开放阅读框albA、albB、albC或albD的序列同源的多核苷酸序列,尤其是为了证实二酮哌嗪衍生物的新合成途径。
本发明的主题还是一种分离的天然或合成的多肽,其特征在于它包含分别对应于多肽AlbB1、albB2、albC或AlbD的序列SEQ ID NO.7至SEQ ID NO.10中的至少一个序列。
本发明的主题还是一种分离的天然或合成的多肽,其特征在于它对应于序列 SEQ ID NO.7(AlbB1)、SEQ ID NO.8(AlbB2)、SEQ ID NO.9(AlbC)或SEQ ID NO.10(AlbD)中的任一序列。
本发明还涉及由本发明任一多核苷酸,尤其是选自序列SEQ IDNO.2(albB)、SEQ ID NO.3(albC)或SEQ ID NO.4(albD)的任一多核苷酸,编码的多肽。
有利的是,根据本发明的多肽可以分离自例如微生物(诺尔斯链霉菌),或通过化学合成或生物技术途径从本发明的多核苷酸获得,例如,从在正常条件下不表达所述多肽的经修饰的微生物获得。
本发明的主题还是一种分离的多肽,其序列与如上述所定义的序列SEQ ID NO.7至SEQ ID NO.10中至少一个序列基本同源。
在此,当多肽的氨基酸序列与序列SEQ ID NO.7至SEQ ID NO.10中至少一个的氨基酸序列表现出80%的相似性时,则视该多肽为具有基本同源的序列。
“多肽P与序列SEQ ID NO.7至10间80%的相似性”这一表述意指,当将两个多肽进行比对时,P中80%的氨基酸与序列SEQ ID NO.7至10中对应的氨基酸相同或由同组氨基酸替代。
“同组氨基酸”这一表述意指具有基本相同的化学特性的氨基酸。尤其是,该术语意指具有基本相同的电荷、和/或相同的大小、和/或相同的亲水性或疏水性、和/或相同的芳香结构的氨基酸。
这样的氨基酸组尤其包含:
(i)甘氨酸,丙氨酸
(ii)异亮氨酸,亮氨酸,缬氨酸
(iii)色氨酸,酪氨酸,苯丙氨酸
(iv)天冬氨酸,谷氨酸
(v)精氨酸,赖氨酸,组氨酸
(vi)丝氨酸,苏氨酸。
可以预想其它的取代,其中氨基酸被其它可比的但非天然的氨基酸(羟基脯氨酸、正亮氨酸、鸟氨酸、瓜氨酸、环己氨酸、右旋氨基酸,等)取代。
本发明的主题还是上述本发明的多核苷酸或载体用于合成与序列SEQ ID NO.7至10对应的多肽的用途。
本发明的主题还包括根据本发明的多肽单独或组合用于(特别是体外用于)制备环二肽和/或3-及6-位被α,β不饱和氨基酸侧链取代的二酮哌嗪衍生物(特别是白诺斯菌素)的用途。
本发明的主题还包括本发明的多肽单独或组合用于通过修饰生物分子的结构来修饰其药理学活性的用途,对生物分子结构的修饰例如使侧链(特别是氨基酸侧链)脱氢或环化(特别是肽分子的环化)。
本发明的主题还是经修饰的生物系统,其中导入了至少一种根据本发明的多核苷酸或至少一个根据本发明的载体。
这样的生物系统可以是任何已知的用原核细胞或真核细胞作为宿主的异源表达系统。例如,可以提到的是微生物,例如大肠杆菌或变青链霉素这样的细菌,或动物或昆虫细胞。
本发明的主题还是经修饰的体外非细胞系统,其中导入了至少一种根据本发本发明的多核苷酸或至少一种根据本发明的载体。
本发明的主题还是至少一种根据本发明的多核苷酸和/或至少一种根据本发明的载体用于制备经修饰的生物系统的用途,对所述系统来说它可能是微生物,例如大肠杆菌或变青链霉菌这样的细菌,或任何已知的用原核细胞或真核细胞作为宿主的异源表达系统,或经修饰的体外非细胞系统。
可以用已知的任何方法将根据本发明的多核苷酸和/或载体导入宿主经修饰的生物系统,例如,转染、感染、融合、电穿孔、微注射或其它生物射弹技术。
本发明的主题还包括如上所述的至少一种经修饰的生物系统或至少一种经修饰的体外非细胞系统用于制备环二肽和/或3-及6-位被α,β不饱和氨基酸侧链取代的二酮哌嗪衍生物(特别是白诺斯菌素)的用途。
该生物系统适于以高产量合成如上述所定义的环二肽α,β-不饱和二酮哌嗪衍生物。
当经修饰的生物系统为微生物时,它可选地允许将本发明的二酮哌嗪衍生物分泌至培养基中,从而使其更易于提取和纯化。在如微生物这样的生物系统中存在AlbD使由此而分泌到培养基中的衍生物便于提取和纯化,从而构成了对工业过程有利的步骤。
本发明的主题还是一种体外合成环二肽的方法,其特征在于:
(1)在适宜条件下使两种可以相同或不同的氨基酸与AlbC(SEQ ID NO.9)接触,和
(2)纯化所得的环二肽。
本发明的主题还是一种体外合成3-及6-位被α,β不饱和氨基酸侧链取代的二酮哌嗪衍生物的方法,其特征在于:
(1)在适宜条件下使两种可以相同或不同的氨基酸与AlbC(SEQ ID NO.9)接触,和
(2)使步骤(1)中获得的环二肽与AlbA(SEQ ID NO.6)、AlbB1(SEQ ID NO.7)和AlbB2(SEQ ID NO.8)接触,并纯化所得的α,β不饱和二酮哌嗪衍生物。该方法在步骤(2)中还包含AlbD(SEQID NO.10)。该方法可以可选地在步骤(1)和步骤(2)之间包含一个纯化从步骤(1)获得的环二肽的附加步骤。
当然,该方法也可以在一个步骤内完成,其中在适宜条件下使两种可以相同或不同的氨基酸与AlbA(SEQ ID NO.6)、albB1(SEQ IDNO.7)、albB2(SEQ ID NO.8)和AlbC(SEQ ID NO.9)、可选的AlbD(SEQ ID NO.10)进行接触,并纯化所得的α,β-不饱和二酮哌嗪衍生物。
术语“适宜条件”优选意指孵育以下物质时所处的条件:
-多肽(AlbA、albB、albC和/或AlbD),其浓度介于0.1nM和10μM之间,优选介于10nM和1μM之间;
-存在浓度介于0.1mM和100mM之间、优选介于1mM和10mM之间的氨基酸,所述氨基酸可以相同或不同;
-于0.1M Tris-HCl缓冲液中,pH介于6.8和8.0,温度介于28℃和40℃,时间介于2小时至48小时之间。
本发明的主题还是一种合成环二肽的方法,其特征在于:
(1)  在适宜培养所述已选择的生物系统的条件下接触含有至少多核苷酸SEQ ID NO.3(albC,编码AlbC)的生物系统,和
(2)  纯化所得的环二肽。该生物系统还可以包含多核苷酸SEQID NO.4(编码AlbD)。
本发明的主题还是一种合成3-及6-位被α,β不饱和氨基酸侧链取代的二酮哌嗪衍生物的方法,其特征在于:
(1)在适宜培养所述已选择的生物系统的条件下接触含有对应于序列SEQ ID NO.1-3的多核苷酸(编码AlbA、AlbB和AlbC)的生物系统,和
(2)纯化所得的α,β不饱和二酮哌嗪衍生物。该生物系统还可以包含对应于SEQ ID NO.4的多核苷酸(编码AlbD)。
将“适于培养所述已选择的生物系统的条件”这一表述理解为意指,在培养所述已选择的生物系统的条件(包含含有大大过量的氨基酸的培养基)下实施该方法。例如,如果该生物系统是例如大肠杆菌这样的微生物,那么适宜的条件就是通常用来培养该细菌的那些条件。对于变青链霉菌或当生物系统为真核细胞时也是如此。
根据本发明的方法,可以相同或不同的氨基酸以介于0.1mM和100mM之间、优选介于1mM和10mM之间的量存在。
类似地,根据本发明的方法,多肽AlbA、albB、albC和albD以介于0.1nM和10μM之间、优选介于10nM和1μM之间的量存在。
环二肽和α,β-不饱和二酮哌嗪衍生物的纯化可以直接从体内或体外合成物中通过本领域技术人员已知的液相萃取技术或沉淀、或薄层或液相层析技术,特别是反相HPLC,或其它适宜纯化肽的方法完成。
可以在适宜的生物系统中,尤其是在例如微生物(例如大肠杆菌或变青链霉菌这样的细菌)这样的宿主、或任何已知的用原核细胞和真核细胞作为宿主的异源表达系统、或甚至在体外非细胞系统中实施本发明的方法。
除了上述方案,本发明还包含其它可以从以下描述中显现的方案,“以下描述”是指实施本发明的实施例以及附图,其中:
-附图1代表二酮哌嗪环(A)和白诺斯菌素(B)的化学结构。
-附图2代表诺尔斯链霉菌的包含白诺斯菌素合成所需基因簇的基因组区域的图表,其中orfl对应于albA,orf2对应于albB,orf3对应于albC,以及orf4对应于albD。
-附图3表示假设的诺尔斯链霉菌白诺斯菌素合成途径。
-附图4表示所制备的用于向大肠杆菌或变青链霉菌中导入各种开放阅读框(或orf)的特定质粒构建体。
-附图5表示对用质粒pSL128(A)、pUWL201(B)和pSL129(C)转化的变青链霉菌的培养基的分析结果。
-附图6表示对用质粒pSL168和pSL159转化的变青链霉菌、或未经转化的变青链霉菌的培养基的分析结果:
A:变青链霉菌[pSL168],在CDO存在下培养;
B:变青链霉菌[pSL168],在CDO不存在下培养;
C:变青链霉菌[pSL159],不存在或存在CDO;
D:在CDO存在下培养的变青链霉菌TK21。
-附图7表示对在大肠杆菌BL21(DE3)-plysS中从多核苷酸albA-albB表达AlbA和AlbB1和AlbB2的十二烷基硫酸钠/聚丙烯酰胺凝胶(SDS-PAGE)分析。用考马斯亮蓝R-250染色。泳道S:分子量标准,泳道1:全细胞质提取物(约10μg),泳道2:用Ni-琼脂糖凝胶柱纯化的酶级分(约10μg)。
以下实施例对本发明进行举例说明但不限制本发明。
实施例1:从诺尔斯链霉菌中分离本发明的多核苷酸
用以PCR基因扩增为基础的方法从诺尔斯链霉菌全基因组中分离出在诺尔斯链霉菌中生物合成白诺斯菌素所需的含有全部遗传信息的多核苷酸。
-获得环二肽氧化酶的部分肽序列:
根据M.Gondry等(Gondry等,2001,上述)中描述的方案,通过用Edman法对纯化的环二肽氧化酶经胰蛋白酶水解所得的多肽进行直接测序得到在诺尔斯链霉菌中催化环二肽环(L-Phe-L-Leu)向白诺斯菌素转化的酶,即环二肽氧化酶(CDO)。经15%聚丙烯酰胺凝胶电泳和蛋白质的考马斯亮蓝染色分离出酶级分组成后,切出一条含有分子量约为21000道尔顿的蛋白质的凝胶带,并将其在1ml 50mMTris-HCl缓冲液,pH 8,胰蛋白酶(相对胰蛋白酶/底物浓度=1/50)存在下于37℃孵育20小时。之后用反相高效液相层析(HPLC)(μRPCC2/C18 SC21/10柱,Pharmacia)以0%至76%乙氰的线性梯度在62分钟内对所得多肽进行分离(溶剂:0.1%三氟乙酸;流速:1ml/分钟)。之后在已用含30%乙氰和0.1%三氟乙酸的缓冲液平衡的superdex肽PC32/30柱(Pharmacia)上进行凝胶渗透层析以纯化各分离的肽。最后经Edman法自动测序(型号477A测序仪,Applied Biosystems)和MALDI-TOF质谱法分析所得的三种多肽。表1给出了所得的肽序列以及由其推导出的核苷酸序列。
表I:
肽序列         推导出的核苷酸序列
EPVDDALIEQLLEAMLAAPT(SEQ ID N°11) GARCCSGTSGACGACGC(oligo1f)(SEQ ID N°14)
GCGTCGTCSACSGGYTC(oligo1r)(SEQ ID N°15)
NEVVNYEXWGNR(SEQ ID N°12) AACGARGTSGTSAACTACGA(oligo2f)(SEQ ID N°16)
TCGTAGTTSACSACYTCGTT(oligo2r)(SEQ ID N°17)
QAXSFMVVR(SEQ ID N°13) CAGGCSTGGWSSTTCATGGT(oligo3f)(SEQ ID N°18)
ACCATGAASSWCCASGCCTG(oligo3r)(SEQ ID N°19)
X:未确定的氨基酸(R=A或G;S=C或G;Y=C或T和W=A或T)。
对对应于序列SEQ ID NO.13的多肽的试验和理论质量进行比较使得有可能鉴定3-位的色氨酸残基。根据链霉菌中典型的密码子使用,下划线和粗体的序列用于表示6条有义(1f、2f和3f)和反义(1r、2r和3r)简并寡核苷酸。由于缺少关于这些多肽各自在蛋白质序列中的位置的信息,将这六个寡核苷酸组合用于克隆。由于所测试的PCR条件导致太大量的扩增核苷酸片段产生,因此开发了反转录(RT-PCR)策略。
-由RT-PCR扩增寡核苷酸片段:
从根据Kieser等(Practical Streptomyces Genetics.The JohnInnes Foundation Norwich,U.K.(2000))描述的方法在培养基5(ATCC培养基)中的培养24小时的培养物中提取诺尔斯链霉菌的总RNA。用DNase I进行附加处理以将DNA完全去除。由Sigma GenosysLtd合成简并的寡核苷酸(有义和反义),以及根据标准说明用TitanTMOne Tube RT-PCR试剂盒(Boehringer Mannheim)在各反应中使用1μg总RNA进行RT-PCR。反转录在50℃下进行30分钟,之后的PCR条件如下:初始97℃变性4分钟,之后45循环的95℃ 1分钟、50℃ 1分钟和68℃ 1分钟,和最后于68℃进行10分钟聚合反应。反应产物经1.5%琼脂糖凝胶电泳分析,之后纯化(DNA和Gel Band纯化试剂盒,Pharmacia)。
用六个寡核苷酸组合进行的RT-PCR扩增出一个带有寡核苷酸3f和2r的约400碱基对的片段。将该片段克隆进载体pGEM-T便利载体并进行测序,从而有可能确认在同一阅读框中真正使用的寡核苷酸引物。将该核苷酸片段用作筛选在粘粒pWED1中制备的诺尔斯链霉菌基因组DNA文库的探针。
-构建诺尔斯链霉菌基因组DNA文库:
用0.33U的BamHI对以标准程序(Kieser等,前述;J.Sambrook等,Molecular cloning:a laboratory manual.Cold Spring HarborLaboratory Press.Cold Spring Harbor,N.Y.(1989))从诺尔斯链霉菌提取的基因组DNA(2.5μg)进行部分消化,产生一个约35至45kb的DNA片段。通过连接将这些片段导入预先用BamHI消化并脱磷酸化的粘粒载体pWED1。在体外将连接产物包装进λ噬菌体(Packagene Lambda DNA包装系统,Promega),并经转染导入大肠杆菌(SURE)菌株。
-筛选诺尔斯链霉菌基因组DNA文库:
之后,由RT-PCR扩增获得的核苷酸片段用T7 Quick Prime试剂盒(Pharmacia)通过随机引发以[α-32P]-dCTP进行标记,并用作筛选文库的探针。根据标准方法用菌落杂交测试了约2000个克隆(J.Sambrook等,前述),并选择出12个克隆。提取对应的粘粒(指pSL110至pSL121),用BamHI消化并以RT-PCR片段为探针作DNA印迹技术分析。该探针使得有可能分离出对所有粘粒来说都相同、且存在于用BamHI消化的诺尔斯链霉菌基因组DNA中的约3.8kb的核苷酸片段。从粘粒pSL117中分离该片段,并将其克隆进载体pBC SK+,从而得到载体pSL122(所用载体的定义:参见表II)。
实施例2:对本发明多核苷酸序列的分析
在ABI PRISM Genetic Analyzer(Perkin Elmer)上用DYEnamicET终止子循环试剂盒(Pharmacia)或由公司Genome Express完成对本发明多核苷酸的自动测序。用Frame(Bibb,M.J.等,Gene,30,157-166(1984))、BLAST和FASTA(Altschul,S.F.等,Nucleic AcidsRes.,25,3389-3402(1997);Pearson,W.R.,Methods in Enzymology,183,63-98(1990))程序对序列进行计算机分析并与数据库进行比较。
用FRAME程序对BamHI多核苷酸(SEQ ID NO.5)所作的分析揭示了四个完整的开放阅读框,即以相同方向转录的orf1至orf4(albA至albD,SEQ ID No.1至4),和一个末端被截断的开放阅读框(1119bp),即orf5(参见附图2)。orf5的翻译产物与源自蓝色链霉菌(Streptomyces coelicolor)的NADP-特异性谷氨酸脱氢酶N末端部分表现出高度相似性(根据BLAST程序为78%同一性和86%相似性)。
第一个开放阅读框,orf1(albA,SEQ ID NO.1),包含由RT-PCR扩增的片段的核苷酸序列,而且推导的肽序列确实包含最初分离的3个胰蛋白酶肽。因此,orf1产物对应于分离纯化自诺尔斯链霉菌(M.Gondry等,前述)的、质量约为21千道尔顿的酶蛋白。因此,该基于无疑涉及白诺斯菌素的生物合成,且将被称为albA。
对albA(orf1)序列的分析表明,3个密码子,两个GUG和一个AUG,可被视为albA翻译的起始密码子,它们产生219、204或196个氨基酸的蛋白质。由于存在对末端的转录后修饰而未能成功确定N-末端的肽序列,因此为albA(SEQ ID NO.6)选择了最长的序列(657核苷酸)(第一个起始密码子位于距BamHI片段末端20个核苷酸的位置,因此该BamHI片段不包含必需位于该基因更上游的启动子区)。
从albA推导的肽序列(AlbA、SEQ ID NO.6)与数据库进行比较显示了与来自Archaeoglobus fulgidus的NADH氧化酶最大程度的相似性(根据BLAST程序为32%同一性和52%相似性),对保守结构域的查询显示它具有一个大的硝基还原酶类型结构域(pfam00881,151个氨基酸)。
与albA相邻但阅读框不同的Orf2(albB、SEQ ID NO.2)也表现出典型的链霉菌密码子使用。根据起始密码子AUG或GUG,考虑了orf2,albB翻译成AlbA多肽活性所需的两个同种型(AlbB1,SEQ ID NO.7和AlbB2,SEQ ID NO.8)。基本以等量表达的这两个AlbB同种型彼此间的区别在于由于使用两个不同的起始密码子而产生的位于AlbB1N-末端的5个附加氨基酸。对于AlbB1,去除了起始甲硫氨酸。
这两种可能性与用FRAME程序对序列进行分析是相容的。BLAST和FASTA程序未显示由orf2推导的肽序列与数据库中的蛋白质有特别的同源性。
类似地,以分别推导自orf3(albC,SEQ ID NO.3)和orf4(albD,SEQ ID NO.4)的多肽序列为基础进行数据库查询未显示与功能已知的蛋白间的显著同源性。orf3以ATG起始密码子开始并编码239个氨基酸的多肽albC(SEQ ID NO.9),它与两种功能未知的假定蛋白质表现出具有低相似性:来自结核杆菌(Mycobacterium tuberculosis)的Rv2275(根据BLAST程序为34%同一性和53%相似性)和来自枯草芽孢杆菌(Bacillus subtilis)的YvmC(根据BLAST程序为29%同一性和46%相似性)。Orf4编码277个氨基酸的蛋白质Albe(SEQ IDNO.10),它含有一个如同用TMHMM程序(Krogh,A.等,J.Mol.Biol.305,(2001))对其进行序列分析所示的跨膜结构域,并与蓝色链霉菌的一个功能未知的跨膜蛋白表现出弱同源性(根据BLAST程序为54%同一性和67%相似性)。
实施例3:多核苷酸albA、albB、albC和albD的克隆和表达载体的构建
根据Sambrook等(前述)和Kieser等(前述)描述的标准程序完成提取和制备DNA、转化大肠杆菌和变青链霉菌TK21菌株、以及制备原生质体的方法。
表II给出了所制备的用于操作作为本发明主题的多核苷酸的所有质粒和粘粒载体(也参见附图4)。
表II:所述的菌株和载体
        细菌             特性        来源/参考
大肠杆菌DH52 用于克隆的标准菌株 Invitrogen
大肠杆菌SURE 用于粘粒文库的菌株 Stratagene
变青链霉菌TK21 用于克隆alb基因的链霉菌菌株 Hopwood,D.A.等,J.Gen.Microbol.129,2257-2269(1983)。
诺尔斯链霉菌ATCC1145 产白诺斯菌素的野生型菌株 ATCC
载体
pGEM-T easy 用于克隆PCR产物的载体,AmpR Promega
pWED1 衍生自pWED15的粘粒,AmpR Gourmelen,A.等,AntimicrobialAgentsChemotherapy,42,2612-2619(1998)
pBC SK+ 克隆载体,CmR Stratagene
pHP45Ωacc 用于获得Ωacc盒的质粒,AmpR,AprR Blondelet-Rouault,M.H.等,Gene,190,315-317(1997)
pUWL201 大肠杆菌/链霉菌穿梭载体,含有在链霉菌中表达克隆基因的ErmeE*启动子,AmpR,ThioR Doumith,M.,等,Mol.Gen.Genet.,264,477-485(2000)
pET-28a 表达载体 Novagen
pSL117 来自诺尔斯链霉菌文库的粘粒,用于RT-PCR产物
pSL122 克隆进pBC SK+的3.8kb BamHI片段
pSL127 pSL122衍生物,含有Apal片段的一个内部缺失,去除了orf2、orf3、orf4和orf5
pSL128 克隆进pUWL201中的pSL122的3.8kb BamHI片段,受Erme*p控制
pSL129 克隆进pUWL201中的pSL122的
3.8kb BamHI片段,含有与pSL128相反反向的插入
pSL138 pSL122衍生物,含有EcoRI片段的一个内部缺失,去除了orf3、orf4和orf5,并带有Ωacc盒插入
pSL140 pSL122衍生物,含有NdeI/EcoRV片段的一个内部缺失,去除了orf5,并带有Ωacc盒插入
pSL142 克隆进pUWL201的,pSL138的Asp718/Klenow/BamHI片段(含有orf1、orf2和Ωacc盒)
pSL144 克隆进pUWL201的,pSL140的Asp718/Klenow/BamHI片段(含有orf1至orf4和Ωacc盒)
pSL145 pSL122衍生物,含有EcoRI片段的一个内部缺失,去除了orf3、orf4和orf5
 pSL150 克隆进表达载体pET-28a的orf1至orf2的PCR扩增产物
pSL157 克隆进表达载体pGEM-T easy的,orf4的PCR扩增产物
pSL159 克隆进pUWL201的,pSL157的Pst1/Klenow/BamHI片段
pSL165 克隆进pGEM-Teasy的,的orf3PCR扩增产物
pSL166 克隆进pGEM-Teasy的,的orf3+orf4 PCR扩增产物
pSL167 克隆进pUWL201的,pSL166的Pst1/Klenow/BamHI片段
pSL168 克隆进pUWL201的,pSL165的Pst1/Klenow/BamHI片段
pSL117是含诺尔斯链霉菌基因组DNA文库的粘粒。
pSL122包含被克隆进克隆载体pBC SK+的、源自诺尔斯链霉菌的3.8kb BamHI多核苷酸(SEQ ID NO.5),该多核苷酸是本发明一个主题。经ApaI或EcoRI消化pSL122和再连接分别构建了pSL127和pSL145。
BamHI多核苷酸还被以适于将所有基因置于ermE*启动子控制下的方向(pSL128)或以相反方向(pSL129)克隆进了大肠杆菌/链霉菌穿梭载体pUWL201。
两步构建了pSL142和pSL144:先用EcoRI和Klenow酶、或NdeI和Klenow酶消化pSL122,之后将这些片段与已用HindIII-Klenow消化的Ωaac盒连接从而产生质粒pSL138和pSL140。之后将这些质粒用Asp718、Klenow和BamHI消化,首先将所得的包含orfl(albA,SEQID NO.1)、orf2(albB,SEQ ID NO.2)和Ωaac盒的片段,以及其次将orf1至orf4(albA至albD)和Ωaac盒克隆进已用XbaI-Klenow-BamHI消化过的载体pUWL201。
用下列引物PCR扩增orf3(albC,SEQ ID NO.3)、orf4(albD,SEQ ID NO.4)和(orf3+orf4):
对orf3
sylv24:(SEQ ID N°20):
5′-CGG CTGCAGGAGAAGGGAGCGGACATATGCTTGCAGGCTTAGTTCCC
-3′,(PstI位点有下划线);
sylv22:(SEQ ID N°21):
5′-CGGTCCCGT GGATCCAAGCTTCTAGGCCGCGTCGGCCAGCTC-3′,
(BamHI位点有下划线);
对orf4
sylv19:(SEQ ID N°22):
5′-GAGCGGGATC CTGCAGTGTCATGGGGAGGACAGGAC-3′,
(PstI位点有下划线);
sylv18:(SEQ ID N°23):
5′-CGATCACGT GGATCCAAGCTTGCCAATCCTGTACGCGATTT-3′,
(BamHI位点有下划线);
对(orf3+orf4):sylv24和sylv18。
仅由37个核苷酸分离orf2和orf3,sylv24中包含了一个合成的核糖体结合位点以确保orf3的正确翻译。之后将PCR扩增的片段克隆进载体pGEM-Teasy(Promega),以形成pSL165、pSL157和pSL166。之后将从这三个质粒得到的PstI-BamHI片段克隆进已用PstI-BamHI消化的载体pUWL201,以形成pSL168、pSL159和pSL167。
实施例4:在导入了BamHI多核苷酸(SEQ ID NO.5)的转化异源宿主变青链霉菌中生产二酮哌嗪衍生物环(ΔPhe-ΔLeu)(白诺斯菌素)
根据Sambrook等(前述)和Kieser等(前述)描述的标准过程,用pSL128(含有BamHI多核苷酸(SEQ ID NO.5))、pSL129或pUWL201(对照)转化变青链霉菌TK21原生质体。在28℃至30℃间的温度下,将这三个菌株在M5培养基(ATCC培养基)中培养三天,该M5培养基是一种含有大大过量氨基酸的丰富培养基。在下列条件下用反相HPLC分析这三个转化菌株的培养物上清液:过滤培养物上清液(500μl)(ultrafree-MC 10 kDa,Millipore)并直接注入HPLC(Vydac C18柱(4.6×250mm):流速:1ml/分钟;洗脱:在0.1%三氟乙酸中0至45%乙氰的线性梯度,45分钟内)。用多波长探测器监测200和600nm间的洗脱。
在变青链霉菌[pSL128]中检测到了两种立体异构形式的白诺斯菌素的生产(出现在38.3分钟和40.5分钟的两个峰;λmax=318nm;m=256.4Da)(附图5A)。
在对照菌株变青链霉菌[pUWL201]和变青链霉菌[pSL129](附图5B和5C)中,未检测到白诺斯菌素的生产。
来自诺尔斯链霉菌的BamHI多核苷酸(SEQ ID NO.5)包含白诺斯菌素生产的遗传信息。
实施例5:用经多核苷酸albA和albB插入转化的异源宿主,大肠杆菌,将环(L-Trp-L-Trp)向环(ΔTrp-ΔTrp)的转化在培养皿中可视化,以此证明多核苷酸albA和albB的功能。
为了直接在分离的克隆上探测由环二肽向双脱氢环二肽的转化,开发了一种在培养皿中的快速测试。该测试是以在溶液中无色的环二肽环(L-Trp-L-Trp)向黄色的不溶产物环(ΔTrp-ΔTrp)(λmax=367nm和450nm)的转化为基础的,它使得表现CDO活性的克隆呈现亮黄色。
直接在含有0.5mM环{L-Trp-L-Trp}的LB培养基的平皿中测试已用根据实施例3详细说明的程序制备的质粒转化的大肠杆菌。
37℃下培养16小时后,大肠杆菌[pSL122](包含BamHI多核苷酸)和大肠杆菌[pSL145](包含带有orf3至orf5缺失的BamHI片段)菌株表现强黄色染色,而大肠杆菌[pBC SK+](包含完整的克隆载体)和大肠杆菌[pSL127](包含带有orf2至orf5缺失的BamHI片段)不被染色。
结果证实,orf1(albA,SEQ ID NO.1)和orf2(albB,SEQ ID NO.2)这两个基因涉及与白诺斯菌素生产相关的环二肽氧化酶活性。
实施例6:环二肽氧化酶(CDO)酶活性在导入了orf1和orf2(albA和albB,SEQ ID NO.1和SEQ ID NO.2)的转化异源宿主变青链霉菌中的表达。
在实施例4中所述的条件下培养经含BamHI多核苷酸的质粒pSL142转化的变青链霉菌TK21菌株,该BamHI多核苷酸中删除了orf3(albC,SEQ ID NO.3)、orf4(albD,SEQ ID NO.4)和orf5,对该菌株上清液所作的HPLC分析证实未出现白诺斯菌素的生产,并由此表明orf3和/或orf4在二酮哌嗪衍生物生中的相关性产。
然而,在Gondry等(前述)描述的标准条件下向上清液中加入环(L-Phe-L-Leu),明显导致白诺斯菌素的产生。这暗示着orf3和/或orf4在环二肽环(L-Phe-L-Leu)生物合成中的相关性。
实施例7:证明环(L-Phe-L-Leu)和环(L-Phe-L-Phe)在经orf3(albC,SEQ ID NO.3)的导入而转化的异源宿主变青链霉菌中的体内生产。
为确认实施例6中所描述的结果,将orf3(albC)和orf4(albD)分别克隆进穿梭质粒pUWL201而分别产生pSL168(orf3)和pSL159(orf4),根据Sambrook等(前述)和Kieser等(前述)描述的标准方法将它们导入变青链霉菌TK21。
变青链霉菌[pSL168]和变青链霉菌[pSL159]在实施例4中所述的条件下培养后,在实施例4中所述的标准条件下对其培养物上清液作HPLC分析,以证实环二肽环(L-Phe-L-Leu)的生产。由于该化合物的低摩尔吸收系数(254nm处εmol≈100M-1cm-1)和培养基的复杂性使得难以直接检测该化合物,因此通过加入已根据Gondry等(前述)描述的方法纯化的CDO酶在将环二肽转化为白诺斯菌素(环(ΔPhe-ΔLeu),318nm处εmol=25120M-1.cm-1)后进行证实。
过滤培养物上清,之后与4.1×10-3酶单位的纯化CDO于30℃孵育10至15小时。比较与CDO或未与CDO孵育的培养物上清液的HPLC分析。用质谱法(Quattro II,Micromass)测定所产生的代谢物的分子量。
结果示于附图6:
在与CDO孵育的变青链霉菌[pSL168]培养物上清液中检测到,白诺斯菌素(环(ΔPhe-ΔLeu))(峰值出现在40.5分钟;λmax=318nm;m=256.4Da)和环(ΔPhe-ΔPhe)(峰值出现在44.1分钟;λmax=338nm;m=290.3)(图版A);
未检测到代谢物的:
-不含CDO时的变青链霉菌[psL168]培养物上清液(图版B);
-含或不含CDO的变青链霉菌[pSL159]培养物上清液(图版C);
-与CDO孵育的变青链霉菌TK21的培养物上清液(图版D)。
该结果清楚地证实了orf3(albC)涉及白诺斯菌素的前体分子环二肽环(L-Phe-L-Leu)、和第二个代谢产物环(ΔPhe-ΔPhe)的前体分子环(l-Phe-L-Phe)最初一同在诺尔斯链霉菌中生产(Khokhlov A.S.等,Tetrahedron Lett.,27,1881(1963))。
实施例8:证明环(L-Phe-L-Leu)和环(L-Phe-L-Phe)在经多核苷酸orf3-orf4(albC-albD,SEQ ID NO.3-SEQ ID NO.4)的导入而转化的异源宿主变青链霉菌中的体内生产。
根据对实施例7的修改,将多核苷酸orf3-orf4(albC-albD)克隆进穿梭质粒pUWL201,并根据Sambrook等(前述)和Kieser等(前述)描述的标准方法将所得的质粒pSL167导变青链霉菌TK21。
对经与实施例7所述相同的方式处理的培养物上清液所作的HPLC分析表明,在存在CDO时培养的变青链霉菌[pSL167]的上清液中检测到了白诺斯菌素(环(ΔPhe-ΔLeu))和环(ΔPhe-ΔPhe),在没有CDO的变青链霉菌[pSL167]的培养物上清液中未检测到代谢物,在存在CDO时培养的变青链霉菌TK21的培养物上清液中也没有检测到代谢物。
这些结果证实,在变青链霉菌中如同在诺尔斯链霉菌中,orf5基因的产物不直接参与白诺斯菌素的合成,而orf4(albC)对于生产前体环二肽环(L-Phe-L-Leu)和环(L-Phe-L-Phe)时必需且充分的。
实施例9:AlbA和AlbB从多核苷酸albA-albB(SEQ ID NO.1-SEQID NO.2)的过表达
用含有N-末端和C-末端聚组氨酸序列(His标签)的载体pET-28a(+)构建一个含有多核苷酸albA-albB的表达载体,以便于纯化重组蛋白。选择最短的albA序列,它编码196个氨基酸残基的多肽。用设计成含有NdeI(有义)和XhoI(反义)克隆位点的寡核苷酸引物PCR扩增该多核苷酸。
PCR条件如下:94℃初始变性4分钟,之后进行10个循环:94℃1分钟、45℃ 1分钟和72℃ 1.5分钟,之后20个循环的94℃ 1分钟、50℃ 1分钟和72℃ 1.5分钟,以及最后在72℃下进行10分钟的聚合反应。用NdeI和XhoI消化反应产物,并将片段亚克隆进载体pET-28a以得到pSL150。用DYEnamic ET终止子循环试剂盒(AmershamPharmacia Biotech)经自动测序(ABI PRISM Genetic analyzer,Perkin Elmer)核实插入序列。
使用了标准表达条件:
-生长温度:20℃,
-表达的诱导:0.6mM IPTG,
-诱导时间:16小时。
将pSL150导入大肠杆菌BL21(DE3)-plysS。菌株于20℃培养于LB培养基直至吸收为0.6,之后诱导表达。之后于4℃在4190g下离心培养物15分钟。之后将细胞重悬于抽提缓冲液(100mMTris-HCl,pH 8.0,1μM膦酰二肽,1mM PMSF和5%丙三醇),并用Eaton press研磨。30℃下在benzonase(25U/ml)存在下孵育蛋白质提取物10分钟,之后于4℃在11300g离心15分钟。根据Gondry等(前述)描述的标准检测方法测定酶活性。将一个单位的酶活性定义为,每分钟催化产生1μmol产物的酶量,且特异酶活性以每毫克蛋白质的酶单位表示。亲和层析(柱:螯合了HP(1ml)的HiTrap,Amersham Pharmacia Biotech;Ni2+离子平衡于含有0.5M NaCl和10mM咪唑、pH为8.0的100mM Tris-HCl缓冲液中;洗脱:35分钟内在0.3至1M咪唑梯度中;流速:1ml/min)纯化后,酶提取物的特异酶活性提高了50倍(As=2U/mg)。
对大肠杆菌[pSL150]的纯化级分所作的十二烷基硫酸钠/聚丙烯酰胺凝胶(SDS-PAGE)(12%)分析证实AlbA和AlbB以非化学计量比例同时出现,并证实AlbB表达为两个同种型(SDS-PAGE中的两个条带)。用质谱法对纯化的AlbB所作的分析和对多肽序列的N-末端测序显示,这两个同种型对应于源自其序列中鉴定的两个起始密码子的产物AlbB1和AlbB2(参见上述)。
实施例10:由重组AlbA-AlbB对环(L-Phe-L-His)和环(L-Phe-L-Leu)的体外转化
在Gondry等(前述)描述的标准条件下孵育根据实施例9中描述的方法纯化的酶制品,催化环肽向单脱氢和双脱氢环二肽的转化。
于30℃在环(L-Phe-L-His)底物存在下孵育纯化的酶制品72小时。反应产物在实施例4中描述的条件下作反相HPLC分析,并根据它们由质谱分析确定的光谱特征和分子量进行鉴定。反应产物如下:
-源自环(L-Phe-L-His):环(ΔPhe-L-His)(λmax=297nm和m=282Da)和环(ΔPhe-Δ-His)(λmax=338nm和m=280Da),
-源自环(L-Phe-L-Leu):环(ΔPhe-L-Leu)(λmax=297nm和m=258Da)和环(ΔPhe-Δ-Leu)(λmax=316nm和m=256Da)。
这些结果证实,由将多核苷酸albA-albB克隆进表达载体、并将该表达载体导入异源宿主而得到的酶制品在体外催化环二肽向α,β-脱氢的二酮哌嗪衍生物的转化。
                              序列表
<110>Commissariat à l′Energie Atomique
     Centre National  de la  Recherche Scientifique
     GONDRY Muriel
     GENET Roger
     LAUTRU Sylvie
     PERNODET Jean-Luc
<120>涉及二酮哌嗪衍生物合成的多核苷酸和由所述多核苷酸编码的多肽
<130>CGA263/83FR
<140>
<141>
<160>  23
<170>  PatentIn Ver.  2.1
<210>  1
<211>  657
<212>  ADN
<213>  诺尔斯链酶菌
<400>  1
gtgaggcgcc acccatcgca ttcgccgtac cgcggcgggt gtgaggtgcg cccaaaaaga 60
aggggattga tgttagctca cagttcatct gaatcgccgc cggaatcctt gccggacgcg 120
tggacggtcc tcaaaacccg taccgccgtc cgcaattacg cgaaagagcc ggtcgacgac 180
gcgctgatcg agcagctgtt ggaggccatg ctcgccgcgc cgaccgcctc caaccggcag 240
gcgtggtcgt tcatggtggt gcgcaggccc gccgcggtcc gccggctgcg cgcgttctcg 300
cccggggtgc tgggaacccc cgccttcttc gtcgtggcct gcgtcgaccg cagtctgacc 360
gacaacctct ccccgaagct ctcgcagaag atctacgaca ccagcaagct ctgtgtcgcc 420
atggcggtgg agaacctgct gctcgcggcg cacgcggccg gcctgggcgg atgcccggtg 480
ggcagcttca ggtccgacat cgtcaccagc atgctcggta tcccggaaca catcgagccg 540
atgctcgtgg tcccgatcgg ccgtcccgcg acagccctcg tcccctccca gcgccgcgcc 600
aagaatgagg tcgtcaacta tgaatcctgg ggaaaccgtg ctgccgcccc aactgcg    657
<210>  2
<211>  318
<212>  ADN
<213>  诺尔斯链酶菌
<400>  2
atgaatcctg gggaaaccgt gctgccgccc caactgcgtg aggagatcgc gctcctcgcc 60
gtctatctgc tcagcagcgg ccgcggactc ctggaggagc cggccgacta cggaatttac 120
cgctgtaccg acggggcccg tcgggcgctc caactcctcg acgaacacgg cgggagcacg 180
gcacggctga ccgccgtccg cgagcgtctc gacgaggtca tgttcgcgcc gatgggcgag 240
gaccgggaca tgggcgcgat tctggacgac ctgtgtcgcc aaatggcaga cgctcttccg 300
gaaattgaaa ccccctga                                               318
<210>  3
<211>  720
<212>  ADN
<213>  诺尔斯链酶菌
<400>  3
atgcttgcag gcttagttcc cgcgccggac cacggaatgc gggaagaaat acttggcgac 60
cgcagccgat tgatccggca acgcggtgag cacgccctca tcggaatcag tgcgggcaac 120
agttatttca gccagaagaa caccgtcatg ctgctgcaat gggccgggca gcgtttcgag 180
cgcaccgatg tcgtctatgt cgacacccac atcgacgaga tgctgatcgc cgacggccgc 240
agcgcgcagg aggccgagcg gtcggtcaaa cgcacgctca aggatctgcg gcgcagactc 300
cggcgctcgc tggagagcgt gggcgaccac gccgagcggt tccgtgtccg gtccctgtcc 360
gagctccagg agacccctga gtaccgggcc gtacgcgagc gcaccgaccg ggccttcgag 420
gaggacgccg aattcgccac cgcctgcgag gacatggtgc gggccgtggt gatgaaccgg 480
cccggtgacg gcgtcggcat ctccgcggaa cacctgcggg ccggtctgaa ctacgtgctg 540
gccgaggccc cgctcttcgc ggactcgccc ggagtcttct ccgtcccctc ctcggtgctc 600
tgctaccaca tcgacacccc gatcacggcg ttcctgtccc ggcgcgagac cggtttccgg 660
gcggccgagg gacaggcgta cgtcgtcgtc aggccccagg agctggccga cgcggcctag 720
<210>  4
<211>  834
<212>  ADN
<213>  诺尔斯链酶菌
<400>  4
atgtcatggg gaggacagga cacttgctca tggtgcggaa cggggcccct cggcgaagct 60
gaagacgtag gaagacagca cacgtcgcac gccgggggac ccgtcatgac tcaagccgcc 120
accgtcaccg ccaccacgag ccagggcagg gcactcctgc ggagcctgac gccgctgttc 180
gtggacgccg cgatcccgct cggctcgtac ttcctcctcg ccgagggctt cggcatgagc 240
acggtcgccg cgctggcctg gagcagcgtg gtcccggcgc tgcgcacgat ctggggcctg 300
gtccgggagc ggacggtcaa cggcctcgcg ctgctgatcc tcgtcgtcaa cgtggtgggg 360
ctggcgacga gcaccctgac cggcgatgcc cggctgatga tggccaagga cagcggcgtc 420
agcagcgtcg tcgggatcgc gatcctgctc tcggtgcgcg gccggcgccc gctgatgacc 480
gccggactcc ggccctgggt gaccaaggga agcccggagg ggaacgccgc atgggaccgg 540
ctgtgggcgc gcagcgcgcg gttccggcaa ctggagcggc gattctcgac ggtctggggg 600
agcgccctgc tgatcgagtg cgtggtcaag gtcgtcggtg cgtacgtcct gccggtgcac 660
accatggtgt ggctgggcac ggtgctgacg gtggtggcga tcctgctggc catggtggtc 720
gcgggcggcg gcagcgccga gccgatggag cggatggtca aggccgaggt cggggccgcc 780
ggcgaggccg ccacggcggg gaacgccgag ccggcgccgg ccgccgcggc ctga       834
<210>  5
<211>  3839
<212>  ADN
<213>  诺尔斯链酶菌
<400>  5
ggatccgtcc cgacgggcgg gaaccggtga ggcgccaccc atcgcattcg ccgtaccgcg 60
gcgggtgtga ggtgcgccca aaaagaaggg gattgatgtt agctcacagt tcatctgaat 120
cgccgccgga atccttgccg gacgcgtgga cggtcctcaa aacccgtacc gccgtccgca 180
attacgcgaa agagccggtc gacgacgcgc tgatcgagca gctgttggag gccatgctcg 240
ccgcgccgac cgcctccaac cggcaggcgt ggtcgttcat ggtggtgcgc aggcccgccg 300
cggtccgccg gctgcgcgcg ttctcgcccg gggtgctggg aacccccgcc ttcttcgtcg 360
tggcctgcgt cgaccgcagt ctgaccgaca acctctcccc gaagctctcg cagaagatct 420
acgacaccag caagctctgt gtcgccatgg cggtggagaa cctgctgctc gcggcgcacg 480
cggccggcct gggcggatgc ccggtgggca gcttcaggtc cgacatcgtc accagcatgc 540
tcggtatccc ggaacacatc gagccgatgc tcgtggtccc gatcggccgt cccgcgacag 600
ccctcgtccc ctcccagcgc cgcgccaaga atgaggtcgt caactatgaa tcctggggaa 660
accgtgctgc cgccccaact gcgtgaggag atcgcgctcc tcgccgtcta tctgctcagc 720
agcggccgcg gactcctgga ggagccggcc gactacggaa tttaccgctg taccgacggg 780
gcccgtcggg cgctccaact cctcgacgaa cacggcggga gcacggcacg gctgaccgcc 840
gtccgcgagc gtctcgacga ggtcatgttc gcgccgatgg gcgaggaccg ggacatgggc 900
gcgattctgg acgacctgtg tcgccaaatg gcagacgctc ttccggaaat tgaaaccccc 960
tgacggctgt ccggggcaac cccaaaagga cttcttagca tgcttgcagg cttagttccc 1020
gcgccggacc acggaatgcg ggaagaaata cttggcgacc gcagccgatt gatccggcaa 1080
cgcggtgagc acgccctcat cggaatcagt gcgggcaaca gttatttcag ccagaagaac 1140
accgtcatgc tgctgcaatg ggccgggcag cgtttcgagc gcaccgatgt cgtctatgtc 1200
gacacccaca tcgacgagat gctgatcgcc gacggccgca gcgcgcagga ggccgagcgg 1260
tcggtcaaac gcacgctcaa ggatctgcgg cgcagactcc ggcgctcgct ggagagcgtg 1320
ggcgaccacg ccgagcggtt ccgtgtccgg tccctgtccg agctccagga gacccctgag 1380
taccgggccg tacgcgagcg caccgaccgg gccttcgagg aggacgccga attcgccacc 1440
gcctgcgagg acatggtgcg ggccgtggtg atgaaccggc ccggtgacgg cgtcggcatc 1500
tccgcggaac acctgcgggc cggtctgaac tacgtgctgg ccgaggcccc gctcttcgcg 1560
gactcgcccg gagtcttctc cgtcccctcc tcggtgctct gctaccacat cgacaccccg 1620
atcacggcgt tcctgtcccg gcgcgagacc ggtttccggg cggccgaggg acaggcgtac 1680
gtcgtcgtca ggccccagga gctggccgac gcggcctagt tgggggcgtc cgcgggcgga 1740
cctgcctccc cacccgctcc cggtgccggc gccgggcatg acaaatgtca tggggaggac 1800
aggacacttg ctcatggtgc ggaacggggc ccctcggcga agctgaagac gtaggaagac 1860
agcacacgtc gcacgccggg ggacccgtca tgactcaagc cgccaccgtc accgccacca 1920
cgagccaggg cagggcactc ctgcggagcc tgacgccgct gttcgtggac gccgcgatcc 1980
cgctcggctc gtacttcctc ctcgccgagg gcttcggcat gagcacggtc gccgcgctgg 2040
cctggagcag cgtggtcccg gcgctgcgca cgatctgggg cctggtccgg gagcggacgg 2100
tcaacggcct cgcgctgctg atcctcgtcg tcaacgtggt ggggctggcg acgagcaccc 2160
tgaccggcga tgcccggctg atgatggcca aggacagcgg cgtcagcagc gtcgtcggga 2220
tcgcgatcct gctctcggtg cgcggccggc gcccgctgat gaccgccgga ctccggccct 2280
gggtgaccaa gggaagcccg gaggggaacg ccgcatggga ccggctgtgg gcgcgcagcg 2340
cgcggttccg gcaactggag cggcgattct cgacggtctg ggggagcgcc ctgctgatcg 2400
agtgcgtggt caaggtcgtc ggtgcgtacg tcctgccggt gcacaccatg gtgtggctgg 2460
gcacggtgct gacggtggtg gcgatcctgc tggccatggt ggtcgcgggc ggcggcagcg 2520
ccgagccgat ggagcggatg gtcaaggccg aggtcggggc cgccggcgag gccgccacgg 2580
cggggaacgc cgagccggcg ccggccgccg cggcctgaga ccgcgcggcg ggggagttgg 2640
ggaaatcgcg tacaggattg gcgcgtcgag cacccccgcc ctcgataggg cgggcccccg 2700
gcgcatatgg tcggcgatgc gacgggacat cggagccccg cgtcgacggt tcaacggcga 2760
tccggacggc acgcggcttt cgtcggccac gaagggaacg gaagtcatgt cgactgttca 2820
cactggggtc acgcagagcg gtctcaccgc cgagctggcc tccctgcacg ccgagctcgt 2880
ccgtcggaat cccggtgaag cggagttcca ccaggcggcc ctggaggtcc tcgaaacgct 2940
ggcaccggtg ctcaccgccc ggccggagtt cgccgacgcc aaggtcctgg agcggatcgt 3000
cgagccggag cggcagatca tgttccgcgt gccctggcag gacgactccg gcacgatccg 3060
ggtcaaccgc ggcttccggg tggagttcaa cagcgcgctc ggcccctaca agggcggcct 3120
gcggttccac gcgtccgtca acctcggcat cgtgaagttc ctcggcttcg agcagatctt 3180
caagaacgcc ctgaccgggc tgaacatcgg cggcggcaag ggcggcagcg acttcgaccc 3240
gcacggcagg tcggacgccg aggtgatgcg cttctgccag tccttcatga ccgagctgca 3300
ccgtcacctg ggcgagcaca ccgacgtgcc ggctggcgac atcggcgtcg gcggccggga 3360
gatcggctac ctcttcggcc agtaccggcg gatcaccaac cgctgggagg ccggcgtcct 3420
gaccggcaag ggcctggcgt ggggcggctc caaggcccgt acggaggcca ccggttacgg 3480
caatgtgctg ttcaccgagg agatgctcaa gcagcgcggc gaggagctgg acggccagca 3540
ggtggtggtc tccgggtccg gcaacgtcgc catctacacc atcgagaagg cccaggcgct 3600
cggcgccaac gtcctgaccg tctcggactc cggcggctac gtcgtcgacg agaagggcat 3660
cgacctggcg ctgctcaagc aggtcaagga ggtcgagcgc ggccgggtcg gcgactacgc 3720
ccagcggcgc ggcagttcgg cgaagtacgt cgccggcggg agcgtgtggg acgtcgcctg 3780
tgacgtggcg ctgccgtcgg ccacccagaa cgagctcgac gcggacgccg cccggatcc  3839
<210>  6
<211>  219
<212>  PRT
<213>  诺尔斯链酶菌
<400>  6
Met Arg Arg His Pro Ser His Ser Pro Tyr Arg Gly Gly Cys Glu Val
  1               5                  10                  15
Arg Pro Lys Arg Arg Gly Leu Met Leu Ala His Ser Ser Ser Glu Ser
             20                  25                  30
Pro Pro Glu Ser Leu Pro Asp Ala Trp Thr Val Leu Lys Thr Arg Thr
         35                  40                  45
Ala Val Arg Asn Tyr Ala Lys Glu Pro Val Asp Asp Ala Leu Ile Glu
     50                  55                  60
Gln Leu Leu Glu Ala Met Leu Ala Ala Pro Thr Ala Ser Asn Arg Gln
 65                  70                  75                  80
Ala Trp Ser Phe Met Val Val Arg Arg Pro Ala Ala Val Arg Arg Leu
                 85                  90                  95
Arg Ala Phe Ser Pro Gly Val Leu Gly Thr Pro Ala Phe Phe Val Val
            100                 105                 110
Ala Cys Val Asp Arg Ser Leu Thr Asp Asn Leu Ser Pro Lys Leu Ser
        115                 120                 125
Gln Lys Ile Tyr Asp Thr Ser Lys Leu Cys Val Ala Met Ala Val Glu
    130                 135                 140
Asn Leu Leu Leu Ala Ala His Ala Ala Gly Leu Gly Gly Cys Pro Val
145                 150                 155                 160
Gly Ser Phe Arg Ser Asp Ile Val Thr Ser Met Leu Gly Ile Pro Glu
                165                 170                 175
His Ile Glu Pro Met Leu Val Val Pro Ile Gly Arg Pro Ala Thr Ala
            180                 185                 190
Leu Val Pro Ser Gln Arg Arg Ala Lys Asn Glu Val Val Asn Tyr Glu
        195                 200                 205
Ser Trp Gly Asn Arg Ala Ala Ala Pro Thr Ala
    210                 215
<210>  7
<211>  104
<212>  PRT
<213>  诺尔斯链酶菌
<400>7
Asn Pro Gly Glu Thr Val Leu Pro Pro Gln Leu Arg Glu Glu Ile Ala
  1               5                  10                  15
Leu Leu Ala Val Tyr Leu Leu Ser Ser Gly Arg Gly Leu Leu Glu Glu
             20                  25                  30
Pro Ala Asp Tyr Gly Ile Tyr Arg Cys Thr Asp Gly Ala Arg Arg Ala
         35                  40                  45
Leu Gln Leu Leu Asp Glu His Gly Gly Ser Thr Ala Arg Leu Thr Ala
     50                  55                  60
Val Arg Glu Arg Leu Asp Glu Val Met Phe Ala Pro Met Gly Glu Asp
 65                  70                  75                  80
Arg Asp Met Gly Ala Ile Leu Asp Asp Leu Cys Arg Gln Met Ala Asp
                 85                  90                  95
Ala Leu Pro Glu Ile Glu Thr Pro
            100
<210>  8
<211>  99
<212>  PRT
<213>  诺尔斯链酶菌
<400>  8
Met Leu Pro Pro Gln Leu Arg Glu Glu Ile Ala Leu Leu Ala Val Tyr
  1               5                  10                  15
Leu Leu Ser Ser Gly Arg Gly Leu Leu Glu Glu Pro Ala Asp Tyr Gly
             20                  25                  30
Ile Tyr Arg Cys Thr Asp Gly Ala Arg Arg Ala Leu Gln Leu Leu Asp
         35                  40                  45
Glu His Gly Gly Ser Thr Ala Arg Leu Thr Ala Val Arg Glu Arg Leu
     50                  55                  60
Asp Glu Val Met Phe Ala Pro Met Gly Glu Asp Arg Asp Met Gly Ala
 65                  70                  75                  80
Ile Leu Asp Asp Leu Cys Arg Gln Met Ala Asp Ala Leu Pro Glu Ile
                 85                  90                  95
Glu Thr Pro
<210>  9
<211>  239
<212>  PRT
<213>  诺尔斯链酶菌
<400>  9
Met Leu Ala Gly Leu Val Pro Ala Pro Asp His Gly Met Arg Glu Glu
  1               5                  10                  15
Ile Leu Gly Asp Arg Ser Arg Leu Ile Arg Gln Arg Gly Glu His Ala
             20                  25                  30
Leu Ile Gly Ile Ser Ala Gly Asn Ser Tyr Phe Ser Gln Lys Asn Thr
         35                  40                  45
Val Met Leu Leu Gln Trp Ala Gly Gln Arg Phe Glu Arg Thr Asp Val
     50                  55                  60
Val Tyr Val Asp Thr His Ile Asp Glu Met Leu Ile Ala Asp Gly Arg
 65                  70                  75                  80
Ser Ala Gln Glu Ala Glu Arg Ser Val Lys Arg Thr Leu Lys Asp Leu
                 85                  90                  95
Arg Arg Arg Leu Arg Arg Ser Leu Glu Ser Val Gly Asp His Ala Glu
            100                 105                 110
Arg Phe Arg Val Arg Ser Leu Ser Glu Leu Gln Glu Thr Pro Glu Tyr
        115                 120                 125
Arg Ala Val Arg Glu Arg Thr Asp Arg Ala Phe Glu Glu Asp Ala Glu
    130                 135                 140
Phe Ala Thr Ala Cys Glu Asp Met Val Arg Ala Val Val Met Asn Arg
145                 150                 155                 160
Pro Gly Asp Gly Val Gly Ile Ser Ala Glu His Leu Arg Ala Gly Leu
                165                 170                 175
Asn Tyr Val Leu Ala Glu Ala Pro Leu Phe Ala Asp Ser Pro Gly Val
            180                 185                 190
Phe Ser Val Pro Ser Ser Val Leu Cys Tyr His Ile Asp Thr Pro Ile
        195                 200                 205
Thr Ala Phe Leu Ser Arg Arg Glu Thr Gly Phe Arg Ala Ala Glu Gly
    210                 215                 220
Gln Ala Tyr Val Val Val Arg Pro Gln Glu Leu Ala Asp Ala Ala
225                 230                 235
<210>  10
<211>  277
<212>  PRT
<213>  诺尔斯链酶菌
<400>  10
Met Ser Trp Gly Gly Gln Asp Thr Cys Ser Trp Cys Gly Thr Gly Pro
  1               5                  10                  15
Leu Gly Glu Ala Glu Asp Val Gly Arg Gln His Thr Ser His Ala Gly
             20                  25                  30
Gly Pro Val Met Thr Gln Ala Ala Thr Val Thr Ala Thr Thr Ser Gln
         35                  40                  45
Gly Arg Ala Leu Leu Arg Ser Leu Thr Pro Leu Phe Val Asp Ala Ala
     50                  55                  60
Ile Pro Leu Gly Ser Tyr Phe Leu Leu Ala Glu Gly Phe Gly Met Ser
 65                  70                  75                  80
Thr Val Ala Ala Leu Ala Trp Ser Ser Val Val Pro Ala Leu Arg Thr
                 85                  90                  95
Ile Trp Gly Leu Val Arg Glu Arg Thr Val Asn Gly Leu Ala Leu Leu
            100                 105                 110
Ile Leu Val Val Asn Val Val Gly Leu Ala Thr Ser Thr Leu Thr Gly
        115                 120                 125
Asp Ala Arg Leu Met Met Ala Lys Asp Ser Gly Val Ser Ser Val Val
    130                 135                 140
Gly Ile Ala Ile Leu Leu Ser Val Arg Gly Arg Arg Pro Leu Met Thr
145                 150                 155                 160
Ala Gly Leu Arg Pro Trp Val Thr Lys Gly Ser Pro Glu Gly Asn Ala
                165                 170                 175
Ala Trp Asp Arg Leu Trp Ala Arg Ser Ala Arg Phe Arg Gln Leu Glu
            180                 185                 190
Arg Arg Phe Ser Thr Val Trp Gly Ser Ala Leu Leu Ile Glu Cys Val
        195                 200                 205
Val Lys Val Val Gly Ala Tyr Val Leu Pro Val His Thr Met Val Trp
    210                 215                 220
Leu Gly Thr Val Leu Thr Val Val Ala Ile Leu Leu Ala Met Val Val
225                 230                 235                 240
Ala Gly Gly Gly Ser Ala Glu Pro Met Glu Arg Met Val Lys Ala Glu
                245                 250                     255
Val Gly Ala Ala Gly Glu Ala Ala Thr Ala Gly Asn Ala Glu Pro Ala
             260                265                 270
Pro Ala Ala Ala Ala
        275
<210>  11
<211>  20
<212>  PRT
<213>  诺尔斯链酶菌
<400>  11
Glu Pro Val Asp Asp Ala Leu Ile Glu Gln Leu Leu Glu Ala Met Leu
  1               5                  10                  15
Ala Ala Pro Thr
             20
<210>  12
<211>  12
<212>  PRT
<213>  诺尔斯链酶菌
<400>  12
Asn Glu Val Val Asn Tyr Glu Xaa Trp Gly Asn Arg
  1               5                  10
<210>  13
<211>  9
<212>  PRT
<213>  诺尔斯链酶菌
<400>  13
Gln Ala Xaa Ser Phe Met Val Val Arg
   1              5
<210>  14
<211>  17
<212>  ADN
<213>  人工序列
<220>
<223>  人工序列的描述:引物
<400>  14
garccsgtsg acgacgc                                             17
<210>  15
<211>  17
<212>  ADN
<213>  人工序列
<220>
<223>  人工序列的描述:引物
<400>  15
gcgtcgtcsa  csggytc                                            17
<210>  16
<211>  20
<212>  ADN
<213>  人工序列
<220>
<223>  人工序列的描述:引物
<400>  16
aacgargtsg tsaactacga                                          20
<210>  17
<211>  20
<212>  ADN
<213>  人工序列
<220>
<223>  人工序列的描述:引物
<400>  17
tcgtagttsa csacytcgtt                                          20
<210>  18
<211>  20
<212>  ADN
<213>  人工序列
<220>
<223>  人工序列的描述:引物
<400>  18
caggcstggw ssttcatggt                                          20
<210>  19
<211>  20
<212>  ADN
<213>  人工序列
<220>
<223>  人工序列的描述:引物
<400>  19
accatgaass wccasgcctg                                          20
<210>  20
<211>  47
<212>  ADN
<213>  人工序列
<220>
<223>  人工序列的描述:引物
<400>  20
cggctgcagg agaagggagc ggacatatgc ttgcaggctt agttccc            47
<210>  21
<211>  42
<212>  ADN
<213>  人工序列
<220>
<223>  人工序列的描述:引物
<400>  21
cggtcccgtg gatccaagct tctaggccgc gtcggccagc tc                 42
<210>  22
<211>  36
<212>  ADN
<213>  人工序列
<220>
<223>  人工序列的描述:引物
<400>  22
gagcgggatc ctgcagtgtc atggggagga caggac                        36
<210>  23
<211>  41
<212>  ADN
<213>  人工序列
<220>
<223>  人工序列的描述:引物
<400>  23
cgatcacgtg gatccaagct tgccaatcct gtacgcgatt t                  41

Claims (31)

1.分离的天然或合成的多核苷酸,其特征在于它包含至少对应于序列SEQ ID NO.1、SEQ ID NO.2和SEQ ID NO.3的三个开放阅读框。
2.如权利要求1所请求保护的多核苷酸,其特征在于它还包含对应于序列SEQ ID NO.4的开放阅读框。
3.分离的天然或合成的多核苷酸,其特征在于它对应于序列SEQ ID NO.5。
4.分离的天然或合成的多核苷酸,其特征在于它包含对应于序列SEQ ID NO.2、SEQ ID NO.3和SEQ ID NO.4的三个开放阅读框中的至少一个。
5.对应于序列SEQ ID NO.2、SEQ ID NO.3和SEQ ID NO.4之中任一个的分离的天然或合成的多核苷酸。
6.载体,其特征在于它含有权利要求1至5中任一项所请求保护的多核苷酸。
7.如权利要求6所请求保护的载体,其特征在于它是质粒、粘粒、细菌人工染色体(BAC)、放线菌的整合元件、病毒或噬菌体。
8.至少一种如权利要求1至5中任一项所请求保护的多核苷酸、或其具有至少15个核苷酸的片段之一、或如权利要求6或7任一项所请求保护的载体作为探针的用途。
9.至少一种如权利要求1至5中任一项所请求保护的多核苷酸、或其具有至少15个核苷酸的片段之一、或如权利要求6或7任一项所请求保护的载体之一作为扩增核苷酸序列的引物的用途。
10.分离的天然或合成的多肽,其特征在于它包含至少序列SEQID NO.7至SEQ ID NO.10之中的任一序列。
11.分离的天然或合成的多肽,其特征在于它对应于序列SEQ IDNO.7至SEQ ID NO.10之中的任一序列。
12.分离的天然或合成的多肽,其特征在于它由如权利要求1至5中任一项所请求保护的多核苷酸之一、或如权利要求6或7任一项所请求保护的载体之一编码。
13.如权利要求1至5中任一项所请求保护的多核苷酸、或如权利要求6或7任一项中所述的载体用于制备如权利要求10至12之中任一项所述的多肽的用途。
14.至少一种如权利要求10至12之中任一项所请求保护的多肽单独或组合用于(特别是体外用于)制备环二肽和/或在3-及6-位被α,β不饱和氨基酸侧链取代的二酮哌嗪衍生物(特别是白诺斯菌素)的用途。
15.至少一种如权利要求1至5中任一项所请求保护的多核苷酸、或如权利要求6或7任一项所述的载体用于制备经修饰的生物系统或经修饰的体外非细胞系统的用途。
16.如权利要求15所请求保护的用途,其特征在于该经修饰的生物系统是一种微生物或是以原核细胞或真核细胞为宿主的异源表达系统。
17.经修饰的生物系统,其特征在于它包含至少一种如权利要求1至5中任一项所述的多核苷酸和/或至少一种如权利要求6或7任一项所述的载体。
18.如权利要求17中所述的生物系统,其特征在于它由微生物、或以原核细胞或真核细胞为宿主的异源表达系统、或体外非细胞系统构成。
19.如权利要求18中所述的生物系统,其特征在于所述微生物是例如大肠杆菌或变青链霉菌的细菌。
20.经修饰的体外非细胞系统,其特征在于它包含至少一种如权利要求1至5中任一项所述的多核苷酸和/或至少一种如权利要求6或7任一项所述的载体。
21.至少一种如权利要求17至19中任一项所请求保护的经修饰的生物系统或如权利要求20所请求保护的经修饰的体外非细胞系统用于制备环二肽和/或在3-及6-位被α,β不饱和氨基酸侧链取代的二酮哌嗪衍生物(特别是白诺斯菌素)的用途。
22.体外合成环二肽的方法,其特征在于:
(1)在适宜条件下使两种可以相同或不同的氨基酸与多肽AlbC(SEQ ID NO.9)接触,和
(2)纯化所得的环二肽。
23.体外合成3-及6-位被氨基酸侧链取代的α,β不饱和二酮哌嗪衍生物的方法,其特征在于:
(1)在适宜条件下使两种可以相同或不同的氨基酸与多肽AlbC(SEQ ID NO.9)接触并纯化所得的环二肽,和
(2)使步骤(1)中获得的环二肽与AlbA(SEQ ID NO.6)、AlbB1(SEQ ID NO.7)和AlbB2(SEQ ID NO.8)接触,并纯化所得的α,β不饱和二酮哌嗪衍生物。
24.如权利要求23所请求保护的方法,其特征在于该方法在步骤(2)中还包含多肽AlbD(SEQ ID NO.10)。
25.如权利要求22至24之中任一项所请求保护的方法,其特征在于多肽的量介于0.1nM和10μM之间,优选介于10nM和1μM之间。
26.合成环二肽的方法,其特征在于:
(1)在适宜培养所述已选择的生物系统的条件下接触至少含有多核苷酸albC(SEQ ID NO.3)的生物系统,和
(2)纯化所得的环二肽。
27.如权利要求26所请求保护的方法,其特征在于该生物系统还包含多核苷酸albD(SEQ ID NO.4)。
28.合成3-及6-位被α,β不饱和氨基酸侧链取代的二酮哌嗪衍生物的方法,其特征在于:
(1)在适宜培养所述已选择的生物系统的条件下接触包含一种至少含有albA、albB和albC(SEQ ID NO.1-3)的多核苷酸的生物系统,和
(2)纯化所得的α,β不饱和二酮哌嗪衍生物。
29.如权利要求28所请求保护的方法,其特征在于该生物系统还包含多核苷酸albD(SEQ ID NO.4)。
30.如权利要求26至29之中任一项所请求保护的方法,其特征在于该生物系统是一种微生物,例如如大肠杆菌或变青链霉菌的细菌,或任一已知的以原核细胞或真核细胞为宿主的异源表达系统,或者甚至是体外非细胞系统。
31.如权利要求22至30之中任一项所请求保护的方法,其特征在于氨基酸的量介于0.1mM和100mM之间,优选介于1mM和10mM之间。
CNA038171325A 2002-06-21 2003-06-18 涉及二酮哌嗪衍生物合成的多核苷酸和由所述多核苷酸编码的多肽 Pending CN1668639A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR02/07728 2002-06-21
FR0207728A FR2841260B1 (fr) 2002-06-21 2002-06-21 Polynucleotides et polypeptides codes par lesdits polynucleotides impliques dans la synthese de derives des dicetopiperazines

Publications (1)

Publication Number Publication Date
CN1668639A true CN1668639A (zh) 2005-09-14

Family

ID=29719952

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA038171325A Pending CN1668639A (zh) 2002-06-21 2003-06-18 涉及二酮哌嗪衍生物合成的多核苷酸和由所述多核苷酸编码的多肽

Country Status (9)

Country Link
US (2) US7112425B2 (zh)
EP (1) EP1523498B1 (zh)
JP (1) JP4521270B2 (zh)
CN (1) CN1668639A (zh)
AT (1) ATE526342T1 (zh)
AU (1) AU2003255681B2 (zh)
CA (1) CA2490517A1 (zh)
FR (1) FR2841260B1 (zh)
WO (1) WO2004000879A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103189384A (zh) * 2010-10-29 2013-07-03 隆萨有限公司 形成二酮哌嗪的二肽连接子
CN105199989A (zh) * 2015-10-09 2015-12-30 厦门大学 海洋链霉菌环二肽及其制备方法
CN110327455A (zh) * 2019-07-26 2019-10-15 福建师范大学 一种环(l-酪氨酸-l-脯氨酸)在制备细菌群体感应系统抑制剂中的应用

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1946847A (zh) * 2004-04-21 2007-04-11 协和发酵工业株式会社 二肽的制备方法
US8257943B2 (en) * 2004-06-25 2012-09-04 Kyowa Hakko Bio Co., Ltd. Process for producing dipeptides or dipeptide derivatives
ATE474847T1 (de) * 2004-06-25 2010-08-15 Kyowa Hakko Bio Co Ltd Verfahren zur herstellung von dipeptiden
EP1767628A4 (en) * 2004-06-25 2008-08-27 Kyowa Hakko Kogyo Kk PROCESS FOR THE PREPARATION OF DIPEPTIDES OR DIPEPTIDE DERIVATIVES
JP2009534048A (ja) * 2006-04-26 2009-09-24 コミッサリア ア レネルジ アトミック シクロジペプチド合成酵素及びシクロ(Leu−Leu)シクロジペプチドの合成のためのその使用
US20100055737A1 (en) * 2006-04-26 2010-03-04 Centre National De La Recherche Scientifique Cyclodipeptide Synthetase and its use for Synthesis of Cyclo(Tyr-Xaa) Cyclodipeptides
EP2212419A1 (en) * 2007-10-31 2010-08-04 Kyowa Hakko Bio Co., Ltd. Cyclodipeptide synthases (cdss) and their use in the synthesis of linear dipeptides
JP7179715B2 (ja) * 2016-07-27 2022-11-29 ザ ボード オブ トラスティーズ オブ ザ レランド スタンフォード ジュニア ユニバーシティー 核酸送達用の崩壊性細胞透過性複合体
CN109320587A (zh) * 2018-10-24 2019-02-12 苏州卫生职业技术学院 具有通乳效果的环二肽

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6779347B2 (en) * 2001-05-21 2004-08-24 C.P. Baker Securities, Inc. Solid-state thermionic refrigeration

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103189384A (zh) * 2010-10-29 2013-07-03 隆萨有限公司 形成二酮哌嗪的二肽连接子
CN105199989A (zh) * 2015-10-09 2015-12-30 厦门大学 海洋链霉菌环二肽及其制备方法
CN110327455A (zh) * 2019-07-26 2019-10-15 福建师范大学 一种环(l-酪氨酸-l-脯氨酸)在制备细菌群体感应系统抑制剂中的应用

Also Published As

Publication number Publication date
EP1523498B1 (fr) 2011-09-28
AU2003255681B2 (en) 2009-08-20
WO2004000879A1 (fr) 2003-12-31
CA2490517A1 (fr) 2003-12-31
FR2841260B1 (fr) 2004-10-22
JP4521270B2 (ja) 2010-08-11
FR2841260A1 (fr) 2003-12-26
AU2003255681A1 (en) 2004-01-06
US7112425B2 (en) 2006-09-26
EP1523498A1 (fr) 2005-04-20
JP2006503554A (ja) 2006-02-02
US20070048817A1 (en) 2007-03-01
US7723082B2 (en) 2010-05-25
US20060051837A1 (en) 2006-03-09
ATE526342T1 (de) 2011-10-15

Similar Documents

Publication Publication Date Title
CN100347291C (zh) 用于发酵制备l-半胱氨酸、l-胱氨酸、n-乙酰丝氨酸或四氢噻唑衍生物的微生物和方法
CN1839153A (zh) 来自荚膜毕赤氏酵母的氧化还原酶
CN1317049A (zh) 编码opcA基因的核苷酸序列
CN1668639A (zh) 涉及二酮哌嗪衍生物合成的多核苷酸和由所述多核苷酸编码的多肽
CN1152955C (zh) 生产蛋白酶的方法
CN1046462A (zh) 生物活性肽和抗菌素的组合物及其应用
CN1263855C (zh) 来自淡青链霉菌的假寡糖生物合成基因的分离及其应用
CN101061222A (zh) 编码甲基化儿茶素生物合成酶的基因
CN1300317C (zh) 抗李斯特菌细菌素
CN1153831C (zh) 编码神经酰胺糖内切酶激活物的基因
CN1227870A (zh) 来自棉铃腐阿氏酵母的嘌呤生物合成基因及在微生物核黄素合成中的应用
CN1685057A (zh) 在芽孢杆菌细胞的色素缺陷突变体中产生生物物质的方法
CN1501979A (zh) 通过发酵棒状细菌生产l-氨基酸的方法
CN1514880A (zh) 生产依马菌素的方法和组合物
CN1765929A (zh) 含有肽载体和表皮生长因子的融合蛋白和核酸及其用途
CN1213402A (zh) 表层蛋白的重组表达
CN100347190C (zh) 编码rpsL基因的核苷酸序列
CN1387566A (zh) 环状缩肽合成酶及其基因、以及环状缩肽的大规模生产系统
CN1056189C (zh) 编码阿凡曼链霉菌支链α-酮酸脱氢酶复合物的基因
CN1230544C (zh) 磷酸己酮糖异构酶和编码该酶的基因
CN1192107C (zh) 从带小棒链霉菌分离的5s棒烷基因及其在棒酸生产中的应用
CN101063140A (zh) 万古霉素生物合成基因簇
CN1532282A (zh) 一种新型抗肠球菌多肽及其制备方法
CN1371423A (zh) 编码环状脂肽酰基转移酶的基因及其表达
CN100347302C (zh) 尼可霉素生物合成调控基因及其编码蛋白与表达工程菌

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication