CN117222622A - 多取代基裸盖菇素衍生物及使用方法 - Google Patents

多取代基裸盖菇素衍生物及使用方法 Download PDF

Info

Publication number
CN117222622A
CN117222622A CN202280028274.4A CN202280028274A CN117222622A CN 117222622 A CN117222622 A CN 117222622A CN 202280028274 A CN202280028274 A CN 202280028274A CN 117222622 A CN117222622 A CN 117222622A
Authority
CN
China
Prior art keywords
nucleic acid
group
derivative
acid sequence
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202280028274.4A
Other languages
English (en)
Inventor
吉利恩·M·哈格尔
彼得·J·法基尼
林长春
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nvirick Biosciences Canada Co
Original Assignee
Nvirick Biosciences Canada Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nvirick Biosciences Canada Co filed Critical Nvirick Biosciences Canada Co
Priority claimed from PCT/CA2022/050206 external-priority patent/WO2022170438A1/en
Publication of CN117222622A publication Critical patent/CN117222622A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Saccharide Compounds (AREA)

Abstract

公开了新的多取代基裸盖菇素衍生化合物以及含有其的药物制剂和娱乐性药品制剂。可以通过使反应物裸盖菇素衍生物与含取代基的化合物反应来生产所述化合物。

Description

多取代基裸盖菇素衍生物及使用方法
相关申请
本申请要求2021年2月12日提交的美国临时申请号63/149,001和2021年9月24日提交的美国临时申请号63/247,881的权益,专利申请号63/149,001和63/247,881的全部内容通过引证并入本文。
技术领域
本文公开的组合物和方法涉及称为裸盖菇素(psilocybin,赛洛西宾)的化学化合物(chemical compound,化合物)。此外,本文公开的组合物和方法特别地涉及包含多个取代基的裸盖菇素的衍生物。
背景技术
作为本公开的背景的方式提供以下段落。然而,它们并不承认其中讨论的任何内容是现有技术或本领域技术人员的知识的一部分。
活生物体细胞中的生化途径可分为初级代谢的一部分或次级代谢的一部分。作为细胞初级代谢的一部分的途径涉及用于能量产生的分解代谢或用于细胞构建块(buildingblock)生产的合成代谢。另一方面,次级代谢产物由不具有明显合成代谢或分解代谢功能的细胞产生。人们早已认识到次级代谢产物可用于许多方面,包括作为治疗化合物。
例如,裸盖菇素是由某些蘑菇天然产生的次级代谢产物,这些蘑菇在分类学上可归类为属于真菌界的担子菌门。能够产生裸盖菇素的蘑菇物种包括属于裸盖菇属(Psilocybe)的物种,例如,诸如深蓝裸盖菇(Psilocybe azurescens)、半裸盖菇(Psilocybe semilanceata)、塞尔维亚裸盖菇(Psilocybe serbica)、墨西哥裸盖菇(Psilocybe mexicana)和光盖裸盖菇(Psilocybe cyanescens)。本领域对裸盖菇素的兴趣是众所周知的。因此,例如,裸盖菇素是一种精神活性化合物,并因此被用作娱乐性药品(recreational drug,消遣性药品)。此外,裸盖菇素被用作精神障碍(disorder,紊乱)中行为和神经影像研究中的研究工具,并已对其治疗心理健康状况的临床潜力进行了评估(Daniel,J.et al.,Mental Health Clin/,2017;7(1):24-28),包括治疗晚期癌症患者的焦虑(Grob,C.et al.,Arch.Gen.Psychiatry,2011,68(1)71-78)和缓解难治性抑郁症的症状(Cathart-Harris,R.L.et al.,Lancet Psychiatry,2016,3:619-627)。
尽管裸盖菇素的毒性较低,但娱乐性裸盖菇素使用者经常会经历不良副作用,包括例如惊恐发作、偏执狂和精神病状态,有时一起或单独称为“恶梦之旅”。
因此,本领域需要改进的裸盖菇素化合物。
发明内容
以下段落旨在向读者介绍更详细的描述,而不是定义或限制本公开所要求保护的主题。
在一方面,本公开涉及裸盖菇素及其衍生化合物(derivative compound)。
在另一方面,本公开涉及裸盖菇素衍生化合物以及制备和使用这些化合物的方法。
在另一方面,本公开涉及多取代基裸盖菇素衍生化合物(multiple-substituentpsilocybin derivative compound,多取代裸盖菇素衍生化合物)。
因此,在一方面,在至少一个实施方式中,根据本文的教导,本公开提供了具有式(I)的化学化合物或其盐:
其中,R2、R4、R5、R6或R7中的至少两个是独立地选自以下的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基(glycosyloxy,糖基氧基)、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基(phosphate group,磷酸根基团),并且其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且R3c为氢原子或羧基。
在至少一个实施方式中,在一方面,R2、R4、R5、R6或R7中的至少三个可以是选自以下的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
在至少一个实施方式中,在一方面,R2、R4、R5、R6或R7中的至少三个可以是选自以下的至少三种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
在至少一个实施方式中,在一方面,当R4没有被取代基取代时,R4可以是氢原子。
在至少一个实施方式中,在一方面,R4和R5可以选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R2、R6和R7可以是氢原子。
在至少一个实施方式中,在一方面,R4和R5可以选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R4和R5中的至少一个可以是异戊二烯基或卤素原子,并且R2、R6和R7可以是氢原子。
在至少一个实施方式中,在一方面,R4和R6可以选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R2、R4和R7可以是氢原子。
在至少一个实施方式中,在一方面,R4和R6可以选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R4和R6中的至少一个可以是异戊二烯基或卤素原子,并且R2、R4和R7可以是氢原子。
在至少一个实施方式中,在一方面,R4和R7可以选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R2、R5和R6可以是氢原子。
在至少一个实施方式中,在一方面,R4和R7可以选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R4和R7中的至少一个可以是异戊二烯基或卤素原子,并且R2、R5和R6可以是氢原子。
在至少一个实施方式中,在一方面,R5和R6可以选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R2、R4和R7可以是氢原子。
在至少一个实施方式中,在一方面,R5和R7可以选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R5和R6中的至少一个可以是异戊二烯基或卤素原子,并且R2、R4和R6可以是氢原子。
在至少一个实施方式中,在一方面,R5和R7可以选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R2、R4和R6可以是氢原子。
在至少一个实施方式中,在一方面,R5和R7可以选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R5和R7中的至少一个可以是异戊二烯基或卤素原子,并且R2、R4和R6可以是氢原子。
在至少一个实施方式中,在一方面,R6和R7可以选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R2、R4和R5可以是氢原子。
在至少一个实施方式中,在一方面,R6和R7可以选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R6和R7中的至少一个可以是异戊二烯基或卤素原子,并且R2、R4和R5可以是氢原子。
在至少一个实施方式中,在一方面,R2可以为氢,并且R4、R5、R6或R7中仅两个被取代,其中第一取代基选自(i)卤素原子、(ii)异戊二烯基和(iii)腈基,并且第二取代基选自(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中第一和第二取代基来自不同的基团。
在至少一个实施方式中,在一方面,R2可以为氢,并且R4、R5、R6或R7中仅两个被取代,其中第一取代基为卤素原子,并且第二取代基选自(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物、(vi)醛或酮基、(vii)异戊二烯基和(viii)腈基。
在至少一个实施方式中,在一方面,R2可以为氢,并且R4、R5、R6或R7中仅两个被取代,其中第一取代基为异戊二烯基,并且第二取代基选自(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基和(viii)腈基。
在至少一个实施方式中,在一方面,R2可以为氢,并且R4、R5、R6或R7中仅两个被取代,其中第一取代基为腈原子,并且第二取代基选自(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基和(viii)异戊二烯基。
在至少一个实施方式中,在一方面,R2可以为氢,并且R4、R5、R6或R7中仅两个被取代,其中第一取代基选自(i)卤素原子、(ii)异戊二烯基和(iii)腈基,并且第二取代基选自(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物和(vi)醛或酮基。
在至少一个实施方式中,在一方面,R2可以为氢,并且R4、R5、R6或R7中仅两个被取代,其中第一取代基为卤素原子,并且第二取代基可以选自(i)氨基或N-取代的氨基、(ii)腈基、(iii)硝基、(iv)羟基和(v)异戊二烯基。
在至少一个实施方式中,在一方面,R2可以为氢,并且R4、R5、R6或R7中仅两个被取代,其中第一取代基为异戊二烯基,并且第二取代基选自(i)羧基或羧酸衍生物、(ii)卤素和(iii)羟基,其中R2可以是氢原子,并且R4、R5、R6或R7中的两个可以是取代基。
在至少一个实施方式中,在一方面,R2可以为氢,并且R4、R5、R6或R7中仅两个被取代,其中第一取代基为卤素原子,并且第二取代基为异戊二烯基。
在至少一个实施方式中,在一方面,R2可以为氢,并且R4、R5、R6或R7中仅两个被取代,其中第一取代基为腈基,并且第二取代基为氨基或N-取代的氨基。
在至少一个实施方式中,在一方面,R5可以是羧基或乙酰基,并且R7可以是氨基、腈基、羟基或卤素。
在至少一个实施方式中,在一方面,R5可以是乙酰胺基,并且R7可以是醛基、羧基或羧基酯(carboxyester,羧酸酯)。
在至少一个实施方式中,在一方面,R5可以是乙酰胺基,R6可以是氨基、硝基或卤素,并且R7可以是醛基、羧基或羧基酯。
在至少一个实施方式中,在一方面,R5可以是羧甲基或酰胺基,并且R7可以是硝基、氨基或卤素。
在至少一个实施方式中,在一方面,R4可以是糖氧基,R5可以是羧甲基或酰胺基,并且R7可以是硝基、氨基或卤素。
在至少一个实施方式中,在一方面,化学化合物(I)可以选自具有化学式(IX)、(X)、(XI)、(XII)、(XIII)、(XIV)、(XV)、(XVI)、(XVII)、(XVIII)、(XIX)、(XX)、(XXI)、(XXII)、(XXIII)、(XXIV)、(XXV)、(XXVI)、(XXVII)、(XXVIII)、(XXIX)、(XXX)、(XXXI)、(XXXII)、(XXXIII)、(XXXIV)、(XXXV)、(XXXVI)、(XXXVII)、(XXXVIII)、(XXXIX)、(XL)、(XLI)、(XLII)、(XLIII)、(XLIV)、(XLV)、(XLVI)、(XLVII)、(XLVIII)、(XLIX)、(L)、(LI)、(LII)、(LIII)、(LIV)、(LV)或(LXXVI)的化合物:
在至少一个实施方式中,化学化合物(I)可以是图13A、图13B和图13C中所示并且在其中标记为13A-3、13A-4、13A-5、13A-6、13A-7、13A-8、13A-9、13A-10、13B-3、13B-4、13B-5、13B-6、13B-7、13B-8、13B-8、13C-6、13C-7、13C-8、13C-9、13C-10或13C-11的化合物中的任一种。
在另一方面,本公开涉及包含裸盖菇素衍生化合物的药物制剂和娱乐性药品制剂(pharmaceutical and recreational drug formulation)。因此,在一方面,本公开在至少一个实施方式中提供了药物制剂或娱乐性药品制剂,其包含有效量的具有式(I)的化学化合物或其盐以及药学上可接受的赋形剂、稀释剂或载体:
其中,R2、R4、R5、R6或R7中的至少两个是独立地选自以下的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且R3c为氢原子或羧基。
在另一方面,本公开涉及治疗精神障碍(psychiatric disorder,精神疾病,精神紊乱)的方法。因此,在一个实施方式中,本公开还提供了用于治疗精神障碍的方法,该方法包括向对其有需要的受试者施用包含具有式(I)的化学化合物或其盐的药物制剂:
其中,R2、R4、R5、R6或R7中的至少两个是独立地选自以下的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且R3c为氢原子或羧基,其中药物制剂以治疗受试者的精神障碍的有效量施用。
在至少一个实施方式中,在一方面,障碍可以是5-HT2A受体介导的障碍或5-HT1A受体介导的障碍。
在至少一个实施方式中,在一方面,可以施用约0.001mg至约5,000mg的剂量。
在另一方面,本公开在至少一个实施方式中提供了一种用于调节5-HT2A受体或5-HT1A受体的方法,该方法包括使5-HT2A受体或5-HT1A受体与具有式(I)的化学化合物或其盐接触:
其中,R2、R4、R5、R6或R7中的至少两个是独立地选自以下的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且R3c为氢原子或羧基。
在至少一个实施方式中,在一方面,反应条件可以是体外反应条件。
在至少一个实施方式中,在一方面,反应条件可以是体内反应条件。
在另一方面,本公开涉及制备多取代基裸盖菇素衍生化合物的方法。因此,在一方面,本公开在至少一个实施方式中提供了一种制备具有化学式(I)的裸盖菇素衍生物或其盐的方法:
其中,R2、R4、R5、R6或R7中的至少两个是独立地选自以下的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且R3c为氢原子或羧基,所述方法包括:
在足以形成具有化学式(I)的裸盖菇素取代物(psilocybin substituent)或其盐的反应条件下,使具有化学式(II)的反应物裸盖菇素衍生物与含取代基的化合物(substituent containing compound)反应:
其中,R2、R4、R5、R6或R7之一是选自下述的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7为氢原子或醇基,并且当R4没有被任何上述取代基取代时,R4为氢原子、羟基、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基,
其中,含取代基的化合物中的取代基选自(i)含卤素的化合物、(ii)含羟基的化合物、(iii)含硝基的化合物、(iv)含糖氧基的化合物、(v)含氨基或N-取代的氨基的化合物、(vi)含羧基或羧酸衍生物的化合物、(vii)含醛基或酮基的化合物、(viii)含异戊二烯基的化合物以及(ix)含腈基的化合物。
在至少一个实施方式中,在一方面,具有式(II)的反应物裸盖菇素衍生物中的取代基可以是硝基,含取代基的化合物可以是羧酸衍生物乙酸酐(Ac2O),并且反应物裸盖菇素衍生物和含取代基的化合物可在傅-克(Friedl-Crafts)酰基化反应中反应以形成具有式(I)的第一裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一是硝基,并且R2、R4、R5、R6或R7中的至少一个是乙酰基。
在至少一个实施方式中,在一方面,形成的第一裸盖菇素衍生物可以是图13A中所示并且标记为13A-3的化合物。
在至少一个实施方式中,在一方面,可以使形成的具有式(I)的第一裸盖菇素衍生物反应以氧化乙酰基并且形成具有式(I)的第二裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是硝基,并且R2、R4、R5、R6或R7中的至少一个可以是羧基。
在至少一个实施方式中,在一方面,形成的第二裸盖菇素衍生物可以是图13A中所示并且标记为13A-4的化合物。
在至少一个实施方式中,在一方面,可以使形成的具有式(I)的第二裸盖菇素衍生物反应以还原硝基并形成氨基和具有式(I)的第三裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是氨基,并且R2、R4、R5、R6或R7中的至少一个可以是羧基。
在至少一个实施方式中,在一方面,形成的第三裸盖菇素衍生物可以是图13A中所示并且标记为13A-5的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的第三裸盖菇素衍生物可以与亚硝酸盐反应以将氨基转化为重氮盐并形成具有式(I)的中间(intermediate,中间体)裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是重氮基(diazonium group),并且R2、R4、R5、R6或R7中的至少一个可以是羧基。
在至少一个实施方式中,在一方面,形成的中间裸盖菇素衍生物可以是图13A中所示并且标记为13A-6的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的中间裸盖菇素衍生物可以与含腈化合物反应,以转化重氮基并形成具有式(I)的第四裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是腈基,并且R2、R4、R5、R6或R7中的至少一个可以是羧基。
在至少一个实施方式中,在一方面,形成的第四裸盖菇素衍生物可以是图13A中所示并且标记为13A-7的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的中间裸盖菇素衍生物可以与水反应,以转化重氮基并形成具有式(I)的第五裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是羟基,并且R2、R4、R5、R6或R7中的至少一个可以是羧基。
在至少一个实施方式中,在一方面,形成的第五裸盖菇素衍生物可以是图13A中所示并且标记为13A-8的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的中间裸盖菇素衍生物可以与含卤素的化合物反应,以转化重氮基并形成具有式(I)的第六裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是卤素原子,并且R2、R4、R5、R6或R7中的至少一个可以是羧基。
在至少一个实施方式中,在一方面,形成的第六裸盖菇素衍生物可以是图13A中所示并且标记为13A-9或13A-10的化合物。
在至少一个实施方式中,在一方面,具有式(II)的反应物裸盖菇素衍生物中的取代基可以是甲氧基羰基,含取代基的化合物可以是含卤素的化合物N-卤代琥珀酰亚胺,并且反应物裸盖菇素衍生物和含取代基的化合物可以反应形成具有式(I)的第一裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是甲氧基羰基,并且R2、R4、R5、R6或R7中的至少一个可以是卤素原子。
在至少一个实施方式中,在一方面,N-卤代琥珀酰亚胺可以是N-氯代琥珀酰亚胺,并且形成的第一裸盖菇素衍生物可以是图13B中所示并且标记为13B-3的化合物。
在至少一个实施方式中,在一方面,具有式(II)的反应物裸盖菇素衍生物中的取代基可以是甲氧基羰基,含取代基的化合物可以是含硝基的化合物四氟硼酸硝鎓(nitronium tetrafluoroborate),并且反应物裸盖菇素衍生物和含取代基的化合物可以反应以形成具有式(I)的第二裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一是甲氧基羰基,并且R2、R4、R5、R6或R7中的至少一个是硝基。
在至少一个实施方式中,在一方面,形成的第二裸盖菇素衍生物可以是图13B中所示并且标记为13B-4的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的第一裸盖菇素衍生物可以与乙酰化的糖基化合物反应并形成具有式(I)的第三裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一是甲氧基羰基,R2、R4、R5、R6或R7中的至少一个可以是糖氧基,并且R2、R4、R5、R6或R7中的至少一个可以是卤素原子。
在至少一个实施方式中,在一方面,形成的第三裸盖菇素衍生物可以是图13B中所示并且标记为13B-5的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的第二裸盖菇素衍生物可以与乙酰化的糖基化合物反应并形成具有式(I)的第四裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是甲氧基羰基,R2、R4、R5、R6或R7中的至少一个可以是糖氧基,并且R2、R4、R5、R6或R7中的至少一个是硝基。
在至少一个实施方式中,在一方面,形成的第四裸盖菇素衍生物可以是图13B中所示并且标记为13B-6的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的第三裸盖菇素衍生物可以与氨反应,以将甲氧基羰基转化为酰氨基(amido group,酰胺基)并形成具有式(I)的第五裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是酰氨基,R2、R4、R5、R6或R7中的至少一个是糖氧基,并且R2、R4、R5、R6或R7中的至少一个可以是卤素原子。
在至少一个实施方式中,在一方面,形成的第五裸盖菇素衍生物可以是图13B中所示并且标记为13B-7的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的第四裸盖菇素衍生物可以与氨反应,以将甲氧基羰基转化为酰氨基并形成具有式(I)的第六裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是酰氨基,R2、R4、R5、R6或R7中的至少一个可以是糖氧基,并且R2、R4、R5、R6或R7中的至少一个是硝基。
在至少一个实施方式中,在一方面,形成的第六裸盖菇素衍生物可以是图13B中所示并且标记为13B-8的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的第六裸盖菇素衍生物可以反应以还原硝基以形成氨基和具有式(I)的第七裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是酰氨基,R2、R4、R5、R6或R7中的至少一个是糖氧基,并且R2、R4、R5、R6或R7中的至少一个可以是硝基。
在至少一个实施方式中,在一方面,形成的第七裸盖菇素衍生物可以是图13B中所示并且标记为13B-9的化合物。
在至少一个实施方式中,在一方面,具有式(II)的反应物裸盖菇素衍生物中的取代基可以是乙酰胺基,含取代基的化合物可以是含卤素的化合物N-卤代琥珀酰亚胺,并且反应物裸盖菇素衍生物和含取代基的化合物可以反应以形成具有式(I)的第一裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是乙酰胺基,并且R2、R4、R5、R6或R7中的至少一个可以是卤素原子。
在至少一个实施方式中,在一方面,N-卤代琥珀酰亚胺可以是N-溴代琥珀酰亚胺(NBS),并且形成的第一裸盖菇素衍生物可以是图13C中所示并且标记为13C-6的化合物。
在至少一个实施方式中,在一方面,具有式(II)的反应物裸盖菇素衍生物中的取代基可以是乙酰胺基,含取代基的化合物可以是二甲基甲酰胺,并且反应物裸盖菇素衍生物和含取代基的化合物可以反应以形成具有式(I)的中间裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一是乙酰胺基,并且R2、R4、R5、R6或R7中的至少一个可以是甲醇基,并且其中中间裸盖菇素衍生物可以反应以氧化甲醇基,并且形成具有式(I)的第二裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是乙酰胺基,并且R2、R4、R5、R6或R7中的至少一个可以是羧基。
在至少一个实施方式中,在一方面,中间裸盖菇素衍生物可以是图13C中所示并且标记为13C-5的化合物,并且形成的第二裸盖菇素衍生物可以是图13C中所示并且标记为13C-7的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的第二裸盖菇素衍生物可以与醇反应,以酯化羧基以形成酯和具有式(I)的第三裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是乙酰胺基,R2、R4、R5、R6或R7中的至少一个可以是羧基酯。
在至少一个实施方式中,在一方面,形成的第三裸盖菇素衍生物可以是图13C中所示并且标记为13C-8的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的第三裸盖菇素衍生物可以与含硝基的化合物反应并形成具有式(I)的第四裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是乙酰胺基,R2、R4、R5、R6或R7中的至少一个可以是羧基酯,并且R2、R4、R5、R6或R7中的至少一个是硝基。
在至少一个实施方式中,在一方面,形成的第四裸盖菇素衍生物可以是图13C中所示并且标记为13C-9的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的第四裸盖菇素衍生物可以反应,以还原硝基以形成氨基和具有式(I)的第五裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一是乙酰胺基,R2、R4、R5、R6或R7中的至少一个是羧基酯,并且R2、R4、R5、R6或R7中的至少一个是氨基。
在至少一个实施方式中,在一方面,形成的第五裸盖菇素衍生物可以是图13C中所示并且标记为13C-10的化合物。
在至少一个实施方式中,在一方面,形成的具有式(I)的第五裸盖菇素衍生物可以与氨反应以形成酰氨基和具有式(I)的第六裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一可以是乙酰胺基,R2、R4、R5、R6或R7中的至少一个是羧基酯,并且R2、R4、R5、R6或R7中的至少一个可以是酰氨基。
在至少一个实施方式中,在一方面,形成的第六裸盖菇素衍生物可以是图13C中所示并且标记为13C-11的化合物。
在另一方面,本公开涉及制备多取代基裸盖菇素衍生物的进一步方法。因此,在一方面,本公开在至少一个方面提供了一种制备多取代基裸盖菇素衍生物的方法,该方法包括在允许酶催化转化裸盖菇素衍生物前体化合物的反应条件下,使具有式(LVII)的裸盖菇素衍生物前体化合物与催化量的裸盖菇素生物合成酶补体(complement)接触,以形成具有式(I)的多取代基裸盖菇素衍生化合物:
其中R2、R4、R5、R6或R7中的至少一个是选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,并且其中R3为氢原子或-CH2-CHNH2COOH或-CH2-CH2NH2
其中,R2、R4、R5、R6或R7中的至少两个是独立地选自以下的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基。
在至少一个实施方式中,在一方面,反应条件可以是体外反应条件。
在至少一个实施方式中,在一方面,反应条件可以是体内反应条件。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物和含取代基的化合物可以与宿主细胞中的裸盖菇素生物合成酶补体接触,其中宿主细胞可以包含嵌合核酸序列(chimeric nucleic acid sequence),所述嵌合核酸序列包含下述作为操作性地连接的组件(operably linked component,操作性地连接的元件,操作性地连接的组分):
(i)控制宿主细胞中表达的核酸序列;和
(ii)编码裸盖菇素生物合成酶补体的核酸序列,
并且宿主细胞可以生长以表达裸盖菇素生物合成酶补体并产生多取代基裸盖菇素衍生化合物。
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以包含由选自以下的核酸编码的至少一种酶:
(a)SEQ.ID NO:1、SEQ.ID NO:3、SEQ.ID NO:5、SEQ.ID NO:7、SEQ.ID NO:9、SEQ.IDNO 11、SEQ.ID NO:13、SEQ.ID NO:15、SEQ.ID NO:17、SEQ.ID NO:19、SEQ.ID NO:21、SEQ.IDNO 23、SEQ.ID NO:25和SEQ.ID NO:48;
(b)与(a)的任一核酸序列基本同一(substantially identical)的核酸序列;
(c)除了遗传密码的简并(degeneration)之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2、SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:8、SEQ.ID NO:10、SEQ.ID NO 12、SEQ.ID NO:14、SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20、SEQ.IDNO:22、SEQ.ID NO 24、SEQ.ID NO:26和SEQ.ID NO:49中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:2、SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:8、SEQ.ID NO:10、SEQ.ID NO 12、SEQ.ID NO:14、SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20、SEQ.ID NO:22、SEQ.ID NO 24、SEQ.ID NO:26和SEQ.ID NO:49中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以包含由选自以下的核酸编码的色氨酸合酶亚基B多肽(synthase subunit B polypeptide):
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2中所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示的核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个是独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中R3为氢原子,并且其中形成了具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R3c为羧基。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LVIII)的化学化合物:
其中R4为羟基,并且其中R6是氯原子,并且形成的第一(first formed,第一形成的)多取代基裸盖菇素衍生化合物具有式(LV):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含色氨酸脱羧酶以使R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中R3a和R3b各自为氢原子,色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LVIII)的化学化合物:
其中R4为氟原子、氨基或羟基,其中R6为氟原子、氨基、腈或溴原子,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LIX):
其中R4为氟原子、氨基或羟基,其中R6为氟原子、氨基、腈或溴原子,并且其中第二多取代基裸盖菇素衍生物具有式(XXII)、(XXVI)、(XXIX)、(LII)或(LIV):
/>
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含N-乙酰基转移酶以使具有化学式(I)的第二裸盖菇素衍生物乙酰化,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中R3a为氢原子并且R3b为乙酰基,N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LVIII)的化学化合物:
其中R4为乙酰胺基、氟原子、氨基或羟基,其中R6为氟原子、氨基、腈或溴原子,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LIX):
其中R4为乙酰胺基、氟原子、氨基或羟基,其中R6为氟原子、氨基、腈或溴原子,并且其中第二多取代基裸盖菇素衍生物具有式(LX):
并且其中第三多取代基裸盖菇素衍生物具有式(IX)、(X)、(XVIII)、(XXI)、(XXV)或(XXVIII):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含N-甲基转移酶以使在R3处的R3氨基甲基化并形成具有化学式(I)的第四多取代基裸盖菇素衍生物,其中R3a和R3b各自为甲基,或其中R3a为氢原子并且R3b为甲基,N-甲基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:11和SEQ.ID NO 13;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LVIII)的化学化合物:
其中R4为氨基或羟基,其中R6是氯原子、腈基或溴原子,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LIX):
其中R4为氨基或羟基,其中R6是氯原子、腈基或溴原子,并且其中第二多取代基裸盖菇素衍生物具有式(LX):
并且其中第四多取代基裸盖菇素衍生物具有式(XXVII)、(XL)或(LIII):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以包含由选自以下的核酸编码的异戊二烯基转移酶:
(a)SEQ.ID NO:15、SEQ.ID NO:17、SEQ.ID NO:19和SEQ.ID NO 21;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO 22中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO 22中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7之一是选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中R3为-CH2-CHNH2COOH,并且其中形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R2、R4、R5、R6或R7中的至少一个为异戊二烯基并且R3c为氢原子。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXI)的化学化合物:
其中R4为羟基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(L):
/>
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含色氨酸脱羧酶以使R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中R3a和R3b各自为氢原子,色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含N-甲基转移酶以使R3处的R3氨基甲基化并形成具有化学式(I)的第四多取代基裸盖菇素衍生物,其中R3a和R3b各自为甲基或其中R3a为氢原子并且R3b为甲基,N-甲基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:11和SEQ.ID NO 13;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXI)的化学化合物:
其中R4是丙酰氧基或乙酰氧基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LIX):
其中R4是丙酰氧基或乙酰氧基,其中R6为异戊二烯基,并且其中第二多取代基裸盖菇素衍生物具有式:
其中R4是丙酰氧基或乙酰氧基,其中R6为异戊二烯基,其中第三多取代基裸盖菇素衍生物具有式(XLI)或(XLII):
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXII)的化学化合物:
其中R5是氯或氟原子,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LXIII):
其中R5是氯或氟原子,并且其中R6为异戊二烯基,并且其中形成的第二(secondformed,第二形成的)多取代基裸盖菇素衍生化合物具有式(XXXVI)和(XXXVIII):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含N-乙酰基转移酶以使具有化学式(I)的第二裸盖菇素衍生物乙酰化并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中R3a为氢原子并且R3b为乙酰基,N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXI)的化学化合物:
其中R5是氯或氟原子,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LXIII):
其中R5是氯或氟原子,并且其中R6为异戊二烯基,并且其中形成的第二多取代基裸盖菇素衍生化合物具有式(LXIV):
其中R5是氯或氟原子,并且其中R6为异戊二烯基,并且其中第三多取代基裸盖菇素衍生物具有式(XXXV)或(XXXVII):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以包含由选自以下的核酸编码的色氨酸合酶亚基B多肽:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个是独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中R3为氢原子,并且其中形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R3c为羧基。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXV)的化学化合物:
其中R4为羟基,并且其中R5为异戊二烯基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LI):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含色氨酸脱羧酶以使R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中R3a和R3b各自为氢原子,色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXV)的化学化合物:
其中R4为氟原子并且R5为腈基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LXIX):
其中R4为氟原子并且其中R5为腈基,并且其中形成的第二多取代基裸盖菇素衍生化合物具有式(XIX):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含N-乙酰基转移酶以使具有化学式(I)的第二裸盖菇素衍生物乙酰化,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中R3a为氢原子并且R3b为乙酰基,N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXV)的化学化合物:
其中R4为氟原子并且R5为羟基或腈基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LXIX):
其中R4为氟原子并且其中R5为羟基或腈基,并且其中形成的第二多取代基裸盖菇素衍生化合物具有式(LXXII):
其中R4为氟原子,并且其中R5为羟基或腈基,并且其中第三多取代基裸盖菇素衍生物具有式(XVII)或(XX):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以包含由选自以下的核酸编码的色氨酸合酶亚基B多肽:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个是独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中R3为氢原子,并且其中形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R3c为羧基。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXVI)的化学化合物:
其中R4为羟基,并且其中R7为异戊二烯基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(XLIX):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含色氨酸脱羧酶以使R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中R3a和R3b各自为氢原子,色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXVI)的化学化合物:
其中R4为氟原子并且R7为腈基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LXX):
其中R4为氟原子并且其中R7为腈基,并且其中形成的第二多取代基裸盖菇素衍生化合物具有式(XXIV):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含N-乙酰基转移酶以使具有化学式(I)的第二裸盖菇素衍生物乙酰化,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中R3a为氢原子并且R3b为乙酰基,N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXVI)的化学化合物:
其中R4为氟原子或氯原子并且R7为异戊二烯基或腈基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LXX):
其中R4为氟原子或氯原子并且其中R7为异戊二烯基或腈基,并且其中形成的第二多取代基裸盖菇素衍生化合物具有式(LXXIII):
其中R4为氟原子或氯原子,并且其中R7为异戊二烯基或腈基,并且其中第三多取代基裸盖菇素衍生物具有式(XXIII)或(XX):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含N-甲基转移酶以使R3处的R3氨基甲基化并形成另外的具有化学式(I)的多取代基裸盖菇素衍生物,其中R3a和R3b各自为甲基或其中R3a为氢原子并且R3b为甲基,N-甲基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:11和SEQ.ID NO:13;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXVI)的化学化合物:
其中R4是氯原子并且R7为羟基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LXX):
其中R4为羟基并且其中R7为氯原子,并且其中形成的第二多取代基裸盖菇素衍生化合物具有式(LXXIII):
其中R4为羟基,并且其中R7为氯原子,并且其中第三多取代基裸盖菇素衍生物具有式(XXXIX):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以包含由选自以下的核酸编码的色氨酸合酶亚基B多肽:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个是独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中R3是氢原子,并且其中形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R3c是羧基,并且裸盖菇素生物合成酶补体进一步包含色氨酸脱羧酶以使第一多取代基裸盖菇素衍生化合物的R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中R3a和R3b各自为氢原子,色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXVII)的化学化合物:
其中R5为氟原子、氯原子或腈基并且R6为氟原子、氨基或异戊二烯基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LXIII):
其中R5为氟原子、氯原子或腈基并且其中R6为氟原子、氨基或异戊二烯基,并且其中形成的第二多取代基裸盖菇素衍生化合物具有式(XI)、(XVI)、(XXXVI)或(XXXVIII):
/>
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含N-乙酰基转移酶以使具有化学式(I)的第二裸盖菇素衍生物乙酰化并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中R3a是氢原子并且R3b是乙酰基,N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXVII)的化学化合物:
其中R5为氟原子或氯原子并且R6为氨基、乙酰胺基或异戊二烯基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LXIII):
其中R5为氟原子或氯原子并且其中R6为氨基、乙酰胺基或异戊二烯基,并且其中形成的第二多取代基裸盖菇素衍生化合物具有式(LXXIV):
其中R5为氟原子或氯原子,并且其中R6为氨基、乙酰胺基或异戊二烯基,并且其中第三多取代基裸盖菇素衍生物具有式(XIV)、(XV)、(XXXV)或(XXXVII):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含N-甲基转移酶以使R3处的R3氨基甲基化并形成具有化学式(I)的第四多取代基裸盖菇素衍生物,其中R3a和R3b各自为甲基或其中R3a为氢原子且R3b为甲基,N-甲基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:11和SEQ.ID NO 13;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXVII)的化学化合物:
其中R5是氯原子并且R6为异戊二烯基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LXIII):
其中R5是氯原子并且其中R6为异戊二烯基,并且其中形成的第二多取代基裸盖菇素衍生化合物具有式(LXXIV):
其中R5是氯原子,并且其中R6为异戊二烯基,并且其中第三多取代基裸盖菇素衍生物具有式(XLIV):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以包含由选自以下的核酸编码的色氨酸合酶亚基B多肽:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2所示氨基酸序列的功能变体的核酸序列;
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个是独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中R3为氢原子,并且其中形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R3c是羧基,并且裸盖菇素生物合成酶补体进一步包含色氨酸脱羧酶以使第一多取代基裸盖菇素衍生化合物的R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中R3a和R3b各自为氢原子,色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXVIII)的化学化合物:
其中R5为氟原子,并且R7为硝基或异戊二烯基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LXXI):
其中R5为氟原子,并且其中R7为硝基原子或异戊二烯基,并且其中形成的第二多取代基裸盖菇素衍生化合物具有式(XIII)或(XXXIII):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以进一步包含N-乙酰基转移酶以使具有化学式(I)的第二裸盖菇素衍生物乙酰化,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中R3a为氢原子并且R3b为乙酰基,N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在至少一个实施方式中,在一方面,裸盖菇素衍生物前体化合物可以是具有式(LXVIII)的化学化合物:
其中R5为氟原子,并且R7为硝基或异戊二烯基,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LXXI):
其中R5为氟原子,并且其中R7为硝基原子或异戊二烯基,并且其中形成的第二多取代基裸盖菇素衍生化合物具有式(LXXV):
其中R5为氟原子,并且其中R7为硝基或异戊二烯基,并且其中第三多取代基裸盖菇素衍生物具有式(XII)或(XXXII):
在至少一个实施方式中,在一方面,裸盖菇素生物合成酶补体可以含有由选自以下的核酸编码的异戊二烯基转移酶:
(a)SEQ.ID NO:15、SEQ.ID NO:17、SEQ.ID NO:19和SEQ.ID NO 21;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO 22中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO 22中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7之一是选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中R3为氢原子,并且其中形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R3c是羧基或氢原子。
在至少一个实施方式中,裸盖菇素衍生物前体化合物具有式(LXXVII):
并且第一多取代基裸盖菇素衍生化合物具有式(LXXVI):
在至少一个实施方式中,在一方面,该方法可以进一步包括这样的步骤,所述步骤包括从宿主细胞和/或宿主细胞培养基中分离多取代基裸盖菇素衍生化合物。
在至少一个实施方式中,在一方面,宿主细胞可以是微生物。
在至少一个实施方式中,在一方面,宿主细胞可以是细菌细胞或酵母细胞。
在至少一个实施方式中,在一方面,宿主细胞可以是大肠杆菌细胞或酿酒酵母(Saccharomyces cerevisiae)细胞。
在另一方面,本公开在至少一个实施方式中提供了具有式(I)的化学化合物或其盐在制备药物制剂或娱乐性药品制剂中的用途:
其中,R2、R4、R5、R6或R7中的至少两个是独立地选自以下的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且R3c为氢原子或羧基。
在至少一个实施方式中,制备可以包括将化学化合物与赋形剂、稀释剂或载体进行配制。
在另一方面,本公开在至少一个实施方式中提供了具有式(I)的化学化合物或其盐与稀释剂、载体或赋形剂一起作为药物制剂或娱乐性药品制剂的用途:
/>
其中,R2、R4、R5、R6或R7中的至少两个是独立地选自以下的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且R3c为氢原子或羧基。
其他特征和优点将从以下详细描述中变得显而易见。然而,应当理解的是,虽然详细描述指示了本公开的优选实现方式,但是仅以示例的方式给出,因为从详细描述,在本公开的精神和范围内的各种变化和修改对于本领域技术人员来说将是显而易见的。
附图说明
本公开在下文提供的段落中通过示例的方式结合附图进行描述。提供本文中提供的附图是为了更好地理解示例性实施方式并且更清楚地示出可以如何实施各种实施方式。附图并不旨在限制本公开。
图1描绘了裸盖菇素的化学结构。
图2描绘了裸盖菇素和裸盖菇素衍生化合物的某种原型结构,即吲哚。某些碳和氮原子在本文中可通过它们在吲哚结构内的位置来指代,即N1、C2、C3等。显示了相关的原子编号。
图3A、3B、3C、3D、3E、3F、3G、3H、3I、3J、3K和3L描绘了某些示例性裸盖菇素衍生物的化学结构,特别地2,5-二-S1,S2-裸盖菇素衍生物(图3A)、2,5-二-S2,S1-裸盖菇素衍生物(图3B)、2,6-二-S1,S2-裸盖菇素衍生物(图3C)、2,6-二-S2,S1-裸盖菇素衍生物(图3D)、2,7-二-S1,S2-裸盖菇素衍生物(图3E)、2,7-二-S2,S1-裸盖菇素衍生物(图3F)、5,6-二-S1,S2-裸盖菇素衍生物(图3G)、5,6-二-S2,S1-裸盖菇素衍生物(图3H)、5,7-二-S1,S2-裸盖菇素衍生物(图3I)、5,7-二-S2,S1-裸盖菇素衍生物(图3J)、6,7-二-S1,S2-裸盖菇素衍生物(图3K)和6,7-二-S2,S1-裸盖菇素衍生物(图3L)。在前述的每一个中,S1和S2选自下列中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮、(viii)异戊二烯基和(ix)腈基。应当注意的是,在图3A-3L的每一个中,R3a和R3b各自可以为氢原子、烷基、环烷基、酰基或芳基,并且R3c可以是氢原子或羧基。
图4A、4B、4C、4D、4E和4F描绘了某些示例性裸盖菇素衍生物的化学结构,特别地2,5,6-三-S1,S2,S3-裸盖菇素衍生物(图4A)、2,5,6-三-S1,S3,S2-裸盖菇素衍生物(图4B)、2,5,6-三-S3,S1,S2-裸盖菇素衍生物(图4C)、2,5,6-三-S2,S1,S3-裸盖菇素衍生物(图4D)、2,5,6-三-S3,S2,S1-裸盖菇素衍生物(图4E)和2,5,6-三-S2,S3,S1-裸盖菇素衍生物(图4F)。在上述的每一个中,S1、S2和S3选自以下的三种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。应当注意的是,在图4A-4F的每一个中,R3a和R3b各自可以为氢原子、烷基、环烷基、酰基或芳基,并且R3c可以是氢原子或羧基。
图4G、4H和4I描绘了某些示例性裸盖菇素衍生物的化学结构,特别地2,5,6-三-S1,S2,S2-裸盖菇素衍生物(图4G)、2,5,6-三-S2,S1,S2-裸盖菇素衍生物(图4H)和2,5,6-三-S2,S2,S1-裸盖菇素衍生物(图4I)。在前述的每一个中,S1和S2选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。应当注意的是,在图4G-4I的每一个中,R3a和R3b各自可以是氢原子、烷基、环烷基、酰基或芳基,并且R3c可以是氢原子或羧基。
图5A、5B、5C、5D、5E和5F描绘了某些示例性裸盖菇素衍生物的化学结构,特别地2,5,7-三-S1,S2,S3-裸盖菇素衍生物(图5A)、2,5,7-三-S1,S3,S2-裸盖菇素衍生物(图5B)、2,5,7-三-S3,S1,S2-裸盖菇素衍生物(图5C)、2,5,7-三-S2,S1,S3-裸盖菇素衍生物(图5D)、2,5,7-三-S3,S2,S1-裸盖菇素衍生物(图5E)和2,5,7-三-S2,S3,S1-裸盖菇素衍生物(图5F)。在上述每一个中,S1、S2和S3选自以下的三种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。值得注意的是,在图5A-5F的每一个中,R3a和R3b各自可以是氢原子、烷基、环烷基、酰基或芳基,并且R3c可以是氢原子或羧基。
图5G、5H和5I描绘了某些示例性裸盖菇素衍生物的化学结构,特别地2,5,7-三-S1,S2,S2-裸盖菇素衍生物(图5G)、2,5,7-三-S2,S1,S2-裸盖菇素衍生物(图5H)和2,5,7-三-S2,S2,S1-裸盖菇素衍生物(图5I)。在上述的每一个中,S1和S2选自以下的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。应当注意的是,在图5A-5I的每一个中,R3a和R3b各自可以是氢原子、烷基、环烷基、酰基或芳基,并且R3c可以是氢原子或羧基。
图6A、6B、6C、6D、6E和6F描绘了某些示例性裸盖菇素衍生物的化学结构,特别地2,6,7-三-S1,S2,S3-裸盖菇素衍生物(图6A)、2,6,7-三-S1,S3,S2-裸盖菇素衍生物(图6B)、2,6,7-三-S3,S1,S2-裸盖菇素衍生物(图6C)、2,6,7-三-S2,S1,S3-裸盖菇素衍生物(图6D)、2,6,7-三-S3,S2,S1-裸盖菇素衍生物(图6E)和2,6,7-三-S2,S3,S1-裸盖菇素衍生物(图6F)。在上述的每一个中,S1、S2和S3选自以下的三种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。应当注意的是,在图6A-6F的每一个中,R3a和R3b各自可以是氢原子、烷基、环烷基、酰基或芳基,并且R3c可以是氢原子或羧基。
图6G、6H和6I描绘了某些示例性裸盖菇素衍生物的化学结构,特别地2,6,7-三-S1,S2,S2-裸盖菇素衍生物(图6G)、2,6,7-三-S2,S1,S2-裸盖菇素衍生物(图6H)和2,6,7-三-S2,S2,S1-裸盖菇素衍生物(图6I)。在上述的每一个中,S1和S2选自下列中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。应当注意的是,在图6G-6I的每一个中,R3a和R3b各自可以是氢原子、烷基、环烷基、酰基或芳基,并且R3c可以是氢原子或羧基。
图7A、7B、7C、7D、7E和7F描绘了某些示例性裸盖菇素衍生物的化学结构,特别地5,6,7-三-S1,S2,S3-裸盖菇素衍生物(图7A)、5,6,7-三-S1,S3,S2-裸盖菇素衍生物(图7B)、5,6,7-三-S3,S1,S2-裸盖菇素衍生物(图7C)、5,6,7-三-S2,S1,S3-裸盖菇素衍生物(图7D)、5,6,7-三-S3,S2,S1-裸盖菇素衍生物(图7E)和5,6,7-三-S2,S3,S1-裸盖菇素衍生物(图7F)。在前述的每一个中,S1、S2和S3选自下列中的三种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。应当注意的是,在图7A-7F的每一个中,R3a和R3b各自可以是氢原子、烷基、环烷基、酰基或芳基,并且R3c可以是氢原子或羧基。
图7G、7H和7I描绘了某些示例性裸盖菇素衍生物的化学结构,特别地5,6,7-三-S1,S2,S2-裸盖菇素衍生物(图7G)、5,6,7-三-S2,S1,S2-裸盖菇素衍生物(图7H)和5,6,7-三-S2,S2,S1-裸盖菇素衍生物(图7I)。在前述的每一个中,S1和S2选自下列中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。应当注意的是,在图7G-7I的每一个中,R3a和R3b各自可以是氢原子、烷基、环烷基、酰基或芳基,并且R3c可以是氢原子或羧基。
图8A、8B、8C、8D、8E、8F和8G描绘了某些示例性裸盖菇素衍生物的化学结构,特别地O-烷基化的裸盖菇素衍生物,特别地4-O-甲基-5-氯-裸盖菇素衍生物(图8A)、4-O-乙基-5-氯-裸盖菇素衍生物(图8B)、4-乙酰氧基-5-氯-裸盖菇素衍生物(图8C)、4-丙酰氧基-5-氯-裸盖菇素衍生物(图8D)、4-羟基-5-氯-裸盖菇素衍生物(图8E)、4-磷酸-5-氯-裸盖菇素衍生物(图8F)和5-氯-裸盖菇素衍生物(图8H)。应当注意的是,在图8A-8G的每一个中,R3a和R3b各自可以是氢原子、烷基、环烷基、酰基或芳基,并且R3c可以是氢原子或羧基。
图9描绘了用于合成硝化裸盖菇素衍生物的示例性化学反应,特别是其中在硫酸存在下4-O-甲基-裸盖菇素衍生物与硝酸反应以形成4-O-甲基-5-硝基-裸盖菇素衍生物的反应。
图10描绘了用于合成糖基化裸盖菇素衍生物的示例性化学反应,特别是其中4-羟基-裸盖菇素衍生物与糖基化合物反应以形成4-糖基-裸盖菇素衍生物的反应。
图11A、11B和11C描绘了用于合成具有后续N-取代的胺化裸盖菇素衍生物的某些示例性化学反应,特别是其中4-O-甲基-5-硝基-裸盖菇素衍生物与氢气在钯炭(palladiumon charcoal,炭载钯)的催化下形成4-O-甲基-5-氨基-裸盖菇素衍生物的反应(图11A)。然后,可以用不同的基团取代5-位上形成的氨基,诸如用乙酸酐酰化。氨基还可以通过与醛(诸如乙醛)缩合,然后用硼氢化物还原中间体亚胺来烷基化(图11B)。图11C描绘了在催化剂的帮助下使用H2O2和NH3·H2O的可能的直接胺化方法。
图12A、12B、12C和12D描绘了示例性化学反应,其显示使用4-羟基-裸盖菇素衍生物作为反应物形成4-羟基-5-羧基裸盖菇素衍生物(图12A);使用芳基卤化物-裸盖菇素衍生物作为反应物形成4-羟基-7-羧基裸盖菇素衍生物(图12B);使用受保护的裸盖菇素衍生物作为试剂形成羧化的受保护的裸盖菇素衍生物(图12C);以及使用羧化的裸盖菇素衍生物作为试剂形成羧化的裸盖菇素衍生物的钠盐(a);形成OH被取代的羧基形成酯(b);或形成OH被取代的羧基形成酰胺(c)(图12D)。
图13A、13B、13C和13D描绘了用于制备裸盖菇素衍生物的示例性化学反应。图13A描绘了最初合成的7-硝化裸盖菇素衍生物向在C5和C7原子处含有两种类型基团的其他裸盖菇素衍生物的转化,特别是在C5原子处的基团是酮基或羧酸,并且在C7原子处的基团是硝基、胺、腈、羟基、碘化物或氟化物。图13B描绘了使用最初合成的5-羧基裸盖菇素衍生物向在C5原子和C7原子处含有两种类型基团的其他O-4-糖基化裸盖菇素衍生物的示例性化学转化,特别是在C5原子处的基团是酯或酰胺,在C7原子处的基团是硝基或胺。图13C描绘了最初合成的5-硝化裸盖菇素衍生物形成在C5、C6和C7碳原子处含有多达三种类型基团的5,6,7-三取代裸盖菇素衍生物的进一步的示例性化学转化。附接到C5碳原子上的基团可以是硝基、氨基或N-乙酰胺基,而附接到C6碳原子上的基团可以是卤素、硝基或氨基,并且附接到C7碳原子上的基团可以是甲酰基、羧基或酰胺基。图13-D描绘了羟基-裸盖菇素衍生物(化合物13-D4)的制备,然后可以使用异戊二烯基转移酶在体外或体内将其异戊二烯化以形成例如化合物13-D4的C6异戊二烯化衍生物。应当注意的是,图13A-13D中的具体化学化合物被标记为13A-1、13A-2等(图13A);13B-1、13B-2等(图13B);13C-1、13C-2等(图13C)以及13D-1、13D-2等(图13D)。
图14A、14B、14C、14D、14E、14F和14G描绘了生物合成示例性多取代基裸盖菇素衍生化合物的某些途径,特别是具有S14和S26取代基的示例性化合物(图14A)、具有S14和S26异戊二烯基的示例性化合物(图14B)、具有S15和S26异戊二烯基的示例性化合物(图14C)、具有S14和S25取代基的示例性化合物(图14D)、具有S14和S27取代基的示例性化合物(图14E)、具有S15和S26取代基的示例性化合物(图14F)以及具有S15和S27取代基的示例性化合物(图14G)。图14A-14G的每一个中与示例性化合物相邻的罗马数字是指本公开中如此编号的示例性化合物。
图15A、15B、15C、15D、15E、15F、15G和15H描绘了在进行实验测定中获得的各种图,所述实验测定用于评估本文所述具有化学式(IX)的示例性异戊二烯化裸盖菇素衍生物的功效,特别是具有化学式(IX)的多取代基裸盖菇素衍生物的细胞存活率测定(图15A);[3H]酮色林在5-HT2A受体处的饱和结合测定(图15B);裸头草辛作为阳性对照(结合)的竞争测定(图A);以及色氨酸作为阴性对照(无结合)的竞争测定(图B)(图15C);对具有式(IX)的多取代基裸盖菇素衍生化合物的竞争测定,指定为“IX”(图15D,为了清楚起见,用两个不同的Y轴绘制,图A和图B);在+5HT1A细胞和-5HT1A细胞中,在恒定(4μM)毛喉素存在下和使用增加浓度的裸头草辛的cAMP测定(图15E);在+5HT1A细胞和-5HT1A细胞中,在(4μM)毛喉素存在下和10μM血清素以及使用增加浓度的血清素的cAMP测定(图15F);在+5HT1A细胞和-5HT1A细胞cAMP测定中,在(4μM)毛喉素存在下以及使用增加浓度的色氨酸的cAMP测定(图14G);和在+5HT1A细胞和-5HT1A细胞中,在恒定(4μM)毛喉素存在下和使用增加浓度的具有式(IX)的多取代基裸盖菇素衍生化合物,指定为“IX”,的cAMP测定(图15H)。
图16A、16B和16C描绘了在进行实验测定中获得的各种图,该实验测定用以评估本文所述具有化学式(X)的示例性异戊二烯化裸盖菇素衍生物的功效,特别是具有化学式(IX)的多取代基裸盖菇素衍生物的细胞存活率测定(图16A);具有式(IX)的多取代基裸盖菇素衍生化合物的竞争测定,指定为“IX”(图16B);以及在+5HT1A细胞和-5HT1A细胞中,在恒定(4μM)毛喉素存在和使用增加浓度的具有式(X)的多取代基裸盖菇素衍生化合物,指定为“X”,的cAMP测定(图15H)。
图17和17B描绘了色谱图形式的质谱数据的表示,特别是进行实验以合成本文所述具有化学式(XII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图(图17A);以及在进行实验以鉴别本文所述具有化学式(XII)的多取代基裸盖菇素衍生化合物中获得的进一步质谱光谱形式的质谱数据的表示(图17B)。
图18A和18B描绘了色谱图形式的进一步质谱数据的表示,特别是进行实验以合成本文所述具有化学式(XIV)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图(图18A);以及在进行实验以鉴别本文所述具有化学式(XII)的多取代基裸盖菇素衍生化合物中获得的进一步质谱光谱形式的质谱数据的表示(图18B)。
图19A和19B描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XV)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图(图19A);以及在进行实验以鉴别本文所述具有化学式(XV)的多取代基裸盖菇素衍生化合物中获得的进一步质谱光谱形式的质谱数据的表示(图19B)。
图20描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XVII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图21A和21B描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XVIII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图(图21A);以及在进行实验以鉴别本文所述具有化学式(XVIII)的多取代基裸盖菇素衍生化合物中获得的进一步质谱光谱形式的质谱数据的表示(图21B)。
图22A和22B描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXI)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图(图22A);和在进行实验以鉴别本文所述具有化学式(XXI)的多取代基裸盖菇素衍生化合物中获得的进一步质谱光谱形式的质谱数据的表示(图22B)。
图23A和23B描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXIII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图(图23A);以及在进行实验以鉴别本文所述具有化学式(XXIII)的多取代基裸盖菇素衍生化合物中获得的进一步质谱光谱形式的质谱数据的表示(图23B)。
图24描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXV)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图25A和25B描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXVIII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图(图25A);以及在进行实验以鉴别本文所述具有化学式(XXVIII)的多取代基裸盖菇素衍生化合物中获得的进一步质谱光谱形式的质谱数据的表示(图25B)。
图26描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XX)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图27描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XIII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图28描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XVI)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图29描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XIX)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图30描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图31描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXVI)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图32A和32B描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXIX)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图(图32A);以及在进行实验以鉴别本文所述具有化学式(XXIX)的多取代基裸盖菇素衍生化合物中获得的进一步质谱光谱形式的质谱数据表示(图32B)。
图33描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXVII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图34A和34B描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXXIV)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图(图34A);以及在进行实验以鉴别本文所述具有化学式(XXXIV)的多取代基裸盖菇素衍生化合物中获得的进一步质谱光谱形式的质谱数据的表示(图34B)。
图35A和35B描绘了色谱图形式的进一步质谱数据的表示,特别是在过行实验以合成本文所述具有化学式(XXXII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图(图35A);以及在进行实验以鉴别本文所述具有化学式(XXXII)的多取代基裸盖菇素衍生化合物中获得的进一步质谱光谱形式的质谱数据的表示(图35B)。
图36描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXXVI)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图37描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XLIX)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图38描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(L)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图39描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XLVII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图40描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(LI)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图41描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXXVI)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图42描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXXV)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图43A和43B描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXXVI)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图(图43A);以及在进行实验以鉴别本文所述具有化学式(XXXVI)的多取代基裸盖菇素衍生化合物中获得的进一步质谱光谱形式的质谱数据的表示(图43B)。
图44描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXXVIII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图45描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XL)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图46描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXXIX)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图47描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(LII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图48描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(LIII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图49描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(LIV)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图50描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXX)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图51描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XXXI)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图52描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XLI)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图53描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XLII)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图54描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XLV)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
图55A和55B描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(XLIV)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图(图55A);以及在进行实验以鉴别本文所述具有化学式(XLIV)的多取代基裸盖菇素衍生化合物中获得的进一步质谱光谱形式的质谱数据的表示(图55B)。
图56描绘了色谱图形式的进一步质谱数据的表示,特别是在进行实验以合成本文所述具有化学式(LXVVI)的示例性多取代基裸盖菇素衍生化合物中获得的色谱图。
附图与下面的详细描述一起使得本领域技术人员清楚如何在实践中实现本公开。
具体实施方式
下面将描述各种组合物、系统或方法以提供每个要求保护的主题的实施方式的示例。下面描述的实施方式不限制任何要求保护的主题,并且任何要求保护的主题可以覆盖与下面描述的那些不同的方法、组合物或系统。所要求保护的主题不限于具有下述任一组合物、系统或方法的所有特征的组合物、方法或系统,或者不限于下述多种组合物、系统或方法的多个或全部所共有的特征。下面描述的组合物、系统或方法可能不是任何要求保护的主题的实施方式。本文件中未要求保护的在下面描述的组合物、系统或方法中公开的任何主题,可以是另一保护性文件的主题,例如继续专利申请,并且申请人、发明人或权利人不打算通过在本文件中的公开而舍弃、放弃任何此类主题或将其奉献给公众。
如本文和权利要求中所使用的,单数形式,诸如“一个”、“一种”和“该”包括复数引用,反之亦然,除非上下文另有明确说明。在整个说明书中,除非另有说明,“包含(comprise)”、“包含(comprises)”和“包含(comprising)”被包含性地而非排他性地使用,使得所陈述的整数或整数组可以包括一个或多个其它未陈述的整数或整数组。
下面将描述各种组合物、系统或方法以提供每个要求保护的主题的实施方式的示例。下面描述的实施方式不限制任何要求保护的主题,并且任何要求保护的主题可以覆盖与下面描述的那些不同的方法、组合物或系统。所要求保护的主题不限于具有下述任一组合物、系统或方法的所有特征的组合物、方法或系统,或者不限于下述多种组合物、系统或方法的多个或全部所共有的特征。下面描述的组合物、系统或方法可能不是任何要求保护的主题的实施方式。本文件中未要求保护的在下文描述的组合物、系统或方法中公开的任何主题,可以是另一保护性文件的主题,例如继续专利申请,并且申请人、发明人或权利人无意通过在本文件中的公开而舍弃、放弃任何此类主题或将其奉献给公众。
当本文为物理性质(诸如分子量)或化学性质(诸如化学式)而使用范围时,旨在包括范围的所有组合和子组合以及其中的具体的实施方式。除了在操作示例中或另外指出的情况外,本文使用的表达成分的量或反应条件的所有数字应理解为在所有情况下均由术语“约”修饰。当提及数字或数值范围时,术语“约”意指所提及的数字或数值范围是在实验变异性内(或统计实验误差内)的近似值,并且因此该数字或数值范围可以在所述数字或数字范围的1%和15%之间变化,根据上下文可以很容易地看出这一点。此外,本文描述的任何数值范围旨在具体地包括该范围的极限值以及在给定范围内的任何中间值或子范围,并且所有此类中间值和子范围均被单独且具体地公开(例如范围1至5包括1、1.5、2、2.75、3、3.90、4和5)。类似地,本文使用的诸如“基本上”和“大致”等其它程度术语意指所修饰的术语的合理偏差量,使得最终结果不会显著改变。如果偏差不会否定其所修饰术语的含义,则这些程度术语应被解释为包括所修饰术语的该偏差。
除非另有定义,与本文描述的制剂相关的科学和技术术语应具有本领域普通技术人员通常理解的含义。本文使用的术语仅用于描述特定实施方式的目的,并不旨在限制本发明的范围,本发明的范围仅由权利要求限定。
所有出版物、专利和专利申请均通过引用整体并入本文,其程度如同每个单独的出版物、专利或专利申请被具体且单独地表明通过引用整体并入一样。
术语和定义
术语“裸盖菇素”是指具有图1所示结构的化学化合物。
术语“吲哚原型结构”是指图2所示的化学结构。值得注意的是,吲哚原型结构中的具体碳原子和氮原子被编号。本文可引用这些碳和氮数,例如C2、C4、N1等。此外,可以根据相同编号引用附接至吲哚原型结构的化学基团,例如R4和R6是指化学基团分别附接至C4和C6原子。另外,在这方面,R3A和R3B是指从乙基氨基延伸出的化学基团,而该乙基氨基又从原型吲哚结构的C3原子延伸出。
本文所用的术语“裸盖菇素衍生物”是指可以从裸盖菇素衍生的化合物,其中此类化合物包括吲哚原型结构和具有式(LXXVIII)的C3乙胺或乙胺衍生基团:
其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基。裸盖菇素衍生物包括在C2、C4、C5、C6和C7中的每一个处含有一个或多个取代基的化合物。因此,在式(LXXVIII)中,R2、R4、R5、R6和R7各自可以是例如下列的任何一种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基、(x)O-烷基、(xi)和(xii)O-酰基、(xiii)磷酸酯基、或(xiv)氢原子。
术语“多取代基裸盖菇素衍生物”是指其中两个或更多个取代基实体已键合至裸盖菇素或裸盖菇素衍生物的裸盖菇素衍生化合物。可以引用可被取代的具体碳原子。此外,取代基实体可称为S1、S2、S3或S4,其中S1、S2、S3和S4中的每一个指不同的取代基实体。例如,5,7-S1,S2-二-裸盖菇素衍生物是指其中碳原子数5和碳原子数7(如吲哚原型结构中所确定的)各自具有不同取代基实体的裸盖菇素衍生物,或者类似地,2,5,6-三-S1,S2,S3-裸盖菇素衍生物是指其中碳原子数2,5,6(如吲哚原型结构中所确定的)具有不同取代基实体(或在三个取代基中至少两个不同)的裸盖菇素衍生物。作为另一个示例,2,5,6-三-S1,S2,S2-裸盖菇素衍生物是指其中碳原子数2,5,6(如在吲哚原型结构中所确定的)各自具有取代基实体的裸盖菇素衍生物,由碳原子数5和6具备的取代基实体是相同的。值得注意的是,S1、S2、S3和S4在本文中还可以包括数字下标,诸如S15、S36、S47等。当包括此类数值时,它们引用了原型吲哚结构的编号C原子。因此,例如,S15是从吲哚环结构的C5原子延伸出的取代基实体,S37是从吲哚环结构的C7原子延伸出的取代基实体等。术语多取代基裸盖菇素衍生物进一步包括具有化学式(I)的化学化合物:
其中,R2、R4、R5、R6或R7中的至少两个是独立地选自以下中的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基。术语多取代基裸盖菇素衍生物可以进一步包括具有式(IV)的化合物:
其中,R2、R5、R6或R7中的至少两个是独立地选自以下中的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7为氢原子,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基。该术语进一步包括多取代基裸盖菇素的盐,诸如钠盐、钾盐等。
如本文所用,术语“卤素”、“卤化的”和“卤代-”是指由氟(F)、氯(Cl)、溴(Br)和碘(I)组成的化学元素类别。因此,卤化的化合物可以指“氟化”、“氯化”、“溴化”或“碘化”化合物。
如本文所用,术语“磷酸酯基”或“磷酸基团(phospho group)”是含有与四个氧原子(三个单键和一个双键)共价键合的一个磷原子的分子。四个氧原子中的一个氧原子可以是羟基,并且非羟基化的氧原子之一可以化学键合至另一实体。
本文所用的术语“羟基基团”和“羟基”是指含有与一个氢原子键合的一个氧原子并具有式-OH的分子。羟基可以通过其氧原子与另一个实体化学键合。
本文所用的术语“硝基基团”和“硝基”是指含有与两个氧原子键合的一个氮原子并具有式-NO2的分子。硝基可以通过其氮原子与另一个实体化学键合。此外,应注意的是,附接至硝基的实体在本文中可称为“硝化”实体,例如硝化裸盖菇素衍生物是具有硝基的裸盖菇素衍生物。
本文所用的术语“氨基基团”和“氨基”是指含有与氢原子键合的一个氮原子并具有式-NH2的分子。氨基也可以被质子化并具有式-NH3 +。氨基通过其氮原子可以化学键合至另一实体。此外,值得注意的是,附接至氨基的实体在本文中可称为“胺化”实体,例如胺化裸盖菇素衍生物是具有氨基或N-取代的氨基的裸盖菇素衍生物。
本文所用的术语“N-取代的氨基”是指其中至少一个氢原子已被另一原子或基团(诸如,例如烷基、酰基、芳基、磺酰基等)取代的氨基。N-取代的氨基也可以被质子化,并且氨基通过其氮原子可以化学键合至另一实体。因此,N-取代的氨基在本文中可表示为:
或为/>
此外,N-取代的氨基包括:
化学基团(IV)(烷基、芳基):
其中R’和R”各自独立地选自氢原子、烷基和芳基,但前提条件是R’和R”中至少一个不是氢原子;
化学基团(V):
其中R’、R”和R”’各自独立地选自氢原子、烷基和芳基,但是前提条件是R’、R”和R”’中的至少一个不是氢原子;
化学基团(VI)(酰基):
其中R’和R”各自独立地选自氢原子、烷基和芳基;
化学基团(VII)(磺酰基):
其中R’和R”各自独立地选自氢原子、烷基和芳基;以及
化学基团(VIII)(磺酸酯基):
其中R”选自氢原子、烷基和芳基。化学基团(VI)、(VII)和(VIII)的氮原子也可以带正电并且进一步被H或R”’取代。应注意的是,R’、R”和R”’在本文中可附加地包括数字下标,诸如5a6b7b等,并且分别表示为例如R’5a、R”6b或R”’7a。当包括这样的数值时,它们指的是从氨基延伸出的化学实体,该氨基又从原型吲哚结构的如此编号的C原子延伸出。因此,例如,R’5a是从附接至吲哚环结构的C5原子的胺化基团延伸出的化学实体,R’2a是从附接至吲哚环结构的C2原子的胺化基团延伸出的化学实体等。此外,需要得注意的是,附接至N-取代的氨基的实体在本文中可被称为“胺化”实体,例如胺化的裸盖菇素衍生物是具有氨基或N-取代的氨基的裸盖菇素衍生物。
本文所用的术语“羧基基团”、“羧基(carboxyl)”和“羧基(carboxy)”是指含有与氧原子和羟基键合的一个碳原子并具有式-COOH的分子。羧基包括去质子化的羧基,即具有式-COO-的羧基离子。在其去质子化形式中,羧基可形成羧基盐,例如羧基钠盐或羧基钾盐,或有机羧基盐,所有这些在本文中可表示为COO-M+。还应当理解的是,羧基可以通过其碳原子与另一实体化学键合。此外,应注意的是,附接至羧基的实体在本文中可称为“羧化”实体,例如,羧化裸盖菇素衍生物是具有羧基或OH-取代的羧基的裸盖菇素衍生物。
本文所用的术语“羧酸衍生物”是指其中羧基的羟基已被另一原子或基团取代的羧基,诸如,例如-OR”基团或-NR’R”基团。因此,羧酸衍生物包括化学基团(III):
其中,R’为烷基、芳基和氢原子。应注意的是,化学基团(III)是酯。应注意的是,R’在本文中还可包括数字下标,例如3c6b7b等,并且分别表示为例如R’3c、R’6b或R’7a。在包括此类数值的情况下,它们指的是从羧基延伸出的化学实体,该羧基又从原型吲哚结构的如此编号的C原子延伸出。因此,例如,R’5a是从附接至吲哚环结构的C5原子的羧化基团延伸出的化学实体,R’2a是从附接至吲哚环结构的C2原子的羧化基团延伸出的化学实体等。此外,应注意的是,附接至羧酸衍生物的实体在本文中可称为“羧化”实体,例如,羧化裸盖菇素衍生物是具有羧基或OH-取代的羧基的裸盖菇素衍生物。
本文所用的术语“醛”或“醛基”是指含有与氧原子双键键合且与氢原子键合的一个碳原子并且具有化学式的分子,其可以进一步替代地在本文中表示为-CHO。-CHO基团在本文中也可称为甲酰基。应当理解的是,醛可以通过其碳原子化学键合至另一实体。/>
本文所用的术语“酮”或“酮基”是指含有两个碳原子的分子,第一个碳原子与氧原子双键键合,并且第一个碳进一步与第二个碳原子键合,该分子具有化学式:其中R是任何实体或多个实体,它们组合在一起使得与R键合的碳原子达到其普通化合价。因此,例如,R可以代表3个氢原子,或者R可以代表2个氢原子和甲基。应当理解的是,酮可以通过其第一个碳原子化学键合至另一实体,诸如亚烷基(C1-C6)-亚烷基。
本文所用的术语“腈基”和“腈”是指含有与氮原子键合的一个碳原子并具有式的分子。应当理解的是,腈基通过其碳原子可以与另一实体化学键合。此外,值得注意的是,附接至腈基的实体在本文中可称为“腈化”实体,例如腈化裸盖菇素衍生物是具有腈基的裸盖菇素衍生物。
本文所用的术语“糖基化”或“糖基”是指糖基团,诸如单糖、二糖、三糖、寡糖或多糖基团,其可以或已经从其异头碳以吡喃糖或呋喃糖形式以α或β构象键合。当通过其异头碳经由氧原子与另一实体键合时,键合的糖基团(包括氧原子)在本文中可称为“糖氧基”基团。示例单糖基团包括但不限于戊糖基、己糖基或庚糖基。糖氧基还可以被各种基团取代。此类取代可包括低级烷基、低级烷氧基、酰基、羧基、羧氨基、氨基、乙酰胺基、卤代、硫代、硝基、酮基和磷酰基(phosphatyl group),其中取代可位于糖上的一个或多个位置。术语糖基还包括糖氧基的立体异构体、旋光异构体、端基异构体和差向异构体。因此,例如,己糖基可以是醛糖或酮糖基,可以是D-或L-构型,可以呈现α或β构象,并且相对于平面偏振光可以是右旋或左旋的。示例糖氧基进一步包括但不限于葡糖基、葡糖醛酸基、半乳糖基、岩藻糖基、木糖基、阿拉伯糖基和鼠李糖基。
本文所用的术语“异戊二烯基基团”和“异戊二烯基”是指具有结构(LVI)的化学基团:
并且进一步包括具有以下结构的聚异戊二烯基化合物:
其中n为2或更大的整数,例如2、3、4、5等。此外,术语“异戊二烯基化合物”是指是、基本上是或具有反应性异戊二烯基基团(即可以被另一实体接收的异戊二烯基基团)的化学化合物。异戊二烯基化合物包括例如香叶基焦磷酸酯(GPP)、二甲基烯丙基二磷酸酯(DMAPP)、法尼基焦磷酸酯(FPP)和香叶基香叶基焦磷酸酯(GGPP)。
本文所用的术语“烷基”是指含有1至“p”个碳原子的直链和/或支链饱和烷基(“C1-Cp-烷基”),并且取决于“p”的特性,包括甲基、乙基、丙基、异丙基、正丁基、仲丁基、异丁基、叔丁基、2,2-二甲基丁基、正戊基、2-甲基戊基、3-甲基戊基、4-甲基戊基、正己基等,其中变量p是表示烷基中碳原子的最大数目的整数。烷基进一步包括排列成具有化学式-CnH2n+1的链的烃基,包括但不限于甲基(-CH3)、乙基(-C2H5)、丙基(-C3H7)和丁基(-C4H9),进一步还包括环状烷基,包括环丙烷、环丁烷、环戊烷、环己烷和环庚烷。
术语“环烷基”是指环状烷基,包括(C3-C20)环烷基、(C3-C10)环烷基和(C3-C6)环烷基,并且进一步包括环丙烷、环丁烷、环戊烷、环己烷和环庚烷。
本文所用的术语“O-烷基”是指排列成具有化学式-O-CnH2n+1的链的烃基。O-烷基包括但不限于O-甲基(-O-CH3)、O-乙基(-O-C2H5)、O-丙基(-O-C3H7)和O-丁基(-O-C4H9)。
本文所用的术语“芳基”是指排列成芳香环的烃基,并且可以是例如C6-C14-芳基、C6-C10-芳基。芳基进一步包括苯基、萘基、四氢萘基、菲基、联亚苯基、茚满基、甲苯基、二甲苯基或茚基等。
本文所用的术语“酰基”是指与氧双键连接且与烷基单键连接的碳原子。碳原子可以进一步键合至另一实体。酰基可以由以下化学式描述:-C(=O)-CnH2n+1
本文所用的术语“O-酰基”是指其中碳原子单键键合至附加氧原子的酰基。附加氧原子可以键合到另一实体上。O-酰基可以由以下化学式描述:-O-C(=O)-CnH2n+1。此外,取决于碳链,长度特定的O-酰基可称为乙酰氧基(n=1)、丙酰氧基(n=2)、丁酰氧基(n=3)、戊酰氧基(n=4)等。
本文所用的术语“醇基”或“羟烷基”是指排列成具有化学式CnHn+1OH的链的烃基。根据碳链,长度特定的醇基可称为甲醇基(n=1)或羟甲基、乙醇基(n=2)或羟乙基、丙醇基(n=3)或羟丙基、丁醇基(n=4)或羟丁基等。
本文所用的术语“5-HT2A受体”是指神经递质和外周信号介体血清素受体家族的亚类。5-HT2A受体可介导血清素的多种中枢和外周生理功能。中枢神经系统作用可以包括致幻化合物的致幻作用的介导。
本文所用的术语“调节5-HT2A受体”是指本文公开的化合物改变5-HT2A受体功能的能力。5-HT2A受体调节剂可以激活5-HT2A受体的活性,可以根据暴露于5-HT2A受体的化合物的浓度来激活或抑制5-HT2A受体的活性,或者可以抑制5-HT2A受体的活性。这种激活或抑制可能取决于特定事件的发生,例如信号转导途径的激活,和/或可能仅在特定细胞类型中显现。术语“调节5-HT2A受体”还指通过增加或降低在5-HT2A受体与天然结合配偶体之间形成复合物以形成多聚体的概率来改变5-HT2A受体的功能。5-HT2A受体调节剂可以增加在5-HT2A受体和天然结合配偶体之间形成这种复合物的概率,可以增加或降低在5-HT2A受体和天然结合配偶体之间形成复合物的概率,这取决于暴露于5-HT2A受体的化合物的浓度,和/或可以降低在5-HT2A受体与天然结合配偶体之间形成概率。还应注意的是,异戊二烯化裸盖菇素衍生物可以通过充当5-HT1A受体的激动剂或拮抗剂来改变5-HT2A受体的功能,并且根据本公开的异戊二烯化裸盖菇素衍生物可以通过与5-HT2A受体直接相互作用或与其结合、或通过一种或多种其它分子实体与其间接相互作用来改变5-HT2A受体的功能。
如本文所用,术语“5-HT2A受体介导的障碍”是指以异常5-HT2A受体活性为特征的障碍。5-HT2A受体介导的障碍可以完全或部分通过调节5-HT2A受体来介导。特别地,5-HT2A受体介导的障碍是其中5-HT2A受体的调节对潜在障碍产生一些影响的障碍,例如施用5-HT2A受体调节剂导致至少一些接受治疗的受试者的一些改善。
本文所用的术语“5-HT1A受体”是指神经递质和外周信号介体血清素受体家族的亚类。5-HT1A受体可以介导血清素的多种中枢和外周生理功能。5-HT1A的配体活性通常与幻觉无关,尽管许多致幻化合物已知可调节5-HT1A受体以赋予复杂的生理反应(Inserra etal.,2020,Pharmacol Rev 73:202)。
本文所用的术语“调节5-HT1A受体”是指本文公开的化合物改变5-HT1A受体功能的能力。5-HT1A受体调节剂可以激活5-HT1A受体的活性,可以根据暴露于5-HT1A受体的化合物的浓度来激活或抑制5-HT1A受体的活性,或者可以抑制5-HT1A受体的活性。这种激活或抑制可能取决于特定事件的发生,例如信号转导途径的激活,和/或可能仅在特定细胞类型中显现。术语“调节5-HT1A受体”还指通过增加或降低在5-HT1A受体与天然结合配偶体之间形成复合物以形成多聚体的概率来改变5-HT1A受体的功能。5-HT1A受体调节剂可以增加在5-HT1A受体和天然结合配偶体之间形成这种复合物的概率,可以增加或降低在5-HT1A受体和天然结合配偶体之间形成复合物的概率,具体取决于暴露于5-HT1A受体的化合物的浓度,和/或可以降低在5-HT1A受体和天然结合配偶体之间形成复合物的概率。还应注意的是,异戊二烯化裸盖菇素衍生物可以通过充当5-HT1A受体的激动剂或拮抗剂来改变5-HT1A受体的功能,并且根据本公开的异戊二烯化裸盖菇素衍生物可以通过与5-HT1A受体直接相互作用或与其结合、或通过一种或多种其它分子实体与其间接相互作用来改变5-HT1A受体的功能。
如本文所用的术语“5-HT1A受体介导的障碍”是指以异常5-HT1A受体活性为特征的障碍。5-HT1A受体介导的障碍可以完全或部分地通过调节5-HT1A受体介导。特别地,5-HT1A受体介导的障碍是其中5-HT1A受体的调节对潜在障碍产生一些影响的障碍,例如施用5-HT1A受体调节剂导致至少一些接受治疗的受试者的一些改善。
本文所用的术语“反应物裸盖菇素衍生化合物”是指能够在合成或生物合成反应中反应从而形成另一裸盖菇素衍生化合物的裸盖菇素衍生化合物,并且一般包括含有吲哚结构的反应物。术语“反应物裸盖菇素衍生化合物”包括术语“裸盖菇素衍生物前体化合物”。
本文所用的术语“裸盖菇素衍生物前体化合物”是指可以在多取代基裸盖菇素衍生物的合成或生物合成中充当前体化合物的化学化合物,并且包括包含吲哚原型结构的化合物,包括例如色氨酸和色胺,并且进一步包括具有式(LVII)的裸盖菇素衍生物前体化合物:
其中R2、R4、R5、R6或R7中的至少一个是选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,并且其中R3为氢原子或-CH2-CHNH2COOH或-CH2-CH2NH2
本文所用的术语“裸盖菇素生物合成酶补体”是指一种或多种多肽,其单独或一起能够促进裸盖菇素衍生物前体化合物的化学转化,并且形成多取代基裸盖菇素衍生化合物。裸盖菇素生物合成酶补体可以包括例如色氨酸合酶B多肽、色氨酸脱羧酶、N-乙酰基转移酶、N-甲基转移酶和异戊二烯基转移酶中的一种或多种。
本文所用的术语“色氨酸合酶B多肽”是指包含以下氨基酸残基序列的任何和所有酶,所述氨基酸残基序列(i)与构成本文所述的任何色氨酸合酶B多肽的氨基酸序列(包括例如SEQ.ID NO:2)基本同一,或(ii)由能够在至少中等严格条件下与编码本文所述任何色氨酸合酶B多肽的任何核酸序列杂交的核酸序列编码,但使用同义密码子。
本文所用的术语“色氨酸脱羧酶”是指包含以下氨基酸残基序列的任何和所有酶,所述氨基酸残基序列(i)与构成本文所述的任何色氨酸脱羧酶多肽的氨基酸序列(包括例如SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO:8)基本同一,或(ii)由能够在至少中等严格条件下与编码本文所述的任何色氨酸脱羧酶的任何核酸序列杂交的核酸序列编码,但使用同义密码子。
本文所用的术语“N-乙酰基转移酶”是指包含下述氨基酸残基序列的任何和所有酶,所述氨基酸残基序列(i)与构成本文所述的任何乙酰基转移酶多肽的氨基酸序列(包括例如SEQ.ID NO:10)基本同一,或(ii)由能够在至少中等严格条件下与编码本文所述的任何乙酰基转移酶的任何核酸序列杂交的核酸序列编码,但使用同义密码子。
本文所用的术语“N-甲基转移酶”是指包含以下氨基酸残基序列的任何和所有酶,所述氨基酸残基序列(i)与构成本文所述的任何N-甲基转移酶多肽的氨基酸序列(包括例如SEQ.ID NO:12和SEQ.ID NO:14)基本同一,或(ii)由能够在至少中等严格条件下与编码本文所述的任何N-甲基转移酶的任何核酸序列杂交的核酸序列编码,但使用同义密码子。
本文所用的术语“异戊二烯基转移酶”是指包含以下氨基酸残基序列的任何和所有酶,所述氨基酸残基序列(i)与构成本文所述的任何异戊二烯基转移酶多肽的氨基酸序列(包括例如SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO:22)基本同一,或(ii)由能够在至少中等严格条件下与编码本文所述的任何异戊二烯基转移酶的任何核酸序列杂交的核酸序列编码,但使用同义密码子。
如本文所用的术语“PsiH”是指包含以下氨基酸残基序列的任何和所有酶,所述氨基酸残基序列(i)与构成本文所述的任何PsiH多肽的氨基酸序列(包括例如SEQ.ID NO:24)基本同一,或(ii)由能够在至少中等严格条件下与编码本文所述的任何PsiH的任何核酸序列杂交的核酸序列编码,但使用同义密码子。
如本文所用的术语“CPR”是指包含以下氨基酸残基序列的任何和所有酶,所述氨基酸残基序列(i)与构成本文所述的任何CPR多肽的氨基酸序列(包括例如SEQ.ID NO:26)基本同一,或(ii)由能够在至少中等严格条件下与编码本文所述的任何CPR的任何核酸序列杂交的核酸序列编码,但使用同义密码子。
如本文所用的术语“PsiK”是指包含氨基酸残基序列的任何和所有酶,所述氨基酸残基序列(i)与构成本文所述的任何PsiK的氨基酸序列(包括例如SEQ.ID NO:49)基本同一,或(ii)由能够在至少中等严格条件下与编码本文所述的任何PsiK的任何核酸序列杂交的核酸序列编码,但使用同义密码子。
如本文中可互换使用的术语“编码色氨酸合酶B多肽的核酸序列”和“编码一种色氨酸合酶B多肽的核酸序列”是指编码色氨酸合酶B多肽的任何和所有核酸序列,包括例如SEQ.ID NO:1。编码色氨酸合酶B多肽的核酸序列进一步包括任何和所有核酸序列,该核酸序列:(i)编码与本文所述的色氨酸合酶B多肽序列基本同一的多肽;或(ii)在至少中等严格杂交条件下与本文所述的任何色氨酸合酶B多肽核酸序列杂交,或者在至少中等严格条件下但使用同义密码子可与其杂交。
在本文中可以互换使用的术语“编码色氨酸脱羧酶的核酸序列”和“编码色氨酸脱羧酶多肽的核酸序列”是指编码色氨酸脱羧酶多肽的任何和所有核酸序列,包括例如SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7。编码色氨酸脱羧酶多肽的核酸序列进一步包括任何和所有核酸序列,该核酸序列:(i)编码与本文所述的色氨酸脱羧酶多肽序列基本同一的多肽;或(ii)在至少中等严格杂交条件下与本文所述的任何色氨酸脱羧酶核酸序列杂交,或者在至少中等严格条件下但使用同义密码子可与其杂交。
在本文中可互换使用的术语“编码N-乙酰基转移酶的核酸序列”和“编码N-乙酰基转移酶多肽的核酸序列”是指编码N-乙酰基转移酶多肽的任何和所有核酸序列,包括例如SEQ.ID NO:9。编码N-乙酰基转移酶多肽的核酸序列进一步包括任何和所有核酸序列,该核酸序列:(i)编码与本文所述的N-乙酰基转移酶多肽序列基本同一的多肽;或(ii)在至少中等严格杂交条件下与本文所述的任何N-乙酰基转移酶核酸序列杂交,或在至少中等严格条件下但使用同义密码子可与其杂交。
在本文中可互换使用的术语“编码N-甲基转移酶的核酸序列”和“编码N-甲基转移酶多肽的核酸序列”是指编码N-甲基转移酶多肽的任何和所有核酸序列,包括例如SEQ.IDNO:11和SEQ.ID NO:13。编码N-甲基转移酶多肽的核酸序列进一步包括任何和所有核酸序列,该核酸序列:(i)编码与本文所述的N-甲基转移酶多肽序列基本同一的多肽;或(ii)在至少中等严格杂交条件下与本文所述的任何N-甲基转移酶核酸序列杂交,或在至少中等严格条件下但使用同义密码子可与其杂交。
在本文中可互换使用的术语“编码异戊二烯基转移酶的核酸序列”和“编码异戊二烯基转移酶多肽的核酸序列”是指编码异戊二烯基转移酶多肽的任何和所有核酸序列,包括例如SEQ.ID NO:15、SEQ.ID NO:17、SEQ.ID NO:19和SEQ.ID NO:21。编码异戊二烯基转移酶多肽的核酸序列进一步包括任何和所有核酸序列,该核酸序列:(i)编码与本文所述的异戊二烯基转移酶多肽序列基本同一的多肽;或(ii)在至少中等严格杂交条件下与本文所述的任何异戊二烯基转移酶核酸序列杂交,或者在至少中等严格条件下但使用同义密码子与其杂交。
在本文中可互换使用的术语“编码PsiH的核酸序列”和“编码PsiH多肽的核酸序列”是指编码PsiH的任何和所有核酸序列,包括例如SEQ.ID NO:23。编码PsiH多肽的核酸序列进一步包括任何和所有核酸序列,该核酸序列:(i)编码与本文所述的PsiH多肽序列基本同一的多肽;或(ii)在至少中等严格杂交条件下与本文所述的任何PsiH核酸序列杂交,或在至少中等严格条件下但使用同义密码子可与其杂交。
在本文中可以互换使用的术语“编码CPR的核酸序列”和“编码CPR多肽的核酸序列”是指编码CPR的任何和所有核酸序列,包括例如SEQ.ID NO:25。编码CPR多肽的核酸序列进一步包括任何和所有核酸序列,该核酸序列:(i)编码与本文所述的CPR多肽序列基本同一的多肽;或(ii)在至少中等严格杂交条件下与本文所述的任何CPR核酸序列杂交,或者在至少中等严格条件下但使用同义密码子可与其杂交。
在本文中可以互换使用的术语“编码PsiK的核酸序列”和“编码PsiK多肽的核酸序列”是指编码PsiK的任何和所有核酸序列,包括例如SEQ.ID NO:48。编码PsiK的核酸序列进一步包括任何和所有核酸序列,该核酸序列:(i)编码与本文所述的PsiK多肽序列基本同一的多肽;或(ii)在至少中等严格杂交条件下与本文所述的任何PsiK核酸序列杂交,或者在至少中等严格条件下但使用同义密码子可与其杂交。
如本文所用的术语“核酸”或“核酸序列”是指由天然存在的碱基、糖和糖间(主链)键组成的核苷或核苷酸单体的序列。该术语还包括包含非天然存在的单体或其部分的修饰或取代的序列。本公开的核酸可以是脱氧核糖核酸(DNA)或核糖核酸(RNA),并且可以包括天然存在的碱基,包括腺嘌呤、鸟嘌呤、胞嘧啶、胸苷和尿嘧啶。核酸还可以含有修饰的碱基。此类修饰碱基的示例包括氮杂和脱氮腺嘌呤、鸟嘌呤、胞嘧啶、胸苷和尿嘧啶、以及黄嘌呤和次黄嘌呤。核苷酸或核苷单体的序列可以称为多核苷酸序列、核酸序列、核苷酸序列或核苷序列。
本文中与参考SEQ.ID NO结合使用的术语“多肽”是指包含氨基酸残基序列的任何和所有多肽,所述氨基酸残基序列(i)与构成具有该参考SEQ.ID NO的多肽的氨基酸序列基本同一,或(ii)由能够在至少中等严格条件下与编码具有此参考SEQ.ID NO的多肽的任何核酸序列杂交的核酸序列编码,但使用同义密码子。氨基酸残基的序列可以称为氨基酸序列或多肽序列。
如本文与参考SEQ.ID NO结合使用的术语“编码多肽的核酸序列”是指编码具有此参考SEQ.ID NO的多肽的任何和所有核酸序列。编码连同参考SEQ.ID NO的多肽的核酸序列进一步包括任何和所有核酸序列,该核酸序列:(i)编码与具有此参考SEQ.ID NO的多肽基本同一的多肽;或(ii)在至少中等严格杂交条件下与编码具有此参考SEQ.ID NO的多肽的任何核酸序列杂交,或者在至少中等严格条件下但使用同义密码子可与其杂交。
术语“基本同一”是指两个氨基酸序列优选至少70%同一,并且更优选至少85%同一,且最优选至少95%同一,例如96%、97%、98%或99%同一。为了确定两个氨基酸序列之间的同一性百分比,使用例如Smith和Waterman(Adv.Appl.Math.,1981,2:482)修订的Needleman和Wunsch(J.Mol.Biol.,1970,48:443)的对比方法将该两个序列的氨基酸序列对齐,从而在该两个序列之间获得最高阶匹配,并确定该两个序列之间相同氨基酸的数量。计算两个氨基酸序列之间的百分比同一性的方法通常是本领域公认的,并且包括例如Carillo和Lipton(SIAM J.Applied Math.,1988,48:1073)描述的那些方法和Computational Molecular Biology,Lesk,e.d.Oxford University Press,New York,1988,Biocomputing:Informatics and Genomics Projects中描述的那些方法。通常,可以采用计算机程序进行此类计算。在这方面可以使用的计算机程序包括但不限于GCG(Devereux et al.,Nucleic Acids Res.,1984,12:387)BLASTP、BLASTN和FASTA(Altschulet al.,J.Mol.Biol.,1990:215:403)。用于确定两个多肽之间的百分比同一性的特别优选的方法涉及Clustal W算法(Thompson,J D,Higgines,D G和Gibson T J,1994,NucleicAcid Res 22(22):4673-4680)以及BLOSUM 62评分矩阵(Henikoff S&Henikoff,J G,1992,Proc.Natl.Acad.Sci.USA 89:10915-10919),使用10的空位开放罚分和0.1的空位延伸罚分,使得在两个序列之间获得最高阶匹配,其中两个序列之一的总长度的至少50%参与比对。
“至少中等严格杂交条件”是指选择的促进溶液中两个互补核酸分子之间的选择性杂交的条件。杂交可以发生在全部或部分核酸序列分子上。杂交部分的长度通常至少为15(例如20、25、30、40或50)个核苷酸。本领域技术人员将认识到,核酸双链体或杂交体的稳定性由Tm决定,其在含钠缓冲液中是钠离子浓度和温度的函数(Tm=81.5℃.-16.6(Log10[Na+])+0.41(%(G+C)-600/l)或类似方程)。因此,决定杂交稳定性的洗涤条件中的参数是钠离子浓度和温度。为了鉴别与已知核酸分子相似但不同一的分子,可以假设1%错配导致Tm约1℃降低,例如如果寻找具有>95%同一性的核酸分子,最终洗涤温度将降低约5℃。基于这些考虑,本领域技术人员将能够容易地选择合适的杂交条件。在优选的实施方式中,选择严格的杂交条件。举例来说,可以采用以下条件来实现严格杂交:在5×氯化钠/柠檬酸钠(SSC)/5×Denhardt溶液/1.0%SDS下在Tm(基于以上方程)-5℃下杂交,然后在60℃下用0.2×SSC/0.1%SDS洗涤。中等严格杂交条件包括在42℃下在3×SSC中的洗涤步骤。然而,应当理解的是,使用替代缓冲液、盐和温度可以实现同等严格性。有关杂交条件的其它指南可参见:Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.,1989,6.3.1.-6.3.6和Sambrook et al.,Molecular Cloning,a Laboratory Manual,ColdSpring Harbor Laboratory Press,1989,Vol.3。
如本文所用,关于多核苷酸或多肽的术语“功能变体”是指能够执行与所提及的参考多核苷酸或多肽相同的功能的多核苷酸或多肽。因此,例如,SEQ.ID NO:2中所示的多肽的功能变体是指能够执行与SEQ.ID NO:2中所示的多肽相同功能的多肽。功能变体包括修饰的多肽,其中相对于所提及的参考多肽,修饰包括取代、缺失或添加一个或多个氨基酸。在一些实施方式中,取代是导致一个氨基酸被具有相似特性的氨基酸替换的那些取代。此类取代包括但不限于(i)谷氨酸和天冬氨酸;(i)丙氨酸、丝氨酸和苏氨酸;(iii)异亮氨酸、亮氨酸和缬氨酸,(iv)天冬酰胺和谷氨酰胺,以及(v)色氨酸、酪氨酸和苯丙氨酸。功能变体进一步包括保留或表现出增强的裸盖菇素生物合成生物活性的多肽。
本文在核酸上下文中使用的术语“嵌合”是指非天然连接的至少两个连接的核酸。嵌合核酸包括不同天然来源的连接的核酸。例如,构成与编码植物多肽的核酸连接的微生物启动子的核酸被认为是嵌合的。嵌合核酸还可以包含相同天然来源的核酸,前提条件是它们不是天然连接的。例如,从特定细胞类型获得的构成启动子的核酸可以与从该相同细胞类型获得的编码多肽的核酸连接,但通常不与构成启动子的核酸连接。嵌合核酸还包括包含与任何非天然存在的核酸连接的任何天然存在的核酸的核酸。
本文所用的术语“药物制剂”是指这样形式的制品,该制品允许其中含的活性成分(包括精神活性成分)提供有效治疗,并且其不含有任何引起过度毒性、过敏反应、刺激或其它与合理的风险/效益比相称的不良反应的其它成分。药物制剂可以含有其它药物成分,诸如赋形剂、载体、稀释剂或辅助剂。
本文所用的术语“娱乐性药品制剂”是指这样形式的制品,该形式使得其中所含的精神活性成分能够有效地作为娱乐性药品施用,并且不含有任何引起过度毒性、过敏反应、刺激或其它与合理的风险/效益比相称的不良反应的其它成分。娱乐性药品制剂可以含有其它成分,诸如赋形剂、载体、稀释剂或辅助剂。
如本文所用的术语“作为娱乐性药品施用有效”是指这样形式的制品,该形式在施用后允许受试者自愿诱导用于非医疗目的的精神作用,通常以自我施用的形式。效果可以包括改变意识、满足、快乐、欣快感、知觉扭曲或幻觉的状态。
本文所用的术语“有效量”是指活性剂、药物制剂或娱乐性药品制剂的量,其足以诱导期望的生物或治疗效果,包括预防效果,并且进一步包括精神活性效果。这样的效果可以包括关于障碍、或疾病或生物系统的任何其它所需改变的体征、症状或原因的效果。有效量可以根据例如接受治疗的受试者的健康状况、损伤阶段、障碍阶段或疾病阶段、体重或性别、施用时间、施用方式、受试者的年龄等而变化,所有这些都可以由本领域技术人员确定。
本文所用的术语“治疗(treating)”和“治疗(treatment)”等旨在表示获得期望的生理学、药理学或生物学效果,并且包括预防性和治疗性治疗。该效果可以导致可归因于障碍或疾病(包括智力和精神疾病和障碍)的障碍或疾病的体征、症状或原因的抑制、减弱、改善或逆转。预防或治疗的临床证据可随障碍或疾病、受试者和所选治疗而变化。
本文所用的术语“药学上可接受的”是指可与药物或娱乐性药品制剂中的其它材料相容的材料,包括赋形剂、载体、稀释剂或辅助剂,并且该材料在合理医学判断范围内用于与受试者接触时,而没有过度毒性、过敏反应、刺激或其它与合理风险/效益比相称的不良反应。
在本文中可以互换使用的术语“基本上纯的”和“分离的”描述了与其天然伴随的组分分离的化合物,例如裸盖菇素衍生物。通常,当样品中的总材料(按体积、按湿重或干重、或按摩尔百分比或摩尔分数)的至少60%、更优选至少75%、更优选至少90%、95%、96%、97%或98%且最优选至少99%为目的化合物时,该化合物基本上是纯的。可以通过任何适当的方法测量纯度,例如通过色谱法、凝胶电泳或HPLC分析。
如本文与酶、蛋白质或化学化合物关联使用的术语“回收的”是指基本纯净形式的酶、蛋白质或化学化合物。
本文关于一种制备多取代基裸盖菇素衍生化合物的方法所用的术语“体内”涉及这样一种方法,该方法包括使裸盖菇素衍生物前体化合物与能够在细胞内(例如在例如生长培养基中培养的细胞或微生物内)转化裸盖菇素衍生物前体化合物的酶接触,以将该裸盖菇素衍生物前体化合物转化为多取代基裸盖菇素衍生化合物。所述细胞通常表达裸盖菇素生物合成酶复合物,包括例如异源表达的色氨酸合酶B多肽、色氨酸脱羧酶、N-乙酰基转移酶、N-甲基转移酶和异戊二烯基转移酶。
本文关于一种制备多取代基裸盖菇素衍生化合物的方法所用的术语“体外”涉及这样一种方法,该方法包括使裸盖菇素衍生物前体化合物与能够在细胞外(例如在微孔板、管、烧瓶、烧杯、槽、反应器等中)转化裸盖菇素衍生物前体的酶接触,以将该裸盖菇素衍生物前体化合物转化为多取代基裸盖菇素衍生化合物。
一般实现方式
如上文所述,本公开涉及裸盖菇素衍生物。特别地,本公开提供了新的多取代基裸盖菇素衍生物。一般而言,本文提供的组合物表现出与裸盖菇素的功能特性不同的功能特性。因此,例如,多取代基裸盖菇素衍生物可以表现出不同于裸盖菇素的药理学特性。此外,多取代基衍生物可以表现出与裸盖菇素不同的物理化学性质。因此,例如,多取代基裸盖菇素衍生物可以在溶剂(例如水性溶剂)中表现出优异的溶解性。多取代基裸盖菇素衍生物在这方面对于药物和娱乐性药品制剂的配制是有用的。在一个实施方式中,本公开的多取代基裸盖菇素衍生物可以方便地通过化学和/或生物合成方法生产。该方法的实施避免了从蘑菇中提取裸盖菇素以及进行后续化学反应以获得多取代基衍生物。此外,可以避免蘑菇的生长,从而限制对气候和天气的依赖,以及与种植含有精神活性化合物的蘑菇相关的潜在法律和社会挑战。该方法可以有效地产生大量的多取代基裸盖菇素衍生物。
下面参考附图描述所选择的实施方式。
首先将描述示例多取代基裸盖菇素衍生物。此后将描述使用和制备多取代基裸盖菇素衍生物的示例方法。
因此,在一方面,本公开提供了称为裸盖菇素的化合物的衍生物,其化学结构如图1所示。本文提供的衍生物特别是多取代基衍生物,包括具有两个或更多个取代基实体的裸盖菇素衍生物。
因此,在一方面,根据本文的教导,在至少一个实施方式中,本公开提供了一种具有式(I)的化学化合物:
其中,R2、R4、R5、R6或R7中的至少两个是独立地选自以下中的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基。
因此,参考具有式(I)的化学化合物,首先注意到,在其一个方面,R2、R4、R5、R6或R7中的至少两个是选自以下中的至少两种的取代基实体:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。因此,应当理解的是,根据本公开的一个方面,R2、R4、R5、R6或R7中的至少两个是取代基实体。该取代基实体各自独立地选自(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且在选择两个(但不超过两个)取代基实体时,它们是不相同的,并且在选择三个或更多个取代基实体时,所选择的取代基实体中的至少两个是不相同的。
在其一个方面,在一个实施方式中,R2、R4、R5、R6或R7中的至少三个可以是从下列的至少两种中选择的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
在其一个方面,在一个实施方式中,R2、R4、R5、R6或R7中的至少三个可以是从下列的至少三种中选择的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
继续参考具有式(I)的化学化合物,在其进一步方面,R4可以是磷酸酯基或氢原子。
继续参考具有式(I)的化学化合物,在其进一步方面,R3a和R3b可以是氢原子、烷基、酰基或芳基。因此,R3a和R3b各自可以是氢原子,或R3a和R3b各自可以是烷基,诸如甲基、乙基、丙基或更长链的烷基,或R3a和R3b可以各自是酰基,或R3a和R3b各自可以是芳基。此外,R3a和R3b之一可以是氢原子,并且R3a和R3b之一可以是烷基。R3a和R3b之一可以是氢原子,并且R3a和R3b之一可以是酰基。R3a和R3b之一可以是氢原子,并且R3a和R3b之一可以是芳基。R3a和R3b之一可以是烷基,并且R3a和R3b之一可以是芳基。R3a和R3b之一可以是烷基,并且R3a和R3b之一可以是酰基。R3a和R3b之一可以是酰基,并且R3a和R3b之一可以是芳基。
继续参考具有式(I)的化学化合物,在其进一步方面,每个未取代的基团R2、R5、R6或R7可以是氢原子。此外,如上所述,R4也可以是氢原子。
根据本文公开,在一方面,多取代基裸盖菇素衍生物包括两个或三个取代基。接下来将参考选定的附图来讨论这些每一个的示例。特别地,通过参考图3A-3L讨论了包括包含两个取代基的多取代基裸盖菇素衍生物在内的示例;并且通过参考图4A-4I、5A-5I、6A-6I和7A-7I讨论了包括三个取代基的多取代基裸盖菇素的示例。为了清楚起见,应注意的是,在这些图的每一个中,诸如S15、S25和S17等符号分别表示在5位(C5)处的第一取代基S1、在5位(C5)处的第二取代基S2和在7位(C7)处的第一取代基S1。类似地,在某些图中,相同化学化合物内的符号,诸如S22和S26,例如表示在该化合物的2位(C2)处的第二取代基S2和在6位(C6)处的相同第二取代基(参见:例如图6I)。
因此,接下来参考图3A-3L,其中R2、R5、R6或R7中的两个是取代基的根据本文的多取代基裸盖菇素衍生物的示例是:图3A中描绘的2,5-二-S1,S2-裸盖菇素衍生物、图3B中描绘的2,5-二-S2,S1-裸盖菇素衍生物、图3C中描绘的2,6-二-S1,S2-裸盖菇素衍生物、图3D中描绘的2,6-二-S2,S1-裸盖菇素衍生物、图3E中描绘的2,7-二-S1,S2-裸盖菇素衍生物、图3F中描绘的2,7-二-S2,S1-裸盖菇素衍生物、图3G中描绘的5,6-二-S1,S2-裸盖菇素衍生物、图3H中描绘的5,6-二-S2,S1-裸盖菇素衍生物、图3I中描绘的5,7-二-S1,S2-裸盖菇素衍生物、图3J中描绘的5,7-二-S2,S1-裸盖菇素衍生物、图3K中描绘的6,7-二-S1,S2-裸盖菇素衍生物以及图3L中描绘的6,7-二-S2,S1-裸盖菇素衍生物。如从前述内容可以清楚地看出,在图3A-3L的每个中,S1和S2选自下列中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
因此,例如,参考具有式(I)的化学化合物,在一个示例实施方式中,R4、R5、R6或R7中的两个可以是取代基,其之一可以选自(i)卤素原子、(ii)异戊二烯基和(iii)腈基,并且R4、R5、R6或R7之一可以是选自(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基中的取代基,但条件是该两个取代基不同,并且R2和未取代的R4、R5、R6和R7是氢原子。因此,在此类示例实施方式中,参考图3A-3L,S1可以选自(i)卤素原子、(ii)异戊二烯基和(iii)腈基,并且S2可以选自(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,或者相反,S2可以选自(i)卤素原子、(ii)异戊二烯基和(iii)腈基,并且S1可以是选自(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛基或酮基、(viii)异戊二烯基和(ix)腈基。
因此,例如,参考具有式(I)的化学化合物,在进一步示例实施方式中,R4、R5、R6或R7中的两个可以是取代基,其之一是卤素原子,并且R4、R5、R6或R7之一可以是选自(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物、(vi)醛或酮基、(vii)异戊二烯基和(viii)腈基中的取代基,并且R2和未取代的R4、R5、R6和R7是氢原子。因此,在此类示例实施方式中,参考图3A-3L,S1可以是卤素原子,并且S2可以选自(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物、(vi)醛或酮基、(vii)异戊二烯基和(viii)腈基,或者相反,S2可以是卤素原子,并且S1可以是(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物、(vi)醛或酮基、(vii)异戊二烯基和(viii)腈基。
因此,例如,参考具有式(I)的化学化合物,在进一步示例实施方式中,R4、R5、R6或R7中的两个可以是取代基,其之一是卤素原子,并且R4、R5、R6或R7之一可以是选自(i)氨基、(ii)腈基、(iii)硝基、(iv)羟基和(vii)异戊二烯基中的取代基,并且R2和未取代的R4、R5、R6和R7是氢原子。因此,在此类示例实施方式中,参考图3A-3L,S1可以是卤素原子,并且S2可以选自(i)氨基、(ii)腈基、(iii)硝基、(iv)羟基和(vii)异戊二烯基,或者相反,S2可以是卤素原子,并且S1可以是(i)氨基、(ii)腈基、(iii)硝基、(iv)羟基和(v)异戊二烯基。
因此,例如,参考具有式(I)的化学化合物,在进一步示例实施方式中,R4、R5、R6或R7中的两个可以是取代基,其之一是卤素原子,并且R4、R5、R6或R7之一可以是异戊二烯基,并且R2和未取代的R4、R5、R6和R7是氢原子。因此,在此类示例实施方式中,参考图3A-3L,S1可以是卤素原子,并且S2可以是异戊二烯基,或者相反,S2可以是异戊二烯基,并且S1可以是卤素原子。
因此,例如,参考具有式(I)的化学化合物,在进一步示例实施方式中,R4、R5、R6或R7中的两个可以是取代基,其之一是异戊二烯基,并且R4、R5、R6或R7之一可以是从(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物、(vi)醛或酮基、(vii)卤素原子和(viii)腈基中选择的取代基,并且R2和未取代的R4、R5、R6和R7是氢原子。因此,在此类示例实施方式中,参考图3A-3L,S1可以是异戊二烯基,并且S2可以选自(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物、(vi)醛或酮基、(vii)卤素原子和(viii)腈基,或者相反,S2可以是异戊二烯基,并且S1可以是(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物、(vi)醛或酮基、(vii)卤素原子和(viii)腈基。
因此,例如,参考具有式(I)的化学化合物,在进一步示例实施方式中,R4、R5、R6或R7中的两个可以是取代基,其之一是异戊二烯基,并且R4、R5、R6或R7之一可以是从(i)羧基或羧酸衍生物、(ii)卤素原子和(iii)羟基中选择的取代基,并且R2和未取代的R4、R5、R6和R7是氢原子。因此,在此类示例实施方式中,参考图3A-3L,S1可以是异戊二烯基,并且S2可以选自(i)羧基或羧酸衍生物、(ii)卤素原子和(iii)羟基,或者相反,S2可以是异戊二烯基,并且S1可以是(i)羧基或羧酸衍生物、(ii)卤素原子和(iii)羟基。
因此,例如,参考具有式(I)的化学化合物,在进一步示例实施方式中,R4、R5、R6或R7中的两个可以是取代基,其之一是腈基,并且R4、R5、R6或R7之一可以是从(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物、(vi)醛或酮基、(vii)异戊二烯基和(viii)卤素原子中选择的取代基,并且R2和未取代的R4、R5、R6和R7是氢原子。因此,在此类示例实施方式中,参考图3A-3L,S1可以是腈基,并且S2可以选自(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物、(vi)醛或酮基、(vii)异戊二烯基和(viii)卤素原子,或者相反,S2可以是腈基,并且S1可以是(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物、(vi)醛或酮基、(vii)异戊二烯基和(viii)卤素原子。
因此,例如,参考具有式(I)的化学化合物,在进一步示例实施方式中,R4、R5、R6或R7中的两个可以是取代基,其之一是腈基,并且R4、R5、R6或R7之一可以是氨基或N-取代的氨基,并且R2和未取代的R4、R5、R6和R7是氢原子。因此,在此类示例实施方式中,参考图3A-3L,S1可以是腈基,并且S2可以是氨基或N-取代的氨基,反之,S2可以是腈基,并且S1可以是氨基或N-取代的氨基。
现在转向包括三个取代基的多取代基裸盖菇素衍生物,并参考图4A-4F、4G-4I、5A-5F、5G-5I、6A-6F、6G-6I、7A-7F、7G-7I,其中所示为根据本文的多取代基裸盖菇素衍生物的示例,其中R2、R5、R6或R7中的三个是取代基。应当注意的是,在图4A-4F、5A-5F、6A-6F、6G-6I和7A-7F所示的示例中,三个取代基是三个不同的取代基S1、S2、S3。在图4G-4I、5G-5I、6G-6I和7G-7I所示的示例中,选择三个取代基使得该三个取代基中的两个相同,即S1、S2、S2。在这方面的示例特别是:图4A所示的2,5,6-三-S1,S2,S3-裸盖菇素衍生物、图4B所示的2,5,6-三-S1,S3,S2-裸盖菇素衍生物、图4C所示的2,5,6-三-S3,S1,S2-裸盖菇素衍生物、图4D所示的2,5,6-三-S2,S1,S3-裸盖菇素衍生物、图4E所示的2,5,6-三-S3,S2,S1-裸盖菇素衍生物和2,5,6-三-S2,S3,S1-裸盖菇素衍生物(图4F)。从前述内容可以清楚地看出,在图4A-4F的每个中,S1、S2和S3选自以下中的三个:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
图4G、4H和4I示出了其中R2、R5、R6或R7中的三个为取代基的进一步示例,特别是图4G所示的2,5,6-三-S1,S2,S2-裸盖菇素衍生物、图4H所示的2,5,6-三-S2,S1,S2-裸盖菇素衍生物和图4I所示的2,5,6-三-S2,S2,S1-裸盖菇素衍生物。从前述内容可以清楚地看出,在图4G-4I的每个中,S1和S2选自下列中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
图5A、5B、5C、5D、5E和5F示出了其中R2、R5、R6或R7中的三个是取代基的进一步示例,特别是图5A所示的2,5,7-三-S1,S2,S3-裸盖菇素衍生物、图5B所示的2,5,7-三-S1,S3,S2-裸盖菇素衍生物、图5C所示的2,5,7-三-S3,S1,S2-裸盖菇素衍生物、图5D所示的2,5,7-三-S2,S1,S3-裸盖菇素衍生物、图5E所示的2,5,7-三-S3,S2,S1-裸盖菇素衍生物和图5F所示的2,5,7-三-S2,S3,S1-裸盖菇素衍生物。从前述内容可以清楚地看出,在图5A-5I的每一个中,S1、S2和S3选自以下中的三种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
图5G、5H和5I示出了其中R2、R5、R6或R7中的三个是取代基的进一步示例,特别是图5G所示的2,5,7-三-S1,S2,S2-裸盖菇素衍生物、图5H所示的2,5,7-三-S2,S1,S2-裸盖菇素衍生物和图5I所示的2,5,7-三-S2,S2,S1-裸盖菇素衍生物。从前述内容可以清楚地看出,在图5G-5I的每个中,S1和S2选自下列中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
图6A、6B、6C、6D、6E和6F示出了其中R2、R5、R6或R7中的三个是取代基的进一步示例,特别是图6A所示的2,6,7-三-S1,S2,S3-裸盖菇素衍生物、图6B所示的2,6,7-三-S1,S3,S2-裸盖菇素衍生物、图6C所示的2,6,7-三-S3,S1,S2-裸盖菇素衍生物、图6D所示的2,6,7-三-S2,S1,S3-裸盖菇素衍生物、图6E所示的2,6,7-三-S3,S2,S1-裸盖菇素衍生物和2,6,7-三-S2,S3,S1-裸盖菇素衍生物(图6F)。从前述内容可以清楚地看出,在图6A-6F中,S1、S2和S3选自下列中的三种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
图6G、6H和6I示出了其中R2、R5、R6或R7中的三个是取代基的进一步示例,特别是图6G所示的2,6,7-三-S1,S2,S2-裸盖菇素衍生物、图6H所示的2,6,7-三-S2,S1,S2-裸盖菇素衍生物和图6I所示的2,6,7-三-S2,S2,S1-裸盖菇素衍生物。从前述内容可以清楚地看出,在图6A-6I中,S1和S2选自下列中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix腈基。
图7A、7B、7C、7D、7E和7F示出了其中R2、R5、R6或R7中的三个是取代基的进一步示例,特别是图7A所示的5,6,7-三-S1,S2,S3-裸盖菇素衍生物、图7B所示的5,6,7-三-S1,S3,S2-裸盖菇素衍生物、图7C所示的5,6,7-三-S3,S1,S2-裸盖菇素衍生物、图7D所示的5,6,7-三-S2,S1,S3-裸盖菇素衍生物、图7E所示的5,6,7-三-S3,S2,S1-裸盖菇素衍生物和图7F所示的5,6,7-三-S2,S3,S1-裸盖菇素衍生物。从前述内容可以清楚地看出,在图7A-7F中,S1、S2和S3选自以下中的三种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
图7G、7H和7I示出了其中R2、R5、R6或R7中的三个是取代基的又进一步示例,特别是图7G所示的5,6,7-三-S1,S2,S2-裸盖菇素衍生物、图7H所示的5,6,7-三-S2,S1,S2-裸盖菇素衍生物和图7I所示的5,6,7-三-S2,S2,S1-裸盖菇素衍生物。从前述内容可以清楚看出,在图7G-7I的每一个中,S1和S2选自下列中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
此外,在图3A-3L、4A-4I、5A-5I、6A-6I和7A-7I所示的每个示例实施方式中,值得注意的是,R3a和R3b可以是氢原子、烷基、酰基或芳基。因此,R3a和R3b可以各自为氢原子,或者R3a和R3b可以各自为烷基,例如甲基、乙基、丙基或更长链的烷基,或者R3a和R3b可以各自为酰基,或者R3a和R3b可以各自为芳基。此外,R3a和R3b之一可以是氢原子,并且R3a和R3b之一可以是烷基。R3A和R3B之一可以是氢原子,并且R3a和R3b之一可以是酰基。R3a和R3b之一可以是氢原子,并且R3a和R3b之一可以是芳基。R3a和R3b之一可以是烷基,并且R3A和R3B之一可以是芳基。R3a和R3b之一可以是烷基,并且R3a和R3b之一可以是酰基。R3a和R3b之一可以是酰基,并且R3a和R3b之一可以是芳基。
应当注意的是,在其进一步方面,在图3A-3L、4A-4I、5A-5I、6A-6I和7A-7I所示的每个示例实施方式中,R3c可以是氢原子或羧基。
应当注意的是,在其进一步方面,在图3A-3L、4A-4I、5A-5I、6A-6I和7A-7I所示的每个示例实施方式中,R4可以是氢原子、O-烷基、O-酰基或磷酸酯基。
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(IX)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(X)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XI)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XIII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XIV)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XV)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XV)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XVII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XVIII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XIX)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XX)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXI)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXIII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXIV)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXV)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XVI)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXVII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXVIII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXIX)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXX)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXXI)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXXII)的化学化合物:
/>
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXXIII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXXIV)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXXV)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXXVI)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXXVII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXXVIII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XXXIX)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XL)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XLI)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XLII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XLIII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XLIV)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XLV)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XLVI)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XLVII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XLVIII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(XLIX)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(L)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(LI)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(LII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(LIII)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(LIV)的化学化合物:
/>
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(LV)的化学化合物:
此外,在一个示例实施方式中,根据本公开的多取代基裸盖菇素衍生物可以是具有式(LXXVI)的化学化合物:
此外,应当注意的是,本公开的多取代基裸盖菇素衍生物包括其盐,包括药学上可接受的盐。因此,从C3原子依次延伸的乙基-氨基的氮原子可以被质子化,并且正电荷可以通过例如氯离子或硫酸根离子平衡,从而形成氯化物盐或硫酸盐。此外,在其中R4是磷酸酯基的化合物中,磷酸酯基可以被去质子化,并且负电荷可以通过例如钠离子或钾离子平衡,从而形成钠盐或钾盐。
此外,应当注意的是,当R4是磷酸酯基时,术语异戊二烯化裸盖菇素衍生物还包括具有式(IV)的化合物:
其中,R2、R5、R6或R7中的至少两个是从下列的至少两种中独立选择的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7为氢原子,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基。当R3c是羧基时,进一步包括具有式(Iva)的化合物:
进一步包括具有式(IV)和(IVa)的异戊二烯化裸盖菇素衍生物的盐,例如钠盐、钾盐等。
因此,简要回顾一下,本公开提供了多取代基裸盖菇素衍生物。本公开特别地提供一种具有式(I)的化学化合物:
其中,R2、R4、R5、R6或R7中的至少两个是从下列的至少两种中独立选择的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基。
在另一个实施方式中,R3a和R3b为氢原子、(C1-C20)-烷基、(C6-C14)-芳基或-C(=O)(C1-C20)-烷基。在另一个实施方式中,R3a和R3b为氢原子、(C1-C10)-烷基、(C6-C10)-芳基或-C(=O)(C1-C10)-烷基。在另一个实施方式中,R3a和R3b为氢原子、(C1-C6)-烷基、苯基或-C(=O)(C1-C6)-烷基。在另一个实施方式中,R3a和R3b为氢原子、甲基、乙基、丙基、苯基、-C(=O)-CH3、-C(=O)-CH2CH3或-C(=O)-CH2CH2CH3
在另一个实施方式中,R3a和/或R3b为(C1-C20)-环烷基、或(C1-C10)-环烷基、(C1-C10)-环烷基或(C1-C10)-环烷基。在一个实施方式中,R3a和/或R3b为环丙烷基团、环丁烷基团、环戊烷基团或环己烷基团。
在一个实施方式中,本公开的式的任何定义中的烷基(包括O-烷基)是C1-C20-烷基。在另一个实施方式中,烷基是C1-C10-烷基。在另一个实施方式中,烷基是C1-C6-烷基。在另一个实施方式中,烷基是甲基、乙基、丙基、丁基或戊基。
在一个实施方式中,本公开的式的任何定义中的酰基(包括O-酰基)是C1-C20-酰基(或C1-C20-酰基-O-)。在另一个实施方式中,烷基是C1-C10-酰基(或C1-C10-酰基-O-)。在另一个实施方式中,烷基是C1-C6-酰基(或C1-C6-酰基-O-)。在另一个实施方式中,酰基是O-酰基、甲酰基、乙酰基、丙酰基、丁酰基或戊酰基。
在一个实施方式中,本公开的式的任何定义中的芳基是任选取代的C6-C14-芳基。在另一个实施方式中,芳基是任选取代的C6-C10-芳基或苯基。在另一个实施方式中,芳基是苯基、萘基、四氢萘基、菲基、亚联苯基、茚满基或茚基等。
本公开的多取代基裸盖菇素衍生物可用于制备药物或娱乐性药品制剂。因此,在一个实施方式中,本公开在另一方面进一步提供了包含多取代基裸盖菇素衍生物的药物和娱乐性药品制剂。因此,在一方面,本公开在进一步实施方式中提供了一种药物或娱乐性药品制剂,其包含具有式(I)的化学化合物:
其中,R2、R4、R5、R6或R7中的至少两个是从下列的至少两种中独立选择的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基。
药物或娱乐性药品制剂可以制备成液体、片剂、胶囊、微胶囊、纳米胶囊、透皮贴剂、凝胶、泡沫、油、气雾剂、纳米颗粒、粉末、乳膏、乳液、胶束系统、薄膜、喷雾剂、胚珠、输液、茶、煎剂、栓剂等,并且包括硝化裸盖菇素化合物的药学上可接受的盐或溶剂化物以及赋形剂。本文使用的术语“赋形剂”是指除本公开的化学化合物之外的任何成分。如本领域技术人员容易理解的,赋形剂的选择可以取决于多种因素,例如特定的施用模式、赋形剂对本公开的化学化合物的溶解性的影响以及它们的制备方法,这对于本领域技术人员来说是显而易见的。此类组合物及其制备方法可以在例如“Remington’s PharmaceuticalSciences”,22nd Edition(Pharmaceutical Press and Philadelphia College ofPharmacy at the University of the Sciences,2012)中找到。
当使用本公开的化合物时,剂量可以在宽范围内变化,并且如惯例并且是本领域技术人员已知的,可以根据每个个体情况中的个体条件调整剂量。剂量取决于例如待治疗的疾病的性质和严重程度、患者的状况、所用的化合物或是否治疗急性或慢性疾病状态、或进行预防、化合物的递送模式、或除了本公开的化合物之外是否施用其它活性化合物。本发明的代表性剂量包括但不限于约0.001mg至约5000mg、约0.001mg至约2500mg、约0.001mg至约1000mg、约0.001mg至约500mg、约0.001mg至约250mg、约0.001mg至约100mg、约0.001mg至约50mg和约0.001mg至约25mg。本公开的代表性剂量包括但不限于约0.0001至约1,000mg、约10至约160mg、约10mg、约20mg、约40mg、约80mg或约160mg。可以在一天中施用多次剂量,尤其是当认为需要相对大量时,例如2、3或4剂。根据受试者以及患者的医生或护理人员认为合适的意见,可能有必要向上或向下偏离本文所述的剂量。
包含本公开的多取代基裸盖菇素衍生物的药物和药品制剂可以口服施用。口服施用可以涉及吞咽,从而使化合物进入胃肠道,或者可以采用口腔或舌下施用,其中化合物直接从口腔进入血流。适合口服施用的制剂包括固体制剂和液体制剂。
固体制剂包括片剂、胶囊(含有颗粒、液体、微胶囊或粉末)、锭剂(包括液体填充锭剂)、咀嚼物、多颗粒和纳米颗粒、凝胶、固溶体、脂质体制品、微囊制品、乳膏、薄膜、胚珠、栓剂和喷雾剂。
液体制剂包括混悬剂、溶液剂、糖浆剂和酏剂。此类制剂可用作软胶囊或硬胶囊中的填充剂,并且通常包含载体,例如水、乙醇、聚乙二醇、丙二醇、甲基纤维素或合适的油,以及一种或多种乳化剂和/或助悬剂。液体制剂还可以通过固体(例如来自小袋)的重构来制备。
通常使用粘合剂来赋予片剂制剂以粘聚性。合适的粘合剂包括微晶纤维素、明胶、糖、聚乙二醇、天然和合成树胶、聚乙烯吡咯烷酮、预胶化淀粉、羟丙基纤维素和羟丙基甲基纤维素。
片剂还可以含有稀释剂,例如乳糖(一水合物、喷雾干燥的一水合物、无水等)、甘露醇、木糖醇、右旋糖、蔗糖、山梨糖醇、微晶纤维素、淀粉和二水合磷酸氢钙。
片剂还可以任选地包含表面活性剂,例如十二烷基硫酸钠和聚山梨醇酯80。当存在时,表面活性剂可占片剂的0.2%(w/w)至5%(w/w)。
片剂可以进一步含有润滑剂,例如硬脂酸镁、硬脂酸钙、硬脂酸锌、硬脂酰富马酸钠、以及硬脂酸镁与十二烷基硫酸钠的混合物。润滑剂通常占片剂的0.25%(w/w)至10%(w/w)、0.5%(w/w)至3%(w/w)。
除了多取代基裸盖菇素衍生物外,片剂还可含有崩解剂。崩解剂的示例包括乙醇酸淀粉钠、羧甲基纤维素钠、羧甲基纤维素钙、交联羧甲基纤维素钠、交聚维酮、聚乙烯吡咯烷酮、甲基纤维素、微晶纤维素、低级烷基取代的羟丙基纤维素、淀粉、预胶化淀粉和藻酸钠。通常,崩解剂将占剂型的1%(w/w)至25%(w/w)或5%(w/w)至20%(w/w)。
其它可能的辅助成分包括抗氧化剂、着色剂、调味剂、防腐剂和掩味剂。
对于片剂剂型,取决于化学化合物的所需有效量,本公开的化学化合物可以占剂型的1%(w/w)至80%(w/w),更通常为剂型的5%(w/w)至60%(w/w)。
示例性的片剂含有至多约80%(w/w)的化学化合物、约10%(w/w)至约90%(w/w)的粘合剂、约0%(w/w)至约85%(w/w)的稀释剂、约2%(w/w)至约10%(w/w)的崩解剂以及约0.25%(w/w)至约10%(w/w)的润滑剂。
“Pharmaceutical Dosage Forms:Tablets”,Vol.1-Vol.3,CRC Press(2008)中讨论了片剂的制剂。
包含本公开的多取代基裸盖菇素衍生物的药物和娱乐性药品制剂还可以直接施用到血流、肌肉或内脏器官中。因此,药物和娱乐性药品制剂可以肠胃外施用(例如通过皮下、静脉内、动脉内、鞘内、心室内、颅内、肌内或腹膜内注射)。肠胃外制剂通常是水溶液,其可以含有赋形剂例如盐、糖类和缓冲剂(在一个实施方式中,pH为3至9),但是对于某些应用,它们可以更合适地配制为无菌非水溶液或以干燥形式以与合适的载体(例如无菌水)结合使用。
用于肠胃外施用的包含本公开的多取代基裸盖菇素衍生物的制剂可以配制为立即释放和/或改良释放。改良释放制剂包括延迟释放、持续释放、脉冲释放、控制释放、靶向释放和程序性释放。因此,本公开的化学化合物可以配制为固体、半固体或触变液体,用于作为提供活性化合物的改良释放的植入储库施用。此类制剂的示例包括药物涂层支架和聚(dl-乳酸-共乙醇酸)(PGLA)微球。
本公开的药物或娱乐性药品制剂还可局部施用至皮肤或粘膜,即经皮或透皮施用。用于此目的的示例药物和娱乐性药品制剂包括凝胶、水凝胶、洗剂、溶液、霜剂、软膏、扑粉、化妆品、油、滴眼剂、敷料、泡沫、薄膜、皮肤贴剂、晶片、植入物、海绵、纤维、绷带和微乳液。也可以使用脂质体。示例载体包括醇、水、矿物油、液体凡士林、白凡士林、甘油、聚乙二醇和丙二醇。可以掺入渗透增强剂(参见:例如,Finnin,B.和Morgan,T.M.,1999J.Pharm.Sci,88(10),955-958)。
局部施用的其它方式包括通过电穿孔、离子电渗疗法、超声透入疗法、超声波导入疗法和微针或无针(例如,PowderjectTM,、BiojectTM等)注射来递送。
用于吸入或吹入的药物和娱乐性药品制剂包括在药学上可接受的水性或有机溶剂或其混合物中的溶液剂和混悬剂以及粉末。液体或固体药物组合物可以含有合适的药学上可接受的赋形剂。在一些实施方式中,通过口腔或鼻呼吸途径施用药物组合物以获得局部或全身作用。药学上可接受的溶剂中的药物组合物可以通过使用惰性气体来雾化。雾化溶液可以直接从雾化装置吸入,或者可以将雾化装置附接至面罩帐篷或间歇正压呼吸机。溶液、悬浮液或粉末药物组合物可以例如从以适当方式递送制剂的装置经口或经鼻施用。
在进一步的实施方式中,其中本公开的多取代基裸盖菇素衍生化合物用作娱乐性药品,所述化合物可以包含在组合物中,例如食物或食物产品、饮料、食品调味料、个人护理产品,例如化妆品、香水或沐浴油,或油(既可作为按摩油进行局部施用,也可用于燃烧或雾化)。本公开的化学化合物还可包含在“电子烟”产品中,该产品还可包含其它药物,诸如尼古丁和调味剂。
因此,清楚的是,多取代基裸盖菇素衍生化合物可用作药物或娱乐性药品。因此,在另一方面,本公开在至少一个实施方式中提供了具有式(I)的化学化合物的用途:
其中,R2、R4、R5、R6或R7中的至少两个是从下列的至少两种中独立选择的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基。
包含本公开的化学化合物的药物制剂可用于治疗受试者,并且特别是治疗受试者的精神障碍。因此,在另一个实施方式中,本公开包括一种用于治疗精神障碍的方法,该方法包括向对其有需要的受试者施用包含具有式(I)的化学化合物的药物制剂:
/>
其中,R2、R4、R5、R6或R7中的至少两个是从下列的至少两种中独立选择的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基。
可以治疗的精神障碍包括例如神经发育障碍,诸如智力障碍、整体发育迟缓、沟通障碍、自闭症谱系障碍和注意力缺陷多动障碍(ADHD);双相情感障碍和相关疾病,诸如躁狂症和抑郁症发作;焦虑症,诸如广泛性焦虑症(GAD)、广场恐惧症、社交焦虑症、特定恐惧症(例如自然事件、医疗、动物、情境)、惊恐障碍和离别焦虑障碍;应激障碍,诸如急性应激障碍、适应障碍、创伤后应激障碍(PTSD)和反应性依恋障碍;解离性障碍,诸如解离性遗忘症、解离性身份障碍和人格解体/现实解体障碍;躯体形式障碍,诸如躯体症状障碍、疾病焦虑障碍、转换障碍和做作性障碍;饮食障碍,例如神经性厌食症、神经性贪食症、反刍障碍、异食癖和暴食症;睡眠障碍,诸如发作性睡病、失眠障碍、嗜睡症、呼吸相关睡眠障碍、异态睡眠和不宁腿综合征;破坏性障碍,诸如盗窃癖、纵火癖、间歇性爆发性障碍、品行障碍和对立违抗性障碍;抑郁症,诸如破坏性情绪失调障碍、重度抑郁症、持续性抑郁症(心境恶劣)、经前期烦躁障碍、物质/药物引起的抑郁症、产后抑郁症和由另一种医疗状况引起的抑郁症,例如危及生命的癌症情况下的精神和生存痛苦(ACS Pharmacol.Transl.Sci.4:553-562;JPsychiatr Res 137:273-282);物质相关障碍,诸如酒精相关障碍、大麻相关障碍、吸入剂使用相关障碍、兴奋剂使用障碍和烟草使用障碍;神经认知障碍,诸如谵妄;精神分裂症;强迫症,诸如强迫症(OCD)、身体变形障碍、囤积障碍、拔毛癖症、表皮脱落障碍、物质/药物诱发的强迫症以及与另一种医疗状况相关的强迫症;和人格障碍,诸如反社会型人格障碍、回避型人格障碍、边缘型人格障碍、依赖型人格障碍、表演型人格障碍、自恋型人格障碍、强迫型人格障碍、偏执型人格障碍、精神分裂型人格障碍和分裂型人格障碍。
在一方面,本公开的化合物可用于与5-HT2A受体接触,从而调节5-HT2A受体。此类接触包括在体外条件下将本公开的化合物和5-HT2A受体放在一起,例如通过将化合物引入含有5-HT2A受体的样品中,例如含有纯化的5-HT2A受体的样品,或含有包含5-HT2A受体的细胞的样品。体外条件进一步包括本文实施例1中描述的条件。接触进一步包括在体内条件下将本公开的化合物和5-HT2A受体放在一起。此类体内条件包括向动物或人类受试者施用例如药学有效量的本公开的发明化合物,当所述化合物与如上文所述的药学活性载体、稀释剂或赋形剂一起配制时,从而治疗该受试者。在接触5-HT2A受体后,该化合物可以激活5-HT2A受体或抑制5-HT2A受体。
因此,在另一方面,可以按照本文治疗的病情可以是任何5-HT2A受体介导的障碍。此类障碍包括但不限于精神分裂症、精神病性障碍、注意力缺陷多动障碍、自闭症和双相情感障碍。
在一方面,本公开的化合物可用于与5-HT1A受体接触,从而调节5-HT1A受体。此类接触包括在体外条件下将本公开的化合物和5-HT1A受体放在一起,例如通过将所述化合物引入含有5-HT1A受体的样品中,例如含有纯化的5-HT1A受体的样品,或含有包含5-HT1A受体的细胞的样品。体外条件进一步包括本文实施例1中描述的条件。接触进一步包括在体内条件下将本公开的化合物和5-HT1A受体放在一起。此类体内条件包括向动物或人类受试者施用例如药学有效量的本公开的化合物,当所述化合物与如上文所述的药学活性载体、稀释剂或赋形剂一起配制时,从而治疗该受试者。在接触5-HT1A受体后,该化合物可以激活5-HT1A受体或抑制5-HT1A受体。
因此,在进一步方面,可以根据本文治疗的病情可以是任何5-HT1A受体介导的障碍。此类障碍包括但不限于精神分裂症、精神病性障碍、注意力缺陷多动障碍、自闭症和双相情感障碍。
在一些实施方式中,在接触5-HT1A受体和5-HT2A受体后,该化合物可以调节5-HT1A受体,例如激活或抑制5-HT1A受体,然而,该化合物可以同时不调节5-HT2A受体。
在一些实施方式中,在接触5-HT2A受体和5-HT1A受体后,所述化合物可以调节5-HT2A受体,例如激活或抑制5-HT2A受体,然而,所述化合物可以同时不调节5-HT1A受体。
现在转向制备本公开的多取代基裸盖菇素衍生物的方法,首先应注意的是,本公开的多取代基裸盖菇素衍生物可以以任何合适的方式制备,包括通过任何有机化学合成方法、生物合成方法或其组合。接下来,首先,将讨论用于化学制备本公开的多取代基裸盖菇素衍生物的示例方法。此后,将讨论用于制备多取代基裸盖菇素衍生物的示例生物合成方法。
一种制备本公开的多取代基裸盖菇素衍生物的合适方法首先涉及选择并获得或制备反应物裸盖菇素衍生化合物,以及选择并获得或制备含有取代基的化合物,然后使反应物裸盖菇素衍生化合物与含取代基的化合物进行化学或生物化学反应,以获得多取代基裸盖菇素衍生化合物。应当注意的是,在其中反应物裸盖菇素衍生化合物尚未具有至少一个取代基的实施方式中,通常可以使非取代基反应物裸盖菇素衍生化合物(即通常含有吲哚结构的反应物,其中R2、R5、R6和R7各自为氢原子)顺序地与含有至少两个取代基的化合物反应。图9、10、11A-11C和12A-12D(描绘了形成具有单个取代基的第一裸盖菇素衍生物的示例反应)连同图13A-13C(描绘了形成具有两个或更多个取代基的多取代基裸盖菇素衍生物的后续示例反应)中示出了其示例。在其它实施方式中,反应物裸盖菇素衍生化合物可具有至少一个取代基,并与含有至少一个附加取代基的化合物反应(如图8A-8G中所示)。
因此,在一方面,本公开在至少一个实施方式中提供了一种制备具有式(I)的裸盖菇素衍生物或其盐的方法:
其中,R2、R4、R5、R6或R7中的至少两个是从下列的至少两种中独立选择的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且R3c为氢原子或羧基,该方法包括:
在足以形成具有化学式(I)的裸盖菇素取代物或其盐的反应条件下,使具有化学式(II)的反应物裸盖菇素衍生化合物与含取代基的化合物反应:
其中,R2、R4、R5、R6或R7之一是从(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基中选择的取代基,并且其中每个未取代的R2、R5、R6或R7为氢原子或醇基并且当R4没有被任何上述取代基取代时,R4为氢原子、羟基、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基,
其中含取代基的化合物中的取代基选自(i)含卤素的化合物、(ii)含羟基的化合物、(iii)含硝基的化合物、(iv)含糖氧基的化合物、(v)含氨基或N-取代的氨基的化合物、(vi)含羧基或羧酸衍生物的化合物、(vii)含醛或酮基的化合物、(viii)含异戊二烯基的化合物和(ix)含腈基的化合物。
具有式(II)的反应物裸盖菇素衍生化合物涵盖多种化合物。一般而言,可以通过以下方式来选择具有式(II)的反应物裸盖菇素衍生化合物:首先鉴定所需的多取代基裸盖菇素衍生化合物,并确定其中的取代基,然后选择具有式(II)的合适的反应物裸盖菇素衍生化合物。因此,例如,如果需要制备S14、S26多取代基裸盖菇素衍生物,则可以选择S14反应物裸盖菇素衍生化合物并与含有S2取代基的化合物反应以形成所需的S14、S26多取代基裸盖菇素衍生化合物,或如果需要制备S15、S26多取代基裸盖菇素衍生物,可选择S15反应物裸盖菇素衍生化合物并与含有S2取代基的化合物反应以形成S15、S26多取代基裸盖菇素衍生物。因此,此外可以说,制备本公开化合物的化学反应的进行通常涉及不同碳原子(即C2、C4、C5、C6和/或C7原子)处的取代。
因此,在一个示例实施方式中,为了形成其中S15是氯原子并且R2、R6和R7是S22、S26或S27的多取代基裸盖菇素衍生物,反应物裸盖菇素衍生物可选择为这样的化学化合物,其中R4是O-烷基,R2、R6和R7为氢原子,R5为氯原子,且R3A和R3B为氢原子、烷基、酰基或芳基,诸如例如图8A和8B所示的反应物裸盖菇素衍生物。
在一个进一步的示例实施方式中,为了形成其中S15是氯原子并且R2、R6和R7是S22、S26或S27的多取代基裸盖菇素衍生物,反应物裸盖菇素衍生物可选择为这样的化学化合物,其中R4是O-酰基,R2、R6和R7是氢原子,R5是氯原子,并且R3A和R3B是氢原子、烷基、酰基或芳基,诸如例如图8C和8D所示的反应物裸盖菇素衍生物。
在一个进一步的示例实施方式中,为了形成其中S15是氯原子并且R2、R6和R7是S22、S26或S27的多取代基裸盖菇素衍生物,反应物裸盖菇素衍生物可选择为这样的化学化合物,其中R4是羟基,R2、R6和R7是氢原子,R5是氯原子,并且R3A和R3B是氢原子、烷基、酰基或芳基,诸如例如图8E所示的反应物裸盖菇素衍生物。
在一个进一步示例实施方式中,为了形成其中S15是氯原子并且R2、R6和R7是S22、S26或S27的多取代基裸盖菇素衍生物,反应物裸盖菇素衍生物可选择为这样的化学化合物,其中R4是磷酸酯基,R2、R6和R7是氢原子,R5是氯原子,并且R3A和R3B是氢原子、烷基、酰基或芳基,诸如例如图8F所示的反应物裸盖菇素衍生物。
在又一进一步示例实施方式中,为了形成其中S15是氯原子并且R2、R6和R7是S22、S26或S27的多取代基裸盖菇素衍生物,反应物裸盖菇素衍生物可以选择为这样的化学化合物,其中R4是氢原子,R2、R6和R7是氢原子,R5是氯原子,并且R3A和R3B是氢原子、烷基、酰基或芳基,诸如例如图8G所示的反应物裸盖菇素衍生物。
反应物裸盖菇素衍生化合物可以以基本上化学纯的形式提供,例如以具有至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少99.9%的纯度的裸盖菇素衍生物制剂的形式。裸盖菇素衍生物可以是化学合成的,或者是从精细化学品制造商获得,诸如例如(St.Louis,MO,USA)。
含取代基的化合物可以是包含选自以下的取代基的任何化合物:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其能够与所选反应物裸盖菇素衍生化合物反应。
含取代基的化合物可以基本上化学纯的形式提供,例如具有至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或至少99.9%的纯度。含腈化合物可以合成或纯化,或者可以方便地从精细化学品制造商获得,例如(St.Louis,MO,USA)。
举例来说,图9、10、11A-11C、12A-12D和13A-13C示出了形成初始硝化(图9)、糖基化(图10)、胺化(图11A-11C)和羧化(图12A-12D)裸盖菇素衍生物的示例反应。随后,所获得的每种化合物可以与附加含取代基的化合物反应,例如图13A-13C所示。
因此,参见图13A,其中示出了最初合成的7-硝化裸盖菇素衍生物(参见:化合物13A-2)向在C5和C7碳原子处含有两种类型基团的其它5,7-二取代裸盖菇素衍生物的示例性化学转化。例如,用化合物13A-2进行傅-克酰基化将在C5碳上区域选择性地安装乙酰基以得到化合物13A-3,而化合物13A-3又可以通过碘仿反应进一步氧化成相应的5-羧基衍生物(化合物13A-4)。然后,使用甲酸作为氢源,通过钯介导的还原,将7-硝基基团还原成相应的7-氨基-裸盖菇素衍生物(化合物13A-5)。在酸性条件下,使用亚硝酸钠作为试剂,7-氨基可以进一步转化为反应性和多功能的7-重氮盐(化合物13A-6)。由反应性7-重氮盐中间体化合物13A-6,可以获得附加地含有7-腈(化合物13A-7)、7-羟基(化合物13A-8)、7-氟基(化合物13A-9)或7-碘基(化合物13A-10)的相应5-羧基-裸盖菇素衍生物。
在一个示例实施方式中,在一方面,形成的第一裸盖菇素衍生物可以是具有乙酰基的化合物,诸如例如图13A中所示并且标记为13A-3的化合物。在其它示例中,R2、R4或R6或R7可具有乙酰基。
因此,进一步参考图13A以及具有式(I)的化学化合物,显然形成的第一多取代基裸盖菇素衍生化合物可以进一步反应以形成附加多取代基裸盖菇素衍生化合物。因此,例如,形成的第一裸盖菇素衍生物可以是图13A中所示并且标记为13A-3的化合物,或其中R2、R4、R5、R6和R7的其它组合具有硝基和乙酰基的化合物。这种形成的第一裸盖菇素衍生物可以反应以氧化乙酰基并形成具有式(I)的第二裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个是硝基,并且其中R2、R4、R5、R6或R7中的一个或至少一个为羧基,并形成第二裸盖菇素衍生物,例如图13A中所示并且标记为13A-4的化合物。
继续参考图13A以及具有式(I)的化学化合物,形成的第二裸盖菇素衍生物可以反应以还原硝基并形成氨基和第三裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个是氨基,并且其中R2、R4、R5、R6或R7中的一个或至少一个是羧基。形成的第三裸盖菇素衍生物可以是图13A中所示并且标记为13A-5的化合物。
继续参考图13A以及具有式(I)的化学化合物,形成的第三裸盖菇素衍生物可与亚硝酸盐反应,以将氨基转化为重氮盐并形成中间裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个是重氮基,并且R2、R4、R5、R6或R7中的一个或至少一个是羧基。形成的中间裸盖菇素衍生物可以是例如图13A中所示并且标记为13A-6的化合物。
继续参考图13A以及具有式(I)的化学化合物,形成的中间裸盖菇素衍生物可以与含腈化合物反应以转化重氮基并形成第四裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个为腈基,并且R2、R4、R5、R6或R7中的一个或至少一个为羧基,例如图13A中所示并且标记为13A-7的化合物。
继续参考图13A以及具有式(I)的化学化合物,形成的中间裸盖菇素可以与水反应以转化重氮基并形成第五裸盖菇素,其中R2、R4、R5、R6或R7中的一个或至少一个是羟基,并且R2、R4、R5、R6或R7中的一个或至少一个为羧基,例如图13A中所示并且标记为13A-8的化合物。
继续参考图13A以及具有式(I)的化学化合物,形成的中间裸盖菇素衍生物可以与含卤素的化合物反应以转化重氮基并形成第六裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个为卤素原子,并且R2、R4、R5、R6或R7中的一个或至少一个为羧基,例如图13A中所示并且标记为13A-9和13A-10的化合物。
接下来参考图13B,其中示出了使用最初合成的5-羧基裸盖菇素衍生物(参见化合物:13B-1)向在碳原子C5和C7处含有两种类型的基团的其它O-4-糖基化裸盖菇素衍生物的示例化学转化。因此,从化合物13B-1开始,5-羧基官能团可以在费歇尔(Fisher)酯化条件下在甲醇中选择性酯化以得到化合物13B-2,其可以用于分别合成相应的7-氯(化合物13B-3)和7-硝基(化合物13B-4)衍生物。化合物13B-3和13B-4都可以在O-4位用全-O-乙酰化糖基溴化物来糖基化,并在除去所有O-乙酸酯后,可以获得相应的4-O-糖基化衍生化合物13A-5和13A-6。两种化合物的5-酯官能团可通过氨解反应进一步转化为5-酰氨基,以分别提供4-O-糖基化裸盖菇素衍生化合物13B-7和13B-8。使用甲酸作为氢源,通过钯介导的还原可以进一步还原化合物13B-8的7-硝基以提供化合物13B-9。
进一步参考图13B以及具有式(I)的化学化合物,显然,含有取代基的反应物裸盖菇素衍生化合物可用于与含取代基的化合物反应,并形成初始多取代基裸盖菇素衍生化合物,其又可用于形成附加的多取代基裸盖菇素衍生化合物。因此,例如,反应物裸盖菇素衍生物中的取代基可以是甲氧基羰基,所述含取代基的化合物可以是含有卤素的化合物N-卤代琥珀酰亚胺,并且反应物裸盖菇素衍生物和含取代基的化合物可以反应以形成第一裸盖菇素衍生物,其中R2、R4、R5、R6或R7之一为甲氧基羰基,并且R2、R4、R5、R6或R7中的一个或至少一个为卤素原子,例如图13B中所示并且标记为13B-3所示的化合物。
继续参考图13B以及具有式(I)和(II)的化学化合物,反应物裸盖菇素衍生物可以具有甲氧基羰基,所述含取代基的化合物可以为含硝基的化合物四氟硼酸硝鎓,并且反应物裸盖菇素衍生物和所述含取代基的化合物可以反应以形成第二裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个是甲氧基羰基,并且R2、R4、R5、R6或R7中的一个或至少一个是硝基,并且所形成的第二裸盖菇素衍生物可以是图13B中所示并且标记为13B-4的化合物。
继续参考图13B以及具有式(I)的化学化合物,形成的第一裸盖菇素衍生物可以与乙酰化糖基化合物反应并形成第三裸盖菇素,其中R2、R4、R5、R6或R7中的一个或至少一个是甲氧基羰基,R2、R4、R5、R6或R7中的一个或至少一个为糖氧基,并且R2、R4、R5、R6或R7中的一个或至少一个为卤素原子,例如图13B中所示并且标记为13B-5的化合物。
继续参考图13B以及具有式(I)的化学化合物,形成的第二裸盖菇素衍生物可以与乙酰化的糖基化合物反应并形成第四裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个为甲氧基羰基,R2、R4、R5、R6或R7中的一个或至少一个为糖氧基,并且R2、R4、R5、R6或R7中的一个或至少一个为硝基。例如,形成的第四裸盖菇素衍生物可以是图13B中所示并且标记为13B-6的化合物。
继续参考图13B以及具有式(I)的化学化合物,形成的第三裸盖菇素衍生物可以与氨反应以将甲氧基羰基转化为酰氨基并形成第五裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个为酰氨基,R2、R4、R5、R6或R7中的一个或至少一个为糖氧基,并且R2、R4、R5、R6或R7中的一个或至少一个为卤素原子,例如图13B中所示并且标记为13B-7的化合物。
继续参考图13B以及具有式(I)的化学化合物,形成的第三裸盖菇素衍生物可以与氨反应,以将甲氧基羰基转化酰氨基并形成第六裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个是酰氨基,R2、R4、R5、R6或R7中的一个或至少一个是糖氧基,并且R2、R4、R5、R6或R7中的一个或至少一个是硝基,例如图13B中所示并且标记为13B-8的化合物。
继续参考图13B以及具有式(I)的化合物,形成的第六裸盖菇素衍生物可以反应以还原硝基以形成氨基和第七裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个是酰氨基,R2、R4、R5、R6或R7中的一个或至少一个是糖氧基,并且R2、R4、R5、R6或R7中的一个或至少一个是硝基,例如图13B中所示并且标记为13B-9的化合物。
因此,参考图13C,其中示出了合成的5-硝化裸盖菇素衍生物(参见:化合物13C-2)向含有至多三种类型取代基的5,6,7-三取代裸盖菇素衍生物的化学转化的更多示例。例如,在甲酸作为氢源存在下,通过钯介导的还原,可以将5-硝基还原以产生5-氨基衍生物(化合物:13C-3)。可以在甲醇中进行化学选择性N-乙酰化,以得到相应的5-乙酰胺基裸盖菇素衍生化合物13C-4,然后可以使用DMF-POCl3作为试剂,在碳原子C7处将其甲酰化,以得到7-醛化合物13C-5。使用N-溴代琥珀酰亚胺进一步溴化可以提供5-乙酰胺基-6-溴-7-甲酰基-裸盖菇素衍生化合物13C-6。可替代地,使用化合物13C-5作为底物,可以使用碳酸银作为试剂在温和条件下氧化7-甲酰基,得到7-羧基衍生化合物13C-7,其可以使用费歇尔酯化条件进行酯化以获得化合物13C-8。通过使化合物13C-8与四氟硼酸亚硝鎓反应,在C6碳原子上安装硝基,得到5,6,7-三取代裸盖菇素衍生化合物13C-9,其6-硝基被还原,形成化合物13C-10并随后进行氨解反应,以将7-酯基转化为酰胺。这提供了新型5,6,7-三取代的裸盖菇素衍生化合物13C-11。
进一步参考图13C和具有式(I)和(II)的化学化合物,将清楚的是,含有取代基的反应物裸盖菇素衍生化合物可用于与含取代基的化合物反应并形成初始多取代基裸盖菇素衍生化合物,其又可用于形成附加的多取代基裸盖菇素衍生化合物。因此,例如,反应物裸盖菇素衍生物中的取代基可以是乙酰胺基,所述含取代基的化合物可以是含卤素的化合物N-卤代琥珀酰亚胺(例如N-溴代琥珀酰亚胺(NBS)),并且反应物裸盖菇素衍生物和含取代基的化合物可以反应以形成第一裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个是乙酰胺基,并且R2、R4、R5、R6或R7中的一个或至少一个是卤素原子,例如图13C中所示并且标记为13C-6的化合物。
进一步参考图13C和具有式(I)及(II)的化学化合物,反应物裸盖菇素衍生化合物可具有乙酰胺基,所述含取代基的化合物可为二甲基甲酰胺,并且反应物裸盖菇素衍生物与含取代基的化合物可以反应以形成中间裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个是乙酰胺基,并且R2、R4、R5、R6或R7中的至少一个或至少一个是甲醇基,并且其中使中间裸盖菇素衍生物反应以氧化甲醇基,并且形成第二裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个为乙酰胺基,并且R2、R4、R5、R6或R7中的一个或至少一个是羧基。例如,中间裸盖菇素衍生物可以是图13C中所示并且标记为13C-5的化合物,并且形成的第二裸盖菇素衍生物可以是图13C中所示并且标记为13C-7的化合物。
进一步参考图13C和具有式(I)的化学化合物,形成的具有式(I)的第二裸盖菇素衍生物可以与醇反应,以酯化羧基以形成酯和第三裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个为乙酰胺基,R2、R4、R5、R6或R7中的一个或至少一个为羧基酯,例如图13C中所示并且标记为13C-8的化合物。
进一步参考图13C和具有式(I)的化学化合物,形成的第三裸盖菇素衍生物可与含硝基的化合物反应并形成第四裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个为乙酰胺基,R2、R4、R5、R6或R7中的一个或至少一个为羧基酯,并且R2、R4、R5、R6或R7中的至少一个为硝基,例如图13C中所示并且标记为13C-9的化合物。
进一步参考图13C和具有式(I)的化学化合物,形成的第四裸盖菇素衍生物可以反应以还原硝基以形成氨基和第五裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个为乙酰胺基,R2、R4、R5、R6或R7中的一个或至少一个为羧基酯,并且R2、R4、R5、R6或R7中的一个或至少一个为氨基,例如图13C中所示并且标记为13C-10的化合物。
进一步参考图13C和具有式(I)的化学化合物,形成的第五裸盖菇素衍生物可以与氨反应以形成酰氨基和具有式(I)的第六裸盖菇素衍生物,其中R2、R4、R5、R6或R7中的一个或至少一个为乙酰胺基,R2、R4、R5、R6或R7中的一个或至少一个为羧基酯,并且R2、R4、R5、R6或R7中的至少一个为酰氨基,例如图13C中所示并且标记为13C-11的化合物。
因此,一般来说,提供了一种反应物裸盖菇素衍生物,并且使用该反应物裸盖菇素衍生物在化学反应中反应,导致形成多取代基裸盖菇素衍生物。
诸如图9、10、11A-11C、12A-12D和13A-13C中所示的示例反应等反应,可以在任何合适的反应容器(例如管、瓶)中进行。可以使用的合适的溶剂是例如水、醇(如甲醇、乙醇)、四氢呋喃(THF)、二氯甲烷、丙酮、N,N-二甲基甲酰胺(DMF)、二甲亚砜(DMSO)或溶剂的组合。合适的温度可以在例如约20℃至约100℃的范围内。此外,反应时间可以变化。正如本领域技术人员容易理解的,可以优化反应条件,例如通过制备多种裸盖菇素衍生物反应物制剂并使它们在不同的反应容器中在不同的反应条件下反应,例如在不同的温度下、使用不同的溶剂、使用不同的催化剂等,评价所获得的多取代基裸盖菇素衍生反应产物,调整反应条件并选择所需的反应条件。
接下来转向制备本公开的多取代基化合物的生物合成方法,此类方法一般涉及使用裸盖菇素生物合成酶补体来酶促催化裸盖菇素衍生物前体化合物的转化并形成多取代基裸盖菇素衍生化合物。包括在裸盖菇素生物合成酶补体中的酶可以变化,如下文将参考图14A、14B和14C中所示的某些示例酶和示例化合物进行讨论。
因此,在一方面,本公开进一步提供了一种制备多取代基裸盖菇素衍生物的方法,该方法包括在允许酶催化转化裸盖菇素衍生物前体化合物的反应条件下,使具有式(LVII)的裸盖菇素衍生物前体化合物接触催化量的裸盖菇素生物合成酶补体,以形成具有式(I)的多取代基裸盖菇素衍生化合物:
其中R2、R4、R5、R6或R7中的至少一个为从(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基中选择的取代基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,并且其中R3为氢原子或-CH2-CHNH2COOH或-CH2-CH2NH2
其中,R2、R4、R5、R6或R7中的至少两个是从下列的至少两种中独立选择的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基。
反应条件可以是体外反应条件、或体内反应条件、或其组合。
体外合成
一般而言,体外合成涉及最初提供基本纯净形式的试剂,包括前体裸盖菇素衍生化合物和其它反应物。因此,反应物可以基本上纯的形式作为颗粒提供,或者它们可以基本上纯净的形式溶解在合适的溶剂或稀释剂(例如水或缓冲剂)中。然后,可以将试剂合并并且在合适的反应容器(例如管、烧杯、烧瓶等)或者在更大规模的罐或反应器中彼此接触,通常优选呈液体形式,其根据需要可以通过进一步包含稀释剂例如水或缓冲剂来制备。可以将组合的试剂混合,一般而言,通过使用合适的搅拌或混合装置轻轻搅拌,例如实验室大小的磁力搅拌器(例如由制造的)或手持式或工业混合器,以形成混合物。可以根据需要选择试剂的相对量和绝对量。绝对量通常取决于人们希望进行反应的规模,诸如例如在实验室规模(例如以小于1L、小于100mL、小于10mL或小于1mL的规模),或例如以商业生产规模(例如以大于100L、大于1,000L或大于10,000L的规模)。试剂的相对量可以变化。因此,例如,在一个实施方式中,可以将化学计量量的前体裸盖菇素衍生物和含取代基的化合物中的每一种与催化量的酶混合。如果需要,可以选择非化学计量的试剂,例如裸盖菇素前体衍生物与含取代基的化合物的摩尔比为1:0.95;1:0.9;1:0.75;或者1:1.05、1:1.1或1:1.25。
如本领域技术人员将理解的,以摩尔量计,少量的酶足以进行反应,因为酶充当催化剂,并且与前体裸盖菇素衍生物和含取代基的化合物不同,酶在反应中不被消耗。因此,一般而言,催化量可以被认为是转化前体裸盖菇素衍生物和含取代基的化合物并形成所需量的多取代基裸盖菇素衍生物所需的至少最小量的酶。因此,例如,反应混合物中可以包括0.1至1,000个酶单位(例如0.1个酶单位、1个酶单位、10个酶单位、50个酶单位、100个酶单位、250个酶单位、500个酶单位或1,000个酶单位),其中如本领域技术人员已知的,1个酶单位是每分钟催化1μmol底物(即裸盖菇素前体化合物)的酶量。此外,体外反应条件可以变化并且可以包括例如约18℃至约37℃范围内的温度和约pH 5.0至约pH 8.5范围内的pH。此外,可以包括其它试剂以促进催化,例如稀释剂(例如水或缓冲剂)、盐和pH调节剂。可以调整和优化体外反应条件,例如通过制备多个样品,每个样品在不同的操作条件下反应,例如在不同的温度、不同的pH下、包括不同量的酶、包括不同相对量的试剂等,并且检测所形成的多取代基裸盖菇素衍生物。
体内合成
在一个实施方式中,可以在宿主细胞中使裸盖菇素衍生物前体化合物和含取代基的化合物与裸盖菇素生物合成酶补体接触,其中宿主细胞包含嵌合核酸序列,所述嵌合核酸序列包含以下作为操作性地连接的组件:
(i)控制宿主细胞中表达的核酸序列;和
(ii)编码裸盖菇素生物合成酶补体的核酸序列,
和使宿主细胞生长以表达裸盖菇素生物合成酶补体并且产生多取代基裸盖菇素衍生化合物。
合适的嵌合核酸序列包括任何核酸序列,其包含与编码裸盖菇素生物合成酶补体的序列操作性地连接的控制宿主细胞中表达的核酸序列,所述裸盖菇素生物合成酶补体为例如色氨酸合酶B亚基多肽、色氨酸脱羧酶、N-乙酰基转移酶、N-甲基转移酶和异戊二烯基转移酶中的一种或多种,如下文进一步描述。
可用于本文的能够控制编码生物合成酶补体的核酸序列在宿主细胞中表达的核酸序列包括能够控制宿主细胞中多肽表达的任何转录启动子。通常,当根据本文选择细菌宿主时,使用从细菌细胞获得的启动子,而当选择真菌宿主细胞时,将使用真菌启动子,当选择植物细胞时,将使用植物启动子等。例如,可用于在酵母细胞中表达的具体示例包括半乳糖诱导型启动子,诸如Gal 10/Gal 1启动子,或用于在大肠杆菌细胞中表达的β-半乳糖苷酶启动子。能够控制宿主细胞中表达的其它核酸元件包括转录终止子、增强子等,所有这些都可以包括在本公开的嵌合核酸序列中。
可以将嵌合核酸序列整合到确保在宿主细胞中良好表达的重组表达载体中,其中该表达载体适合在宿主细胞中表达。术语“适合在宿主细胞中表达”是指重组表达载体包含与为实现在细胞中表达所需的遗传元件连接的嵌合核酸序列。在这一方面,可以包括在表达载体中的遗传元件包括转录终止区、编码标记基因的一种或多种核酸序列、一种或多种复制起点等。在优选的实施方式中,表达载体进一步包含例如将载体或其部分整合到宿主细胞基因组中所需的遗传元件。如果使用植物宿主细胞,则T-DNA左右边界序列有助于整合到植物的核基因组中。
根据本发明,表达载体可以进一步含有标记基因。可根据本公开使用的标记基因包括允许将转化细胞与非转化细胞区分开的所有基因,包括所有可选择和可筛选的标记基因。标记基因可以是抗性标记,例如针对例如卡那霉素或氨苄青霉素的抗生素抗性标志物,或营养缺陷型标志物,例如leu标志物(Sikorski和Hieter,1989,Genetics 122(1):19-27)或ura标志物(Rose和Winston,1984,Mol.Gen.Genet.193(3):557-560)。可用于通过目视检查来鉴定转化体的可筛选标志物包括β-葡萄糖醛酸酶(GUS)(美国专利号5,268,463和5,599,670)和绿色荧光蛋白(GFP)(Niedz et al.,1995,Plant Cell Rep.,14:403)。
可以根据本文使用多种宿主细胞。所选择的宿主细胞可能能够天然产生裸盖菇素化合物或其衍生物,或者该细胞可能不能天然产生裸盖菇素化合物或其衍生物。在引入嵌合核酸序列后,宿主细胞可以说能够异源表达裸盖菇素生物合成酶补体。
在一些实施方式中,宿主细胞可以是微生物细胞,例如细菌细胞或酵母细胞。可根据本文使用的示例细菌细胞是大肠杆菌细胞。可根据本文使用的示例酵母细胞可以是酿酒酵母细胞或解脂耶氏酵母细胞。
在进一步的实施方式中,宿主细胞可以是植物细胞或藻类细胞。
存在多种用于操纵宿主细胞以将核酸序列(包括包含本公开的嵌合核酸序列的表达载体)引入细胞中并获得表达的技术和方法,并且是本领域技术人员众所周知的。这些方法包括例如基于阳离子的方法,例如基于锂离子或钙离子的方法、电穿孔、基因枪法和基于玻璃珠的方法。如本领域技术人员所知,根据所选择的宿主细胞,将核酸材料引入宿主细胞的方法可以变化,此外可以针对宿主对核酸材料的摄取来优化方法,例如通过比较使用不同条件的核酸材料的摄取。详细指导可参见例如Sambrook et al.,Molecular Cloning,aLaboratory Manual,Cold Spring Harbor Laboratory Press,2012,Fourth Ed。值得注意的是,嵌合核酸是非天然存在的嵌合核酸序列并且可以说对于宿主细胞是异源的。
可以方便地使用的一种示例宿主细胞是大肠杆菌。大肠杆菌载体的制备可以使用公知的技术来完成,例如限制性消化、连接、凝胶电泳、DNA测序、聚合成酶链式反应(PCR)和其它方法。有多种克隆载体可用于执行制备重组表达载体所需的必要步骤。在大肠杆菌中具有功能性复制系统的载体包括诸如pBR322、pUC系列载体、M13 mp系列载体、pBluescript等诸体。用于大肠杆菌的合适启动子序列包括例如T7启动子、T5启动子、色氨酸(trp)启动子、乳糖(lac)启动子、色氨酸/乳糖(tac)启动子、脂蛋白(Ipp)启动子和λ噬菌体PL启动子。通常,克隆载体含有标志物,例如抗生素抗性标志物,例如氨苄青霉素或卡那霉素抗性标志物,从而允许选择转化的细胞。可以将核酸序列引入这些载体中,并且可以通过制备感受态细胞、电穿孔或使用本领域技术人员熟知的其它方法将载体引入大肠杆菌中。大肠杆菌可以在适当的培养基(如Luria-Broth培养基)中生长并收获。收获和裂解细胞后,可以容易地从细胞中回收重组表达载体。
可以方便地使用的另一种示例宿主细胞是酵母细胞。可以使用的示例酵母宿主细胞是属于念珠菌属、克鲁维酵母属、酵母属、裂殖酵母属、毕赤酵母属、汉逊酵母属和耶氏酵母属的酵母细胞。在具体的示例实施方式中,酵母细胞可以是酿酒酵母细胞、解脂耶氏酵母细胞或巴斯德毕赤酵母细胞。
存在许多用于在酵母宿主细胞中表达重组蛋白的载体。可以在酵母宿主细胞中使用的载体的示例包括例如Yip型载体、Yep型载体、Yrp型载体、Ycp型载体、pGPD-2、pAO815、pGAPZ、pGAPZα、pHIL-D2、pHIL-S1、pPIC3.5K、pPIC9K、pPICZ、pPICZα、pPIC3K、pHWO10、pPUZZLE和2μm质粒。此类载体是本领域已知的并且例如描述于Cregg et al.,MolBiotechnol.(2000)16(1):23-52中。用于酵母宿主细胞的合适的启动子序列也是已知的并且描述于例如Mattanovich et al.,Methods Mol.Biol.,2012,824:329-58和Romanos etal.,1992,Yeast 8:423-488中。用于酵母宿主细胞的合适启动子的示例包括糖酵解酶的启动子,如磷酸丙糖异构酶(TPI)、磷酸甘油酸激酶(PGK)、甘油醛-3-磷酸脱氢酶(GAPDH或GAP)及其变体、乳糖酶(LAC)和半乳糖苷酶(GAL)、巴斯德毕赤酵母葡萄糖-6-磷酸异构酶启动子(PPGI)、3-磷酸甘油酸激酶启动子(PPGK)、甘油醛磷酸脱氢酶启动子(PGAP)、翻译延伸因子启动子(PTEF)、酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母磷酸三糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶(PGK)和麦芽糖酶基因启动子(MAL)。适用于酵母宿主细胞的标记基因也是本领域已知的。因此,酵母中可以使用抗生素抗性标志物(如氨苄青霉素抗性标志物),以及为必需营养素((例如亮氨酸(LEU2)、色氨酸(TRP1和TRP2)、尿嘧啶(URA3、URA5、URA6)、组氨酸(HIS3)等)提供遗传功能的标记基因。用于将载体引入酵母宿主细胞的方法可以例如参见S.Kawai et al.,2010,Bioeng.Bugs 1(6):395-403。
此外,关于表达载体的制备和将其引入宿主细胞(包括大肠杆菌细胞、酵母细胞和其它宿主细胞)的指导可以参见例如:Sambrook et al.,Molecular Cloning,aLaboratory Manual,Cold Spring Harbor Laboratory Press,2012,Fourth Ed。
接下来参考图14A-14G,其中示出了制备本公开的多取代基裸盖菇素衍生化合物的示例生物合成途径,特别是图14A以举例的方式示出了如何可以生物合成制备示例S14、S26多取代基裸盖菇素衍生化合物。图14B以进一步示例的方式示出了如何可以生物合成制备进一步示例S14、S26多取代基裸盖菇素衍生化合物。图14C以进一步示例的方式示出了如何可以生物合成制备进一步示例S15、S26多取代基裸盖菇素衍生物化合物。图14D以举例的方式示出了如何可以生物合成制备示例S14、S25多取代基裸盖菇素衍生化合物。图14E以举例的方式示出了如何可以生物合成制备示例S14、S27多取代基裸盖菇素衍生化合物。图14F以举例的方式示出了如何可以生物合成制备示例S15、S26多取代基裸盖菇素衍生化合物。图14G以又进一步示例的方式示出了如何可以生物合成制备示例S15、S27多取代基裸盖菇素衍生化合物。应当理解的是,除了图14A-14G所示的途径、酶和化合物之外,可以使用其它生物合成途径来制备其它多取代基裸盖菇素衍生化合物,其包含多个取代基,其中碳原子C2、C4、C5、C6和C7中的两个或更多个具有选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,进一步包括例如图3A-3L、4A-4I、5A-5I、6A-6I和7A-7F所示的多取代基化合物,并且进一步包括具有式(I)的任何多取代基裸盖菇素衍生化合物:
其中,R2、R4、R5、R6或R7中的至少两个是从下列的至少两种中独立选择的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,其中R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中R3c为氢原子或羧基。
遵循本文阐述的教导,包括参考图14A-14G所示的示例,本领域技术人员将能够选择合适的裸盖菇素前体化合物、裸盖菇素生物合成酶补体酶以生物合成地制备本公开的多取代基裸盖菇素衍生化合物。
因此,进一步参考图14A和裸盖菇素衍生物前体化合物(LVII),裸盖菇素生物合成酶补体可以例如包含色氨酸合酶亚基B多肽,其由选自以下的核酸编码:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2中所示氨基酸序列的功能变体的核酸序列;
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
可以使用具有式(I)的第一裸盖菇素衍生物前体化合物,其中R2、R4、R5、R6或R7中的两个为独立地从(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基中选择的取代基,其中R3是氢原子。可以形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R3c是羧基。例如,裸盖菇素衍生物前体化合物可以是具有式(LVIII)的化学化合物:
其中R4为羟基,并且其中R6是氯原子,并且第一多取代基裸盖菇素衍生化合物具有式(LV):
可以在色氨酸合酶B亚基多肽催化的体内或体外反应中形成。
继续参考图14A,裸盖菇素生物合成酶补体可以进一步包含色氨酸脱羧酶,以使第一多取代基裸盖菇素衍生化合物的R3-CH2-CHNH2COOH基团脱羧基,从而形成具有式(I)的第二多取代基裸盖菇素衍生物,其中R3a和R3b是氢原子,由选自以下的核酸序列编码色氨酸脱羧酶:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO:8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO:8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14A,在一个示例实施方式中,裸盖菇素衍生物前体化合物可以是具有式(LVIII)的化学化合物:
其中R4为氟原子、氨基或羟基,其中R6为氟原子、氨基、腈、或溴原子,并且可以形成具有式(LIX)的第一多取代基裸盖菇素衍生化合物:
其中R4为氟原子、氨基或羟基,其中R6为氟原子、氨基、腈、或溴原子。第一多取代基裸盖菇素可脱羧,并且可形成第二多取代基裸盖菇素,例如具有式(XXII)、(XXVI)、(XXIX)、(LII)或(LIV)的第二多取代基裸盖菇素衍生物。
裸盖菇素生物合成酶补体可以进一步例如包含N-乙酰基转移酶以乙酰化具有化学式(I)的第二裸盖菇素衍生物并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中R3a是氢原子并且R3b是乙酰基。N-乙酰基转移酶可以由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10中所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
因此,继续参考图14A,在一个示例实施方式中,裸盖菇素衍生物前体化合物可以是具有式(LVIII)的化学化合物:
其中R4为乙酰胺基、氟原子、氨基或羟基,其中R6为氟原子、氨基、腈、或溴原子,并且可以形成具有式(LIX)的第一多取代基裸盖菇素衍生化合物:
其中R4为乙酰胺基、氟原子、氨基或羟基,其中R6为氟原子、氨基、腈、或溴原子。然后,可以将第一多取代基裸盖菇素衍生物脱羧并且可以形成具有式(LX)的第二多取代基裸盖菇素衍生物:
此后,可以将第二多取代基裸盖菇素衍生物乙酰化,并且可以形成第三多取代基裸盖菇素衍生物,例如具有式(IX)、(X)、(XVIII)、(XXI)、(XXV)或(XXVIII)的第三多取代基裸盖菇素衍生物:
根据本文,裸盖菇素生物合成酶补体可进一步例如包含N-甲基转移酶,以甲基化R3处的R3氨基并形成具有化学式(I)的第四多取代基裸盖菇素衍生物,其中R3a和R3b各自为甲基,或其中R3a是氢原子且R3b是甲基。N-甲基转移酶可以由选自以下的核酸序列编码:
(a)SEQ.ID NO:11和SEQ.ID NO 13;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14A,在一个示例实施方式中,裸盖菇素衍生物前体化合物可以是具有式(LVIII)的化学化合物:
其中R4是氨基或羟基,其中R6是氯原子、腈基、或溴原子,并且可以形成具有式(LIX)的第一多取代基裸盖菇素衍生化合物:
其中R4为氨基或羟基,其中R6为氯原子、腈基或溴原子。第一多取代基裸盖菇素衍生化合物可以脱羧以形成第二多取代基裸盖菇素衍生化合物,其中第二多取代基裸盖菇素衍生物具有式(LX):
第三多取代基裸盖菇素衍生化合物可被甲基化以形成第四多取代基裸盖菇素衍生物,例如具有式(XXVII)、(XL)或(LIII)的第四多取代基裸盖菇素衍生化合物:
根据本文,在进一步的示例实施方式中,裸盖菇素生物合成酶补体可以包含由选自以下的核酸编码的异戊二烯基转移酶:
(a)SEQ.ID NO:15、SEQ.ID NO:17、SEQ.ID NO:19和SEQ.ID NO 21;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO 22中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO 22中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在这一方面,接下来参考图14B,在进一步的示例实施方式中,裸盖菇素衍生物前体化合物可以是具有式(LXI)的化学化合物:
其中R4是羟基,并且可以形成第一多取代基裸盖菇素衍生化合物,例如形成的具有式(L)的第一多取代基裸盖菇素衍生化合物:
继续参考图14B,在进一步的示例实施方式中,裸盖菇素生物合成酶补体可以包含色氨酸脱羧酶以使R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中R3a和R3b是氢原子。色氨酸脱羧酶可以由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.IDNO:6和SEQ.ID NO:8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在进一步示例实施方式中,裸盖菇素生物合成酶补体可以包含N-甲基转移酶以甲基化R3处的R3氨基并且形成具有化学式(I)的第四多取代基裸盖菇素衍生物,其中R3a和R3b各自为甲基,或其中R3a为氢原子且R3b为甲基。N-甲基转移酶可以由选自以下的核酸序列编码:
(a)SEQ.ID NO:11和SEQ.ID NO 13;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14B,在一个示例实施方式中,裸盖菇素衍生物前体化合物可以是具有式(LXI)的化学化合物:
其中R4是丙酰氧基或乙酰氧基,并且形成所形成的具有式(LIX)的第一多取代基裸盖菇素衍生化合物:
其中R4是丙酰氧基或乙酰氧基,其中R6是异戊二烯基。第一多取代基裸盖菇素衍生化合物可脱羧基以形成具有下式的第二多取代基裸盖菇素衍生物:
其中R4为丙酰氧基或乙酰氧基,其中R6为异戊二烯基。第二多取代基裸盖菇素衍生物可被甲基化以形成具有式(XLI)或(XLII)的第三多取代基裸盖菇素衍生物:
进一步参考图14B,注意到为了使S14裸盖菇素衍生物前体化合物异戊二烯化,可以使用二甲基烯丙基焦磷酸酯(DMAPP)作为含取代基的化合物。其它含异戊二烯基的化合物,例如香叶基焦磷酸酯(GPP)、法尼基焦磷酸酯(FPP)和香叶基香叶基焦磷酸酯(GGPP)也可替代地用作含取代基的化合物。如图14B进一步所示,DMAPP本身可以任选地使用酸性磷酸酶和异戊烯基磷酸激酶作为催化酸由二甲基烯丙醇DMAOH生物合成(体外或体内)来形成,如Couillaud et al.,2019,ACS,Omega,4,7838-7859的进一步描述。
接下来参考图14C,在进一步的示例实施方式中,裸盖菇素衍生物前体化合物可以是具有式(LXII)的化学化合物:
其中R5是氯或氟原子,并且可以形成具有式(LXIII)的第一多取代基裸盖菇素衍生化合物:
其中R5是氯或氟原子,并且其中R6是异戊二烯基。第一多取代基裸盖菇素衍生物可以脱羧基以形成具有式(XXXVI)或(XXXVIII)的第二多取代基裸盖菇素衍生化合物:
/>
在一个进一步的示例实施方式中,裸盖菇素生物合成酶补体可以进一步包含N-乙酰基转移酶以乙酰化具有化学式(I)的第二裸盖菇素衍生物并且由此形成具有化学式(I)的第三多取代基裸盖菇素衍生物,其中R3a是氢原子且R3b是乙酰基,N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14C,在进一步的示例实施方式中,裸盖菇素衍生物前体化合物可以是具有式(LXII)的化学化合物:
其中R5是氯或氟原子,并且可以形成具有式(LXIII)的第一多取代基裸盖菇素衍生化合物:
其中R5是氯或氟原子,并且其中R6是异戊二烯基。第一多取代基裸盖菇素衍生化合物可以脱羧基以形成所形成的具有式(LXIV)的第二多取代基裸盖菇素衍生化合物:
其中R5为氯或氟原子,且其中R6为异戊二烯基。第二多取代基裸盖菇素衍生化合物可被乙酰化以形成具有式(XXXV)或(XXXVII)的第三多取代基裸盖菇素衍生物:
进一步参见图14C,类似于图14B中描绘的生物合成途径,为了将图14C所示的S15裸盖菇素衍生物前体化合物异戊二烯化,可以将二甲基烯丙基焦磷酸酯(DMAPP)用作含取代基的化合物。
接下来参考图14D和具有式(LVII)的裸盖菇素衍生物前体化合物,裸盖菇素生物合成酶补体可以例如包含色氨酸合酶亚基B多肽,其由选自以下的核酸编码:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2中所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
可以使用具有式(I)的第一裸盖菇素衍生物前体化合物,其中R2、R4、R5、R6或R7中的两个为独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中R3为氢原子。可以形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R3c是羧基。例如,裸盖菇素衍生物前体化合物可以是具有式(LXV)的化学化合物:
其中R4是羟基,并且其中R5是异戊二烯基,并且可以形成所形成的具有式(LI)的第一多取代基裸盖菇素衍生化合物:
裸盖菇素生物合成酶补体可以进一步包含色氨酸脱羧酶以使R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中R3a和R3b是氢原子,色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14D,例如,裸盖菇素衍生物前体化合物可以是具有式(LXV)的化学化合物:
其中R4是氟原子并且R5是腈基,可以形成所形成的具有式(LXIX)的第一多取代基裸盖菇素衍生化合物:
其中R4是氟原子且其中R5是腈基。然后可以通过使第一多取代基衍生化合物脱羧基来形成形成的第二多取代基裸盖菇素衍生化合物,第二多取代基裸盖菇素衍生化合物具有式(XIX):
在进一步的实施方式中,裸盖菇素生物合成酶补体可以进一步包含N-乙酰基转移酶以乙酰化具有化学式(I)的第二裸盖菇素衍生物,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中R3a是氢原子并且R3b是乙酰基,该N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14D,例如,裸盖菇素衍生物前体化合物可以是具有式(LXV)的化学化合物:
其中R4是氟原子并且R5是羟基或腈基,并且可以形成所形成的具有式(LXIX)的第一多取代基裸盖菇素衍生化合物:
其中R4为氟原子且其中R5为羟基或腈基。形成的第一多取代基裸盖菇素衍生物可以被脱羧基以形成具有式(LXXII)的第二多取代基裸盖菇素衍生化合物:
其中R4是氟原子,并且其中R5是羟基或腈基。然后,可以将形成的第二多取代基裸盖菇素衍生物乙酰化以形成具有式(XVII)或(XX)的第三多取代基裸盖菇素衍生物:
接下来参考图14E,裸盖菇素生物合成酶补体可以包含由选自以下的核酸编码的色氨酸合酶亚基B多肽:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2中所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个是独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中R3为氢原子,并且其中形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R3c是羧基。例如,裸盖菇素衍生物前体化合物可以是具有式(LXVI)的化学化合物:
其中R4是羟基,并且其中R7是异戊二烯基,并且可以形成所形成的具有式(XLIX)的第一多取代基裸盖菇素衍生化合物:
在进一步的实施方式中,裸盖菇素生物合成酶补体可以进一步包含色氨酸脱羧酶以使R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中R3a和R3b各自是氢原子,该色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14E,裸盖菇素衍生物前体化合物可以是具有式(LXVI)的化学化合物:
其中R4是氟原子并且R7是腈基,并且可以形成具有式(LXX)的第一多取代基裸盖菇素衍生化合物:
其中R4是氟原子并且其中R7是腈基。可以通过使第一多取代基裸盖菇素衍生化合物脱羧基来形成所形成的具有式(XXIV)的第二多取代基裸盖菇素衍生化合物:
在进一步的实施方式中,裸盖菇素生物合成酶补体可以进一步包含N-乙酰基转移酶以乙酰化具有化学式(I)的第二裸盖菇素衍生物,并且从而形成具有化学式(I)的第三多取代基裸盖菇素,其中R3a为氢原子并且R3b为乙酰基,该N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14E,裸盖菇素衍生物前体化合物可以是具有式(LXVI)的化学化合物:
其中R4是氟原子或氯原子并且R7是异戊二烯基或腈基,并且可以形成具有式(LXX)的多取代基裸盖菇素衍生化合物:
/>
其中R4是氟原子或氯原子并且其中R7是异戊二烯基或腈基。在第一个多取代基裸盖菇素衍生化合物脱羧之后,可以形成具有式(LXXIII)的第二多取代基裸盖菇素衍生化合物:
其中R4是氟原子或氯原子,并且其中R7是异戊二烯基或腈基。在乙酰化后,可以形成具有式(XXIII)或(XX)的第三多取代基裸盖菇素衍生物:
裸盖菇素生物合成酶补体可以进一步包含N-甲基转移酶以甲基化R3处的R3氨基并且形成具有化学式(I)的另外的多取代基裸盖菇素衍生物,其中R3a和R3b各自为甲基,或其中R3a为氢原子且R3b为甲基,该N-甲基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:11和SEQ.ID NO 13;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
在一个实施方式中,例如,裸盖菇素衍生物前体化合物可以是具有式(LXVI)的化学化合物:
其中R4是氯原子并且R7是羟基,并且可以形成所形成的具有式(LXX)的第一多取代基裸盖菇素衍生化合物:
其中R4是羟基并且其中R7是氯原子。在脱羧后,可以形成所形成的具有式(LXXIII)的第二多取代基裸盖菇素衍生化合物:
其中R4是羟基,并且其中R7是氯原子。在甲基化之后,可以形成具有式(XXXIX)的第三多取代基裸盖菇素衍生物:
接下来参考图14F,在另一个实施方式中,裸盖菇素生物合成酶补体可以包含由选自以下的核酸编码的色氨酸合酶亚基B多肽:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2中所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个是独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中R3为氢原子,并且其中形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R3c为羧基,并且裸盖菇素生物合成酶补体进一步包含色氨酸脱羧酶,以将第一多取代基裸盖菇素衍生化合物的R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中R3a和R3b各自为氢原子,该色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14F,裸盖菇素衍生物前体化合物可以是具有式(LXVII)的化学化合物:
其中R5为氟原子、氯原子或腈基,且R6为氟原子、氨基或异戊二烯基,并且可以形成所形成的具有式(LXIII)的第一多取代基裸盖菇素衍生化合物
其中R5是氟原子、氯原子或腈基并且其中R6是氟原子、氨基或异戊二烯基。在脱羧之后,可以形成所形成的具有式(XI)、(XVI)、(XXXVI)或(XXXVIII)的第二多取代基裸盖菇素衍生化合物:
裸盖菇素生物合成酶补体可以进一步包含N-乙酰基转移酶,以乙酰化具有化学式(I)的第二裸盖菇素衍生物,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中R3a为氢原子且R3b为乙酰基,该N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14F,在一个实施方式中,例如,裸盖菇素衍生物前体化合物可以是具有式(LXVII)的化学化合物:
其中R5是氟原子或氯原子并且R6是氨基、乙酰胺基、或异戊二烯基,并且可以形成所形成的具有式(LXIII)的第一多取代基裸盖菇素衍生化合物:
其中R5为氟原子或氯原子且其中R6为氨基、乙酰胺基或异戊二烯基。在脱羧后,可以形成具有式(LXXIV)的第二多取代基裸盖菇素衍生化合物:
其中R5是氟原子或氯原子,并且其中R6是氨基、乙酰胺基或异戊二烯基。在乙酰化后,可以形成具有式(XIV)、(XV)、(XXXV)或(XXXVII)的第三多取代基裸盖菇素衍生物:
裸盖菇素生物合成酶补体可以进一步包含N-甲基转移酶以甲基化R3处的R3氨基并且形成进一步的具有化学式(I)的多取代基裸盖菇素衍生物,其中R3a和R3b各自为甲基,或其中R3a为氢原子且R3b为甲基,该N-甲基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:11和SEQ.ID NO 13;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14F,裸盖菇素衍生物前体化合物可以是具有式(LXVII)的化学化合物:
其中R5是氯原子且R6是异戊二烯基,并且可以形成所形成的具有式(LXIII)的第一多取代基裸盖菇素衍生化合物:
其中R5是氯原子且其中R6是异戊二烯基。在脱羧之后,可以形成具有式(LXXIV)的第二多取代基裸盖菇素衍生化合物:
其中R5是氯原子,并且其中R6是异戊二烯基。在甲基化后,可以形成具有式(XLIV)的第三多取代基裸盖菇素衍生物:
接下来参考图14G,在另一个实施方式中,裸盖菇素生物合成酶补体可以包含由选自以下的核酸编码的色氨酸合酶亚基B多肽:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2中所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个是独立地选自下列中的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中R3为氢原子,并且其中形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R3c为羧基,并且裸盖菇素生物合成酶补体进一步包含色氨酸脱羧酶以将第一多取代基裸盖菇素衍生化合物的R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中R3a和R3b各自为氢原子,该色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14G,裸盖菇素衍生物前体化合物可以是例如具有式(LXVIII)的化学化合物:
其中R5是氟原子,并且R7是硝基或异戊二烯基,可以形成所形成的具有式(LXXI)的第一多取代基裸盖菇素衍生化合物:
其中R5是氟原子,并且其中R7是硝基原子或异戊二烯基。在脱羧后,可以形成所形成的具有式(XIII)或(XXXIII)的第二多取代基裸盖菇素衍生化合物:
在一个实施方式中,裸盖菇素生物合成酶补体可以进一步包含N-乙酰基转移酶以乙酰化具有化学式(I)的第二裸盖菇素衍生物,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中R3a为氢原子且R3b为乙酰基,该N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
继续参考图14G,裸盖菇素衍生物前体化合物可以是例如具有式(LXVIII)的化学化合物:
其中R5是氟原子,并且R7是硝基或异戊二烯基,可以形成所形成的具有式(LXXI)的第一多取代基裸盖菇素衍生化合物:
其中R5是氟原子,并且其中R7是硝基原子或异戊二烯基。在其脱羧之后,可以形成所形成的具有式(LXXV)的第二多取代基裸盖菇素衍生化合物:
其中R5是氟原子,并且其中R7是硝基或异戊二烯基。在其乙酰化之后,可以形成具有式(XII)或(XXXII)的第三多取代基裸盖菇素衍生物:
如上所述,在一些实施方式中,多取代基裸盖菇素衍生物可以通过采用合成和生物合成方法的组合来制备。因此,例如,参考图13D,化合物13-D4可以根据图13D所示的合成示意图合成制备(并且如本文实施例42中进一步描述)。然后,使用异戊二烯基转移酶在体外或体内将化合物13-D4异戊二烯化以形成例如化合物13-D4的C6异戊二烯化衍生物。
因此,在一个实施方式中,裸盖菇素生物合成酶补体可以含有由选自以下的核酸编码的异戊二烯基转移酶:
(a)SEQ.ID NO:15、SEQ.ID NO:17、SEQ.ID NO:19和SEQ.ID NO 21;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO 22中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO 22中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7之一是选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中R3为氢原子,并且其中形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中R3c是羧基或氢原子。
在一个实施方式中,裸盖菇素衍生物前体化合物可以具有式(LXXVII):
并且可以形成具有式(LXXVI)的多取代基裸盖菇素衍生化合物:
本领域技术人员将清楚,可以选择多种不同的裸盖菇素前体化合物。图14A和14G在这方面提供了指导并允许本领域技术人员选择合适的裸盖菇素衍生物前体化合物和匹配的裸盖菇素生物合成酶补体。
当根据本公开的方法由宿主细胞产生多取代基裸盖菇素化合物时,可以从宿主细胞悬浮液中提取多取代基裸盖菇素衍生化合物,并与宿主细胞悬浮液内的其它成分(例如介质成分和细胞碎片)分离。分离技术是本领域技术人员已知的,并且包括例如溶剂萃取(例如丁烷、氯仿、乙醇)、基于柱色谱的技术(例如高效液相色谱(HPLC))和/或基于逆流分离(CCS)的系统。回收的多取代基裸盖菇素衍生化合物可以基本纯净的形式获得,例如可以获得至少约60%(w/w)、约70%(w/w)、约80%(w/w)、约90%(w/w)、约95%(w/w)、约96%(w/w)、约97%(w/w)、约98%(w/w)或约99%(w/w)纯度的多取代基衍生物裸盖菇素化合物的制剂。因此,以这种方式,可以制备基本纯净的形式的多取代基裸盖菇素衍生物。
现在从前述内容将清楚,本文公开了新颖的多取代基裸盖菇素衍生物,以及制备多取代基裸盖菇素衍生物的方法。多取代基裸盖菇素化合物可配制用于用作制药药物或娱乐性药品。
序列总结
SEQ.ID NO:1阐述了编码命名为PfTrpB-B0A9的色氨酸合酶亚基B多肽的激烈火球菌核酸序列。
SEQ.ID NO:2阐述了命名为PfTrpB-B0A9的激烈火球菌亚基B色氨酸合酶亚基B多肽的推导氨基酸序列。
SEQ.ID NO:3阐述了编码命名为BaTDC的色氨酸脱羧酶多肽的萎缩芽孢杆菌核酸序列。
SEQ.ID NO:4阐述了命名为BaTDC的萎缩芽孢杆菌色氨酸脱羧酶多肽的推导氨基酸序列。
SEQ.ID NO:5阐述了编码命名为ClostSporTDC的色氨酸脱羧酶多肽的担孢子梭菌(Clostridium sporidium)核酸序列。
SEQ.ID NO:6阐述了命名为ClostSporTDC的担孢子梭菌色氨酸脱羧酶多肽的推导氨基酸序列。
SEQ.ID NO:7阐述了编码PsiD多肽的古巴裸盖菇核酸序列。
SEQ.ID NO:8阐述了古巴裸盖菇PsiD多肽的推导氨基酸序列。
SEQ.ID NO:9阐述了编码命名为PmsF的N-乙酰转移酶的灰褐链霉菌核酸序列。
SEQ.ID NO:10阐述了命名为PmsF的灰褐链霉菌N-乙酰基多肽的推导氨基酸序列。
SEQ.ID NO:11阐述了编码命名为EsNMT的N-甲基转移酶的草麻黄核酸序列。
SEQ.ID NO:12阐述了命名为EsNMT的草麻黄N-甲基转移酶多肽的推导氨基酸序列。
SEQ.ID NO:13阐述了编码PsiM多肽的古巴裸盖菇核酸序列。
SEQ.ID NO:14阐述了古巴裸盖菇PsiM多肽的推导氨基酸序列。
SEQ.ID NO:15阐述了编码命名为7DMATS的色氨酸7-异戊二烯基转移酶多肽的烟曲霉核酸序列。
SEQ.ID NO:16阐述了命名为7DMATS的烟曲霉色氨酸7-异戊二烯基转移酶多肽的推导氨基酸序列。
SEQ.ID NO:17阐述了编码命名为PriB的6-异戊二烯基转移酶多肽的链霉菌属物种RM-5-8核酸序列。
SEQ.ID NO:18阐述了命名为PriB的链霉菌属物种RM-5-8 6-异戊二烯基转移酶多肽的推导氨基酸序列。
SEQ.ID NO:19阐述了编码命名为SCO7467的色氨酸5-异戊二烯基转移酶多肽的天蓝色链霉菌核酸序列。
SEQ.ID NO:20阐述了命名为SCO7467的天蓝色链霉菌色氨酸5-异戊二烯基转移酶多肽的推导氨基酸序列。
SEQ.ID NO:21阐述了编码命名为FgaPT2的色氨酸4-异戊二烯基转移酶多肽的烟曲霉核酸序列。
SEQ.ID NO:22阐述了命名为FgaPT2的烟曲霉色氨酸4-异戊二烯基转移酶多肽的推导氨基酸序列。
SEQ.ID NO:23阐述了编码PsiH多肽的古巴裸盖菇核酸序列。
SEQ.ID NO:24阐述了古巴裸盖菇PsiH多肽的推导氨基酸序列。
SEQ.ID NO:25阐述了编码CPR多肽的古巴裸盖菇核酸序列。
SEQ.ID NO:26阐述了古巴裸盖菇CPR多肽的推导氨基酸序列。
SEQ.ID NO:27阐述了可用作整合盒的人工核酸,命名为XII-4::TADH1-PsiH-HA-PPGK1-PTDH3-CPR-c-myc-TCYC1。
SEQ.ID NO:28阐述了可用作整合盒的人工核酸,命名为XII-5::TADH1-PsiK-V5-PPGK1-PTDH3-PsiM-FLAG-TCYC1。
SEQ.ID NO:29阐述了可用作整合盒的人工核酸,命名为pMM1-PTDH3-ClostSporTDC-His-TCYC1。
SEQ.ID NO:30阐述了有用作启动子的人工核酸,命名为PGK1_启动子。
SEQ.ID NO:31阐述了可用作启动子的人工核酸,命名为TDH3_启动子。
SEQ.ID NO:32阐述了可用作启动子的人工核酸,命名为CLN1_启动子。
SEQ.ID NO:33阐述了可用作启动子的人工核酸,命名为UGA1_启动子。
SEQ.ID NO:34阐述了可用作载体的人工核酸,命名为pMM1。
SEQ.ID NO:35阐述了可用作载体的人工核酸,命名为pCDM4。
SEQ.ID NO:36阐述了可用作载体的人工核酸,命名为pET28a(+)。
SEQ.ID NO:37阐述了可用作载体的人工核酸,命名为pET23(+)。
SEQ.ID NO:38阐述了编码可用作标签的命名为HA-标签的多肽序列的人工核酸。
SEQ.ID NO:39阐述了可用作标签的命名为HA-标签的人工多肽序列。
SEQ.ID NO:40阐述了编码可用作标签的命名为c-myc-标签的多肽序列的人工核酸序列。
SEQ.ID NO:41阐述了可用作标签的命名为c-myc-标签的人工多肽序列。
SEQ.ID NO:42阐述了编码可用作标签的命名为FLAG-标签的多肽序列的人工核酸序列。
SEQ.ID NO:43阐述了可用作标签的命名为FLAG-标签的人工多肽序列。
SEQ.ID NO:44阐述了编码可用作标签的命名为V5-标签的多肽序列的人工核酸序列。
SEQ.ID NO:45阐述了可用作标签的命名为V5-标签的人工多肽序列。
SEQ.ID NO:46阐述了编码可用作标签的命名为His-标签的多肽序列的人工核酸序列。
SEQ.ID NO:47阐述了可用作标签的命名为His-标签的人工多肽序列。
SEQ.ID NO:48阐述了编码PsiK多肽的古巴裸盖菇核酸序列。
SEQ.ID NO:49阐述了古巴裸盖菇PsiK多肽的推导氨基酸序列。
SEQ.ID NO:50阐述了可用作整合盒的人工核酸,命名为X-3::TADH1-BaTDC-Flag-PPGK1-PTDH3-CPR-c-myc-TCYC1。
SEQ.ID NO:51阐述了可用作整合盒的人工核酸,命名为Xii-2::TADH1-PPGK1-PTDH3-PriB-His-TCYC1。
SEQ.ID NO:52阐述了可用作整合盒的人工核酸,命名为X-3::TADH1-ClostSporTDC-Flag-PPGK1-PTDH3-CPR-c-myc-TCYC1。
SEQ.ID NO:53阐述了可用作整合盒的人工核酸,命名为Xii-2::TADH1-PPGK1-PTDH3-Af-7DMATS-His-TCYC1。
SEQ.ID NO:54阐述了可用作载体的人工核酸,命名为pET26b(+)。
序列
SEQ.ID NO:1
SEQ.ID NO:2
SEQ.ID NO:3
SEQ.ID NO:4
SEQ.ID NO:5
SEQ.ID NO:6
SEQ.ID NO:7
SEQ.ID NO:8
SEQ.ID NO:9
SEQ.ID NO:10
SEQ.ID NO:11
SEQ.ID NO:12
SEQ.ID NO:13
SEQ.ID NO:14
SEQ.ID NO:15
SEQ.ID NO:16
SEQ.ID NO:17
SEQ.ID NO:18
SEQ.ID NO:19
SEQ.ID NO:20
SEQ.ID NO:21
SEQ.ID NO:22
SEQ.ID NO:23
SEQ.ID NO:24
SEQ.ID NO:25
SEQ.ID NO:26
/>
SEQ.ID NO:27
/>
/>
SEQ.ID NO:28
/>
/>
SEQ.ID NO:29
/>
/>
/>
SEQ.ID NO:30
SEQ.ID NO:31
SEQ.ID NO:32
SEQ.ID NO:33
SEQ.ID NO:34
/>
/>
SEQ.ID NO:35
/>
/>
SEQ.ID NO:36
/>
/>
SEQ.ID NO:37
/>
SEQ.ID NO:38
SEQ.ID NO:39
YPDVPDYA
SEQ.ID NO:40
SEQ.ID NO:41EQKLISEEDL
SEQ.ID NO:42
SEQ.ID NO:43
DYKDDDDK
SEQ.ID NO:44
SEQ.ID NO:45
SEQ.ID NO:46
SEQ.ID NO:47
HHHHHH
SEQ.ID NO:48
SEQ.ID NO:49
SEQ.ID NO:50
/>
/>
SEQ.ID NO:51
/>
SEQ.ID NO:52
/>
/>
SEQ.ID NO:53
/>
SEQ.ID NO:54
/>
实施例
实施例1-第一多取代基裸盖菇素衍生物的生物合成
如下构建了大肠杆菌菌株E1。对于质粒克隆,根据抗生素志物使用Top10或XL1-蓝菌株。使用标准LB培养基进行培养。对于基因表达和喂养实验,使用的亲本宿主菌株是BL21(DE3)。首先,通过将框内HIS标记的(SEQ.ID NO:46)PfTrpB-B0A9基因(SEQ.ID NO:1)插入pET28a(+)(SEQ.ID NO:36)的NdeI/XhoI位点中,创建了质粒pET28a(+)-PfTrpB-B0A9-HIS。作为第二步,从质粒pCDM4(SEQ.ID NO:35),通过将框内HIS-标记的(SEQ.ID NO:46)BaTDC基因(SEQ.ID NO:3)插入到pCDM4的NdeI/XhoI位点,创建了质粒pCDM4-BaTDC-HIS。最后,从质粒pET23a(+)(SEQ.ID NO:37),通过将框内HIS-标记的(SEQ.ID NO:46)PsmF基因(SEQ.IDNO:9)插入到pET23a(+)的Nde1/Xho1位点,创建了质粒pET23a(+)-PsmF-HIS。将靶质粒pET28a(+)-PfTrpB-B0A9-HIS、pCDM4-BaTDC-HIS和pET23a(+)-PsmF-HIS转化到BL21(DE3)细胞中,如下:首先将pCDM4-BaTDC-HIS转化到BL21(DE3)细胞中,并且用pET28a(+)-PfTrpB-B0A9-HIS和pET23a(+)-PsmF-HIS一起转化使用链霉素选择的转化体。用链霉素、氨苄青霉素和卡那霉素选择最终的大肠杆菌菌株(Ec-1)。如下进行工程化大肠杆菌的放大培养:将种子培养物接种在AMM(Jones et al.,2015,Sci Rep.5:11301)培养基中过夜。然后,将过夜培养物分入到两个烧瓶中,每个烧瓶各含有500mL AMM培养基,其附加地含有0.5%(w/v)丝氨酸,1M IPTG,50ug/L链霉素、氨苄青霉素和卡那霉素以及用于由Ec-1转化的100mg/L吲哚原料(6-氟-1H-吲哚-4-基胺;www.bldpharm.com)。培养物生长24小时。然后将培养物离心(10,000g x 5分钟)以除去细胞内容物,并且将含有分泌衍生物的培养肉汤合并并且储存在-80℃下直至进一步处理。向1.0L肉汤中添加10M NaOH溶液直至pH达到~7。然后用乙酸乙酯(4×600ml)萃取培养物。合并有机层并经Na2SO4干燥,随后减压浓缩。将残余物通过硅胶快速色谱法纯化(二氯甲烷中1→2%甲醇),得到浅黄色固体状的化合物(7mg)。在纯化后,进行高分辨率MS(HRMS)、1H NMR和选择性13C NMR以评估纯度、估计总量并确认分子结构。1H NMR(400MHz,CD3OD):δ=1.94(s,3H),3.00(m,2H,),3.38(m,2H,),6.10(dd,J=11.7,2.2Hz,1H),6.38(dd,J=9.7,2.2Hz,1H),6.84(s,1H)。13C NMR(100MHz,CD3OD):δ=21.0,29.2,41.9,87.1(d,JC,F=26.1Hz),92,6(d,JC,F=27.8Hz),111.6,112.4,120.7,138.0(d,JC,F=15.0Hz),141.7(d,JC,F=13.2Hz),160.7(d,JC,F=232.5Hz),172.1。HRMS(ESI)m/z:计算的C12H14FN3O[M+H]+236.1194,发现236.1189。纯度测定为95%w/w。应注意的是,这些数据证实了与本文所述的示例化合物(IX)相对应的化学结构:
裸盖菇素衍生物处理后细胞存活率的评估
为了建立用于竞争性结合测定的合适配体浓度,首先进行PrestoBlue测定。PrestoBlue测定基于四唑盐形成来测量细胞代谢活性,并且是常规细胞存活率测定的优选方法(Terrasso et al.,2017,J Pharmacol Toxicol Methods 83:72)。这些测定的结果是使用对照配体(例如裸盖菇素、裸头草辛、DMT)和新型衍生物进行的,部分是作为在浓度高达1mM时对细胞培养物的任何显着毒性作用的预筛选。一种已知的细胞毒素(Triton X-100,Pyrgiotakis G.et al.,2009,Ann.Biomed.Eng.37:1464-1473)被包括作为毒性的一般标志物。在简单的体外系统(例如HepG2细胞系)中药物诱导的细胞健康变化通常被用作制药行业的一线筛选方法(Weaver et al.,2017,Expert Opin Drug Metab Toxicol 13:767)。HepG2是一种人类肝癌,最常用于药物代谢和肝毒性研究(Donato et al.,2015,Methods Mol Biol 1250:77)。在此,使用制造商的协议(ATCC,HB-8065)使用标准程序培养HepG2细胞。简而言之,细胞在补充有10%胎牛血清的Eagle最低必需培养基中培养,并且在5%CO2存在下在37℃下生长。为了用细胞系测试各种化合物,将细胞以每孔20,000个细胞接种在透明的96孔培养板中。让细胞贴壁并生长24小时后,添加1μM、10μM、100μM和1mM的化合物。使用浓度为0.001、0.01、0.1和1%的甲醇作为载具。作为毒性的阳性对照,使用的TritonX浓度为0.0001、0.001、0.01和0.1%。将细胞与化合物一起温育48小时,然后按照制造商的协议(ThermoFisher Scientific,P50200)使用PrestoBlue测定法检测细胞存活率。将PrestoBlue试剂添加到细胞中并在读数前温育1小时。在SpectraMax iD3读板器上,在570nm处读取吸光度读数,并在600nm处进行参考。未处理的细胞被指定为100%存活率。条形图显示平均值+/-SD,n=3。通过双因素ANOVA和Dunnett多重比较检验确定显著性,并用***(P<0.0001)、**(P<0.001)、*(P<0.005)表示。对于具有化学式(IX)的衍生物获得的数据,在图15A的x轴上显示为“IX”。
放射性配体受体结合测定
药物结合评价是表征所有药物-靶标相互作用的必要步骤(Fang 2012,Exp OpinDrug Discov 7:969)。传统上,药物与靶标的结合亲和力被视为其体内功效的可接受替代指标(et al.,2012,Drug Disc Today 17:10)。竞争测定也称为置换或调节结合测定,是测量配体在靶受体上的活性的常用方法(Flanagan 2016,Methods Cell Biol 132:191)。在这些测定中,充当激动剂或拮抗剂的标准放射性配体归因于特定受体。在G蛋白-偶联受体5-HT2A的情况下,[3H]酮色林是一种成熟的拮抗剂,常用于竞争测定,以评估新候选药物在5-HT2A受体上的竞争活性(Maguire et al.,2012,Methods Mol Biol 897:31)。因此,为了评价新型裸盖菇素衍生物在5-HT2A受体处的活性,如下采用使用[3H]酮色林的竞争测定。SPA珠(RPNQ0010)、[3H]酮色林(NET1233025UC)、含5-HT2A的膜(ES-313-M400UA)和isoplate-96微孔板(6005040)均购自PerkinElmer。使用闪烁邻近测定(SPA)进行放射性结合分析。对于饱和结合测定,在室温下在管旋转器中1小时在结合缓冲液(50mM Tris-HClpH7.4,4mM CaCl2,1mM抗坏血酸,10mM巴吉林HCl)中将10ug含有5-HT2A受体的膜的混合物预偶联至1mg SPA珠。在预偶联后,将珠和膜等分在isoplate-96微孔板中,其具有逐渐增加量的[3H]酮色林(0.1525nM至5nM),并且在室温下避光摇动温育两小时。温育后,在MicroBeta2微孔板计数器(Perkin Elmer)上读取样品。在20mM螺哌隆(S7395-250MG,Sigma)存在下进行非特异性结合的测定。使用GraphPad PRISM软件(版本9.2.0)的“单位点饱和结合分析”方法,从饱和结合曲线确定酮色林的平衡结合常数(Kd)。使用固定的(1nM)[3H]酮色林和不同浓度的色氨酸(3nM至1mM)、裸头草辛(30pM至10mM)或未标记的测试化合物(3nM至1mM)进行竞争性结合测定,类似于饱和结合测定。使用GraphPad PRISM软件的竞争结合分析从竞争转换数据计算得出的Ki值。包括色氨酸作为阴性对照,因为它在5-HT2A受体上没有活性。相反,将裸头草辛用作阳性对照,因为它已在5-HT2A受体上建立了结合活性(Kim et al.,2020,Cell 182:1574)。图15B描绘了[3H]酮色林在5-HT2A受体处的饱和结合曲线。图A显示了[3H]酮色林(从0.1525nM到5nM)与含有5-HT2A受体的膜的特异性饱和配体结合,这是在减去非特异性结合值后获得的(如图B所示)。通过从总结合中减去非特异性结合来计算每分钟的特异性结合计数(cpm)。特异性结合(pmol/mg)是从测定中每mg蛋白质结合的[3H]酮色林的pmol来计算的。通过将数据与PRISM软件(版本9.2.0)的单位点结合模型进行拟合来计算Kd。图15C(图A)显示了作为阳性对照(结合)的裸头草辛的竞争结合曲线。(图B)显示了作为阴性对照(无结合)的色氨酸的竞争结合曲线。图15D显示了具有式(IX)的化合物的竞争结合曲线,在图中指定为“IX”。值得注意的是,没有完整显现化合物(IX)对[3H]酮色林占据的5-HT2A位点的竞争,正如仅~50%特异性结合所表明的那样(参考图B,为了清楚起见,它使用重新格式化的y轴重新绘制了图A的数据)。已知酮色林结合通常由激动剂(例如血清素)占据的两个主要位点以及除5-HT2A外的其它位点(Sleight et al.,1996,BiochemPharmacol 51:71);因此,化合物(IX)的不完全竞争意味着该衍生物竞争由酮色林结合的全部位点的特定子集(即一部分)。
用于评估在5-HT1A处活性的细胞系和对照配体
使用了CHO-K1/Gα15(GenScript,M00257)(-5-HT1A)和CHO-K1/5-HT1A/Gα15(GenScript,M00330)(+5-HT1A)细胞系。简而言之,CHO-K1/Gα15是组成型表达Gα15的对照细胞系,Gα15是一种混杂的Gq蛋白。这一对照细胞系缺乏任何编码5-HT1A受体的转基因,但仍对毛喉素有响应;因此,无论是否存在5-HT1A激动剂,cAMP对毛喉素的响应应该是相同的。相反,CHO-K1/5-HT1A/Gα15细胞在CHO-K1宿主背景中稳定表达5-HT1A受体。值得注意的是,Gα15是一种混杂的G蛋白,已知可诱导钙通量响应,存在于对照细胞系和5-HT1A细胞系中。在+5-HT1A细胞中,Gα15可能会被招募来代替Gαi/o,这理论上可以抑制cAMP响应(Rojas andFiedler 2016,Front Cell Neurosci 10:272)。因此,我们纳入了两种已知的5HT1A激动剂,裸头草辛(Blair et al.,2000,J Med Chem 43:4701)和血清素(Rojas and Fiedler2016,Front Cell Neurosci 10:272),作为阳性对照,以确保观察到足够的cAMP响应,从而指示Gαi/o蛋白可测量地募集到激活的5-HT1A受体。相反,已知色氨酸不会以任何方式激活或调节5HT1A受体,并因此被用作阴性对照。按照供应商(GenScript)的推荐,将细胞维持在完全生长培养基中,其组成如下:Ham’s F12营养混合物(HAM’s F12,GIBCO#11765-047)与10%胎牛血清(FBS)(Thermo Scientific#12483020),200μg/ml博莱霉素(ThermoScientific#R25005)和/或100μg/ml潮霉素(Thermo Scientific#10687010)。在37℃和5%CO2的湿润培养箱中培养细胞。按照细胞供应商的建议进行细胞维护。简而言之,将装有细胞的小瓶从液氮中取出并在37℃水浴中快速解冻。在细胞完全解冻之前,用70%乙醇喷雾对小瓶外部进行消毒。然后从小瓶中取出细胞悬浮液并添加到温热(37℃)的完全生长培养基中,并以1,000rpm离心5分钟。弃去上清液,然后将细胞沉淀重悬于另外10ml完全生长培养基中,并添加至10cm细胞培养皿(Greiner Bio-One#664160)中。每三天更换一次培养基,直到细胞约90%汇合。然后将~90%汇合的细胞按10:1分割以进行维护或用于实验。
5-HT1A受体调节的评价
由于5-HT1A激活抑制了cAMP形成,因此通过由于应用4μM毛喉素而产生的cAMP水平的变化来测量测试分子调节5-HT1A响应的能力。使用cAMP-Glo测定试剂盒(Promega#V1501)评估由于新分子治疗而引起的细胞内cAMP水平的变化(如果发生任何显著变化)。简而言之,将+5-HT1A细胞接种在白壁透明底96孔板(Corning,#3903)的第1-6列上,并将基础-5-HT1A细胞接种在第7-12列上。将两种细胞以30,000个细胞/孔的密度接种在100μl完全生长培养基中,并在37℃和5%CO2的加湿培养箱中培养24小时。实验当天,将细胞培养基更换为无血清/抗生素培养基。然后,用溶解在诱导培养基(含有4μM毛喉素、500mM IBMX(异丁基-1-甲基黄嘌呤,Sigma-Aldrich,Cat.#17018)和100mM(RO 20-1724,Sigma-Aldrich,Cat.#B8279)的无血清/无抗生素培养基)中的测试分子将细胞处理20分钟。毛喉素诱导cAMP形成,而IBMX和RO 20-1724抑制cAMP降解。将PKA添加到裂解液中,混合,然后添加PKA的底物。PKA被cAMP激活,并且由于PKA磷酸化所消耗的ATP量直接对应于裂解物中的cAMP水平。ATP减少导致荧光素向氧化荧光素的转化减少,5-HT1A激活导致发光减弱。总之:这种信号级联允许通过测试分子激活5-HT1A(正向调节),并根据降低的%cAMP进行测量。相反,当5-HT1A受体受到测试分子的负调节时,%cAMP预计会增加。最后,%cAMP没有显著变化(超出阴性对照实验(例如使用色氨酸)观察到的变化),表明测试分子不结合5-HT1A或结合产生了沉默响应。图15E显示了在固定(4μM)毛喉素的存在下,随着裸头草辛剂量的增加,与-5HT1A培养物相比,+5HT1A培养物中%cAMP降低,揭示了裸头草辛的5-HT1A活性。图15F显示了在固定(4μM)毛喉素的存在下,随着血清素剂量的增加,与-5HT1A培养物相比,+5HT1A培养物中的%cAMP降低,揭示了血清素的5-HT1A活性。图15G显示在固定(4μM)毛喉素的存在下,随着色氨酸剂量的增加,与-5HT1A培养物相比,+5HT1A培养物的%cAMP没有显著差异,表明色氨酸不调节5-HT1A活性。图15H显示,在固定(4μM)毛喉素的存在下,随着化合物(X)剂量的增加,与-5HT1A培养物相比,+5HT1A培养物的%cAMP没有显著差异,表明化合物(X)不调节5-HT1A活性。注意,化合物(X)沿x轴简单地显示为“X”。图15H显示,在固定(4μM)毛喉素的存在下,随着化合物(IX)剂量的增加,与-5HT1A培养物相比,+5HT1A培养物的%cAMP没有显著差异,表明化合物(IX)不调节的5-HT1A活性。注意,化合物(IX)沿x轴简单地显示为“IX”。对于图15E-15H,相对于在无配体(0mM)样品中观察到的报告cAMP水平(%);x轴上的值“0”是指配体浓度为0.0001mM;并且当存在时,误差条代表三个实验的结果(n=3)。
实施例2-第二多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-1从衍生化吲哚原料生物合成具有式(X)的裸盖菇素衍生物。Ec-1的构建描述于实施例1中。如实施例1所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用4-氟-1H-吲哚-6-基胺(Combi-Blocks,www.combi-blocks.com)来代替6-氟-1H-吲哚-4-基胺。如实施例1中所述进行工程化大肠杆菌的放大培养和加工,不同之处在于培养总量为2.0L。用乙酸乙酯(4×1.2L)萃取两升大肠杆菌培养肉汤。合并有机层,用Na2SO4干燥,然后减压浓缩。将残余物通过硅胶快速色谱法纯化(在二氯甲烷中1→3%甲醇),得到呈黄色固体的化合物(5mg)。纯化后,进行高分辨率MS(HRMS)、1H NMR和选择性13C NMR以评估纯度、估计总量并确认分子结构。1H NMR(400MHz,CD3OD):δ=1.92(s,3H),2.14(s,3H),2.98(t,J=7.2,2H),3.47(t,J=7.2,2H,),6.82(dd,J=12.9,1.6Hz,1H),7.00(s,1H),7.56(d,J=1.6Hz,1H)。13C NMR(100MHz,CD3OD):δ=21.1,22.4,25.9,40.5(d,JC,F=2.0Hz),97.5(d,JC,F=24.0Hz),98.9(d,JC,F=3.4Hz),110.5(d,JC,F=2.8Hz),112.6(d,JC,F=20.0Hz),122.6,133.1(d,JC,F=10.5Hz),139.2(d,JC,F=13.6Hz),156.2(d,JC,F=242.5Hz),170.0,171.8。HRMS(ESI)m/z:计算的C12H16FN3O2[M+H]+278.1299,发现278.1298。纯度测定为95%w/w。应注意的是,这些数据证实了与本文所述的示例化合物(X)相对应的化学结构:
裸盖菇素衍生物处理后细胞存活率的评估
如实施例1所述评估细胞活力,不同之处在于评估具有式(X)的化合物而不是具有式(IX)的化合物。图16A显示了具有式(X)的化合物的PrestoBlue测定结果,在x轴上描绘为“X”。
放射性配体受体结合测定
如实施例1所述评估在5-HT2A受体处的活性,不同之处在于评估具有式(X)的化合物而不是具有式(IX)的化合物。图16B显示了具有式(X)的化合物的放射性配体竞争测定结果,在x轴上简单地描绘为“X”。与裸头草辛相比,化合物(X)的Ki值相对较高,表明结合相对“松散”,或者化合物(X)与酮色林对5-HT2A相互作用的存在轻度竞争。对于司来吉兰(Tollet al.,NIDARes.Monogr.1998,178:440)和麦司卡林(Rickli et al.,Neuropharmacology2015,99:546)等药物,对5-HT2A的类似高Ki值(例如微摩尔范围)表示温和或“松散”的结合特性,司来吉兰是一种治疗重度抑郁症MDMA的重要治疗(Simmler et al.,Br.J.Pharmacol.2013,168:458;Setola et al.,Molec Pharmacol 2003,63:1223),麦司卡林是备受瞩目的潜在抑郁症治疗(Liechti et al.,Curr Top Behav Neurosci 2021,doi:10.1007/7854_2021_270)。
细胞系、对照配体和5-HT1A受体调节的评估
细胞系和对照配体如实施例1中所述。如实施例1所述评估在5-HT1A受体处的活性,不同之处在于评估具有式(X)的化合物而不是具有式(IX)的化合物。图16C显示了相对cAMP以%为单位测量的5-HT1A测定结果,其中具有式(X)的化合物在x轴上简单地描绘为“X”。图16C显示,在固定(4μM)毛喉素的存在下,随化合物(X)的剂量增加,与-5HT1A培养物相比,+5HT1A培养物%cAMP没有显著差异,表明化合物(X)不调节5-HT1A活性。
实施例3-第三多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-1从衍生化吲哚原料生物合成具有式(XII)的裸盖菇素衍生物。Ec-1的构建描述于实施例1中。如实施例1中所述进行工程化大肠杆菌的放大培养和材料储存,不同的是使用5-氟-7-硝基-1H-吲哚(www.bldpharm.com)代替6-氟-1H-吲哚-4-基胺。如实施例1中所述进行工程化大肠杆菌的放大培养和加工。使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)采用先前描述的方法(Chang et al.,2015,Plant Physiol.169:1127-1140)的修改版本进行分析,不同之处在于液相色谱是使用配备Poroshell 120SB-C18柱(Agilent Technologies)的UltiMate 3000HPLC(Thermo FisherScientific)而不是配备Zorbax C18柱(Agilent Technologies)的Accela HPLC系统(Thermo Fisher Scientific)进行的。简而言之,将100微升培养基干燥并重悬于100微升DMSO中。以0.5mL/min的流速注入该悬浮液的十分之一(10微升),并且溶剂A(含0.1%甲酸的水)和溶剂B(含0.1%甲酸的乙腈)的梯度如下:5min内,100%到0%(v/v)溶剂A;在0%(v/v)下等度1min;0.1min内0%到100%(v/v);和在100%(v/v)等度1.9min。总运行时间为8分钟。加热的ESI源和界面条件在正离子模式下操作如下:汽化器温度,400℃;源电压,3kV;鞘气,60au,辅助气体,20au;毛细管温度,380℃;毛细管电压,6V;管状透镜,45V。使用Orbitrap检测在100-500m/z范围内的m/z,将仪器作为单个HR扫描事件进行。离子注入时间为300ms,扫描时间为1s。外部和内部校准程序确保<2ppm误差,以促进元素式预测。与具有化学式(XII)的N-[2-(5-氟-7-硝基-1H-吲哚-3-基)乙基]乙酰胺的单质子化形式匹配的具有精确m/z和预期元素式的单质子化产物在4.0分钟时洗脱(EIC,参见:图17A):
根据标准程序(Menéndez-Perdomo et al.,2021,Mass Spectrom 56:34683),在专用的LTQ后氮气碰撞池中使用高能碰撞(HCD)进行进一步分析。采用基于Orbitrap的HR片段检测(归一化碰撞能量,NCE 35),使得有机会将元素式分配给具有式(XII)的目标裸盖菇素衍生物的后续诊断离子种类特征,如下(图17B,表1)(Servillo L.et al.,2013,J.Agric.Chem.61:5156-5162)。
表1
实施例4-第四多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-1从衍生化吲哚原料生物合成具有式(XIV)的裸盖菇素衍生物。Ec-1的构建描述于实施例1中。如实施例1中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用5-氟-1H-吲哚-6-基胺(www.bldpharm.com)代替6-氟-1H-吲哚-4-基胺。如实施例1中所述进行工程化大肠杆菌的放大培养和加工。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XIV)的N-[2-(6-乙酰氨基-5-氟-1H-吲哚-3-基)乙基]乙酰胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在3.2分钟时洗脱(EIC,参见:图18A):
/>
根据标准程序(Menéndez-Perdomo et al.,2021,Mass Spectrom 56:34683),在专用的LTQ后氮气碰撞池中使用高能碰撞(HCD)进行进一步分析。采用基于Orbitrap的HR片段检测(归一化碰撞能量,NCE 35),使得有机会将元素式分配给具有式(XIV)的目标裸盖菇素衍生物的后续诊断离子种类特征,如下(图18B,表2)(Servillo L.et al.,2013,J.Agric.Chem.61:5156-5162)。
表2
实施例5-第四多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-1从衍生化吲哚原料生物合成具有式(XV)的裸盖菇素衍生物。Ec-1的构建描述于实施例1中。如实施例1中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于培养进行14小时而不是24小时,并且使用5-氟-1H-吲哚-6-基胺(www.bldpharm.com)代替6-氟-1H-吲哚-4-基胺。如实施例3中所述使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XV)的N-[2-(6-乙酰氨基-5-氟-1H-吲哚-3-基)乙基]乙酰胺的单质子化形式匹配的具有精确m/z和预期元素式的单质子化产物在2.5分钟时洗脱(EIC,参见:图19A):
根据标准程序(Menéndez-Perdomo et al.,2021,Mass Spectrom 56:34683),在专用的LTQ后氮气碰撞池中使用高能碰撞(HCD)完成进一步分析。采用基于Orbitrap的HR片段检测(归一化碰撞能量,NCE 35),使得有机会将元素式分配给具有式(XV)的目标裸盖菇素衍生物的后续诊断离子种类特征,如下(图19B,表3)(Servillo L.et al.,2013,J.Agric.Chem.61:5156-5162)。
表3
实施例6-第六多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-1从衍生化吲哚原料生物合成具有式(XVII)的裸盖菇素衍生物。Ec-1的构建描述于实施例1中。如实施例1中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用4-氟-1H-吲哚-5-甲腈(www.bldpharm.com)代替6-氟-1H-吲哚-4-基胺。如实施例1中所述进行工程化大肠杆菌的放大培养和加工。如实施例3中所述使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XVII)的N-[2-(5-氰基-4-氟-1H-吲哚-3-基)乙基]乙酰胺的单质子化形式匹配的具有精确m/z和预期元素式的单质子化产物在4.0分钟时洗脱(EIC,参见:图20):
实施例7-第七多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-1从衍生化吲哚原料生物合成具有式(XVIII)的裸盖菇素衍生物。Ec-1的构建描述于实施例1中。如实施例1中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用6-溴-1H-吲哚-4-醇(www.bldpharm.com)代替6-氟-1H-吲哚-4-基胺。如实施例1中所述进行工程化大肠杆菌的放大培养和加工。如实施例3中所述使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XVIII)的N-[2-(6-溴-4-羟基-1H-吲哚-3-基)乙基]乙酰胺的单质子化形式匹配的具有精确m/z和预期元素式的单质子化产物在3.8分钟时洗脱(EIC,参见:图21A):
根据标准程序(Menéndez-Perdomo et al.,2021,Mass Spectrom 56:34683),在专用的LTQ后氮气碰撞池中使用高能碰撞(HCD)完成进一步分析。采用基于Orbitrap的HR片段检测(归一化碰撞能量,NCE 35),使得有机会将元素式分配给具有式(XVIII)的目标裸盖菇素衍生物的后续诊断离子种类特征,如下(图21B,表4)(Servillo L.et al.,2013,J.Agric.Chem.61:5156-5162)。
表4
m/z %相对丰度 离子种类 Δppm
237.98574 100 [M+H-C2H6NO]+ 1.93
159.06737 29.5
209.99081 3.3
255.01230 1.2
279.99649 1.0
199.51968 1.0
61.09401 0.9
297.02267 0.7 [M+H]+ 2.19
203.89784 0.6
177.16207 0.6
实施例8-第八多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-1从衍生化吲哚原料生物合成具有式(XXI)的裸盖菇素衍生物。Ec-1的构建描述于实施例1中。如实施例1中所述进行工程化大肠杆菌的放大培养和材料储存。如实施例1中所述进行工程化大肠杆菌的放大培养和加工。如实施例3中所述使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXI)的N-[2-(4-乙酰氨基-6-氟-1H-吲哚-3-基)乙基]乙酰胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在3.2分钟时洗脱(EIC,参见:图22A):
值得注意的是,尽管与实施例1所用原料相比,本实施例中提供了相同的吲哚原料,但产物(XXI)与产物(IX)不同。事实上,产物(XXI)和(IX)都是通过将6-氟-1H-吲哚-4-基胺进料至Ec-1而获得的。然而,在实施例1中,仅产物(IX)被纯化。相反,在本实施例中,仅分析产物(XXI)。根据标准程序(Menéndez-Perdomo et al.,2021,Mass Spectrom 56:34683),在专用的LTQ后氮气碰撞池中使用高能碰撞(HCD)完成了进一步分析。采用基于Orbitrap的HR片段检测(归一化碰撞能量,NCE 35),使得有机会将元素式分配给具有式(XXI)的目标裸盖菇素衍生物的后续诊断离子种类特征,如下(图22B,表5)(Servillo L.etal.,2013,J.Agric.Chem.61:5156-5162)。
表5
m/z %相对丰度 离子种类 Δppm
236.11928 100 [M+H-C2H2O]+ 0.38
177.08202 26.0 [M+H-C2H6NO-C2H2O]+ 1.30
219.09267 17.9 [M+H-C2H6NO]+ 0.68
278.12986 3.0 [M+H]+ 0.25
136.07571 1.1
56.17127 0.9
199.20892 0.8
88.82042 0.8
232.86285 0.8
158.02567 0.8
实施例9-第九多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-1从衍生化吲哚原料生物合成具有式(XXIII)的裸盖菇素衍生物。Ec-1的构建描述于实施例1中。如实施例1中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用4-氟-1H-吲哚-7-甲腈(www.bldpharm.com)代替6-氟-1H-吲哚-4-基胺。如实施例1中所述进行工程化大肠杆菌的放大培养和加工。如实施例3中所述使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXIII)的N-[2-(7-氰基-4-氟-1H-吲哚-3-基)乙基]乙酰胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在3.9分钟时洗脱(EIC,参见:图23A):
根据标准程序(Menéndez-Perdomo et al.,2021,Mass Spectrom 56:34683),在专用的LTQ后氮气碰撞池中使用高能碰撞(HCD)完成了进一步分析。采用基于Orbitrap的HR片段检测(归一化碰撞能量,NCE 35),使得有机会将元素式分配给具有式(XXIII)的目标裸盖菇素衍生物的后续诊断离子种类特征,如下(图23B,表6)(Servillo L.et al.,2013,J.Agric.Chem.61:5156-5162)。
表6
m/z %相对丰度 离子种类 Δppm
187.06606 100 [M+H-C2H3NO]+ 2.89
93.13169 1.0
204.09270 0.6
229.07666 0.2
246.10356 0.2 [M+H]+ 0.61
199.66049 0.2
59.34151 0.1
实施例10-第十多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-1从衍生化吲哚原料生物合成具有式(XXV)的裸盖菇素衍生物。Ec-1的构建描述于实施例1中。如实施例1中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用4-氟-1H-吲哚-6-基胺代替6-氟-1H-吲哚-4-基胺。如实施例1中所述进行工程化大肠杆菌的放大培养和加工。如实施例3中所述使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXV)的N-[2-(6-氨基-4-氟-1H-吲哚-3-基)乙基]乙酰胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在4.1分钟时洗脱(EIC,参见:图24):
值得注意的是,尽管与实施例2所使用的原料相比,本实施例中提供了相同的吲哚原料,但产物(XXV)与产物(X)不同。事实上,产物(XXV)和(X)都是通过将4-氟-1H-吲哚-6-基胺进料至Ec-1而获得的。然而,在实施例2中,仅产物(X)被纯化。相反,在本实施例中,仅分析产物(XXV)。
实施例11-第十一多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-1从衍生化吲哚原料生物合成具有式(XXVIII)的裸盖菇素衍生物。Ec-1的构建描述于实施例1中。如实施例1中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用4-氨基-1H-吲哚-6-甲腈(www.bldpharm.com)代替6-氟-1H-吲哚-4-基胺。如实施例1中所述进行工程化大肠杆菌的放大培养和加工。如实施例3中所述使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXVIII)的N-[2-(4-氨基-6-氰基-1H-吲哚-3-基)乙基]乙酰胺的单质子化形式匹配的具有精确m/z和预期元素式的单质子化产物在3.3分钟时洗脱(EIC,参见:图25A):
根据标准程序(Menéndez-Perdomo et al.,2021,Mass Spectrom 56:34683),在专用的LTQ后氮气碰撞池中使用高能碰撞(HCD)完成了进一步分析。采用基于Orbitrap的HR片段检测(归一化碰撞能量,NCE 35),使得有机会将元素式分配给具有式(XXVIII)的目标裸盖菇素衍生物的后续诊断离子种类特征,如下(图25B,表7)(Servillo L.et al.,2013,J.Agric.Chem.61:5156-5162)。
表7
实施例12-第十二取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-1从衍生化吲哚原料生物合成具有式(XX)的裸盖菇素衍生物。Ec-1的构建描述于实施例1中。如实施例1中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用4-氟-1H-吲哚-5-醇(www.bldpharm.com)代替6-氟-1H-吲哚-4-基胺。如实施例1中所述进行工程化大肠杆菌的放大培养和加工。如实施例3中所述使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XX)的N-[2-(4-氟-5-羟基-1H-吲哚-3-基)乙基]乙酰胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在3.1分钟时洗脱(EIC,参见:图26):
实施例13-第十三多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-2从衍生化吲哚原料生物合成具有式(XIII)的裸盖菇素衍生物。如下构建大肠杆菌菌株Ec-2。对于质粒克隆,根据抗生素标志物使用Top10或XL1-蓝菌株。使用标准LB培养基进行培养。对于基因表达和喂养实验,使用的亲本宿主菌株是BL21(DE3)。如实施例1中所述创建质粒pET28a(+)-PfTrpB-B0A9-HIS和pCDM4-BaTDC-HIS。如下将目的质粒pET28a(+)-PfTrpB-B0A9-HIS和pCDM4-BaTDC-HIS依次转化BL21(DE3)细胞:首先将pCDM4-BaTDC-HIS转化到BL21(DE3)中。接下来用pET28a(+)-PfTrpB-B0A9-HIS转化使用链霉素选择的转化体,并用链霉素和卡那霉素进行选择。如实施例1所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于(1)仅使用链霉素和卡那霉素用于选择目的;和(2)使用5-氟-7-硝基-1H-吲哚(www.bldpharm.com)代替6-氟-1H-吲哚-4-基胺。如实施例3中所述使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XIII)的2-(5-氟-7-硝基-1H-吲哚-3-基)乙胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在3.3分钟时洗脱(EIC,参见:图27):
实施例14-第十四多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-2从衍生化吲哚原料生物合成具有式(XVI)的裸盖菇素衍生物。Ec-2的构建描述于实施例13中。如实施例13中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用5-氟-1H-吲哚-6-基胺(www.bldpharm.com)代替5-氟-7-硝基-1H-吲哚。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(ThermoFisher Scientific)进行分析。与具有化学式(XVI)的3-(2-氨基乙基)-5-氟-1H-吲哚-6-胺的单质子化形式匹配的具有精确m/z和预期元素式的单质子化产物在2.9分钟时洗脱(EIC,参见:图28):
实施例15-第十五多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-2从衍生化吲哚原料生物合成具有式(XIX)的裸盖菇素衍生物。Ec-2的构建描述于实施例13中。如实施例13中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用4-氟-1H-吲哚-5-甲腈(www.bldpharm.com)代替5-氟-7-硝基-1H-吲哚。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(ThermoFisher Scientific)进行分析。与具有化学式(XIX)的3-(2-氨乙基)-4-氟-1H-吲哚-5-甲腈的单质子化形式匹配的具有精确m/z和预期元素式的单质子化产物在3.2分钟时洗脱(EIC,参见:图29):
实施例16-第十六多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-2从衍生化吲哚原料生物合成具有式(XXII)的裸盖菇素衍生物。Ec-2的构建描述于实施例13中。如实施例13中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用6-氟-1H-吲哚-4-基胺(www.bldpharm.com)代替5-氟-7-硝基-1H-吲哚。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(ThermoFisher Scientific)进行分析。与具有化学式(XXII)的3-(2-氨乙基)-6-氟-1H-吲哚-4-胺的单质子化形式相匹配的具有精确m/z和预期的元素式的单质子化产物在1.4分钟时洗脱(EIC,参见:图30):
实施例17-第十七多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-2从衍生化吲哚原料生物合成具有式(XXVI)的裸盖菇素衍生物。Ec-2的构建描述于实施例13中。如实施例13中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用3-(2-氨乙基)-4-氟-1H-吲哚-6-胺(www.bldpharm.com)代替5-氟-7-硝基-1H-吲哚。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXVI)的3-(2-氨乙基)-4-氟-1H-吲哚-6-胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在0.6分钟时洗脱(EIC,参见:图31):
实施例18-第十八多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-2从衍生化吲哚原料生物合成具有式(XXIX)的裸盖菇素衍生物。Ec-2的构建描述于实施例13中。如实施例13中所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于使用4-氨基-1H-吲哚-6-甲腈(www.bldpharm.com)代替5-氟-7-硝基-1H-吲哚。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(ThermoFisher Scientific)进行分析。与具有化学式(XXIX)的4-氨基-3-(2-氨乙基)-1H-吲哚-6-甲腈的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在2.6分钟时洗脱(EIC,参见:图32A):
根据标准程序(Menéndez-Perdomo et al.,2021,Mass Spectrom 56:34683),在专用的LTQ后氮气碰撞池中使用高能碰撞(HCD)完成了进一步分析。采用基于Orbitrap的HR片段检测(归一化碰撞能量,NCE 35),使得有机会将元素式分配给具有式(XXIX)的目标裸盖菇素衍生物的后续诊断离子种类特征,如下(图32B,表8)(Servillo L.et al.,2013,J.Agric.Chem.61:5156-5162)。
表8
m/z %相对丰度 离子种类 Δppm
184.08655 100 [M+H-NH3]+ 2.01
97.51806 1.0
172.08669 0.7
201.11313 0.6 [M+H]+ 1.69
199.55735 0.1
61.09273 0.1
143.08142 0.1
60.25552 0.1
209.32732 0.1
202.04140 0.1
实施例19-第十九多取代基裸盖菇素衍生物的生物合成
使用大肠杆菌菌株Ec-3从衍生化吲哚原料生物合成具有式(XXVII)的裸盖菇素衍生物。如下构建大肠杆菌菌株Ec-2。对于质粒克隆,根据抗生素标志物使用Top10或XL1-蓝菌株。使用标准LB培养基进行培养。对于基因表达和喂养实验,使用的亲本宿主菌株是BL21(DE3)。首先,通过将框内HIS标记的(SEQ.ID NO:46)EsNMT基因(SEQ.ID NO:11)插入到pET28a(+)(SEQ.ID NO:36)的NdeI/XhoI位点来创建质粒pET28a(+)-EsNMT-HIS。作为第二步,从质粒pCDM4(SEQ.ID NO:35),通过将框内HIS-标记的(SEQ.ID NO:46)PsiD基因(SEQ.ID NO:7)插入pCDM4的NdeI/XhoI位点来创建质粒pCDM4-PsiD-HIS。如下将这些目标质粒依次转化至BL21(DE3)细胞中:首先将pCDM4-PsiD-HIS转化至BL21(DE3)中。接下来用pET28a(+)-EsNMT-HIS转化使用链霉素选择的转化体并用链霉素和卡那霉素两者选择。如实施例1所述进行工程化大肠杆菌的放大培养和材料储存,不同之处在于(1)仅使用链霉素和卡那霉素用于选择目的;和(2)使用4-氨基-1H-吲哚-6-甲腈(www.bldpharm.com)代替6-氟-1H-吲哚-4-基胺。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXVII)的4-氨基-3-[2-(甲基氨基)乙基]-1H-吲哚-6-甲腈的单质子化形式匹配的具有精确m/z和预期元素式的单质子化产物在2.6分钟时洗脱(EIC,参见:图33):
实施例20-第二十多取代基裸盖菇素衍生物的生物合成
酵母(酿酒酵母)菌株Sc-1是通过亲本酵母菌株的基因工程创建的,以使得能够对商业获得的衍生化吲哚、色氨酸或色胺原料进行生物转化以产生最终产物。亲本酵母(酿酒酵母)菌株为CEN.PK,具有基因型为Matα;ura3-52;trp1-289;leu2-3,112;his3Δ1;MAL2-8C;SUC2。将亲本菌株工程化以包括7DMATS(SEQ.ID NO:16)、ClostSporTDC(SEQ.ID NO:6)和PsmF(SEQ.ID NO:10),其催化三个酶促步骤。工程化还包括CPR(SEQ.ID NO:26),尽管该酶未用于生物转化过程。如先前所述(Dastmalchi et al.,2019,Nat.Chem Biol.15:384-390;Chen et al.,2018,Nat.Chem Biol.14:738-743),通过整合盒的染色体同源重组而将7DMATS、ClostSporTDC和CPR包括在菌株中。相反,将PsmF构建到蛋白质表达质粒中,并转化到已经包含7DMATS、ClostSporTDC和CPR的基因组整合菌株中。7DMATS、ClostSporTDC和CPR分别由SEQ.ID NO:15、SEQ.ID NO:5和SEQ.ID NO:25编码,并分别添加了框内C末端HIS(SEQ.ID NO:46,SEQ.ID NO:47)、FLAG(SEQ.ID NO:42,SEQ.ID NO:43)和c-MYC(SEQ.ID NO:40,SEQ.ID NO:41)表位标签。如所述(Dastmalchi et al.,2019;Chen et al.,2018),使用从酿酒酵母基因组DNA扩增的酵母启动子序列构建整合盒,从而实现组成型基因表达。扩增的启动子包括PGK1(SEQ.ID NO:30)、TDH3(SEQ.ID NO:31)、CLN1(SEQ.ID NO:32)和UGA1(SEQ.ID NO:33)。组装两个整合盒:第一个,(X-3)::TADH1-ClostSporTDC-Flag-PPGK1-PTDH3-CPR-c-myc-TCYC1(SEQ.ID NO:52),含有标记的ClostSporTDC和CPR。第二个(Xii-2)::PTDH3-7DMATS-His-TCYC1(SEQ.ID NO:53),仅含有标记的7DMATS。如前所述(Chen etal.,2018),对这些盒进行连续基因组整合。在这两个盒稳定整合之后,通过用编码混杂N-乙酰转移酶PsmF(pMM1-pTDH3-PsmF-His-tCYC1)的酵母附加型载体转化来进一步操纵该菌株。为了构建pMM1-pTDH3-PsmF-His-tCYC1,使用BamHI/SacII限制性位点将与HIS表位标签(SEQ.ID NO:46)框内融合的基PsmF(SEQ.ID NO:9)连接至空质粒pMM1(SEQ.ID NO:34)。对于本实施例,非原生的或工程化的TrpB基因的异源表达不是必需的,因为内源色氨酸合成酶活性被证明是足够的。最终的工程菌株被称为Sc-1。为了放大生产衍生产物,如下进行培养。将种子培养物接种于SD-drop-out培养基中过夜。然后将过夜培养物拆分到两个烧瓶中,每个烧瓶含有500ml SD-drop-out培养基,其中含有2%(w/v)葡萄糖、0.3%(w/v)KH2PO4、0.05%(w/v)MgSO4.7H2O、0.5%(w/v)(NH4)2SO4加用于由Sc-1转化的500μM 4-氯-1H-吲哚(www.combi-blocks.com)。酵母培养物生长48小时。然后将培养物离心(10,000g x5分钟)以除去细胞内容物,并将含有分泌的衍生产物的培养肉汤储存在-80℃下直至进一步加工。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo FisherScientific)进行分析。与具有化学式(XXXIV)的N-(2-[4-氯-7-(3-甲基-2-丁烯基)-1H-吲哚-3-基]乙基)乙酰胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在5.2分钟时洗脱(EIC,参见:图34A):
根据标准程序(Menéndez-Perdomo et al.,2021,Mass Spectrom 56:34683),在专用的LTQ后氮气碰撞池中使用高能碰撞(HCD)完成了进一步分析。采用基于Orbitrap的HR片段检测(归一化碰撞能量,NCE 35),使得有机会将元素式分配给具有式(XXXIV)的目标裸盖菇素衍生物的后续诊断离子种类特征,如下(图34B,表9)(Servillo L.et al.,2013,J.Agric.Chem.61:5156-5162)。
表9
实施例21-第二十一多取代基裸盖菇素衍生物的生物合成
使用实施例20中描述的相同酵母菌株(Sc-1)和程序来生物合成具有化学式(XXXIII)的裸盖菇素衍生物,除了以下例外:代替4-氯-1H-吲哚,将500μM 5-氟-1H-吲哚(Combi-Blocks,www.combi-blocks.com)供应为用生生物转化的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXXII)的2-[5-氟-7-(3-甲基-2-丁烯基)-1H-吲哚-3-基]乙胺的单质子形式相匹配的具有精确m/z和预期元素式的单质子化产物在4.9分钟时洗脱(EIC,参见:图35A):
根据标准程序(Menéndez-Perdomo et al.,2021,Mass Spectrom 56:34683),在专用的LTQ后氮气碰撞池中使用高能碰撞(HCD)完成了进一步分析。采用基于Orbitrap的HR片段检测(归一化碰撞能量,NCE 35),使得有机会将元素式分配给具有式(XXXII)的目标裸盖菇素衍生物的后续诊断离子种类特征,如下(图35B,表10)(Servillo L.et al.,2013,J.Agric.Chem.61:5156-5162)。
表10
实施例22-第二十二多取代基裸盖菇素衍生物的生物合成
使用与实施例20中描述的相同酵母菌株(Sc-1)和程序来生物合成具有化学式(XXXIII)的裸盖菇素衍生物,但以下例外:代替4-氯-1H-吲哚,将500μM 5-氟-1H-吲哚(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXXIII)的N-(2-[5-氟-7-(3-甲基-2-丁烯基)-1H-吲哚-3-基]乙基)乙酰胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在4.2分钟时洗脱(EIC,参见:图36):
需注意的是,尽管与实施例21所用原料相比,本实施例中提供了相同的吲哚原料,但产物(XXXII)与产物(XXXIII)不同。事实上,产物(XXXII)和(XXXIII)都是通过将5-氟-1H-吲哚进料至Sc-1而获得的。然而,在实施例21中,仅分析了产物(XXXII)。相反,在本实施例中,仅分析产物(XXXIII)。
实施例23-第二十三多取代基裸盖菇素衍生物的生物合成
使用与实施例20中描述的相同酵母菌株(Sc-1)和程序来生物合成具有化学式(XLIX)的裸盖菇素衍生物,但以下例外:代替4-氯-1H-吲哚,将500μM 1H-吲哚-4-醇(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XLIX)的2-氨基-3-[4-羟基-7-(3-甲基-2-丁烯基)-1H-吲哚-3-基]丙酸的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在3.8分钟时洗脱(EIC,参见:图37):
需注意的是,尽管Sc-1中存在ClostSporTDC酶,但化合物(XLIX)保留了羧酸基团。在培养基中检测不到化合物(XLIX)的脱羧版本,可能是由于ClostSporTDC酶固有地无法接受羟基化底物导致的。
实施例24-第二十四多取代基裸盖菇素衍生物的生物合成
通过亲本酵母菌株的质粒转化创建了酵母(酿酒酵母)菌株Sc-2,以使得能够生物转化商业获得的衍生化吲哚、色氨酸或色胺原料以产生最终产物。亲本酵母(酿酒酵母)菌株为CEN.PK,具有基因型Matα;ura3-52;trp1-289;leu2-3,112;his3Δ1;MAL2-8C;SUC2。亲本菌株用编码HIS标记的(SEQ.ID NO:46,SEQ.ID NO:47)、混杂6-异戊二烯基转移酶PriB(SEQ.ID NO:18)的酵母附加型载体(pMM1-pTDH3-PriB-His-tCYC1)转化。为了构建pMM1-pTDH3-PriB-His-tCYC1,使用BamHI/SacII限制性位点将与HIS表位标签(SEQ.ID NO:46)框内融合的基因PriB(SEQ.ID NO:17)连接至空质粒pMM1(SEQ.ID NO:34)。对于本实施例,非原生的或工程化的TrpB基因的异源表达不是必需的,因为内源色氨酸合成酶活性被证明是足够的。最终的工程化菌株被称为Sc-2。对于衍生物产物的放大生产,如实施例20中所述进行培养,但以下例外:代替4-氯-1H-吲哚,将500μM 1H-吲哚-4-醇(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(L)的2-氨基-3-[4-羟基-6-(3-甲基-2-丁烯基)-1H-吲哚-3-基]丙酸的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在3.8分钟时洗脱(EIC,参见:图38):
实施例25-第二十五多取代基裸盖菇素衍生物的生物合成
使用与实施例24中描述的相同酵母菌株(Sc-2)和程序来生物合成具有化学式(XLVIII)的裸盖菇素衍生物,但以下例外:代替1H-吲哚-4-醇,将5-溴-1H-吲哚(Combi-Blocks,www.combi-blocks.com)提供为生物转化的的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XLVIII)的2-氨基-3-[5-溴-6-(3-甲基-2-丁烯基)-1H-吲哚-3-基]丙酸的单质子化形式相匹配的精确m/z和预期元素式的单质子化产物在4.2分钟时洗脱(EIC,参见:图39):
实施例26-第二十六多取代基裸盖菇素衍生物的生物合成
通过亲本酵母菌株的质粒转化而创建了酵母(酿酒酵母)菌株Sc-3,使得能够对商业获得的衍生化吲哚、色氨酸或色胺原料进行生物转化以产生最终产物。亲本酵母(酿酒酵母)菌株为CEN.PK,具有基因型为Matα;ura3-52;trp1-289;leu2-3,112;his3Δ1;MAL2-8C;SUC2。用编码5-异戊二烯基转移酶SCO7467(SEQ.ID NO:20)的酵母附加型载体(pMM1-pTDH3-SCO7467-tCYC1)来转化亲本菌株。为了构建pMM1-pTDH3-SCO7467-tCYC1,使用BamHI/SacII限制性位点将基因SCO7467(SEQ.ID NO:19)连接至空质粒pMM1(SEQ.ID NO:34)。对于本实施例,非原生的或工程化的TrpB基因的异源表达不是必需的,因为内源色氨酸合成酶活性被证明是足够的。最终的工程菌株被称为Sc-3。对于衍生物产物的放大生产,如实施例20中所述进行培养,但以下例外:代替4-氯-1H-吲哚,将500μM 1H-吲哚-4-醇(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(LI)的2-氨基-3-[4-羟基-5-(3-甲基-2-丁烯基)-1H-吲哚-3-基]丙酸的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在3.8分钟时洗脱(EIC,参见:图40):
实施例27-第二十七多取代基裸盖菇素衍生物的生物合成
通过亲本酵母菌株的基因工程创建了酵母(酿酒酵母)菌株Sc-4,使得能够对商业获得的衍生化吲哚、色氨酸或色胺原料进行生物转化以产生最终产物。亲本酵母(酿酒酵母)菌株为CEN.PK,具有基因型为Matα;ura3-52;trp1-289;leu2-3,112;his3Δ1;MAL2-8C;SUC2。将亲本菌株工程化以包括PriB(SEQ.ID NO:18)、BaTDC(SEQ.ID NO:4)和PsmF(SEQ.IDNO:10),其催化三个酶促步骤。工程化还包括CPR(SEQ.ID NO:26),尽管该酶未用于生物转化过程。如先前所述(Dastmalchi et al.,2019,Nat.Chem Biol.15:384-390;Chen etal.,2018,Nat.Chem Biol.14:738-743),PriB、BaTDC和CPR通过整合盒的染色体同源重组而包括在菌株中。相反,将PsmF构建到蛋白质表达质粒中,并转化到已经含有PriB、BaTDC和CPR的基因组整合菌株中。PriB、BaTDC和CPR分别由SEQ.ID NO:17、SEQ.ID NO:3和SEQ.IDNO:25编码,并分别添加了框内C末端HIS(SEQ.ID NO:46,SEQ.ID NO:47)、FLAG(SEQ.ID NO:42,SEQ.ID NO:43)和c-MYC(SEQ.ID NO:40,SEQ.ID NO:41)表位标签。如所述(Dastmalchiet al.,2019;Chen et al.,2018),使用从酿酒酵母基因组DNA扩增的酵母启动子序列构建整合盒,从而实现组成型基因表达。扩增的启动子包括PGK1(SEQ.ID NO:30)、TDH3(SEQ.IDNO:31)、CLN1(SEQ.ID NO:32)和UGA1(SEQ.ID NO:33)。组装两个整合盒:第一个,(X-3)::TADH1-BaTDC-Flag-PPGK1-PTDH3-CPR-c-myc-TCYC1(SEQ.ID NO:50),其含有标记的BaTDC和CPR。第二个(Xii-2)::PTDH3-PriB-His-TCYC1(SEQ.ID NO:51),仅含有标记的PriB。如前所述(Chen et al.,2018),对这些盒进行连续基因组整合。在这两个盒稳定整合后,通过用编码混杂N-乙酰转移酶PsmF(pMM1-pTDH3-PsmF-His-tCYC1)的酵母附加型载体转化来进一步操纵该菌株。为了构建pMM1-pTDH3-PsmF-His-tCYC1,使用BamHI/SacII限制性位点,将与HIS表位标签(SEQ.ID NO:46)框内融合的基因PsmF(SEQ.ID NO:9)连接至空质粒pMM1(SEQ.ID NO:34)。对于本实施例,非原生的或工程化的TrpB基因的异源表达不是必需的,因为内源色氨酸合成酶活性被证明是足够的。最终的工程化菌株称为Sc-4。对于衍生物产物的放大生产,如实施例20中所述进行培养,但以下例外:代替4-氯-1H-吲哚,将500μM 5-氯-1H-吲哚(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXXVII)的N-(2-[5-氯-6-(3-甲基-2-丁烯基)-1H-吲哚-3-基]乙基)乙酰胺的单质子化形式相匹配的具有精确m/z和预期元素式单质子化产物在5.1分钟时洗脱(EIC,参见:图41):
实施例28-第二十八多取代基裸盖菇素衍生物的生物合成
使用与实施例27中描述的相同酵母菌株(Sc-4)和程序来生物合成具有化学式(XXXV)的裸盖菇素衍生物,但以下例外:代替5-氯-1H-吲哚,将500μM 5-氟-1H-吲哚(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXXV)的N-(2-[5-氟-6-(3-甲基-2-丁烯基)-1H-吲哚-3-基]乙基)乙酰胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在3.8分钟时洗脱(EIC,参见:图42):
实施例29-第二十九多取代基裸盖菇素衍生物的生物合成
在组装Sc-4过程中作为中间体获得酵母(酿酒酵母)菌株Sc-5。菌株Sc-5基本上与Sc-4相同,不同之处在于Sc-5不含有编码混杂N-乙酰转移酶PsmF(SEQ.ID NO:10)的附加附加型载体(pMM1-pTDH3-PsmF-His-tCYC1)。因此,Sc-5通过染色体整合含有仅两种酶(BaTDC(SEQ.ID NO:4)和PriB(SEQ.ID NO:18))它们参与衍生物形成。第三种酶CPR(SEQ.ID NO:26)也被类似地整合,但不参与衍生物的产生。非原生的或工程化的TrpB基因的异源表达是不必要的,因为内源性色氨酸合成酶活性已被证明足够。对于衍生物产物的放大生产,如实施例20中所述进行培养,但以下例外:代替4-氯-1H-吲哚,将500μM 5-氟-1H-吲哚(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXXVI)的2-[5-氟-6-(3-甲基-2-丁烯基)-1H-吲哚-3-基]乙胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在4.3分钟时洗脱(EIC,参见:图43):
根据标准程序(Menéndez-Perdomo et al.,2021,Mass Spectrom 56:34683),在专用的LTQ后氮气碰撞池中使用高能碰撞(HCD)完成了进一步分析。采用基于Orbitrap的HR片段检测(归一化碰撞能量,NCE 35),使得有机会将元素式指定给具有式(XXXVI)的目标裸盖菇素衍生物的后续诊断离子种类特征,如下(图43B,表11)(Servillo L.et al.,2013,J.Agric.Chem.61:5156-5162)。
表11
m/z %相对丰度 离子种类 Δppm
230.13358 100 [M+H-NH3]+ 1.61
198.47229 0.6
89.48803 0.5
233.50280 0.5
154.92723 0.5
115.92102 0.5
132.59683 0.5
92.18462 0.5
199.41139 0.4
102.89690 0.4
实施例30-第三十多取代基裸盖菇素衍生物的生物合成
使用与实施例29中描述的相同酵母菌株(Sc-5)和程序来生物合成具有化学式(XXXVIII)的裸盖菇素衍生物,但以下例外:代替5-氟-1H-吲哚,将500μM 5-氯-1H-吲哚(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXXVIII)的2-[5-氯-6-(3-甲基-2-丁烯基)-1H-吲哚-3-基]乙胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在4.4分钟时洗脱(EIC,参见:图44):
实施例31-第三十一多取代基裸盖菇素衍生物的生物合成
通过亲本酵母菌株的基因工程创建了酵母(酿酒酵母)菌株Sc-6,使得能够将商业获得的衍生化吲哚、色氨酸或色胺原料生物转化以生成最终产物。亲本酵母(酿酒酵母)菌株为CEN.PK,具有基因型为Matα;ura3-52;trp1-289;leu2-3,112;his3Δ1;MAL2-8C;SUC2。将亲本菌株工程化以包括PsiH(SEQ.ID NO:24)、CPR(SEQ.ID NO:26)、ClostSporTDC(SEQ.ID NO:6)和PsiM(SEQ.ID NO:14),其催化或支持多个酶促步骤。工程化还包括PsiK(SEQ.ID NO:49),尽管这种酶似乎无法促进生物转化过程。如先前所述(Dastmalchi etal.,2019,Nat.Chem Biol.15:384-390;Chen etal.,2018,Nat.Chem Biol.14:738-743),通过整合盒的染色体同源重组而在菌株中包括PsiH、CPR、PsiM和PsiK。相反,ClostSporTDC被构建到蛋白质表达质粒中,并转化到已经含有PsiH、CPR、PsiM和PsiK的基因组整合菌株中。PsiH、CPR、ClostSporTDC和PsiM分别由SEQ.ID NO:23、SEQ.ID NO:25、SEQ.ID NO:5和SEQ.ID NO:13编码,并分别添加了框内C-末端HA(SEQ.ID NO:38,SEQ.ID NO:39)、c-MYC(SEQ.ID NO:40,SEQ.ID NO:41)、HIS(SEQ.ID NO:46,SEQ.ID NO:47)和FLAG(SEQ.ID NO:42,SEQ.ID NO:43)表位标签。如所述(Dastmalchi et al.,2019;Chen et al.,2018),使用从酿酒酵母基因组DNA扩增的酵母启动子序列构建整合盒,从而实现组成型基因表达。扩增的启动子包括PGK1(SEQ.ID NO:30)、TDH3(SEQ.ID NO:31)、CLN1(SEQ.ID NO:32)和UGA1(SEQ.ID NO:33)。组装两个整合盒:第一个,XII-4::TADH1-PsiH-HA-PPGK1-PTDH3-CPR-c-myc-TCYC1(SEQ.ID NO:27),含有标记的PsiH和CPR。第二个,XII-5::TADH1-PsiK-V5-PPGK1-PTDH3-PsiM-FLAG-TCYC1(SEQ.ID NO:28),含有标记的PsiK和PsiM。如先前所述(Chen et al.,2018),对这些盒进行连续基因组整合。在这两个盒稳定整合后,通过用编码ClostSporTDC(pMM1-pTDH3-ClostSpor-His-tCYC1)的酵母附加型载体转化来进一步操纵该菌株。为了构建pMM1-pTDH3-ClostSpor-His-tCYC1,使用BamHI/SacII限制性位点将与HIS表位标签(SEQ.ID NO:46)框内融合的基因ClostSporTDC(SEQ.ID NO:5)连接至空质粒pMM1(SEQ.ID NO:34)。对于本实施例,非原生的或工程化的TrpB基因的异源表达不是必需的,因为内源色氨酸合成酶活性被证明是足够的。最终的工程化菌株称为Sc-6。使用Sc-6,使用与实施例20中描述的相同程序来生物合成具有化学式(XL)的裸盖菇素衍生物,但以下例外:代替4-氯-1H-吲哚,将500μM 6-氯-1H-吲哚(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XL)的6-氯-3-[2-(二甲基氨基)乙基]-1H-吲哚-4-醇的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在0.38分钟时洗脱(EIC,参见:图45):
实施例32-第三十二多取代基裸盖菇素衍生物的生物合成
使用与实施例31中描述的相同酵母菌株(Sc-6)和程序来生物合成具有化学式(XXXIX)的裸盖菇素衍生物,但以下例外:代替4-氯-1H-吲哚,将500μM 7-氯-1H-吲哚(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXXIX)的7-氯-3-[2-(二甲基氨基)乙基]-1H-吲哚-4-醇的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在3.1分钟时洗脱(EIC,参见:图46):
实施例33-第三十三多取代基裸盖菇素衍生物的生物合成
使用与实施例31中描述的相同酵母菌株(Sc-6)和程序来生物合成具有化学式(LII)的裸盖菇素衍生物,但以下例外:代替4-氯-1H-吲哚,将500μM 6-氟-1H-吲哚(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(LII)的3-(2-氨乙基)-6-氟-1H-吲哚-4-醇的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在2.3分钟时洗脱(EIC,参见:图47):
需注意的是,尽管存在甲基转移酶PsiM,但产物(LII)不具有N,N-二甲基官能,这意味着PsiM不能接受该产物(LII)作为底物。
实施例34-第三十四多取代基裸盖菇素衍生物的生物合成
使用与实施例31中描述的相同酵母菌株(Sc-6)和程序来生物合成具有化学式(LIII)的裸盖菇素衍生物,但以下例外:代替4-氯-1H-吲哚,将500μM 6-溴-1H-吲哚(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(LIII)的6-溴-3-[2-(二甲基氨基)乙基]-1H-吲哚-4-醇的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在3.2分钟时洗脱(EIC,参见:图48):
/>
实施例35-第三十五多取代基裸盖菇素衍生物的生物合成
使用与实施例31中描述的相同酵母菌株(Sc-6)和程序来生物合成具有化学式(LIV)的裸盖菇素衍生物,但以下例外:代替4-氯-1H-吲哚,将500μM 6-溴-1H-吲哚(Combi-Blocks,www.combi-blocks.com)提供为生物转化用的原料。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(LIV)的3-(2-氨乙基)-6-溴-1H-吲哚-4-醇的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在2.9分钟时洗脱(EIC,参见:图49):
需注意的是,尽管与实施例34中使用的原料相比,本实施例中提供了相同的吲哚原料,但产物(LIII)与产物(LIV)不同。事实上,产物(LIII)和(LIV)都是通过将6-溴-1H-吲哚进料至Sc-6而获得的。然而,在实施例34中,仅分析产物(LIII)。相反,在本实施例中,仅分析产物(LIV)。
实施例36-第三十六多取代基裸盖菇素衍生物的生物合成
使用FgaPT2酶和体外程序完成了裸盖菇素衍生物的合成。合成编码FgaPT2(SEQ.ID NO:21)的cDNA并在GenScript(www.genscript.com)上使用Nde1和Xho1位点亚克隆至pET26b(+)质粒(SEQ.ID NO:54)。最终的质粒pET26b(+)-FgaPT2编码FgaPT2的框内C末端HIS标签融合体。在大肠杆菌中生成纯化的重组FgaPT2酶(SEQ.ID NO:22)并如下分离。将质粒pET26b(+)-FgaPT2转化至Rosetta(DE3)感受态大肠杆菌细胞中。转化的Rosetta(DE3)大肠杆菌细胞在LB培养基中在30℃下生长过夜,然后转移到TB(超级肉汤)培养基中在37℃下生长直至光密度(OD600)达到0.6-1.5。然后将细胞培养物转移至16℃培养箱,添加0.2mMIPTG以启动重组蛋白表达。20小时后,通过以5,000x g离心6分钟收获细胞,并在萃取蛋白质之前将细胞沉淀储存在-80℃下。为了萃取和纯化FgaPT2重组蛋白,将大肠杆菌细胞重悬于含有50mM磷酸钠(pH 7.0)和300mM NaCl的缓冲液中,然后超声处理5-10分钟以破碎细胞。将细胞裂解物在12,000g下离心30分钟以收集含有可溶性粗蛋白的上清液。将上清液应用于钴树脂(TALON SuperflowTM,Cytiva)以分离HIS标记的目标蛋白。将纯化的蛋白质在-80℃下储存在含有50mM Tris-HCl(pH 7.0)、100mM NaCl和10%甘油的缓冲液中。将色氨酸衍生物2-氨基-3-(5-溴-1H-吲哚-3-基)丙酸(www.sigmaaldrich.com)和DMAPP(www.sigmaaldrich.com)用作反应中的共底物。简而言之,反应设置如下:将50mM Tris-HCl(pH 8.0)、180μM DMAPP、0.5mM色氨酸衍生物和300μg/mL的FgaPT2一起添加,并在37℃下进行反应2小时。添加等体积的MeOH以淬灭反应并沉淀蛋白质。然后将样品在13,000g下离心20分钟,取出含有所需产物的上清液。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXX)的2-氨基-3-[5-溴-4-(3-甲基-2-丁烯基)-1H-吲哚-3-基]丙酸的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在4.2分钟时洗脱(EIC,参见:图50):
实施例37-第三十七多取代基裸盖菇素衍生物的生物合成
使用FgaPT2酶和实施例36中描述的体外程序完成裸盖菇素衍生物的合成,不同之处在于使用2-氨基-3-(6-氟-1H-吲哚-3-基)丙酸(www.sigmaaldrich.com)代替2-氨基-3-(5-溴-1H-吲哚-3-基)丙酸底物。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XXXI)的2-氨基-3-[6-氟-4-(3-甲基-2-丁烯基)-1H-吲哚-3-基]丙酸的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在4.0分钟时洗脱(EIC,参见:图51):
实施例38-第三十八多取代基裸盖菇素衍生物的生物合成
使用PriB酶和体外程序完成了裸盖菇素衍生物的合成。合成了编码riB(SEQ.IDNO:17)的cDNA并在GenScript(www.genscript.com)使用Nde1和Xho1位点亚克隆至pET26b(+)质粒(SEQ.ID NO:54)。最终的质粒pET26b(+)-PriB编码PriB的框内C末端HIS标签融合体。在大肠杆菌中产生纯化的重组PriB酶(SEQ.ID NO:18)并如下分离。将质粒pET26b(+)-PriB转化至Rosetta(DE3)感受态大肠杆菌细胞中。转化的Rosetta(DE3)大肠杆菌细胞在LB培养基中在30℃下生长过夜,然后转移到TB(超级肉汤)培养基中在37℃下生长直至光密度(OD600)达到0.6-1.5。然后将细胞培养物转移至16℃培养箱,添加0.5mM IPTG以启动重组蛋白表达。20小时后,通过以5,000x g离心6分钟收获细胞,并在萃取蛋白质之前将细胞沉淀储存在-80℃下。为了萃取和纯化PriB重组蛋白,将大肠杆菌细胞重悬于含有50mM磷酸钠(pH 7.0)和300mM NaCl的缓冲液中,然后超声处理5-10分钟以破碎细胞。将细胞裂解物在12,000g下离心30分钟以收集含有可溶性粗蛋白的上清液。将上清液应用于钴树脂(TALONSuperflowTM,Cytiva)以分离HIS标记的目标蛋白。将纯化的蛋白质在-80℃下储存在含有50mM Tris-HCl(pH 7.0)、100mM NaCl和10%甘油的缓冲液中。反应中使用共底物3-[2-(二甲基氨基)乙基]-1H-吲哚-4-基丙酸酯(Indole Shop;www.theindoleshop.com)和DMAPP(www.sigmaaldrich.com)。简而言之,反应设置如下:将50mM Tris-HCl(pH 8.0)、180μMDMAPP、0.5mM 3-[2-(二甲基氨基)乙基]-1H-吲哚-4-基丙酸酯和392μg/mL的PriB一起添加并在37℃下进行反应2小时。添加等体积的MeOH以淬灭反应并沉淀蛋白质。然后将样品在13,000g下离心20分钟,取出含有所需产物的上清液。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XLI)的3-[2-(二甲基氨基)乙基]-6-(3-甲基-2-丁烯基)-1H-吲哚-4-基丙酸酯的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在4.7分钟时洗脱(EIC,参见:图52):
实施例39-第三十九多取代基裸盖菇素衍生物的生物合成
使用PriB酶和实施例38中描述的体外程序完成裸盖菇素衍生物的合成,不同之处在于使用3-[2-(二甲基氨基)乙基]-1H-吲哚-4-基乙酸酯(Indole Shop;www.theindoleshop.com)代替3-[2-(二甲基氨基)乙基]-1H-吲哚-4-基丙酸酯底物。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XLII)的3-[2-(二甲基氨基)乙基]-6-(3-甲基-2-丁烯基)-1H-吲哚-4-基乙酸酯的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在4.4分钟时洗脱(EIC,参见:图53):
实施例40-第四十多取代基裸盖菇素衍生物的生物合成
使用PriB酶和实施例38中描述的体外程序完成裸盖菇素衍生物的合成,不同之处在于使用3-[2-(二乙基氨基)乙基]-1H-吲哚-4-基乙酸酯(Indole Shop;www.theindoleshop.com)代替3-[2-(二甲基氨基)乙基]-1H-吲哚-4-基丙酸酯底物。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XLV)的3-[2-(二乙氨基)乙基]-6-(3-甲基-2-丁烯基)-1H-吲哚-4-基乙酸酯的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在4.6分钟时洗脱(EIC,参见:图54):
实施例41-第四十一多取代基裸盖菇素衍生物的合成
使用PriB酶和实施例38中描述的体外程序完成裸盖菇素衍生物的合成,不同之处在于使用N,N--二甲基[2-(5-氯-1H-吲哚-3-基)乙基]胺(Indole Shop;www.theindoleshop.com)代替3-[2-(二甲基氨基)乙基]-1H-吲哚-4-基丙酸酯底物。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo Fisher Scientific)进行分析。与具有化学式(XLIV)的N,N-二甲基(2-[5-氯-6-(3-甲基-2-丁烯基)-1H-吲哚-3-基]乙基)胺的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在4.7分钟时洗脱(EIC,参见:图55A):
根据标准程序(Menéndez-Perdomo et al.,2021,Mass Spectrom 56:34683),在专用的LTQ后氮气碰撞池中实现了使用高能碰撞(HCD)完成了进一步分析。采用基于Orbitrap的HR片段检测(归一化的碰撞能量,NCE 35),使得有机会将元素式分配给具有式(XLIV)的目标裸盖菇素衍生物的后续诊断离子种类特征,如下(图55B,表12)(ServilloL.et al.,2013,J.Agric.Chem.61:5156-5162)。
表12
实施例42-第四十二多取代基裸盖菇素衍生物的生物合成
使用(1)化学合成,然后(2)通过PriB酶进行体外酶促转化来完成了裸盖菇素衍生物的合成。使用图13D所示的合成程序进行化学合成。
在0℃下在氩气吹扫下,历经30分钟,向4-苄氧基吲哚13D-1(1.00mmol,1.00当量)在无水乙醚(10mL)中的溶液中逐滴添加草酰氯(2.05mmol,2.05当量),并且在0-5℃下继续反应3小时。历经1小时,逐滴加入N-甲基异丙胺(5.00mmol,5.00当量)在无水乙醚(5mL)中的溶液。将溶液真空浓缩,并将残余物再溶解于二氯甲烷(30mL)中。用水(4×10mL)和盐水(1×10mL)洗涤有机溶液,然后经无水Na2SO4干燥并减压浓缩,得到化合物13D-2,其不经进一步纯化而用于下一步骤。将氢化铝锂在无水THF(1M,5.20当量)和1,4-二氧六环(2.0mL)的混合物中的溶液在氩气下加热至60℃。历经30分钟滴加化合物13D-2在无水THF(2.0mL)和1,4-二氧六环(3.5mL)的混合物中的溶液,并将反应升温至70℃持续2小时。将反应物进一步在95℃下回流20小时。冷却至0℃后,通过滴加水(0.4mL)-THF(2.0mL)的混合物来淬灭过量的氢化铝锂。添加乙醚(10mL),并将反应混合物在室温下搅拌30分钟。通过真空过滤除去沉淀物,滤液经无水Na2SO4干燥,并在真空下浓缩,得到化合物3,其无需进一步纯化即可使用。将粗化合物13D-3溶解在95%EtOH(10mL)中,并添加10%活性炭载钯(0.110当量)。将反应烧瓶抽空,然后用氢气回填。在室温下搅拌2小时后,通过过滤除去催化剂并在减压下除去溶剂,得到化合物13D-4,通过反相柱色谱在C18硅胶上使用水-乙腈+0.1%甲酸作为洗脱液进行纯化。然后将化合物13D-4用作由PriB酶生物转化的底物,PriB酶是使用实施例38中描述的程序产生并纯化的。使用实施例38中描述的相同程序进行由PriB的体外转化,不同之处在于使用化合物13D-4代替3-[2-(二甲基氨基)乙基]-1H-吲哚-4-基丙酸酯底物。如实施例3中所述,使用高分辨率LC-HESI-LTQ-Orbitrap-XL MS(Thermo FisherScientific)进行分析。与具有化学式(LXXVI)的3-(2-[(异丙基)-N-甲基氨基]乙基)-6-(3-甲基-2-丁烯基)-1H-吲哚-4-醇的单质子化形式相匹配的具有精确m/z和预期元素式的单质子化产物在4.2分钟时洗脱(EIC,参见:图56):
/>
序列表
<110> 迈吉克默德工业公司(MAGICMED INDUSTRIES INC.)
<120> 多取代基裸盖菇素衍生物及使用方法
<130> 21806-P63978PC00
<150> US 63/149,001
<151> 2021-02-12
<150> US 63/247,881
<151> 2021-09-24
<160> 54
<170> PatentIn version 3.5
<210> 1
<211> 1167
<212> DNA
<213> 激烈火球菌
<400> 1
atgtggttcg gtgagtttgg tggacaatat gtgccagaga ctttagtggg tcctcttaag 60
gaattggaaa aggcatataa aaggttcaag gacgatgagg agttcaacag gcaactaaac 120
tattatttga agacatgggc cggtagacca acgcccttgt attatgctaa gaggttaact 180
gaaaagattg gcggcgcgaa agtgtatctg aaaagagaag acctagttca tggtggagca 240
cacaagacaa ataatgccat tggacaagca ctattggcaa agctaatggg taaaactaga 300
ttgatagctg agacaggagc gggtcaacat ggggtcgcga cagcgatggc tggtgcacta 360
ctggggatga aggtagatat ttacatgggt gctgaggacg ttgagcgtca gaaactaaat 420
gtcttcagga tgaagctatt aggtgccaat gttatacctg taaattctgg ctcaagaaca 480
ctaaaggacg ccttcgacga ggctcttaga gactgggttg ccactttcga gtatactcat 540
tacttgatcg gttcagtggt tggaccacat ccatacccaa ccatcgttag ggactttcag 600
agcgtgattg gtagagaggc taaggcacag atcttagaag cagagggaca gctacctgac 660
gtcatagttg cctgcgtcgg cggtggctct aacgcaatgg gtatattcta tccattcgtt 720
aatgacaaga aggttaaatt agtaggagtc gaagctggcg gaaaggggtt agagtcgggt 780
aaacactcag caagcttaaa tgcaggacag gtaggggtgt cccacggcat gttgtcgtat 840
ttcttgcaag acgaggaagg tcagataaag ccaagtcatt caattgctcc aggccttgac 900
caccccggtg ttggtccaga gcacgcttac ttaaagaaga ttcaaagggc cgagtacgtc 960
gctgtaacag acgaagaggc attgaaagct ttccatgagc tatccagaac tgaggggatt 1020
atacccgccc ttgagtctgc ccatgctgtg gcgtacgcca tgaagttagc taaagagatg 1080
tcccgtgacg aaatcatcat tgtaaatcta tcagggagag gagacaagga tttggacatt 1140
gtattgaagg caagcggaaa tgtttga 1167
<210> 2
<211> 388
<212> PRT
<213> 激烈火球菌
<400> 2
Met Trp Phe Gly Glu Phe Gly Gly Gln Tyr Val Pro Glu Thr Leu Val
1 5 10 15
Gly Pro Leu Lys Glu Leu Glu Lys Ala Tyr Lys Arg Phe Lys Asp Asp
20 25 30
Glu Glu Phe Asn Arg Gln Leu Asn Tyr Tyr Leu Lys Thr Trp Ala Gly
35 40 45
Arg Pro Thr Pro Leu Tyr Tyr Ala Lys Arg Leu Thr Glu Lys Ile Gly
50 55 60
Gly Ala Lys Val Tyr Leu Lys Arg Glu Asp Leu Val His Gly Gly Ala
65 70 75 80
His Lys Thr Asn Asn Ala Ile Gly Gln Ala Leu Leu Ala Lys Leu Met
85 90 95
Gly Lys Thr Arg Leu Ile Ala Glu Thr Gly Ala Gly Gln His Gly Val
100 105 110
Ala Thr Ala Met Ala Gly Ala Leu Leu Gly Met Lys Val Asp Ile Tyr
115 120 125
Met Gly Ala Glu Asp Val Glu Arg Gln Lys Leu Asn Val Phe Arg Met
130 135 140
Lys Leu Leu Gly Ala Asn Val Ile Pro Val Asn Ser Gly Ser Arg Thr
145 150 155 160
Leu Lys Asp Ala Phe Asp Glu Ala Leu Arg Asp Trp Val Ala Thr Phe
165 170 175
Glu Tyr Thr His Tyr Leu Ile Gly Ser Val Val Gly Pro His Pro Tyr
180 185 190
Pro Thr Ile Val Arg Asp Phe Gln Ser Val Ile Gly Arg Glu Ala Lys
195 200 205
Ala Gln Ile Leu Glu Ala Glu Gly Gln Leu Pro Asp Val Ile Val Ala
210 215 220
Cys Val Gly Gly Gly Ser Asn Ala Met Gly Ile Phe Tyr Pro Phe Val
225 230 235 240
Asn Asp Lys Lys Val Lys Leu Val Gly Val Glu Ala Gly Gly Lys Gly
245 250 255
Leu Glu Ser Gly Lys His Ser Ala Ser Leu Asn Ala Gly Gln Val Gly
260 265 270
Val Ser His Gly Met Leu Ser Tyr Phe Leu Gln Asp Glu Glu Gly Gln
275 280 285
Ile Lys Pro Ser His Ser Ile Ala Pro Gly Leu Asp His Pro Gly Val
290 295 300
Gly Pro Glu His Ala Tyr Leu Lys Lys Ile Gln Arg Ala Glu Tyr Val
305 310 315 320
Ala Val Thr Asp Glu Glu Ala Leu Lys Ala Phe His Glu Leu Ser Arg
325 330 335
Thr Glu Gly Ile Ile Pro Ala Leu Glu Ser Ala His Ala Val Ala Tyr
340 345 350
Ala Met Lys Leu Ala Lys Glu Met Ser Arg Asp Glu Ile Ile Ile Val
355 360 365
Asn Leu Ser Gly Arg Gly Asp Lys Asp Leu Asp Ile Val Leu Lys Ala
370 375 380
Ser Gly Asn Val
385
<210> 3
<211> 1446
<212> DNA
<213> 萎缩芽孢杆菌
<400> 3
atgatgtctg aaaatttgca attgtcagct gaagaaatga gacaattggg ttaccaagca 60
gttgatttga tcatcgatca catgaaccat ttgaagtcta agccagtttc agaaacaatc 120
gattctgata tcttgagaaa taagttgact gaatctatcc cagaaaatgg ttcagatcca 180
aaggaattgt tgcatttctt gaacagaaac gtttttaatc aaattacaca tgttgatcat 240
ccacatttct tggcttttgt tccaggtcca aataattacg ttggtgttgt tgcagatttc 300
ttggcttctg gttttaatgt ttttccaact gcatggattg ctggtgcagg tgctgaacaa 360
atcgaattga ctacaattaa ttggttgaaa tctatgttgg gttttccaga ttcagctgaa 420
ggtttatttg tttctggtgg ttcaatggca aatttgacag ctttgactgt tgcaagacag 480
gctaagttga acaacgatat cgaaaatgct gttgtttact tctctgatca aacacatttc 540
tcagttgata gagcattgaa ggttttaggt tttaaacatc atcaaatctg tagaatcgaa 600
acagatgaac atttgagaat ctctgtttca gctttgaaga aacaaattaa agaagataga 660
actaagggta aaaagccatt ctgtgttatt gcaaatgctg gtactacaaa ttgtggtgct 720
gttgattctt tgaacgaatt agcagatttg tgtaacgatg aagatgtttg gttgcatgct 780
gatggttctt atggtgctcc agctatcttg tctgaaaagg gttcagctat gttgcaaggt 840
attcatagag cagattcttt gactttagat ccacataagt ggttgttcca accatacgat 900
gttggttgtg ttttgatcag aaactctcaa tatttgtcaa agacttttag aatgatgcca 960
gaatacatca aggattcaga aactaacgtt gaaggtgaaa ttaatttcgg tgaatgtggt 1020
atcgaattgt caagaagatt cagagctttg aaggtttggt tgtcttttaa agttttcggt 1080
gttgctgctt ttagacaagc aatcgatcat ggtatcatgt tagcagaaca agttgaagca 1140
tttttgggta aagcaaaaga ttgggaagtt gttacaccag ctcaattggg tatcgttact 1200
tttagataca ttccatctga attggcatca acagatacta ttaatgaaat taataagaaa 1260
ttggttaagg aaatcacaca tagaggtttc gctatgttat ctactacaga attgaaggaa 1320
aaggttgtta ttagattgtg ttcaattaat ccaagaacta caactgaaga aatgttgcaa 1380
atcatgatga agattaaagc attggctgaa gaagtttcta tttcataccc atgtgttgct 1440
gaataa 1446
<210> 4
<211> 481
<212> PRT
<213> 萎缩芽孢杆菌
<400> 4
Met Met Ser Glu Asn Leu Gln Leu Ser Ala Glu Glu Met Arg Gln Leu
1 5 10 15
Gly Tyr Gln Ala Val Asp Leu Ile Ile Asp His Met Asn His Leu Lys
20 25 30
Ser Lys Pro Val Ser Glu Thr Ile Asp Ser Asp Ile Leu Arg Asn Lys
35 40 45
Leu Thr Glu Ser Ile Pro Glu Asn Gly Ser Asp Pro Lys Glu Leu Leu
50 55 60
His Phe Leu Asn Arg Asn Val Phe Asn Gln Ile Thr His Val Asp His
65 70 75 80
Pro His Phe Leu Ala Phe Val Pro Gly Pro Asn Asn Tyr Val Gly Val
85 90 95
Val Ala Asp Phe Leu Ala Ser Gly Phe Asn Val Phe Pro Thr Ala Trp
100 105 110
Ile Ala Gly Ala Gly Ala Glu Gln Ile Glu Leu Thr Thr Ile Asn Trp
115 120 125
Leu Lys Ser Met Leu Gly Phe Pro Asp Ser Ala Glu Gly Leu Phe Val
130 135 140
Ser Gly Gly Ser Met Ala Asn Leu Thr Ala Leu Thr Val Ala Arg Gln
145 150 155 160
Ala Lys Leu Asn Asn Asp Ile Glu Asn Ala Val Val Tyr Phe Ser Asp
165 170 175
Gln Thr His Phe Ser Val Asp Arg Ala Leu Lys Val Leu Gly Phe Lys
180 185 190
His His Gln Ile Cys Arg Ile Glu Thr Asp Glu His Leu Arg Ile Ser
195 200 205
Val Ser Ala Leu Lys Lys Gln Ile Lys Glu Asp Arg Thr Lys Gly Lys
210 215 220
Lys Pro Phe Cys Val Ile Ala Asn Ala Gly Thr Thr Asn Cys Gly Ala
225 230 235 240
Val Asp Ser Leu Asn Glu Leu Ala Asp Leu Cys Asn Asp Glu Asp Val
245 250 255
Trp Leu His Ala Asp Gly Ser Tyr Gly Ala Pro Ala Ile Leu Ser Glu
260 265 270
Lys Gly Ser Ala Met Leu Gln Gly Ile His Arg Ala Asp Ser Leu Thr
275 280 285
Leu Asp Pro His Lys Trp Leu Phe Gln Pro Tyr Asp Val Gly Cys Val
290 295 300
Leu Ile Arg Asn Ser Gln Tyr Leu Ser Lys Thr Phe Arg Met Met Pro
305 310 315 320
Glu Tyr Ile Lys Asp Ser Glu Thr Asn Val Glu Gly Glu Ile Asn Phe
325 330 335
Gly Glu Cys Gly Ile Glu Leu Ser Arg Arg Phe Arg Ala Leu Lys Val
340 345 350
Trp Leu Ser Phe Lys Val Phe Gly Val Ala Ala Phe Arg Gln Ala Ile
355 360 365
Asp His Gly Ile Met Leu Ala Glu Gln Val Glu Ala Phe Leu Gly Lys
370 375 380
Ala Lys Asp Trp Glu Val Val Thr Pro Ala Gln Leu Gly Ile Val Thr
385 390 395 400
Phe Arg Tyr Ile Pro Ser Glu Leu Ala Ser Thr Asp Thr Ile Asn Glu
405 410 415
Ile Asn Lys Lys Leu Val Lys Glu Ile Thr His Arg Gly Phe Ala Met
420 425 430
Leu Ser Thr Thr Glu Leu Lys Glu Lys Val Val Ile Arg Leu Cys Ser
435 440 445
Ile Asn Pro Arg Thr Thr Thr Glu Glu Met Leu Gln Ile Met Met Lys
450 455 460
Ile Lys Ala Leu Ala Glu Glu Val Ser Ile Ser Tyr Pro Cys Val Ala
465 470 475 480
Glu
<210> 5
<211> 1254
<212> DNA
<213> 担孢子梭菌
<400> 5
atgaagttct ggagaaagta cacacaacaa gaaatggatg aaaagattac tgaatctttg 60
gaaaagactt tgaactacga taacactaag acaatcggta ttccaggtac taagttggat 120
gatacagttt tctatgatga tcattctttc gttaagcatt caccatactt gagaactttt 180
attcaaaacc caaaccatat cggttgtcat acttatgata aggctgatat cttgttcggt 240
ggtacattcg atatcgaaag agaattaatc caattgttag caatcgatgt tttgaacggt 300
aacgatgaag aatttgatgg ttacgttact caaggtggta cagaagctaa catccaagca 360
atgtgggttt acagaaacta cttcaagaaa gaaagaaagg ctaagcatga agaaatcgct 420
atcatcactt cagcagatac acattactct gcatacaaag gttcagattt gttgaacatc 480
gatattatta aggttccagt tgatttttat tcaagaaaaa ttcaagaaaa tacattggat 540
tcaattgtta aagaagctaa agaaattggt aaaaagtact tcatcgttat ctctaacatg 600
ggtactacaa tgtttggttc agttgatgat ccagatttgt acgctaacat cttcgataag 660
tacaatttgg aatacaaaat tcatgttgat ggtgcatttg gtggttttat atatccaatt 720
gataataagg aatgtaaaac tgatttctct aataagaacg tttcttcaat cacattagat 780
ggtcataaga tgttgcaagc tccatacggt actggtatct tcgtttcaag aaagaatttg 840
atccataaca ctttgacaaa ggaagcaact tacatcgaaa atttggatgt tacattgtct 900
ggttcaagat ctggttcaaa tgctgttgca atttggatgg ttttagcttc ttatggtcca 960
tacggttgga tggaaaagat taataagttg agaaatagaa ctaaatggtt gtgtaagcaa 1020
ttgaacgata tgagaattaa atattacaaa gaagattcaa tgaatattgt tacaattgaa 1080
gaacaatatg ttaataagga aatcgctgaa aagtactttt tagttccaga agttcataac 1140
ccaactaaca actggtacaa gatcgttgtt atggaacatg ttgaattgga tatcttgaac 1200
tctttggttt acgatttgag aaagtttaat aaggaacatt tgaaggcaat gtaa 1254
<210> 6
<211> 417
<212> PRT
<213> 担孢子梭菌
<400> 6
Met Lys Phe Trp Arg Lys Tyr Thr Gln Gln Glu Met Asp Glu Lys Ile
1 5 10 15
Thr Glu Ser Leu Glu Lys Thr Leu Asn Tyr Asp Asn Thr Lys Thr Ile
20 25 30
Gly Ile Pro Gly Thr Lys Leu Asp Asp Thr Val Phe Tyr Asp Asp His
35 40 45
Ser Phe Val Lys His Ser Pro Tyr Leu Arg Thr Phe Ile Gln Asn Pro
50 55 60
Asn His Ile Gly Cys His Thr Tyr Asp Lys Ala Asp Ile Leu Phe Gly
65 70 75 80
Gly Thr Phe Asp Ile Glu Arg Glu Leu Ile Gln Leu Leu Ala Ile Asp
85 90 95
Val Leu Asn Gly Asn Asp Glu Glu Phe Asp Gly Tyr Val Thr Gln Gly
100 105 110
Gly Thr Glu Ala Asn Ile Gln Ala Met Trp Val Tyr Arg Asn Tyr Phe
115 120 125
Lys Lys Glu Arg Lys Ala Lys His Glu Glu Ile Ala Ile Ile Thr Ser
130 135 140
Ala Asp Thr His Tyr Ser Ala Tyr Lys Gly Ser Asp Leu Leu Asn Ile
145 150 155 160
Asp Ile Ile Lys Val Pro Val Asp Phe Tyr Ser Arg Lys Ile Gln Glu
165 170 175
Asn Thr Leu Asp Ser Ile Val Lys Glu Ala Lys Glu Ile Gly Lys Lys
180 185 190
Tyr Phe Ile Val Ile Ser Asn Met Gly Thr Thr Met Phe Gly Ser Val
195 200 205
Asp Asp Pro Asp Leu Tyr Ala Asn Ile Phe Asp Lys Tyr Asn Leu Glu
210 215 220
Tyr Lys Ile His Val Asp Gly Ala Phe Gly Gly Phe Ile Tyr Pro Ile
225 230 235 240
Asp Asn Lys Glu Cys Lys Thr Asp Phe Ser Asn Lys Asn Val Ser Ser
245 250 255
Ile Thr Leu Asp Gly His Lys Met Leu Gln Ala Pro Tyr Gly Thr Gly
260 265 270
Ile Phe Val Ser Arg Lys Asn Leu Ile His Asn Thr Leu Thr Lys Glu
275 280 285
Ala Thr Tyr Ile Glu Asn Leu Asp Val Thr Leu Ser Gly Ser Arg Ser
290 295 300
Gly Ser Asn Ala Val Ala Ile Trp Met Val Leu Ala Ser Tyr Gly Pro
305 310 315 320
Tyr Gly Trp Met Glu Lys Ile Asn Lys Leu Arg Asn Arg Thr Lys Trp
325 330 335
Leu Cys Lys Gln Leu Asn Asp Met Arg Ile Lys Tyr Tyr Lys Glu Asp
340 345 350
Ser Met Asn Ile Val Thr Ile Glu Glu Gln Tyr Val Asn Lys Glu Ile
355 360 365
Ala Glu Lys Tyr Phe Leu Val Pro Glu Val His Asn Pro Thr Asn Asn
370 375 380
Trp Tyr Lys Ile Val Val Met Glu His Val Glu Leu Asp Ile Leu Asn
385 390 395 400
Ser Leu Val Tyr Asp Leu Arg Lys Phe Asn Lys Glu His Leu Lys Ala
405 410 415
Met
<210> 7
<211> 1320
<212> DNA
<213> 古巴裸盖菇
<400> 7
atgcaggtga tacccgcgtg caactcggca gcaataagat cactatgtcc tactcccgag 60
tcttttagaa acatgggatg gctctctgtc agcgatgcgg tctacagcga gttcatagga 120
gagttggcta cccgcgcttc caatcgaaat tactccaacg agttcggcct catgcaacct 180
atccaggaat tcaaggcttt cattgaaagc gacccggtgg tgcaccaaga atttattgac 240
atgttcgagg gcattcagga ctctccaagg aattatcagg aactatgtaa tatgttcaac 300
gatatctttc gcaaagctcc cgtctacgga gaccttggcc ctcccgttta tatgattatg 360
gccaaattaa tgaacacccg agcgggcttc tctgcattca cgagacaaag gttgaacctt 420
cacttcaaaa aacttttcga tacctgggga ttgttcctgt cttcgaaaga ttctcgaaat 480
gttcttgtgg ccgaccagtt cgacgacaga cattgcggct ggttgaacga gcgggccttg 540
tctgctatgg ttaaacatta caatggacgc gcatttgatg aagtcttcct ctgcgataaa 600
aatgccccat actacggctt caactcttac gacgacttct ttaatcgcag atttcgaaac 660
cgagatatcg accgacctgt agtcggtgga gttaacaaca ccaccctcat ttctgctgct 720
tgcgaatcac tttcctacaa cgtctcttat gacgtccagt ctctcgacac tttagttttc 780
aaaggagaga cttattcgct taagcatttg ctgaataatg accctttcac cccacaattc 840
gagcatggga gtattctaca aggattcttg aacgtcaccg cttaccaccg atggcacgca 900
cccgtcaatg ggacaatcgt caaaatcatc aacgttccag gtacctactt tgcgcaagcc 960
ccgagcacga ttggcgaccc tatcccggat aacgattacg acccacctcc ttaccttaag 1020
tctcttgtct acttctctaa tattgccgca aggcaaatta tgtttattga agccgacaac 1080
aaggaaattg gcctcatttt ccttgtgttc atcggcatga ccgaaatctc gacatgtgaa 1140
gccacggtgt ccgaaggtca acacgtcaat cgtggcgatg acttgggaat gttccatttc 1200
ggtggttctt cgttcgcgct tggtctgagg aaggattgca gggcagagat cgttgaaaag 1260
ttcaccgaac ccggaacagt gatcagaatc aacgaagtcg tcgctgctct aaaggcttag 1320
<210> 8
<211> 439
<212> PRT
<213> 古巴裸盖菇
<400> 8
Met Gln Val Ile Pro Ala Cys Asn Ser Ala Ala Ile Arg Ser Leu Cys
1 5 10 15
Pro Thr Pro Glu Ser Phe Arg Asn Met Gly Trp Leu Ser Val Ser Asp
20 25 30
Ala Val Tyr Ser Glu Phe Ile Gly Glu Leu Ala Thr Arg Ala Ser Asn
35 40 45
Arg Asn Tyr Ser Asn Glu Phe Gly Leu Met Gln Pro Ile Gln Glu Phe
50 55 60
Lys Ala Phe Ile Glu Ser Asp Pro Val Val His Gln Glu Phe Ile Asp
65 70 75 80
Met Phe Glu Gly Ile Gln Asp Ser Pro Arg Asn Tyr Gln Glu Leu Cys
85 90 95
Asn Met Phe Asn Asp Ile Phe Arg Lys Ala Pro Val Tyr Gly Asp Leu
100 105 110
Gly Pro Pro Val Tyr Met Ile Met Ala Lys Leu Met Asn Thr Arg Ala
115 120 125
Gly Phe Ser Ala Phe Thr Arg Gln Arg Leu Asn Leu His Phe Lys Lys
130 135 140
Leu Phe Asp Thr Trp Gly Leu Phe Leu Ser Ser Lys Asp Ser Arg Asn
145 150 155 160
Val Leu Val Ala Asp Gln Phe Asp Asp Arg His Cys Gly Trp Leu Asn
165 170 175
Glu Arg Ala Leu Ser Ala Met Val Lys His Tyr Asn Gly Arg Ala Phe
180 185 190
Asp Glu Val Phe Leu Cys Asp Lys Asn Ala Pro Tyr Tyr Gly Phe Asn
195 200 205
Ser Tyr Asp Asp Phe Phe Asn Arg Arg Phe Arg Asn Arg Asp Ile Asp
210 215 220
Arg Pro Val Val Gly Gly Val Asn Asn Thr Thr Leu Ile Ser Ala Ala
225 230 235 240
Cys Glu Ser Leu Ser Tyr Asn Val Ser Tyr Asp Val Gln Ser Leu Asp
245 250 255
Thr Leu Val Phe Lys Gly Glu Thr Tyr Ser Leu Lys His Leu Leu Asn
260 265 270
Asn Asp Pro Phe Thr Pro Gln Phe Glu His Gly Ser Ile Leu Gln Gly
275 280 285
Phe Leu Asn Val Thr Ala Tyr His Arg Trp His Ala Pro Val Asn Gly
290 295 300
Thr Ile Val Lys Ile Ile Asn Val Pro Gly Thr Tyr Phe Ala Gln Ala
305 310 315 320
Pro Ser Thr Ile Gly Asp Pro Ile Pro Asp Asn Asp Tyr Asp Pro Pro
325 330 335
Pro Tyr Leu Lys Ser Leu Val Tyr Phe Ser Asn Ile Ala Ala Arg Gln
340 345 350
Ile Met Phe Ile Glu Ala Asp Asn Lys Glu Ile Gly Leu Ile Phe Leu
355 360 365
Val Phe Ile Gly Met Thr Glu Ile Ser Thr Cys Glu Ala Thr Val Ser
370 375 380
Glu Gly Gln His Val Asn Arg Gly Asp Asp Leu Gly Met Phe His Phe
385 390 395 400
Gly Gly Ser Ser Phe Ala Leu Gly Leu Arg Lys Asp Cys Arg Ala Glu
405 410 415
Ile Val Glu Lys Phe Thr Glu Pro Gly Thr Val Ile Arg Ile Asn Glu
420 425 430
Val Val Ala Ala Leu Lys Ala
435
<210> 9
<211> 546
<212> DNA
<213> 灰褐链霉菌
<400> 9
atgaacacct tcagaacagc cactgccaga gacatacctg atgtagcagc aactcttacg 60
gaagccttcg caactgatcc acccacgcag tgggtgttcc ccgacggtac tgccgccgtc 120
agcaggttct ttacacatgt tgcagatagg gttcacacgg ccggtggtat tgttgagcta 180
ctaccagaca gagccgccat gattgcattg ccaccacacg tgaggctgcc aggagaagct 240
gccgacggaa ggcaggcgga aattcagaga aggctggcag acaggcaccc gctgacacct 300
cactactacc tgctgtttta cggagttaga acggcacacc agggttcggg attgggcgga 360
agaatgctgg ccagattaac tagcagagct gatagggaca gggtgggtac atatactgag 420
gcatccacct ggcgtggcgc tagactgatg ctgagacatg gattccatgc tacaaggcca 480
ctaagattgc cagatggacc cagcatgttt ccactttgga gagatccaat ccatgatcat 540
tctgat 546
<210> 10
<211> 182
<212> PRT
<213> 灰褐链霉菌
<400> 10
Met Asn Thr Phe Arg Thr Ala Thr Ala Arg Asp Ile Pro Asp Val Ala
1 5 10 15
Ala Thr Leu Thr Glu Ala Phe Ala Thr Asp Pro Pro Thr Gln Trp Val
20 25 30
Phe Pro Asp Gly Thr Ala Ala Val Ser Arg Phe Phe Thr His Val Ala
35 40 45
Asp Arg Val His Thr Ala Gly Gly Ile Val Glu Leu Leu Pro Asp Arg
50 55 60
Ala Ala Met Ile Ala Leu Pro Pro His Val Arg Leu Pro Gly Glu Ala
65 70 75 80
Ala Asp Gly Arg Gln Ala Glu Ile Gln Arg Arg Leu Ala Asp Arg His
85 90 95
Pro Leu Thr Pro His Tyr Tyr Leu Leu Phe Tyr Gly Val Arg Thr Ala
100 105 110
His Gln Gly Ser Gly Leu Gly Gly Arg Met Leu Ala Arg Leu Thr Ser
115 120 125
Arg Ala Asp Arg Asp Arg Val Gly Thr Tyr Thr Glu Ala Ser Thr Trp
130 135 140
Arg Gly Ala Arg Leu Met Leu Arg His Gly Phe His Ala Thr Arg Pro
145 150 155 160
Leu Arg Leu Pro Asp Gly Pro Ser Met Phe Pro Leu Trp Arg Asp Pro
165 170 175
Ile His Asp His Ser Asp
180
<210> 11
<211> 1092
<212> DNA
<213> 草麻黄
<400> 11
atgggatcca tggaagaagc aaaaatggcg accctgggcg gtgcgtccta tgcgatgatt 60
gtgaaaacga tgatgcgctc tctggaagca aacctgattc cggattttgt gctgcgtcgc 120
ctgacgcgta tcctgctggc tagtcgcctg aaactgggtt ataagcagac cgctgaactg 180
caactggcgg atctgatgtc attcgttgcg tcgctgaaaa cgatgccgat tgccctgtgc 240
accgaagaag caaagggtca gcattacgaa ctgccgacca gctttttcaa actggtcctg 300
ggcaaacatc tgaagtatag ctctgcctac ttttctgaac acacccgtac gctggatgaa 360
gcggaagaag ccatgctggc actgtattgc gaacgcgcca aaattgaaga tggtcagaag 420
attctggaca tcggctgtgg ttggggcagt ttttccctgt atgtggcaga acgttacccg 480
aaatgcgaaa ttacgggcct gtgtaacagt tccacccaaa aagccttcat cgaacagcaa 540
tgcagcgaac gtcgcctgtg taatgttacc atttatgcag atgacatcag cacctttgat 600
acggaatcta cctacgaccg cattatcagc atcgaaatgt tcgaacacat gaagaactac 660
agtacgctgc tgaagaaaat tagcaagtgg atgaatcagg aatgcctgct gtttgtccat 720
tatttctgtc acaaaacctt tgcgtaccac ttcgaagatg tggacgaaga tgactggatg 780
gctcgttatt tctttaccgg cggcaccatg ccggcgtcat cgctgctgct gtactttcag 840
gatgacgtct cagtggttga tcattggctg attaacggta aacactatgc tcaaacctcg 900
gaagaatggc tgaagcgtat ggaccacaat ctgagctcta ttctgccgat ctttaacgaa 960
acgtatggcg aaaatgcggc caaaaagtgg ctggcatact ggcgcacctt tttcatcgca 1020
gttgctgaac tgttcaaata caacgatggc gaagaatgga tggtgtccca cttcctgttc 1080
aaaaagaaat aa 1092
<210> 12
<211> 363
<212> PRT
<213> 草麻黄
<400> 12
Met Gly Ser Met Glu Glu Ala Lys Met Ala Thr Leu Gly Gly Ala Ser
1 5 10 15
Tyr Ala Met Ile Val Lys Thr Met Met Arg Ser Leu Glu Ala Asn Leu
20 25 30
Ile Pro Asp Phe Val Leu Arg Arg Leu Thr Arg Ile Leu Leu Ala Ser
35 40 45
Arg Leu Lys Leu Gly Tyr Lys Gln Thr Ala Glu Leu Gln Leu Ala Asp
50 55 60
Leu Met Ser Phe Val Ala Ser Leu Lys Thr Met Pro Ile Ala Leu Cys
65 70 75 80
Thr Glu Glu Ala Lys Gly Gln His Tyr Glu Leu Pro Thr Ser Phe Phe
85 90 95
Lys Leu Val Leu Gly Lys His Leu Lys Tyr Ser Ser Ala Tyr Phe Ser
100 105 110
Glu His Thr Arg Thr Leu Asp Glu Ala Glu Glu Ala Met Leu Ala Leu
115 120 125
Tyr Cys Glu Arg Ala Lys Ile Glu Asp Gly Gln Lys Ile Leu Asp Ile
130 135 140
Gly Cys Gly Trp Gly Ser Phe Ser Leu Tyr Val Ala Glu Arg Tyr Pro
145 150 155 160
Lys Cys Glu Ile Thr Gly Leu Cys Asn Ser Ser Thr Gln Lys Ala Phe
165 170 175
Ile Glu Gln Gln Cys Ser Glu Arg Arg Leu Cys Asn Val Thr Ile Tyr
180 185 190
Ala Asp Asp Ile Ser Thr Phe Asp Thr Glu Ser Thr Tyr Asp Arg Ile
195 200 205
Ile Ser Ile Glu Met Phe Glu His Met Lys Asn Tyr Ser Thr Leu Leu
210 215 220
Lys Lys Ile Ser Lys Trp Met Asn Gln Glu Cys Leu Leu Phe Val His
225 230 235 240
Tyr Phe Cys His Lys Thr Phe Ala Tyr His Phe Glu Asp Val Asp Glu
245 250 255
Asp Asp Trp Met Ala Arg Tyr Phe Phe Thr Gly Gly Thr Met Pro Ala
260 265 270
Ser Ser Leu Leu Leu Tyr Phe Gln Asp Asp Val Ser Val Val Asp His
275 280 285
Trp Leu Ile Asn Gly Lys His Tyr Ala Gln Thr Ser Glu Glu Trp Leu
290 295 300
Lys Arg Met Asp His Asn Leu Ser Ser Ile Leu Pro Ile Phe Asn Glu
305 310 315 320
Thr Tyr Gly Glu Asn Ala Ala Lys Lys Trp Leu Ala Tyr Trp Arg Thr
325 330 335
Phe Phe Ile Ala Val Ala Glu Leu Phe Lys Tyr Asn Asp Gly Glu Glu
340 345 350
Trp Met Val Ser His Phe Leu Phe Lys Lys Lys
355 360
<210> 13
<211> 930
<212> DNA
<213> 古巴裸盖菇
<400> 13
atgcatatca gaaatcctta ccgtacacca attgactatc aagcactttc agaggccttc 60
cctcccctca agccatttgt gtctgtcaat gcagatggta ccagttctgt tgacctcact 120
atcccagaag cccagagggc gttcacggcc gctcttcttc atcgtgactt cgggctcacc 180
atgaccatac cagaagaccg tctgtgccca acagtcccca ataggttgaa ctacgttctg 240
tggattgaag atattttcaa ctacacgaac aaaaccctcg gcctgtcgga tgaccgtcct 300
attaaaggcg ttgatattgg tacaggagcc tccgcaattt atcctatgct tgcctgtgct 360
cggttcaagg catggtctat ggttggaaca gaggtcgaga ggaagtgcat tgacacggcc 420
cgcctcaatg tcgtcgcgaa caatctccaa gaccgtctct cgatattaga gacatccatt 480
gatggtccta ttctcgtccc cattttcgag gcgactgaag aatacgaata cgagtttact 540
atgtgtaacc ctccattcta cgacggtgct gccgatatgc agacttcgga tgctgccaaa 600
ggatttggat ttggcgtggg cgctccccat tctggaacag tcatcgaaat gtcgactgag 660
ggaggtgaat cggctttcgt cgctcagatg gtccgtgaga gcttgaagct tcgaacacga 720
tgcagatggt acacgagtaa cttgggaaag ctgaaatcct tgaaagaaat agtggggctg 780
ctgaaagaac ttgagataag caactatgcc attaacgaat acgttcaggg gtccacacgt 840
cgttatgccg ttgcgtggtc tttcactgat attcaactgc ctgaggagct ttctcgtccc 900
tctaaccccg agctcagctc tcttttctag 930
<210> 14
<211> 309
<212> PRT
<213> 古巴裸盖菇
<400> 14
Met His Ile Arg Asn Pro Tyr Arg Thr Pro Ile Asp Tyr Gln Ala Leu
1 5 10 15
Ser Glu Ala Phe Pro Pro Leu Lys Pro Phe Val Ser Val Asn Ala Asp
20 25 30
Gly Thr Ser Ser Val Asp Leu Thr Ile Pro Glu Ala Gln Arg Ala Phe
35 40 45
Thr Ala Ala Leu Leu His Arg Asp Phe Gly Leu Thr Met Thr Ile Pro
50 55 60
Glu Asp Arg Leu Cys Pro Thr Val Pro Asn Arg Leu Asn Tyr Val Leu
65 70 75 80
Trp Ile Glu Asp Ile Phe Asn Tyr Thr Asn Lys Thr Leu Gly Leu Ser
85 90 95
Asp Asp Arg Pro Ile Lys Gly Val Asp Ile Gly Thr Gly Ala Ser Ala
100 105 110
Ile Tyr Pro Met Leu Ala Cys Ala Arg Phe Lys Ala Trp Ser Met Val
115 120 125
Gly Thr Glu Val Glu Arg Lys Cys Ile Asp Thr Ala Arg Leu Asn Val
130 135 140
Val Ala Asn Asn Leu Gln Asp Arg Leu Ser Ile Leu Glu Thr Ser Ile
145 150 155 160
Asp Gly Pro Ile Leu Val Pro Ile Phe Glu Ala Thr Glu Glu Tyr Glu
165 170 175
Tyr Glu Phe Thr Met Cys Asn Pro Pro Phe Tyr Asp Gly Ala Ala Asp
180 185 190
Met Gln Thr Ser Asp Ala Ala Lys Gly Phe Gly Phe Gly Val Gly Ala
195 200 205
Pro His Ser Gly Thr Val Ile Glu Met Ser Thr Glu Gly Gly Glu Ser
210 215 220
Ala Phe Val Ala Gln Met Val Arg Glu Ser Leu Lys Leu Arg Thr Arg
225 230 235 240
Cys Arg Trp Tyr Thr Ser Asn Leu Gly Lys Leu Lys Ser Leu Lys Glu
245 250 255
Ile Val Gly Leu Leu Lys Glu Leu Glu Ile Ser Asn Tyr Ala Ile Asn
260 265 270
Glu Tyr Val Gln Gly Ser Thr Arg Arg Tyr Ala Val Ala Trp Ser Phe
275 280 285
Thr Asp Ile Gln Leu Pro Glu Glu Leu Ser Arg Pro Ser Asn Pro Glu
290 295 300
Leu Ser Ser Leu Phe
305
<210> 15
<211> 1419
<212> DNA
<213> 烟曲霉
<400> 15
atgtccatcg gagccgagat cgattcgctg gttcctgctc caccgggcct caacggcacc 60
gctgcgggct atccagccaa gacgcagaag gagttaagca acggagactt tgacgcgcac 120
gatggtcttt ctcttgcaca actgacaccg tacgatgtct tgacggctgc acttccgctg 180
ccggctccgg cttcgagcac agggttctgg tggcgggaga cgggccctgt tatgagcaag 240
cttttggcca aggcgaacta ccctctttac actcattaca agtaccttat gttataccat 300
acccatattc tcccattgtt gggacctcga ccgccgctcg agaactcgac gcacccgtcg 360
ccgagtaacg cgccgtggag gtccttcctg acagacgact tcactccgct cgagccgagc 420
tggaacgtga acgggaactc ggaagcacag agcacaatcc gtcttggtat tgaacctata 480
ggctttgaag ccggggctgc agcggaccca ttcaaccaag ctgccgtgac gcagttcatg 540
cactcatacg aggcaaccga agtcggtgcc acgctgacgc tgttcgagca cttccgcaac 600
gacatgtttg ttggcccaga aacgtacgct gcgttaagag cgaagatacc agaaggcgag 660
cataccacac agagtttcct ggcgttcgac ctggacgcgg gtcgtgtcac cacaaaggcg 720
tactttttcc cgattctcat gtcgttgaaa actggacaga gcacaacaaa ggtggtctct 780
gattccattc tgcatctagc gctgaagagt gaggtgtggg gtgtgcagac catcgccgcg 840
atgtcggtca tggaggcgtg gataggtagc tacggtggcg cggcaaagac ggagatgatc 900
agcgtcgatt gcgtgaacga ggcagactct cggatcaaga tatacgtgcg gatgccacat 960
acatccttgc ggaaggtaaa agaggcgtac tgcttaggtg ggcggttgac agacgagaac 1020
acaaaggagg gcctgaagct gctggacgag ctgtggagga cggtcttcgg catcgacgac 1080
gaggacgcgg agctgccaca gaatagccat cgcaccgcag gcacaatatt caatttcgag 1140
ctgaggccag ggaaatggtt ccccgagccc aaggtatacc tgcccgtccg acactactgt 1200
gaaagtgata tgcagattgc tagtcggcta caaacgttct ttggaaggct cggatggcac 1260
aacatggaga aagattattg caagcatctg gaagatttgt ttccccatca tccactgtcc 1320
tcgtcaacgg gcacacacac ctttctctca ttttcgtata agaagcagaa gggggtctat 1380
atgaccatgt attataatct ccgggtgtac agcacctaa 1419
<210> 16
<211> 472
<212> PRT
<213> 烟曲霉
<400> 16
Met Ser Ile Gly Ala Glu Ile Asp Ser Leu Val Pro Ala Pro Pro Gly
1 5 10 15
Leu Asn Gly Thr Ala Ala Gly Tyr Pro Ala Lys Thr Gln Lys Glu Leu
20 25 30
Ser Asn Gly Asp Phe Asp Ala His Asp Gly Leu Ser Leu Ala Gln Leu
35 40 45
Thr Pro Tyr Asp Val Leu Thr Ala Ala Leu Pro Leu Pro Ala Pro Ala
50 55 60
Ser Ser Thr Gly Phe Trp Trp Arg Glu Thr Gly Pro Val Met Ser Lys
65 70 75 80
Leu Leu Ala Lys Ala Asn Tyr Pro Leu Tyr Thr His Tyr Lys Tyr Leu
85 90 95
Met Leu Tyr His Thr His Ile Leu Pro Leu Leu Gly Pro Arg Pro Pro
100 105 110
Leu Glu Asn Ser Thr His Pro Ser Pro Ser Asn Ala Pro Trp Arg Ser
115 120 125
Phe Leu Thr Asp Asp Phe Thr Pro Leu Glu Pro Ser Trp Asn Val Asn
130 135 140
Gly Asn Ser Glu Ala Gln Ser Thr Ile Arg Leu Gly Ile Glu Pro Ile
145 150 155 160
Gly Phe Glu Ala Gly Ala Ala Ala Asp Pro Phe Asn Gln Ala Ala Val
165 170 175
Thr Gln Phe Met His Ser Tyr Glu Ala Thr Glu Val Gly Ala Thr Leu
180 185 190
Thr Leu Phe Glu His Phe Arg Asn Asp Met Phe Val Gly Pro Glu Thr
195 200 205
Tyr Ala Ala Leu Arg Ala Lys Ile Pro Glu Gly Glu His Thr Thr Gln
210 215 220
Ser Phe Leu Ala Phe Asp Leu Asp Ala Gly Arg Val Thr Thr Lys Ala
225 230 235 240
Tyr Phe Phe Pro Ile Leu Met Ser Leu Lys Thr Gly Gln Ser Thr Thr
245 250 255
Lys Val Val Ser Asp Ser Ile Leu His Leu Ala Leu Lys Ser Glu Val
260 265 270
Trp Gly Val Gln Thr Ile Ala Ala Met Ser Val Met Glu Ala Trp Ile
275 280 285
Gly Ser Tyr Gly Gly Ala Ala Lys Thr Glu Met Ile Ser Val Asp Cys
290 295 300
Val Asn Glu Ala Asp Ser Arg Ile Lys Ile Tyr Val Arg Met Pro His
305 310 315 320
Thr Ser Leu Arg Lys Val Lys Glu Ala Tyr Cys Leu Gly Gly Arg Leu
325 330 335
Thr Asp Glu Asn Thr Lys Glu Gly Leu Lys Leu Leu Asp Glu Leu Trp
340 345 350
Arg Thr Val Phe Gly Ile Asp Asp Glu Asp Ala Glu Leu Pro Gln Asn
355 360 365
Ser His Arg Thr Ala Gly Thr Ile Phe Asn Phe Glu Leu Arg Pro Gly
370 375 380
Lys Trp Phe Pro Glu Pro Lys Val Tyr Leu Pro Val Arg His Tyr Cys
385 390 395 400
Glu Ser Asp Met Gln Ile Ala Ser Arg Leu Gln Thr Phe Phe Gly Arg
405 410 415
Leu Gly Trp His Asn Met Glu Lys Asp Tyr Cys Lys His Leu Glu Asp
420 425 430
Leu Phe Pro His His Pro Leu Ser Ser Ser Thr Gly Thr His Thr Phe
435 440 445
Leu Ser Phe Ser Tyr Lys Lys Gln Lys Gly Val Tyr Met Thr Met Tyr
450 455 460
Tyr Asn Leu Arg Val Tyr Ser Thr
465 470
<210> 17
<211> 1158
<212> DNA
<213> 链霉菌属物种RM-5-8
<400> 17
atgggaggtc cgatgagcgg tttccattcg ggggaggcgc tgctcggtga cctcgccacc 60
ggtcagctga ccaggctgtg cgaggtggcg gggctgaccg aggccgacac ggcggcctac 120
acgggggtgc tgatcgaaag tctggggacg tcggccggac ggccgttgtc cctgccaccc 180
ccgtcgcgga cctttctctc cgacgaccac acccccgtgg agttctccct ggccttcctg 240
ccgggacgcg caccgcacct gcgggtcctg gtggaaccgg gctgctccag cggcgacgac 300
ctggcggaaa acggccgggc cggtctgcgg gcggtccaca ccatggcgga ccgctgggga 360
ttctccaccg agcaactcga ccggctggag gacctgttct tcccctcctc ccccgagggc 420
ccgctggccc tgtggtgcgc cctggagctc cgctccggtg gggtgccggg ggtgaaggtc 480
tacctcaacc ccgcggcgaa tggcgccgac cgggccgccg agacggtacg cgaggcgctg 540
gccaggctgg gccacctgca ggcgttcgac gcgctgcccc gggcggacgg cttcccgttc 600
ctcgccctgg acctcggcga ctgggacgcc ccgcgggtga agatctacct caaacacctc 660
ggcatgtccg ccgccgacgc gggctccctc ccccggatgt cgcccgcacc gagccgggag 720
cagctggagg agttcttccg caccgccggt gacctcccgg ccccgggaga cccggggccc 780
accgaggaca ccggccggct cgccgggcgc cccgccctca cctgccactc cttcacggag 840
acggcgaccg ggcggcccag cggctacacc ctccacgtgc cggtccgcga ctacgtccgg 900
cacgacggcg aggcacggga ccgggcggtg gccgtgctgc gcgaacatga catggacagt 960
gcggcactgg accgggcgct ggccgccgtg agcccccgcc cgctgagtga cggggtgggc 1020
ctgatcgcct atctggcact ggtccaccag cgcggccggc cgacacgggt gaccgtctac 1080
gtctcctccg aggcgtacga ggtgcggccg ccccgcgaga cggtccccac ccgcgaccgg 1140
gcgcgggcac ggctgtga 1158
<210> 18
<211> 385
<212> PRT
<213> 链霉菌属物种RM-5-8
<400> 18
Met Gly Gly Pro Met Ser Gly Phe His Ser Gly Glu Ala Leu Leu Gly
1 5 10 15
Asp Leu Ala Thr Gly Gln Leu Thr Arg Leu Cys Glu Val Ala Gly Leu
20 25 30
Thr Glu Ala Asp Thr Ala Ala Tyr Thr Gly Val Leu Ile Glu Ser Leu
35 40 45
Gly Thr Ser Ala Gly Arg Pro Leu Ser Leu Pro Pro Pro Ser Arg Thr
50 55 60
Phe Leu Ser Asp Asp His Thr Pro Val Glu Phe Ser Leu Ala Phe Leu
65 70 75 80
Pro Gly Arg Ala Pro His Leu Arg Val Leu Val Glu Pro Gly Cys Ser
85 90 95
Ser Gly Asp Asp Leu Ala Glu Asn Gly Arg Ala Gly Leu Arg Ala Val
100 105 110
His Thr Met Ala Asp Arg Trp Gly Phe Ser Thr Glu Gln Leu Asp Arg
115 120 125
Leu Glu Asp Leu Phe Phe Pro Ser Ser Pro Glu Gly Pro Leu Ala Leu
130 135 140
Trp Cys Ala Leu Glu Leu Arg Ser Gly Gly Val Pro Gly Val Lys Val
145 150 155 160
Tyr Leu Asn Pro Ala Ala Asn Gly Ala Asp Arg Ala Ala Glu Thr Val
165 170 175
Arg Glu Ala Leu Ala Arg Leu Gly His Leu Gln Ala Phe Asp Ala Leu
180 185 190
Pro Arg Ala Asp Gly Phe Pro Phe Leu Ala Leu Asp Leu Gly Asp Trp
195 200 205
Asp Ala Pro Arg Val Lys Ile Tyr Leu Lys His Leu Gly Met Ser Ala
210 215 220
Ala Asp Ala Gly Ser Leu Pro Arg Met Ser Pro Ala Pro Ser Arg Glu
225 230 235 240
Gln Leu Glu Glu Phe Phe Arg Thr Ala Gly Asp Leu Pro Ala Pro Gly
245 250 255
Asp Pro Gly Pro Thr Glu Asp Thr Gly Arg Leu Ala Gly Arg Pro Ala
260 265 270
Leu Thr Cys His Ser Phe Thr Glu Thr Ala Thr Gly Arg Pro Ser Gly
275 280 285
Tyr Thr Leu His Val Pro Val Arg Asp Tyr Val Arg His Asp Gly Glu
290 295 300
Ala Arg Asp Arg Ala Val Ala Val Leu Arg Glu His Asp Met Asp Ser
305 310 315 320
Ala Ala Leu Asp Arg Ala Leu Ala Ala Val Ser Pro Arg Pro Leu Ser
325 330 335
Asp Gly Val Gly Leu Ile Ala Tyr Leu Ala Leu Val His Gln Arg Gly
340 345 350
Arg Pro Thr Arg Val Thr Val Tyr Val Ser Ser Glu Ala Tyr Glu Val
355 360 365
Arg Pro Pro Arg Glu Thr Val Pro Thr Arg Asp Arg Ala Arg Ala Arg
370 375 380
Leu
385
<210> 19
<211> 1128
<212> DNA
<213> 天蓝色链霉菌
<400> 19
atgagggccg cgtcgacggg cgcggacccg caggacgcat ccacgctcgg ctctttcacc 60
ggcggccagt tgcgaagact cggctcggtc gccggtctgt cccgcgccga cgtcgagacc 120
tacgcacagg tcctgaccga cgcattgggc ccggtggccc agcggccgct gagcctggcg 180
ccgcccaccc gcaccttcct gtcggacgac cacacccccg tggagttctc cctctccttc 240
cggcccgggg cggcgcccgc catgcgggtc ctcgtggaac cgggctgcgg tgcgaccagc 300
ctggccgaca acggccgtgc cggtcttgag gcggtccgca cgatggcgcg gcgctggcac 360
ttcaccaccg acgccctcga cgaactcctg gacctgttcc tgccgcccgc tccgcagggc 420
cccctcgccc tgtggtgcgc cctggaactc aggcccgggg gtgtaccggg cgtcaaggtc 480
tatctgaacc ctgcggtggg cggggaggaa cgttccgccg cgacggtgcg cgaggccctg 540
cgccggctcg ggcaccacca ggccttcgac agcctccccc agggcagtgg atacccgttc 600
ctcgccctgg acctcgggaa ctggacggag ccccgggcga aggtctacct gcgccacgac 660
aacctcacgg ccggtcgggc cgcacggctg tcccggacgg actcgggcct cgtgccgacc 720
gcggtcgagg gtttcttccg caccgccgcg ggtcccggct ccgacgcggg tgggctcgac 780
gggcggcctg ctcagtcctg ccactccttc accgaccccg gcgcggagcg gccgagcggc 840
ttcaccctgt acatcccggt tcgtgactac gtccggcatg acggggaggc cctggcgcgg 900
gcgtccaccg tgctgcacca ccacggcatg gacgcctccg tgctccaccg cgccctggcc 960
gccctcaccg agcggcggcc cgaggacggg gtgggcctga tcgcctacct ggccctcgcc 1020
ggccaacggg accagccgcc gcgggtgacg gcctacctct cctcggaggc ctacacggtc 1080
cggccgccgg tcgtggagac cgtccgccaa ccgctgtcgg tcggctga 1128
<210> 20
<211> 375
<212> PRT
<213> 天蓝色链霉菌
<400> 20
Met Arg Ala Ala Ser Thr Gly Ala Asp Pro Gln Asp Ala Ser Thr Leu
1 5 10 15
Gly Ser Phe Thr Gly Gly Gln Leu Arg Arg Leu Gly Ser Val Ala Gly
20 25 30
Leu Ser Arg Ala Asp Val Glu Thr Tyr Ala Gln Val Leu Thr Asp Ala
35 40 45
Leu Gly Pro Val Ala Gln Arg Pro Leu Ser Leu Ala Pro Pro Thr Arg
50 55 60
Thr Phe Leu Ser Asp Asp His Thr Pro Val Glu Phe Ser Leu Ser Phe
65 70 75 80
Arg Pro Gly Ala Ala Pro Ala Met Arg Val Leu Val Glu Pro Gly Cys
85 90 95
Gly Ala Thr Ser Leu Ala Asp Asn Gly Arg Ala Gly Leu Glu Ala Val
100 105 110
Arg Thr Met Ala Arg Arg Trp His Phe Thr Thr Asp Ala Leu Asp Glu
115 120 125
Leu Leu Asp Leu Phe Leu Pro Pro Ala Pro Gln Gly Pro Leu Ala Leu
130 135 140
Trp Cys Ala Leu Glu Leu Arg Pro Gly Gly Val Pro Gly Val Lys Val
145 150 155 160
Tyr Leu Asn Pro Ala Val Gly Gly Glu Glu Arg Ser Ala Ala Thr Val
165 170 175
Arg Glu Ala Leu Arg Arg Leu Gly His His Gln Ala Phe Asp Ser Leu
180 185 190
Pro Gln Gly Ser Gly Tyr Pro Phe Leu Ala Leu Asp Leu Gly Asn Trp
195 200 205
Thr Glu Pro Arg Ala Lys Val Tyr Leu Arg His Asp Asn Leu Thr Ala
210 215 220
Gly Arg Ala Ala Arg Leu Ser Arg Thr Asp Ser Gly Leu Val Pro Thr
225 230 235 240
Ala Val Glu Gly Phe Phe Arg Thr Ala Ala Gly Pro Gly Ser Asp Ala
245 250 255
Gly Gly Leu Asp Gly Arg Pro Ala Gln Ser Cys His Ser Phe Thr Asp
260 265 270
Pro Gly Ala Glu Arg Pro Ser Gly Phe Thr Leu Tyr Ile Pro Val Arg
275 280 285
Asp Tyr Val Arg His Asp Gly Glu Ala Leu Ala Arg Ala Ser Thr Val
290 295 300
Leu His His His Gly Met Asp Ala Ser Val Leu His Arg Ala Leu Ala
305 310 315 320
Ala Leu Thr Glu Arg Arg Pro Glu Asp Gly Val Gly Leu Ile Ala Tyr
325 330 335
Leu Ala Leu Ala Gly Gln Arg Asp Gln Pro Pro Arg Val Thr Ala Tyr
340 345 350
Leu Ser Ser Glu Ala Tyr Thr Val Arg Pro Pro Val Val Glu Thr Val
355 360 365
Arg Gln Pro Leu Ser Val Gly
370 375
<210> 21
<211> 1380
<212> DNA
<213> 烟曲霉
<400> 21
atgaaggcag ccaatgcctc cagtgcggag gcctatcgag ttcttagtcg cgcctttaga 60
ttcgataatg aagatcagaa gctgtggtgg cacagcactg ccccgatgtt tgcaaaaatg 120
ctggaaactg ccaactacac cacaccttgt cagtatcaat acctcatcac ctataaggag 180
tgcgtaattc ccagtctcgg atgctatccg accaacagcg ccccccgctg gttgagcatc 240
ctcactcgat acggcactcc gttcgaattg agcctaaatt gctctaattc aatagtgaga 300
tacacattcg agccgatcaa tcaacatacc ggaacagata aagacccatt caatacgcac 360
gccatctggg agagcctgca gcacctgctt ccactggaga agagcattga tctggagtgg 420
ttccgccact tcaagcacga tctcaccctc aacagtgaag aatctgcttt tctggctcat 480
aatgatcgcc tcgtgggcgg cactatcagg acgcagaaca agctcgcgct cgatctgaag 540
gatggccgct ttgcacttaa gacgtacata tacccggctc tcaaagctgt cgtcaccggc 600
aagacaattc atgagttggt ctttggctca gtccgccggc tggcagtgag ggagccccga 660
atcttgcccc cactcaacat gctggaggaa tacatccgat cacgcggttc caagagcact 720
gccagtcccc gcctagtgtc ctgtgatctg accagtcctg ccaagtcgag aatcaagatc 780
tacctgctgg agcagatggt ttcactagaa gccatggagg acctgtggac tctgggcgga 840
cggcgccgag acgcttccac tttagagggg ctctctctgg tgcgtgagct ttgggatctg 900
atccaactgt cgccgggatt gaagtcctat ccggcgccgt atctgcctct cggggttatc 960
ccagacgaga ggctgccgct tatggccaat ttcaccctgc accagaatga cccggtccca 1020
gagccgcaag tatatttcac aaccttcggc atgaacgaca tggcggtggc ggatgccctg 1080
acgacgttct tcgagcgccg gggttggagt gaaatggccc gcacctacga aactactttg 1140
aagtcgtact acccccatgc ggatcatgac aaacttaact acctccacgc ctacatatcc 1200
ttctcctaca gggaccgtac cccttatctg agtgtctatc ttcaatcctt cgagacaggg 1260
gactgggcag ttgcaaactt atccgaatca aaggtcaagt gtcaggatgc ggcctgtcaa 1320
cccacagctt tacctccaga tctgtcaaag acaggggtat attattccgg tctccactga 1380
<210> 22
<211> 459
<212> PRT
<213> 烟曲霉
<400> 22
Met Lys Ala Ala Asn Ala Ser Ser Ala Glu Ala Tyr Arg Val Leu Ser
1 5 10 15
Arg Ala Phe Arg Phe Asp Asn Glu Asp Gln Lys Leu Trp Trp His Ser
20 25 30
Thr Ala Pro Met Phe Ala Lys Met Leu Glu Thr Ala Asn Tyr Thr Thr
35 40 45
Pro Cys Gln Tyr Gln Tyr Leu Ile Thr Tyr Lys Glu Cys Val Ile Pro
50 55 60
Ser Leu Gly Cys Tyr Pro Thr Asn Ser Ala Pro Arg Trp Leu Ser Ile
65 70 75 80
Leu Thr Arg Tyr Gly Thr Pro Phe Glu Leu Ser Leu Asn Cys Ser Asn
85 90 95
Ser Ile Val Arg Tyr Thr Phe Glu Pro Ile Asn Gln His Thr Gly Thr
100 105 110
Asp Lys Asp Pro Phe Asn Thr His Ala Ile Trp Glu Ser Leu Gln His
115 120 125
Leu Leu Pro Leu Glu Lys Ser Ile Asp Leu Glu Trp Phe Arg His Phe
130 135 140
Lys His Asp Leu Thr Leu Asn Ser Glu Glu Ser Ala Phe Leu Ala His
145 150 155 160
Asn Asp Arg Leu Val Gly Gly Thr Ile Arg Thr Gln Asn Lys Leu Ala
165 170 175
Leu Asp Leu Lys Asp Gly Arg Phe Ala Leu Lys Thr Tyr Ile Tyr Pro
180 185 190
Ala Leu Lys Ala Val Val Thr Gly Lys Thr Ile His Glu Leu Val Phe
195 200 205
Gly Ser Val Arg Arg Leu Ala Val Arg Glu Pro Arg Ile Leu Pro Pro
210 215 220
Leu Asn Met Leu Glu Glu Tyr Ile Arg Ser Arg Gly Ser Lys Ser Thr
225 230 235 240
Ala Ser Pro Arg Leu Val Ser Cys Asp Leu Thr Ser Pro Ala Lys Ser
245 250 255
Arg Ile Lys Ile Tyr Leu Leu Glu Gln Met Val Ser Leu Glu Ala Met
260 265 270
Glu Asp Leu Trp Thr Leu Gly Gly Arg Arg Arg Asp Ala Ser Thr Leu
275 280 285
Glu Gly Leu Ser Leu Val Arg Glu Leu Trp Asp Leu Ile Gln Leu Ser
290 295 300
Pro Gly Leu Lys Ser Tyr Pro Ala Pro Tyr Leu Pro Leu Gly Val Ile
305 310 315 320
Pro Asp Glu Arg Leu Pro Leu Met Ala Asn Phe Thr Leu His Gln Asn
325 330 335
Asp Pro Val Pro Glu Pro Gln Val Tyr Phe Thr Thr Phe Gly Met Asn
340 345 350
Asp Met Ala Val Ala Asp Ala Leu Thr Thr Phe Phe Glu Arg Arg Gly
355 360 365
Trp Ser Glu Met Ala Arg Thr Tyr Glu Thr Thr Leu Lys Ser Tyr Tyr
370 375 380
Pro His Ala Asp His Asp Lys Leu Asn Tyr Leu His Ala Tyr Ile Ser
385 390 395 400
Phe Ser Tyr Arg Asp Arg Thr Pro Tyr Leu Ser Val Tyr Leu Gln Ser
405 410 415
Phe Glu Thr Gly Asp Trp Ala Val Ala Asn Leu Ser Glu Ser Lys Val
420 425 430
Lys Cys Gln Asp Ala Ala Cys Gln Pro Thr Ala Leu Pro Pro Asp Leu
435 440 445
Ser Lys Thr Gly Val Tyr Tyr Ser Gly Leu His
450 455
<210> 23
<211> 2155
<212> DNA
<213> 古巴裸盖菇
<400> 23
atgatcgctg tactattctc cttcgtcatt gcaggatgca tatactacat cgtttctcgt 60
agagtgaggc ggtcgcgctt gccaccaggg ccgcctggca ttcctattcc cttcattggg 120
aacatgtttg atatgcctga agaatctcca tggttaacat ttctacaatg gggacgggat 180
tacagtctgt cttgccgcgt tgacttctaa tatatgaaca gctaatatat tgtcagacac 240
cgatattctc tacgtggatg ctggagggac agaaatggtt attcttaaca cgttggagac 300
cattaccgat ctattagaaa agcgagggtc catttattct ggccggtgag ctgatgttga 360
gttttttgca attgaatttg tggtcacacg tttccagact tgagagtaca atggtcaacg 420
aacttatggg gtgggagttt gacttagggt tcatcacata cggcgacagg tggcgcgaag 480
aaaggcgcat gttcgccaag gagttcagtg agaagggcat caagcaattt cgccatgctc 540
aagtgaaagc tgcccatcag cttgtccaac agcttaccaa aacgccagac cgctgggcac 600
aacatattcg ccagtaagta ctacttgagg aaaatagcgt acgcttcgct gaccggtccg 660
tacatcaaag tcagatagcg gcaatgtcac tggatattgg ttatggaatt gatcttgcag 720
aagacgaccc ttggctggaa gcgacccatt tggctaatga aggcctcgcc atagcatcag 780
tgccgggcaa attttgggtc gattcgttcc cttctcgtga gcatccttct tctatgtagg 840
aagggaagga gtctaacaag tgttagtaaa ataccttcct gcttggttcc caggtgctgt 900
cttcaagcgc aaagcgaagg tctggcgaga agccgccgac catatggttg acatgcctta 960
tgaaactatg aggaaattag cagttagtca aatgcgttct ccccgtattt tttcaatact 1020
ctaacttcag ctcacagcct caaggattga ctcgtccgtc gtatgcttca gctcgtctgc 1080
aagccatgga tctcaacggt gaccttgagc atcaagaaca cgtaatcaag aacacagccg 1140
cagaggttaa tgtcggtaag tcaaaagcgt ccgtcggcaa ttcaaaattc aggcgctaaa 1200
gtgggtcttc tcaccaaggt ggaggcgata ctgtaaggat ttctcaatcg ttagagtata 1260
agtgttctaa tgcagtacat actccaccaa ccagactgtc tctgctatgt ctgcgttcat 1320
cttggccatg gtgaagtacc ctgaggtcca gcgaaaggtt caagcggagc ttgatgctct 1380
gaccaataac ggccaaattc ctgactatga cgaagaagat gactccttgc catacctcac 1440
cgcatgtatc aaggagcttt tccggtggaa tcaaatcgca cccctcgcta taccgcacaa 1500
attaatgaag gacgacgtgt accgcgggta tctgattccc aagaacactc tagtcttcgc 1560
aaacacctgg tgaggctgtc cattcattcc tagtacatcc gttgccccac taatagcatc 1620
ttgataacag ggcagtatta aacgatccag aagtctatcc agatccctct gtgttccgcc 1680
cagaaagata tcttggtcct gacgggaagc ctgataacac tgtacgcgac ccacgtaaag 1740
cggcatttgg ctatggacga cgaaattggt aagtgcgctt tcagaacccc cccttccgtt 1800
gactagtgcc atgcgcgcat acaatatcgc tattgatctg atataacttc cctgcggcat 1860
ttattttggc attcctttag tcccggaatt catctagcgc agtcgacggt ttggattgca 1920
ggggcaaccc tcttatcagc gttcaatatc gagcgacctg tcgatcagaa tgggaagccc 1980
attgacatac cggctgattt tactacagga ttcttcaggt agctaatttc cgtctttgtg 2040
tgcataatac ccctaacgac gcacgtttac ctttttgtaa agacacccag tgcctttcca 2100
gtgcaggttt gttcctcgaa cagagcaagt ctcacagtcg gtatccggac cctga 2155
<210> 24
<211> 508
<212> PRT
<213> 古巴裸盖菇
<400> 24
Met Ile Ala Val Leu Phe Ser Phe Val Ile Ala Gly Cys Ile Tyr Tyr
1 5 10 15
Ile Val Ser Arg Arg Val Arg Arg Ser Arg Leu Pro Pro Gly Pro Pro
20 25 30
Gly Ile Pro Ile Pro Phe Ile Gly Asn Met Phe Asp Met Pro Glu Glu
35 40 45
Ser Pro Trp Leu Thr Phe Leu Gln Trp Gly Arg Asp Tyr Asn Thr Asp
50 55 60
Ile Leu Tyr Val Asp Ala Gly Gly Thr Glu Met Val Ile Leu Asn Thr
65 70 75 80
Leu Glu Thr Ile Thr Asp Leu Leu Glu Lys Arg Gly Ser Ile Tyr Ser
85 90 95
Gly Arg Leu Glu Ser Thr Met Val Asn Glu Leu Met Gly Trp Glu Phe
100 105 110
Asp Leu Gly Phe Ile Thr Tyr Gly Asp Arg Trp Arg Glu Glu Arg Arg
115 120 125
Met Phe Ala Lys Glu Phe Ser Glu Lys Gly Ile Lys Gln Phe Arg His
130 135 140
Ala Gln Val Lys Ala Ala His Gln Leu Val Gln Gln Leu Thr Lys Thr
145 150 155 160
Pro Asp Arg Trp Ala Gln His Ile Arg His Gln Ile Ala Ala Met Ser
165 170 175
Leu Asp Ile Gly Tyr Gly Ile Asp Leu Ala Glu Asp Asp Pro Trp Leu
180 185 190
Glu Ala Thr His Leu Ala Asn Glu Gly Leu Ala Ile Ala Ser Val Pro
195 200 205
Gly Lys Phe Trp Val Asp Ser Phe Pro Ser Leu Lys Tyr Leu Pro Ala
210 215 220
Trp Phe Pro Gly Ala Val Phe Lys Arg Lys Ala Lys Val Trp Arg Glu
225 230 235 240
Ala Ala Asp His Met Val Asp Met Pro Tyr Glu Thr Met Arg Lys Leu
245 250 255
Ala Pro Gln Gly Leu Thr Arg Pro Ser Tyr Ala Ser Ala Arg Leu Gln
260 265 270
Ala Met Asp Leu Asn Gly Asp Leu Glu His Gln Glu His Val Ile Lys
275 280 285
Asn Thr Ala Ala Glu Val Asn Val Gly Gly Gly Asp Thr Thr Val Ser
290 295 300
Ala Met Ser Ala Phe Ile Leu Ala Met Val Lys Tyr Pro Glu Val Gln
305 310 315 320
Arg Lys Val Gln Ala Glu Leu Asp Ala Leu Thr Asn Asn Gly Gln Ile
325 330 335
Pro Asp Tyr Asp Glu Glu Asp Asp Ser Leu Pro Tyr Leu Thr Ala Cys
340 345 350
Ile Lys Glu Leu Phe Arg Trp Asn Gln Ile Ala Pro Leu Ala Ile Pro
355 360 365
His Lys Leu Met Lys Asp Asp Val Tyr Arg Gly Tyr Leu Ile Pro Lys
370 375 380
Asn Thr Leu Val Phe Ala Asn Thr Trp Ala Val Leu Asn Asp Pro Glu
385 390 395 400
Val Tyr Pro Asp Pro Ser Val Phe Arg Pro Glu Arg Tyr Leu Gly Pro
405 410 415
Asp Gly Lys Pro Asp Asn Thr Val Arg Asp Pro Arg Lys Ala Ala Phe
420 425 430
Gly Tyr Gly Arg Arg Asn Cys Pro Gly Ile His Leu Ala Gln Ser Thr
435 440 445
Val Trp Ile Ala Gly Ala Thr Leu Leu Ser Ala Phe Asn Ile Glu Arg
450 455 460
Pro Val Asp Gln Asn Gly Lys Pro Ile Asp Ile Pro Ala Asp Phe Thr
465 470 475 480
Thr Gly Phe Phe Arg His Pro Val Pro Phe Gln Cys Arg Phe Val Pro
485 490 495
Arg Thr Glu Gln Val Ser Gln Ser Val Ser Gly Pro
500 505
<210> 25
<211> 2187
<212> DNA
<213> 古巴裸盖菇
<400> 25
atggcttcta gttcttccga tgtcttcgtt ttgggtctag gtgttgtttt ggctgccttg 60
tatatcttca gagaccaatt attcgctgct tctaagccaa aggtggctcc agtttccact 120
acgaagcctg ccaacggttc cgctaaccca agagacttca tcgccaagat gaaacaaggt 180
aagaagagaa tcgtaatctt ctacggttct caaactggta ccgctgaaga atatgctatt 240
cgtttggcta aggaagctaa gcaaaagttc ggtctagcct ccttggtttg tgatccagaa 300
gaatacgatt ttgaaaagtt ggaccaattg ccagaagatt ctattgcttt cttcgtcgtt 360
gctacctatg gtgaaggtga acctacagac aacgctgtcc aattgttgca aaacttgcaa 420
gatgaaagct tcgaattctc ctctggtgag agaaagttgt caggtttgaa gtacgttgtt 480
tttggtctgg gtaacaagac ctacgaacat tacaacctca ttgggagaac tgttgacgct 540
caattggcca agatgggtgc tatcagaatc ggtgaaagag gtgaaggtga tgatgacaag 600
tccatggaag aagactactt ggaatggaag gatggtatgt gggaagcgtt tgccactgct 660
atgggtgttg aagaaggtca aggtggtgac tccgctgatt tcgtcgtttc cgaattggaa 720
tctcacccac cagaaaaggt ttaccaaggt gaattttctg ctagagcttt aaccaaaacc 780
aagggtattc acgacgctaa gaatcctttt gctgctccaa ttgcggttgc tagagaattg 840
ttccaatctg ttgtcgatag aaactgtgtc cacgtcgaat tcaacattga aggctctggt 900
atcacctatc aacacggtga ccacgttggt ttgtggccat tgaatccaga tgttgaagtc 960
gaacggttgt tgtgtgtttt aggtttagct gaaaagagag atgctgtcat ctccattgaa 1020
tccttagacc cggctttggc taaggttcca ttcccagtcc caactactta cggtgctgtg 1080
ttgagacact acattgacat ctctgctgtc gccggtagac aaatcttggg tactttgtcc 1140
aaattcgctc caaccccaga agctgaagct ttcttgagaa acttgaacac taacaaggaa 1200
gaataccaca acgtcgtcgc taacggttgt ttgaaattgg gtgaaatttt gcaaatcgct 1260
accggtaacg acattactgt cccaccaact actgccaaca ccaccaaatg gccaattcca 1320
ttcgacatca ttgtttctgc catcccaaga ttgcaaccaa gatactactc tatctcttct 1380
tccccaaaaa ttcatccaaa caccatccac gctaccgttg ttgtgctcaa atacgaaaac 1440
gttccaaccg aaccaatccc aagaaagtgg gtttacggtg tcggtagtaa cttcttgttg 1500
aatttaaagt acgctgttaa caaggaacca gttccataca tcactcaaaa tggcgaacaa 1560
agagtcggtg tcccggaata cttgattgct ggtccacgtg gttcttacaa gactgaatct 1620
ttctacaagg ctccaatcca tgttagacgt tctactttcc gtttgccaac caacccaaag 1680
tctccagtca tcatgattgg tccaggtact ggtgtcgccc cattcagagg cttcgttcaa 1740
gaaagagttg ccttggccag aagatccatc gaaaagaacg gtcctgactc tttggctgac 1800
tggggtcgta tttccttgtt ctacggttgt agaagatccg acgaagactt cttgtacaag 1860
gacgaatggc cacaatacga agctgagttg aagggtaagt tcaagttgca ctgtgctttc 1920
tccagacaaa actacaagcc agacggttct aagatttacg tccaagattt gatctgggaa 1980
gacagagaac acattgccga tgccatctta aacggtaagg gttacgtcta catctgcggt 2040
gaagctaagt ccatgtctaa acaagttgaa gaagttctag ccaagatctt gggcgaagcc 2100
aaaggtggtt ccggtccagt tgaaggtgtt gctgaagtca agttactgaa ggaacggtcc 2160
agattgatgt tggatgtctg gtctagg 2187
<210> 26
<211> 728
<212> PRT
<213> 古巴裸盖菇
<400> 26
Met Ala Ser Ser Ser Ser Asp Val Phe Val Leu Gly Leu Gly Val Val
1 5 10 15
Leu Ala Ala Leu Tyr Ile Phe Arg Asp Gln Leu Phe Ala Ala Ser Lys
20 25 30
Pro Lys Val Ala Pro Val Ser Thr Thr Lys Pro Ala Asn Gly Ser Ala
35 40 45
Asn Pro Arg Asp Phe Ile Ala Lys Met Lys Gln Gly Lys Lys Arg Ile
50 55 60
Val Ile Phe Tyr Gly Ser Gln Thr Gly Thr Ala Glu Glu Tyr Ala Ile
65 70 75 80
Arg Leu Ala Lys Glu Ala Lys Gln Lys Phe Gly Leu Ala Ser Leu Val
85 90 95
Cys Asp Pro Glu Glu Tyr Asp Phe Glu Lys Leu Asp Gln Leu Pro Glu
100 105 110
Asp Ser Ile Ala Phe Phe Val Val Ala Thr Tyr Gly Glu Gly Glu Pro
115 120 125
Thr Asp Asn Ala Val Gln Leu Leu Gln Asn Leu Gln Asp Glu Ser Phe
130 135 140
Glu Phe Ser Ser Gly Glu Arg Lys Leu Ser Gly Leu Lys Tyr Val Val
145 150 155 160
Phe Gly Leu Gly Asn Lys Thr Tyr Glu His Tyr Asn Leu Ile Gly Arg
165 170 175
Thr Val Asp Ala Gln Leu Ala Lys Met Gly Ala Ile Arg Ile Gly Glu
180 185 190
Arg Gly Glu Gly Asp Asp Asp Lys Ser Met Glu Glu Asp Tyr Leu Glu
195 200 205
Trp Lys Asp Gly Met Trp Glu Ala Phe Ala Thr Ala Met Gly Val Glu
210 215 220
Glu Gly Gln Gly Gly Asp Ser Ala Asp Phe Val Val Ser Glu Leu Glu
225 230 235 240
Ser His Pro Pro Glu Lys Val Tyr Gln Gly Glu Phe Ser Ala Arg Ala
245 250 255
Leu Thr Lys Thr Lys Gly Ile His Asp Ala Lys Asn Pro Phe Ala Ala
260 265 270
Pro Ile Ala Val Ala Arg Glu Leu Phe Gln Ser Val Val Asp Arg Asn
275 280 285
Cys Val His Val Glu Phe Asn Ile Glu Gly Ser Gly Ile Thr Tyr Gln
290 295 300
His Gly Asp His Val Gly Leu Trp Pro Leu Asn Pro Asp Val Glu Val
305 310 315 320
Glu Arg Leu Leu Cys Val Leu Gly Leu Ala Glu Lys Arg Asp Ala Val
325 330 335
Ile Ser Ile Glu Ser Leu Asp Pro Ala Leu Ala Lys Val Pro Phe Pro
340 345 350
Val Pro Thr Thr Tyr Gly Ala Val Leu Arg His Tyr Ile Asp Ile Ser
355 360 365
Ala Val Ala Gly Arg Gln Ile Leu Gly Thr Leu Ser Lys Phe Ala Pro
370 375 380
Thr Pro Glu Ala Glu Ala Phe Leu Arg Asn Leu Asn Thr Asn Lys Glu
385 390 395 400
Glu Tyr His Asn Val Val Ala Asn Gly Cys Leu Lys Leu Gly Glu Ile
405 410 415
Leu Gln Ile Ala Thr Gly Asn Asp Ile Thr Val Pro Pro Thr Thr Ala
420 425 430
Asn Thr Thr Lys Trp Pro Ile Pro Phe Asp Ile Ile Val Ser Ala Ile
435 440 445
Pro Arg Leu Gln Pro Arg Tyr Tyr Ser Ile Ser Ser Ser Pro Lys Ile
450 455 460
His Pro Asn Thr Ile His Ala Thr Val Val Val Leu Lys Tyr Glu Asn
465 470 475 480
Val Pro Thr Glu Pro Ile Pro Arg Lys Trp Val Tyr Gly Val Gly Ser
485 490 495
Asn Phe Leu Leu Asn Leu Lys Tyr Ala Val Asn Lys Glu Pro Val Pro
500 505 510
Tyr Ile Thr Gln Asn Gly Glu Gln Arg Val Gly Val Pro Glu Tyr Leu
515 520 525
Ile Ala Gly Pro Arg Gly Ser Tyr Lys Thr Glu Ser Phe Tyr Lys Ala
530 535 540
Pro Ile His Val Arg Arg Ser Thr Phe Arg Leu Pro Thr Asn Pro Lys
545 550 555 560
Ser Pro Val Ile Met Ile Gly Pro Gly Thr Gly Val Ala Pro Phe Arg
565 570 575
Gly Phe Val Gln Glu Arg Val Ala Leu Ala Arg Arg Ser Ile Glu Lys
580 585 590
Asn Gly Pro Asp Ser Leu Ala Asp Trp Gly Arg Ile Ser Leu Phe Tyr
595 600 605
Gly Cys Arg Arg Ser Asp Glu Asp Phe Leu Tyr Lys Asp Glu Trp Pro
610 615 620
Gln Tyr Glu Ala Glu Leu Lys Gly Lys Phe Lys Leu His Cys Ala Phe
625 630 635 640
Ser Arg Gln Asn Tyr Lys Pro Asp Gly Ser Lys Ile Tyr Val Gln Asp
645 650 655
Leu Ile Trp Glu Asp Arg Glu His Ile Ala Asp Ala Ile Leu Asn Gly
660 665 670
Lys Gly Tyr Val Tyr Ile Cys Gly Glu Ala Lys Ser Met Ser Lys Gln
675 680 685
Val Glu Glu Val Leu Ala Lys Ile Leu Gly Glu Ala Lys Gly Gly Ser
690 695 700
Gly Pro Val Glu Gly Val Ala Glu Val Lys Leu Leu Lys Glu Arg Ser
705 710 715 720
Arg Leu Met Leu Asp Val Trp Ser
725
<210> 27
<211> 6347
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 27
gtatccggct gttccttcat agccctttca atgaacgttg cagccctttg aagattggcc 60
attttgtcag gactcgagcc tgacagttgg accaacgcaa ctttaatttt ttgtgaaaga 120
atcttcgaag cactcatact ggcgatcttc acgccctcct gctattacaa aagctgtgtt 180
tttacaagaa tcaaattaag ttagcaagat attatacaac attattgata atttcaatat 240
cgtgttcgta cctgatgacg tatctgtgca ttgataaggc ccgcatggtt tcagaaagca 300
gagcggaacg attccaaatt agtggccttg tgctttgcat gtcaattgtg ttaccttcag 360
ctcgtggatt tgttttatca atacacagtc tacagtcaag aatttttttt atcaaatttt 420
gcgttcgagc gtataaaata gccgctgtag ctacttaagt tcctgttcag cgatagtttt 480
tttccatcac acgtactatg gcaattaagt cctcagcgag ctcgcatgga atgcgtgcga 540
tgagcgacct catgctatac ctgagaaagc aacctgacct acaggaaaga gttactcaag 600
aataagaatt ttcgttttaa aacctaagag tcactttaaa atttgtatac acttattttt 660
tttataactt atttaataat aaaaatcata aatcataaga aattcgctta tttagaagtg 720
tcaacaacgt atctaccaac ggaatgcgtg cgattcaggc gtagtctgga acgtcgtatg 780
ggtatggacc agagacggat tgagaaactt gttcggttct tgggacgaat ctacattgga 840
atggaactgg gtgcctgaag aaaccagtgg tgaaatcagc tgggatgtca attggcttac 900
cgttttggtc aactggtctt tcaatgttga aagcagacaa caaagtagca ccggcaatcc 960
aaacagtaga ttgagctagg tgaatacctg ggcagtttct tctaccgtaa ccgaaagcag 1020
cctttcttgg gtctctaaca gtgttgtctg gtttaccatc aggacccaag tatctttctg 1080
gacggaaaac ggatggatct ggatagactt ctgggtcatt caaaactgcc caggtgttag 1140
caaaaaccaa tgtgttcttt ggaatcaaat aacctctgta aacatcatcc ttcatcaatt 1200
tatgagggat ggctaatgga gcaatttggt tccatctgaa taattccttg atacaagcgg 1260
tcaaatatgg gagtgagtcg tcttcctcat cgtagtcagg gatttgaccg ttgttggtca 1320
aagcatccaa ttcagcttga acctttcttt gcacttctgg gtatttaacc atggccaata 1380
tgaaagcgga catagcagag acggtagtgt cgccaccacc aacgttaact tcagcagcag 1440
tgttcttgat aacatgttct tggtgttcta aatcaccgtt caagtccata gcttgtaatc 1500
tagcagaagc gtaagatggt ctggttagac cttgtggagc caactttctc atagtttcgt 1560
atggcatgtc aaccatgtgg tcagcggctt ctctccagac cttggcctta cgcttgaaga 1620
cggcacctgg gaaccaagct ggcaagtact tcaaagatgg gaaggagtca acccagaact 1680
tacctggaac actagcaatg gccaaacctt cgttggctaa gtgggtagct tctaaccatg 1740
ggtcatcttc ggctagatcg ataccgtaac caatgtccaa agacatagca gcgatttgat 1800
gtctgatgtg ttgagcccac cggtccggag tcttggtcaa ttgttgaacc aattggtgag 1860
cagccttgac ttgagcgtgt ctgaattgct tgataccctt ttcagagaat tccttagcaa 1920
acattcttct ttcttctctc caacggtcac cgtaagtgat aaaacccaga tcaaattccc 1980
aacccatcaa ttcattgacc atagtggatt ccaatctacc ggagtagatg gaaccacgtt 2040
tttccaagag atccgtgata gtttccaagg tgtttaaaat gaccatttcg gtaccaccag 2100
catctacgta caagatatca gtgttgtagt cacgacccca ttgcaagaaa gtcaaccatg 2160
gagattcttc tggcatgtcg aacatgttac caataaatgg gattggaatt cctggtggac 2220
caggtggcaa tctggatcta cgaactcttc tggagacgat gtagtaaata caaccagcaa 2280
tgacgaaaga gaacaagaca gcaatcattg ttttatattt gttgtaaaaa gtagataatt 2340
acttccttga tgatctgtaa aaaagagaaa aagaaagcat ctaagaactt gaaaaactac 2400
gaattagaaa agaccaaata tgtatttctt gcattgacca atttatgcaa gtttatatat 2460
atgtaaatgt aagtttcacg aggttctact aaactaaacc acccccttgg ttagaagaaa 2520
agagtgtgtg agaacaggct gttgttgtca cacgattcgg acaattctgt ttgaaagaga 2580
gagagtaaca gtacgatcga acgaactttg ctctggagat cacagtgggc atcatagcat 2640
gtggtactaa accctttccc gccattccag aaccttcgat tgcttgttac aaaacctgtg 2700
agccgtcgct aggaccttgt tgtgtgacga aattggaagc tgcaatcaat aggaagacag 2760
gaagtcgagc gtgtctgggt tttttcagtt ttgttctttt tgcaaacaac agtttattcc 2820
tggcatccac taaatataat ggagcccgct ttttaagctg gcatccagaa aaaaaaagaa 2880
tcccagcacc aaaatattgt tttcttcacc aaccatcagt tcataggtcc attctcttag 2940
cgcaactaca gagaacaggg gcacaaacag gcaaaaaacg ggcacaacct caatggagtg 3000
atgcaacctg cctggagtaa atgatgacac aaggcaattg acccacgcat gtatctatct 3060
cattttctta caccttctat taccttctgc tctctctgat ttggaaaaag ctgaaaaaaa 3120
aggttgaaac cagttccctg aaattattcc cctacttgac taataagtat ataaagacgg 3180
taggtattga ttgtaattct gtaaatctat ttcttaaact tcttaaattc tacttttata 3240
gttagtcttt tttttagttt taaaacacca agaacttagt ttcgaataaa cacacataaa 3300
caaacaaaat ggcttctagt tcttccgatg tcttcgtttt gggtctaggt gttgttttgg 3360
ctgccttgta tatcttcaga gaccaattat tcgctgcttc taagccaaag gtggctccag 3420
tttccactac gaagcctgcc aacggttccg ctaacccaag agacttcatc gccaagatga 3480
aacaaggtaa gaagagaatc gtaatcttct acggttctca aactggtacc gctgaagaat 3540
atgctattcg tttggctaag gaagctaagc aaaagttcgg tctagcctcc ttggtttgtg 3600
atccagaaga atacgatttt gaaaagttgg accaattgcc agaagattct attgctttct 3660
tcgtcgttgc tacctatggt gaaggtgaac ctacagacaa cgctgtccaa ttgttgcaaa 3720
acttgcaaga tgaaagcttc gaattctcct ctggtgagag aaagttgtca ggtttgaagt 3780
acgttgtttt tggtctgggt aacaagacct acgaacatta caacctcatt gggagaactg 3840
ttgacgctca attggccaag atgggtgcta tcagaatcgg tgaaagaggt gaaggtgatg 3900
atgacaagtc catggaagaa gactacttgg aatggaagga tggtatgtgg gaagcgtttg 3960
ccactgctat gggtgttgaa gaaggtcaag gtggtgactc cgctgatttc gtcgtttccg 4020
aattggaatc tcacccacca gaaaaggttt accaaggtga attttctgct agagctttaa 4080
ccaaaaccaa gggtattcac gacgctaaga atccttttgc tgctccaatt gcggttgcta 4140
gagaattgtt ccaatctgtt gtcgatagaa actgtgtcca cgtcgaattc aacattgaag 4200
gctctggtat cacctatcaa cacggtgacc acgttggttt gtggccattg aatccagatg 4260
ttgaagtcga acggttgttg tgtgttttag gtttagctga aaagagagat gctgtcatct 4320
ccattgaatc cttagacccg gctttggcta aggttccatt cccagtccca actacttacg 4380
gtgctgtgtt gagacactac attgacatct ctgctgtcgc cggtagacaa atcttgggta 4440
ctttgtccaa attcgctcca accccagaag ctgaagcttt cttgagaaac ttgaacacta 4500
acaaggaaga ataccacaac gtcgtcgcta acggttgttt gaaattgggt gaaattttgc 4560
aaatcgctac cggtaacgac attactgtcc caccaactac tgccaacacc accaaatggc 4620
caattccatt cgacatcatt gtttctgcca tcccaagatt gcaaccaaga tactactcta 4680
tctcttcttc cccaaaaatt catccaaaca ccatccacgc taccgttgtt gtgctcaaat 4740
acgaaaacgt tccaaccgaa ccaatcccaa gaaagtgggt ttacggtgtc ggtagtaact 4800
tcttgttgaa tttaaagtac gctgttaaca aggaaccagt tccatacatc actcaaaatg 4860
gcgaacaaag agtcggtgtc ccggaatact tgattgctgg tccacgtggt tcttacaaga 4920
ctgaatcttt ctacaaggct ccaatccatg ttagacgttc tactttccgt ttgccaacca 4980
acccaaagtc tccagtcatc atgattggtc caggtactgg tgtcgcccca ttcagaggct 5040
tcgttcaaga aagagttgcc ttggccagaa gatccatcga aaagaacggt cctgactctt 5100
tggctgactg gggtcgtatt tccttgttct acggttgtag aagatccgac gaagacttct 5160
tgtacaagga cgaatggcca caatacgaag ctgagttgaa gggtaagttc aagttgcact 5220
gtgctttctc cagacaaaac tacaagccag acggttctaa gatttacgtc caagatttga 5280
tctgggaaga cagagaacac attgccgatg ccatcttaaa cggtaagggt tacgtctaca 5340
tctgcggtga agctaagtcc atgtctaaac aagttgaaga agttctagcc aagatcttgg 5400
gcgaagccaa aggtggttcc ggtccagttg aaggtgttgc tgaagtcaag ttactgaagg 5460
aacggtccag attgatgttg gatgtctggt ctgaacaaaa gttaatttct gaagaagatt 5520
tggaatgaat cgcgtgcatt catccgctct aaccgaaaag gaaggagtta gacaacctga 5580
agtctaggtc cctatttatt tttttatagt tatgttagta ttaagaacgt tatttatatt 5640
tcaaattttt cttttttttc tgtacagacg cgtgtacgca tgtaacatta tactgaaaac 5700
cttgcttgag aaggttttgg gacgctcgaa gatcgcgtcc caattcgccc tatagtgagt 5760
cgtattacgc gcgctcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 5820
ttacccctgc aggactagtg ctgaggcatt aatagtttac tcaattcttg aagccaattt 5880
gtacaattcc ccattagagt caaataaaag gatgcctcac ggaggtatgt tacccgcgct 5940
atttcacatg gctcattgaa ttagaggtgg aatttggtgt accctcccct cctcatctga 6000
tgaagtagtg atccgacaat tcttaaaagt tgtagacatt acttttacca ccaactaagt 6060
tgtatttata ttgctaccct tatcctttta tatctaacta gcgctcataa ggttggggca 6120
atactaaaac tgtgttctta ttcaactcat taaatacgtg gcagtacgta ccctattaga 6180
aacaatagga aacagcagag tcggaagaag ccaaatgcca gatttgaagt ccaaaacctt 6240
gtcaagccaa tctttgggag cggctattcc tccagaaatt gtgtaccaaa tacttacata 6300
ccagtttagg gatttgttaa gaaatgacca tccaggtacg gcagaaa 6347
<210> 28
<211> 4792
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 28
caatctggcg gcttgagttc tcaacatgtt ttatttttta cttatattgc tggtagggta 60
aaaaaatata actcctagga ataggttgtc tatatgtttt tgtcttgctt ctataattgt 120
aacaaacaag gaaagggaaa atactgggtg taaaagccat tgagtcaagt taggtcatcc 180
cttttataca aaatttttca attttttttc caagattctt gtacgattaa ttattttttt 240
tttgcgtcct acagcgtgat gaaaatttcg cctgctgcaa gatgagcggg aacgggcgaa 300
atgtgcacgc gcacaactta cgaaacgcgg atgagtcact gacagccacc gcagaggttc 360
tgactcctac tgagctctat tggaggtggc agaaccggta ccggaggagg ccgctataac 420
cggtttgaat ttattgtcac agtgtcacat cagcattaag tcctcagcga gctcgcatgg 480
aatgcgtgcg atgagcgacc tcatgctata cctgagaaag caacctgacc tacaggaaag 540
agttactcaa gaataagaat tttcgtttta aaacctaaga gtcactttaa aatttgtata 600
cacttatttt ttttataact tatttaataa taaaaatcat aaatcataag aaattcgctt 660
atttagaagt gtcaacaacg tatctaccaa cggaatgcgt gcgattcagg tggagtccaa 720
acccaacaaa ggatttggaa ttggcttacc ggcagtggag gattccttta gcaacgtgga 780
agtgatttca ccgttgtcgt tgttacctct agcatcgtgg aaagcagcaa cacccttctt 840
aacaaagttg attctttctt cttcagaacc ccattgcatg aagtcagtcc acataacaat 900
gtgagcggcg ataccagcgg taaccttggc gtagttgatg gaatgcttgg aagtacgggc 960
gtaagattgc aagtaagctt gtctcatggt tgtaccaact tgttcgtctt ggaatctgct 1020
aatcaagtaa cagtcaccca agaagtaacc caaatccaat gaagctggac cgtacttaca 1080
caattcccag tctaagatgt agatcttttg caacttagat gggttacctt cttcaagttg 1140
caacaagatg ttcccagacc acaagtcagc catgaccaaa gtttcttcgg agtgcataac 1200
atcgtcaact agatccttga caacagttgg caacaatgga tcatcgacgc cgtatttagc 1260
ggcgtttggg ataatagttt ggtacaattg gtcagaggtg gttctaccga caatgttacc 1320
agagaagaac ttgaattctg ggtcgtctct tctttctcta cctatgttgt gcaatctggc 1380
gacgaaacca ccaatctcgg taccaaccaa tctagcaata tcggtagcca aaggtggctt 1440
agcagtaacg tagtctaata aggtcttcat tttaccgaca tcttgcataa tcaaagcatt 1500
gttttccaag tcatagttga gaccttctgg aacagagaca ataccatcaa caccacccaa 1560
aacttctctg ttagccatca tcaacttgat agcttggtat tcgtagacag aacgttcaac 1620
accgattttg aaatcttcat cagtagacat gtgtggttga gcgtgcttca aaatgataga 1680
agtgtgacct tggtatggag cgttcaattt aatacgccag gtgacgttaa cgaaaccacc 1740
ggataatctc ttgacaccag aagtgtcaac atctaaagac aaatgcttgg tcaaataggt 1800
gattaaaccg tcttcagtct tcaagtcaaa ggccattgtt ttatatttgt tgtaaaaagt 1860
agataattac ttccttgatg atctgtaaaa aagagaaaaa gaaagcatct aagaacttga 1920
aaaactacga attagaaaag accaaatatg tatttcttgc attgaccaat ttatgcaagt 1980
ttatatatat gtaaatgtaa gtttcacgag gttctactaa actaaaccac ccccttggtt 2040
agaagaaaag agtgtgtgag aacaggctgt tgttgtcaca cgattcggac aattctgttt 2100
gaaagagaga gagtaacagt acgatcgaac gaactttgct ctggagatca cagtgggcat 2160
catagcatgt ggtactaaac cctttcccgc cattccagaa ccttcgattg cttgttacaa 2220
aacctgtgag ccgtcgctag gaccttgttg tgtgacgaaa ttggaagctg caatcaatag 2280
gaagacagga agtcgagcgt gtctgggttt tttcagtttt gttctttttg caaacaacag 2340
tttattcctg gcatccacta aatataatgg agcccgcttt ttaagctggc atccagaaaa 2400
aaaaagaatc ccagcaccaa aatattgttt tcttcaccaa ccatcagttc ataggtccat 2460
tctcttagcg caactacaga gaacaggggc acaaacaggc aaaaaacggg cacaacctca 2520
atggagtgat gcaacctgcc tggagtaaat gatgacacaa ggcaattgac ccacgcatgt 2580
atctatctca ttttcttaca ccttctatta ccttctgctc tctctgattt ggaaaaagct 2640
gaaaaaaaag gttgaaacca gttccctgaa attattcccc tacttgacta ataagtatat 2700
aaagacggta ggtattgatt gtaattctgt aaatctattt cttaaacttc ttaaattcta 2760
cttttatagt tagtcttttt tttagtttta aaacaccaag aacttagttt cgaataaaca 2820
cacataaaca aacaaaatgc atatcagaaa cccatataga actccaattg actaccaagc 2880
tttgtctgaa gctttcccac cattgaagcc atttgtttcc gttaacgctg atggtacctc 2940
ctcagttgac ttgaccattc cagaagccca aagagctttt accgctgccc ttttgcacag 3000
agacttcggc ttgactatga ctatcccaga agatcgtttg tgtccaaccg ttccaaacag 3060
attgaactac gttttgtgga ttgaagacat tttcaactac accaacaaga ctttgggttt 3120
atctgacgac cgtccaatca agggtgttga tatcggtacc ggtgcttctg ccatttaccc 3180
aatgttggct tgcgccagat tcaaggcttg gtccatggtt ggtactgaag ttgaaagaaa 3240
gtgtatcgac actgctagat taaacgttgt tgctaacaac ttgcaagatc gtctatccat 3300
cttggaaacc tctattgacg gtccaatttt agtcccaatt ttcgaagcta ccgaagaata 3360
cgaatacgaa ttcaccatgt gtaacccacc tttctacgat ggtgccgctg acatgcaaac 3420
tagcgatgct gcaaagggtt ttggtttcgg tgtcggtgct ccacactctg gtacagtcat 3480
cgaaatgtct actgaaggtg gtgaatccgc tttcgtggct caaatggtta gagaatctct 3540
taagttgaga accagatgta gatggtacac ttctaactta ggtaagttga aatctttgaa 3600
ggaaattgtc ggtttgttga aggaattaga aatctctaat tacgccatca acgaatatgt 3660
ccaaggttcc actagaagat acgctgtcgc ttggagtttc actgatatcc aattgccaga 3720
agaattgtcc agaccatcta atcctgaatt gtcctctttg ttcgactaca aggatgacga 3780
tgacaaatga atcgcgtgca ttcatccgct ctaaccgaaa aggaaggagt tagacaacct 3840
gaagtctagg tccctattta tttttttata gttatgttag tattaagaac gttatttata 3900
tttcaaattt ttcttttttt tctgtacaga cgcgtgtacg catgtaacat tatactgaaa 3960
accttgcttg agaaggtttt gggacgctcg aagatcgcgt acccaattcg ccctatagtg 4020
agtcgtatta cgcgcgctca ctggccgtcg ttttacaacg tcgtgactgg gaaaaccctg 4080
gcgttacccc tgcaggacta gtgctgaggc attaatgcaa ctcagaagtt tgacagcaag 4140
caagttcatc attcgaacta gccttattgt tttagttcag tgacagcgaa ctgccgtact 4200
cgatgcttta tttctcacgg tagagcggaa gaacagatag gggcagcgtg agaagagtta 4260
gaaagtaaat ttttatcacg tctgaagtat tcttattcat aggaaatttt gcaaggtttt 4320
ttagctcaat aacgggctaa gttatataag gtgttcacgc gattttcttg ttatgtatac 4380
ctcttctctg aggaatggta ctactgtcct gatgtaggct ccttaaattg gtgggcaaga 4440
ataacttatc gatattttgt atattggtct tggagttcac cacgtaatgc ctgtttaaga 4500
ccatcagtta actctagtat tatttggtct tggctactgg ccgtttgcta ttattcaagt 4560
cttttgtgcc ttcccgtcgg gtaagggagt tatttaggga tacagaatct aacgaaaact 4620
aaatctcaat gattaactct atttaatcct tttttgaaag gcaaaagagg tcccttgttc 4680
acttacaacg ttcttagcca aattcgctta tcacttacta cttcacgata tacagaagta 4740
aaaacatata aaaagatgtc tgtttgttta gccatcacaa aaggtatcgc ag 4792
<210> 29
<211> 9145
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 29
tgttttatat ttgttgtaaa aagtagataa ttacttcctt gatgatctgt aaaaaagaga 60
aaaagaaagc atctaagaac ttgaaaaact acgaattaga aaagaccaaa tatgtatttc 120
ttgcattgac caatttatgc aagtttatat atatgtaaat gtaagtttca cgaggttcta 180
ctaaactaaa ccaccccctt ggttagaaga aaagagtgtg tgagaacagg ctgttgttgt 240
cacacgattc ggacaattct gtttgaaaga gagagagtaa cagtacgatc gaacgaactt 300
tgctctggag atcacagtgg gcatcatagc atgtggtact aaaccctttc ccgccattcc 360
agaaccttcg attgcttgtt acaaaacctg tgagccgtcg ctaggacctt gttgtgtgac 420
gaaattggaa gctgcaatca ataggaagac aggaagtcga gcgtgtctgg gttttttcag 480
ttttgttctt tttgcaaaca acagtttatt cctggcatcc actaaatata atggagcccg 540
ctttttaagc tggcatccag aaaaaaaaag aatcccagca ccaaaatatt gttttcttca 600
ccaaccatca gttcataggt ccattctctt agcgcaacta cagagaacag gggcacaaac 660
aggcaaaaaa cgggcacaac ctcaatggag tgatgcaacc tgcctggagt aaatgatgac 720
acaaggcaat tgacccacgc atgtatctat ctcattttct tacaccttct attaccttct 780
gctctctctg atttggaaaa agctgaaaaa aaaggttgaa accagttccc tgaaattatt 840
cccctacttg actaataagt atataaagac ggtaggtatt gattgtaatt ctgtaaatct 900
atttcttaaa cttcttaaat tctactttta tagttagtct tttttttagt tttaaaacac 960
caagaactta gtttcgaata aacacacata aacaaacaaa ggatccatga tgaagttctg 1020
gagaaagtac acacaacaag aaatggatga aaagattact gaatctttgg aaaagacttt 1080
gaactacgat aacactaaga caatcggtat tccaggtact aagttggatg atacagtttt 1140
ctatgatgat cattctttcg ttaagcattc accatacttg agaactttta ttcaaaaccc 1200
aaaccatatc ggttgtcata cttatgataa ggctgatatc ttgttcggtg gtacattcga 1260
tatcgaaaga gaattaatcc aattgttagc aatcgatgtt ttgaacggta acgatgaaga 1320
atttgatggt tacgttactc aaggtggtac agaagctaac atccaagcaa tgtgggttta 1380
cagaaactac ttcaagaaag aaagaaaggc taagcatgaa gaaatcgcta tcatcacttc 1440
agcagataca cattactctg catacaaagg ttcagatttg ttgaacatcg atattattaa 1500
ggttccagtt gatttttatt caagaaaaat tcaagaaaat acattggatt caattgttaa 1560
agaagctaaa gaaattggta aaaagtactt catcgttatc tctaacatgg gtactacaat 1620
gtttggttca gttgatgatc cagatttgta cgctaacatc ttcgataagt acaatttgga 1680
atacaaaatt catgttgatg gtgcatttgg tggttttata tatccaattg ataataagga 1740
atgtaaaact gatttctcta ataagaacgt ttcttcaatc acattagatg gtcataagat 1800
gttgcaagct ccatacggta ctggtatctt cgtttcaaga aagaatttga tccataacac 1860
tttgacaaag gaagcaactt acatcgaaaa tttggatgtt acattgtctg gttcaagatc 1920
tggttcaaat gctgttgcaa tttggatggt tttagcttct tatggtccat acggttggat 1980
ggaaaagatt aataagttga gaaatagaac taaatggttg tgtaagcaat tgaacgatat 2040
gagaattaaa tattacaaag aagattcaat gaatattgtt acaattgaag aacaatatgt 2100
taataaggaa atcgctgaaa agtacttttt agttccagaa gttcataacc caactaacaa 2160
ctggtacaag atcgttgtta tggaacatgt tgaattggat atcttgaact ctttggttta 2220
cgatttgaga aagtttaata aggaacattt gaaggcaatg catcatcatc atcatcatta 2280
accgcggcta gctaagatcc gctctaaccg aaaaggaagg agttagacaa cctgaagtct 2340
aggtccctat ttattttttt atagttatgt tagtattaag aacgttattt atatttcaaa 2400
tttttctttt ttttctgtac agacgcgtgt acgcatgtaa cattatactg aaaaccttgc 2460
ttgagaaggt tttgggacgc tcgaagatcc agctgcatta atgaatcggc caacgcgcgg 2520
ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac tcgctgcgct 2580
cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca 2640
cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga 2700
accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 2760
acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 2820
cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 2880
acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 2940
atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 3000
agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 3060
acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 3120
gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg 3180
gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 3240
gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca 3300
gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 3360
acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga 3420
tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt 3480
ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt 3540
catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat 3600
ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca gatttatcag 3660
caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct 3720
ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt 3780
tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg 3840
cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca 3900
aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt 3960
tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat 4020
gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac 4080
cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa 4140
aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt 4200
tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt 4260
tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa 4320
gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt 4380
atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 4440
taggggttcc gcgcacattt ccccgaaaag tgccacctga acgaagcatc tgtgcttcat 4500
tttgtagaac aaaaatgcaa cgcgagagcg ctaatttttc aaacaaagaa tctgagctgc 4560
atttttacag aacagaaatg caacgcgaaa gcgctatttt accaacgaag aatctgtgct 4620
tcatttttgt aaaacaaaaa tgcaacgcga gagcgctaat ttttcaaaca aagaatctga 4680
gctgcatttt tacagaacag aaatgcaacg cgagagcgct attttaccaa caaagaatct 4740
atacttcttt tttgttctac aaaaatgcat cccgagagcg ctatttttct aacaaagcat 4800
cttagattac tttttttctc ctttgtgcgc tctataatgc agtctcttga taactttttg 4860
cactgtaggt ccgttaaggt tagaagaagg ctactttggt gtctattttc tcttccataa 4920
aaaaagcctg actccacttc ccgcgtttac tgattactag cgaagctgcg ggtgcatttt 4980
ttcaagataa aggcatcccc gattatattc tataccgatg tggattgcgc atactttgtg 5040
aacagaaagt gatagcgttg atgattcttc attggtcaga aaattatgaa cggtttcttc 5100
tattttgtct ctatatacta cgtataggaa atgtttacat tttcgtattg ttttcgattc 5160
actctatgaa tagttcttac tacaattttt ttgtctaaag agtaatacta gagataaaca 5220
taaaaaatgt agaggtcgag tttagatgca agttcaagga gcgaaaggtg gatgggtagg 5280
ttatataggg atatagcaca gagatatata gcaaagagat acttttgagc aatgtttgtg 5340
gaagcggtat tcgcaatatt ttagtagctc gttacagtcc ggtgcgtttt tggttttttg 5400
aaagtgcgtc ttcagagcgc ttttggtttt caaaagcgct ctgaagttcc tatactttct 5460
agagaatagg aacttcggaa taggaacttc aaagcgtttc cgaaaacgag cgcttccgaa 5520
aatgcaacgc gagctgcgca catacagctc actgttcacg tcgcacctat atctgcgtgt 5580
tgcctgtata tatatataca tgagaagaac ggcatagtgc gtgtttatgc ttaaatgcgt 5640
acttatatgc gtctatttat gtaggatgaa aggtagtcta gtacctcctg tgatattatc 5700
ccattccatg cggggtatcg tatgcttcct tcagcactac cctttagctg ttctatatgc 5760
tgccactcct caattggatt agtctcatcc ttcaatgcta tcatttcctt tgatattgga 5820
tcatactaag aaaccattat tatcatgaca ttaacctata aaaataggcg tatcacgagg 5880
ccctttcgtc tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg 5940
gagacggtca cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg 6000
tcagcgggtg ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta 6060
ctgagagtgc accatatttc acaccgcata gatccgtcga gttcaagaga aaaaaaaaga 6120
aaaagcaaaa agaaaaaagg aaagcgcgcc tcgttcagaa tgacacgtat agaatgatgc 6180
attaccttgt catcttcagt atcatactgt tcgtatacat acttactgac attcataggt 6240
atacatatat acacatgtat atatatcgta tgctgcagct ttaaataatc ggtgtcacta 6300
cataagaaca cctttggtgg agggaacatc gttggtacca ttgggcgagg tggcttctct 6360
tatggcaacc gcaagagcct tgaacgcact ctcactacgg tgatgatcat tcttgcctcg 6420
cagacaatca acgtggaggg taattctgct agcctctgca aagctttcaa gaaaatgcgg 6480
gatcatctcg caagagagat ctcctacttt ctccctttgc aaaccaagtt cgacaactgc 6540
gtacggcctg ttcgaaagat ctaccaccgc tctggaaagt gcctcatcca aaggcgcaaa 6600
tcctgatcca aaccttttta ctccacgcac ggcccctagg gcctctttaa aagcttgacc 6660
gagagcaatc ccgcagtctt cagtggtgtg atggtcgtct atgtgtaagt caccaatgca 6720
ctcaacgatt agcgaccagc cggaatgctt ggccagagca tgtatcatat ggtccagaaa 6780
ccctatacct gtgtggacgt taatcacttg cgattgtgtg gcctgttctg ctactgcttc 6840
tgcctctttt tctgggaaga tcgagtgctc tatcgctagg ggaccaccct ttaaagagat 6900
cgcaatctga atcttggttt catttgtaat acgctttact agggctttct gctctgtcat 6960
ctttgccttc gtttatcttg cctgctcatt ttttagtata ttcttcgaag aaatcacatt 7020
actttatata atgtataatt cattatgtga taatgccaat cgctaagaaa aaaaaagagt 7080
catccgctag gtggaaaaaa aaaaatgaaa atcattaccg aggcataaaa aaatatagag 7140
tgtactagag gaggccaaga gtaatagaaa aagaaaattg cgggaaagga ctgtgttatg 7200
acttccctga ctaatgccgt gttcaaacga tacctggcag tgactcctag cgctcaccaa 7260
gctcttaaaa cgggaattta tggtgcactc tcagtacacg cgccagatct gtttagcttg 7320
cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc ctccttgaca 7380
gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt tagcccatac 7440
atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg cgaagcaaaa 7500
attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca gacgcgttga 7560
attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg ccactgaggt 7620
tcttctttca tatacttcct tttaaaatct tgctaggata cagttctcac atcacatccg 7680
aacataaaca accatgggta aggaaaagac tcacgtttcg aggccgcgat taaattccaa 7740
catggatgct gatttatatg ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc 7800
gacaatctat cgattgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa 7860
aggtagcgtt gccaatgatg ttacagatga gatggtcaga ctaaactggc tgacggaatt 7920
tatgcctctt ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac 7980
cactgcgatc cccggcaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga 8040
aaatattgtt gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa 8100
ttgtcctttt aacagcgatc gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa 8160
cggtttggtt gatgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt 8220
ctggaaagaa atgcataagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga 8280
tttctcactt gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg 8340
acgagtcgga atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga 8400
gttttctcct tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat 8460
gaataaattg cagtttcatt tgatgctcga tgagtttttc taatcagtac tgacaataaa 8520
aagattcttg ttttcaagaa cttgtcattt gtatagtttt tttatattgt agttgttcta 8580
ttttaatcaa atgttagcgt gatttatatt ttttttcgcc tcgacatcat ctgcccagat 8640
gcgaagttaa gtgcgcagaa agtaatatca tgcgtcaatc gtatgtgaat gctggtcgct 8700
atactgctgt cgattcgata ctaacgccgc catccagtgt cgaattcgcc attcaggctg 8760
cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctgaattgg 8820
agcgacctca tgctatacct gagaaagcaa cctgacctac aggaaagagt tactcaagaa 8880
taagaatttt cgttttaaaa cctaagagtc actttaaaat ttgtatacac ttattttttt 8940
tataacttat ttaataataa aaatcataaa tcataagaaa ttcgcttatt tagaagtgtc 9000
aacaacgtat ctaccaacga tttgaccctt ttccatcttt tcgtaaattt ctggcaaggt 9060
agacaagccg acaaccttga ttggagactt gaccaaacct ctggcgaaga attgttaatt 9120
aagagctcag atcttttgcg gccgc 9145
<210> 30
<211> 499
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 30
gtttgcaaaa agaacaaaac tgaaaaaacc cagacacgct cgacttcctg tcttcctatt 60
gattgcagct tccaatttcg tcacacaaca aggtcctagc gacggctcac aggttttgta 120
acaagcaatc gaaggttctg gaatggcggg aaagggttta gtaccacatg ctatgatgcc 180
cactgtgatc tccagagcaa agttcgttcg atcgtactgt tactctctct ctttcaaaca 240
gaattgtccg aatcgtgtga caacaacagc ctgttctcac acactctttt cttctaacca 300
agggggtggt ttagtttagt agaacctcgt gaaacttaca tttacatata tataaacttg 360
cataaattgg tcaatgcaag aaatacatat ttggtctttt ctaattcgta gtttttcaag 420
ttcttagatg ctttcttttt ctctttttta cagatcatca aggaagtaat tatctacttt 480
ttacaacaaa tataaaaca 499
<210> 31
<211> 500
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 31
acagtttatt cctggcatcc actaaatata atggagcccg ctttttaagc tggcatccag 60
aaaaaaaaag aatcccagca ccaaaatatt gttttcttca ccaaccatca gttcataggt 120
ccattctctt agcgcaacta cagagaacag gggcacaaac aggcaaaaaa cgggcacaac 180
ctcaatggag tgatgcaacc tgcctggagt aaatgatgac acaaggcaat tgacccacgc 240
atgtatctat ctcattttct tacaccttct attaccttct gctctctctg atttggaaaa 300
agctgaaaaa aaaggttgaa accagttccc tgaaattatt cccctacttg actaataagt 360
atataaagac ggtaggtatt gattgtaatt ctgtaaatct atttcttaaa cttcttaaat 420
tctactttta tagttagtct tttttttagt tttaaaacac caagaactta gtttcgaata 480
aacacacata aacaaacaaa 500
<210> 32
<211> 500
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 32
gctggattga gctgaatggt gccaggtcga ggctgggagg gagactaact cgaaagtgac 60
gaagactcga aaattaaaaa aaaagatact gcagaaggca agattgagaa tggagtaaag 120
gcagcgtggg tcccctgtgg aaaccgcagt tttcctgcgc caagtggtac cggtgcgagt 180
gcagcaatta atctctcgat attttcttag tatctctttt tatataagaa tatattttgg 240
aattggtaat gcttatcttc aatagtttct tagttgaatg cacacttaag agcaaattgg 300
ccaaggagtt cttcgttcgc tttaatttat ttcctggtta ttgtcaattt attcatccca 360
tctccccagg atagaagaaa ttagtgtaat tttgctgaca atacatttta acgacgataa 420
caataatagc aattaaataa aatagcacta ccaccactcc actgctcgtt agctatttct 480
gtaaaataaa taaaaagatc 500
<210> 33
<211> 501
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 33
attcgcgcta tctcgatttc tacctatata gttaatctct gtacaaaaac aatctttcca 60
actatccatt aatcatagta tattatcagc gtcggcgatt ttaccacgct tgacaaaagc 120
cgcgggcggg attcctgtgg gtagtggcac cggcagttaa tctaatcaaa ggcgcttgaa 180
ggaagagata gataatagaa caaagcaatc gccgctttgg acggcaaata tgtttatcca 240
ttggtgcggt gattggatat gatttgtctc cagtagtata agcaagcgcc agatctgttt 300
actgtaaaat taagtgagta atctcgcggg atgtaatgat ttaagggaat ctggttcagg 360
ttttcacata tatttgtata taaggccatt tgtaatttca atagttttag gatttttcct 420
tctcccaaaa tactcactta ctgtgttaca ttacagaaag aacagacaag aaaccgtcaa 480
taagaaatat aactaagaac a 501
<210> 34
<211> 7882
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 34
caggtggcac ttttcgggga aatgtgcgcg gaacccctat ttgtttattt ttctaaatac 60
attcaaatat gtatccgctc atgagacaat aaccctgata aatgcttcaa taatattgaa 120
aaaggaagag tatgagtatt caacatttcc gtgtcgccct tattcccttt tttgcggcat 180
tttgccttcc tgtttttgct cacccagaaa cgctggtgaa agtaaaagat gctgaagatc 240
agttgggtgc acgagtgggt tacatcgaac tggatctcaa cagcggtaag atccttgaga 300
gttttcgccc cgaagaacgt tttccaatga tgagcacttt taaagttctg ctatgtggcg 360
cggtattatc ccgtattgac gccgggcaag agcaactcgg tcgccgcata cactattctc 420
agaatgactt ggttgagtac tcaccagtca cagaaaagca tcttacggat ggcatgacag 480
taagagaatt atgcagtgct gccataacca tgagtgataa cactgcggcc aacttacttc 540
tgacaacgat cggaggaccg aaggagctaa ccgctttttt gcacaacatg ggggatcatg 600
taactcgcct tgatcgttgg gaaccggagc tgaatgaagc cataccaaac gacgagcgtg 660
acaccacgat gcctgtagca atggcaacaa cgttgcgcaa actattaact ggcgaactac 720
ttactctagc ttcccggcaa caattaatag actggatgga ggcggataaa gttgcaggac 780
cacttctgcg ctcggccctt ccggctggct ggtttattgc tgataaatct ggagccggtg 840
agcgtgggtc tcgcggtatc attgcagcac tggggccaga tggtaagccc tcccgtatcg 900
tagttatcta cacgacgggg agtcaggcaa ctatggatga acgaaataga cagatcgctg 960
agataggtgc ctcactgatt aagcattggt aactgtcaga ccaagtttac tcatatatac 1020
tttagattga tttaaaactt catttttaat ttaaaaggat ctaggtgaag atcctttttg 1080
ataatctcat gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg 1140
tagaaaagat caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc 1200
aaacaaaaaa accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc 1260
tttttccgaa ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt 1320
agccgtagtt aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc 1380
taatcctgtt accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact 1440
caagacgata gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac 1500
agcccagctt ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag 1560
aaagcgccac gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg 1620
gaacaggaga gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg 1680
tcgggtttcg ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga 1740
gcctatggaa aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt 1800
ttgctcacat gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct 1860
ttgagtgagc tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg 1920
aggaagcgga agagcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 1980
aatgcagctg gatcttcgag cgtcccaaaa ccttctcaag caaggttttc agtataatgt 2040
tacatgcgta cacgcgtctg tacagaaaaa aaagaaaaat ttgaaatata aataacgttc 2100
ttaatactaa cataactata aaaaaataaa tagggaccta gacttcaggt tgtctaactc 2160
cttccttttc ggttagagcg gatcttagct agccgcggta ccaagctggt ggatcctttg 2220
tttgtttatg tgtgtttatt cgaaactaag ttcttggtgt tttaaaacta aaaaaaagac 2280
taactataaa agtagaattt aagaagttta agaaatagat ttacagaatt acaatcaata 2340
cctaccgtct ttatatactt attagtcaag taggggaata atttcaggga actggtttca 2400
accttttttt tcagcttttt ccaaatcaga gagagcagaa ggtaatagaa ggtgtaagaa 2460
aatgagatag atacatgcgt gggtcaattg ccttgtgtca tcatttactc caggcaggtt 2520
gcatcactcc attgaggttg tgcccgtttt ttgcctgttt gtgcccctgt tctctgtagt 2580
tgcgctaaga gaatggacct atgaactgat ggttggtgaa gaaaacaata ttttggtgct 2640
gggattcttt ttttttctgg atgccagctt aaaaagcggg ctccattata tttagtggat 2700
gccaggaata aactgttgtt tgcaaaaaga acaaaactga aaaaacccag acacgctcga 2760
cttcctgtct tcctattgat tgcagcttcc aatttcgtca cacaacaagg tcctagcgac 2820
ggctcacagg ttttgtaaca agcaatcgaa ggttctggaa tggcgggaaa gggtttagta 2880
ccacatgcta tgatgcccac tgtgatctcc agagcaaagt tcgttcgatc gtactgttac 2940
tctctctctt tcaaacagaa ttgtccgaat cgtgtgacaa caacagcctg ttctcacaca 3000
ctcttttctt ctaaccaagg gggtggttta gtttagtaga acctcgtgaa acttacattt 3060
acatatatat aaacttgcat aaattggtca atgcaagaaa tacatatttg gtcttttcta 3120
attcgtagtt tttcaagttc ttagatgctt tctttttctc ttttttacag atcatcaagg 3180
aagtaattat ctacttttta caacaaatat aaaacagcgg ccgcaaaaga tctgagctct 3240
taattaacaa ttcttcgcca gaggtttggt caagtctcca atcaaggttg tcggcttgtc 3300
taccttgcca gaaatttacg aaaagatgga aaagggtcaa atcgttggta gatacgttgt 3360
tgacacttct aaataagcga atttcttatg atttatgatt tttattatta aataagttat 3420
aaaaaaaata agtgtataca aattttaaag tgactcttag gttttaaaac gaaaattctt 3480
attcttgagt aactctttcc tgtaggtcag gttgctttct caggtatagc atgaggtcgc 3540
tccaattcag ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc 3600
gcagcctgaa tggcgaattc gacactggat ggcggcgtta gtatcgaatc gacagcagta 3660
tagcgaccag cattcacata cgattgacgc atgatattac tttctgcgca cttaacttcg 3720
catctgggca gatgatgtcg aggcgaaaaa aaatataaat cacgctaaca tttgattaaa 3780
atagaacaac tacaatataa aaaaactata caaatgacaa gttcttgaaa acaagaatct 3840
ttttattgtc agtactgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt 3900
catatcagga ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa 3960
ctcaccgagg cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg 4020
tccaacatca atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa 4080
atcaccatga gtgacgactg aatccggtga gaatggcaaa agcttatgca tttctttcca 4140
gacttgttca acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc 4200
gttattcatt cgtgattgcg cctgagcgag acgaaatacg cgatcgctgt taaaaggaca 4260
attacaaaca ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt 4320
ttcacctgaa tcaggatatt cttctaatac ctggaatgct gttttgccgg ggatcgcagt 4380
ggtgagtaac catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat 4440
aaattccgtc agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc 4500
tttgccatgt ttcagaaaca actctggcgc atcgggcttc ccatacaatc gatagattgt 4560
cgcacctgat tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat 4620
gttggaattt aatcgcggcc tcgaaacgtg agtcttttcc ttacccatgg ttgtttatgt 4680
tcggatgtga tgtgagaact gtatcctagc aagattttaa aaggaagtat atgaaagaag 4740
aacctcagtg gcaaatccta accttttata tttctctaca ggggcgcggc gtggggacaa 4800
ttcaacgcgt ctgtgagggg agcgtttccc tgctcgcagg tctgcagcga ggagccgtaa 4860
tttttgcttc gcgccgtgcg gccatcaaaa tgtatggatg caaatgatta tacatgggga 4920
tgtatgggct aaatgtacgg gcgacagtca catcatgccc ctgagctgcg cacgtcaaga 4980
ctgtcaagga gggtattctg ggcctccatg tcgctggccg ggtgacccgg cggggacgag 5040
gcaagctaaa cagatctggc gcgtgtactg agagtgcacc ataaattccc gttttaagag 5100
cttggtgagc gctaggagtc actgccaggt atcgtttgaa cacggcatta gtcagggaag 5160
tcataacaca gtcctttccc gcaattttct ttttctatta ctcttggcct cctctagtac 5220
actctatatt tttttatgcc tcggtaatga ttttcatttt tttttttcca cctagcggat 5280
gactcttttt ttttcttagc gattggcatt atcacataat gaattataca ttatataaag 5340
taatgtgatt tcttcgaaga atatactaaa aaatgagcag gcaagataaa cgaaggcaaa 5400
gatgacagag cagaaagccc tagtaaagcg tattacaaat gaaaccaaga ttcagattgc 5460
gatctcttta aagggtggtc ccctagcgat agagcactcg atcttcccag aaaaagaggc 5520
agaagcagta gcagaacagg ccacacaatc gcaagtgatt aacgtccaca caggtatagg 5580
gtttctggac catatgatac atgctctggc caagcattcc ggctggtcgc taatcgttga 5640
gtgcattggt gacttacaca tagacgacca tcacaccact gaagactgcg ggattgctct 5700
cggtcaagct tttaaagagg ccctaggggc cgtgcgtgga gtaaaaaggt ttggatcagg 5760
atttgcgcct ttggatgagg cactttccag agcggtggta gatctttcga acaggccgta 5820
cgcagttgtc gaacttggtt tgcaaaggga gaaagtagga gatctctctt gcgagatgat 5880
cccgcatttt cttgaaagct ttgcagaggc tagcagaatt accctccacg ttgattgtct 5940
gcgaggcaag aatgatcatc accgtagtga gagtgcgttc aaggctcttg cggttgccat 6000
aagagaagcc acctcgccca atggtaccaa cgatgttccc tccaccaaag gtgttcttat 6060
gtagtgacac cgattattta aagctgcagc atacgatata tatacatgtg tatatatgta 6120
tacctatgaa tgtcagtaag tatgtatacg aacagtatga tactgaagat gacaaggtaa 6180
tgcatcattc tatacgtgtc attctgaacg aggcgcgctt tccttttttc tttttgcttt 6240
ttcttttttt ttctcttgaa ctcgacggat ctatgcggtg tgaaatatgg tgcactctca 6300
gtacaatctg ctctgatgcc gcatagttaa gccagccccg acacccgcca acacccgctg 6360
acgcgccctg acgggcttgt ctgctcccgg catccgctta cagacaagct gtgaccgtct 6420
ccgggagctg catgtgtcag aggttttcac cgtcatcacc gaaacgcgcg agacgaaagg 6480
gcctcgtgat acgcctattt ttataggtta atgtcatgat aataatggtt tcttagtatg 6540
atccaatatc aaaggaaatg atagcattga aggatgagac taatccaatt gaggagtggc 6600
agcatataga acagctaaag ggtagtgctg aaggaagcat acgatacccc gcatggaatg 6660
ggataatatc acaggaggta ctagactacc tttcatccta cataaataga cgcatataag 6720
tacgcattta agcataaaca cgcactatgc cgttcttctc atgtatatat atatacaggc 6780
aacacgcaga tataggtgcg acgtgaacag tgagctgtat gtgcgcagct cgcgttgcat 6840
tttcggaagc gctcgttttc ggaaacgctt tgaagttcct attccgaagt tcctattctc 6900
tagaaagtat aggaacttca gagcgctttt gaaaaccaaa agcgctctga agacgcactt 6960
tcaaaaaacc aaaaacgcac cggactgtaa cgagctacta aaatattgcg aataccgctt 7020
ccacaaacat tgctcaaaag tatctctttg ctatatatct ctgtgctata tccctatata 7080
acctacccat ccacctttcg ctccttgaac ttgcatctaa actcgacctc tacatttttt 7140
atgtttatct ctagtattac tctttagaca aaaaaattgt agtaagaact attcatagag 7200
tgaatcgaaa acaatacgaa aatgtaaaca tttcctatac gtagtatata gagacaaaat 7260
agaagaaacc gttcataatt ttctgaccaa tgaagaatca tcaacgctat cactttctgt 7320
tcacaaagta tgcgcaatcc acatcggtat agaatataat cggggatgcc tttatcttga 7380
aaaaatgcac ccgcagcttc gctagtaatc agtaaacgcg ggaagtggag tcaggctttt 7440
tttatggaag agaaaataga caccaaagta gccttcttct aaccttaacg gacctacagt 7500
gcaaaaagtt atcaagagac tgcattatag agcgcacaaa ggagaaaaaa agtaatctaa 7560
gatgctttgt tagaaaaata gcgctctcgg gatgcatttt tgtagaacaa aaaagaagta 7620
tagattcttt gttggtaaaa tagcgctctc gcgttgcatt tctgttctgt aaaaatgcag 7680
ctcagattct ttgtttgaaa aattagcgct ctcgcgttgc atttttgttt tacaaaaatg 7740
aagcacagat tcttcgttgg taaaatagcg ctttcgcgtt gcatttctgt tctgtaaaaa 7800
tgcagctcag attctttgtt tgaaaaatta gcgctctcgc gttgcatttt tgttctacaa 7860
aatgaagcac agatgcttcg tt 7882
<210> 35
<211> 3810
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 35
gctaacagcg cgatttgctg gtgacccaat gcgaccagat gctccacgcc cagtcgcgta 60
ccgtcttcat gggagaaaat aatactgttg atgggtgtct ggtcagagac atcaagaaat 120
aacgccggaa cattagtgca ggcagcttcc acagcaatgg catcctggtc atccagcgga 180
tagttaatga tcagcccact gacgcgttgc gcgagaagat tgtgcaccgc cgctttacag 240
gcttcgacgc cgcttcgttc taccatcgac accaccacgc tggcacccag ttgatcggcg 300
cgagatttaa tcgccgcgac aatttgcgac ggcgcgtgca gggccagact ggaggtggca 360
acgccaatca gcaacgactg tttgcccgcc agttgttgtg ccacgcggtt gggaatgtaa 420
ttcagctccg ccatcgccgc ttccactttt tcccgcgttt tcgcagaaac gtggctggcc 480
tggttcacca cgcgggaaac ggtctgataa gagacaccgg catactctgc gacatcgtat 540
aacgttactg gtttcacatt caccaccctg aattgactct cttccgggcg ctatcatgcc 600
ataccgcgaa aggttttgcg ccattcgatg gtgtccggga tctcgacgct ctcccttatg 660
cgactcctgc attaggaagc agcccagtag taggttgagg ccgttgagca ccgccgccgc 720
aaggaatggt gcatgcaagg agatggcgcc caacagtccc ccggccacgg ggcctgccac 780
catacccacg ccgaaacaag cgctcatgag cccgaagtgg cgagcccgat cttccccatc 840
ggtgatgtcg gcgatatagg cgccagcaac cgcacctgtg gcgccggtga tgccggccac 900
gatgcgtccg gcgtagccta ggatcgagat cgatctcgat cccgcgaaat taatacgact 960
cactataggg gaattgtgag cggataacaa ttcccctcta gaaataattt tgtttaactt 1020
taagaaggag atatacatat ggcagatctc aattggatat cggccggcca cgcgatcgct 1080
gacgtcggta ccctcgagtc tggtaaagaa accgctgctg cgaaatttga acgccagcac 1140
atggactcgt ctactagtcg cagcttaatt aacctaaact gctgccaccg ctgagcaata 1200
actagcataa ccccttgggg cctctaaacg ggtcttgagg ggttttttgc tagcgaaagg 1260
aggagtcgac actgcttccg gtagtcaata aaccggtaaa ccagcaatag acataagcgg 1320
ctatttaacg accctgccct gaaccgacga ccgggtcatc gtggccggat cttgcggccc 1380
ctcggcttga acgaattgtt agacattatt tgccgactac cttggtgatc tcgcctttca 1440
cgtagtggac aaattcttcc aactgatctg cgcgcgaggc caagcgatct tcttcttgtc 1500
caagataagc ctgtctagct tcaagtatga cgggctgata ctgggccggc aggcgctcca 1560
ttgcccagtc ggcagcgaca tccttcggcg cgattttgcc ggttactgcg ctgtaccaaa 1620
tgcgggacaa cgtaagcact acatttcgct catcgccagc ccagtcgggc ggcgagttcc 1680
atagcgttaa ggtttcattt agcgcctcaa atagatcctg ttcaggaacc ggatcaaaga 1740
gttcctccgc cgctggacct accaaggcaa cgctatgttc tcttgctttt gtcagcaaga 1800
tagccagatc aatgtcgatc gtggctggct cgaagatacc tgcaagaatg tcattgcgct 1860
gccattctcc aaattgcagt tcgcgcttag ctggataacg ccacggaatg atgtcgtcgt 1920
gcacaacaat ggtgacttct acagcgcgga gaatctcgct ctctccaggg gaagccgaag 1980
tttccaaaag gtcgttgatc aaagctcgcc gcgttgtttc atcaagcctt acggtcaccg 2040
taaccagcaa atcaatatca ctgtgtggct tcaggccgcc atccactgcg gagccgtaca 2100
aatgtacggc cagcaacgtc ggttcgagat ggcgctcgat gacgccaact acctctgata 2160
gttgagtcga tacttcggcg atcaccgctt ccctcatact cttccttttt caatattatt 2220
gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 2280
ataaacaaat agccagctca ctcggtcgct acgctccggg cgtgagactg cggcgggcgc 2340
tgcggacaca tacaaagtta cccacagatt ccgtggataa gcaggggact aacatgtgag 2400
gcaaaacagc agggccgcgc cggtggcgtt tttccatagg ctccgccctc ctgccagagt 2460
tcacataaac agacgctttt ccggtgcatc tgtgggagcc gtgaggctca accatgaatc 2520
tgacagtacg ggcgaaaccc gacaggactt aaagatcccc accgtttccg gcgggtcgct 2580
ccctcttgcg ctctcctgtt ccgaccctgc cgtttaccgg atacctgttc cgcctttctc 2640
ccttacggga agtgtggcgc tttctcatag ctcacacact ggtatctcgg ctcggtgtag 2700
gtcgttcgct ccaagctggg ctgtaagcaa gaactccccg ttcagcccga ctgctgcgcc 2760
ttatccggta actgttcact tgagtccaac ccggaaaagc acggtaaaac gccactggca 2820
gcagccattg gtaactggga gttcgcagag gatttgttta gctaaacacg cggttgctct 2880
tgaagtgtgc gccaaagtcc ggctacactg gaaggacaga tttggttgct gtgctctgcg 2940
aaagccagtt accacggtta agcagttccc caactgactt aaccttcgat caaaccacct 3000
ccccaggtgg ttttttcgtt tacagggcaa aagattacgc gcagaaaaaa aggatctcaa 3060
gaagatcctt tgatcttttc tactgaaccg ctctagattt cagtgcaatt tatctcttca 3120
aatgtagcac ctgaagtcag ccccatacga tataagttgt aattctcatg ttagtcatgc 3180
cccgcgccca ccggaaggag ctgactgggt tgaaggctct caagggcatc ggtcgagatc 3240
ccggtgccta atgagtgagc taacttacat taattgcgtt gcgctcactg cccgctttcc 3300
agtcgggaaa cctgtcgtgc cagctgcatt aatgaatcgg ccaacgcgcg gggagaggcg 3360
gtttgcgtat tgggcgccag ggtggttttt cttttcacca gtgagacggg caacagctga 3420
ttgcccttca ccgcctggcc ctgagagagt tgcagcaagc ggtccacgct ggtttgcccc 3480
agcaggcgaa aatcctgttt gatggtggtt aacggcggga tataacatga gctgtcttcg 3540
gtatcgtcgt atcccactac cgagatgtcc gcaccaacgc gcagcccgga ctcggtaatg 3600
gcgcgcattg cgcccagcgc catctgatcg ttggcaacca gcatcgcagt gggaacgatg 3660
ccctcattca gcatttgcat ggtttgttga aaaccggaca tggcactcca gtcgccttcc 3720
cgttccgcta tcggctgaat ttgattgcga gtgagatatt tatgccagcc agccagacgc 3780
agacgcgccg agacagaact taatgggccc 3810
<210> 36
<211> 5369
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 36
atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60
ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120
tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc gcaagcttgt 180
cgacggagct cgaattcgga tccgcgaccc atttgctgtc caccagtcat gctagccata 240
tggctgccgc gcggcaccag gccgctgctg tgatgatgat gatgatggct gctgcccatg 300
gtatatctcc ttcttaaagt taaacaaaat tatttctaga ggggaattgt tatccgctca 360
caattcccct atagtgagtc gtattaattt cgcgggatcg agatctcgat cctctacgcc 420
ggacgcatcg tggccggcat caccggcgcc acaggtgcgg ttgctggcgc ctatatcgcc 480
gacatcaccg atggggaaga tcgggctcgc cacttcgggc tcatgagcgc ttgtttcggc 540
gtgggtatgg tggcaggccc cgtggccggg ggactgttgg gcgccatctc cttgcatgca 600
ccattccttg cggcggcggt gctcaacggc ctcaacctac tactgggctg cttcctaatg 660
caggagtcgc ataagggaga gcgtcgagat cccggacacc atcgaatggc gcaaaacctt 720
tcgcggtatg gcatgatagc gcccggaaga gagtcaattc agggtggtga atgtgaaacc 780
agtaacgtta tacgatgtcg cagagtatgc cggtgtctct tatcagaccg tttcccgcgt 840
ggtgaaccag gccagccacg tttctgcgaa aacgcgggaa aaagtggaag cggcgatggc 900
ggagctgaat tacattccca accgcgtggc acaacaactg gcgggcaaac agtcgttgct 960
gattggcgtt gccacctcca gtctggccct gcacgcgccg tcgcaaattg tcgcggcgat 1020
taaatctcgc gccgatcaac tgggtgccag cgtggtggtg tcgatggtag aacgaagcgg 1080
cgtcgaagcc tgtaaagcgg cggtgcacaa tcttctcgcg caacgcgtca gtgggctgat 1140
cattaactat ccgctggatg accaggatgc cattgctgtg gaagctgcct gcactaatgt 1200
tccggcgtta tttcttgatg tctctgacca gacacccatc aacagtatta ttttctccca 1260
tgaagacggt acgcgactgg gcgtggagca tctggtcgca ttgggtcacc agcaaatcgc 1320
gctgttagcg ggcccattaa gttctgtctc ggcgcgtctg cgtctggctg gctggcataa 1380
atatctcact cgcaatcaaa ttcagccgat agcggaacgg gaaggcgact ggagtgccat 1440
gtccggtttt caacaaacca tgcaaatgct gaatgagggc atcgttccca ctgcgatgct 1500
ggttgccaac gatcagatgg cgctgggcgc aatgcgcgcc attaccgagt ccgggctgcg 1560
cgttggtgcg gatatctcgg tagtgggata cgacgatacc gaagacagct catgttatat 1620
cccgccgtta accaccatca aacaggattt tcgcctgctg gggcaaacca gcgtggaccg 1680
cttgctgcaa ctctctcagg gccaggcggt gaagggcaat cagctgttgc ccgtctcact 1740
ggtgaaaaga aaaaccaccc tggcgcccaa tacgcaaacc gcctctcccc gcgcgttggc 1800
cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca 1860
acgcaattaa tgtaagttag ctcactcatt aggcaccggg atctcgaccg atgcccttga 1920
gagccttcaa cccagtcagc tccttccggt gggcgcgggg catgactatc gtcgccgcac 1980
ttatgactgt cttctttatc atgcaactcg taggacaggt gccggcagcg ctctgggtca 2040
ttttcggcga ggaccgcttt cgctggagcg cgacgatgat cggcctgtcg cttgcggtat 2100
tcggaatctt gcacgccctc gctcaagcct tcgtcactgg tcccgccacc aaacgtttcg 2160
gcgagaagca ggccattatc gccggcatgg cggccccacg ggtgcgcatg atcgtgctcc 2220
tgtcgttgag gacccggcta ggctggcggg gttgccttac tggttagcag aatgaatcac 2280
cgatacgcga gcgaacgtga agcgactgct gctgcaaaac gtctgcgacc tgagcaacaa 2340
catgaatggt cttcggtttc cgtgtttcgt aaagtctgga aacgcggaag tcagcgccct 2400
gcaccattat gttccggatc tgcatcgcag gatgctgctg gctaccctgt ggaacaccta 2460
catctgtatt aacgaagcgc tggcattgac cctgagtgat ttttctctgg tcccgccgca 2520
tccataccgc cagttgttta ccctcacaac gttccagtaa ccgggcatgt tcatcatcag 2580
taacccgtat cgtgagcatc ctctctcgtt tcatcggtat cattaccccc atgaacagaa 2640
atccccctta cacggaggca tcagtgacca aacaggaaaa aaccgccctt aacatggccc 2700
gctttatcag aagccagaca ttaacgcttc tggagaaact caacgagctg gacgcggatg 2760
aacaggcaga catctgtgaa tcgcttcacg accacgctga tgagctttac cgcagctgcc 2820
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 2880
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 2940
ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga gtgtatactg 3000
gcttaactat gcggcatcag agcagattgt actgagagtg caccatatat gcggtgtgaa 3060
ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc ttcctcgctc 3120
actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca ctcaaaggcg 3180
gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc 3240
cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 3300
ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 3360
ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 3420
ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 3480
agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 3540
cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 3600
aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 3660
gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 3720
agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 3780
ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 3840
cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 3900
tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgaa caataaaact 3960
gtctgcttac ataaacagta atacaagggg tgttatgagc catattcaac gggaaacgtc 4020
ttgctctagg ccgcgattaa attccaacat ggatgctgat ttatatgggt ataaatgggc 4080
tcgcgataat gtcgggcaat caggtgcgac aatctatcga ttgtatggga agcccgatgc 4140
gccagagttg tttctgaaac atggcaaagg tagcgttgcc aatgatgtta cagatgagat 4200
ggtcagacta aactggctga cggaatttat gcctcttccg accatcaagc attttatccg 4260
tactcctgat gatgcatggt tactcaccac tgcgatcccc gggaaaacag cattccaggt 4320
attagaagaa tatcctgatt caggtgaaaa tattgttgat gcgctggcag tgttcctgcg 4380
ccggttgcat tcgattcctg tttgtaattg tccttttaac agcgatcgcg tatttcgtct 4440
cgctcaggcg caatcacgaa tgaataacgg tttggttgat gcgagtgatt ttgatgacga 4500
gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg cataaacttt tgccattctc 4560
accggattca gtcgtcactc atggtgattt ctcacttgat aaccttattt ttgacgaggg 4620
gaaattaata ggttgtattg atgttggacg agtcggaatc gcagaccgat accaggatct 4680
tgccatccta tggaactgcc tcggtgagtt ttctccttca ttacagaaac ggctttttca 4740
aaaatatggt attgataatc ctgatatgaa taaattgcag tttcatttga tgctcgatga 4800
gtttttctaa gaattaattc atgagcggat acatatttga atgtatttag aaaaataaac 4860
aaataggggt tccgcgcaca tttccccgaa aagtgccacc tgaaattgta aacgttaata 4920
ttttgttaaa attcgcgtta aatttttgtt aaatcagctc attttttaac caataggccg 4980
aaatcggcaa aatcccttat aaatcaaaag aatagaccga gatagggttg agtgttgttc 5040
cagtttggaa caagagtcca ctattaaaga acgtggactc caacgtcaaa gggcgaaaaa 5100
ccgtctatca gggcgatggc ccactacgtg aaccatcacc ctaatcaagt tttttggggt 5160
cgaggtgccg taaagcacta aatcggaacc ctaaagggag cccccgattt agagcttgac 5220
ggggaaagcc ggcgaacgtg gcgagaaagg aagggaagaa agcgaaagga gcgggcgcta 5280
gggcgctggc aagtgtagcg gtcacgctgc gcgtaaccac cacacccgcc gcgcttaatg 5340
cgccgctaca gggcgcgtcc cattcgcca 5369
<210> 37
<211> 3592
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 37
atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60
ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120
tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc gcaagcttgt 180
cgacggagct cgaattcgga tcctagaggg aaaccgttgt ggtctcccta tagtgagtcg 240
tattaatttc gcgggatcga gatctcgggc agcgttgggt cctggccacg ggtgcgcatg 300
atcgtgctcc tgtcgttgag gacccggcta ggctggcggg gttgccttac tggttagcag 360
aatgaatcac cgatacgcga gcgaacgtga agcgactgct gctgcaaaac gtctgcgacc 420
tgagcaacaa catgaatggt cttcggtttc cgtgtttcgt aaagtctgga aacgcggaag 480
tcagcgccct gcaccattat gttccggatc tgcatcgcag gatgctgctg gctaccctgt 540
ggaacaccta catctgtatt aacgaagcgc tggcattgac cctgagtgat ttttctctgg 600
tcccgccgca tccataccgc cagttgttta ccctcacaac gttccagtaa ccgggcatgt 660
tcatcatcag taacccgtat cgtgagcatc ctctctcgtt tcatcggtat cattaccccc 720
atgaacagaa atccccctta cacggaggca tcagtgacca aacaggaaaa aaccgccctt 780
aacatggccc gctttatcag aagccagaca ttaacgcttc tggagaaact caacgagctg 840
gacgcggatg aacaggcaga catctgtgaa tcgcttcacg accacgctga tgagctttac 900
cgcagctgcc tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg 960
gagacggtca cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg 1020
tcagcgggtg ttggcgggtg tcggggcgca gccatgaccc agtcacgtag cgatagcgga 1080
gtgtatactg gcttaactat gcggcatcag agcagattgt actgagagtg caccatatat 1140
gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc 1200
ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 1260
ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg 1320
agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca 1380
taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa 1440
cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc 1500
tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc 1560
gctttctcat agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct 1620
gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg 1680
tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag 1740
gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta 1800
cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg 1860
aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt 1920
tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt 1980
ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag 2040
attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat 2100
ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc 2160
tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat 2220
aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc 2280
acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag 2340
aagtggtcct gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag 2400
agtaagtagt tcgccagtta atagtttgcg caacgttgtt gccattgctg caggcatcgt 2460
ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg 2520
agttacatga tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt 2580
tgtcagaagt aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc 2640
tcttactgtc atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc 2700
attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa 2760
taccgcgcca catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg 2820
aaaactctca aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc 2880
caactgatct tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag 2940
gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt 3000
cctttttcaa tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt 3060
tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc 3120
acctgaaatt gtaaacgtta atattttgtt aaaattcgcg ttaaattttt gttaaatcag 3180
ctcatttttt aaccaatagg ccgaaatcgg caaaatccct tataaatcaa aagaatagac 3240
cgagataggg ttgagtgttg ttccagtttg gaacaagagt ccactattaa agaacgtgga 3300
ctccaacgtc aaagggcgaa aaaccgtcta tcagggcgat ggcccactac gtgaaccatc 3360
accctaatca agttttttgg ggtcgaggtg ccgtaaagca ctaaatcgga accctaaagg 3420
gagcccccga tttagagctt gacggggaaa gccggcgaac gtggcgagaa aggaagggaa 3480
gaaagcgaaa ggagcgggcg ctagggcgct ggcaagtgta gcggtcacgc tgcgcgtaac 3540
caccacaccc gccgcgctta atgcgccgct acagggcgcg tcccattcgc ca 3592
<210> 38
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 38
tacccatacg acgttccaga ctacgcc 27
<210> 39
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 39
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
1 5
<210> 40
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 40
gaacaaaagt taatttctga agaagatttg gaa 33
<210> 41
<211> 10
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 41
Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu
1 5 10
<210> 42
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 42
gactacaagg atgacgatga caaa 24
<210> 43
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 43
Asp Tyr Lys Asp Asp Asp Asp Lys
1 5
<210> 44
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 44
ggtaagccaa ttccaaatcc tttgttgggt ttggactcca cc 42
<210> 45
<211> 14
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 45
Gly Lys Pro Ile Pro Asn Pro Leu Leu Gly Leu Asp Ser Thr
1 5 10
<210> 46
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 46
catcatcatc atcatcat 18
<210> 47
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 合成构建体
<400> 47
His His His His His His
1 5
<210> 48
<211> 1089
<212> DNA
<213> 古巴裸盖菇
<400> 48
atggcgttcg atctcaagac tgaagacggc ctcatcacat atctcactaa acatctttct 60
ttggacgtcg acacgagcgg agtgaagcgc cttagcggag gctttgtcaa tgtaacctgg 120
cgcattaagc tcaatgctcc ttatcaaggt catacgagca tcatcctgaa gcatgctcag 180
ccgcacatgt ctacggatga ggattttaag ataggtgtag aacgttcggt ttacgaatac 240
caggctatca agctcatgat ggccaatcgg gaggttctgg gaggcgtgga tggcatagtt 300
tctgtgccag aaggcctgaa ctacgactta gagaataatg cattgatcat gcaagatgtc 360
gggaagatga agaccctttt agattatgtc accgccaaac cgccacttgc gacggatata 420
gcccgccttg ttgggacaga aattgggggg ttcgttgcca gactccataa cataggccgc 480
gagaggcgag acgatcctga gttcaaattc ttctctggaa atattgtcgg aaggacgact 540
tcagaccagc tgtatcaaac catcataccc aacgcagcga aatatggcgt cgatgacccc 600
ttgctgccta ctgtggttaa ggaccttgtg gacgatgtca tgcacagcga agagaccctt 660
gtcatggcgg acctgtggag tggaaatatt cttctccagt tggaggaggg aaacccatcg 720
aagctgcaga agatatatat cctggattgg gaactttgca agtacggccc agcgtcgttg 780
gacctgggct atttcttggg tgactgctat ttgatatccc gctttcaaga cgagcaggtc 840
ggtacgacga tgcggcaagc ctacttgcaa agctatgcgc gtacgagcaa gcattcgatc 900
aactacgcca aagtcactgc aggtattgct gctcatattg tgatgtggac cgactttatg 960
cagtggggga gcgaggaaga aaggataaat tttgtgaaaa agggggtagc tgcctttcac 1020
gacgccaggg gcaacaacga caatggggaa attacgtcta ccttactgaa ggaatcatcc 1080
actgcgtaa 1089
<210> 49
<211> 362
<212> PRT
<213> 古巴裸盖菇
<400> 49
Met Ala Phe Asp Leu Lys Thr Glu Asp Gly Leu Ile Thr Tyr Leu Thr
1 5 10 15
Lys His Leu Ser Leu Asp Val Asp Thr Ser Gly Val Lys Arg Leu Ser
20 25 30
Gly Gly Phe Val Asn Val Thr Trp Arg Ile Lys Leu Asn Ala Pro Tyr
35 40 45
Gln Gly His Thr Ser Ile Ile Leu Lys His Ala Gln Pro His Met Ser
50 55 60
Thr Asp Glu Asp Phe Lys Ile Gly Val Glu Arg Ser Val Tyr Glu Tyr
65 70 75 80
Gln Ala Ile Lys Leu Met Met Ala Asn Arg Glu Val Leu Gly Gly Val
85 90 95
Asp Gly Ile Val Ser Val Pro Glu Gly Leu Asn Tyr Asp Leu Glu Asn
100 105 110
Asn Ala Leu Ile Met Gln Asp Val Gly Lys Met Lys Thr Leu Leu Asp
115 120 125
Tyr Val Thr Ala Lys Pro Pro Leu Ala Thr Asp Ile Ala Arg Leu Val
130 135 140
Gly Thr Glu Ile Gly Gly Phe Val Ala Arg Leu His Asn Ile Gly Arg
145 150 155 160
Glu Arg Arg Asp Asp Pro Glu Phe Lys Phe Phe Ser Gly Asn Ile Val
165 170 175
Gly Arg Thr Thr Ser Asp Gln Leu Tyr Gln Thr Ile Ile Pro Asn Ala
180 185 190
Ala Lys Tyr Gly Val Asp Asp Pro Leu Leu Pro Thr Val Val Lys Asp
195 200 205
Leu Val Asp Asp Val Met His Ser Glu Glu Thr Leu Val Met Ala Asp
210 215 220
Leu Trp Ser Gly Asn Ile Leu Leu Gln Leu Glu Glu Gly Asn Pro Ser
225 230 235 240
Lys Leu Gln Lys Ile Tyr Ile Leu Asp Trp Glu Leu Cys Lys Tyr Gly
245 250 255
Pro Ala Ser Leu Asp Leu Gly Tyr Phe Leu Gly Asp Cys Tyr Leu Ile
260 265 270
Ser Arg Phe Gln Asp Glu Gln Val Gly Thr Thr Met Arg Gln Ala Tyr
275 280 285
Leu Gln Ser Tyr Ala Arg Thr Ser Lys His Ser Ile Asn Tyr Ala Lys
290 295 300
Val Thr Ala Gly Ile Ala Ala His Ile Val Met Trp Thr Asp Phe Met
305 310 315 320
Gln Trp Gly Ser Glu Glu Glu Arg Ile Asn Phe Val Lys Lys Gly Val
325 330 335
Ala Ala Phe His Asp Ala Arg Gly Asn Asn Asp Asn Gly Glu Ile Thr
340 345 350
Ser Thr Leu Leu Lys Glu Ser Ser Thr Ala
355 360
<210> 50
<211> 6379
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 50
cgagatcttt gtgttcggtt acccggctca gatcctaact tcttcttttg gtatgtttat 60
tcgtataagt tactgttgtc cacaggcaat actctgcaga aaattaaaac ggcattaatg 120
ctaggacaac cagaattgtt actactgtat gtgcgatagt tgataactgc aacattatgc 180
ccggtatatt ctcaaaaaac cctattactg catacgaaga aatcgcaaga gaaatctttc 240
ggtttggaaa agctcactgt gaggttcctt ggagccaata gtaatacagc acaatccaag 300
gaaaaatctg gcctatatgc aaggaaggag agatagtcaa aagcattctt tcccctagaa 360
gttggtgcat atatggcatc gttaaaacat attaccccca aaatttcttc tctaaacgat 420
gtgcttggcc tttgttttgg tttttgatgt cggtcgtttg aggccccttg cggaaaatcg 480
agatcgccga atggcacgcg agggaaggga aataaggttt aaaggcactg aaacaatagg 540
caagaagtag gcgagagccg acatacgaga ctaaattaag tcctcagcga gctcgcatgg 600
aatgcgtgcg atgagcgacc tcatgctata cctgagaaag caacctgacc tacaggaaag 660
agttactcaa gaataagaat tttcgtttta aaacctaaga gtcactttaa aatttgtata 720
cacttatttt ttttataact tatttaataa taaaaatcat aaatcataag aaattcgctt 780
atttagaagt gtcaacaacg tatctaccaa cggaatgcgt gcgattcatt tgtcatcgtc 840
atccttgtag tcttcagcaa cacatgggta tgaaatagaa acttcttcag ccaatgcttt 900
aatcttcatc atgatttgca acatttcttc agttgtagtt cttggattaa ttgaacacaa 960
tctaataaca accttttcct tcaattctgt agtagataac atagcgaaac ctctatgtgt 1020
gatttcctta accaatttct tattaatttc attaatagta tctgttgatg ccaattcaga 1080
tggaatgtat ctaaaagtaa cgatacccaa ttgagctggt gtaacaactt cccaatcttt 1140
tgctttaccc aaaaatgctt caacttgttc tgctaacatg ataccatgat cgattgcttg 1200
tctaaaagca gcaacaccga aaactttaaa agacaaccaa accttcaaag ctctgaatct 1260
tcttgacaat tcgataccac attcaccgaa attaatttca ccttcaacgt tagtttctga 1320
atccttgatg tattctggca tcattctaaa agtctttgac aaatattgag agtttctgat 1380
caaaacacaa ccaacatcgt atggttggaa caaccactta tgtggatcta aagtcaaaga 1440
atctgctcta tgaatacctt gcaacatagc tgaacccttt tcagacaaga tagctggagc 1500
accataagaa ccatcagcat gcaaccaaac atcttcatcg ttacacaaat ctgctaattc 1560
gttcaaagaa tcaacagcac cacaatttgt agtaccagca tttgcaataa cacagaatgg 1620
ctttttaccc ttagttctat cttctttaat ttgtttcttc aaagctgaaa cagagattct 1680
caaatgttca tctgtttcga ttctacagat ttgatgatgt ttaaaaccta aaaccttcaa 1740
tgctctatca actgagaaat gtgtttgatc agagaagtaa acaacagcat tttcgatatc 1800
gttgttcaac ttagcctgtc ttgcaacagt caaagctgtc aaatttgcca ttgaaccacc 1860
agaaacaaat aaaccttcag ctgaatctgg aaaacccaac atagatttca accaattaat 1920
tgtagtcaat tcgatttgtt cagcacctgc accagcaatc catgcagttg gaaaaacatt 1980
aaaaccagaa gccaagaaat ctgcaacaac accaacgtaa ttatttggac ctggaacaaa 2040
agccaagaaa tgtggatgat caacatgtgt aatttgatta aaaacgtttc tgttcaagaa 2100
atgcaacaat tcctttggat ctgaaccatt ttctgggata gattcagtca acttatttct 2160
caagatatca gaatcgattg tttctgaaac tggcttagac ttcaaatggt tcatgtgatc 2220
gatgatcaaa tcaactgctt ggtaacccaa ttgtctcatt tcttcagctg acaattgcaa 2280
attttcagac attgttttat atttgttgta aaaagtagat aattacttcc ttgatgatct 2340
gtaaaaaaga gaaaaagaaa gcatctaaga acttgaaaaa ctacgaatta gaaaagacca 2400
aatatgtatt tcttgcattg accaatttat gcaagtttat atatatgtaa atgtaagttt 2460
cacgaggttc tactaaacta aaccaccccc ttggttagaa gaaaagagtg tgtgagaaca 2520
ggctgttgtt gtcacacgat tcggacaatt ctgtttgaaa gagagagagt aacagtacga 2580
tcgaacgaac tttgctctgg agatcacagt gggcatcata gcatgtggta ctaaaccctt 2640
tcccgccatt ccagaacctt cgattgcttg ttacaaaacc tgtgagccgt cgctaggacc 2700
ttgttgtgtg acgaaattgg aagctgcaat caataggaag acaggaagtc gagcgtgtct 2760
gggttttttc agttttgttc tttttgcaaa caacagttta ttcctggcat ccactaaata 2820
taatggagcc cgctttttaa gctggcatcc agaaaaaaaa agaatcccag caccaaaata 2880
ttgttttctt caccaaccat cagttcatag gtccattctc ttagcgcaac tacagagaac 2940
aggggcacaa acaggcaaaa aacgggcaca acctcaatgg agtgatgcaa cctgcctgga 3000
gtaaatgatg acacaaggca attgacccac gcatgtatct atctcatttt cttacacctt 3060
ctattacctt ctgctctctc tgatttggaa aaagctgaaa aaaaaggttg aaaccagttc 3120
cctgaaatta ttcccctact tgactaataa gtatataaag acggtaggta ttgattgtaa 3180
ttctgtaaat ctatttctta aacttcttaa attctacttt tatagttagt ctttttttta 3240
gttttaaaac accaagaact tagtttcgaa taaacacaca taaacaaaca aaatggcttc 3300
tagttcttcc gatgtcttcg ttttgggtct aggtgttgtt ttggctgcct tgtatatctt 3360
cagagaccaa ttattcgctg cttctaagcc aaaggtggct ccagtttcca ctacgaagcc 3420
tgccaacggt tccgctaacc caagagactt catcgccaag atgaaacaag gtaagaagag 3480
aatcgtaatc ttctacggtt ctcaaactgg taccgctgaa gaatatgcta ttcgtttggc 3540
taaggaagct aagcaaaagt tcggtctagc ctccttggtt tgtgatccag aagaatacga 3600
ttttgaaaag ttggaccaat tgccagaaga ttctattgct ttcttcgtcg ttgctaccta 3660
tggtgaaggt gaacctacag acaacgctgt ccaattgttg caaaacttgc aagatgaaag 3720
cttcgaattc tcctctggtg agagaaagtt gtcaggtttg aagtacgttg tttttggtct 3780
gggtaacaag acctacgaac attacaacct cattgggaga actgttgacg ctcaattggc 3840
caagatgggt gctatcagaa tcggtgaaag aggtgaaggt gatgatgaca agtccatgga 3900
agaagactac ttggaatgga aggatggtat gtgggaagcg tttgccactg ctatgggtgt 3960
tgaagaaggt caaggtggtg actccgctga tttcgtcgtt tccgaattgg aatctcaccc 4020
accagaaaag gtttaccaag gtgaattttc tgctagagct ttaaccaaaa ccaagggtat 4080
tcacgacgct aagaatcctt ttgctgctcc aattgcggtt gctagagaat tgttccaatc 4140
tgttgtcgat agaaactgtg tccacgtcga attcaacatt gaaggctctg gtatcaccta 4200
tcaacacggt gaccacgttg gtttgtggcc attgaatcca gatgttgaag tcgaacggtt 4260
gttgtgtgtt ttaggtttag ctgaaaagag agatgctgtc atctccattg aatccttaga 4320
cccggctttg gctaaggttc cattcccagt cccaactact tacggtgctg tgttgagaca 4380
ctacattgac atctctgctg tcgccggtag acaaatcttg ggtactttgt ccaaattcgc 4440
tccaacccca gaagctgaag ctttcttgag aaacttgaac actaacaagg aagaatacca 4500
caacgtcgtc gctaacggtt gtttgaaatt gggtgaaatt ttgcaaatcg ctaccggtaa 4560
cgacattact gtcccaccaa ctactgccaa caccaccaaa tggccaattc cattcgacat 4620
cattgtttct gccatcccaa gattgcaacc aagatactac tctatctctt cttccccaaa 4680
aattcatcca aacaccatcc acgctaccgt tgttgtgctc aaatacgaaa acgttccaac 4740
cgaaccaatc ccaagaaagt gggtttacgg tgtcggtagt aacttcttgt tgaatttaaa 4800
gtacgctgtt aacaaggaac cagttccata catcactcaa aatggcgaac aaagagtcgg 4860
tgtcccggaa tacttgattg ctggtccacg tggttcttac aagactgaat ctttctacaa 4920
ggctccaatc catgttagac gttctacttt ccgtttgcca accaacccaa agtctccagt 4980
catcatgatt ggtccaggta ctggtgtcgc cccattcaga ggcttcgttc aagaaagagt 5040
tgccttggcc agaagatcca tcgaaaagaa cggtcctgac tctttggctg actggggtcg 5100
tatttccttg ttctacggtt gtagaagatc cgacgaagac ttcttgtaca aggacgaatg 5160
gccacaatac gaagctgagt tgaagggtaa gttcaagttg cactgtgctt tctccagaca 5220
aaactacaag ccagacggtt ctaagattta cgtccaagat ttgatctggg aagacagaga 5280
acacattgcc gatgccatct taaacggtaa gggttacgtc tacatctgcg gtgaagctaa 5340
gtccatgtct aaacaagttg aagaagttct agccaagatc ttgggcgaag ccaaaggtgg 5400
ttccggtcca gttgaaggtg ttgctgaagt caagttactg aaggaacggt ccagattgat 5460
gttggatgtc tggtctgaac aaaagttaat ttctgaagaa gatttggaat gaatcgcgtg 5520
cattcatccg ctctaaccga aaaggaagga gttagacaac ctgaagtcta ggtccctatt 5580
tattttttta tagttatgtt agtattaaga acgttattta tatttcaaat ttttcttttt 5640
tttctgtaca gacgcgtgta cgcatgtaac attatactga aaaccttgct tgagaaggtt 5700
ttgggacgct cgaagatcgc gtcccaattc gccctatagt gagtcgtatt acgcgcgctc 5760
actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc ctgcaggact 5820
agtgctgagg cattaatacc acttttcaat gaaacggata ttgatatgct agtaaaagga 5880
cgagctcaag agcgaaaata taagtaaaga attcgagtgc acttgtctcc atgcagcaag 5940
atttcatatg agtctttttt atctttttac tttttacatt acacgatatg cactttatga 6000
aaatttaacg aggttggaag ccggataatc aaccaaaatc aggcacgaag gcacactcgt 6060
atatgcatgt tgttgaaact ctgttacgct gaactaacaa tcacacatgt agaggtcacc 6120
gggaaaagtt gcgaccccat ggaaggtcga tctcttcgtt tggctttgct tggctggcgg 6180
cattgcgctt cttcgcttat acccgtctct tgacgctcga gctcgttcat tgagatacct 6240
ttattcttgc acattttctg gcttttttcg ctactcgggt acatgtaatc atgcacacag 6300
aaggtgctgt agggtgaaag ttcctttgtg ctgtcgtttg tttttaatgc caaactttcc 6360
ggtgatcaat aaccacctc 6379
<210> 51
<211> 3840
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 51
cggcatgcaa acatctacac aattagcaag ggcaatccat attttgtctt ttcgcgccct 60
ggaaaggcct aagtaatgtc gtaaacgcat tctatctgta cttcaactct cctctgtgca 120
ttggtttgtg caaatcacat tttacgatac tgccagatat atgcaaaaag agaaaaccaa 180
gggaccagaa caaagcaaaa ttacgatatt cttcgaattc cttcgtgctt gactaagaca 240
aagggatgga cgtagcgatt tttagcgggc caagaactgg ttccgaaaaa gcacaggtac 300
accgaaccct cagctaagga gggacagcac cgatgcggaa ggacaaactt tctttttgcc 360
tatcacagta tcttatcgag ctaactattt tcgacacaca tgaaaaagca gaaatattaa 420
cgaaaaagaa aagaaagacc atgtcatgta cgggcaatca gaatctgtaa caagcgccat 480
ttttttttct gtatcgggcc ctccttactg ctctccttcc gtgtaacgcg ttatgaaatt 540
aagtcctcag cgagctcgca tggaatgcgt gcgatgagcg acctcatgct atacctgaga 600
aagcaacctg acctacagga aagagttact caagaataag aattttcgtt ttaaaaccta 660
agagtcactt taaaatttgt atacacttat tttttttata acttatttaa taataaaaat 720
cataaatcat aagaaattcg cttatttaga agtgtcaaca acgtatctac caacggaatg 780
cgtgcgattg ttttatattt gttgtaaaaa gtagataatt acttccttga tgatctgtaa 840
aaaagagaaa aagaaagcat ctaagaactt gaaaaactac gaattagaaa agaccaaata 900
tgtatttctt gcattgacca atttatgcaa gtttatatat atgtaaatgt aagtttcacg 960
aggttctact aaactaaacc acccccttgg ttagaagaaa agagtgtgtg agaacaggct 1020
gttgttgtca cacgattcgg acaattctgt ttgaaagaga gagagtaaca gtacgatcga 1080
acgaactttg ctctggagat cacagtgggc atcatagcat gtggtactaa accctttccc 1140
gccattccag aaccttcgat tgcttgttac aaaacctgtg agccgtcgct aggaccttgt 1200
tgtgtgacga aattggaagc tgcaatcaat aggaagacag gaagtcgagc gtgtctgggt 1260
tttttcagtt ttgttctttt tgcaaacaac agtttattcc tggcatccac taaatataat 1320
ggagcccgct ttttaagctg gcatccagaa aaaaaaagaa tcccagcacc aaaatattgt 1380
tttcttcacc aaccatcagt tcataggtcc attctcttag cgcaactaca gagaacaggg 1440
gcacaaacag gcaaaaaacg ggcacaacct caatggagtg atgcaacctg cctggagtaa 1500
atgatgacac aaggcaattg acccacgcat gtatctatct cattttctta caccttctat 1560
taccttctgc tctctctgat ttggaaaaag ctgaaaaaaa aggttgaaac cagttccctg 1620
aaattattcc cctacttgac taataagtat ataaagacgg taggtattga ttgtaattct 1680
gtaaatctat ttcttaaact tcttaaattc tacttttata gttagtcttt tttttagttt 1740
taaaacacca agaacttagt ttcgaataaa cacacataaa caaacaaaat gggaggtccg 1800
atgagcggtt tccattcggg ggaggcgctg ctcggtgacc tcgccaccgg tcagctgacc 1860
aggctgtgcg aggtggcggg gctgaccgag gccgacacgg cggcctacac gggggtgctg 1920
atcgaaagtc tggggacgtc ggccggacgg ccgttgtccc tgccaccccc gtcgcggacc 1980
tttctctccg acgaccacac ccccgtggag ttctccctgg ccttcctgcc gggacgcgca 2040
ccgcacctgc gggtcctggt ggaaccgggc tgctccagcg gcgacgacct ggcggaaaac 2100
ggccgggccg gtctgcgggc ggtccacacc atggcggacc gctggggatt ctccaccgag 2160
caactcgacc ggctggagga cctgttcttc ccctcctccc ccgagggccc gctggccctg 2220
tggtgcgccc tggagctccg ctccggtggg gtgccggggg tgaaggtcta cctcaacccc 2280
gcggcgaatg gcgccgaccg ggccgccgag acggtacgcg aggcgctggc caggctgggc 2340
cacctgcagg cgttcgacgc gctgccccgg gcggacggct tcccgttcct cgccctggac 2400
ctcggcgact gggacgcccc gcgggtgaag atctacctca aacacctcgg catgtccgcc 2460
gccgacgcgg gctccctccc ccggatgtcg cccgcaccga gccgggagca gctggaggag 2520
ttcttccgca ccgccggtga cctcccggcc ccgggagacc cggggcccac cgaggacacc 2580
ggccggctcg ccgggcgccc cgccctcacc tgccactcct tcacggagac ggcgaccggg 2640
cggcccagcg gctacaccct ccacgtgccg gtccgcgact acgtccggca cgacggcgag 2700
gcacgggacc gggcggtggc cgtgctgcgc gaacatgaca tggacagtgc ggcactggac 2760
cgggcgctgg ccgccgtgag cccccgcccg ctgagtgacg gggtgggcct gatcgcctat 2820
ctggcactgg tccaccagcg cggccggccg acacgggtga ccgtctacgt ctcctccgag 2880
gcgtacgagg tgcggccgcc ccgcgagacg gtccccaccc gcgaccgggc gcgggcacgg 2940
ctgcatcatc atcatcatca ttgaatcgcg tgcattcatc cgctctaacc gaaaaggaag 3000
gagttagaca acctgaagtc taggtcccta tttatttttt tatagttatg ttagtattaa 3060
gaacgttatt tatatttcaa atttttcttt tttttctgta cagacgcgtg tacgcatgta 3120
acattatact gaaaaccttg cttgagaagg ttttgggacg ctcgaagatc gcgtcccaat 3180
tcgccctata gtgagtcgta ttacgcgcgc tcactggccg tcgttttaca acgtcgtgac 3240
tgggaaaacc ctggcgttac ccctgcagga ctagtgctga ggcattaata cgactctctc 3300
gaaatttttc ttaacgcgtc cttgtactgc gtctaacgct tttgccactt ggatttctat 3360
tataggaaat agtctcactt actgggcgac gaattttcgc gttttgatga agcacaggaa 3420
gaatttcttt tttttttggc ttcttctggt tccgtttttt acgcgcacaa atctaaaaaa 3480
agaaataatt ataacctagt ctcgaaaatt ttcatcgatc cattcgttcc tttttttcga 3540
ttttttcaga tcaaaattct tgtttctttc tttgtcttag tttatattaa aagatatttt 3600
gattttactc ctgaactatt tattctttct aagaaggcca gaacactaca gctgttttaa 3660
ccgactacga agttctccat tctcgaacac tagccttcat ttaccaaaca ggaactagcg 3720
tatatcatta gtccttattc gaaaagagat tggtagatat ttattgtagt ttgtgagaag 3780
gagaaaatac tgtcattgga ctgatagtta gaggacatta acctctctta cgttcgctca 3840
<210> 52
<211> 6190
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 52
cgagatcttt gtgttcggtt acccggctca gatcctaact tcttcttttg gtatgtttat 60
tcgtataagt tactgttgtc cacaggcaat actctgcaga aaattaaaac ggcattaatg 120
ctaggacaac cagaattgtt actactgtat gtgcgatagt tgataactgc aacattatgc 180
ccggtatatt ctcaaaaaac cctattactg catacgaaga aatcgcaaga gaaatctttc 240
ggtttggaaa agctcactgt gaggttcctt ggagccaata gtaatacagc acaatccaag 300
gaaaaatctg gcctatatgc aaggaaggag agatagtcaa aagcattctt tcccctagaa 360
gttggtgcat atatggcatc gttaaaacat attaccccca aaatttcttc tctaaacgat 420
gtgcttggcc tttgttttgg tttttgatgt cggtcgtttg aggccccttg cggaaaatcg 480
agatcgccga atggcacgcg agggaaggga aataaggttt aaaggcactg aaacaatagg 540
caagaagtag gcgagagccg acatacgaga ctaaattaag tcctcagcga gctcgcatgg 600
aatgcgtgcg atgagcgacc tcatgctata cctgagaaag caacctgacc tacaggaaag 660
agttactcaa gaataagaat tttcgtttta aaacctaaga gtcactttaa aatttgtata 720
cacttatttt ttttataact tatttaataa taaaaatcat aaatcataag aaattcgctt 780
atttagaagt gtcaacaacg tatctaccaa cggaatgcgt gcgattcatt tgtcatcgtc 840
atccttgtag tccattgcct tcaaatgttc cttattaaac tttctcaaat cgtaaaccaa 900
agagttcaag atatccaatt caacatgttc cataacaacg atcttgtacc agttgttagt 960
tgggttatga acttctggaa ctaaaaagta cttttcagcg atttccttat taacatattg 1020
ttcttcaatt gtaacaatat tcattgaatc ttctttgtaa tatttaattc tcatatcgtt 1080
caattgctta cacaaccatt tagttctatt tctcaactta ttaatctttt ccatccaacc 1140
gtatggacca taagaagcta aaaccatcca aattgcaaca gcatttgaac cagatcttga 1200
accagacaat gtaacatcca aattttcgat gtaagttgct tcctttgtca aagtgttatg 1260
gatcaaattc tttcttgaaa cgaagatacc agtaccgtat ggagcttgca acatcttatg 1320
accatctaat gtgattgaag aaacgttctt attagagaaa tcagttttac attccttatt 1380
atcaattgga tatataaaac caccaaatgc accatcaaca tgaattttgt attccaaatt 1440
gtacttatcg aagatgttag cgtacaaatc tggatcatca actgaaccaa acattgtagt 1500
acccatgtta gagataacga tgaagtactt tttaccaatt tctttagctt ctttaacaat 1560
tgaatccaat gtattttctt gaatttttct tgaataaaaa tcaactggaa ccttaataat 1620
atcgatgttc aacaaatctg aacctttgta tgcagagtaa tgtgtatctg ctgaagtgat 1680
gatagcgatt tcttcatgct tagcctttct ttctttcttg aagtagtttc tgtaaaccca 1740
cattgcttgg atgttagctt ctgtaccacc ttgagtaacg taaccatcaa attcttcatc 1800
gttaccgttc aaaacatcga ttgctaacaa ttggattaat tctctttcga tatcgaatgt 1860
accaccgaac aagatatcag ccttatcata agtatgacaa ccgatatggt ttgggttttg 1920
aataaaagtt ctcaagtatg gtgaatgctt aacgaaagaa tgatcatcat agaaaactgt 1980
atcatccaac ttagtacctg gaataccgat tgtcttagtg ttatcgtagt tcaaagtctt 2040
ttccaaagat tcagtaatct tttcatccat ttcttgttgt gtgtactttc tccagaactt 2100
cattgtttta tatttgttgt aaaaagtaga taattacttc cttgatgatc tgtaaaaaag 2160
agaaaaagaa agcatctaag aacttgaaaa actacgaatt agaaaagacc aaatatgtat 2220
ttcttgcatt gaccaattta tgcaagttta tatatatgta aatgtaagtt tcacgaggtt 2280
ctactaaact aaaccacccc cttggttaga agaaaagagt gtgtgagaac aggctgttgt 2340
tgtcacacga ttcggacaat tctgtttgaa agagagagag taacagtacg atcgaacgaa 2400
ctttgctctg gagatcacag tgggcatcat agcatgtggt actaaaccct ttcccgccat 2460
tccagaacct tcgattgctt gttacaaaac ctgtgagccg tcgctaggac cttgttgtgt 2520
gacgaaattg gaagctgcaa tcaataggaa gacaggaagt cgagcgtgtc tgggtttttt 2580
cagttttgtt ctttttgcaa acaacagttt attcctggca tccactaaat ataatggagc 2640
ccgcttttta agctggcatc cagaaaaaaa aagaatccca gcaccaaaat attgttttct 2700
tcaccaacca tcagttcata ggtccattct cttagcgcaa ctacagagaa caggggcaca 2760
aacaggcaaa aaacgggcac aacctcaatg gagtgatgca acctgcctgg agtaaatgat 2820
gacacaaggc aattgaccca cgcatgtatc tatctcattt tcttacacct tctattacct 2880
tctgctctct ctgatttgga aaaagctgaa aaaaaaggtt gaaaccagtt ccctgaaatt 2940
attcccctac ttgactaata agtatataaa gacggtaggt attgattgta attctgtaaa 3000
tctatttctt aaacttctta aattctactt ttatagttag tctttttttt agttttaaaa 3060
caccaagaac ttagtttcga ataaacacac ataaacaaac aaaatggctt ctagttcttc 3120
cgatgtcttc gttttgggtc taggtgttgt tttggctgcc ttgtatatct tcagagacca 3180
attattcgct gcttctaagc caaaggtggc tccagtttcc actacgaagc ctgccaacgg 3240
ttccgctaac ccaagagact tcatcgccaa gatgaaacaa ggtaagaaga gaatcgtaat 3300
cttctacggt tctcaaactg gtaccgctga agaatatgct attcgtttgg ctaaggaagc 3360
taagcaaaag ttcggtctag cctccttggt ttgtgatcca gaagaatacg attttgaaaa 3420
gttggaccaa ttgccagaag attctattgc tttcttcgtc gttgctacct atggtgaagg 3480
tgaacctaca gacaacgctg tccaattgtt gcaaaacttg caagatgaaa gcttcgaatt 3540
ctcctctggt gagagaaagt tgtcaggttt gaagtacgtt gtttttggtc tgggtaacaa 3600
gacctacgaa cattacaacc tcattgggag aactgttgac gctcaattgg ccaagatggg 3660
tgctatcaga atcggtgaaa gaggtgaagg tgatgatgac aagtccatgg aagaagacta 3720
cttggaatgg aaggatggta tgtgggaagc gtttgccact gctatgggtg ttgaagaagg 3780
tcaaggtggt gactccgctg atttcgtcgt ttccgaattg gaatctcacc caccagaaaa 3840
ggtttaccaa ggtgaatttt ctgctagagc tttaaccaaa accaagggta ttcacgacgc 3900
taagaatcct tttgctgctc caattgcggt tgctagagaa ttgttccaat ctgttgtcga 3960
tagaaactgt gtccacgtcg aattcaacat tgaaggctct ggtatcacct atcaacacgg 4020
tgaccacgtt ggtttgtggc cattgaatcc agatgttgaa gtcgaacggt tgttgtgtgt 4080
tttaggttta gctgaaaaga gagatgctgt catctccatt gaatccttag acccggcttt 4140
ggctaaggtt ccattcccag tcccaactac ttacggtgct gtgttgagac actacattga 4200
catctctgct gtcgccggta gacaaatctt gggtactttg tccaaattcg ctccaacccc 4260
agaagctgaa gctttcttga gaaacttgaa cactaacaag gaagaatacc acaacgtcgt 4320
cgctaacggt tgtttgaaat tgggtgaaat tttgcaaatc gctaccggta acgacattac 4380
tgtcccacca actactgcca acaccaccaa atggccaatt ccattcgaca tcattgtttc 4440
tgccatccca agattgcaac caagatacta ctctatctct tcttccccaa aaattcatcc 4500
aaacaccatc cacgctaccg ttgttgtgct caaatacgaa aacgttccaa ccgaaccaat 4560
cccaagaaag tgggtttacg gtgtcggtag taacttcttg ttgaatttaa agtacgctgt 4620
taacaaggaa ccagttccat acatcactca aaatggcgaa caaagagtcg gtgtcccgga 4680
atacttgatt gctggtccac gtggttctta caagactgaa tctttctaca aggctccaat 4740
ccatgttaga cgttctactt tccgtttgcc aaccaaccca aagtctccag tcatcatgat 4800
tggtccaggt actggtgtcg ccccattcag aggcttcgtt caagaaagag ttgccttggc 4860
cagaagatcc atcgaaaaga acggtcctga ctctttggct gactggggtc gtatttcctt 4920
gttctacggt tgtagaagat ccgacgaaga cttcttgtac aaggacgaat ggccacaata 4980
cgaagctgag ttgaagggta agttcaagtt gcactgtgct ttctccagac aaaactacaa 5040
gccagacggt tctaagattt acgtccaaga tttgatctgg gaagacagag aacacattgc 5100
cgatgccatc ttaaacggta agggttacgt ctacatctgc ggtgaagcta agtccatgtc 5160
taaacaagtt gaagaagttc tagccaagat cttgggcgaa gccaaaggtg gttccggtcc 5220
agttgaaggt gttgctgaag tcaagttact gaaggaacgg tccagattga tgttggatgt 5280
ctggtctgaa caaaagttaa tttctgaaga agatttggaa tgaatcgcgt gcattcatcc 5340
gctctaaccg aaaaggaagg agttagacaa cctgaagtct aggtccctat ttattttttt 5400
atagttatgt tagtattaag aacgttattt atatttcaaa tttttctttt ttttctgtac 5460
agacgcgtgt acgcatgtaa cattatactg aaaaccttgc ttgagaaggt tttgggacgc 5520
tcgaagatcg cgtcccaatt cgccctatag tgagtcgtat tacgcgcgct cactggccgt 5580
cgttttacaa cgtcgtgact gggaaaaccc tggcgttacc cctgcaggac tagtgctgag 5640
gcattaatac cacttttcaa tgaaacggat attgatatgc tagtaaaagg acgagctcaa 5700
gagcgaaaat ataagtaaag aattcgagtg cacttgtctc catgcagcaa gatttcatat 5760
gagtcttttt tatcttttta ctttttacat tacacgatat gcactttatg aaaatttaac 5820
gaggttggaa gccggataat caaccaaaat caggcacgaa ggcacactcg tatatgcatg 5880
ttgttgaaac tctgttacgc tgaactaaca atcacacatg tagaggtcac cgggaaaagt 5940
tgcgacccca tggaaggtcg atctcttcgt ttggctttgc ttggctggcg gcattgcgct 6000
tcttcgctta tacccgtctc ttgacgctcg agctcgttca ttgagatacc tttattcttg 6060
cacattttct ggcttttttc gctactcggg tacatgtaat catgcacaca gaaggtgctg 6120
tagggtgaaa gttcctttgt gctgtcgttt gtttttaatg ccaaactttc cggtgatcaa 6180
taaccacctc 6190
<210> 53
<211> 4101
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 53
cggcatgcaa acatctacac aattagcaag ggcaatccat attttgtctt ttcgcgccct 60
ggaaaggcct aagtaatgtc gtaaacgcat tctatctgta cttcaactct cctctgtgca 120
ttggtttgtg caaatcacat tttacgatac tgccagatat atgcaaaaag agaaaaccaa 180
gggaccagaa caaagcaaaa ttacgatatt cttcgaattc cttcgtgctt gactaagaca 240
aagggatgga cgtagcgatt tttagcgggc caagaactgg ttccgaaaaa gcacaggtac 300
accgaaccct cagctaagga gggacagcac cgatgcggaa ggacaaactt tctttttgcc 360
tatcacagta tcttatcgag ctaactattt tcgacacaca tgaaaaagca gaaatattaa 420
cgaaaaagaa aagaaagacc atgtcatgta cgggcaatca gaatctgtaa caagcgccat 480
ttttttttct gtatcgggcc ctccttactg ctctccttcc gtgtaacgcg ttatgaaatt 540
aagtcctcag cgagctcgca tggaatgcgt gcgatgagcg acctcatgct atacctgaga 600
aagcaacctg acctacagga aagagttact caagaataag aattttcgtt ttaaaaccta 660
agagtcactt taaaatttgt atacacttat tttttttata acttatttaa taataaaaat 720
cataaatcat aagaaattcg cttatttaga agtgtcaaca acgtatctac caacggaatg 780
cgtgcgattg ttttatattt gttgtaaaaa gtagataatt acttccttga tgatctgtaa 840
aaaagagaaa aagaaagcat ctaagaactt gaaaaactac gaattagaaa agaccaaata 900
tgtatttctt gcattgacca atttatgcaa gtttatatat atgtaaatgt aagtttcacg 960
aggttctact aaactaaacc acccccttgg ttagaagaaa agagtgtgtg agaacaggct 1020
gttgttgtca cacgattcgg acaattctgt ttgaaagaga gagagtaaca gtacgatcga 1080
acgaactttg ctctggagat cacagtgggc atcatagcat gtggtactaa accctttccc 1140
gccattccag aaccttcgat tgcttgttac aaaacctgtg agccgtcgct aggaccttgt 1200
tgtgtgacga aattggaagc tgcaatcaat aggaagacag gaagtcgagc gtgtctgggt 1260
tttttcagtt ttgttctttt tgcaaacaac agtttattcc tggcatccac taaatataat 1320
ggagcccgct ttttaagctg gcatccagaa aaaaaaagaa tcccagcacc aaaatattgt 1380
tttcttcacc aaccatcagt tcataggtcc attctcttag cgcaactaca gagaacaggg 1440
gcacaaacag gcaaaaaacg ggcacaacct caatggagtg atgcaacctg cctggagtaa 1500
atgatgacac aaggcaattg acccacgcat gtatctatct cattttctta caccttctat 1560
taccttctgc tctctctgat ttggaaaaag ctgaaaaaaa aggttgaaac cagttccctg 1620
aaattattcc cctacttgac taataagtat ataaagacgg taggtattga ttgtaattct 1680
gtaaatctat ttcttaaact tcttaaattc tacttttata gttagtcttt tttttagttt 1740
taaaacacca agaacttagt ttcgaataaa cacacataaa caaacaaaat gtccatcggt 1800
gctgaaattg actctttggt tccagctcca ccaggtttga acggtaccgc tgctggttac 1860
ccagccaaga ctcaaaagga attgtctaac ggcgatttcg atgctcacga tggtctgtcc 1920
ttggctcaat tgactccata cgatgtttta accgctgctt tgccattgcc agcgccagct 1980
tctagtactg gtttctggtg gagagaaact ggtccagtta tgtctaagct cttggctaaa 2040
gccaactacc cattgtacac ccattacaag tatttaatgt tgtaccacac tcacatttta 2100
cctttgttag gtccaagacc acctttggaa aattctaccc acccatctcc atcaaatgct 2160
ccttggagat ccttcttgac cgatgacttc accccattag aaccatcttg gaacgttaac 2220
ggtaactccg aagcacaatc cactatcaga ttgggtattg aaccaattgg tttcgaagcc 2280
ggtgctgctg ccgacccatt caaccaagct gccgtcaccc aattcatgca ctcctacgaa 2340
gctactgaag ttggtgccac tctaactttg ttcgaacact tcagaaacga catgttcgtc 2400
ggtccagaga cttacgctgc cttgagagct aagattcctg aaggtgagca caccactcaa 2460
tctttcttgg ctttcgactt ggacgccggt cgtgtcacta ccaaggctta cttcttccca 2520
atcttgatgt ctttgaagac cggtcaatct acgaccaaag ttgtttccga ttctatcttg 2580
cacctagctt tgaagtctga agtttggggt gtccaaacca ttgccgctat gtcggtcatg 2640
gaagcttgga tcggttctta cggtggtgct gctaagaccg aaatgatctc cgttgactgt 2700
gtcaacgaag ctgactccag aatcaagatc tacgttagaa tgccacacac tagcttgaga 2760
aaggtcaaag aagcttattg tttgggtggc cgtttgactg acgaaaacac caaggaaggt 2820
ttgaaattgt tggatgaatt gtggagaact gttttcggta tcgatgacga agatgctgaa 2880
ttaccacaaa actctcacag aactgctggt actattttta actttgaact aagaccaggt 2940
aagtggttcc cagaaccaaa ggtctacttg ccagtcagac actactgtga atccgacatg 3000
caaattgcct ccagattaca aactttcttt ggtcgtttgg gttggcacaa catggaaaag 3060
gactactgca agcatttgga agacttattc cctcaccacc cattgtcctc ctctaccggt 3120
acccacactt tcttgtcttt ttcttacaag aagcaaaagg gtgtttacat gaccatgtac 3180
tacaacttga gagtttattc tacacaccac catcatcatc attgaatcgc gtgcattcat 3240
ccgctctaac cgaaaaggaa ggagttagac aacctgaagt ctaggtccct atttattttt 3300
ttatagttat gttagtatta agaacgttat ttatatttca aatttttctt ttttttctgt 3360
acagacgcgt gtacgcatgt aacattatac tgaaaacctt gcttgagaag gttttgggac 3420
gctcgaagat cgcgtcccaa ttcgccctat agtgagtcgt attacgcgcg ctcactggcc 3480
gtcgttttac aacgtcgtga ctgggaaaac cctggcgtta cccctgcagg actagtgctg 3540
aggcattaat acgactctct cgaaattttt cttaacgcgt ccttgtactg cgtctaacgc 3600
ttttgccact tggatttcta ttataggaaa tagtctcact tactgggcga cgaattttcg 3660
cgttttgatg aagcacagga agaatttctt ttttttttgg cttcttctgg ttccgttttt 3720
tacgcgcaca aatctaaaaa aagaaataat tataacctag tctcgaaaat tttcatcgat 3780
ccattcgttc ctttttttcg attttttcag atcaaaattc ttgtttcttt ctttgtctta 3840
gtttatatta aaagatattt tgattttact cctgaactat ttattctttc taagaaggcc 3900
agaacactac agctgtttta accgactacg aagttctcca ttctcgaaca ctagccttca 3960
tttaccaaac aggaactagc gtatatcatt agtccttatt cgaaaagaga ttggtagata 4020
tttattgtag tttgtgagaa ggagaaaata ctgtcattgg actgatagtt agaggacatt 4080
aacctctctt acgttcgctc a 4101
<210> 54
<211> 5360
<212> DNA
<213> 人工序列
<220>
<223> 合成构建体
<400> 54
atccggatat agttcctcct ttcagcaaaa aacccctcaa gacccgttta gaggccccaa 60
ggggttatgc tagttattgc tcagcggtgg cagcagccaa ctcagcttcc tttcgggctt 120
tgttagcagc cggatctcag tggtggtggt ggtggtgctc gagtgcggcc gcaagcttgt 180
cgacggagct cgaattcgga tccgaattaa ttccgatatc catggccatc gccggctggg 240
cagcgaggag cagcagacca gcagcagcgg tcggcagcag gtatttcata tgtatatctc 300
cttcttaaag ttaaacaaaa ttatttctag aggggaattg ttatccgctc acaattcccc 360
tatagtgagt cgtattaatt tcgcgggatc gagatctcga tcctctacgc cggacgcatc 420
gtggccggca tcaccggcgc cacaggtgcg gttgctggcg cctatatcgc cgacatcacc 480
gatggggaag atcgggctcg ccacttcggg ctcatgagcg cttgtttcgg cgtgggtatg 540
gtggcaggcc ccgtggccgg gggactgttg ggcgccatct ccttgcatgc accattcctt 600
gcggcggcgg tgctcaacgg cctcaaccta ctactgggct gcttcctaat gcaggagtcg 660
cataagggag agcgtcgaga tcccggacac catcgaatgg cgcaaaacct ttcgcggtat 720
ggcatgatag cgcccggaag agagtcaatt cagggtggtg aatgtgaaac cagtaacgtt 780
atacgatgtc gcagagtatg ccggtgtctc ttatcagacc gtttcccgcg tggtgaacca 840
ggccagccac gtttctgcga aaacgcggga aaaagtggaa gcggcgatgg cggagctgaa 900
ttacattccc aaccgcgtgg cacaacaact ggcgggcaaa cagtcgttgc tgattggcgt 960
tgccacctcc agtctggccc tgcacgcgcc gtcgcaaatt gtcgcggcga ttaaatctcg 1020
cgccgatcaa ctgggtgcca gcgtggtggt gtcgatggta gaacgaagcg gcgtcgaagc 1080
ctgtaaagcg gcggtgcaca atcttctcgc gcaacgcgtc agtgggctga tcattaacta 1140
tccgctggat gaccaggatg ccattgctgt ggaagctgcc tgcactaatg ttccggcgtt 1200
atttcttgat gtctctgacc agacacccat caacagtatt attttctccc atgaagacgg 1260
tacgcgactg ggcgtggagc atctggtcgc attgggtcac cagcaaatcg cgctgttagc 1320
gggcccatta agttctgtct cggcgcgtct gcgtctggct ggctggcata aatatctcac 1380
tcgcaatcaa attcagccga tagcggaacg ggaaggcgac tggagtgcca tgtccggttt 1440
tcaacaaacc atgcaaatgc tgaatgaggg catcgttccc actgcgatgc tggttgccaa 1500
cgatcagatg gcgctgggcg caatgcgcgc cattaccgag tccgggctgc gcgttggtgc 1560
ggatatctcg gtagtgggat acgacgatac cgaagacagc tcatgttata tcccgccgtt 1620
aaccaccatc aaacaggatt ttcgcctgct ggggcaaacc agcgtggacc gcttgctgca 1680
actctctcag ggccaggcgg tgaagggcaa tcagctgttg cccgtctcac tggtgaaaag 1740
aaaaaccacc ctggcgccca atacgcaaac cgcctctccc cgcgcgttgg ccgattcatt 1800
aatgcagctg gcacgacagg tttcccgact ggaaagcggg cagtgagcgc aacgcaatta 1860
atgtaagtta gctcactcat taggcaccgg gatctcgacc gatgcccttg agagccttca 1920
acccagtcag ctccttccgg tgggcgcggg gcatgactat cgtcgccgca cttatgactg 1980
tcttctttat catgcaactc gtaggacagg tgccggcagc gctctgggtc attttcggcg 2040
aggaccgctt tcgctggagc gcgacgatga tcggcctgtc gcttgcggta ttcggaatct 2100
tgcacgccct cgctcaagcc ttcgtcactg gtcccgccac caaacgtttc ggcgagaagc 2160
aggccattat cgccggcatg gcggccccac gggtgcgcat gatcgtgctc ctgtcgttga 2220
ggacccggct aggctggcgg ggttgcctta ctggttagca gaatgaatca ccgatacgcg 2280
agcgaacgtg aagcgactgc tgctgcaaaa cgtctgcgac ctgagcaaca acatgaatgg 2340
tcttcggttt ccgtgtttcg taaagtctgg aaacgcggaa gtcagcgccc tgcaccatta 2400
tgttccggat ctgcatcgca ggatgctgct ggctaccctg tggaacacct acatctgtat 2460
taacgaagcg ctggcattga ccctgagtga tttttctctg gtcccgccgc atccataccg 2520
ccagttgttt accctcacaa cgttccagta accgggcatg ttcatcatca gtaacccgta 2580
tcgtgagcat cctctctcgt ttcatcggta tcattacccc catgaacaga aatccccctt 2640
acacggaggc atcagtgacc aaacaggaaa aaaccgccct taacatggcc cgctttatca 2700
gaagccagac attaacgctt ctggagaaac tcaacgagct ggacgcggat gaacaggcag 2760
acatctgtga atcgcttcac gaccacgctg atgagcttta ccgcagctgc ctcgcgcgtt 2820
tcggtgatga cggtgaaaac ctctgacaca tgcagctccc ggagacggtc acagcttgtc 2880
tgtaagcgga tgccgggagc agacaagccc gtcagggcgc gtcagcgggt gttggcgggt 2940
gtcggggcgc agccatgacc cagtcacgta gcgatagcgg agtgtatact ggcttaacta 3000
tgcggcatca gagcagattg tactgagagt gcaccatata tgcggtgtga aataccgcac 3060
agatgcgtaa ggagaaaata ccgcatcagg cgctcttccg cttcctcgct cactgactcg 3120
ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc ggtaatacgg 3180
ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg ccagcaaaag 3240
gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg cccccctgac 3300
gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg actataaaga 3360
taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac cctgccgctt 3420
accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca tagctcacgc 3480
tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt gcacgaaccc 3540
cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc caacccggta 3600
agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag agcgaggtat 3660
gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac tagaaggaca 3720
gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt tggtagctct 3780
tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa gcagcagatt 3840
acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg gtctgacgct 3900
cagtggaacg aaaactcacg ttaagggatt ttggtcatga acaataaaac tgtctgctta 3960
cataaacagt aatacaaggg gtgttatgag ccatattcaa cgggaaacgt cttgctctag 4020
gccgcgatta aattccaaca tggatgctga tttatatggg tataaatggg ctcgcgataa 4080
tgtcgggcaa tcaggtgcga caatctatcg attgtatggg aagcccgatg cgccagagtt 4140
gtttctgaaa catggcaaag gtagcgttgc caatgatgtt acagatgaga tggtcagact 4200
aaactggctg acggaattta tgcctcttcc gaccatcaag cattttatcc gtactcctga 4260
tgatgcatgg ttactcacca ctgcgatccc cgggaaaaca gcattccagg tattagaaga 4320
atatcctgat tcaggtgaaa atattgttga tgcgctggca gtgttcctgc gccggttgca 4380
ttcgattcct gtttgtaatt gtccttttaa cagcgatcgc gtatttcgtc tcgctcaggc 4440
gcaatcacga atgaataacg gtttggttga tgcgagtgat tttgatgacg agcgtaatgg 4500
ctggcctgtt gaacaagtct ggaaagaaat gcataaactt ttgccattct caccggattc 4560
agtcgtcact catggtgatt tctcacttga taaccttatt tttgacgagg ggaaattaat 4620
aggttgtatt gatgttggac gagtcggaat cgcagaccga taccaggatc ttgccatcct 4680
atggaactgc ctcggtgagt tttctccttc attacagaaa cggctttttc aaaaatatgg 4740
tattgataat cctgatatga ataaattgca gtttcatttg atgctcgatg agtttttcta 4800
agaattaatt catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg 4860
ttccgcgcac atttccccga aaagtgccac ctgaaattgt aaacgttaat attttgttaa 4920
aattcgcgtt aaatttttgt taaatcagct cattttttaa ccaataggcc gaaatcggca 4980
aaatccctta taaatcaaaa gaatagaccg agatagggtt gagtgttgtt ccagtttgga 5040
acaagagtcc actattaaag aacgtggact ccaacgtcaa agggcgaaaa accgtctatc 5100
agggcgatgg cccactacgt gaaccatcac cctaatcaag ttttttgggg tcgaggtgcc 5160
gtaaagcact aaatcggaac cctaaaggga gcccccgatt tagagcttga cggggaaagc 5220
cggcgaacgt ggcgagaaag gaagggaaga aagcgaaagg agcgggcgct agggcgctgg 5280
caagtgtagc ggtcacgctg cgcgtaacca ccacacccgc cgcgcttaat gcgccgctac 5340
agggcgcgtc ccattcgcca 5360

Claims (134)

1.一种具有式(I)的化学化合物或其盐:
其中,R2、R4、R5、R6或R7中的至少两个是独立地选自以下中的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中,每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,并且其中,R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且R3c为氢原子或羧基。
2.根据权利要求1所述的化学化合物,其中,R2、R4、R5、R6或R7中的至少三个是选自以下中的至少两种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
3.根据权利要求1所述的化学化合物,其中,R2、R4、R5、R6或R7中的至少三个是选自以下中的至少三种的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基。
4.根据权利要求1所述的化学化合物,其中,当R4没有被取代基取代时,R4是氢原子。
5.根据权利要求1所述的化学化合物,其中,R4和R5选自以下中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R2、R6和R7是氢原子。
6.根据权利要求1所述的化学化合物,其中,R4和R5选自以下中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R4和R5中的至少一个为异戊二烯基或卤素原子,并且R2、R6和R7为氢原子。
7.根据权利要求1所述的化学化合物,其中,R4和R6选自以下中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R2、R4和R7是氢原子。
8.根据权利要求1所述的化学化合物,其中,R4和R6选自以下中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R4和R6中的至少一个为异戊二烯基或卤素原子,并且R2、R4和R7为氢原子。
9.根据权利要求1所述的化学化合物,其中,R4和R7选自以下中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R2、R5和R6为氢原子。
10.根据权利要求1所述的化学化合物,其中,R4和R7选自以下中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R4和R7中的至少一个为异戊二烯基或卤素原子,并且R2、R5和R6为氢原子。
11.根据权利要求1所述的化学化合物,其中,R5和R6选自以下中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R2、R4和R7为氢原子。
12.根据权利要求1所述的化学化合物,其中,R5和R7选自以下中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R5和R6中的至少一个为异戊二烯基或卤素原子,并且R2、R4和R6为氢原子。
13.根据权利要求1所述的化学化合物,其中,R5和R7选自以下中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R2、R4和R6为氢原子。
14.根据权利要求1所述的化学化合物,其中,R5和R7选自以下中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R5和R7中的至少一个为异戊二烯基或卤素原子,并且R2、R4和R6为氢原子。
15.根据权利要求1所述的化学化合物,其中,R6和R7选自以下中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R2、R4和R5为氢原子。
16.根据权利要求1所述的化学化合物,其中,R6和R7选自以下中的两种:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且R6和R7中的至少一个为异戊二烯基或卤素原子,并且R2、R4和R5为氢原子。
17.根据权利要求1所述的化学化合物,其中,R2为氢,并且R4、R5、R6或R7中仅两个被取代,其中,第一取代基选自(i)卤素原子、(ii)异戊二烯基和(iii)腈基,并且第二取代基选自(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中,所述第一取代基和所述第二取代基来自不同的基团。
18.根据权利要求1所述的化学化合物,其中,R2为氢,并且R4、R5、R6或R7中仅两个被取代,其中,第一取代基为卤素原子,并且第二取代基选自(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物、(vi)醛或酮基、(vii)异戊二烯基和(viii)腈基。
19.根据权利要求1所述的化学化合物,其中,R2为氢,并且R4、R5、R6或R7中仅两个被取代,其中,第一取代基为异戊二烯基,并且第二取代基选自(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基和(viii)腈基。
20.根据权利要求1所述的化学化合物,其中,R2为氢,并且R4、R5、R6或R7中仅两个被取代,其中,第一取代基为腈基,并且第二取代基选自(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基和(viii)异戊二烯基。
21.根据权利要求1所述的化学化合物,其中,R2为氢,并且R4、R5、R6或R7中仅两个被取代,其中,第一取代基选自(i)卤素原子、(ii)异戊二烯基和(iii)腈基,并且第二取代基选自(i)羟基、(ii)硝基、(iii)糖氧基、(iv)氨基或N-取代的氨基、(v)羧基或羧酸衍生物和(vi)醛或酮基。
22.根据权利要求1所述的化学化合物,其中,R2为氢,并且R4、R5、R6或R7中仅两个被取代,其中,第一取代基为卤素原子,并且第二取代基选自(i)氨基或N-取代的氨基、(ii)腈基、(iii)硝基、(iv)羟基和(v)异戊二烯基。
23.根据权利要求1所述的化学化合物,其中,R2为氢,并且R4、R5、R6或R7中仅两个被取代,其中,第一取代基为异戊二烯基,并且第二取代基选自(i)羧基或羧酸衍生物、(ii)卤素和(iii)羟基。
24.根据权利要求1所述的化学化合物,其中,R2为氢,并且R4、R5、R6或R7中仅两个被取代,其中,第一取代基为卤素原子,并且第二取代基为异戊二烯基。
25.根据权利要求1所述的化学化合物,其中,R2为氢,并且R4、R5、R6或R7中仅两个被取代,其中,第一取代基为腈基,并且第二取代基为氨基或N-取代的氨基。
26.根据权利要求1所述的化学化合物,其中,R5为羧基或乙酰基,并且R7为氨基、腈基、羟基或卤素。
27.根据权利要求1所述的化学化合物,其中,R5为乙酰胺基,并且R7为醛基、羧基或羧基酯。
28.根据权利要求1所述的化学化合物,其中,R5为乙酰胺基,R6为氨基、硝基或卤素,并且R7为醛基、羧基或羧基酯。
29.根据权利要求1所述的化学化合物,其中,R5为羧甲基或酰胺基,并且R7为硝基、氨基或卤素。
30.根据权利要求1所述的化学化合物,其中,R4为糖氧基,R5为羧甲基或酰胺基,并且R7为硝基、氨基或卤素。
31.根据权利要求1所述的化学化合物,其中,化学化合物(I)选自具有化学式(IX)、(X)、(XI)、(XII)、(XIII)、(XIV)、(XV)、(XVI)、(XVII)、(XVIII)、(XIX)、(XX)、(XXI)、(XXII)、(XXIII)、(XXIV)、(XXV)、(XXVI)、(XXVII)、(XXVIII)、(XXIX)、(XXX)、(XXXI)、(XXXII)、(XXXIII)、(XXXIV)、(XXXV)、(XXXVI)、(XXXVII)、(XXXVIII)、(XXXIX)、(XL)、(XLI)、(XLII)、(XLIII)、(XLIV)、(XLV)、(XLVI)、(XLVII)、(XLVIII)、(XLIX)、(L)、(LI)、(LII)、(LIII)、(LIV)或(LV)的化合物:
32.根据权利要求1所述的化学化合物,其中,化学化合物(I)是示出在图13A、图13B和图13C中并且在其中被标记为13A-3、13A-4、13A-5、13A-6、13A-7、13A-8、13A-9、13A-10、13B-3、13B-4、13B-5、13B-6、13B-7、13B-8、13B-8、13C-6、13C-7、13C-8、13C-9、13C-10或13C-11的化合物中的任一种。
33.一种药物制剂或娱乐性药品制剂,包含有效量的根据权利要求1所述的化学化合物以及药学上可接受的赋形剂、稀释剂或载体。
34.一种用于治疗精神障碍的方法,所述方法包括向对其有需要的受试者施用包含根据权利要求1所述的化学化合物的药物制剂,其中,所述药物制剂以治疗所述受试者的精神障碍的有效量施用。
35.根据权利要求34所述的方法,其中,所述障碍是5-HT2A受体介导的障碍或5-HT1A受体介导的障碍。
36.根据权利要求34所述的方法,其中,施用的剂量为约0.001mg至约5,000mg。
37.一种用于调节5-HT2A受体或5-HT1A受体的方法,所述方法包括使5-HT2A受体或5-HT1A受体与根据权利要求1所述的化学化合物接触。
38.根据权利要求37所述的方法,其中,反应条件是体外反应条件。
39.根据权利要求37所述的方法,其中,反应条件是体内反应条件。
40.一种制备根据权利要求1所述的裸盖菇素衍生化合物的方法,所述方法包括:
在足以形成具有化学式(I)的裸盖菇素取代物或其盐的反应条件下,使具有化学式(II)的反应物裸盖菇素衍生物与含取代基的化合物反应,
其中,R2、R4、R5、R6或R7之一是选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中,每个未取代的R2、R5、R6或R7为氢原子或醇基,并且当R4没有被任何上述取代基取代时,R4为氢原子、羟基、O-烷基、O-酰基或磷酸酯基,其中,R3a和R3b各自独立地为氢原子、烷基、环烷基、酰基或芳基,并且其中,R3c为氢原子或羧基,
其中,所述含取代基的化合物中的取代基选自(i)含卤素的化合物、(ii)含羟基的化合物、(iii)含硝基的化合物、(iv)含糖氧基的化合物、(v)含氨基或N-取代的氨基的化合物、(vi)含羧基或羧酸衍生物的化合物、(vii)含醛或酮基的化合物、(viii)含异戊二烯基的化合物和(ix)含腈基的化合物。
41.根据权利要求40所述的方法,其中,具有式(II)的所述反应物裸盖菇素衍生物中的取代基是硝基,所述含取代基的化合物是羧酸衍生物乙酸酐(Ac2O),并且所述反应物裸盖菇素衍生物和所述含取代基的化合物在傅-克酰基化反应中反应,以形成具有式(I)的第一裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一是硝基,并且R2、R4、R5、R6或R7中的至少一个是乙酰基。
42.根据权利要求41所述的方法,其中,形成的所述第一裸盖菇素衍生物是示出在图13A中并且被标记为13A-3的化合物。
43.根据权利要求40所述的方法,其中,使形成的具有式(I)的第一裸盖菇素衍生物反应以使乙酰基氧化并形成具有式(I)的第二裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为硝基,并且R2、R4、R5、R6或R7中的至少一个为羧基。
44.根据权利要求43所述的方法,其中,形成的所述第二裸盖菇素衍生物是示出在图13A中并且被标记为13A-4的化合物。
45.根据权利要求43所述的方法,其中,使形成的所述具有式(I)的第二裸盖菇素衍生物反应以使硝基还原并形成氨基以及具有式(I)的第三裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为氨基,并且R2、R4、R5、R6或R7中的至少一个为羧基。
46.根据权利要求45所述的方法,其中,形成的所述第三裸盖菇素衍生物是示出在图13A中并且被标记为13A-5的化合物。
47.根据权利要求45所述的方法,其中,使形成的所述具有式(I)的第三裸盖菇素衍生物与亚硝酸盐反应,以将氨基转化为重氮盐并形成具有式(I)的中间裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为重氮基,并且R2、R4、R5、R6或R7中的至少一个为羧基。
48.根据权利要求47所述的方法,其中,形成的所述中间裸盖菇素衍生物是示出在图13A中并且被标记为13A-6的化合物。
49.根据权利要求47所述的方法,其中,使形成的所述具有式(I)的中间裸盖菇素衍生物与含腈化合物反应,以转化重氮基并形成具有式(I)的第四裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为腈基,并且R2、R4、R5、R6或R7中的至少一个为羧基。
50.根据权利要求49所述的方法,其中,形成的所述第四裸盖菇素衍生物是示出在图13A中并且被标记为13A-7的化合物。
51.根据权利要求47所述的方法,其中,使形成的所述具有式(I)的中间裸盖菇素衍生物与水反应,以转化重氮基并形成具有式(I)的第五裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为羟基,并且R2、R4、R5、R6或R7中的至少一个为羧基。
52.根据权利要求51所述的方法,其中,形成的所述第五裸盖菇素衍生物是示出在图13A中并且被标记为13A-8的化合物。
53.根据权利要求47所述的方法,其中,使形成的所述具有式(I)的中间裸盖菇素衍生物与含卤素的化合物反应,以转化重氮基并形成具有式(I)的第六裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为卤素原子,并且R2、R4、R5、R6或R7中的至少一个为羧基。
54.根据权利要求53所述的方法,其中,形成的所述第六裸盖菇素衍生物是示出在图13A中并且被标记为13A-9或13A-10的化合物。
55.根据权利要求40所述的方法,其中,具有式(II)的所述反应物裸盖菇素衍生物中的取代基是甲氧基羰基,所述含取代基的化合物是所述含卤素的化合物N-卤代琥珀酰亚胺,并且所述反应物裸盖菇素衍生物和所述含取代基的化合物反应以形成具有式(I)的第一裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为甲氧基羰基,并且R2、R4、R5、R6或R7中的至少一个为卤素原子。
56.根据权利要求55所述的方法,其中,所述N-卤代琥珀酰亚胺是N-氯代琥珀酰亚胺,并且形成的所述第一裸盖菇素衍生物是示出在图13B中并且被标记为13B-3的化合物。
57.根据权利要求40所述的方法,其中,具有式(II)的所述反应物裸盖菇素衍生物中的取代基是甲氧基羰基,所述含取代基的化合物是含硝基的化合物四氟硼酸硝鎓,并且所述反应物裸盖菇素衍生物与所述含取代基的化合物反应以形成具有式(I)的第二裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为甲氧基羰基,并且R2、R4、R5、R6或R7中的至少一个为硝基。
58.根据权利要求57所述的方法,其中,形成的所述第二裸盖菇素衍生物是示出在图13B中并且被标记为13B-4的化合物。
59.根据权利要求40所述的方法,其中,形成的具有式(I)的第一裸盖菇素与乙酰化的糖基化合物反应并且形成具有式(I)的第三裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为甲氧基羰基,R2、R4、R5、R6或R7中的至少一个为糖氧基,并且R2、R4、R5、R6或R7中的至少一个为卤素原子。
60.根据权利要求59所述的方法,其中,形成的所述第三裸盖菇素衍生物是示出在图13B中并且被标记为13B-5的化合物。
61.根据权利要求57所述的方法,其中,形成的所述具有式(I)的第二裸盖菇素衍生物与乙酰化的糖基化合物反应并且形成具有式(I)的第四裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为甲氧基羰基,R2、R4、R5、R6或R7中的至少一个为糖氧基,并且R2、R4、R5、R6或R7中的至少一个为硝基。
62.根据权利要求61所述的方法,其中,形成的所述第四裸盖菇素衍生物是示出在图13B中并且被标记为13B-6的化合物。
63.根据权利要求59所述的方法,其中,形成的所述具有式(I)的第三裸盖菇素衍生物与氨反应,以将甲氧基羰基转化为酰氨基并且形成具有式(I)的第五裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为酰氨基,R2、R4、R5、R6或R7中的至少一个为糖氧基,并且R2、R4、R5、R6或R7中的至少一个为卤素原子。
64.根据权利要求63所述的方法,其中,形成的所述第五裸盖菇素衍生物是示出在图13B中并且被标记为13B-7的化合物。
65.根据权利要求61所述的方法,其中,形成的所述具有式(I)的第四裸盖菇素衍生物与氨反应,以将甲氧基羰基转化为酰氨基并且形成具有式(I)的第六裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为酰氨基,R2、R4、R5、R6或R7中的至少一个为糖氧基,并且R2、R4、R5、R6或R7中的至少一个为硝基。
66.根据权利要求65所述的方法,其中,形成的所述第六裸盖菇素衍生物是示出在图13B中并且被标记为13B-8的化合物。
67.根据权利要求65所述的方法,其中,使形成的所述具有式(I)的第六裸盖菇素衍生物反应以使硝基还原以形成氨基和具有式(I)的第七裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为酰氨基,R2、R4、R5、R6或R7中的至少一个为糖氧基,并且R2、R4、R5、R6或R7中的至少一个为硝基。
68.根据权利要求67所述的方法,其中,形成的所述第七裸盖菇素衍生物是示出在图13B中并且被标记为13B-9的化合物。
69.根据权利要求40所述的方法,其中,具有式(II)的所述反应物裸盖菇素衍生物中的取代基是乙酰胺基,所述含取代基的化合物是所述含卤素的化合物N-卤代琥珀酰亚胺,并且所述反应物裸盖菇素衍生物和所述含取代基的化合物反应以形成具有式(I)的第一裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为乙酰胺基,并且R2、R4、R5、R6或R7中的至少一个为卤素原子。
70.根据权利要求69所述的方法,其中,所述N-卤代琥珀酰亚胺是N-溴代琥珀酰亚胺(NBS),并且形成的所述第一裸盖菇素衍生物是示出在图13C中并且被标记为13C-6的化合物。
71.根据权利要求69所述的方法,其中,具有式(II)的所述反应物裸盖菇素衍生物中的取代基是乙酰胺基,所述含取代基的化合物是二甲基甲酰胺,并且所述反应物裸盖菇素衍生物与所述含取代基的化合物反应以形成具有式(I)的中间裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为乙酰胺基,并且R2、R4、R5、R6或R7中的至少一个为甲醇基,并且其中,所述中间裸盖菇素衍生物进一步反应以使甲醇基氧化,并且形成具有式(I)的第二裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为乙酰胺基,并且R2、R4、R5、R6或R7中的至少一个为羧基。
72.根据权利要求71所述的方法,其中,所述中间裸盖菇素衍生物是示出在图13C中并且被标记为13C-5的化合物,并且形成的所述第二裸盖菇素衍生物是示出在图13C中并且被标记为13C-7的化合物。
73.根据权利要求71所述的方法,其中,形成的所述具有式(I)的第二裸盖菇素衍生物与醇反应以使羧基酯化以形成酯和具有式(I)的第三裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为乙酰胺基,R2、R4、R5、R6或R7中的至少一个为羧基酯。
74.根据权利要求73所述的方法,其中,形成的所述第三裸盖菇素衍生物是示出在图13C中并且被标记为13C-8的化合物。
75.根据权利要求73所述的方法,其中,形成的所述具有式(I)的第三裸盖菇素衍生物与含硝基的化合物反应并形成具有式(I)的第四裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为乙酰胺基,R2、R4、R5、R6或R7中的至少一个为羧基酯,并且R2、R4、R5、R6或R7中的至少一个为硝基。
76.根据权利要求75所述的方法,其中,形成的所述第四裸盖菇素衍生物是示出在图13C中并且被标记为13C-9的化合物。
77.根据权利要求75所述的方法,其中,使形成的所述具有式(I)的第四裸盖菇素衍生物反应以使硝基还原以形成氨基和具有式(I)的第五裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为乙酰胺基,R2、R4、R5、R6或R7中的至少一个为羧基酯,并且R2、R4、R5、R6或R7中的至少一个为氨基。
78.根据权利要求77所述的方法,其中,形成的所述第五裸盖菇素衍生物是示出在图13C中并且被标记为13C-10的化合物。
79.根据权利要求77所述的方法,其中,形成的所述具有式(I)的第五裸盖菇素衍生物与氨反应以形成酰氨基和具有式(I)的第六裸盖菇素衍生物,其中,R2、R4、R5、R6或R7之一为乙酰胺基,R2、R4、R5、R6或R7中的至少一个为羧基酯,并且R2、R4、R5、R6或R7中的至少一个为酰氨基。
80.根据权利要求79所述的方法,其中,形成的所述第六裸盖菇素衍生物是示出在图13C中并且被标记为13C-11的化合物。
81.一种制备多取代基裸盖菇素衍生物的方法,所述方法包括:在允许酶催化转化裸盖菇素衍生物前体化合物的反应条件下,使具有式(LVII)的裸盖菇素衍生物前体化合物与催化量的裸盖菇素生物合成酶补体接触以形成根据权利要求1所述的多取代基裸盖菇素衍生化合物:
其中,R2、R4、R5、R6或R7中的至少一个是选自以下的取代基:
(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,并且其中,每个未取代的R2、R5、R6或R7是氢原子并且当R4没有被任何上述取代基取代时,R4为氢原子、O-烷基、O-酰基或磷酸酯基,并且其中,R3为氢原子或-CH2-CHNH2COOH或-CH2-CH2NH2
82.根据权利要求81所述的方法,其中,所述反应条件是体外反应条件。
83.根据权利要求81所述的方法,其中,所述反应条件是体内反应条件。
84.根据权利要求81或83所述的方法,其中,使所述裸盖菇素衍生物前体化合物和含取代基的化合物与宿主细胞中的所述裸盖菇素生物合成酶补体接触,其中,所述宿主细胞包含嵌合核酸序列,所述嵌合核酸序列包含以下作为操作性地连接的组件:
(i)控制所述宿主细胞中的表达的核酸序列;和
(ii)编码裸盖菇素生物合成酶补体的核酸序列,
并且使所述宿主细胞生长以表达所述裸盖菇素生物合成酶补体并产生所述多取代基裸盖菇素衍生化合物。
85.根据权利要求84所述的方法,其中,所述裸盖菇素生物合成酶补体包含由选自以下的核酸编码的至少一种酶:
(f)SEQ.ID NO:1、SEQ.ID NO:3、SEQ.ID NO:5、SEQ.ID NO:7、SEQ.ID NO:9、SEQ.ID NO11、SEQ.ID NO:13、SEQ.ID NO:15、SEQ.ID NO:17、SEQ.ID NO:19、SEQ.ID NO:21、SEQ.ID NO23、SEQ.ID NO:25和SEQ.ID NO:48;
(g)与(a)的任一核酸序列基本同一的核酸序列;
(h)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(i)与(a)的任一核酸序列互补的核酸序列;
(j)编码具有SEQ.ID NO:2、SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:8、SEQ.ID NO:10、SEQ.ID NO 12、SEQ.ID NO:14、SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20、SEQ.ID NO:22、SEQ.ID NO 24、SEQ.ID NO:26和SEQ.ID NO:49中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:2、SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:8、SEQ.ID NO:10、SEQ.ID NO 12、SEQ.ID NO:14、SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20、SEQ.ID NO:22、SEQ.ID NO 24、SEQ.ID NO:26和SEQ.ID NO:49中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
86.根据权利要求85所述的方法,其中,所述裸盖菇素生物合成酶补体包含由选自以下的核酸编码的色氨酸合酶亚基B多肽:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2中所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在所述具有式(LVII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个为独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中,R3是氢原子,并且其中,形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中,R3c是羧基。
87.根据权利要求86所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LVIII)的化学化合物:
其中,R4为羟基,并且其中,R6是氯原子,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LV):
88.根据权利要求85所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含色氨酸脱羧酶以使R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中,R3a和R3b各自为氢原子,所述色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
89.根据权利要求88所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LVIII)的化学化合物:
其中,R4是氟原子、氨基或羟基,其中,R6是氟原子、氨基、腈、或溴原子,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LIX):
其中,R4为氟原子、氨基或羟基,其中,R6为氟原子、氨基、腈、或溴原子,并且其中,所述第二多取代基裸盖菇素衍生物具有式(XXII)、(XXVI)、(XXIX)、(LII)或(LIV):
90.根据权利要求88所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含N-乙酰基转移酶以使具有化学式(I)的第二裸盖菇素衍生物乙酰化,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中,R3a为氢原子并且R3b为乙酰基,所述N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10中所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
91.根据权利要求90所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LVIII)的化学化合物:
其中,R4为乙酰胺基、氟原子、氨基或羟基,其中,R6为氟原子、氨基、腈、或溴原子,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LIX):
其中,R4为乙酰胺基、氟原子、氨基或羟基,其中,R6为氟原子、氨基、腈、或溴原子,并且其中,所述第二多取代基裸盖菇素衍生物具有式(LX):
并且其中,第三多取代基裸盖菇素衍生物具有式(IX)、(X)、(XVIII)、(XXI)、(XXV)或(XXVIII):
92.根据权利要求88所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含N-甲基转移酶以使R3处的R3氨基甲基化并且形成具有化学式(I)的第四多取代基裸盖菇素衍生物,其中,R3a和R3b各自为甲基,或其中,R3a为氢原子并且R3b为甲基,所述N-甲基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:11和SEQ.ID NO 13;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
93.根据权利要求92所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LVIII)的化学化合物:
其中,R4为氨基或羟基,其中,R6是氯原子、腈基或溴原子,并且形成的第一多取代基裸盖菇素衍生化合物具有式(LIX):
其中,R4为氨基或羟基,其中,R6是氯原子、腈基或溴原子,并且其中,所述第二多取代基裸盖菇素衍生物具有式(LX):
并且其中,所述第四多取代基裸盖菇素衍生物具有式(XXVII)、(XL)或(LIII):
94.根据权利要求88所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含由选自以下的核酸编码的异戊二烯基转移酶:
(a)SEQ.ID NO:15、SEQ.ID NO:17、SEQ.ID NO:19和SEQ.ID NO 21;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO 22中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO 22中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在所述具有式(LVII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7之一是选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中,R3为-CH2-CHNH2COOH,并且其中,形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中,R2、R4、R5、R6或R7中的至少一个为异戊二烯基,并且R3c为氢原子。
95.根据权利要求94所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXI)的化学化合物:
其中,R4为羟基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(L):
96.根据权利要求94所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含色氨酸脱羧酶以使R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中,R3a和R3b各自为氢原子,所述色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
97.根据权利要求96所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含N-甲基转移酶以使R3处的R3氨基甲基化并形成具有化学式(I)的第四多取代基裸盖菇素衍生物,其中,R3a和R3b各自为甲基,或其中,R3a为氢原子并且R3b为甲基,所述N-甲基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:11和SEQ.ID NO 13;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
98.根据权利要求97所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXI)的化学化合物:
其中,R4是丙酰氧基或乙酰氧基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LIX):
其中,R4是丙酰氧基或乙酰氧基,其中,R6为异戊二烯基,并且其中,所述第二多取代基裸盖菇素衍生物具有下式:
其中,R4是丙酰氧基或乙酰氧基,其中,R6为异戊二烯基,其中,第三多取代基裸盖菇素衍生物具有式(XLI)或(XLII):
99.根据权利要求94所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXII)的化学化合物:
其中,R5是氯或氟原子,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LXIII):
其中,R5是氯或氟原子,并且其中,R6为异戊二烯基,并且其中,形成的第二多取代基裸盖菇素衍生化合物具有式(XXXVI)或(XXXVIII):
100.根据权利要求96所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含N-乙酰基转移酶以使具有化学式(I)的第二裸盖菇素衍生物乙酰化,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中,R3a为氢原子并且R3b为乙酰基,所述N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
101.根据权利要求100所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXII)的化学化合物:
其中,R5是氯或氟原子,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LXIII):
其中,R5是氯或氟原子,并且其中,R6为异戊二烯基,并且其中,形成的第二多取代基裸盖菇素衍生化合物具有式(LXIV):
其中,R5是氯或氟原子,并且其中,R6为异戊二烯基,并且其中,第三多取代基裸盖菇素衍生物具有式(XXXV)或(XXXVII):
102.根据权利要求85所述的方法,其中,所述裸盖菇素生物合成酶补体包含由选自以下的核酸编码的色氨酸合酶亚基B多肽:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2中所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个是独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中,R3为氢原子,并且其中,形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中,R3c为羧基。
103.根据权利要求85所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXV)的化学化合物:
其中,R4为羟基,并且其中,R5为异戊二烯基,并且其中,形成的第一多取代基裸盖菇素衍生化合物具有式(LI):
104.根据权利要求102所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含色氨酸脱羧酶以使R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中,R3a和R3b各自为氢原子,所述色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
105.根据权利要求104所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXV)的化学化合物:
其中,R4为氟原子并且R5为腈基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LXIX):
其中,R4为氟原子并且其中R5为腈基,并且其中,形成的第二多取代基裸盖菇素衍生化合物具有式(XIX):
106.根据权利要求104所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含N-乙酰基转移酶以使具有化学式(I)的第二裸盖菇素衍生物乙酰化,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中,R3a为氢原子并且R3b为乙酰基,所述N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
107.根据权利要求106所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXV)的化学化合物:
其中,R4为氟原子并且R5为羟基或腈基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LXIX):
其中,R4为氟原子并且其中R5为羟基或腈基,并且其中,形成的第二多取代基裸盖菇素衍生化合物具有式(LXXII):
其中,R4为氟原子并且其中R5为羟基或腈基,并且其中,第三多取代基裸盖菇素衍生物具有式(XVII)或(XX):
108.根据权利要求85所述的方法,其中,所述裸盖菇素生物合成酶补体包含由选自以下的核酸编码的色氨酸合酶亚基B多肽:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2中所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个是独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中,R3为氢原子,并且其中,形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中,R3c是羧基。
109.根据权利要求108所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXVI)的化学化合物:
其中,R4为羟基,并且其中,R7为异戊二烯基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(XLIX):
110.根据权利要求108所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含色氨酸脱羧酶以使R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中,R3a和R3b各自为氢原子,所述色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
111.根据权利要求110所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXVI)的化学化合物:
其中,R4为氟原子并且R7为腈基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LXX):
其中,R4为氟原子并且其中R7为腈基,并且其中,形成的第二多取代基裸盖菇素衍生化合物具有式(XXIV):
112.根据权利要求110所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含N-乙酰基转移酶以使具有化学式(I)的第二裸盖菇素衍生物乙酰化,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中,R3a为氢原子并且R3b为乙酰基,所述N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
113.根据权利要求112所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXVI)的化学化合物:
其中,R4为氟原子或氯原子并且R7为异戊二烯基或腈基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LXX):
其中,R4为氟原子或氯原子并且其中R7为异戊二烯基或腈基,并且其中,形成的第二多取代基裸盖菇素衍生化合物具有式(LXXIII):
/>
其中,R4为氟原子或氯原子,并且其中,R7为异戊二烯基或腈基,并且其中,第三多取代基裸盖菇素衍生物具有式(XXIII)或(XX):
114.根据权利要求110所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含N-甲基转移酶以使R3处的R3氨基甲基化并且形成具有化学式(I)的第四多取代基裸盖菇素衍生物,其中,R3a和R3b各自为甲基,或其中,R3a为氢原子并且R3b为甲基,所述N-甲基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:11和SEQ.ID NO 13;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
115.根据权利要求114所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXVI)的化学化合物:
其中,R4是氯原子并且R7是羟基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LXX):
其中,R4是羟基并且其中R7是氯原子,并且其中,形成的第二多取代基裸盖菇素衍生化合物具有式(LXXIII):
其中,R4为羟基,并且其中,R7是氯原子,并且其中,第三多取代基裸盖菇素衍生物具有式(XXXIX):
116.根据权利要求85所述的方法,其中,所述裸盖菇素生物合成酶补体包含由选自以下的核酸编码的色氨酸合酶亚基B多肽:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2中所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个是独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中,R3为氢原子,并且其中,形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中,R3c是羧基,并且所述裸盖菇素生物合成酶补体进一步包含色氨酸脱羧酶以使所述第一多取代基裸盖菇素衍生化合物的R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中,R3a和R3b各自为氢原子,所述色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
117.根据权利要求116所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXVII)的化学化合物:
其中,R5为氟原子、氯原子或腈基并且R6为氟原子、氨基或异戊二烯基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LXIII):
其中,R5为氟原子、氯原子或腈基并且其中R6为氟原子、氨基或异戊二烯基,并且其中,形成的第二多取代基裸盖菇素衍生化合物具有式(XI)、(XVI)、(XXXVI)或(XXXVIII):
118.根据权利要求116所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含N-乙酰基转移酶以使具有化学式(I)的第二裸盖菇素衍生物乙酰化,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中,R3a为氢原子并且R3b为乙酰基,所述N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
119.根据权利要求118所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXVII)的化学化合物
其中,R5为氟原子或氯原子并且R6为氨基、乙酰胺基或异戊二烯基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LXIII):
其中,R5为氟原子或氯原子并且其中R6为氨基、乙酰胺基或异戊二烯基,并且其中,形成的第二多取代基裸盖菇素衍生化合物具有式(LXXIV):
其中,R5为氟原子或氯原子,并且其中,R6为氨基、乙酰胺基或异戊二烯基,并且其中,第三多取代基裸盖菇素衍生物具有式(XIV)、(XV)、(XXXV)或(XXXVII):
120.根据权利要求116所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含N-甲基转移酶以使R3处的R3氨基甲基化并且形成具有化学式(I)的第四多取代基裸盖菇素衍生物,其中,R3a和R3b各自为甲基,或其中,R3a为氢原子并且R3b为甲基,所述N-甲基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:11和SEQ.ID NO 13;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:12和SEQ.ID NO 14中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
121.根据权利要求120所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXVII)的化学化合物:
其中,R5为氯原子并且R6为异戊二烯基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LXIII):
其中,R5是氯原子并且其中R6为异戊二烯基,并且其中,形成的第二多取代基裸盖菇素衍生化合物具有式(LXXIV):
其中,R5是氯原子,并且其中,R6为异戊二烯基,并且其中,第三多取代基裸盖菇素衍生物具有式(XLIV):
122.根据权利要求85所述的方法,其中,所述裸盖菇素生物合成酶补体包含由选自以下的核酸编码的色氨酸合酶亚基B多肽:
(a)SEQ.ID NO:1;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:2中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:2中所示氨基酸序列的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7中的两个是独立地选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中,R3是氢原子,并且其中,形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中,R3c是羧基,并且所述裸盖菇素生物合成酶补体进一步包含色氨酸脱羧酶以使所述第一多取代基裸盖菇素衍生化合物的R3-CH2-CHNH2COOH基团脱羧基,并由此形成具有式(I)的第二多取代基裸盖菇素衍生物,其中,R3a和R3b各自为氢原子,所述色氨酸脱羧酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:3、SEQ.ID NO:5和SEQ.ID NO:7;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:4、SEQ.ID NO:6、SEQ.ID NO:和SEQ.ID NO 8中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:4、SEQ.ID NO:6和SEQ.ID NO 8中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
123.根据权利要求122所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXVIII)的化学化合物:
其中,R5为氟原子,并且R7为硝基或异戊二烯基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LXXI):
其中,R5为氟原子,并且其中,R7为硝基原子或异戊二烯基,并且其中,形成的第二多取代基裸盖菇素衍生化合物具有式(XIII)或(XXXIII):
124.根据权利要求122所述的方法,其中,所述裸盖菇素生物合成酶补体进一步包含N-乙酰基转移酶以使具有化学式(I)的第二裸盖菇素衍生物乙酰化,并由此形成具有化学式(I)的第三多取代基裸盖菇素,其中,R3a为氢原子并且R3b为乙酰基,所述N-乙酰基转移酶由选自以下的核酸序列编码:
(a)SEQ.ID NO:9;
(b)与(a)的核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的核酸序列基本同一的核酸序列;
(d)与(a)的核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:10中所示氨基酸序列的多肽的核酸序列;
(f)编码SEQ.ID NO:10中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列。
125.根据权利要求124所述的方法,其中,所述裸盖菇素衍生物前体化合物是具有式(LXVIII)的化学化合物:
其中,R5为氟原子,并且R7为硝基或异戊二烯基,并且形成的所述第一多取代基裸盖菇素衍生化合物具有式(LXXI):
其中R5为氟原子,并且其中,R7为硝基原子或异戊二烯基,并且其中,形成的第二多取代基裸盖菇素衍生化合物具有式(LXXV):
其中,R5为氟原子,并且其中,R7为硝基或异戊二烯基,并且其中,第三多取代基裸盖菇素衍生物具有式(XII)或(XXXII):
/>
126.根据权利要求85所述的方法,其中,所述裸盖菇素生物合成酶补体包含由选自以下的核酸编码的异戊二烯基转移酶:
(a)SEQ.ID NO:15、SEQ.ID NO:17、SEQ.ID NO:19和SEQ.ID NO 21;
(b)与(a)的任一核酸序列基本同一的核酸序列;
(c)除了遗传密码的简并之外与(a)的任一核酸序列基本同一的核酸序列;
(d)与(a)的任一核酸序列互补的核酸序列;
(e)编码具有SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO 22中所示氨基酸序列中的任一个的多肽的核酸序列;
(f)编码SEQ.ID NO:16、SEQ.ID NO:18、SEQ.ID NO:20和SEQ.ID NO 22中所示氨基酸序列中的任一个的功能变体的核酸序列;和
(g)在严格条件下与(a)、(b)、(c)、(d)、(e)或(f)中所示核酸序列中的任一种杂交的核酸序列,
其中,在具有式(LVIII)的裸盖菇素衍生物前体化合物中,R2、R4、R5、R6或R7之一是选自以下的取代基:(i)卤素原子、(ii)羟基、(iii)硝基、(iv)糖氧基、(v)氨基或N-取代的氨基、(vi)羧基或羧酸衍生物、(vii)醛或酮基、(viii)异戊二烯基和(ix)腈基,其中,R3为氢原子,并且其中,形成具有式(I)的第一多取代基裸盖菇素衍生化合物,其中,R3c是羧基或氢原子。
127.根据权利要求126所述的方法,其中,所述裸盖菇素衍生物前体化合物具有式(LXXVII):
并且所述第一多取代基裸盖菇素衍生化合物具有式(LXXVI):
128.根据权利要求81至127中任一项所述的方法,其中,所述方法进一步包括这样的步骤,所述步骤包括从宿主细胞和/或宿主细胞培养基中分离所述多取代基裸盖菇素衍生化合物。
129.根据权利要求81至128中任一项所述的方法,其中,宿主细胞是微生物。
130.根据权利要求81至128中任一项所述的方法,其中,宿主细胞是细菌细胞或酵母细胞。
131.根据权利要求81至128中任一项所述的方法,宿主细胞是大肠杆菌(Escherichiacoli)细胞或酿酒酵母(Saccharomyces cerevisiae)细胞。
132.根据权利要求1所述的化学化合物在制备药物制剂或娱乐性药品制剂中的用途。
133.根据权利要求132所述的化学化合物的用途,其中,所述制备包括将所述化学化合物与赋形剂、稀释剂或载体进行配制。
134.根据权利要求1所述的化学化合物与稀释剂、载体或赋形剂一起作为药物制剂或娱乐性药品制剂的用途。
CN202280028274.4A 2021-02-12 2022-02-11 多取代基裸盖菇素衍生物及使用方法 Pending CN117222622A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US63/149,001 2021-02-12
US202163247881P 2021-09-24 2021-09-24
US63/247,881 2021-09-24
PCT/CA2022/050206 WO2022170438A1 (en) 2021-02-12 2022-02-11 Multi-substituent psilocybin derivatives and methods of using

Publications (1)

Publication Number Publication Date
CN117222622A true CN117222622A (zh) 2023-12-12

Family

ID=89039408

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202280028274.4A Pending CN117222622A (zh) 2021-02-12 2022-02-11 多取代基裸盖菇素衍生物及使用方法

Country Status (1)

Country Link
CN (1) CN117222622A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114787363A (zh) * 2019-10-01 2022-07-22 恩派瑞安神经科学公司 对真菌进行遗传工程化以调节色胺表达

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114787363A (zh) * 2019-10-01 2022-07-22 恩派瑞安神经科学公司 对真菌进行遗传工程化以调节色胺表达

Similar Documents

Publication Publication Date Title
AU2019206054B2 (en) Production of heterologous polypeptides in microalgae, microalgal extracellular bodies, compositions, and methods of making and uses thereof
KR102506185B1 (ko) 표적 핵산의 변형을 위한 개선된 방법
KR20210023833A (ko) 프로그래밍가능한 염기 편집기 시스템을 이용하여 단일염기다형성을 편집하는 방법
KR101659101B1 (ko) 박테리아 [2Fe-2S] 다이하이드록시산 탈수효소의 동정 및 용도
CN109312360B (zh) 用于原代细胞的基于转座子的转染系统
KR102092422B1 (ko) 유전자 조작된 미생물로부터 뮤콘산의 생산
KR20210139265A (ko) 표적 서열에서 핵염기를 변형하기 위한 아데노신 데아미나제 염기 편집기 및 이의 사용 방법
CN101939434B (zh) 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因
KR20210041008A (ko) 핵산 표적 서열을 변형시키기 위한 다중-이펙터 핵염기 편집기 및 이를 이용하는 방법
KR20120099509A (ko) 재조합 숙주 세포에서 육탄당 키나아제의 발현
KR20220076467A (ko) 신규 핵염기 편집기 및 이의 사용 방법
CN109563505A (zh) 用于真核细胞的组装系统
KR20210127206A (ko) 유전성 질환의 치료를 위한 것을 포함하는, 아데노신 데아미나제 염기 편집기를 사용하여 질환-관련 유전자를 편집하는 방법
KR20140092759A (ko) 숙주 세포 및 아이소부탄올의 제조 방법
KR20100118973A (ko) 이소프렌을 생성하기 위한 조성물 및 방법
KR20110038087A (ko) 재생가능 자원으로부터의 이소프렌 중합체
KR20140113997A (ko) 부탄올 생성을 위한 유전자 스위치
KR20130027063A (ko) Fe-s 클러스터 요구성 단백질의 활성 향상
CN101815432A (zh) 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法
KR20090058519A (ko) 안트라닐레이트 신타제의 엽록체를 표적으로 하는 발현에 의한 고-트립토판 옥수수의 생산
KR20240005196A (ko) 유전자 조작된 미생물로부터 개선된 뮤콘산 생산
KR20210125560A (ko) 유전성 질환의 치료를 위한 것을 포함하는, 아데노신 데아미나제 염기 편집기를 사용한 질환-관련 유전자의 스플라이스 수용체 부위 파괴
KR20220019685A (ko) B형 간염 치료를 위한 조성물 및 방법
KR20220066289A (ko) 전사 또는 발현을 가능하게 하는 돌연변이를 편집하기 위한 조성물 및 방법
KR20220034212A (ko) 재조합으로 변형된 아데노 연관 바이러스 헬퍼 벡터 및 재조합으로 변형된 아데노 연관 바이러스의 패키징 효율을 개선하기 위한 그의 용도

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination