发明内容
为了加快药物研发的进程,尤其是加速国内药物研发和世界接轨的进程,显著提高候选药物的设计效率,发明人研究获得了多维矩阵用于分子设计的方法和技术平台。该平台首次将数学的矩阵优化理念使用在药物及其相关的分子设计领域,并通过将药物研发过程中需要考虑的大量因素按照一定的特性进行归类和对比,从而使用少量的变数来代表数量巨大的变数,以提高药物研发分子的设计效率及其合成效益。
多维矩阵分子设计的理念在于,任何药物分子都是由所谓的化合物基本结构单元组合而成的,通过对300万种高价值的“像药’型化合物按照28000种化合物基本结构单元进行化合物结构分类,然后进行结构分析,结果表明化合物基本结构单元组成药物分子的方式呈现矩阵和多维矩阵的排列、组合方式。同时,天然产物和中药有效成分单体化合物结构的结构分类分析结果表明,合成化合物的基本结构单元的组合方式与天然产物化合物的结构组合方式极具相似性。因此,在药物分子设计时,将已知化合物结构的各种经验型数据进行结构对比,可以大大提高药物分子设计的针对性和有效性。
多维矩阵分子设计平台为药物及其相关的分子设计提供了一个系统化的矩阵模式的结构对比和结构优化的方法。该方法采用多维矩阵排列分析化合物的结构因素的相应变量和可变因素的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型,以显著地减少需要合成的化合物数量,并快速获得所需的具有生物学活性或特定药物活性的候选药物,从而显著提高化合物分子的设计效率和效益。
本发明采用多维矩阵并参照目标化合物结构优化候选药物结构和完成候选药物分子设计的方法可用于Me-Too类新型药物、药物构架化合物、“像药”型化合物、Hit-To-Lead、先导化合物优化等方面,可以最少变量和最少数量的化合物合成来获得最佳的候选药物,具有很强的设计针对性,显著地提高药物的设计效率和研发效益,并显著缩减研发时间和研发费用。
为了实现本发明的发明目的,本发明提供如下技术方案:
1.一种优化候选药物分子结构的方法,包括如下步骤:
(1)将目标化合物按照基本结构单元进行结构分区,并分别以大写字母A,B,C,D...Y或Z代表相应的结构区域,并确定候选药物的可修饰区域,分别选择可修饰区域中可选择的变量,其中,可修饰区域A的变量选自A1、A2、A3...An,可修饰区域B的变量选自B1、B2、B3...Bn,可修饰区域C的变量选自C1、C2、C3...Cn,可修饰区域D的变量选自D1,D2,D3...Dn……,可修饰区域Y的变量选自Y1、Y2、Y3...Yn,可修饰区域Z的变量选自Z1、Z2、Z3...Zn,其中,n为自然数;
(2)参照经验型数据,选择影响候选药物的可变因素及其变量,所述的可变因素分别以小写字母a,b,c,d...y或z加以表示,其中,可变因素a的变量选自a1、a2、a3...an,可变因素b的变量选自b1、b2、b3...bn,可变因素c的变量选自c1、c2、c3...cn,可变因素d的变量选自d1,d2,d3...dn,……,可变因素y的变量选自y1、y2、y3...yn,可变因素z的变量选自z1、z2、z3...zn,其中,n为自然数;
(3)采用多维矩阵排列分析步骤(1)中所述的可修饰结构区域A,B,C,D...Y或Z的相应变量与步骤(2)中所述的可变因素a,b,c,d...y或z的相应变量,再参照结构区域和经验型数据的结构对比结果,优选出具有代表性的化合物结构类型代表A’、B’、C’、D’...Y’或Z’,完成候选药物的结构设计与优化。
优选步骤(1)中的可修饰区域的确定通过经验型数据的对比分析结构进行。
在本发明的优选技术方案中,所述的方法还包括如下步骤:
(1.1)将目标化合物按照基本结构单元进行结构分区;
(1.2)参照经验型数据,确定影响候选药物分子靶标生物活性/细胞活性的结构部分,将其作为不可修饰区域;
(1.3)对目标化合物结构进行分析与结构确认,确定候选药物的可修饰区域,分别以大写字母A,B,C,D...Y或Z代表相应的结构区域,分别选择可修饰区域可选择的变量,其中,可修饰区域A的变量选自A1、A2、A3...An,可修饰区域B的变量选自B1、B2、B3...Bn,可修饰区域C的变量选自C1、C2、C3...Cn,可修饰区域D的变量选自D1,D2,D3...Dn……,可修饰区域Y的变量选自Y1、Y2、Y3...Yn,可修饰区域Z的变量选自Z1、Z2、Z3...Zn,n为自然数;
(2)参照经验型数据,选择影响候选药物的可变因素及其变量,所述的可变因素分别以小写字母a,b,c,d...y或z加以表示,其中,可变因素a的变量选自a1、a2、a3...an,可变因素b的变量选自b1、b2、b3...bn,可变因素c的变量选自c1、c2、c3...cn,可变因素d的变量选自d1,d2,d3...dn……,可变因素y的变量选自y1、y2、y3...yn,可变因素z的变量选自z1、z2、z3...zn,n为自然数;
(3)采用多维矩阵排列分析步骤(1.3)中所述的可修饰结构区域A,B,C,D...Y或Z的相应变量与可变因素a,b,c,d...y或z的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型代表A’、B’、C’、D’...Y’或Z’。
在本发明的优选技术方案中,所述的方法还包括如下步骤:
在上述步骤(1)或(1.3)确定可修饰区域的同时,排除修饰暂不予考虑的部分,所述的暂不予考虑的部分选自环状结构上的取代基、像药型化合物不应具有的官能团和结构类型的任一种或其组合。
在本发明的优选技术方案中,所述方法还进一步包括如下任一或全部步骤:
(4)对步骤(3)优选出的具有代表性的化合物结构类型A’、B’、C’、D’...Y’或Z’的结构进行分析与结构确认,确定其可选择的变量,其中,可修饰区域A’的变量选自A’1、A’2、A’3...A’n,可修饰区域B’的变量选自B’1、B’2、B’3...B’n,可修饰区域C’的变量选自C’1、C’2、C’3...C’n,可修饰区域D’的变量选自D’1,D’2,D’3...D’n……,可修饰区域Y’的变量选自Y’1、Y’2、Y’3...Y’n,可修饰区域Z’的变量选自Z’1、Z’2、Z’3...Z’n,其中,n为自然数;
(5)参照经验型数据,选择影响候选药物的可变因素及其变量,所述的可变因素分别以小写字母a’,b’,c’,d’...y’或z’加以表示,其中,可变因素a’的变量选自a’1、a’2、a’3...a’n,可变因素b’的变量选自b’1、b’2、b’3...b’n,可变因素c’的变量选自c’1、c’2、c’3...c’n,可变因素d’的变量选自d’1,d’2,d’3...d’n……,可变因y’的变量选自y’1、y’2、y’3...y’n,可变因z’的变量选自z’1、z’2、z’3...z’n,其中,n为自然数;
(6)采用多维矩阵排列分析步骤(4)中所述的优选出的具有代表性的化合物结构类型A’、B’、C’、D’...Y’或Z’的相应变量与步骤(7)中所述的可变因素a’,b’,c’,d’...y’或z’的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A’B’、B’C’、C’D’...Y’Z’;或
(7)根据需要,参照步骤(4)-(6)所述的方法,采用多维矩阵排列分析优选出的具有代表性的化合物结构类型A’B’、B’C’、C’D’...Y’Z’的相应变量与可变因素a’b’、b’c’、c’d’...y’z’的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型A”B”C”、B”C”D”...X”Y”Z”;或
(8)根据需要,参照步骤(4)-(7)所述的方法,采用多维矩阵排列分析优选出的具有代表性的化合物结构类型A”B”C”、B”C”D”...X”Y”Z”与可变因素a”b”c”、b”c”d”...x”y”z”,再参照结构区域和经验性数据序列的结构对比结果,完成候选药物的结构设计与优化;或
(9)任选地,根据候选药物的设计需要,采用多维矩阵重复进行上述步骤中的部分步骤或全部步骤,以进行候选药物的结构分析、结构确认、结构优化,直至获得所需的候选药物结构类型。
在本发明的优选技术方案中,所述基本结构单元包括分子结构中的任一结构单元,选自饱和或不饱和的单环结构单元、双环结构单元、多环结构单元、取代基、官能团的任一种或其组合;
在本发明的优选技术方案中,所述的单环结构单元选自芳香单环、非芳香单环、取代的芳香单环、取代的非芳香单环的任一种或其组合;
在本发明的优选技术方案中,所述的双环结构单元选自芳香双环、非芳香双环、取代的芳香双环、取代的非芳香双环的任一种或其组合;
在本发明的优选技术方案中,所述的多环结构单元选自芳香多环、非芳香多环、取代的芳香多环、取代的非芳香多环的任一种或其组合,其中,所述环数不少于3;
在本发明的优选技术方案中,所述官能团选自酮、醛、脂、胺、酰胺、单键、双键、三键、卤素、酸、醇、硫醇、磺酸、酚、硫酚的任一种或其组合;
在本发明的优选技术方案中,所述取代基是任何化合物的结构残基,选自烷基、烯基、炔基、羟基、醚基、酯基、芳基、杂芳基、环烷基、杂环基的任一种或其组合。
在本发明的优选技术方案中,所述的可修饰区域是指影响化合物生物活性或者细胞选择性的结构区域。
在本发明的优选技术方案中,所述的经验数据选自靶标生物活性、靶标生物选择性、细胞活性、毒副作用、ADME性质、像药性、可合成性的任一种或其组合。
本发明的优选技术方案中,可根据候选药物的设计需要,采用多维矩阵重复进行步骤(1)-(8),或者步骤(1.1)、(1.2)、(1.3)、(2)-(8)的部分或全部步骤来进行候选药物的结构分析、结构确认、结构优化,直至获得具有所需生物学活性或药理活性的候选药物结构类型。
在本发明的优选技术方案中,所述的经验型数据选自如下数据库任一种或其组合:
1)世界药物研发领域常用蛋白质靶标数据库及其对应的化合物结构类型数据库;或
2)世界药物研发常用蛋白质靶标相对应的化合物结构类型数据库;或
3)药物研发核心结构数据库;或
4)药物分子构架化合物类型数据库;或
5)被验证的具有生物活性的化合物结构类型数据库;或
6)可查询上市药物数据库;或
7)生物等效型数据库;或
8)新陈代谢化合物类型数据库;或
9)毒性化合物结构类型数据库;或
10)中药有效成分化合物类型数据库;或
11)天然产物单体化合物结构数据库;或
12)药物治疗数据库;或
13)医疗关键词数据库。
本发明的另一目的在于提供多维矩阵在药物分子设计中的应用,其特征在于,所述的多维矩阵排列由结构因素与经验型数据共同确定。
优选地,采用多维矩阵排列分析化合物的结构因素的相应变量和可变因素的相应变量,再参照结构区域和经验性数据的结构对比结果,优选出具有代表性的化合物结构类型。
本发明的优选技术方案中,所述的药物分子选自Me-Too类新型药物、药物构架化合物、“像药”型化合物、Hit-To-Lead、先导化合物的任一种或其优化结构。
优选地,在药物分子设计中的应用中,采用前述任一种药物分子设计方法进行药物分子的设计。
发明详细描述
为了清楚表述本发明的保护范围,本发明对下述术语进行解释和说明。
本发明所述的基本结构单元包括分子结构中的任一结构单元,选自饱和或不饱和的单环、双环、多环等环状结构单元、取代基、官能团的任一种或其组合;所述单环结构单元选自芳香单环、非芳香单环、取代的芳香单环、取代的非芳香单环的任一种或其组合;所述的双环结构单元选自芳香双环、非芳香双环、取代的芳香双环、取代的非芳香双环的任一种或其组合;所述的多环结构单元选自芳香多环,非芳香多环,取代的芳香多环,取代的非芳香多环的任一种或其组合,其中,所述环数不少于3;本发明所述的官能团包括酮、醛、脂、胺、酰胺、单键、双键、三键、卤素、酸、醇、硫醇、磺酸、酚、硫酚的任一种或其;所述取代基是任何化合物的结构残基,包括烷基、烯基、炔基、羟基、醚基、酯基、芳基、杂芳基、环烷基、杂环基的任一种或其组合。
目前,药物研发领域拥有的基本结构类型、官能团和元素有30000多种。本发明通过多维矩阵可将这些基本结构类型确定为约500种,将常用官能团确定为30-50种。
本发明所述的“ADME/T”是指化合物在吸收、分布、代谢、排泄、毒性等方面所具有的性质。
本发明所述的可修饰区域是指影响化合物生物活性或者细胞选择性的结构区域。
本发明所述的不可修饰区域是指决定化合物的生物活性或者细胞活性且不能轻易更改或修饰的结构区域。
本发明所述的“暂不予以考虑的部分”是指在候选药物设计后期予以考虑的因素或变量,包括基本环状结构上的取代基,该部分与化合物的某些性质有关,但属于候选药物的附加部分,且其可选变量较多,并对候选药物的可变因素影响较少,通常需将其与相连接的基本环状化合物统一考虑。因此,可在设计后期予以考虑,以有效减少化合物设计中的可变因素量,显著提高化合物的设计效率。
本发明所述的靶标是指对一定适应症具备功效的生物蛋白质,可以按照其生物功效、适应症(如抗癌,心脏病,中枢神经疾病等)、靶标类型(如GPCR、离子通道等)分类。同时,任何生物靶标或者蛋白质都具有一些靶点,相同的靶标对应不同的靶点也对应不同的生物活性或适应症而起到不同的作用,而同一靶点仅对一个生物靶标或适应症具备特别有效的活性。
本发明所述的“目标化合物”又称“参考化合物”、“药物设计目标”或“参照物”,包括已知的对于特定生物靶标和靶点具备一定的生物活性的化合物结构类型,即已知的化合物结构类型。
本发明所述的“已知化合物结构类型”是指已被专利文献或科技文献公开的针对特定生物靶标具有生物活性的化合物结构类型,包括上市药物、处于政府部门申报阶段或临床阶段的候选药物、处于临床前研究阶段的化合物等。
本发明的优选技术方案中,选择目标化合物的途径包括适应症、适应症对应的靶标、被验证的靶标或被广泛接受的靶标或机理明确的靶标、靶标类型或蛋白组(如GPCR、离子通道等)、靶标蛋白质的结构类型、专利文献或科技文献所公开的化合物结构类型。
在本发明的优选技术方案中,所述的目标化合物选自已知的具有特定生物活性的化合物结构、按照靶标代码数据库查询到的化合物结构或对特定靶标有效的化合物结构类型、已知药物或者候选药物等化合物结构类型,包括上市药物、处于临床阶段的候选药物、处于临床前研究的候选药物、先导化合物、具备生物活性的天然产物、中药单体化合物、中药有效成分、被验证的具备生物活性的像药性化合物、计算机辅助药物分子设计(CADD设计化合物)、高通量筛选化合物、已知靶标蛋白质空间立体结构及其靶点区域的空间立体结构的任一种或其组合。
参照目标化合物进行药物分子设计是新型药物的主要研发方向,即将针对靶标设计的化合物结构类型进行化合物结构分子的分析、设计、改造和优化,以得到新的化合物结构类型或先导型化合物结构类型,还可用于验证生物靶标,以及寻找或设计药物化合物新结构(如Me-Too类药物)等。
本发明所述的化合物结构类型是指对于特定生物靶标具备生物活性和结构相似性的系列化合物。
本发明所述的候选药物是指有可能成为上市药物的新化合物结构(new chemicalentity,NCE)。
本发明所述的“化合物结构类型的分析、确定和优化”是指采用多维矩阵来排列、分析影响候选药物可成药性因素的任一种或其组合,实现以最少数目的考虑因素来有效地设计药物分子,得到优化的先导型化合物或者候选药物化合物结构的目的。
本发明所述的靶标生物活性是指化合物对特定生物靶标所具有的生物活性或细胞活性。
本发明所述的靶标生物选择性是指化合物对生物靶标不同靶点的生物活性所具有的选择性。
本发明所述的细胞活性是指化合物对特定细胞的生物活性。
本发明所述的毒副作用是指化合物所具有的毒性和/或副作用。
本发明所述的可合成性是指化合物具备可被合成出来的可行性。
本发明所述的“先导型化合物优化”是指将一个具有特定生物活性的化合物进行结构和性质的优化,以获得具备所需生物活性或细胞活性的候选药物。
目前,化学信息学用于判断化合物的“像药”性,并利用一些总结的物理化学参数来确定化合物的“像药性”,以提高活性化合物(Hit)和先导化合物(Lead)的设计速率。其中,用于确定化合物“像药性”的参数多源自已知药物、处于临床试验阶段候选药物、天然产物等的分析和鉴定结果。
本发明所述的“像药型”(drug like)化合物的含义来自Walters和Murcko(WaltersWP,Stahl MT,and Murcko MA.Virtual Screening:An overview.Drug Discovery Today1998;3:160-78;Walters WP,Murcko A,Murcko MA.Recognizing Molecules with drug-likeproperties.Curr Opin Chem Biol 1999;3:384-7),他们通过对美国药典中所列成药的研究,认为“像药型”化合物的分子结构应与大多数已知药物(成药)的官能团和物理化学性质相一致,现有的“像药”型化合物的性质大多来自于已知药物的研究和总结,但已知药物的结构种类仅涵盖了“像药”型化合物的很少一部分,并不能代表所有的“像药”型化合物的种类和特点。Lipinski(C.A.Lipinski;F.Lombardo;B.W.Dominy and P.J.Feeney(1997).″Experimental and computational approaches to estimate solubility and permeability indrug discovery and development settings″.Adv Drug Del Rev 23:3-25.:Lipinski CA,Lombardo F,Dominy BW,Feeney PJ.Experimental and computational approaches to estimatesolubility and permeability in drug discovery and development settings.Adv Drug Deliv Rev2001;46:3-26)认为:“像药”型化合物应具有充足的,可接受的ADME/T(吸收,分布,新陈代谢,排除和毒性)性质,并要通过I期临床试验,且分布在一个极其广泛的化学空间,大约包含1040-10100个“像药”型化合物,相对于可能的生物靶标,发现一个活性化合物的几率小于1/1014。“像药”化合物的物理性质将在很大程度上决定化合物能否成为活性化合物。Lipinski不仅发明了著名的“5规则”来帮助鉴别和分析“像药”型化合物,并认为在高效筛选时就应考虑药物的ADME/T性质,与传统意义上的化合物优化后期才予以考虑ADME/T性质有所不同。
现有的商业化合物数据库包括下述几种:
1)综合药物化学数据库---Comprehensive Medicinal Chemistry(CMC);
2)世界药物数据库---World Drug Index(WDI);
3)MDDR数据库;
4)调查类药物数据库---Investigational Drug Database(IDDB);
5)商业化合物数据库---Available Compound Databse(ACD/SCD);
6)化学导向数据库---ChemNavigator
7)生物活性天然产物数据库---Biologically Active Natural Products(BDNP)
因此,本领域技术人员可以基于上述数据库获得所述的目标化合物。
在本发明的优选技术方案中,所述的目标化合物为已知药物结构,优选为市场上广泛使用的已知药物,如抗糖尿病药物、心血管药物等。
本发明采用在临床上被广泛验证过的药物化合物结构,针对新型的靶标进行结构优化和改造,设计出新颖的针对特定适应症具有功效的药物化合物结构类型,包括先导型化合物类型等。
本发明所述的“经验型数据”又称“经验型参数”或“实验型参数”,是指在药物研发历史上积累下来的实验验证过的数据,所述经验数据选自靶标生物活性、靶标生物选择性、细胞活性、毒副作用、ADME性质、像药性、可合成性或药代药理参数等,这些经验型数据与化合物的结构密切关联,包括化合物的构效关系,因此,经验型数据的对比过程包含化合物的结构对比和化合物的结构优化等方面。
本发明的经验型数据均是本领域已知的数据库,现例举如下:
1)世界药物研发领域常用蛋白质靶标数据库及其对应的化合物结构类型数据库。处于临床阶段的化合物数据库用于寻求处于临床阶段的化合物相关的信息,以及与结构相关的蛋白质靶标信息,包括靶标的发现,被验证的靶标,蛋白质结构及其与其相关的化合物结构类型,其代表型的数据库包括:
htp://thomsonscientific.jp/products/iddb/index.shtml;
http://www.cancer.gov/cancertopics/factsheet/therapy/investigational-drug-access;
http://science.thomsonreuters.com/support/faq/sddb/;
http://www.centerwatch.com/drug-information/pipeline/;
http://www.pharmaprojects.com/research development analysis/tools.htm;
http://www.pipelinereview.com/store/product info.php?products id=2741;
http://www.bioportfolio.com/store/product/7781/R-d-Drug-Pipeline-Database-2-months- Subscription.html;
http://thomsonreuters.com/products services/science/science products/a-z/pipeline data integrator/;
http://www.ovid.com/site/cstslog/DataBase/1244.jsp;
http://www.imshealth.com/portal/site/imshealth;
http://www.pjbpubs.com/;或
http://www.fda.gov/。
ADME数据库用于研究、总结与化合物的吸收、分布、代谢与排泄等性质相关的结构信息,其代表型数据库包括:
http://www.pharmainformatic.com/html/adme tox predictions.html;
http://www.aureus-sciences.com/aureus/web/guest/adme-overview;
http://jp.fujitsu.com/group/kyushu/services/lifescience/english/asp/admedb/;
https://www.cloegateway.com/services/cloe knowledge/pages/service frontpage.php;
http://www.siritech.com/Cheminformatics.htm;
http://modem.ucsd.edu/adme/databases/databases extend.htm;
http://www.pubpk.org/index.php?title=Main Page;
http://www.pubpk.org/index.php?title=Main Page;
http://www.hmdb.ca/;
http://www.nugo.org/metabolomics/36124;
http://www.genome.jp/kegg/pathway.html;
http://kanaya.naist.jp/KNApSAcK/;
http://accelrys.com/products/databases/bioactivity/metabolite.html和
http://metlin.scripps.edu/。
蛋白质靶标数据库用于寻求和疾病相关的蛋白质靶标的信息,包括靶标的发现,被验证的靶标,蛋白质结构及其与其相关的化合物结构类型,具有代表型的数据库如下:
http:targetdb.pdb.org/
http://www.dddc.ac.cn./pdtd/
http://www.rcsb.org/pdb/home/home.do
http://bidd.nus.edu.sg/group/CJTTD/TTD.asp
http://www.sciclips.com/sciclips/drug-targets-main.do
http://www.ncbi.nlm.nih.gov/genbank/
http://www.ebi.ac.uk./Databases/structure.html
化合物合成方法数据库用于寻求化合物的合成方法及其可行性,具有代表性的数据库如下:https://scifinder.cas.org;http://accelrys.com/products/databases/synthesis/和http:/www.thieme-chemistry.com/en/products/journals/synfacts.html。
天然产物与中药数据库用于寻求天然产物及其中药化合物的结构数据,具有代表性的数据库如下:http://naturaldatabase.therapeuticresearch.com/home.aspx?cs=&s=ND;
http://www.ponderfodder.com/node/113;
http://www.ncbi.nlm.nih.gov/pmc/articles.PMC1347494/;
http://dnp.chemnetbase.com/intro/index.jsp;jsessionid=80C9568C977F47200197BE482
13AC51A;
http://www.heterocycles.jp/structure/structure.php;http://www.chemnetbase.com/;
http://www.gfmer.ch/TMCAM/TNCAM database system.htm;
http://www.rmhiherbal.org/ai/pharintro.html;
http://tcm.cmu.edu.tw/about01.php?menuid=1;和
http://tcm.cz3.nus.edu.sg/group/TCMsite/Default.aspx
“像药”型化合物、具有生物活性化合物数据库用于寻求“像药”型化合物和具有生物活性的化合物的信息,具有代表性的数据库如下:
http://accelrys.com/products/databases/bioactivity/mddr.html;
http://accelrys.com/products/databases/bioactivity/comprehensive-medinal-chemistry.h tml;
http://www.chemnavigator.com/和
http://accelrys.com/products/databases/sourcing/screening-compounds-directory.html。
药物毒副作用数据库用于寻求化合物的毒性、副作用等特性的数据库,其代表性数据库包括:
http://databases.biomedcentral.com/browsesubiect/?sub id=1013;
http://www.drugs.com/;http://sideeffecta.embl.de/;
http://www.pdrhealth.com/drugs/drugs-index.aspx;
http://www.drugs.com/drug interactions.html;
http://www.pdrhealth.com/home/home.aspx;
http://www.rphworld.com/link-350.html;http://toxnet.nlm.nih.gov/;
http://bioinf.xmu.edu.cn/databases/ADR/index.html;
http://ctd.mdib.org/和http://accelrys.com/products/databases/bioactivity/toxicity.html。
已知药物数据库可以提供相关药物的基本信息,包括蛋白质靶标机理、药物分子结构、药代药理性质、毒副作用、药物相互作用等信息,其代表性数据库包括:
http://www.drugbank.ca/;http://www.nlm.nih.gov/medlineplus/druginformation.html;
http://chrom.tutms.tut.ac.jp/JINNO/DRUGDATA/00database.html;
http://www.rxlis.com/script/main/hp.asp;
http://www.accessdata.fda.gov/scripts/cder/drugsatfda/;
http://www.fda.gov/Drugs/InformationOnDrugs/ucm142438.htm;
http://www.ncbi.nlm.nih.gov/pubmed/;http://www.webmd.com/;
htt://www.3dchem.com/atoz.asp;http://www.drugs.com/和
http://www.pdrhealth.com/home/home.aspx。
本发明的优选技术方案中,采用多维矩阵法设计候选药物时首先进行目标化合物的结构确认,即按照分子结构基本单元拆分化合物的分子结构,再参照经验数据的结构比对分析和结构优化结果,以寻求数量最少的可改变区域或可修饰区域。
作用于生物靶标的化合物结构类型多具备特定的结构母核,该结构母核体现了化合物针对特定靶标的生物活性,其中,化合物结构母核的空间结构应与靶标蛋白质的立体结构相匹配,二者的匹配程度也是决定化合物生物活性的主要因素;结构母核上的杂原子分布与化合物的生物选择性相关;结构母核的官能团分布与其生物活性和选择性相关,而任何杂原子和官能团在化合物结构的分布均有可能影响化合物的药代、药理和毒副作用等性能。
另外,不同的母核结构类型对某一特定生物靶标具有生物活性,其决定因素是化合物的空间立体分子结构和蛋白质空间立体结构。因此,化合物的结构设计过程需进行分子结构对比,可参照化学基因工程的技术扩大化合物结构对比的范围,并增加考虑因素,以进一步验证生物靶标,并寻找新的先导型化合物结构类型。
在设计药物分子时,需要考虑众多因素,所述考虑因素包括适应症、生物活性、可合成性、理化性质、稳定性、新陈代谢、药代、药理、毒副反应的任一种或其组合。如何有效地评价和分析相关影响因素是药物设计的主要工作,并且,设计不同的参照物需要考虑的影响因素或其顺序存在不同,有时需反复考虑一些影响因素。
当以目标化合物为基础设计候选药物时,应尽量不改变甚至增加其生物活性和选择性,并通过合理的结构修饰以改善甚至提高其药代药理性质,降低其毒副作用,其中,设计需要考虑因素包括:
A.蛋白质靶标(又称“生物靶标”);或
B.靶标的验证状态;或
C.作用于特定靶标的化合物结构类型;或
D.被验证的具备生物活性的“像药“型化合物结构类型;或
E.已知药物的化合物结构类型;或
F.处于临床研究阶段的候选药物的化合物结构类型;或
G.处于临床前研究阶段的候选药物的化合物结构类型;或
H.天然产物的化合物结构类型;或
I.中药有效成分的化合物结构类型;或
I.生物等效性化合物结构类型;或
K.新陈代谢物结构类型;或
L.药代药理分子结构类型;或
M.毒性化合物结构类型;或
N.基本化合物结构单元类型;或
O.基本化合物官能团结构类型;或
P.合成方式的任一种或其组合。
在本发明的优选技术方案中,当需要保持甚至改善化合物的生物活性和选择性时,需要考虑的因素选自A、B、C、D、E、F、G、H、I、K、P的任一种或其组合。
在本发明的优选技术方案中,当需要保持甚至改善化合物的空间结构时,需要考虑的因素选自A、D、E、H、I、N、O、P的任一种或其组合。
在本发明的优选技术方案中,当需要保持甚至改善化合物的新陈代谢时,考虑的因素选自E、F、H、I、K、N、O、P的任一种或其组合。
在本发明的优选技术方案中,当需要保持甚至改善化合物的药代药理性质时,考虑的因素选自D、E、F、G、H、I、L、P的任一种或其组合。
在本发明的优选技术方案中,当需要降低化合物的毒副作用时,考虑的因素选自E、F、G、H、I、L、M、P的任一种或其组合。
采用多维矩阵设计化合物的分子结构时,可单独考虑因素A-P的任一种或其组合,其目的是有效地组合不同的因素,从而确定目标化合物的结构类型,并可采用多维矩阵法来分析化合物结构。
在本发明的优选技术方案中,所述靶标为12000-15000种源自Genebank,TargetDB,Threapuetic Target DB,DART,PDTD,TRMP、其他相关数据库等,包括被验证的靶标、被广泛使用的靶标等,以确定靶标对应的化合物结构,并设计出新颖的药物化合物结构类型、新颖的先导型化合物类型等。
在本发明的优选技术方案中,所述目标化合物选自来自天然产物或中药有效成分的化合物结构类型,可以结合其传统药物的特性,将其与靶标蛋白质结构进行结构对比和结构优化,寻找出有效的新化合物结构类型或先导型化合物结构类型,其中,所述的天然产物源自The Directory of Natural Product,Tradional Chinese Medicine Databas,NaturalProduct Database等数据库。
本发明的优选技术方案中,将有效的化合物结构类型与生物靶标进行结构分析和对比,以寻求对该生物靶标具备活性的新化合物结构类型,其中,所述有效的化合物为经过验证的具备一定生物活性的化合物结构类型,并在化学空间内代表最大数目的化合物结构,包括天然产物,以及已知的、可查询到的、来源于文献和相关数据库(包括PubMed,CMC,MDDR,IDDB,Scifinder,Chemnivagator等)的化合物结构等。
与现有技术相比,本发明的有益效果包括:
1、本发明采用多维矩阵法系统的分析、设计和优化化合物的分子结构,以显著提高候选药物分子设计的全面性、针对性、准确性、系统性和设计效益。
2、本发明结合高效的药物分子设计,并采用广泛使用的已知药物验证本发明的候药物设计方法,显著提高了人们对于候选药物分子结构和性质性能之间关联性质的认识,更加系统和完善地提高SAR的统计效力,并大幅度地降低药物分子设计的研发投入。
3、本发明系统地、全面地和合理地总结和使用药物研发经验型数据,并深入地和系统地完善候选药物的设计、结构对比、结构确认和结构优化技术,显著提高了药物分子设计的针对性、有效性和效益。
实施例1卡托普利系列化合物的结构优化
以卡托普利为目标化合物进行药物分子结构设计的方法,具体步骤如下:
1)将卡托普利按照基本结构单元进行结构分区,分为A,B,C,D,E五个区域;
2)参照和比对经验型数据,确定E区域为关键核心区域,其酰胺、邻位的酸基及其杂环属于核心结构范畴,需要尽量保留。考虑其决定靶标生物活性/细胞活性的功效,确认E区域为不可修饰区域,而A,B,C,D为分子设计的可修饰区域;
3)根据影响候选药物的可变因素来确定候选药物的可修饰区域。具体过程如下:
①A区域,参照和比对经验型数据可知,巯基(SH)官能团具有较强的还原性,在新陈代谢、剂型、稳定性、毒性和副作用等方面均不是比较合适的官能团,可将其替代为OH,NHR,NH2,SOR,SO2R,SO3H,SO3R,COOH,COOR或其杂环基本结构等。
②B区域,参照和比对经验型数据可知,增加碳链和替代元素是需要考虑的范畴,可替代的元素包括:O,N,S及杂环基本单元。
③C区域:参照和比对经验型数据可知,其立体化学结构需要保留,而替换甲基可用于增加化合物的“像药”性,尤其在药代药理方面。可以替换的官能团为:任何芳香或者非芳香官能团。
④D区域:参照和比对经验型数据可知,其立体化学需要保留,并需考虑不同类型的环结构及其双环结构。需要考虑的单环环状结构类型(包括杂环)包括:4元环,5元环,6元环,7元环,8元环或其杂环等,需要考虑的双环结构(包括杂环)包括:4-5类型,5-5类型,5-6类型,5-7类型,5-8类型,6-5类型,6-6类型,6-7类型,6-8类型或其杂环等。
根据经验型数据的分析,5-6类型为最佳选择,再需考虑其药代药理,像药性,已知药物结构对比,天然产物结构对比,等效性等可变因素,选择5-6类型和6-6类型最为合理,其中,主要考虑非芳香环,其次是芳香环或非芳香环。
4)根据经验型数据,选择影响药物的可变因素及其变量,具体过程如下:
A区域需要考虑的经验数据参数a的范围为靶标生物选择性,毒副作用,ADME性质,像药性,可合成性。
主要的考虑范围需要参照经验型数据库的支持,包括生物等效性,新陈代谢数据库,“像药”型化合物数据库,已知药物数据库,临床药物数据库等。根据SH的特性,可以确定经验参数a使用的官能团为:SOR,SO2R,SO3H,COOH,COOR和环状基本结构。其中,SOR在稳定性方面存在着问题;SO3H和COOH作为强酸性官能团,在“像药”型方面和已知药物结构对比方面存在着问题;常用的药代药理手段为SO3R,用来调节结构因素,但SO3R同样存在着化学不稳定性,在一定的酸性条件下会转化为SO3H;COOR具有一定程度的化学稳定性,为最佳选择。参照天然产物的结构和性质,此区域部分可以考虑使用环状结构类型来减少可旋转化学键的数目,可以选择的环类型为6-8元环。
B区域要考虑的经验数据参数b的范围为靶标生物选择性,ADME性质,可合成性。
B区域中的O,N,S等官能团和COOR的结合,会形成尿素类化合物结构类型,不完全符合“像药”型化合物结构,而增加碳链,不仅仅可以满足稳定性的要求,还在调节化合物的药代药理性方面具备一定的优越性,且增加的碳链应该为1-2个碳,以符合化合物的空间结构类型。
C区域要考虑的经验数据参数c的范围为靶标生物选择性,ADME性质,可合成性。
D区域要考虑的经验数据参数d的范围为靶标生物选择性,毒副作用,ADME性质,可合成性。
5)根据每个结构区域和经验性数据序列的结构对比结果,选出具有代表性的化合物结构类型,具体如下:
通过Aa矩阵的对比分析可以确定,A区域的结构类型代表为COOR或6-8元环结构。
通过Bb矩阵的对比分析可以确定,B区域的结构类型代表为碳链结构。
通过Cc矩阵的对比分析可以确定,C区域的结构类型代表为任何芳香或者非芳香官能团。
通过Dd矩阵的对比分析可以确定,D区域的结构类型代表为单环或双环结构。
6)根据经验型数据的对比分析结构,多维矩阵的第二层考虑如下:
AB组合需要考虑的经验数据参数ab的范围为靶标生物选择性,毒副作用,ADME性质,像药性,可合成性。
具体确定A部分为酸基(COOH)、脂基(COOR)或酰胺基(COONHR),同时结合B区域为加长链,如烷基(CH2-CH2,CH2-CH2-CH2),醚基(CH2-O)或者胺基(CH2-N)。
BC组合需要考虑的经验数据参数bc范围为靶标生物活性/选择性,ADME性质,像药性,可合成性。具体B区域和AB组合一样,而C区域可以选择长链取代基,这部分需要和可合成性紧密结合。
CD组合需要考虑的经验数据参数cd的范围为靶标生物选择性,ADME性质,像药性,可合成性。C区域应该和BC组合一样,而D区域考虑饱和或者不饱和环状结构,避免单一取代基。
两层综合考虑,A区域需要考虑部分为酸基(COOH),脂基(COOR),或者是酰胺基(COONHR),B区域考虑如烷基(CH2-CH2,或者CH2-CH2-CH2),醚基(CH2-O)或者胺基(CH2-N),C区域为长链取代基,而D区域为饱和或者不饱和单环或双环结构。
7)根据经验型数据的对比分析结构,多维矩阵的第三层考虑如下:
ABC组合需要考虑的经验数据参数abc的范围为靶标选择性,ADME性质,毒副作用,像药性,可合成性,可以确定A=COOH或者COOR;B=CH2或者CH2-CH2;C=CH3或者长链取代基。
BCD组合需要考虑的经验数据参数bcd的范围为靶标选择性,ADME性质,像药性,可合成性,可以确定B=CH2或者CH2-CH2;C=CH3或者长链取代基,D=5-5双环,6-5双环,同时D区域5元环可以做开环考虑。
8)根据经验型数据的对比分析结构,多维矩阵的第四层考虑如下:
ABCD组合需要考虑的经验数据abcd的范畴为靶标生物活性/选择性,毒副作用,ADME性质,像药性,可合成性,可将ABCD分为:
A=COOH,COOR;B=CH2-CH2;C=CH3或者长链取代;D=单5元环,5-5双环,6-5双环,5元环开链组合。
(9)根据经验型数据的对比分析结果,可以确定如下具体结构化合物,见表1。
表1 卡托普利系列化合物的结构优化