CN102693356B

CN102693356B - 多维矩阵用于药物分子设计的应用及药物分子设计方法

Info

Publication number: CN102693356B
Application number: CN201210100820.9A
Authority: CN
Inventors: 闫京波; 霍秀敏
Original assignee: 闫京波; 霍秀敏
Current assignee: Zhonglian Industry Co., Ltd.
Priority date: 2011-04-11
Filing date: 2012-04-09
Publication date: 2015-05-27
Anticipated expiration: 2032-04-09
Also published as: EP2698733A4; WO2012139421A1; EP2698733A1; US20140032198A1; CN102693356A

Abstract

本发明涉及多维矩阵用于设计药物的应用及药物设计方法，该方法首次将数学的矩阵优化理念应用于药物及其相关的分子设计领域，并采用多维矩阵将影响药物化学结构及其性能的因素进行聚类和组合，从而将药物研发过程中需要考虑的大量因素按照一定的特性进行归类和对比，使用少量的变数来代表数量巨大的变数，以针对性地获取有效的药物化学结构，并改善化合物的理化性能，再将其与已有的药物经验数据进行结构比对，进一步优化药物的化学分子结构，以显著提高药物设计的针对性和设计效率，并显著提高合成效率。

Description

多维矩阵用于药物分子设计的应用及药物分子设计方法

技术领域

本发明属于药物分子设计方法领域，尤其涉及多维矩阵用于药物分子设计的应用及药物分子设计方法。

背景技术

近100年来，药物研发经历了下述阶段，1)标靶发现；2)标靶验证；3)高通量筛选(High Throughput Screening)；4)Hit-to-Lead；5)先导化合物；6)临床研究等，其中，靶标验证阶段和药物分子设计被公认为药物研发的技术瓶颈。

上世纪末和本世纪初，基因工程和蛋白质工程取得了长足进步。其中，基因工程发现了大约12000-15000种新型的靶标蛋白质类型，但使用这些新型靶标开发出来的新型药物的预期效果与其实际疗效之间的偏差非常大，导致世界制药和药物研发行业遭遇巨大的损失并深感困惑。目前，世界药物研发行业主要运用的还是被广泛验证过的300-500个生物靶标类型，并有多种药物筛选合成方法被广泛地加以应用。

高通量筛选(HTS)是当前药物研发中广泛应用的药物筛选手段。研究大型数据库的结果表明，用于药物研发过程的高通量筛选化合物种类有1500-2000万。尽管高通量筛选可通过自动化设备每天筛选出12万个以上的化合物，但其又受到诸多技术限制：1)生物靶标的精确性，需要在微量下具备精确度的可用于自动化过程的生物靶标；2)检测手段的提高，需要高分辨度的检测设备，如高质量基因芯片；3)高质量的化合物收藏，一般包括300-500万种精选的化合物，如具有像药型特性的高质量化合物，药物研发项目相关的化合物等，不仅需要考虑化合物的质量与纯度，还要考虑化合物结构类型可代表的化学空间化合物数量，包括化合物的多样性(Diversity)与像药性(Drug Likeness)等。

“像药”型化合物的分子设计和开发将成为世界制药行业的研发重点之一。像药型化合物的可能药物分子数目为10⁶³，该方法所面临的主要困难是如何从中有效寻找具备特定生物功效的化合物结构类型？如何使“像药”型化合物代表的化学空间有效的与蛋白靶标所代表的生物空间紧密地结合，增加新型化合物结构种类和数目？其开发的局限性在于，分子设计的有效性和可利用的药物构架化合物(Building Block)种类的多样性，并成为药物研发的另一个重要瓶颈。

Hit-to-Lead成为药物研发的主要手段，并在近几年正式引入药物研发产业链。该方法先通过高通量筛选“像药型”化合物，以确认一组活性化合物(“Hit”)，再评估和优化活性化合物以获得先导化合物(“Lead”)，并经多次筛选和优化先导化合物结构类型，以有效和准确地在高通量筛选的结果中优化出针对于特定生物靶标具备可成药性的化合物结构。通常，从化合物的合成、筛选、药效药理学、完成化合物的结构优化需要耗费4-6年，并需要开展大量的分子设计和分子结构对比工作，故存在系统性较差，需与分子设计理念相结合等缺陷。

目前，先导性化合物的优化又成为药物研发的关键，将优化后的先导性化合物进行分子设计和分子结构对比，以获得核心的化合物结构，再通过结构修饰以实现下述效果：1)最大程度增加对于特定靶标的生物活性；2)在保持对特定靶标生物活性的同时，具有选择性；3)增加对特定细胞的功能和活性；4)优化化合物的体内试验效果；5)调节化合物的吸收、分布、代谢、排泄、毒性(ADME/T)等特性；6)配合和满足化合物在制剂、给药方式、输送系统、生物利用度等方面的需求。

然而，已有的先导化合物的优化过程比较机械和繁琐，涉及调整先导化合物的取代基、杂原子成分、分子形状等方面的结构修饰，使其具备“像药”性。通常，需针对1-3个具有核心结构的化合物进行结构改造，再研究化合物结构与其生物活性之间的关系(SAR)，并结合化合物的药代药理毒副作用等性质来优化化合物结构，多需要合成5000个以上的化合物，化合物分子的设计效率较低，并存在没有有效地利用现有的药物研究数据与药物研究手段等缺陷。

“针对”性小型化合物收藏(Focused Library)也是目前用来提高药物筛选效率的方法之一，该方法约包含500-2,000个化合物，主要针对特定的化合物靶标并以靶标(TargetOrientated)、多样性(Diversity Orientated)、天然产物(Natural Product Orientated)、化合物基本结构单元(Fragment Orientated)等为基础进行化合物的设计。但这些设计均以药物生物活性相关的单一因素为基础，很少考虑因素之间的关联性，也没有考虑与其它影响化合物像药性的结构进行相对量化的综合对比和评估，更没有充分利用已有的经验数据。因此，该收藏中的化合物分子设计趋于单一，严重影响化合物结构的设计效率。

尽管世界药物研发领域投入大量的人力物力开发了很多新技术，旨在提高药物的研发效率，但是，如何提高药物设计的有效性、针对性与设计效率，使之更加有效、实用与便利，如何合理地进行化合物结构对比，如何在分子设计时综合利用和考虑影响药物分子生物活性和理化性质的多种因素及其关联性等，如何将影响化合物结构与特性的诸多因素进行综合分析与评估，显著提高药物分子的设计效率，仍是药物研发领域急待解决的技术问题。

发明内容

为了加快药物研发的进程，尤其是加速国内药物研发和世界接轨的进程，显著提高候选药物的设计效率，发明人研究获得了多维矩阵用于分子设计的方法和技术平台。该平台首次将数学的矩阵优化理念使用在药物及其相关的分子设计领域，并通过将药物研发过程中需要考虑的大量因素按照一定的特性进行归类和对比，从而使用少量的变数来代表数量巨大的变数，以提高药物研发分子的设计效率及其合成效益。

多维矩阵分子设计的理念在于，任何药物分子都是由所谓的化合物基本结构单元组合而成的，通过对300万种高价值的“像药’型化合物按照28000种化合物基本结构单元进行化合物结构分类，然后进行结构分析，结果表明化合物基本结构单元组成药物分子的方式呈现矩阵和多维矩阵的排列、组合方式。同时，天然产物和中药有效成分单体化合物结构的结构分类分析结果表明，合成化合物的基本结构单元的组合方式与天然产物化合物的结构组合方式极具相似性。因此，在药物分子设计时，将已知化合物结构的各种经验型数据进行结构对比，可以大大提高药物分子设计的针对性和有效性。

多维矩阵分子设计平台为药物及其相关的分子设计提供了一个系统化的矩阵模式的结构对比和结构优化的方法。该方法采用多维矩阵排列分析化合物的结构因素的相应变量和可变因素的相应变量，再参照结构区域和经验性数据的结构对比结果，优选出具有代表性的化合物结构类型，以显著地减少需要合成的化合物数量，并快速获得所需的具有生物学活性或特定药物活性的候选药物，从而显著提高化合物分子的设计效率和效益。

本发明采用多维矩阵并参照目标化合物结构优化候选药物结构和完成候选药物分子设计的方法可用于Me-Too类新型药物、药物构架化合物、“像药”型化合物、Hit-To-Lead、先导化合物优化等方面，可以最少变量和最少数量的化合物合成来获得最佳的候选药物，具有很强的设计针对性，显著地提高药物的设计效率和研发效益，并显著缩减研发时间和研发费用。

为了实现本发明的发明目的，本发明提供如下技术方案：

1.一种优化候选药物分子结构的方法，包括如下步骤：

(1)将目标化合物按照基本结构单元进行结构分区，并分别以大写字母A，B，C，D...Y或Z代表相应的结构区域，并确定候选药物的可修饰区域，分别选择可修饰区域中可选择的变量，其中，可修饰区域A的变量选自A1、A2、A3...An，可修饰区域B的变量选自B1、B2、B3...Bn，可修饰区域C的变量选自C1、C2、C3...Cn，可修饰区域D的变量选自D1，D2，D3...Dn……，可修饰区域Y的变量选自Y1、Y2、Y3...Yn，可修饰区域Z的变量选自Z1、Z2、Z3...Zn，其中，n为自然数；

(2)参照经验型数据，选择影响候选药物的可变因素及其变量，所述的可变因素分别以小写字母a，b，c，d...y或z加以表示，其中，可变因素a的变量选自a1、a2、a3...an，可变因素b的变量选自b1、b2、b3...bn，可变因素c的变量选自c1、c2、c3...cn，可变因素d的变量选自d1，d2，d3...dn，……，可变因素y的变量选自y1、y2、y3...yn，可变因素z的变量选自z1、z2、z3...zn，其中，n为自然数；

(3)采用多维矩阵排列分析步骤(1)中所述的可修饰结构区域A，B，C，D...Y或Z的相应变量与步骤(2)中所述的可变因素a，b，c，d...y或z的相应变量，再参照结构区域和经验型数据的结构对比结果，优选出具有代表性的化合物结构类型代表A’、B’、C’、D’...Y’或Z’，完成候选药物的结构设计与优化。

优选步骤(1)中的可修饰区域的确定通过经验型数据的对比分析结构进行。

在本发明的优选技术方案中，所述的方法还包括如下步骤：

(1.1)将目标化合物按照基本结构单元进行结构分区；

(1.2)参照经验型数据，确定影响候选药物分子靶标生物活性/细胞活性的结构部分，将其作为不可修饰区域；

(1.3)对目标化合物结构进行分析与结构确认，确定候选药物的可修饰区域，分别以大写字母A，B，C，D...Y或Z代表相应的结构区域，分别选择可修饰区域可选择的变量，其中，可修饰区域A的变量选自A1、A2、A3...An，可修饰区域B的变量选自B1、B2、B3...Bn，可修饰区域C的变量选自C1、C2、C3...Cn，可修饰区域D的变量选自D1，D2，D3...Dn……，可修饰区域Y的变量选自Y1、Y2、Y3...Yn，可修饰区域Z的变量选自Z1、Z2、Z3...Zn，n为自然数；

(2)参照经验型数据，选择影响候选药物的可变因素及其变量，所述的可变因素分别以小写字母a，b，c，d...y或z加以表示，其中，可变因素a的变量选自a1、a2、a3...an，可变因素b的变量选自b1、b2、b3...bn，可变因素c的变量选自c1、c2、c3...cn，可变因素d的变量选自d1，d2，d3...dn……，可变因素y的变量选自y1、y2、y3...yn，可变因素z的变量选自z1、z2、z3...zn，n为自然数；

(3)采用多维矩阵排列分析步骤(1.3)中所述的可修饰结构区域A，B，C，D...Y或Z的相应变量与可变因素a，b，c，d...y或z的相应变量，再参照结构区域和经验性数据的结构对比结果，优选出具有代表性的化合物结构类型代表A’、B’、C’、D’...Y’或Z’。

在本发明的优选技术方案中，所述的方法还包括如下步骤：

在上述步骤(1)或(1.3)确定可修饰区域的同时，排除修饰暂不予考虑的部分，所述的暂不予考虑的部分选自环状结构上的取代基、像药型化合物不应具有的官能团和结构类型的任一种或其组合。

在本发明的优选技术方案中，所述方法还进一步包括如下任一或全部步骤：

(4)对步骤(3)优选出的具有代表性的化合物结构类型A’、B’、C’、D’...Y’或Z’的结构进行分析与结构确认，确定其可选择的变量，其中，可修饰区域A’的变量选自A’1、A’2、A’3...A’n，可修饰区域B’的变量选自B’1、B’2、B’3...B’n，可修饰区域C’的变量选自C’1、C’2、C’3...C’n，可修饰区域D’的变量选自D’1，D’2，D’3...D’n……，可修饰区域Y’的变量选自Y’1、Y’2、Y’3...Y’n，可修饰区域Z’的变量选自Z’1、Z’2、Z’3...Z’n，其中，n为自然数；

(5)参照经验型数据，选择影响候选药物的可变因素及其变量，所述的可变因素分别以小写字母a’，b’，c’，d’...y’或z’加以表示，其中，可变因素a’的变量选自a’1、a’2、a’3...a’n，可变因素b’的变量选自b’1、b’2、b’3...b’n，可变因素c’的变量选自c’1、c’2、c’3...c’n，可变因素d’的变量选自d’1，d’2，d’3...d’n……，可变因y’的变量选自y’1、y’2、y’3...y’n，可变因z’的变量选自z’1、z’2、z’3...z’n，其中，n为自然数；

(6)采用多维矩阵排列分析步骤(4)中所述的优选出的具有代表性的化合物结构类型A’、B’、C’、D’...Y’或Z’的相应变量与步骤(7)中所述的可变因素a’，b’，c’，d’...y’或z’的相应变量，再参照结构区域和经验性数据的结构对比结果，优选出具有代表性的化合物结构类型A’B’、B’C’、C’D’...Y’Z’；或

(7)根据需要，参照步骤(4)-(6)所述的方法，采用多维矩阵排列分析优选出的具有代表性的化合物结构类型A’B’、B’C’、C’D’...Y’Z’的相应变量与可变因素a’b’、b’c’、c’d’...y’z’的相应变量，再参照结构区域和经验性数据的结构对比结果，优选出具有代表性的化合物结构类型A”B”C”、B”C”D”...X”Y”Z”；或

(8)根据需要，参照步骤(4)-(7)所述的方法，采用多维矩阵排列分析优选出的具有代表性的化合物结构类型A”B”C”、B”C”D”...X”Y”Z”与可变因素a”b”c”、b”c”d”...x”y”z”，再参照结构区域和经验性数据序列的结构对比结果，完成候选药物的结构设计与优化；或

(9)任选地，根据候选药物的设计需要，采用多维矩阵重复进行上述步骤中的部分步骤或全部步骤，以进行候选药物的结构分析、结构确认、结构优化，直至获得所需的候选药物结构类型。

在本发明的优选技术方案中，所述基本结构单元包括分子结构中的任一结构单元，选自饱和或不饱和的单环结构单元、双环结构单元、多环结构单元、取代基、官能团的任一种或其组合；

在本发明的优选技术方案中，所述的单环结构单元选自芳香单环、非芳香单环、取代的芳香单环、取代的非芳香单环的任一种或其组合；

在本发明的优选技术方案中，所述的双环结构单元选自芳香双环、非芳香双环、取代的芳香双环、取代的非芳香双环的任一种或其组合；

在本发明的优选技术方案中，所述的多环结构单元选自芳香多环、非芳香多环、取代的芳香多环、取代的非芳香多环的任一种或其组合，其中，所述环数不少于3；

在本发明的优选技术方案中，所述官能团选自酮、醛、脂、胺、酰胺、单键、双键、三键、卤素、酸、醇、硫醇、磺酸、酚、硫酚的任一种或其组合；

在本发明的优选技术方案中，所述取代基是任何化合物的结构残基，选自烷基、烯基、炔基、羟基、醚基、酯基、芳基、杂芳基、环烷基、杂环基的任一种或其组合。

在本发明的优选技术方案中，所述的可修饰区域是指影响化合物生物活性或者细胞选择性的结构区域。

在本发明的优选技术方案中，所述的经验数据选自靶标生物活性、靶标生物选择性、细胞活性、毒副作用、ADME性质、像药性、可合成性的任一种或其组合。

本发明的优选技术方案中，可根据候选药物的设计需要，采用多维矩阵重复进行步骤(1)-(8)，或者步骤(1.1)、(1.2)、(1.3)、(2)-(8)的部分或全部步骤来进行候选药物的结构分析、结构确认、结构优化，直至获得具有所需生物学活性或药理活性的候选药物结构类型。

在本发明的优选技术方案中，所述的经验型数据选自如下数据库任一种或其组合：

1)世界药物研发领域常用蛋白质靶标数据库及其对应的化合物结构类型数据库；或

2)世界药物研发常用蛋白质靶标相对应的化合物结构类型数据库；或

3)药物研发核心结构数据库；或

4)药物分子构架化合物类型数据库；或

5)被验证的具有生物活性的化合物结构类型数据库；或

6)可查询上市药物数据库；或

7)生物等效型数据库；或

8)新陈代谢化合物类型数据库；或

9)毒性化合物结构类型数据库；或

10)中药有效成分化合物类型数据库；或

11)天然产物单体化合物结构数据库；或

12)药物治疗数据库；或

13)医疗关键词数据库。

本发明的另一目的在于提供多维矩阵在药物分子设计中的应用，其特征在于，所述的多维矩阵排列由结构因素与经验型数据共同确定。

优选地，采用多维矩阵排列分析化合物的结构因素的相应变量和可变因素的相应变量，再参照结构区域和经验性数据的结构对比结果，优选出具有代表性的化合物结构类型。

本发明的优选技术方案中，所述的药物分子选自Me-Too类新型药物、药物构架化合物、“像药”型化合物、Hit-To-Lead、先导化合物的任一种或其优化结构。

优选地，在药物分子设计中的应用中，采用前述任一种药物分子设计方法进行药物分子的设计。

发明详细描述

为了清楚表述本发明的保护范围，本发明对下述术语进行解释和说明。

本发明所述的基本结构单元包括分子结构中的任一结构单元，选自饱和或不饱和的单环、双环、多环等环状结构单元、取代基、官能团的任一种或其组合；所述单环结构单元选自芳香单环、非芳香单环、取代的芳香单环、取代的非芳香单环的任一种或其组合；所述的双环结构单元选自芳香双环、非芳香双环、取代的芳香双环、取代的非芳香双环的任一种或其组合；所述的多环结构单元选自芳香多环，非芳香多环，取代的芳香多环，取代的非芳香多环的任一种或其组合，其中，所述环数不少于3；本发明所述的官能团包括酮、醛、脂、胺、酰胺、单键、双键、三键、卤素、酸、醇、硫醇、磺酸、酚、硫酚的任一种或其；所述取代基是任何化合物的结构残基，包括烷基、烯基、炔基、羟基、醚基、酯基、芳基、杂芳基、环烷基、杂环基的任一种或其组合。

目前，药物研发领域拥有的基本结构类型、官能团和元素有30000多种。本发明通过多维矩阵可将这些基本结构类型确定为约500种，将常用官能团确定为30-50种。

本发明所述的“ADME/T”是指化合物在吸收、分布、代谢、排泄、毒性等方面所具有的性质。

本发明所述的可修饰区域是指影响化合物生物活性或者细胞选择性的结构区域。

本发明所述的不可修饰区域是指决定化合物的生物活性或者细胞活性且不能轻易更改或修饰的结构区域。

本发明所述的“暂不予以考虑的部分”是指在候选药物设计后期予以考虑的因素或变量，包括基本环状结构上的取代基，该部分与化合物的某些性质有关，但属于候选药物的附加部分，且其可选变量较多，并对候选药物的可变因素影响较少，通常需将其与相连接的基本环状化合物统一考虑。因此，可在设计后期予以考虑，以有效减少化合物设计中的可变因素量，显著提高化合物的设计效率。

本发明所述的靶标是指对一定适应症具备功效的生物蛋白质，可以按照其生物功效、适应症(如抗癌，心脏病，中枢神经疾病等)、靶标类型(如GPCR、离子通道等)分类。同时，任何生物靶标或者蛋白质都具有一些靶点，相同的靶标对应不同的靶点也对应不同的生物活性或适应症而起到不同的作用，而同一靶点仅对一个生物靶标或适应症具备特别有效的活性。

本发明所述的“目标化合物”又称“参考化合物”、“药物设计目标”或“参照物”，包括已知的对于特定生物靶标和靶点具备一定的生物活性的化合物结构类型，即已知的化合物结构类型。

本发明所述的“已知化合物结构类型”是指已被专利文献或科技文献公开的针对特定生物靶标具有生物活性的化合物结构类型，包括上市药物、处于政府部门申报阶段或临床阶段的候选药物、处于临床前研究阶段的化合物等。

本发明的优选技术方案中，选择目标化合物的途径包括适应症、适应症对应的靶标、被验证的靶标或被广泛接受的靶标或机理明确的靶标、靶标类型或蛋白组(如GPCR、离子通道等)、靶标蛋白质的结构类型、专利文献或科技文献所公开的化合物结构类型。

在本发明的优选技术方案中，所述的目标化合物选自已知的具有特定生物活性的化合物结构、按照靶标代码数据库查询到的化合物结构或对特定靶标有效的化合物结构类型、已知药物或者候选药物等化合物结构类型，包括上市药物、处于临床阶段的候选药物、处于临床前研究的候选药物、先导化合物、具备生物活性的天然产物、中药单体化合物、中药有效成分、被验证的具备生物活性的像药性化合物、计算机辅助药物分子设计(CADD设计化合物)、高通量筛选化合物、已知靶标蛋白质空间立体结构及其靶点区域的空间立体结构的任一种或其组合。

参照目标化合物进行药物分子设计是新型药物的主要研发方向，即将针对靶标设计的化合物结构类型进行化合物结构分子的分析、设计、改造和优化，以得到新的化合物结构类型或先导型化合物结构类型，还可用于验证生物靶标，以及寻找或设计药物化合物新结构(如Me-Too类药物)等。

本发明所述的化合物结构类型是指对于特定生物靶标具备生物活性和结构相似性的系列化合物。

本发明所述的候选药物是指有可能成为上市药物的新化合物结构(new chemicalentity，NCE)。

本发明所述的“化合物结构类型的分析、确定和优化”是指采用多维矩阵来排列、分析影响候选药物可成药性因素的任一种或其组合，实现以最少数目的考虑因素来有效地设计药物分子，得到优化的先导型化合物或者候选药物化合物结构的目的。

本发明所述的靶标生物活性是指化合物对特定生物靶标所具有的生物活性或细胞活性。

本发明所述的靶标生物选择性是指化合物对生物靶标不同靶点的生物活性所具有的选择性。

本发明所述的细胞活性是指化合物对特定细胞的生物活性。

本发明所述的毒副作用是指化合物所具有的毒性和/或副作用。

本发明所述的可合成性是指化合物具备可被合成出来的可行性。

本发明所述的“先导型化合物优化”是指将一个具有特定生物活性的化合物进行结构和性质的优化，以获得具备所需生物活性或细胞活性的候选药物。

目前，化学信息学用于判断化合物的“像药”性，并利用一些总结的物理化学参数来确定化合物的“像药性”，以提高活性化合物(Hit)和先导化合物(Lead)的设计速率。其中，用于确定化合物“像药性”的参数多源自已知药物、处于临床试验阶段候选药物、天然产物等的分析和鉴定结果。

本发明所述的“像药型”(drug like)化合物的含义来自Walters和Murcko(WaltersWP，Stahl MT，and Murcko MA.Virtual Screening：An overview.Drug Discovery Today1998；3：160-78；Walters WP，Murcko A，Murcko MA.Recognizing Molecules with drug-likeproperties.Curr Opin Chem Biol 1999；3：384-7)，他们通过对美国药典中所列成药的研究，认为“像药型”化合物的分子结构应与大多数已知药物(成药)的官能团和物理化学性质相一致，现有的“像药”型化合物的性质大多来自于已知药物的研究和总结，但已知药物的结构种类仅涵盖了“像药”型化合物的很少一部分，并不能代表所有的“像药”型化合物的种类和特点。Lipinski(C.A.Lipinski；F.Lombardo；B.W.Dominy and P.J.Feeney(1997).″Experimental and computational approaches to estimate solubility and permeability indrug discovery and development settings″.Adv Drug Del Rev 23：3-25.：Lipinski CA，Lombardo F，Dominy BW，Feeney PJ.Experimental and computational approaches to estimatesolubility and permeability in drug discovery and development settings.Adv Drug Deliv Rev2001；46：3-26)认为：“像药”型化合物应具有充足的，可接受的ADME/T(吸收，分布，新陈代谢，排除和毒性)性质，并要通过I期临床试验，且分布在一个极其广泛的化学空间，大约包含1040-10100个“像药”型化合物，相对于可能的生物靶标，发现一个活性化合物的几率小于1/1014。“像药”化合物的物理性质将在很大程度上决定化合物能否成为活性化合物。Lipinski不仅发明了著名的“5规则”来帮助鉴别和分析“像药”型化合物，并认为在高效筛选时就应考虑药物的ADME/T性质，与传统意义上的化合物优化后期才予以考虑ADME/T性质有所不同。

现有的商业化合物数据库包括下述几种：

1)综合药物化学数据库---Comprehensive Medicinal Chemistry(CMC)；

2)世界药物数据库---World Drug Index(WDI)；

3)MDDR数据库；

4)调查类药物数据库---Investigational Drug Database(IDDB)；

5)商业化合物数据库---Available Compound Databse(ACD/SCD)；

6)化学导向数据库---ChemNavigator

7)生物活性天然产物数据库---Biologically Active Natural Products(BDNP)

因此，本领域技术人员可以基于上述数据库获得所述的目标化合物。

在本发明的优选技术方案中，所述的目标化合物为已知药物结构，优选为市场上广泛使用的已知药物，如抗糖尿病药物、心血管药物等。

本发明采用在临床上被广泛验证过的药物化合物结构，针对新型的靶标进行结构优化和改造，设计出新颖的针对特定适应症具有功效的药物化合物结构类型，包括先导型化合物类型等。

本发明所述的“经验型数据”又称“经验型参数”或“实验型参数”，是指在药物研发历史上积累下来的实验验证过的数据，所述经验数据选自靶标生物活性、靶标生物选择性、细胞活性、毒副作用、ADME性质、像药性、可合成性或药代药理参数等，这些经验型数据与化合物的结构密切关联，包括化合物的构效关系，因此，经验型数据的对比过程包含化合物的结构对比和化合物的结构优化等方面。

本发明的经验型数据均是本领域已知的数据库，现例举如下：

1)世界药物研发领域常用蛋白质靶标数据库及其对应的化合物结构类型数据库。处于临床阶段的化合物数据库用于寻求处于临床阶段的化合物相关的信息，以及与结构相关的蛋白质靶标信息，包括靶标的发现，被验证的靶标，蛋白质结构及其与其相关的化合物结构类型，其代表型的数据库包括：

htp://thomsonscientific.jp/products/iddb/index.shtml；

http://www.cancer.gov/cancertopics/factsheet/therapy/investigational-drug-access；

http://science.thomsonreuters.com/support/faq/sddb/；

http://www.centerwatch.com/drug-information/pipeline/；

http://www.pharmaprojects.com/research development analysis/tools.htm；

http://www.pipelinereview.com/store/product info.php？products id＝2741；

http://www.bioportfolio.com/store/product/7781/R-d-Drug-Pipeline-Database-2-months- Subscription.html；

http://thomsonreuters.com/products services/science/science products/a-z/pipeline data integrator/；

http://www.ovid.com/site/cstslog/DataBase/1244.jsp；

http://www.imshealth.com/portal/site/imshealth；

http：//www.pjbpubs.com/；或

http://www.fda.gov/。

ADME数据库用于研究、总结与化合物的吸收、分布、代谢与排泄等性质相关的结构信息，其代表型数据库包括：

http://www.pharmainformatic.com/html/adme tox predictions.html；

http://www.aureus-sciences.com/aureus/web/guest/adme-overview；

http://jp.fujitsu.com/group/kyushu/services/lifescience/english/asp/admedb/；

https://www.cloegateway.com/services/cloe knowledge/pages/service frontpage.php；

http://www.siritech.com/Cheminformatics.htm；

http://modem.ucsd.edu/adme/databases/databases extend.htm；

http://www.pubpk.org/index.php？title＝Main Page；

http://www.hmdb.ca/；

http://www.nugo.org/metabolomics/36124；

http://www.genome.jp/kegg/pathway.html；

http://kanaya.naist.jp/KNApSAcK/；

http://accelrys.com/products/databases/bioactivity/metabolite.html和

http://metlin.scripps.edu/。

蛋白质靶标数据库用于寻求和疾病相关的蛋白质靶标的信息，包括靶标的发现，被验证的靶标，蛋白质结构及其与其相关的化合物结构类型，具有代表型的数据库如下：

http:targetdb.pdb.org/

http://www.dddc.ac.cn./pdtd/

http://www.rcsb.org/pdb/home/home.do

http://bidd.nus.edu.sg/group/CJTTD/TTD.asp

http://www.sciclips.com/sciclips/drug-targets-main.do

http://www.ncbi.nlm.nih.gov/genbank/

http://www.ebi.ac.uk./Databases/structure.html

化合物合成方法数据库用于寻求化合物的合成方法及其可行性，具有代表性的数据库如下：https://scifinder.cas.org；http://accelrys.com/products/databases/synthesis/和http:/www.thieme-chemistry.com/en/products/journals/synfacts.html。

天然产物与中药数据库用于寻求天然产物及其中药化合物的结构数据，具有代表性的数据库如下：http://naturaldatabase.therapeuticresearch.com/home.aspx？cs＝&s＝ND；

http://www.ponderfodder.com/node/113；

http://www.ncbi.nlm.nih.gov/pmc/articles.PMC1347494/；

http://dnp.chemnetbase.com/intro/index.jsp；jsessionid＝80C9568C977F47200197BE482 13AC51A；

http://www.heterocycles.jp/structure/structure.php；http://www.chemnetbase.com/；

http://www.gfmer.ch/TMCAM/TNCAM database system.htm；

http://www.rmhiherbal.org/ai/pharintro.html；

http://tcm.cmu.edu.tw/about01.php？menuid＝1；和

http://tcm.cz3.nus.edu.sg/group/TCMsite/Default.aspx

“像药”型化合物、具有生物活性化合物数据库用于寻求“像药”型化合物和具有生物活性的化合物的信息，具有代表性的数据库如下：

http://accelrys.com/products/databases/bioactivity/mddr.html；

http://accelrys.com/products/databases/bioactivity/comprehensive-medinal-chemistry.h tml；

http://www.chemnavigator.com/和

http://accelrys.com/products/databases/sourcing/screening-compounds-directory.html。

药物毒副作用数据库用于寻求化合物的毒性、副作用等特性的数据库，其代表性数据库包括：

http://databases.biomedcentral.com/browsesubiect/？sub id＝1013；

http://www.drugs.com/；http://sideeffecta.embl.de/；

http://www.pdrhealth.com/drugs/drugs-index.aspx；

http://www.drugs.com/drug interactions.html；

http://www.pdrhealth.com/home/home.aspx；

http://www.rphworld.com/link-350.html；http://toxnet.nlm.nih.gov/；

http://bioinf.xmu.edu.cn/databases/ADR/index.html；

http://ctd.mdib.org/和http://accelrys.com/products/databases/bioactivity/toxicity.html。

已知药物数据库可以提供相关药物的基本信息，包括蛋白质靶标机理、药物分子结构、药代药理性质、毒副作用、药物相互作用等信息，其代表性数据库包括：

http://www.drugbank.ca/；http：//www.nlm.nih.gov/medlineplus/druginformation.html；

http://chrom.tutms.tut.ac.jp/JINNO/DRUGDATA/00database.html；

http://www.rxlis.com/script/main/hp.asp；

http://www.accessdata.fda.gov/scripts/cder/drugsatfda/；

http://www.fda.gov/Drugs/InformationOnDrugs/ucm142438.htm；

http://www.ncbi.nlm.nih.gov/pubmed/；http://www.webmd.com/；

htt://www.3dchem.com/atoz.asp；http://www.drugs.com/和

http://www.pdrhealth.com/home/home.aspx。

本发明的优选技术方案中，采用多维矩阵法设计候选药物时首先进行目标化合物的结构确认，即按照分子结构基本单元拆分化合物的分子结构，再参照经验数据的结构比对分析和结构优化结果，以寻求数量最少的可改变区域或可修饰区域。

作用于生物靶标的化合物结构类型多具备特定的结构母核，该结构母核体现了化合物针对特定靶标的生物活性，其中，化合物结构母核的空间结构应与靶标蛋白质的立体结构相匹配，二者的匹配程度也是决定化合物生物活性的主要因素；结构母核上的杂原子分布与化合物的生物选择性相关；结构母核的官能团分布与其生物活性和选择性相关，而任何杂原子和官能团在化合物结构的分布均有可能影响化合物的药代、药理和毒副作用等性能。

另外，不同的母核结构类型对某一特定生物靶标具有生物活性，其决定因素是化合物的空间立体分子结构和蛋白质空间立体结构。因此，化合物的结构设计过程需进行分子结构对比，可参照化学基因工程的技术扩大化合物结构对比的范围，并增加考虑因素，以进一步验证生物靶标，并寻找新的先导型化合物结构类型。

在设计药物分子时，需要考虑众多因素，所述考虑因素包括适应症、生物活性、可合成性、理化性质、稳定性、新陈代谢、药代、药理、毒副反应的任一种或其组合。如何有效地评价和分析相关影响因素是药物设计的主要工作，并且，设计不同的参照物需要考虑的影响因素或其顺序存在不同，有时需反复考虑一些影响因素。

当以目标化合物为基础设计候选药物时，应尽量不改变甚至增加其生物活性和选择性，并通过合理的结构修饰以改善甚至提高其药代药理性质，降低其毒副作用，其中，设计需要考虑因素包括：

A.蛋白质靶标(又称“生物靶标”)；或

B.靶标的验证状态；或

C.作用于特定靶标的化合物结构类型；或

D.被验证的具备生物活性的“像药“型化合物结构类型；或

E.已知药物的化合物结构类型；或

F.处于临床研究阶段的候选药物的化合物结构类型；或

G.处于临床前研究阶段的候选药物的化合物结构类型；或

H.天然产物的化合物结构类型；或

I.中药有效成分的化合物结构类型；或

I.生物等效性化合物结构类型；或

K.新陈代谢物结构类型；或

L.药代药理分子结构类型；或

M.毒性化合物结构类型；或

N.基本化合物结构单元类型；或

O.基本化合物官能团结构类型；或

P.合成方式的任一种或其组合。

在本发明的优选技术方案中，当需要保持甚至改善化合物的生物活性和选择性时，需要考虑的因素选自A、B、C、D、E、F、G、H、I、K、P的任一种或其组合。

在本发明的优选技术方案中，当需要保持甚至改善化合物的空间结构时，需要考虑的因素选自A、D、E、H、I、N、O、P的任一种或其组合。

在本发明的优选技术方案中，当需要保持甚至改善化合物的新陈代谢时，考虑的因素选自E、F、H、I、K、N、O、P的任一种或其组合。

在本发明的优选技术方案中，当需要保持甚至改善化合物的药代药理性质时，考虑的因素选自D、E、F、G、H、I、L、P的任一种或其组合。

在本发明的优选技术方案中，当需要降低化合物的毒副作用时，考虑的因素选自E、F、G、H、I、L、M、P的任一种或其组合。

采用多维矩阵设计化合物的分子结构时，可单独考虑因素A-P的任一种或其组合，其目的是有效地组合不同的因素，从而确定目标化合物的结构类型，并可采用多维矩阵法来分析化合物结构。

在本发明的优选技术方案中，所述靶标为12000-15000种源自Genebank，TargetDB，Threapuetic Target DB，DART，PDTD，TRMP、其他相关数据库等，包括被验证的靶标、被广泛使用的靶标等，以确定靶标对应的化合物结构，并设计出新颖的药物化合物结构类型、新颖的先导型化合物类型等。

在本发明的优选技术方案中，所述目标化合物选自来自天然产物或中药有效成分的化合物结构类型，可以结合其传统药物的特性，将其与靶标蛋白质结构进行结构对比和结构优化，寻找出有效的新化合物结构类型或先导型化合物结构类型，其中，所述的天然产物源自The Directory of Natural Product，Tradional Chinese Medicine Databas，NaturalProduct Database等数据库。

本发明的优选技术方案中，将有效的化合物结构类型与生物靶标进行结构分析和对比，以寻求对该生物靶标具备活性的新化合物结构类型，其中，所述有效的化合物为经过验证的具备一定生物活性的化合物结构类型，并在化学空间内代表最大数目的化合物结构，包括天然产物，以及已知的、可查询到的、来源于文献和相关数据库(包括PubMed，CMC，MDDR，IDDB，Scifinder，Chemnivagator等)的化合物结构等。

与现有技术相比，本发明的有益效果包括：

1、本发明采用多维矩阵法系统的分析、设计和优化化合物的分子结构，以显著提高候选药物分子设计的全面性、针对性、准确性、系统性和设计效益。

2、本发明结合高效的药物分子设计，并采用广泛使用的已知药物验证本发明的候药物设计方法，显著提高了人们对于候选药物分子结构和性质性能之间关联性质的认识，更加系统和完善地提高SAR的统计效力，并大幅度地降低药物分子设计的研发投入。

3、本发明系统地、全面地和合理地总结和使用药物研发经验型数据，并深入地和系统地完善候选药物的设计、结构对比、结构确认和结构优化技术，显著提高了药物分子设计的针对性、有效性和效益。

附图说明

图1：本发明优化目标化合物分子设计全过程。

图2：本发明优化化合物分子设计的多维矩阵示例。

图3：实施例1目标化合物卡托普利的优化过程。

图4：实施例5目标化合物奥美拉唑的优化过程。

图2中，大写字母如A，B，C......Y或Z；AB，AC......BC，BD......CD，CE......XY或YZ等代表化合物的结构区域序列，小写字母如a，b，c......y或z；ab，ac....bc，bd......cd，ce......yz等代表经验性数据序列。

具体实施方式

以下结合实施例对本发明做进一步描述。需要说明的是，下述实施例不能作为对本发明保护范围的限制，任何在本发明基础上作出的改进都不违背本发明的精神。

需要说明的是，下述所有化合物中，化学键不完整的表示与氢相连。

实施例1卡托普利系列化合物的结构优化

以卡托普利为目标化合物进行药物分子结构设计的方法，具体步骤如下：

1)将卡托普利按照基本结构单元进行结构分区，分为A，B，C，D，E五个区域；

2)参照和比对经验型数据，确定E区域为关键核心区域，其酰胺、邻位的酸基及其杂环属于核心结构范畴，需要尽量保留。考虑其决定靶标生物活性/细胞活性的功效，确认E区域为不可修饰区域，而A，B，C，D为分子设计的可修饰区域；

3)根据影响候选药物的可变因素来确定候选药物的可修饰区域。具体过程如下：

①A区域，参照和比对经验型数据可知，巯基(SH)官能团具有较强的还原性，在新陈代谢、剂型、稳定性、毒性和副作用等方面均不是比较合适的官能团，可将其替代为OH，NHR，NH₂，SOR，SO₂R，SO₃H，SO₃R，COOH，COOR或其杂环基本结构等。

②B区域，参照和比对经验型数据可知，增加碳链和替代元素是需要考虑的范畴，可替代的元素包括：O，N，S及杂环基本单元。

③C区域：参照和比对经验型数据可知，其立体化学结构需要保留，而替换甲基可用于增加化合物的“像药”性，尤其在药代药理方面。可以替换的官能团为：任何芳香或者非芳香官能团。

④D区域：参照和比对经验型数据可知，其立体化学需要保留，并需考虑不同类型的环结构及其双环结构。需要考虑的单环环状结构类型(包括杂环)包括：4元环，5元环，6元环，7元环，8元环或其杂环等，需要考虑的双环结构(包括杂环)包括：4-5类型，5-5类型，5-6类型，5-7类型，5-8类型，6-5类型，6-6类型，6-7类型，6-8类型或其杂环等。

根据经验型数据的分析，5-6类型为最佳选择，再需考虑其药代药理，像药性，已知药物结构对比，天然产物结构对比，等效性等可变因素，选择5-6类型和6-6类型最为合理，其中，主要考虑非芳香环，其次是芳香环或非芳香环。

4)根据经验型数据，选择影响药物的可变因素及其变量，具体过程如下：

A区域需要考虑的经验数据参数a的范围为靶标生物选择性，毒副作用，ADME性质，像药性，可合成性。

主要的考虑范围需要参照经验型数据库的支持，包括生物等效性，新陈代谢数据库，“像药”型化合物数据库，已知药物数据库，临床药物数据库等。根据SH的特性，可以确定经验参数a使用的官能团为：SOR，SO₂R，SO₃H，COOH，COOR和环状基本结构。其中，SOR在稳定性方面存在着问题；SO₃H和COOH作为强酸性官能团，在“像药”型方面和已知药物结构对比方面存在着问题；常用的药代药理手段为SO₃R，用来调节结构因素，但SO₃R同样存在着化学不稳定性，在一定的酸性条件下会转化为SO₃H；COOR具有一定程度的化学稳定性，为最佳选择。参照天然产物的结构和性质，此区域部分可以考虑使用环状结构类型来减少可旋转化学键的数目，可以选择的环类型为6-8元环。

B区域要考虑的经验数据参数b的范围为靶标生物选择性，ADME性质，可合成性。

B区域中的O，N，S等官能团和COOR的结合，会形成尿素类化合物结构类型，不完全符合“像药”型化合物结构，而增加碳链，不仅仅可以满足稳定性的要求，还在调节化合物的药代药理性方面具备一定的优越性，且增加的碳链应该为1-2个碳，以符合化合物的空间结构类型。

C区域要考虑的经验数据参数c的范围为靶标生物选择性，ADME性质，可合成性。

D区域要考虑的经验数据参数d的范围为靶标生物选择性，毒副作用，ADME性质，可合成性。

5)根据每个结构区域和经验性数据序列的结构对比结果，选出具有代表性的化合物结构类型，具体如下：

通过Aa矩阵的对比分析可以确定，A区域的结构类型代表为COOR或6-8元环结构。

通过Bb矩阵的对比分析可以确定，B区域的结构类型代表为碳链结构。

通过Cc矩阵的对比分析可以确定，C区域的结构类型代表为任何芳香或者非芳香官能团。

通过Dd矩阵的对比分析可以确定，D区域的结构类型代表为单环或双环结构。

6)根据经验型数据的对比分析结构，多维矩阵的第二层考虑如下：

AB组合需要考虑的经验数据参数ab的范围为靶标生物选择性，毒副作用，ADME性质，像药性，可合成性。

具体确定A部分为酸基(COOH)、脂基(COOR)或酰胺基(COONHR)，同时结合B区域为加长链，如烷基(CH₂-CH₂，CH₂-CH₂-CH₂)，醚基(CH₂-O)或者胺基(CH₂-N)。

BC组合需要考虑的经验数据参数bc范围为靶标生物活性/选择性，ADME性质，像药性，可合成性。具体B区域和AB组合一样，而C区域可以选择长链取代基，这部分需要和可合成性紧密结合。

CD组合需要考虑的经验数据参数cd的范围为靶标生物选择性，ADME性质，像药性，可合成性。C区域应该和BC组合一样，而D区域考虑饱和或者不饱和环状结构，避免单一取代基。

两层综合考虑，A区域需要考虑部分为酸基(COOH)，脂基(COOR)，或者是酰胺基(COONHR)，B区域考虑如烷基(CH₂-CH₂，或者CH₂-CH₂-CH₂)，醚基(CH₂-O)或者胺基(CH₂-N)，C区域为长链取代基，而D区域为饱和或者不饱和单环或双环结构。

7)根据经验型数据的对比分析结构，多维矩阵的第三层考虑如下：

ABC组合需要考虑的经验数据参数abc的范围为靶标选择性，ADME性质，毒副作用，像药性，可合成性，可以确定A＝COOH或者COOR；B＝CH₂或者CH₂-CH₂；C＝CH₃或者长链取代基。

BCD组合需要考虑的经验数据参数bcd的范围为靶标选择性，ADME性质，像药性，可合成性，可以确定B＝CH₂或者CH₂-CH₂；C＝CH₃或者长链取代基，D＝5-5双环，6-5双环，同时D区域5元环可以做开环考虑。

8)根据经验型数据的对比分析结构，多维矩阵的第四层考虑如下：

ABCD组合需要考虑的经验数据abcd的范畴为靶标生物活性/选择性，毒副作用，ADME性质，像药性，可合成性，可将ABCD分为：

A＝COOH，COOR；B＝CH₂-CH₂；C＝CH₃或者长链取代；D＝单5元环，5-5双环，6-5双环，5元环开链组合。

(9)根据经验型数据的对比分析结果，可以确定如下具体结构化合物，见表1。

表1 卡托普利系列化合物的结构优化

实施例2卡托普利系列化合物的结构优化

步骤同实施例1，确认Captopril---卡托普利，Enalapril---依那普利，Lisinopril---赖诺普利，Ramipril---雷米普利，Trandolapril---群多普利，Quinapril---喹那普利，Meocipril---莫昔普利，Prindopril---培哚普利，Benazepril---贝那普利，Fosinopril---福辛普利后。

作为药效而言，群多普利，雷米普利，培哚普利和莫昔普利具备较强的作用，采用多维矩阵并参照经验型参数比较研究化合物结构可知，D区域对于化合物的生物活性和选择性决定的作用，如何阻止D区域五元环发生新陈代谢成为主要的提高化合物分子靶标活性的因素，而饱和环(如群多普利，雷米普利，培哚普利)相对于芳香环(莫昔普利和喹那普利)具备更有效的作用。

在毒副作用领域，雷米普利显示出最佳的毒副作用结果，显示五元环以下的饱和环将是最佳的选择。

赖诺普利，福辛普利，贝那普利和喹那普利显示出相对较差的药效和毒副作用，表明C和D区域的重要性，且C区域中小型而简单的取代基将是最佳选择。

培哚普利显示出生物等效性官能团取代的优势。结合化合物的结构对比类型，可以根据多维矩阵分子设计方面，对化合物结构进行设计优化，其优化的前提是保证化合物的生物活性保持在小于10μM，并保持和优化其生物选择性，方案见表2。

表2卡托普利系列化合物的结构优化

实施例3吡格列酮系列化合物的结构优化

表3 吡格列酮的结构分区及其可修饰区域

(一)吡格列酮的结构分区

根据Pioglitazone的结构类型，按照化合物基本结构单元将其划分为A，B，C，D，E，F，G，H，I，J，K，L，M，N，O和P共16个区域，见表3。区域J，O，P决定和影响化合物的靶标生物活性/细胞活性，应属于不可修饰的区域。

N区域属于和影响靶标生物活性/细胞活性的区域，并在一定程度上影响化合物的靶标生物选择性，对其适当的修饰将可以调节靶标的生物选择性，需要结合G，H，K进行综合考虑，故在候选药物化合物结构优化设计时进行整体考虑。

I，K，L，M属于取代基或官能团范畴，属于暂不予以考虑的区域。

F，G，H区域属于连接区域，可以调节靶标生物选择性，ADME性质，毒副作用，像药性和可合成性的可修饰区域或可修改部分，并作整体考虑。

A和B区域属于可以调节靶标生物选择性，毒副作用，ADME性质，像药性和可合成性的区域，可以被确定为可修饰或可修改的区域，C，D，E属于取代基或官能团范畴，属于暂不予以考虑的区域，可A，B，C，D，E区域可以作为整体来考虑。

综合上述分子结构分析结果，确定吡格列酮的可修饰区域为A，B，C，见表3。

A区域主要修饰可以为替换杂环结构类型，如苯环和其他杂环结构，但重点考虑为吡啶环的取代基类型。

B区域主要修饰考虑其起到的链接作用的功能，故碳链的长度及C，O，N的生物等效替换是主要的修改手段。

C区域是一个比较复杂的区域，该区域的修饰将影响到靶标生物活性/细胞活性，应尽量不做改动，主要手段可以是碳链长度和C，O，N生物等效替换。

同时，A区域需要考虑的经验数据参数a的范围为主要适应靶标生物选择性，毒副作用，ADME性质，像药性及其可合成性。

B区域需要考虑的经验数据参数b的范围为而影响化合物的靶标生物选择性，毒副作用，ADME性质和可合成性。

C区域需要考虑的经验数据参数c的范围为靶标生物活性的、调节靶标生物选择性，毒副作用，ADME性质，像药性和可合成性。

根据经验型数据的对比分析结果，优选出具有代表性的化合物结构类型如下：

通过Aa矩阵的对比分析可以确定A区域的结构类型代表为吡啶环。

通过Bb矩阵的对比分析可以确定B区域的结构类型代表为C，O，N的生物等效替换。

通过Cc矩阵的对比分析可以确定C区域的结构类型代表为碳链长度和C，O，N生物等效替换。

综合考虑上述分析结果，可以确认A可以为吡啶环，B区域可以为-NCH₃CH₂CH₂O，C区域保持不变，可以快速确定如下结构：

实施例4奥美拉唑系列化合物的结构优化

1)将奥美拉唑按照基本结构单元结构分区，分为A，B，C，D四个区域；

2)根据经验型数据或者文献实验数据表明，区域A，B，C，D的可能的多维矩阵组合不少于上万种。根据影响候选药物的可变因素来确定候选药物的可修饰区域。具体过程如下：

①A区域，根据经验性数据，可替代甲氧基的有效官能团包括R，Ar，RO，RN，RS，RCO，RCON等，且可分布在1位和2位。

②B区域，根据数据库的分析表明，可替代B区域的有效官能团包括等。

③C区域：根据数据库的分析表明，可替代C区域的有效官能团包括SON，SO₂N，SO₂C，SC等。

④D区域：根据数据库的分析表明，可替代D区域的有效官能团包括Ar或其中R₂、R₃、R₄和R₅可以分别为R，OR等。

3)根据经验型数据，选择影响药物的可变因素及其变量，具体过程如下：

针对相同靶标的分子结构分子，生物靶标的结构分析，经验型数据库数据的分析等经验型数据库说明：区域B和区域C属于生物活性的必需结构成分，为不可修饰区域。其中，区域B中氮原子取代的吲哚环将导致取代基在酸性和新陈代谢过程中不稳定，且吲哚氮原子上的氢原子在药物生物活性方面及其化合物酸碱性方面有着重要作用，虽然在生物等效性方面合理，但将此氮原子换成氧原子或者硫原子存在不合理性；区域C中单氧化的硫原子是非常重要的生物活性成分，将其转化成为双氧化的硫将对于生物活性不利，且将连接硫原子和吡啶环的碳环成氮，虽然在生物等效型方面合理，但是在化合物的“像药”型和选择性方面不够合理。

使用多维矩阵方式分析结果，将分子设计的重点放在区域A和区域D。参照商业化合物数据库和经验型数据，并采用多维矩阵排列、组合、分析、优化和区域A、D结构。首先将一个类型的分子结构类型和取代位置类型进行分类及其排除操作，选择出最少量的因素，进行实际合成测试，从而寻找出最佳的A区域取代基类型和位置，D区域的芳香环类型及其取代基类型和位置。参照化合物合成数据库，进行新型化合物结构类型的合成验证。

A区域，主要在于苯环和杂环的选择及其取代基的位置和类型，以及生物等效性、药代药理、天然产物、合成的可能性和化合物的酸碱性等，并在碳，氧，氮，硫和卤素之间进行多维矩阵组合，寻找出合理的选择。

D区域，关键在于芳香环的选择，其可能性非常得多，就特定的化合物结构而言，由于类似构效的分子结构均采用吡啶2位取代，但采用不同含氮原子杂环结构为必需的设计战略。多维矩阵分子排列给出多种取代可能性，而多维矩阵分子结构分析集中在2位取代吡啶环结构，目的在于提高和改善其生物活性等。而吡啶环取代基，其主要的方面是化合物的酸碱性，药代药理，生物等效性，“像药”性，天然产物等方面。

4)根据每个结构区域和经验性数据序列的结构对比结果，选出具有代表性的化合物结构类型，具体如下：

通过Aa矩阵的对比分析可以确定，A区域的结构类型代表为R，Ar，RO，RN，RS，RCO，RCON等，且可以分布在1位和2位。

通过Bb矩阵的对比分析可以确定，B区域的结构类型代表为苯并吡唑。

通过Cc矩阵的对比分析可以确定，C区域的结构类型代表为-SOCH₂-。

通过Dd矩阵的对比分析可以确定，D区域的结构类型代表为D区域可以为Ar等。

5)根据经验型数据的对比分析结构，多维矩阵的考虑如下：

ABCD组合需要考虑的经验数据abcd的范畴为靶标生物活性/选择性，毒副作用，ADME性质，像药性，可合成性，包括：

A＝OR，R，R可以为H、烷基或取代烷基，尤其是卤代烷基；

B＝苯并吡唑；C＝-SOCH₂-；其中R₂、R₃、R₄和R₅可以分别为R，OR等，R可以为H、烷基或取代烷基，尤其是卤代烷基或烷氧基烷基。

(6)根据经验型数据的对比分析结果，可以确定如下具体结构化合物，见表4。

表4 奥美拉唑系列化合物的结构优化

实施例5百优解系列化合物的结构优化过程

表5 百忧解的结构分区与其可修饰区域

(1)按照化合物基本结构单元将百忧解(Prozac)可以划分为A-Q共17个区域，见表5。若全部考虑17个区域，其排列组合的化合物数目庞大。

(2)参照确定影响候选药物分子标靶生物活性/细胞活性的结构部分，确认不可修饰部分，可以先不考虑的区域，可以修饰的区域。具体过程如下：

G，N，O区域与化合物的靶标生物活性/细胞活性密切相关，属于核心结构范畴，尤其是N，O区域，G区域是不可轻易修饰或轻易修改部分，而N区域可以进行生物等效性官能团替换；P，Q区域也是由于靶标生物活性/细胞活性考虑而不可轻易修饰部分，而新陈代谢前或后的氢键给予能力将予以考虑。故将G，N，O，P，Q区域分为一个区域考虑。

A，B，C，D，E，F区域属于取代基区域，对化合物的毒副作用具有影响，在化合物的设计早期暂不予考虑，而设计和结构优化后作为整体加以考虑。

(3)根据目标化合物的结构分析与确认结果，确定A、B、C为可修饰区域(表5)。

(4)根据经验型数据，选择影响药物的可变因素及其变量，具体过程如下：

就A区域而言，保持苯环结构，更换取代基将是合理的修饰方式。

就B区域而言，结合中枢系统药物的发展历史，早期的药物属于MAOI系列化合物结构类型，三环化合物类型，可以确认如下结构：CH₂CH₂N(CH₃)₂，CH₂CH₂NHCH₃，CH₂CH₂CH₂N(CH₃)₂和CH₂CH₂CH₂NHCH₃；同时考虑O原子作为连接官能团的等效基团；

就C区域而言，保持苯环结构将是优先考虑的因素，更换取代基将是合理的修饰方式。

根据经验型数据库可知，A区域的可变因素a需考虑生物选择性，毒副作用，ADME性质，像药性和合成性，应关注该区域的取代基类型。

根据经验型数据库可知，B区域的可变因素b需考虑ADME，生物选择性，细胞活性，新陈代谢，毒副作用，像药性，可合成性，尤其是像药性中的可旋转健数量和生物选择性，毒副作用等，初步确定O原子的等效基团C原子，当然考虑到天然产物的特性，优先考虑保持O原子，同时环状化合物结构类型也是一种可修饰的区域。

根据经验型数据库可知，C区域的可变因素c需考虑生物选择性，毒副作用，ADME性质，像药性，可合成性等因素，可考虑加入取代基；更优先结合考虑A区域的取代基的类型。

(5)根据每个结构区域和经验性数据序列的结构对比结果，选出具有代表性的化合物结构类型，具体如下：

通过Aa矩阵的对比分析可以确定，A区域的结构类型代表为取代苯环(如卤素或CN取代的苯环，其中CN与卤素等效)，天然产物常见的五元环二醚取代苯环结构类型，含氧五元杂环；

通过Bb矩阵的对比分析可以确定，B区域的结构类型代表为含有N原子的环状结构，优选六元环结构；CH₂CH₂N(CH₃)₂，CH₂CH₂NHCH₃，CH₂CH₂CH₂N(CH₃)₂和CH₂CH₂CH₂NHCH₃，或者O原子的等效基团，如C或N。

通过Cc矩阵的对比分析可以确定，C区域的结构类型代表为相对于O原子的Beta位置引入了立体化学结构类型，而在五元杂环引入了苯环结构及被取代基取代的苯环，如优选卤素，更优选F原子。

(6)根据经验型数据的对比分析结构，多维矩阵综合考虑如下：

ABC组合需要考虑的经验数据abc的范畴为靶标生物活性/选择性，毒副作用，ADME性质，像药性，可合成性，可以分为：

A＝五元环二醚，卤素取代苯环，含氧五元杂环；B＝CH₂CH₂NHCH₃，CH₂CH₂N(CH₃)₂，CH₂CH₂CH₂N(CH₃)₂或立体结构；C＝苯环，取代苯环，如F或Cl取代苯环。

(7)根据经验型数据的对比分析结果，可以确定如下具体结构化合物，见表6。

表6 百优解系列化合物的结构优化

实施例6吉非替尼类似物的结构优化

吉非替尼(Irresa，gefinib，ZD1839)为选择性表皮生长因子受体(EGFR)酪氨酸激酶抑制剂，为易瑞沙新型抗肿瘤药物，其结构如下式所示：

表7 吉非替尼的结构分区与其可修饰区域

(一)化合物结构分区和结构确认

按照基本结构单元划分将吉非替尼划分为A，B，C，D，E，F，G，H，I，J，K，L，M，N，O，P，Q，R和S等19个区域，见表7左栏。

此类化合物结构类型属于概念验证型新型药物研发类型，其化合物结构可以修饰的区域相对广泛。

F，J，K，L，M区域与化合物的靶标生物活性/细胞活性密切相关，属于不可修饰或者不可修改区域，但J区域被认为是可进行结构修饰的部分，但双环结构不应轻易修饰。

A，B，C，D，E区域为可修饰区域，主要考虑因素为ADME性质，像药性，毒副作用，靶标生物选择性，可合成性，并需考虑附加影响靶标生物活性的可能因素。

G区域为可修饰区域，主要考虑的因素为ADME性质，像药性，毒副作用，靶标生物选择性，可合成性，并需考虑附加影响靶标生物活性的可能因素。

H，I区域为取代基或官能团，设计前期暂不予以考虑。

N区域为可修饰区域，其主要的考虑因素为ADME性质，像药性，毒副作用，靶标生物选择性，可合成性，并需考虑附加影响靶标生物活性的可能因素，其主要的考虑结构类型应该为取代基的类型。

区域O，P，Q，R，S为取代基或官能团，设计前期暂不予以考虑。

在多维矩阵分析结构和结构确定完成后，确定吉非替尼的可修饰区域为A，B，C，D，见表7右栏。

(二)化合物的结构优化

A区域主要的考虑因素为ADME性质，像药性，毒副作用，靶标生物选择性，可合成性，且考虑附加的影响靶标生物活性的因素。

B区域主要的考虑因素为ADME性质，像药性，毒副作用，靶标生物选择性，可合成性。

C区域主要考虑靶标生物活性，ADME性质，像药性，毒副作用，靶标生物选择性，可合成性。

D区域主要考虑ADME性质，像药性，毒副作用，靶标生物选择性，可合成性。其主要的考虑因素为苯环取代基或官能团，主为简单的取代基，如卤素，氰基，三键或者双键(主要考虑抗癌药物的特性)。

表8 吉非替尼类似物的结构优化

实施例7唑烷酮抗生素Linezoline类似物的结构优化

唑烷酮抗生素如Linezoline对许多较顽固的革兰阳性细菌有效，包括耐万古霉素屎肠球菌、耐甲氧西林金黄葡萄球菌、耐青霉素肺炎链球菌等。它可在mRNA转录的早期抑制细菌蛋白的合成，口服后吸收迅速而完全。许多尚未发表的临床研究资料表明，linezolid对成年人的肺炎、皮肤感染、耐万古霉素屎肠球菌等均有效。其不良反应与β内酰胺类抗生素、克拉霉素、万古霉素等相似。Linezolid是第一个获准用于治疗耐万古霉素肠球菌的口服抗生素。由于唑烷酮类药物独特的作用机制和抗菌谱很广，治疗高度耐药的革兰阳性菌有效，使它成为一个极有价值的治疗药物，可取代现在应用的其他药物。基于此，对于linezoline进行结构改进，以获得改进结构的化合物。

具体步骤如下：

1)将该Linezoline照基本结构单元结构分区，分为A，B，C，D四个区域；

D部分设计：使用简单取代基团；

①A区域，决定化合物活性的关键区域，根据经验性数据，可替代的结构为饱和杂环或芳香杂环，以饱和杂环为优选。

②B区域，决定化合物活性的关键区域，根据数据库的分析表明，可替代B区域的有效官能团包括取代的环外氮原子(其目的为取消氢键)，氧原子，硫原子等。

③C区域：根据数据库的分析表明，可替代C区域的有效官能团包括取代苯环和芳香杂环。

④D区域：调节DMPK性质，解决新陈代谢问题，根据数据库的分析表明，可替代D区域的有效官能团包括简单取代基团。

使用多维矩阵方式分析结果，将分子设计的重点放在区域A和区域B。参照商业化合物数据库和经验型数据，并采用多维矩阵排列、组合、分析、优化和区域A、B结构。首先将一个类型的分子结构类型和取代位置类型进行分类及其排除操作，选择出最少量的因素，进行实际合成测试，从而寻找出最佳的A区域取代基类型和位置，B区域的芳香环类型及其取代基类型和位置。参照化合物合成数据库，进行新型化合物结构类型的合成验证。

其中R1，R2，R3，R4均为任意取代基，如H，烷基，环烷基，烷酰基，环烷酰基，取代的酰基，磺酰胺基，烷基氨基磺酰基等；

X，Y为芳环上常规取代基，如H，卤素，烷基，烷氧基，环烷基，酰基等；

5)根据经验型数据的对比分析结构，对步骤4)中的前两个结构可能的修饰区域进行修饰，得到如下结构：

其中R1，R2，R3，R4，R5，R6，R7均为任意取代基，如H，烷基，环烷基，烷酰基，环烷酰基，取代的酰基，磺酰胺基，烷基氨基磺酰基等；

X，Y为CH，NH，O，S；

(6)在步骤5)基础上，根据经验型数据的对比分析结果，考虑到R2、R3、R4、R5、R6对活性的影响不大，确定如下结构式：

其中各取代基的定义如下：

上述化合物的合成反应工艺如下：

通过上述方法，获得如上所述的4个化合物，并通过MIC活性检测，这些化合物显示出和Linezolid相似的抑制浓度指数，其结果为MIC₅₀(A)介于1-1.5；MIC₅₀(B)介于0.25-0.75。

其中化合物的抗菌的活性使用MIC(MIC＝minimum inhibition concentration：Lowestdrug concentration for reducing growth by 50％or morw)，使用Metthicillin-susceptibleStaphylococcus---测试A；Penicilin---suscepible Streptococcus pneumonia---测试B。实验的步骤按照标准测试步骤和测试方法，抑制浓度指数标准为微克/毫升。

Claims

1.一种优化候选药物分子结构的方法，包括如下步骤：

(1)将目标化合物按照基本结构单元进行结构分区，并分别以大写字母A，B，C，D...Y或Z代表相应的结构区域，并确定候选药物的可修饰区域，分别选择可修饰区域中可选择的变量，其中，可修饰区域A的变量选自A1、A2、A3...An，可修饰区域B的变量选自B1、B2、B3...Bn，可修饰区域C的变量选自C1、C2、C3...Cn，可修饰区域D的变量选自D1，D2，D3...Dn……，可修饰区域Y的变量选自Y1、Y2、Y3...Yn，可修饰区域Z的变量选自Z1、Z2、Z3...Zn，其中，n为自然数，所述可修饰区域是指影响化合物生物活性或者细胞选择性的结构区域；

(3)采用多维矩阵排列分析步骤(1)中所述的可修饰结构区域A，B，C，D...Y或Z的相应变量与步骤(2)中所述的可变因素a，b，c，d...y或z的相应变量，再参照结构区域和经验型数据的结构对比结果，选出具有代表性的化合物结构类型代表A’、B’、C’、D’...Y’或Z’，完成候选药物的结构设计与优化。

2.一种优化候选药物分子结构的方法，包括如下步骤：

(1.1)将目标化合物按照基本结构单元进行结构分区；

(1.2)参照经验型数据，确定影响候选药物分子靶标生物活性/细胞活性的结构部分，将其作为不可修饰区域，所述不可修饰区域是指决定化合物的生物活性或者细胞活性且不能轻易更改或修饰的结构区域；

(3)采用多维矩阵排列分析步骤(1.3)中所述的可修饰结构区域A，B，C，D...Y或Z的相应变量与可变因素a，b，c，d...y或z的相应变量，再参照结构区域和经验性数据的结构对比结果，选出具有代表性的化合物结构类型代表A’、B’、C’、D’...Y’或Z’；

在步骤(1.3)确定可修饰区域的同时，排除修饰暂不予考虑的部分，所述的暂不予考虑的部分选自环状结构上的取代基、像药型化合物不应具有的官能团和结构类型的任一种或其组合。

3.根据权利要求1所述的方法，所述方法还包括，

在步骤(1)确定可修饰区域的同时，排除修饰暂不予考虑的部分，所述的暂不予考虑的部分选自环状结构上的取代基、像药型化合物不应具有的官能团和结构类型的任一种或其组合。

4.根据权利要求1-3任一项所述的方法，所述方法还进一步包括如下任一或全部步骤：

(4)对步骤(3)选出的具有代表性的化合物结构类型A’、B’、C’、D’...Y’或Z’的结构进行分析与结构确认，确定其可选择的变量，其中，可修饰区域A’的变量选自A’1、A’2、A’3...A’n，可修饰区域B’的变量选自B’1、B’2、B’3...B’n，可修饰区域C’的变量选自C’1、C’2、C’3...C’n，可修饰区域D’的变量选自D’1，D’2，D’3...D’n……，可修饰区域Y’的变量选自Y’1、Y’2、Y’3...Y’n，可修饰区域Z’的变量选自Z’1、Z’2、Z’3...Z’n，n为自然数；

(5)参照经验型数据，选择影响候选药物的可变因素及其变量，所述的可变因素分别以小写字母a’，b’，c’，d’...y’或z’加以表示，其中，可变因素a’的变量选自a’1、a’2、a’3...a’n，可变因素b’的变量选自b’1、b’2、b’3...b’n，可变因素c’的变量选自c’1、c’2、c’3...c’n，可变因素d’的变量选自d’1，d’2，d’3...d’n……，可修饰区域y’的变量选自y’1、y’2、y’3...y’n，可修饰区域z’的变量选自z’1、z’2、z’3...z’n，n为自然数；

(6)采用多维矩阵排列分析步骤(4)中所述的选出的具有代表性的化合物结构类型A’、B’、C’、D’...Y’或Z’的相应变量与步骤(5)中所述的可变因素a’，b’，c’，d’...y’或z’的相应变量，再参照结构区域和经验性数据的结构对比结果，选出具有代表性的化合物结构类型A’B’、B’C’、C’D’...Y’Z’；或

(7)根据需要，参照步骤(4)-(6)所述的方法，采用多维矩阵排列分析选出的具有代表性的化合物结构类型A’B’、B’C’、C’D’...Y’Z’的相应变量与可变因素a’b’、b’c’、c’d’...y’z’的相应变量，再参照结构区域和经验性数据的结构对比结果，选出具有代表性的化合物结构类型A”B”C”、B”C”D”...X”Y”Z”；或

(8)根据需要，参照步骤(4)-(7)所述的方法，采用多维矩阵排列分析选出的具有代表性的化合物结构类型A”B”C”、B”C”D”...X”Y”Z”与可变因素a”b”c”、b”c”d”...x”y”z”，再参照结构区域和经验性数据序列的结构对比结果，完成候选药物的结构设计与优化；或

5.根据权利要求1-3任一项所述的方法，其中所述基本结构单元包括分子结构中的任一结构单元，选自饱和或不饱和的单环结构单元、双环结构单元、多环结构单元、取代基、官能团的任一种或其组合；

其中，所述的单环结构单元选自芳香单环、非芳香单环、取代的芳香单环、取代的非芳香单环的任一种或其组合；

所述的双环结构单元选自芳香双环、非芳香双环、取代的芳香双环、取代的非芳香双环的任一种或其组合；

所述的多环结构单元选自芳香多环、非芳香多环、取代的芳香多环、取代的非芳多单环的任一种或其组合；

所述官能团选自酮、醛、脂、胺、酰胺、单键、双键、三键、卤素、酸、醇、硫醇、磺酸、酚、硫酚的任一种或其组合；

所述取代基是任何化合物的结构残基，选自烷基、烯基、炔基、羟基、醚基、酯基、芳基、杂芳基、环烷基、杂环基的任一种或其组合。

6.根据权利要求4所述的方法，其中所述基本结构单元包括分子结构中的任一结构单元，选自饱和或不饱和的单环结构单元、双环结构单元、多环结构单元、取代基、官能团的任一种或其组合；

7.根据权利要求1-3任一项所述的方法，所述的经验数据选自靶标生物活性、靶标生物选择性、细胞活性、毒副作用、ADME性质、像药性、可合成性的任一种或其组合。

8.根据权利要求4所述的方法，其特征在于，根据候选药物的设计需要，采用多维矩阵重复进行步骤(1)-(8)，或者步骤(1.1)、(1.2)、(1.3)、(2)-(8)的部分或全部来进行候选药物的结构分析、结构确认、结构优化，直至获得具有所需生物学活性或药理活性的候选药物结构类型。

9.根据权利要求1-3任一项所述的方法，所述的经验型数据选自如下数据库的任一种或其组合：

3)药物研发核心结构数据库；或

4)药物分子构架化合物类型数据库；或

5)被验证的具有生物活性的化合物结构类型数据库；或

6)可查询上市药物数据库；或

7)生物等效型数据库；或

8)新陈代谢化合物类型数据库；或

9)毒性化合物结构类型数据库；或

10)中药有效成分化合物类型数据库；或

11)天然产物单体化合物结构数据库；或

12)药物治疗数据库；或

13)医疗关键词数据库。

10.根据权利要求4所述的方法，所述的经验型数据选自如下数据库的任一种或其组合：

3)药物研发核心结构数据库；或

4)药物分子构架化合物类型数据库；或

5)被验证的具有生物活性的化合物结构类型数据库；或

6)可查询上市药物数据库；或

7)生物等效型数据库；或

8)新陈代谢化合物类型数据库；或

9)毒性化合物结构类型数据库；或

10)中药有效成分化合物类型数据库；或

11)天然产物单体化合物结构数据库；或

12)药物治疗数据库；或

13)医疗关键词数据库。

11.多维矩阵在药物分子设计中的应用，其特征在于，所述的多维矩阵排列由结构因素与经验型数据共同确定，所述设计采用权利要求1-10任一项的药物分子设计方法进行药物分子的设计。

12.根据权利要求11所述的应用，所述的药物分子选自Me-Too类新型药物、药物构架化合物、“像药”型化合物、Hit-To-Lead、先导化合物的任一种或其优化结构。

13.根据权利要求11或12所述的应用，其特征在于，采用多维矩阵排列分析化合物的结构因素的相应变量和可变因素的相应变量，再参照结构区域和经验性数据的结构对比结果，选出具有代表性的化合物结构类型，获得最终的药物分子。