CN1215486A - 设计具有常见功能特性的化学结构的计算方法 - Google Patents

设计具有常见功能特性的化学结构的计算方法 Download PDF

Info

Publication number
CN1215486A
CN1215486A CN96180229A CN96180229A CN1215486A CN 1215486 A CN1215486 A CN 1215486A CN 96180229 A CN96180229 A CN 96180229A CN 96180229 A CN96180229 A CN 96180229A CN 1215486 A CN1215486 A CN 1215486A
Authority
CN
China
Prior art keywords
compatibility
acceptor
character
target
maximum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN96180229A
Other languages
English (en)
Inventor
乔纳森·M·施密特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Guelph
Original Assignee
University of Guelph
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Guelph filed Critical University of Guelph
Priority to CN96180229A priority Critical patent/CN1215486A/zh
Publication of CN1215486A publication Critical patent/CN1215486A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及建立在立体构型和结合亲和性的特定组合基础上,设计具有常见有用功能特性的化学结构的计算方法。更为特别的是,本发明提供了一种产生计算机模拟受体的方法,该受体可以模拟生物受体的功能。设计的模拟受体对已知目标分子具有优化的选择亲和性。由此可以确定化学结构并使该结构具有对模拟受体的选择亲和性。

Description

设计具有常见功能特性的化学结构的计算方法
发明领域
本发明涉及建立在立体构型和结合亲和性的特定组合基础上,设计具有常见有用功能特性的化学结构的利用计算机方法。更为特别的是,本发明提供了一种产生计算机模拟受体的方法,该受体可以模拟生物受体的功能。设计的模拟受体对已知目标分子具有优化的选择亲和性。由此可以确定化学结构并使该结构具有对模拟受体的选择亲和性。
发明背景
生物受体是折叠的氨基酸或核苷酸的线性聚合物,它们形成可与底物结合的三维被膜。这些线性排序列的特定三维结构以及被膜表面带电位置的分布是由以功能效用为基础的进化选择决定的。
生物受体的选择性决定于受体与底物之间产生的引力及排斥力的强度差异,这些力的大小,部分随受体及底物表面上的电荷数以及带电位置间距的不同而不同。
由于底物表面存在的或诱导的带电位置的数量和电荷数以及空间排列不同,因此结合亲和性随底物结构的变化而变化。对于同一受体具有相近结合亲和性的底物,至少在一些诱导的和固定的带电位置的空间排布上具有很大的相似性。如果受体的功能与结合亲和性相关,那么具有相似结合亲和性的底物也将具有相似的功能。从此种意义上说可以用受体来识别或定量确定底物间的相似性。
在分子识别中,用于鉴定或发现对受体具有选择结合亲和性的新的化合物或底物的传统方法,是基于发现活性底物共同的分子曲线图(subgraph),并应用这些图来推测新的、相似的化合物,这种技术的缺陷是它的先决条件是,假设具有相似结合作用的底物结构相似,但是在很多情况下,结构不相似的底物对同一受体可以表现出相似的结合亲和性,现在较多的以定量构效关系(QSAR)为基础的定量分析技术只适用于在同一结构类型范围内发现新的化合物,而大都不适合根据显示出预计的选择亲和性来发现新的分子结构,例如Dean,Philip M.在Concepts and Applications of Molecular Similarity,Ed.Mark A.Johnson和Gerald M.Maggiora,pp 211-238(1990)上发表的题为“分子识别:根据配体-受体相互作用来测量和研究分子相似性”的文章。
目前研究方向集中在伪受体(pseudoreceptors)和微受体(minireceptors)的原子模型结构上,伪受体上原子和功能团相连,微小受体上包含有不相连的原子组或功能团的组(Snyder,J.P.(1993).IN3D QSAR in Drug Design:Theory,Methods and Applications;Kubinyi,H.Ed.;Escom,Leiden.P.336),相关研究方法包括已知目标配体周围的一定数量的原子模型和产生于配体和受体模型间的分子间力的计算,这些模型在计算出的结合能与生物活性之间具有高度相关性(Walters,D.E.and Hinds,R.M.(1994)J.Medic.Chem.37:2527),但还未能发现达到何种程度可以导致新的化学结构与受体模型表现出选择亲和性。
因此寻找一种方法来证实不同化学结构之间的有效相似性(non-trivial similarities)是十分有益的,这些相似性充分说明这些化学结构具有共同的特性,以此作为基础,来设计新的、具有有用功能特性的化学结构,这些新的化学结构是基于立体构型与结合亲和性的特殊结合。
发现概述
本发明提出一种方法用以识别不同化学结构之间的有效相似性,这些相似性对于说明这些化学结构具有共同的动能特性来说是必要的并且是充分的。此方法也同时提出了一种提供新的、表现出相似功能特性的化学结构的方法。
本发明的基本概念是通过使用两步计算方法来设计或发现基于体构型与结合亲和性的特殊结合的、具有有用功能特性的化学结构。本方法的第一步是用抗体形成算法仿真来产生一组基于计算机的、模拟生物受体的模拟受体,并使之对选择目标底物具有最佳的结合亲和性。第二步是用模拟的或虚拟的受体来评估己知化合物的结合亲和性,或用来设计新的最佳结合底物。
此处用所述方法提供的模拟受体是对生物受体选择特性进行模拟,还包括对其结合选择性进行最优化的调优过程。通过此种方法产生的仿真体或模拟受体可以被用来识别分子间的特殊相似性。如同抗体和其他生物受体一样,本发明产生的模拟受体具有独特的特性:它们可以用来识别或辩识目标底物的相同或相似的结构特性,受体与目标底物之间的结合亲和性可以用作特性识别的尺度,根据目标底物与特殊模拟受体的结合亲和性可以对目标底物进行定量分类,具有相同特殊结构特性的化合物对同一虚拟受体也具有相似的结合亲和性。
生物受体与底物之间的结合亲和性决定于相邻受体与底物表面立体吻合程度、两表面非极性区域的疏水性及相邻带电区域静电力的强度,在有些情况下,受体与底物之间所形成的共价结合亦能提高结合亲和性。用本方法产生的模拟受体模拟了它们生物同类相似的结合机制。受体与目标表面的平均距离、两表面带电区域产生的静电吸引强度都能用来计算结合亲和性的量度。而结合亲和性的计算结果可以用来评估底物分子的相似性。
通过对底物整个表面与完全包围其周围的附近的一个受体或受体被膜之间的相互作用也能确定整体结合亲和性,在这种情况下分析底物间的整体相似性是开发有用的定量构一效关系的基础。但是,即便不是全部,在大多数生物系统中,亲和性只是由局部而不是整体决定的,底物分子与生物受体之间的相互作用一般只局限于受体的独立片断与底物表面的接触,在这种情况下,用改进的定量构一效关系来分析底物间整体相似性是不准确的,因为底物的片断直接与结合亲和性的产生有关。
局部相似的结构在相关相似的位置和取向上具有相似的结构片断。结构局部相似并不需整体均相似,在对整体相似性进行评估时,用涉及整理相似性的整体取样法可以获得分子特性样本;片断样本法涉及评估局部相似性,多片断样本法既涉及评估局部又涉及评估整体相似性。
局部相似性的分析是以底物相似的结构和电荷分布的分立区域的取样为前提的,在生物受体中,由于相邻底物与受体表面的不规则或高低不平,因此要使取样局限化。在决定结合亲和性的相互作用中,紧紧相对的表面间的作用要远远大于有更多分离区域的表面之间的相互作用,相邻表面的接近程度也将决定氢键强度。通过此种方法产生的有效模拟受体必须利用目标底物(分子)单个的局部取样法来评估化合物间的相对功能相似性。
由于以下两种情况的存在,局部相似性的分析是复杂的:1〕相关片断的数量、位置和辩识对特定的结合亲和性是充分必要条件,但不能简单的从底物的化学结构中推断而得出;2〕取样片断的位置和取向取决于整个分子的结构。
本方法的一部分研究方向是产生能够对化学底物之间的相似性进行分类的模拟受体,这部分工作实质上是搜寻对空间相关位置上底物的相关片断进行取样的受体。最优化过程有赖于模拟受体的四个特性:1.普遍性:其中受体能够与一个以上的底物结合;2.特异性:受体的结合亲和性因底物结构的不同而不同;3.节约性:受体根据最少的局部结构特性来区别底物;4.易变性:受体结构的改变将改变其对于特殊底物的结合亲和性。对受体表型按照用字符串表示的线型基因型(genotype)的形式来编码,这有助于模拟受体的变异、重组和结构特性的继承。
满足这些基本标准的模拟受体可以采用进化选择繁殖方法来进行优化,以便获得与局部相似底物特定的结合亲和性。通过将受体的空间构型和电荷分布情况按可继承的格式进行编码,就可以达到上述目的,此种格式可以变化或变异化。就象生物受体一样,用此种方法产生的受体也定义了一个排他性的三维空间。这种三维空间可在任意分辨率上,用一条具有足够长度和足够曲折度的一维途径来描画。由氨基酸的线性聚合物构成的蛋白质便是此种结构的例子。相似的,模拟受体的三维结构可以编码成转动指令的线性排列。这些受体的一维代码形式构成其基因型。用来评估其结合亲和性的解码形式构成其表型。在最优化过程中,受体的基因型可以发生变化(变异)。因此可以对这些变化对表型的结合亲和性上的影响进行估计。产生具有所需结合亲和性表型的基因型可以保存下来进行更多的变换,通过重复变异和选择过程,直到达到选定的表型的最优化程度。有多种进化方法,包括传统基因算法(genetic algorithms),都可以用来产生具有最佳结合特性的模拟受体群。
用这种方法产生的受体可用于产生或辩识新的化学结构(化合物),这些化学结构具有分子目标种类的特别的、有意义的性质,这些性质被当作产生模拟受体的选择标准。采用与受体的相互作用作为选择标准,新的化学结构优化至与受体最佳吻合。因为这些结构必须满足受体选择性的这个充分必要条件,因此它们很可能具有与原始分子目标相似的生物活性。这些选择性增强了的模拟受体群也可以用来对现存的化学结构进行筛选,以获得具有高亲和性和这些有用性质的化合物。同样的过程也可以用于筛选具有选定的毒性或免疫特性的化合物。
本发明的一个方面是提供了设计具有预先选定功能特性的化学结构的基于计算机的方法,包括如下步骤:
(a)产生一个模拟受体表型的物理模型,此表型的编码是一条线型字符序列,并且提供至少具有一种可定量的功能特性的一组目标分子;
(b)对于每一种目标分子:
  (ⅰ)用有效的亲和性计算方法,对大量取向中的每一个取
向计算受体与目标分子间的亲和性;
  (ⅱ)对计算得到的亲和性进行加和,从而得到加和亲和性;
  (ⅲ)确定最大亲和性;
(c)将计算出的加和亲和性及最大亲和性应用于:
  (ⅰ)计算最大亲和性和可定量的功能特性之间的最大亲和
性相关系数;
  (ⅱ)计算加和亲和性与可定量的功能特性之间的加和亲
和性相关系数;
(d)利用最大相关系数和加和相关系数计算适应性系数;
(e)改变受体结果并重复步骤(b)至(d)直到得到一群具有预先选定的适应性系数的受体;
(f)提供一个由分子线性字符序列编码的化学结构的物理模型,运用所述的有效亲和性计算方法计算化学结构与大量取向中每一个受体之间的亲和性,应用计算所得的亲和性计算亲和性适应性值;
(g)改变化学结构以便产生变换后的化学结构形式,重复步骤(f);以及
(h)保持并进一步改变亲和性值接近预选亲和性值的化学结构的变换形式。
本发明的另一方面是提供了一种筛选化学结构是否具有预选功能特性的方法,它包括:
a)通过产生一个对空间占据和电荷编码的受体线性字符序列产生一个模拟受体基因型;
b)对基因型解码以产生一个受体表型,提供至少一种具有选定功能特性的目标分子,对每个目标分子,对大量取向中的每一个目标分子采用一种有效的亲和性计算方法计算受体和目标分子之间的亲和性,计算每一个目标分子和受体之间的加和亲和性及最大亲和性,计算加和亲和性对所述目标分子功能特性的加和亲和性相关系数,计算最大亲和性对所述功能特性的最大亲和性相关系数,基于所述加和亲和性及最大亲和性相关系数计算适应性系数;
c)变换受体基因型并重复步骤b),保留并变换适应性系数提高的受体直到得到一群具有预选适应性系数的受体;然后
d)利用所述有效的亲和性计算方法计算被筛选的化学结构和大量取向中的每一个受体之间的亲和性,计算亲和性适应性值,其中包括计算化合物与每一个受体之间的加和亲和性及最大亲和性,将至少一种所述的加和亲和性及最大亲和性与所述的至少一种目标与所述的受体群之间的加和亲和性及最大亲和性进行比较,由此,比较表示所述化学结构相对于所述至少一种目标分子的功能活性水平。
本发明的另一方面是提供了一种设计模拟生物受体的、对具有相似功能特性的化合物表现出选择亲和性的模拟受体,该方法包括如下步骤:
a)通过产生一个对空间占据和电荷编码的受体线性字符序列产生一个模拟受体基因型;
b)对基因型解码以产生一个受体表型,提供一组具有相似功能特性的目标分子,对每个目标分子,采用一种有效的亲和性计算方法计算受体和大量取向中的每一个目标分子之间的亲和性,计算每一个目标分子和受体之间的加和亲和性及最大亲和性,对每个目标分子计算加和亲和性对一种功能特性的加和亲和性相关系数,对每个目标分子计算最大亲和性对所述功能特性的最大亲和性相关系数,对每个目标分子计算基于所述加和亲和性及最大亲和性相关系数的适应性系数;以及
c)变换基因型并重复步骤b),保留并变换适应性系数提高的受体直到得到一群具有预选适应性系数的受体;
本发明的另一个方面是提供了一种设计具有预先选择功能特性的化学结构的基于计算机的方法,步骤如下:
(a)产生一个受体的物理模型,提供至少公有一种可定量的功能特性的一组目标分子;
(b)对于每一种目标分子:
  (ⅰ)用有效的亲和性计算方法,对大量取向中的每一个取向计
算受体与目标分子间的亲和性;
  (ⅱ)对计算得到的亲和性进行加和,从而得到加和亲和性;
  (ⅲ)确定最大亲和性;
(c)将计算出的加和亲和性及最大亲和性应用于:
  (ⅰ)计算最大亲和性和可定量的功能特性之间的最大亲和性相
关系数;
  (ⅱ)计算加和亲和性与可定量的功能特性之间的加和亲和性
相关系数;
(d)利用最大相关系数和加和相关系数计算适应性系数;
(e)改变受体结构并重复步骤(b)至(d)直到得到一群具有预先选定的适应性系数的受体;
(f)提供一个化学结构的物理模型,运用所述的有效亲和性计算方法计算化学结构与大量取向中每一个受体之间的亲和性,应用计算得到的亲和性计算亲和性适应性值;
(g)改变化学结构以便产生化学结构变换形式,重复步骤(f);以及
(h)保持并进一步改变亲和性值接近预选亲和性值的化学结构的变换形式。
本发明的其他方面就是提供了对包括元素的化学结构进行编码的方法,本方法还包括提供线性字符序列,该序列对所述化学结构的每个原子的空间占据和带电情况进行编码。
附图的简要说明
本发明的方法将在此加以介绍,但只是通过实施例来介绍,并参照附图:
图1是一张流程图,说明基因型代码的产生与其翻译之间的关系,基因型代码的翻译是为了产生相应的表型,该内容构成了本发明的一个部分;
图2是一张流程图,介绍了采用点变异的方法对选择性结合到一组底物的受体进行优化处理的步骤,该内容构成了本发明的一个部分;
图3是一张流程图,介绍了产生一群优化受体的步骤,这些受体对一组化学底物具有选择结合亲和性,同时介绍了利用这些优化受体来产生一组具有共同功能特性的新的化学底物;
图4a给出了几个用于与配体产生的例子有关的实施例中的化合物;
图4b给出了配体产生的实例中用本发明的方法产生的配体1.1-1.4,其中每个配体至少有一个取向并在结构上与苯甲醛类似;以及
图4c给出了在配体生成的例子中,用本发明的方法产生的配体2.1-2.4,其中配体的产生与设计具有驱蚊效力的化学结构有关。
优选实施方案的描述
本方法可分为两个部分:(A)对具有共同的功能特性的化合物具有选择亲和性的一群模拟受体的调优;(B)产生新的具有共同功能特性的化学结构。(A)包括若干步骤:1)受体基因型和表型的产生;2)已知化学结构对受体的表象(presentation);4)受体对化学结构的亲和性的评估;5)受体对化学结构的选择性的评估;6)对化学结构具有优化选择亲和性的一组相关受体的随机调优;筛选具有毒性和药物活性的化学底物,用优化受体设计对受体具有选择结合亲和性的新的化学结构。
下面对本发明的最佳模式的描述涉及各种分子和原子半径、极化率、有效偶极值、过渡态和附加因子(addition factor)的数据表,相应的数据可在位于本说明本结束部分的表Ⅰ-Ⅴ中找到。在本说明书的末尾附着的模块1-14给出了过程计算的非限制性实施例的流程图。部分A:对具有共同功能特性的目标分子表现出选择亲和性的模拟受体群的调优(1)基因型代码和受体表型的产生
模拟受体基因型和表型均是计算目标。模拟受体的表型由折叠的、不分叉的球形子单元聚合物组成,其直径在长度上等于氢原子的范德华半径(≌110pm)。在与每一个主轴上的球体截距相对应的6个点中的任意两个点上,子单元互相连接起来。在目前的程序中,子单元间的连接不能伸展或旋转,两个连接起来的子单元中心总是分隔一个等于其一边长度的距离(即一个氢原子半径),当两个子单元没有连接在共同的相邻子单元的相反面时则可以进行转动。有四种可能的正交转动:向左、向右、向上和向下。转动必须平行于一个主轴中的一个。为了计算的简单,如果转动导致与聚合物中的其它子单元相交,则允许子单元与其它子单元占据相同的空间。
一个完整的模拟受体由一个或多个单独的聚合物组成。对于由多个聚合物组成的受体,每个聚合物可以起源于空间中的不同的点。为了计算的简单,在本程序中,所有包括单个受体的聚合物具有相同的长度(=子单元数)。这个限制并非功能上的需要,长度不同的聚合物系列对建立特定系统的模型可能是有用的。
每个聚合物的结构编码成一组顺序转动指令。这些指令确定了对应于内部参考框架的单个转动,该框架是以每个聚合物的第一个子单元的初始取向为基础的。
在本程序中,受体和底物的水合作用未加以明确处理,相反,假设存在于键合位置的水分子永久性地附着在受体表面上并构成其结构的一个组成部分。这是一个随意近似,本领域的熟练人员将会认识到可用更精确的处理来取代现有的方法(例如参见VanOss,1995,Molecular Immunology 32:199-211)。
参考图1,建立代码的模块将产生随机的字符串。每一个字符代表有关转动指令或决定电荷特性或决定构成虚拟受体三维形状中一个点的反应活性。用于描述基于直角坐标系的三维受体形状的字符串,至少需要5个不同的字符。其它构架,如四面体结构,也可用不同的转动指令来建立。字符代表了转动指令,这些指令是根据三维空间中虚拟受体结构的现有路径来定义的(即这些指令涉及虚拟受体的本征参考框架,而非任意的外部参考框架)。
转动指令是根据聚合物的现有方向和取向而给出的。只允许向左、向右、向上和向下四种转动。如果没有转动发生,则聚合物或者终止或者继续其现有方向。
对于直角系统,最小字符组是:C1=无转动;C2=右转动;C3=左转动;C4=向上转动;C5=向下转动。可以理解,将指令进行组合则可以产生对角转动,如A1,2=C1C2;A2,1=C2C1等。决定不同电荷或反应活性状态的不同的字符,其数量是不受限制的,并可根据经验依据进行调整。代码长度(字符数)和特定字符出现在字符序列中的频率是可以不同的。基因型产生的例子
本领域的熟练人员将会认识到下面的基因型代码产生及表型表述的例子仅为了说明。在本实施例中,采用了如下约定。
(1)用于产生代码的字符组包括5个与转动指令有关的字符和两个指定电荷位置的字符:“0”=不转动;“1”=右转;“2”向上转;“3”=左转;“4”=向下转;“5”=带正电荷的位置(不转动);“6”=带负电荷的位置(不转动)。
(2)子单元有两类:带电荷或不带电荷。所有带电荷的子单元均假设带有一个单位正电荷或一个单位负电荷。电荷大小一致是一种随意的约定。
(3)受体包括15个单独的聚合物。完整代码的长度总是15的倍数。每个聚合物的长度等于总的代码长度除以15。可以理解,受体可由任意数量的、具有不同或相同长度的单个聚合物构成。
(4)以下参数由用户设定:(a)总代码长度(和聚合物长度);(b)每个字符出现在代码串中的频率;(c)字符组合的出现。模块1给出了一个基因型代码产生的示范流程图。受体表型产生的例子
每个基因型代码被翻译以产生相应的表型或虚拟受体的三维表述。从预先定义的起始点开始,翻译算法被用来把转动指令变换成一系列的坐标三合体(coordinate triplet),后者给出了构成受体聚合物的连续子单元的空间位置。在翻译前,必须给出每个聚合物的起始坐标。在翻译中假定连续子单元的中心被等于氢原子的共价直径。
翻译算法顺序读取代码串以产生连续转动和水平路径段。对相对于外部坐标体系的连续转动的翻译取决于先前的转动序列。对构成受体的每个聚合物,其初始取向假定是相同的。在目前的程序中,翻译算法由给出了输入和输出状态的表1来描述。如果没有转动发生,则利用Δx,Δy,Δz的最新数据和最新状态来计算新的坐标三合体。电荷位置被当作直的(无转动)段来处理。原状态的初始值为20。
下面的参数可由用户来设定:
a.构成受体的每个聚合物的起始坐标。
输出结果保存为:
a.三个矢量(每个轴一个:{x1,x2,x3…xn},{y1…yn},{z1…zn})。
b.一个三维二元矩阵。
c.独立的电荷位置坐标矢量。模块2给出了代码翻译的示范过程。(2)目标产生
目标由球形原子构成的分子来代表。原子被认为是刚性球,并且每一种原子具有固定的特性半径。当目标原子与虚拟受体之间的距离达到刚性球半径时,其相互间的排斥力无穷大,刚性球半径由表2给出的表观范德华半径来近似。其它范德华半径的估算数据也可用取自2中数据。
由共价键连接的两个原子的中心间距可用其共价键半径的加和来表示。共价键半径随键的顺序和原子种类变化。表3给出了一些键合半径的适当数据。作为初级近似,假设键长是固定的(即忽略键的振动)。键的转动是允许的,为了采集有代表性的转动态,同一结构的多重构型是需要的。不考虑构型的稳定性,因为与虚拟受体的键合可以稳定能量上不稳定的构型。可以利用各种能量最小化算法来产生目标配体。
由于键偶合矩而产生的电荷被认为位于原子核上。具有较大电负性的原子带有负电荷。用于本程序的偶极值由表4给出。其它偶极值的估计值也可用取自表4中的数据。(3)目标表述
每个目标对模拟受体的亲和性,将根据目标相对于受体上表面的若干取向来进行测试。上表面由翻译算法定义。在估计键合亲和性之前,目标和受体必须进行接触。接触发生时,至少一个受体的子单元与至少一个目标的原子之间的中心距等于其范德华半径的加和。为了确定目标和受体在接触点的相对位置,目标逐渐沿垂直于受体表面的路径移至受体表面,并经过受体和目标的几何中心。当接触发生时,目标已经达到相对于受体的碰撞位置。当达到碰撞位置时,目标原子的翻译位置被用来计算目标原子与受体子单元之间的距离。该距离用来计算静电相互作用强度和接近程度。
在目前的程序中,假定目标沿一条直线移向受体,并在发生接触时获得初始取向。一种变通的方法是允许目标在接近受体时逐步改变其取向以便在接触点获得最大亲和性。虽然此方法在功能上与已使用的方法相似,但计算起来要复杂得多。在目前的程序中,对多重取向的测试,计算起来较为容易。目前的程序容许对沿受体的x或y轴的路径进行调节性移动,以便容纳较大的分子。当在相同的受体上对大小不同的分子进行试验时,为了提高选择性,该功能特性是必须的。
在计算碰撞位置之前,通过围绕x,y,和z每一个轴,按6°的增量随机转动,从而随机设定目标取向。可以采用或大或小的旋转增量。每个目标的随机取向在一定的试验系列中是唯一的。优化过程的可靠性,取决于被测目标的取向数以及评估的目标化合物的数量。模块3给出了目标表述的示范过程。(4)亲和性计算
近似方案
目前的程序基于一种简化的近似,即用相对较少的计算来估算亲和性的主要组成。在以下内容中将介绍这种近似。然而,本领域的熟练人员将认识到其它精确的亲和性计算程序也可以利用,并将给出更精确的亲和性值。已知的用于得到更加准确的亲和性值的计算程序包,可以直接用于目前的计算过程。
对冠醚的研究表明小分子的电子密度分布可以用来描述较大化物合电子密度(Bruning,H.and Feil,D.(1991)J.Comput.Chem.12:1)。Hirshfeld的股东(stockholder)方法可用来严格定义局域电荷密度分布,该法因此而具有电荷和偶极矩的特性(Hirshfeld,F.L.(1977)Theor.Chim.Acta 44:129)。结果是将分子的总的电子密度分布划分为重叠的原子部分,其大小与自由原子半径有关。
在冠醚中可能证实,静电相互作用的主要组成是由局域的而不是广域的原子间电荷转移来决定的。电荷分布主要由不同化学键的短程效应来决定的。特别的是,非邻原子对原子偶极矩的贡献很小。另外,原子间的电荷转移也受整个分子的静电场的影响,但对冠醚的计算表明,其对电荷分布的影响是非常小的。
计算得到的股东原子的电荷和偶极矩可以用来描述静电相互作用(Bruning,H.and Feil,D.(1991)J.Comput.Chem.12:1)。除了范德华半径,只有原子的四极偶极矩产生较小的贡献。对静电势的计算只考虑了原子电荷,得到的结果也很不理想,然而偶极矩的应用将使数据得到改善。
基于这些考虑,本发明的方法结合了目标配体与模拟受体之间的亲和性近似,以及模拟受体与化学结构之间的亲和性近似,化学结构的设计是建立在两种测量基础上的。
1.产生于模拟受体的带电子单元与目标配体(化学结构)的原子偶极之间的静电力大小。因为假定带电子单元带有不可转移的单位电荷,这些作用力的大小与原子偶极的大小成正比,而与模拟受体和配体的原子偶极之间的距离成反比。
2.模拟受体的非极性或不带电子单元所占的比例充分接近配体的非极性区域以便产生显著的London色散力。在目前程序中用于亲和性计算的假设:
1.假定由目前程序评估的化学底物目标是中性(即非离子化)分子。这是一个随意的限制。用同样的方法可以发展出适用于带电和不带电目标的程序。
2.假定偶极矩局域在原子核。对亲和性可以进行类似的分析,但假定偶极矩集中在共价键上。根据Allingham等人(1989)的观点,这些假设在功能上是相当的。
3.假设虚拟受体的周围环境是一种溶剂体系,在其中目标以溶质的形式出现,并且有效地分配在溶剂和虚拟受体之间。
4.假设在计算亲和性的瞬间,目标和受体以一种特定的、固定的取向彼此相对静止。
5.假设目标只与受体表面上的两种位置进行作用:固定的电荷位置(或带负电荷或带正电荷)以及非极性位置。
根据这些假设,只须考虑相互作用强度的如下贡献:
1.电荷-偶极                  -Q2μ2/6(4π∈)2kTr4
2.电荷-非极性                -Q2α/2(4π∈)2r4
3.偶极-非极性(得拜能)        -μ2α/(4π∈)2r6
4.非极性-非极性(London能)    -.75[hνα2/(4π∈)2r6]
在目前的程序中,由于近似而只考虑相对强度,因而忽略了所有的常数。另外,假设固定的电荷位置是单位正电荷或单位负电荷。基于此,可用简化的方式表达四种组成:
1.电荷-偶极                  -μ2/r4或-μ/r2
2.电荷-非极性                -α/r4
3.偶极-非极性(得拜能)        -μ2α/r6或-μα5/r3
4.非极性-非极性(London能)    -α2/r6或-α/r3
总体上讲,2、3项对长程相互作用只有很小的贡献。然而,1和4项对相互作用能的贡献显著。在目前的程序中,假设非极性区域之间的多数相互作用发生在相邻的烷基和芳烃氢原子以及受体的非极性子单元之间。在这些条件下,假设α值近似为常数。疏水强度和水排除的贡献
在产生键合亲和性时,溶剂化效应是重要的考虑因素。例如,疏水键的形成依赖于非极性基团和疏水基团在空间上的紧密结合,从而使得疏水区域与水分子之间的接触最小。疏水键的形成可对抗体-抗原键的总强度作出一半的贡献。受体和底物表面的水合作用也是一个重要的因素。束缚在受体或底物表面极性位置上的水,可以通过形成表面间交叉桥来影响成键或提高亲和性。
疏水相互作用描述了疏水分子在水中相互间的强吸引。对于受体-目标相互作用,疏水相互作用指,目标的非极性段与相邻非极性受体子单元区域之间的吸引。该效应主要来自熵效应,后者导致表面重排从而使得水从相邻非极性区域间排挤出去。对疏水相互作用进行准确的理论处理是不可能的,但是,估计疏水作用力对抗体和抗原之间的总吸引力的贡献多达50%。为了对估算目标和虚拟受体之间的疏水相互作用,目前的程序估算了通过与目标结合,而有效地避免发生溶剂化作用的受体比例。所有位于目标上非极性原子固定距离之内的非极性(不带电荷)子单元,均可避免被直径等于或大于该限制距离的溶剂分子溶剂化。组合亲和性计算
本程序中的组合亲和性计算组合了相互作用的两种测量:电荷-偶极相互作用的加和强度和-种接近测量。在本程序中,假设这些亲和性是各向同性的。本领域的熟练人员将认识到,如果采用各向异性方法来计算亲和性,将会获得更大的辨别能力,但是计算将变得更加复杂。
电荷-偶极相互作用可用D=∑μi/rij v来计算,其中μi=目标的第i个原子的偶极矩,rij=受体的第i个原子和第j个电荷位置之间的距离,系数v可设置为2,3或4。对于较大的v值,D对总的亲和性的贡献受电荷间距的影响将更大。
接近测量表示为P=∑ni/N,其中Ni=受体的不带电的子单元数量,这些子单元与偶极矩≤0.75得拜的目标的i个原子的最大间距为。在目前的程序中,的范围为1至4个子单元直径(此数据范围近似于水的范德华半径)。N是构成受体的子单元总数。
亲和性值A是从D和P的计算得到的,计算时利用了下面的关系式A=[P(D+NP/k)]0.5,k是适应性常数(本程序中,k=10000)。等式中P的值有两个作用。第一,它是一个权重因子。作为’适应优良度’的一个测量,以一种有利于特定构型的方式影响亲和性值,在这些特定构型中,目标和受体的非极性区域紧密接触。在上述条件下,疏水相互作用和非极性相互作用能很大,并将对键的稳定性和强度产生显著贡献。在上述条件下,目标脱离受体的可能途径变得更小,其保留时间则被延长。第二,P被用来估算色散能对相互作用强度的贡献。假设色散能只是对不带电的、非极性区域有意义,并只有在目标和受体相互接近时才有意义(即彼此位于范围内)。k和的值可被调整以改变P和D的相对贡献。总体上讲,P对非极性目标的影响是决定性的,而D对具有较大局域偶极的目标则更有意义。氢键近似当作,成对的带负电荷和正电荷的受体单元同时与目标羟基、羧基或氨基发生相互作用。亲和性计算-键极化率的其它方法
在某些情况下,将一个对应于目标原子相对极化率的参数引入到亲和性计算中来,可能是有好处的。在此情况下,计算A=[P(D+NP2/k)]0.5中的P2的等式不是P2=∑ni/N。相反,P2由等式P2=∑αini/Nk来计算,其中ni=带电或不带电的受体子单元数量,这些子单元与目标的第i个原子之间的最大距离为,其中αi是目标的第i个原子的相对极化率。为了简便,对脂肪氢αH的值被设定为1.0。如果要应用极化率,k的值则必须进行调整。表Ⅴ给出了基于相邻键极化率加和的极化率例子。
因为极化率与电子云的移动有关,分子的极化率可以当作共价键的特性极化率的加和来计算。这种加和性适用于没有离域电子的非芳烃分子。其它技术-官能团特性
用于本程序的亲和性近似方法可用功能上相似的计算方法来代替,新的方法将保留局域电荷、色散能、目标-受体间距三者之间的相互关系。另外,可以建立测试带电目标亲和性的方法。目前的程序只估算非共价键相互作用,但是,引入可与选定的目标官能团进行特定的共价成键反应的虚拟受体子单元,便可对已有方法进行扩展。模块5提供了用于本发明的、具有优选的有效亲和性计算方法的示范流程图。(5)选择亲和性的评估
对虚拟受体与一组目标底物之间的适应优良度的评估,是通过比较已知的对目标的活性或亲和性,与得到的对虚拟受体-目标复合物的活性或亲和性来进行的。一个最佳选择的虚拟受体的最大亲和性应当与已知的亲和性测量强烈相关。点变异的连续迭代可以用来提高一组底物和虚拟受体(图2)之间的相关性,或用来优化一群虚拟受体的选择性。调优过程的连续迭代可以用来提高这种相关性(图3)。
已知的数据可以是任何已知、或可能取决于键合亲和性的指数,包括(但不限于)ED50、ID50、键合亲和性以及内聚力(cohesion)测量。被测试数值必须是正值。需要对数据进行对数变换。未进行加权的数据不能加以利用。
在试验之前,目标对最大键合亲和性的最佳取向并不知道。为了获得一定范围的受体-目标亲和性的代表性测量,必须用不同的、相对于受体表面的的随机取向来反复测试每一个目标。每次试验都利用模块4来估算亲和性。总体上讲,获得的最大亲和性值的可靠性取决于样品大小,因为样品包括了真正的最大亲和性值的可能性是逐渐增大的。
在本程序中采用了两种技术以避免为产生优化受体而对大样品组的需求:1)利用一个结合了平均(或加和)亲和性与最大亲和性的测量,来选择具有较高选择性的受体;2)连续重复优化过程,被测的取向数量不断提高(优化过程开始于一小组目标取向,当具有更大适应性的受体产生后,试验的取向也更多了)。
在目前的程序中,加和是针对每个目标的所有被测取向的亲和性值进行计算的。加和亲和性值是受体和目标之间的平均亲和性的一种测量。同时,最大亲和性值也被确定了。
计算己知值与加和亲和性rSA 2以及最大亲和性rMA 2之间的相关性。基于这样的假设:没有活性的目标化合物对虚拟受体的亲和性很小或没有亲和性,相关过程包括了原点(0,0)。该假设并不总是有效,在某些试验中,其它截距值也可能需要。
加和亲和性的相关性是平均适应优良度的一种测量。如果相关性很大,但是最大亲和性与已知亲和性之间的相关性很弱,则结果表明虚拟受体没有选择力,即目标的多重取向可以与受体进行有效地作用。相反,如果最大亲和性与已知的亲和性值高度相关,而与加和亲和性的相关性很弱,则虚拟受体可能具有很高的选择力。如果加和亲和性与最大亲和性都与已知亲和性高度相关,很可能采集的取向已经以有限的误差确定了受体的响应特性(Ⅰ和Ⅱ两种误差均降低了:出现正的或负的错误结果的可能性)。在某些情况下,使已知亲和性与加和亲和性之间的相关性最小是适当的,虽然选择的是最大亲和性和已知亲和性之间的相关性增加。该选择要求从总加和中扣除最大亲和性值以便除去产生模糊偏向的数据。
在目前的程序中,一种联合相关性值被用作受体选择的基础。该值计算作加和亲和性与最大亲和性的乘积的平方根
F=(rMA 2×rSA 2)0.5该值通过虚拟受体调优而得到优化。注意:如果rMA 2与rSA 2相互强烈相关,对rSA 2有贡献的值必须或者单独与最大亲和性紧密相关或者对加和值的贡献可以忽略。另一种方法是,计算(加和亲和性-最大亲和性)对已知亲和性的相关性(rSA-MA)并得到最大测量值
F=(rMA 2×(1-rSA-MA 2))0.5应用该测量,可以选择对一个十分有限的目标取向具有高亲和性的受体。模块5提供了计算适应优良度的示范流程图。(6)优化过程
优化过程的目的是,对一组目标受体具有选择亲和性的虚拟受体进行调优。需要一种寻找解的高效机理,因为可能的基因型包括300种指令,其总数为7300或大约10253。下面的四个阶段总结了优化过程中的步骤,每个阶段在以后将进行详细讨论并给出计算例子。
阶段1:产生一组随机基因型并筛选最小活性水平。用所选的基因型作为进一步优化的基础,优化过程采用基因算法(重组)和单方向性的变异技术(unidirectional mutation techniques)。
阶段2:变换所选基因型以产生用于重组的不同但又是相关的基因型繁殖群。从重组群体中选择大多数变异体。
阶段3:通过对选择性变异体进行重组以产生新的基因型。从所产生的基因型中选择具有最高亲和适应性的基因型。用该子群进行下一次重组或产生变异。
阶段4:选取最好的重组产物,重复进行点变异以提高选择性。阶段Ⅰ:初级代码的调优一产生
由Holland发展起来的基因算法(Holland,J.H.(1975)Adaptation inNatural and Artificial Systems.U.Michigan Press.Ann Arbour)可以用来寻找各种问题的优化解。通常该技术在使用时采用很多初始是随机的解。在目前的程序中,对该技术进行了较大的修饰以便降低寻找有高选择性的虚拟受体所需要的试验和迭代次数。为了实现上述目的,还采用了一组紧密相关的基因型作为初始群体,并在每次迭代时采用高速变异的办法。对于任何一组目标化合物,发展具有最优亲和特性的不同受体都是可能的。例如,受体可以优化结合到同一目标,但是处于不同的取向。使用密切相关的基因型作为初始群,将提高优化过程收敛到单个解的可能性。对非相关基因型进行重组,虽然可能产生新的、适应性改进的基因型,但更可能导致离散。
优化过程第一阶段的目的是产生一个对目标组具有最小亲和性水平的基因型。因此,该基因型被用来产生相关基因型的群。模块6给出了产生一个具有最小亲和性水平的基因型的示范过程。阶段2:初级代码的调优-变异
基因型的变异包括改变代码中的一个或多个字符。在现有程序中的变异并不改变组成受体聚合物的子单元数量,也不改变基因型的长度。这些约定可以认为是随意的,也可以认为变化后的形式在一些系统中是有用的。
变异可能改变表型的折叠方式,并导致受体形状空间、结合位置或结合位置的暴露情况发生改变。对表型周边区域的构型有影响的变异,将导致受体中心相对于目标中心的移动。中性变异
所有变异都将改变表型结构,然而,并非所有的变异都将导致受体功能的改变。中性变异可能改变对亲和性没有影响的受体成分。在某些情况下,这些中性变异可与后续变异结合起来产生协同效应。繁殖群
调优过程中第二阶段的目的是产生一个来自初级基因型的不同的、但又相关的基因型群。因此该群体的成员被用来产生重组体。该繁殖群是通过对初级基因型进行多重变异而得到的。所得到的基因型被进行翻译,并对选择性进行筛选。保留最有选择性的产物用于重组。模块7给出了一个基因型多重变异的示范过程流程图。阶段3:调优-重组
重组的目的是产生新的、具有改进适应性的基因型。重组有利于保留对表型适应性至关重要的基因型片断,同时有助于引入新的指令组合。总体上讲,重组与选择一起导致了快速选择性优化。模块8提供了一个基因型重组示范过程的流程图。
目前的程序保留了模块8中步骤7进行试验所需的重组群,从而保证了具有高选择性的基因型不会被选择性较低的基因型所取代。另外,在目前的程序中,在试验之前变异(模块7)应用到50%的重组体基因型(步骤7-模块8)。该步骤提高了重组群中的可变性。用于本程序的试验群的大小从10个基因型到40个基因型不等。这是一个相对较小的群。在一些条件下,可能需要较大的群。阶段4:调优-成熟
渐进微变异技术
优化过程的最后阶段类似哺乳动物免疫系统中抗体的成熟。对基因型进行一系列的单个点变异并评价其对表型适应性的影响。与重组不同,该过程通常只造成表型选择性的小量递增变化。这一成熟过程采用了Rechenberg(1+1)调优战略(Rechenberg,I.(1973),Evolutionsstrategie.F.Frommann,Stuttgart)。在每一代,母体基因型的适应性与其变异产物相比较,具有较大选择性的基因型则为下一代保留下来。结果,该过程成为严格单向的,因为选择性较小的变异体不会替代其母体。模块9显示了一个基因型成熟的非限制例子的流程图。
在成熟过程的每一次重复中,代码中只有一个指令被改变了。如果一个母体与其变异产物具有相同的选择性,那么,在下一代,该母体将被其变异产物所取代。此种方法将导致中性变异的累加,并与后续变异一起产生协同效应。上述约定是随意的。
如果重组或成熟在重复使用后没有使选择性提高,则可能有必要重复阶段2以提高繁殖群基因组的可变性。选择的应用
本发明的方法可应用的在若干方面,包括:1)筛选具有选定药理或毒理活性的化合物;2)发展具有选择功能特性的新的化学结构。后面将提供有关应用和例子。1A)筛选方法
一群受体被调优,并对具有共有的相似药理性质的一组特定的化合物具有选择亲和性,该群受体则可用来作为测试其它具有相似活性的化合物的性质的探针,但条件是这种活性取决于键合亲和性。例如,一群受体被调优并显示出对水杨酸酯的特异亲和性。如果这些受体对水杨酸酯的亲和性与环氧酶对水杨酸酯的亲和性密切相关,那么这些受体至少可以在功能上,部分模拟环氧酶分子结合位置的相关特性。因此这些受体可以用来筛选对环氧酶可能具有结合亲和性的其它化合物。
本技术也可用来筛选潜在的、具有毒理或致癌物活性的化合物。例如,受体可以被调优并模拟胆固醇荷尔蒙受体的特异结合亲和性。在进行体外或体内试验前,这些受体可以用来评估杀虫剂、溶剂、食物添加剂的亲和性,以及其它合成材料可能的键合亲和性。模拟受体也可以被构造以测试对其它目标位、转移蛋白或非目标结合的亲和性。1B)筛选次一最大活性
在一些情况下,具有高亲和性的化合物可能产生有害的副作用,或可能对慢性治疗不适合。在此情况下,可能需要结合亲和性较低的化合物。如组合合成等技术并不容易制得或确定这类化合物。相反,模拟受体可以用来有效地筛选,具有任意特定水平的结合亲和性结构。1C)测定分子相似性
模拟受体的选择性可以用作分子相似性的一种定量测度。模拟受体的例子
在本例子中,选择目标亲和性的虚构试验值,来证实受体产生程序建立模拟受体的能力,该受体可以模拟任意选择的活性状况。
在本实施例中,所有受体均由15种聚合物组成。其宽度、长度和深度值确定了15种聚合物相对于受体中心原点的坐标。实施例1
产生一个具有下面指标的模拟受体:
子单元数:240;宽度:6;长度:6;深度:25
代码:“410003310321220410333342405231201334102412402223233401003224251014405133243400324620412100131310043112101132412022421302413231124330133100323052300043341401020223021404144435026520341310331022051414141021402134014310010231110331235210016240”
对每个目标相对受体进行20次试验。
优化受体的亲和性值为0.9358,该值相对较低。
用于优化受体的目标底物是苯、苯酚、苯甲酸和邻-水杨酸。阿斯匹林的前体邻-水杨酸是用环氧酶进行前列腺素合成的抑制剂。苯甲酸和苯酚对同一位置的亲和性要小得多。目标亲和性值和受体亲和性值由下面的表A给出,这些数据表明,模拟受体具有对邻-水杨酸的最大亲和性。
                        表A目标化合物    目标亲和性    加和亲和性值  最大亲和性值苯               0.6           20.88         3.38苯酚             1.2           8.03          4.99苯甲酸           1.6           42.23         12.98邻-水杨酸        4.4           80.33         34.71
用模拟受体对三个底物进行评估。得知两种化合物的活性低于邻-水杨酸:间-水杨酸和对-水杨酸。第三个化合物,Diflusinal是一种氟化的水杨酸衍生物,其功效等于或大于水杨酸。评估结果见表B。
                        表B目标化合物    加和亲和性值    最大亲和性值间-水杨酸         45.9           12.3对-水杨酸         63.5           27.5Diflusinal        117            71.2邻-水杨酸         80.33          34.71
采用模拟受体得到的结果与这些化合物的药理数据十分吻合:间-水杨酸和对-水杨酸的亲和性值低于邻-水杨酸,而Diflusinal的活性则比邻-水杨酸大。为了提高对活性的预测准确度,需要对模拟受体进行进一步的改善以及使用其它的、独立优化的受体。部分B:新的、具有选择功能特性化合物的开发
新配体的调优
对一群模拟受体进行调优,以便具有对拥有相似功能特性的一组目标化合物的选择亲和性,这些受体可用来设计具有相似特性的新化合物,如果这些特性与结构或模型化合物的结合亲和性密切相关的话。用与受体的相互作用作为选择标准,新的化学结构可以调优至对受体具有最佳的适应性。因为这些化合物必须满足对受体选择性的必要和充分条件,新化合物很可能具有与原始分子目标相似的活性。过程概述
1.产生一群对一组特定目标化合物具有优化选择性的模拟受体。在某些情况下,需要产生若干个具有不同亲和特性的群体。例如,可以产生三个模拟受体群体,第一个模拟选择的目标位置性质,第二个模拟将配体转移至初始目标所需的位置,第三个模拟调节不需要的负作用的目标位置。在此情况下,发展一种新的配体结构需要同时对前两个受体群体进行亲和性优化,并使第三个群体的亲和性最小化。
2.为模拟受体群体确定一个新的初级结构亲和性。
3.用模拟受体群体修饰初级结构并评估亲和性。如果这种修饰提高了亲和性特性,则修饰后的结构将保留下来进行进一步的修饰。否则将试验一种新的修饰方法。先前摈弃的修饰方法可能重新引入与其它修饰方法一起使用。
4.重复步骤3直到获得具有适当亲和特性的化合物。
注意:利用对模拟受体的适当分辨可能调优对选择的目标位置具有次一最大亲和性的化学结构。
1)分子基因型代码的产生
以由字符串表示的线性基因型的形式,对配体表型(分子结构)进行编码将有助于变异、重组过程以及调优过程中配体结构特性的继承。
由本程序调优的配体由取代的碳骨架组成。每个代码由三个字符矢量组成。初级代码矢量包含产生碳骨架的的转动指令并确定了碳骨架中每个碳原子的位置。二级代码矢量确定了附着在每个碳原子上的官能团。三级代码矢量确定了官能团相对于宿主碳的位置。对结合有碳原子以外其它原子的分子骨架(如,醚、酰胺和杂环化合物),可用相似的方式来构造,用代码中的其它字符来指定骨架中取代碳原子的其它原子类别。
碳骨架由形成三维四面体坐标体系节点的一系列点构成。在初始骨架构造中,最近点的间距等于烷基碳原子的平均键长。初级代码矢量:配体骨架的决定因素
初级代码矢量包括确定相对于现有原子位置进行转动的方向的字符。每个转动方向确定了四面体矩阵中下一个原子的坐标。每个原子有四种方向(1,2,3,4),对应于sp3碳原子的未填充的价。每个碳原子属于四种可能状态(A,B,C,D)之一。这些状态相对于四面体坐标体系中不同节点的数量。
转动方向与骨架中下一个原子的新坐标之间的关系由下表给出。下面的B1和B2两个表包括构造配体所需要的两个转动约定。船式约定导致产生一个四面体矩阵,其中的6员环(环己烷)假定为船式构型。椅式约定导致产生一个矩阵,其中的环己基环假定为椅式构型。在代码产生过程中可能将两种约定结合起来。在这里讨论的例子中只用了船式约定。表B1:船式约定当前位置=(x,y,z)
                      转动后的新位置当前状态  转动=1    转动=2    转动=3    转动=4
A (x-.75,y+.433,z-.5) (x+.75,y+.433,z-.5) (x,y-.864,z-.5) (x,y,z+1)
B (x+.75,y-.433,z+.5) (x-.75,y-.433,z+.5) (x,y+.864,z+.5) (x,y,z-1)
C (x-.75,y+.433,z+.5) (x+.75,y+.433,z+.5) (x,y-.864,z+.5) (x,y,z-1)
D (x+.75,y-.433,z-.5) (x-.75,y-.433,z-.5) (x,y+.864,z-.5) (x,y,z+1)
每次转动将产生新原子的状态指标:
                   转动后的新状态当前状态    转动=1    转动=2    转动=3    转动=4
 A  B  B  B  C
 B  A  A  A  D
 C  D  D  D  A
 D  C  C  C  B
表B2:椅型约定:
当前位置=(x,y,z)
                      转动后的新位置当前状态 转动=1    转动=2    转动=3    转动=4
 A (x-.75,y+.433,z-.5) (x+.75,y+.433,z-.5) (x,y-.864,z-.5)  (x,y,z+1)
B (x+.75,y-.433,z+.5) (x-.75,y-.433,z+.5) (x,y+.864,z+.5)  (x,y,z-1)
C (x-.75,y-.433,z+.5) (x+.75,y-.433,z+.5) (x,y+.864,z+.5)  (x,y,z-1)
D (x+.75,y+.433,z-.5) (x-.75,y+.433,z-.5) (x,y-.864,z-.5)  (x,y,z+1)
每次转动将产生新的原子状态指标:
                      转动后的新状态
当前状态 转动=1 转动=2 转动=3 转动=4
 A  B  B  B  C
 B  A  A  A  D
 C  D  D  D  A
 D  C  C  C  B
通过使用这些关系,初级代码矢量由1,2,3和4组成的字符串构成,经解码可以生成三维排列的碳原子。所得到的碳原子链能自我折叠或形成封闭的环,进而形成短边链状和环状结构。如下所示,特定的环状结构(如环己烷)可以直接结合成为作为特殊字符序列。二级代码矢量:取代基
二级代码矢量具有与初级代码矢量一样的长度,被用来分配附着在碳原子上的取代基类别,被附着的碳原子由初级代码矢量来确定。每个取代基均由一个独立的字符来确定。取代基被单个地加到碳骨架上。单独一个碳原子可有不只一个取代基,但必须是初级代码对其进行了不只一次指定。
在目前的程序中,所有的价位均未被由二级代码矢量所确定的取代基填充。在配体构造过程中,这些未填充位置将自动被氢原子占据。用其它原子而非氢原子来占据空价位时,可以采用其它规则。三级矢量:取代基键矢量
三级代码矢量具有与初级代码矢量相同的长度,被用来分配用于取代基附着的价键,取代基由二级代码矢量来确定。三级代码包括字符1,2,3,4,每个字符代表由初级代码确定的转动方向。只有在价键没有被由初级代码矢量确定的碳原子或另一个先前分配的取代基所占据时,才能分配取代基。另外,连续的取代基可能替换先前分配的取代基。2)代码的建立
为了建立碳骨架,通过建立一个随机字符序列来构造初级代码,字符序列属于字符组{“1”,”2”,”3”,”4”}。建立杂环结构、醚、酰胺、亚胺和羧基化合物时,需要用由二级代码确定的不同原子来替换骨架中的碳原子。
二级代码产生自确定取代基类别的随机字符序列。在代码产生前,字符出现的频率可以是随机的,也可以是固定的。
三级代码是由属于集合{“1”,“2”,“3”,“4”}的字符组成的,通过在初级码中增加特殊字符序列来人为组成环状结构(与随机形成相反)。例如代码“431413”代表环己基环。在四面体矩阵中,共有24种代码串代表环己基环的各种可能取向。前面已经介绍了用于初级环状代码的二级和三级代码矢量的生成。模块10提供了产生环状碳骨架代码的举例流程图。
构成碳原子骨架的环的进出点的相对位置,是由用来形成环状结构的字符序列的长度决定的。特别的,如果序列包含有6个字符,如431413,那么环的进出点位于环的同一位置。如果序列被部分重复,以及在原有的6个字符上附加上新的字符,那么环的进出点将不在环的同一位置。如,在由序列4314134和43141343141产生的的环中,环的出去点位于与环的进入点相邻的位置。
在本程序中,通过在代码中增加6个或更多的字符序列,便可在骨架上增加环状结构。在由431413决定的环状结构中,所用到的可能序列有:
431413
4314134
43141343
431413431
4314134314
43141343141
431413431413
431413431413
产生新配体基因型的约定,可以用来以线性方式编码其它化学结构,或者用于保存或引入配体的调优过程。如,一种已知的药效基团可以进行线性编码,并作为具有相似功能或增强功能的新配体调优的起始点。相似的,与同一目标位置作用的一组药效基团可以进行线性编码并用于重组。3)编码的翻译和配体的构建
通过一个由三个独立步骤组成的翻译过程中将代码矢量转变成配体的三维表象。第一步,用初级代码构建碳原子骨架。第二步,通过二级和三级代码矢量的指令将取代基加到碳原子骨架上。来自二级和三级代码矢量的指令也可以使碳原子骨架中的碳原子被其它原子所取代。来自二级和三级代码矢量的指令,也可以使构成初始骨架一部分的碳原子或其它原子的化合价的数量和取向发生改变。如,羰基氧的引入将占据两个空的价位。第三步,在所有在第二步未被取代基填充的价位将用氢原子来填充(除非有其它指定)。初级解码:配体骨架的建立
初级解码利用初级代码矢量中的转动指令来指定每一个碳原子的位置。假设第一个原子定位于坐标原点。假设第一个原子应在矩阵中占据状态A的位置。
解码过程依序进行,初级解码过程的结果是一个3×n的矩阵,包含有骨架中n个碳原子中每个碳原子的X、Y、Z坐标。由于允许成环化和反转,因此同一空间位置上可以被一个以上的碳原子所占据,但在此情形下,只有一个碳原子被假定位于这样的位置上。结果,构成一个完整骨架的碳原子数目可能小于初级代码矢量的字符数。
在读初级代码时,由指定附着到每个碳原子位置上的取代基的二级代码构成一个数列。同时,指定的被每个取代基所占据的价位的三级代码也构成一个平行数列。次级解码:取代基的添加
根据初级解码过程中由二级码形成的数列,依次将取代基添加到每一个碳原子上。用相应的由三级码形成的数据指定相对于宿主碳价键位置。如果该位置已被邻近碳原子占据,或者被以前所确定的取代基占据,则取代过程不能进行。换言之,当取代过程在下一个未被占据的位置上完成,或取代过程替换了以前指定的取代基时,解码过程方才完成。取代基与碳原子之间的距离可以通过查键长表计算出来。位置参数和键长用来计算取代基的坐标。对于多组分取代基,如羟基、硝基、氨基,取代基的每一个原子的坐标都是相对于宿主碳原子的。
当所有经二级代码矢量确定的取代基均被加到碳骨架上后,所有未被取代基填充的价位将用氢原子来填充。氢原子和sp3碳键长被用来计算每个氢原子的坐标。
单个碳原子可以具有多于一种的非氢取代基。这种情况可以发生在初级代码矢量对同一位置进行多次指定的时候。本程序不包括直接用二级代码进行多重取代,尽管这种操作很容易。
只允许在未被形成配体骨架的碳原子占据的位置上进行取代。在四面体矩阵中,所有占据位置的累加数量均被保留下来。
在次级解码过程中,所有构成配体的原子的种类、半径、位置均汇总在一个数列中。这个数列是下面的目标形成的基础。
在此阶段,还没有对由代码序列产生的结构进行可行性评估。在某些情况中,原子坐标可以被输入到能量最小化程序中产生更加现实的结构。但是,在目前程序中,对结合时配体的构型未作任何假设。同时,本程序保留了同一分子特定构型的结构特异性。例如,本程序将丁烷的三种转动异构区别开来,而且将每个异构体当作独立的分子来处理。
代码矢量构成了相应配体的基因型,并可发生变异和与配体结构的变异结果进行重组。配体结构本身是表型,并用来评估与选定的虚拟受体群的结合亲和性。4)目标表象
化学结构或目标配体最初是根据随机产生的代码形成的。在解码后,目标配体的每个原子的坐标、半径、偶极矩和极化率,均是从查阅数值表中获得的,这些数值又被用来估算配体与选定的虚拟受体群之间的结合亲和性。
对目标相对于受体表面的众多取向,均需测试其与每个虚拟受体的亲和性。至于配体与模拟受体取向性,则未作任何假设。在对结合亲和性评估之前,受体和目标必须发生接触。产生目标表象和计算化学结构与模拟受体之间的亲和性的方法,本质上与在模块4中讨论的已知目标分子和模拟受体间的计算方法相同。5)结合亲和性和适应性(fitness)的评估
用来进行适应性评估的、目标配体与每一种模拟受体的结合亲和性,可以用有效亲和性计算方法来加以计算,该计算方法与已经介绍过的、用目标分子产生模拟受体的方法相同。如前所述,采用其它标准计算亲和性的方法,也可以结合进适应性测试过程中来,但是本发明的功效和计算效率,部分依赖于采用相同的、有效亲和性计算方法来产生虚拟受体以及用模拟受体群来产生的化学结构。6)配体调优
适应优良度检验
对选定的虚拟受体群与新的配体或化学结构底物之间的适应优良度的评估,是通过比较对配体的目标活性或亲和性,与得到的对模拟受体-配体复合物的活性或亲和性,来进行的。一个最佳选择的虚拟受体的最大亲和性应当与目标亲和性测量强烈相关。调优过程的连续迭代可以用来提高这种相关性。
对于任何水平的结合亲和性均可以设置目标值。配体无需对用在选择过程中的所有虚拟受体具有相同的结合亲和性。在目前的程序中,对已知底物的优化虚拟受体的最大结合亲和性,可以用来计算目标结合亲和性。例如:目标亲和性可以被设置为虚拟受体群中每一个受体与特定底物的结合亲和性的90%。换句话说,如果配体与虚拟受体间的相互作用最小时,可以将目标结合亲和性设置为零。
把不同底物组优化的模拟受体与对每个受体的相关选定目标亲和性值相结合,选择新配体以获得特定结合亲和性。配体适应性可以衡量计算出的配体结合亲和性与目标亲和性值之间的匹配程度,最优化过程将使配体适应性最大。
在检验前并不知道配体对最大结合亲和性的最佳取向。为了获得某一范围受体-配体亲和性的代表性量度,使用相对于受体表面的不同随机取向对每一个新配体进行反复检验。每次检验均使用A部分中的模块4来计算亲和性。总之,所获得的最大亲和性值的可靠程度取决于样本的大小,因为样本包含有实际的最大值的可能性是逐渐增加的。
在本程序中采用了两种技术以避免为产生优化新配体或化学结构而对大样品组的需求:
1.利用一个结合了平均(或加和)亲和性与最大亲和性的测量,来选择具有优化亲和性的配体;
2.连续重复优化过程,被测的取向数量不断提高(优化过程开始于一小组目标取向,当具有更大适应性的配体产生后,试验的取向也更多了)。
在目前的程序中,加和是针对每个配体的所有被测取向的亲和性值进行的。加和亲和性值是受体和配体之间的平均亲和性的一种测量。同时,最大亲和性值也被确定了。
加和亲和性和最大亲和性都可以用来检验虚拟受体与新配体之间的适应性良好程度。根据所计算出来的加和亲和性值、最大亲和性值与这些参数的目标值之间的差别,便可以对每一个新配体适应性进行分级。在目前的程序中,该差值计算为:
所计算出的值是每一个新配体-模拟受体对的适应性值。当适应性值为零时,适应性最大。目标最大亲和性和目标加和亲和性是从在以前章节讨论过的、在优化虚拟受体调优过程中建立的回归函数得到的。目标值按以下方法得到:
目标最大亲和性=f×所用的最有效底物对形成虚拟受体的最大亲和性
目标加和亲和性=f×所用的最有效底物对形成虚拟受体的加和亲和性
在此,f=换算系数。
当多种模拟受体被用来评估配体适应性时,将每一对配体-模拟受体的适应性值进行加和。 F tot = Σ i - 1 n F i
在此情况下,当适应性加和值为零时,适应性最大。在有些情况下,当检验一个新配体对于一组不同的模拟受体时,要求只能用最大亲和性值。在此情况下,适应性值给出如下: F tot = Σ i - l n |计算出的最大亲和性i-目标最大亲和性i|/目标最大性i
在此情况中,当适应性加和值为零时,适应性最大。其它方法,如用几何平均,也可以用来计算受检配体对于一组不同的模拟受体的总亲和性。
对每一个模拟受体的最大亲和性值和加和亲和性值的使用,将保证虚拟受体的选择性与配体适应性相关联。根据这种方法,配体的适应性不仅反映出配体的亲和性,同时也反映出虚拟受体对空间要求的满足,二者都是选择性的基础。6a)优化过程
目的
为了使一个具有对一组模拟受体的选定目标亲和性的新配体进行调优,需要一个高效求解的机理,因为包含25个指令的可能基因型的总数为25625个。
过程
(1)阶段1.产生一组对配体进行编码的随机基因型,对一组模拟受体进行筛选,从中选择超过适应性阈值水平的配体;
(2)阶段2.运用基因算法(重组)和单向变异技术,将选择出的基因型作为进一步优化的基础。改变选择的基因型,为了进行重组,产生一组不同的、但又相关的基因型繁殖群。
(3)在用于重组的群中选择出最有选择性的变体。
(4)阶段3.通过重组选择性变异体,产生出新的基因型。在产生的基因型中,选择出那些具有最高亲和适应性的基因型。用这个子群去产生下一个重组体(重复阶段3)或变异体(重复阶段4)。
(5)阶段4.利用最佳的重组产物,并重复进行点变异以提高选择性。
(6)当具有所需适应性的配体产生后,最优化过程也就完成了。阶段Ⅰ:初始代码的调和-形成
优化过程第一阶段的目的是产生一个具有最小亲和性水平的基因型和相应的配体表型。因此,该基因型被用来产生相关基因型群。
由Holland发展起来的基因算法可以用来寻找各种问题的优化解。通常该技术在使用时采用很多初始是随机的解。在目前的程序中,对该技术进行了较大的修饰以便降低寻找具有高选择性的配体所需要的试验和迭代次数。为了实现上述目的,还采用了一组紧密相关的基因型作为初始群体,并在每次迭代时采用高速变异的办法。对于任何一组目标化合物,发展具有最优亲和特性的不同配体都是可能的。例如,受体可以优化结合到同一目标,但是处于不同的取向。使用密切相关的基因型作为初始群,将提高优化过程收敛到单个解的可能性。对非相关基因型进行重组,虽然可能产生新的、适应性改进的基因型,但更可能导致离散。阶段2:配体变异
调优过程中第二阶段的目的是产生一个来自初级基因型的不同的、但又相关的基因型群。因此该群的成员被用来产生重组体。该繁殖群是通过对初级基因型进行多重变异而得到的。所得到的基因型被进行翻译,并对选择性进行筛选。对于重组保留最大选择性的产物。
可以通过改变编码配体结构的基因型(代码矢量)的字符来改变配体。这种变异使得配体的形状以及配体上功能团的位置和功能团的类型均发生改变。在本程序中变异能够改变构成配体骨架的碳原子的数量。模块11是一个多点变异的示意流程图。
变异可改变配体表型的折叠模式并改变官能团的形状、位置或暴露情况。变异对配体表型外部区域构型的影响将导致相对于受体中心的位置变化。中性变异
所有的变异都将改变表型的结构,但是,并非所有的变异都将导致配体功能的变化。中性变异可以改变配体的组成,但不会影响其亲和性。在某些情况下,这些中性变异可与后面的变异一起产生协同效应。序列变异
序列变异并不直接改变代码字符,但代码中的字符序列却被重新安排了。序列变异可以改变配体的大小和结构构型以及功能团的存在与分布。在目前的执行程序中采用了四种序列变异:
a)删除:一串字符从代码中删除。
ABCDEAABEA
b)倒置:组成代码中的一个字符序列的顺序被倒置过来。
ABCDEA ABDCEA
c)复制:组成代码片断的字符序列被复制。
ARCDEAARCDCDEA
d)插入:一个字符序列被插入到代码中。
ABCDEAABCDBCEA
在目前的程序中,几种变异配合使用。模块12提供了一个序列变异的示范流程图。阶段3:或重组代码的产生
在重组过程中,随机选择的、互补的片断在选定的基因型之间进行交换。重组的目的是为了产生新的更具适应性的基因型。重组有助于保持对表型适应性十分重要的基因片断,并在同时引入新的指令组合。通常,重组与选择一起导致了选择性的快速优化。模块13提供了重组过程的示范流程图。
目前的程序保留了用于重组测试的群,从而保证了高选择性的基因型不会被适应性较低的基因型所替代。在目前的执行程序中,在测试之前,多重变异被应用到50%的重组基因型。该过程提高了重组群中的可变化性。在目前的程序中,测试群的大小在10至40个基因型。这是一个相对较小的群。在某些条件下可能需要更大的群体。阶段4:配体成熟
渐进微变异技术
优化过程的最后阶段类似哺乳动物免疫系统中抗体的成熟。对基因型进行一系列的单个点变异并评价其对表型适应性的影响。与重组不同,该过程通常只造成表型选择性的小量递增变化。这一成熟过程采用了Rechenberg(1+1)调优战略。在每一代,母体基因型的适应性与其变异产物相当,而具有较大选择性的基因型为下一代保留下来。结果,该过程是严格单方向的,因为选择性较小的变异体不会替代其母体。在变异过程的每一次重复中,在本执行程序中代码中只有一个指令被改变了。
如果一个母体与其变异产物具有相同的选择性,那么,在下一代,该母体将被其变异产物所取代。此种方法将导致中性变异的累加,并与后续变异一起产生协同效应。上述约定是随意的。模块14给出了成熟过程的示范流程图。
如果重组或成熟在多次重复后没有使选择性提高,则可能有必要重复多重变异(阶段2)以提高繁殖群基因组的可变性。
                    配体产生的实施例概述
蚊子Aedes aegypti受苯甲醛的排斥,但受苯和甲苯排斥的程度则要下得多(表1)。该物种受环己烷或己烷的排斥也不强烈(表1)。在下面新配体产生的试验中,采用的方法是从头产生与苯甲醛的排斥性类似的化合物。产生配体的第一步是构造对苯甲醛有高亲和力而对苯有低亲和力的模拟受体。第二步,配体用具有与苯甲醛类似的、对模拟受体的亲和力来调优。蚊子响应
蚊子是在实验室培养的,出现后(post-emergence)7-14天并且不给喂食。试验在20℃和荧光灯照射下进行,试验周期为6天。试验时间是12:00-17:00 EDT。四组试验的测试群体分别为200、175、105和95个雌性蚊子。向蚊子提供饮用水。
试验在一个35×35×35cm的洁净有机玻璃箱中进行,箱子的一组对面由过滤板组成。过滤板由两层组成:粗疏的塑料筛构成的内层与由细密的尼龙筛构成的外层。箱子放置在通风柜中以便空气能从一边的过滤板进入并从相对的另一面出去。空气流量小于0.5cm/s。
蚊子头朝上停留在箱子壁上。采用三角形的Whatman 1号滤纸来传送刺激性化合物。把滤纸的尖端插入测试液0.5cm并立即使用。对测试液的响应按以下方法来确定:
1.一只静卧在顺风箱壁的内层筛网上的雌性蚊子被选来作试验。
2.处理过的滤纸尖端放置在筛网外面并固定在对着蚊子胸附(mesothoracic tarsus)的位置上。在所有的试验中,最初的接触位置均低于蚊子所在的位置。
3.将滤纸尖端固定保持最多3秒钟就可观察到蚊子的反应。
选择一只新的蚊子并重复上述过程。每天只用一种化合物对蚊子进行一次试验。滤纸用五次(总持续时间小于30秒)后即被替换。化合物的测试顺序是随机的,每种化合物在不同的日子测试两次。用未处理(干的)的和用蒸馏水浸湿的滤纸尖端进行两组对比试验,滤纸尖端的固定方法与处理过的滤纸尖端一样。对比试验有规律地安排在排斥性化合物测试之间。对比试验中蚊子的反应在整个试验过程中没有发生变化(p>0.25)。
记录了四种反应:
1.没有反应:蚊子保持不动。
2.飞走:蚊子从所处位置飞走。
3.同侧大腿抬起:蚊子抬起与刺激源在同一侧的胸大腿。
4.反侧大腿抬起:蚊子抬起与刺激源相反一侧的胸大腿。
蚊子在抬起同侧大腿后往往飞走,在这种情况下,记录下两种反应。在测试和化合物制备的所有步骤中均需戴上聚乙烯手套。表E1.蚊子对所选择的挥发性化合物的反应化合物    沸点(℃) N    飞走响应% 抬腿响应% 相对排斥性*苯甲醛    178      130      90       10         178苯        80       72       72       12.5       68甲苯      110      166      67       27         94环己烷    81       80       6        0          4.9己烷      69       100      4        0          2.8对比(空白)-        450      5        0*相对排斥性=[(飞走响应%+抬腿响应%)×沸点]/100模拟受体和配体产生
相同的选择标准产生了两个模拟受体。每一个受体独立使用并产生一组配体。分子集合1阶段1:受体产生
受体演变并具有对苯甲醛的选择亲和力。
训练目标是苯和苯甲醛。利用每一种目标的15种取向来计算亲和力值。
调优过程的结果如下:目标    活性水平    总亲和势    最大亲和势苯        1.0       6.87           2.21苯甲醛    5.9       75.87          13.02
对受体的亲和势分值为0.992
优化的25×6×7苯甲醛受体的代码如下:231014406145 053400324221 412100131300 063112101132412061421302 413231124335 133100333032 300043541401022224-31514 143431012321 341310334122 101414141021402131114311 010233120331 260214016231阶段2:配体产生
优化的模拟受体用作新配体调优的模板。提供随机变异和选择,四个不同的配体被组合起来。配体的选择依据与苯甲醛的相似性,其对配体的亲和性值如下:苯甲醛    配体1.1          配体1.2        配体1.3          配体1.4
                C9H17C12OH     C8H15Cl     C8H13Cl(=O)    C13H16OH(=O)加和亲和性75.87     74.03            67.88           72.25           72.94最大亲和性13.02     12.82            15.14           12.58           11.2
图4b给出了参与调优的配体1.1-1.4。每一个配体至少有一个取向在结构上与苯甲醛类似。分子集合2
阶段1:受体产生
一个25×6×7的受体调优并具有对苯甲醛的选择亲和性。训练目标是苯和苯甲醛。利用每个目标的15种取向来计算亲和性值。
调优过程的结果如下:目标    活性水平    加成亲和性    最大亲和性苯        1.0          25.88       8.53苯甲醛    5.8          162.23      42.74
对受体的亲和性分值为0.996
受体代码如下:031264 441313 004422 243042 223140 112054 302122 330134543301 114446 210043 042311 323431 131340 130020 120133224223 503403 432003 432122 002221 221113 4114400 03113323030 313214 002321 144010 000243 013133阶段2:配体产生
优化的模拟受体用作新配体调优的模板。提供随机变异和选择,四个不同的配体被组合起来。配体的选择依据与苯甲醛的相似性,其亲和性值如下:
     苯甲醛     配体2.1           配体2.2       配体2.3        配体2.4
                C8H13C(=O)    C9H15Cl(=O)  C6H10CN(=O)  C9H13(=O)2加和亲和性162.23    182.4           166.5           159.7         156.8最大亲和性42.74     48.97           43.0            39.0          46.5适应性分值0.135     0.02            0.05            0.06
图4c给出了参与调优的配体2.1-2.4。每一个配体至少有一个取向在结构上与苯甲醛类似。
化合物2.1-2.4均是取代环己酮衍生物。配体2.2是5-氯-2,7-壬二酮,配体2.3是2-氰基-5-己酮。配体1.4包括一个结构上与甲基环己基酮相应的部分。环己酮、薄荷酮、甲基环己基酮和2-辛酮(图4a)的排斥性试验表明这些配体也对蚊子具有排斥性(表E2)。表E2.蚊子对所选择的挥发性化合物的响应
化合物 沸点(℃) N 飞走响应% 抬腿响应% 相对排斥性*
苯甲醛 178  130  90  10  178
 2-辛酮 173  80  82  12.5  162
 2-乙酰环己酮 225  100  54  24  175
环己酮 156  134  99  1 >=154
薄荷酮 207  110  72  11  172
对比(空白) - 450  5  0
*相对排斥性=[(飞走响应%+腿响应%)×沸点]/100
这里介绍的设计新的具有预先设定功能特性或性质的化学结构方法只是通过实施例进行了描述。例如,该方法也可利用其它已知或已接受的极化率、偶极矩、共价半径等参数值进行实施。另外,在模块中描述过程计算步骤的流程图只具有示例作用。例如,对亲和性的计算也可以利用现有的、采用更少近似的程序包来进行。产生新的化学结构的方法,取决于第一个或多个对具有相似功能特性的已知目标化合物,具有预定的亲和性的模拟受体的产生,取决于利用这些受体去产生新的结构,这些结构具有在任意程度上所需要的特性。这些受体本身可用于产生新的化学结构以外的其它应用,例如,用作筛选已知化合物的药理或毒理性质的方法。因此,本领域的熟练人员将认识到:对在这里介绍的方法所做的大量变化依然在本发明的范围之内。
            表1:过渡态和附加因子
原态    附加因子    特定转动下的新态
Δx      Δy    Δz    向右    向上    向左  向下1   0        1      0      2       4       3     52   -1       0      0      15      6       1     243    1       0      0      1       7       15    224    0       0      -1     12      23      14    15    0       0      1      9       1       16    236    0       0      -1     11      20      10    27    0       0      -1     13      21       8    38    0      -1      0      7       9       24    149    -1      0      0      17      10       5    810   0       1      0      6       14      22    911   0      -1      0      22      16       6    1212  -1       0      0      18      11       4    1313   0       1      0      24      12       7    1614   1       0      0      4       8       18    1015   0      -1      0      3       17       2    1816   1       0      0      5       13      17    1117   0       0     -1     16       19       9    1518   0       0      1     14       15      12    1919   0       1      0     20       18      21    1720   1       0      0     23       24      19     621  -1       0      0     19       22      23     722   0       0      1     10        3      11    2123   0      -1      0     21        5      20     424   0       0      1      8        2      13    20计算公式:输入(原态,转动)输出(Δx,Δy,Δz,新态)实例:初始位置(12,34,-18);输入:原态=10,转动=向右:输出:新态=6,Δx=0,Δy=1,Δz=0;结果位置(12,35,-18)
表2:范德华半径
                 H    F    O   N    C    Cl    S   Br   P    I元素的范德华半径(pm) 110 140  150  150  170  180  180  190  190  200相对半径(H=0.5)      0.5 0.64 0.68 0.68 0.77 0.82 0.82 0.86 0.86 0.91引自:N.S.Issacs,1987.Physical Organic Chemistry,Longman Scientific andTechnical,New York,828pp.表3:共价键半径(pm)键级第初级    H
     28
      B      C     N    O    F第初级   88      77    70   66   64第二级                66.5  60   55第三级                60.2  55芳香族                70
             Si    P    S    Cl第初级           117   110   104  99
                             Br第初级                            114引自N.S.Issacs(1987).表4:用于电荷位置分布的有效偶级值键            原子    偶级值(得拜)C-H            H      +0.35或+0.84*
           C      无电荷分布ArC-H          H      +0.6
           C      -0.366或无电荷分布=C-H           H      +0.3336
           C      -0.6或无电荷分布C=O            O      -2.7
           C      无电荷分布*或+1.35C-O-C          O      -0.8C-OH           H      +1.5或+1.7
           O      -1.1C-NH2         H      +1.3
           N      -1.3C-NO2         O      -2.0
           N      +4.0C≡N           N      -3.7
           C      无电荷分布C-S-C          S      在噻吩或二甲基硫化物中+1.5*
                  (在一定情况下可能带负电荷)C-N=C          N      在吡啶或CH3-N=CH2中+1.5或+1.3Ar-F或C=C-F    F      -1.3C-F            F      -1.8Ar-Cl或C=C-Cl  C      -1.7C-Cl           Cl     -2.1Ar-Br或C=C-Br  Br     -1.7C-Br           Br     -2.0C-I            I      -2.0*多数情况下是优选的值每一个目标原子由八个数据的组来描述(xi,yi,zi,ri,bri,cri,dii),xi,yi,zi是相对于分子几何中心的位置坐标,ri=范德华半径,bri=成键或共价半径,cri=共价半径(=ri+0.5),αi=极化率,di=有效偶极矩值。表5:所选目标原子被选相对有效极化率原子    环境     相对极化率(αi)H        C-H        1.0H        N-H        1.1H        O-H        1.1H        S-H        3.0*F        C-F        1.5*Cl       C-Cl       4.0Br       C-Br       5.8I        C-I        8.9*C        C-CH3     3.7C        C-CH2-C   3.5C        C-CC2-H   3.2C        C=CH2     4.5C        C=CH-C     4.3C        C=CC2     4.0C        C≡C-H     4.9*C        C≡C-C     4.6*C        Arene环    4.3*或2.6(基于苯(离域电子云))C        C-C≡N     4.0C        C3-C-O-   3.6C        C2H-C-O-  3.8C        CH2-C-O-  4.1C        H3-C-O-   4.4C        C2-C=O    3.6C        CH-C=O     3.8C        C2-C=N    ?C        CH-C=N     ?C        C3-C-N    3.1C        C2H-C-N   3.3C        CH2-C-N   3.6C        H3-C-N    3.8O        C-O-H      2.1O        C=O        2.1O        C-O-C      1.8O        NO2       1.9*N        C-NH2     3.1N        C-NH-C     2.8*N        C-NC2     2.5*N        C-NO2     4.6*(在小分子中可能更大)N        C≡N       3.2S        C=S        7.7S        C-S-C      ?S        C-S-H      5.0*从分子极化率计算而得。?相关值可由适当的分子数据来确定。模块1:模拟受体的代码产生步骤1输入代码产生参数:ⅰ)代码长度和ⅱ)指令频率。步骤2初始化存储代码的空字符串。步骤3产生随机数。步骤4基于随机数和指令频率选择字符{‘0’,’1’,…,’6’}连接成代码串。重复步骤4直到串长度与现有代码串长度相等。步骤5输出代码。模块2:模拟受体代码变换步骤1输入包含受体的聚合物初始坐标。步骤2输入聚合物代码。步骤3读取代码第一个字符。步骤4如果字符是一个转动指令,用变换算法确定子单元坐标,否则转移至步骤7。步骤5存储子单元坐标。给子单元赋值0。步骤6如果字符不是代码的最后一个字符,重复步骤3,否则至步骤。步骤7如果字符是一个电荷指令,用变换算法确定子单元坐标(假定没有转动)。步骤8存储子单元坐标。给基于字符的子单元赋电荷值+1或-1。步骤9如果字符不是代码的最后一个字符,重复步骤3,否则至步骤。步骤10对每一个构成受体的聚合物重复步骤2到步骤9。步骤11输出子单元坐标及其电荷值。模块3:目标表象步骤1输入目标原子的坐标和半径(xti,yti,zti,半径)(i=目标中的原子数)
输入受体坐标(xrj,yrj,zrj,电荷j)(j=受体中子单元数)步骤2产生随机角度值(Δθ,Δφ)和转化值(kx,ky)。步骤3以随意量转动和转化原子坐标步骤3a将目标坐标转变成极坐标形式(xti,yti,zti,半径i)(θiii,半径i)步骤3b对角度进行随机变化(θiii,半径i)(θi+Δθ,φi+Δφ,ρi,半径i)步骤3c转化成直角坐标(θi+Δθ,φi-Δφ,ρi,半径i)(xi,yi,zi,半径i)步骤3d进行任意转化(xni,yni,zni,半径i)(xi+kx,yi+ky,zi,半径i)步骤4置目标坐标中心为原点(0,0,0)。步骤4a确定xni,yni,和zni的最大和最小值。步骤4b确定受体的几何中心xn中心=(xn最大值-xn最小值)/2,yn中心=(yn最大值-yn最小值)/2,
zn中心=(zn最大值-zn最小值)/2步骤4c计算中心坐标:(xncj,yncj,zncj)=(xni-xn中心,yni-yn中心,znj-zn最大值)步骤5用原子半径和变换后的坐标(xnci,ynci,znci,半径i)构造目标g(xg,yg)=zg的碰撞表面。步骤5a建立一个间隔等于受体子单元(=1)直径的网格。
网格坐标:
xg∈{Int(xn最小值-xn中心),Int(xn最小值-xn中心)+1…0,…Int(xn最大值-xn中心)-1,Int(xn最大值-xn中心)}
yg∈{Int(yn最小值-yn中心),Int(yn最小值-yn中心)+1…0,…Int(yn最大值-yn中心)-1,Int(yn最大值-yn中心)}
设定在网格上的所有点的g(xg,yg)的初始值为0步骤5b对于每一个原子(ⅰ)根据如下规则设定每个格点(xg,yg)的值g(xg,yg)(高度):
Fori=1to目标中的原子数
If(xnci-xp)2+(ynci+yp)2<半径i 2then g(xg,yg)=minimum(g(xg,yg),znci-半径i)
Else
If(xnci-xp)2+(ynci+yp)2<(半径i+.5)2then
g(xg,yg)=minimum(g(xg,yg),znci-(半径i/2))
Else
g(xg,yg)=minimum(g(xg,yg),0)
Nexti步骤6设定受体坐标中心为原点(0,0)。步骤6a确定xrj,yrj和zri的最大值和最小值。步骤6b确定受体的几何中心:
xr中心=(xr最大值-xr最小值)/2
yr中心=(yr最大值-yr最小值)/2
zr中心=(zr最大值-zr最小值)/2步骤6c计算中心受体坐标:
(xcj,ycj,zcj)=(xrj-x中心,yrj-y中心,zrj-z最小值)。步骤7根据如下规则利用中心受体坐标构造受体s(xs,ys)=zs的碰撞表面。
置s(xcj,ycj)的所有初始值为0。
forj=1 to受体中子单元数
if zcj>s(xcj,ycj)then s(xcj,ycj)=zcj
nextj步骤8确定受体碰撞表面与目标碰撞表面的最小间距。
根据如下方式计算所有的差分矩阵d(xg,yg)
xg∈{Int(xn最小值-xn中心),Int(xn最小值-xn中心)+1…0,…Int(xn最大值-xn中心)-1,Int(xn最大值-xn中心)}
和yg∈{Int(yn最小值-y 中心),Int(yn最小值-yn中心)+1…0,..Int(yn最大值-yn中心)-1,Int(yn最大值-yn中心)}
计算d(xg,yg)=(h(xg,yg)-zn最小值+zn最大值)+(s(xg,yg)+zr值小值-zr最大值)
对所有xg,yg,确定d(xg,yg)=dmin的最小值。
dmin为最小间距。步骤9为建立碰撞构型变换目标和受体坐标
对受体:
(x受体j,y受体j,z受体j)=(xcj,ycj,zcj+zr最小值-zr最大值)
对目标:
(x目标i,y目标i,z目标i)=(xnci,ynci,znci-zn最小值+zn最大值-dmin)。步骤10利用(x目标i,y目标i,z目标i)和(x受体j,y受体j,z受体j)计算亲和性。
对测试的每一个目标构型重复步骤2-9。模块4:亲和性计算步骤1输入目标和受体的碰撞坐标(x目标i,y目标i,z目标i)和(x受体j,y受体j,z受体j),其中i=目标中的原子数,j=受体中的子单元数。步骤2输入目标偶极矩值dip(i)
输入受体电荷值charge(j)步骤3输入近似计算阈值THRESHOLD步骤4计算偶极亲和性值步骤4a对每一个带电荷子单元(charge(j)≠0)计算e(i,j)=dip(i)/((x目标i-x受体j)2+(y目标i-y受体j)2+(z目标i-z受体j)2)1.5步骤4b对所有charge(j)≠0的i和j的组合计算e(i,j)的加和。
DIPOLE=∑e(i,j)步骤5计算近似值(该步骤可能被基于极化率的计算所代替)步骤5a对每一个|dip(j)|≤0.75的目标原子计算1(i,j)=((x目标i-x受体i)2+(y目标i-y受体j)2+(z目标i-z受体j)2)0.5
If1(i,j)<THRESHOLD then prox(i,j)=1步骤5b对所有|dip(j)|≤0.75的i和j的组合计算prox(i,j)的加和
PROXIMITY=∑prox(i,j)步骤6计算目标底物组合的亲和性值=AFFINITY
AFFINITY=(PROXIMITY/j)((PROXIMITY/10000)+DIPOLE)模块5:适应性良好度的计算步骤1输入已知目标功效或亲和性值(yk),k=被测目标数步骤2输入目标和受体的碰撞坐标(x目标i,y目标i,z目标i)和(x受体i,y受体j,z受体j)
ik=目标k中的原子数
j=受体中的子单元数步骤3输入被测目标取向数(=m)步骤4利用模块5获得每一个目标和目标取向(=AFFINITYk,m)的亲和性值。步骤5确定每个目标的最大亲和性(MAk)和加和亲和性(SAk)值。
步骤6计算最大亲和性(MAk)对已知目标功效或亲和性值(yk)的相关系
数rMA 2,以及加和亲和性(SAK)对已知目标功效或亲和性值(yk)的相关系
数rSA 2。步骤7计算适应性系数F
F=(rMA 2×rSA 2)0.5选择步骤步骤6′计算最大亲和性(MAk)对已知目标功效或亲和性值(yk)的相关系数rMA 2
及加和亲和性(SAk)-最大亲和性对已知目标功效或亲和性值(yk)的相关系
数rSA-MA 2。步骤7′计算适应性系数F
F=(rMA 2×(1-rSA-MA 2))0.5模块6:产生具有最小亲和性水平的基因型步骤1设定最小适应性阈值步骤2产生随机基因型(模块1)步骤3翻译基因型以构造表型(模块2)步骤4测试表型对目标的亲和性(模块3,4,5,6)步骤5如果表型的适应性超过了适应性阈值,则终止代码的产生并把代码传递到阶段2。否则重复步骤1-5。模块7:多重变异步骤1输入初级代码(从阶段1)。步骤2设定每个代码的变异数(=q)(目前的程序对基因型的2.5-5%的字符进行变异)。步骤3输入群大小(=p)。步骤4在基因型中随机选择一个位置。步骤5在该位置上用一个随机选择的不同字符替代代码字符。步骤6重复q次步骤4和5。步骤7重复步骤4-6以产生总共p个新代码。步骤8利用模块1-6检测变异群体的适应性。选择具有最高选择性的子群以便在阶段3中使用。模块8:重组步骤1设定群体大小(=p)。步骤2从阶段2中产生的群体中随机选择两个代码。步骤3在基因型中随机选择一个位置。步骤4随机产生用于交换的字符数。步骤5在从选择的位置开始的代码间交换字符。步骤6重复2-5直到产生p个新的基因型。步骤7应用模块2-6来检测变异群的适应性。为下一代重组序列或阶段4的成熟过程选择具有最高选择性的子群。模块9:成熟步骤1输入从阶段3得到的母体代码。步骤2设定迭代次数。步骤3在母体基因型中随机选择一个位置。步骤4用一个随机选择的不同字符替代该位置上的代码字符。步骤5用模块2-6检测母体代码(FP)和变异产物(FM)。步骤6如果FM≥FP,用变异产物替代母体基因型。步骤7根据所要求的迭代次数重复步骤3-6。模块10:产生碳环骨架的代码的构建(6员环,进入点=出来点)步骤1设定代码长度设定v1,v2,v3,…vn(取代基频率)。设定prob_ring(环代码序列频率)。(0≤prob_ring≤1)步骤2初始化prime_code=″″。初始化second_code=″″。初始化third_code=″″。步骤3建立字符串。
重复步骤4直到得到代码长度。步骤4a如果prob_ring>随机数(0≤随机数≤1)则环(通常为船型)指定字符。
设定new_character_1为随机选定的数值{‘431413’,‘314134’,
‘141343’,‘132132’,‘321321’,‘213213’,‘123123’,
‘231231’,‘312312’,‘421412’,‘214124’,‘141242’,
‘324234’,‘242343’,‘423432’}
为取代基指定字符。
设定new_character_2为6个从{c1,c2,c3,…,cn}中随机选定的字符
使用频率v1,v2,v3,…vn(c1…cn为代表不同的官能团)。
为取代基价数指定字符。
设new_character_3为6个从{‘1’,‘2’,‘3’,‘4’}中随机选定的
字符。Else步骤4b为初级代码指定单个(非环)字符。
设new_character_1为一个从{‘1’,‘2’,‘3’,‘4’}中随机选定的
字符。
为取代基指定字符。
设new_character_2为一个从{c1,c2,c3,…,cn}中随机选定的字符
使用频率v1,v2,v3,…vn
为取代基价数指定字符。
设new_character_3为一个从{‘1’,‘2’,‘3’,‘4’}中随机选定的
字符。步骤4c将新字符连接成代码串
Prime_code=Prime_code&new_character_1
Second_code=Second_code&new_character_2
Third_code=Third_code&new_character_3模块11:多点变异步骤1输入初级代码。步骤2设定每个代码的变异数(=q)(目前的程序对基因型的2.5-5%的字符进行变
异)。步骤3输入群大小(=p)。步骤4在基因型中随机选择一个位置。步骤5在每个代码向量上用不同的随机选择的字符替代选择位置上的代码字
符。步骤6重复q次步骤4和5。步骤7重复步骤4-6以产生总共p个新代码。步骤8检测变异群每个成员的适应性。选择具有最高适应性的子群以便重组或
其它多重变异中使用。模块12:序列变异步骤1将PDEL,PINV,PINS,和PDUP设为发生变异的阈值水平(0≤Px≤1)。步骤2在代码中(0≤P≤代码长度)产生一个随机位置(=x)。步骤3产生随机序列长度(=L)(0≤L≤代码长度-x)。步骤4复制起始于位置x并延伸总共L个字符的代码序列。步骤5如果0≤PINV≤随机数≤1则颠倒串中字符的顺序。步骤6如果0≤PDUP≤随机数≤1则复制字符序列并将其连接新序列。步骤7如果0≤PDEL≤随机数≤1则消除代码中始于位置x的L个字符。
Else
用步骤5和6产生的序列替代代码中的序列。步骤8如果0≤PINS≤随机数≤1则在代码中随机产生一个位置(=y)(0≤y≤代
码长度)
在位置y插入步骤5和6产生的序列。模块13:重组步骤1设定群大小(=p)。步骤2从多重变异产生的群中随机选择两个代码。步骤3在基因型中随机选择一个位置。步骤4随机产生用于交换的字符数。步骤5在从选择的位置开始的三个代码向量之间交换字符。步骤6重复2-5直到产生P个新的基因型。步骤7在所产生的变异群体中检测每个配体的适应性。为下一代重组序列或成
熟过程选择具有最高适应性的子群。模块14:成熟步骤1输入重组得到的母体代码。步骤2设定迭代次数。步骤3在母体基因型中随机选择一个位置。步骤4在每一个代码向量中,用一个随机选择的不同字符替代所选位置上的代
码字符。步骤5用模块4和5检测母体代码(FP)和变异产物(FM)的适应性。步骤6如果FM≥FP,用变异产物替代母体基因型。步骤7根据所要求的迭代次数重复步骤3-6。

Claims (51)

1.一种基于计算机的用于设计具有预定功能特性的化学结构的方法,包括如下步骤:
(a)产生一个由线性字符序列编码的模拟受体基因型物理模型,提供一组具有共有的至少一种可量化的功能特性的目标分子;
(b)对每个目标分子;
  (ⅰ)对大量取向中的每一种取向采用一种有效的亲和性计算方
    法计算受体和目标分子之间的亲和性;
  (ⅱ)对计算得到的亲和性进行加和,计算出加和亲和性;
  (ⅲ)确定一个最大亲和性;
(c)应用计算得到的加和亲和性和最大亲和性
  (ⅰ)计算最大亲和性与可量化的功能特性之间的最大亲和性相
    关系数;
  (ⅱ)计算加和亲和性与可量化的功能特性之间的加和亲和性相
    关系数;
(d)利用最大相关系数和加和相关系数计算适应性系数;
(e)改变受体结构并重复步骤(b)至(d)直到得到一群具有预先选定的适应性系数的受体;
(f)提供一个由分子线性字符序列编码的化学结构的物理模型,运用所述的有效亲和性计算方法计算化学结构与大量取向中每一个受体之间的亲和性,应用计算所得的亲和性计算亲和性适应性值;
(g)改变化学结构以便产生不同的化学结构,重复步骤(f);以及
(h)保持并进一步改变亲和性值接近预选亲和性值的化学结构的变量。
2.如权利要求1的方法,其中产生模拟受体基因型的步骤包括产生受体线性字符序列,该序列为空间占据和电荷的编码,其中产生化学结构的物理模型的步骤包括产生所述的分子线性字符序列,该序列编码空间占据和电荷。
3.如权利要求2的方法,其中所述的有效亲和性计算包括两种测量,第一种是一种近似测量,其中,所述模拟受体上不带电荷部分所占比例进行估计,这些不带电荷部分与所述分子结构上的非极性区域足够接近以产生有效London色散力,第二种测量是产生于所述模拟受体的带电荷部分与存在于所述分子结构中的偶极之间的电荷-偶极静电力相互作用的累加强度。
∑{|计算出的最大亲和性-目标最大亲和性|/目标最大亲和性},其中所述预选适应性值大体上为0。
5.如权利要求2的方法,其中所述计算亲和性适应性值的步骤包括计算分子结构和每个受体之间的加和亲和性及最大亲和性,适应性值计算如下:
∑{|计算出的最大亲和性-目标最大亲和性|/2×目标最大亲和性)+(|计算的加和亲和性-目标加和亲和性|/2×目标加和亲和性)},其中所述预选适应性值大体上为0。
6.如权利要求2的方法,其中所述加和亲和性相关系数是rSA 2,所述最大亲和性相关系数是rMA 2,其中所述适应性相关系数是F=(rMA 2×rSA 2)0.5,其中所述预选适应性系数大体上为1。
7.如权利要求2的方法,其中所述加和亲和性相关系数是rSA- MA 2,所述最大亲和性相关系数是rMA 2,其中所述适应性相关系数是F=(rMA 2×(1-rSA 2))0.5,其中所述预选适应性系数大体上为1。
8.如权利要求2的方法,其中所述分子线性字符序列包括大量的序列字符三合体,所述三合体的第一个字符随机选自第一个字符组并表示所述分子结构的分子骨架中占据原子的位置和性质,所述三合体的第二个字符随机选自第二个字符组并表示与所述占据原子相连接的取代基的性质,所述三合体的第三个字符随机选自第三个字符组并表示所述的取代基定位在所述三合体第一个字符所指定的原子上。
9.如权利要求8的方法,其中分子线性字符序列用一种有效分子组合算法来解码,该算法顺序翻译所述分子线性序列中的每个三合体并用氢原子填充在所述的分子骨架的未被填充的位置。
10.如权利要求9的方法,其中对所述分子结构进行变异的步骤包括至少以下一个步骤:ⅰ)通过随机交换来自相关字符组的至少一个三合体中的所述第一、第二和第三字符中的至少一个字符对所述分子基因型进行变异,ⅱ)删除,其中来自分子基因型的一个三合体被删除,ⅲ)复制,其中分子基因型中的一个三合体被复制,ⅳ)倒置,其中分子基因型中的一个或多个三合体的序列顺序被倒置,ⅴ)插入,其中来自分子基因型的一个三合体被插入到分子基因型的不同位置。
11.如权利要求10的方法,其中变异所述分子基因型的步骤包括重组随机选自的所述保留的变异分子基因型组,并由此对所述分子线性序列中的相关字符进行交换。
12.如权利要求2的方法,其中受体线性字符序列中的每一个字符表示了一个空间转动指令或一个不作转动的带电荷位置。
13.如权利要求12的方法,其中所述受体基因型包括至少一个有大量子单元的线性聚合物,所述的子单元中的一个是在所述的至少一个线性聚合物中是第一个子单元。
14.如权利要求13的方法,其中所述受体线性字符序列由一种有效的受体组合算法来进行解码,其中应用在所述第一个子单元之后的每一个子单元的转动指令,在执行时均相对于所述第一子单元的初始位置。
15.如权利要求14的方法,其中所述表示空间转动指令的字符规定不转动、向右转、向左转、向上转、向下转,其中表示电荷位置的字符规定了不转动的带正电荷的位置以及不转动的带负电荷的位置。
16.如权利要求14的方法,其中所述子单元大体上为球形,其范德华半径大体上等于氢原子的范德华半径。
17.如权利要求15的方法,其中对所述受体基因型进行变异的步骤包括至少如下一种步骤:ⅰ)删除,其中来自受体基因型的一个字符被删除,ⅱ)复制,其中受体基因型中的一个字符被复制,ⅲ)倒置,其中受体基因型中的一个或多个字符的序列顺序被倒置,ⅳ)插入,其中来自受体基因型的一个字符被插入到基因型的不同位置。
18.如权利要求17的方法,其中变异所述受体基因型的步骤包括重组随机选择的所述保留的变异受体基因型对,并由此对所述受体线性序列中的相关字符进行交换。
19.一种以预选功能特性为标准筛选化学结构的方法,包括:
a)通过产生一个对空间占据和电荷编码的受体线性字符序列产生一个模拟受体基因型;
b)对基因型解码以产生一个受体表型,提供至少一种具有选定功能特性的目标分子,对每个目标分子,对大量取向中的每一分目标分子采用一种有效的亲和性计算方法计算受体和目标分子之间的亲和性,计算每一个目标分子和受体之间的加和亲和性及最大亲和性,计算加和亲和性对所述目标分子功能特性的加和亲和性相关系数,计算最大亲和性对所述功能特性的最大亲和性相关系数,基于所述加和亲和性及最大亲和性相关系数计算适应性系数;
c)变异受体基因型并重复步骤b),保留并变异呈现提高适应性系数的受体直到得到一群具有预选适应性系数的受体;然后
d)利用所述有效的亲和性计算方法计算被筛选的化学结构和大量取向中的每一个受体之间的亲和性,计算亲和性适应性值,其中包括计算在化合物与每一个受体之间的加和亲和性及最大亲和性,将所述加和亲和性及最大亲和性的至少一种与所述的至少一种目标与所述的受体群之间的加和亲和性及最大亲和性进行比较,由此,所述的比较表示所述化学结构相对于所述至少一种目标分子的功能活性水平。
20.如权利要求19的方法,其中所述有效亲和性计算方法包括两种测量,第一种是一种近似测量,对所述模拟受体上不带电荷部分所占比例进行估计,这些不带电荷部分与所述分子结构上的非极性区域足够接近并产生有效London色散力,第二种测量是产生于所述模拟受体的带电荷部分与存在于所述分子结构中的偶极之间的电荷-偶极静电力相互作用的累加强度。
21.如权利要求20的方法,其中适应性值计算如下∑{|计算最大亲和性-目标最大亲和性|/目标最大亲和性}。
22.如权利要求20的方法,其中适应性值计算如下:
∑{|计算最大亲和性-目标最大亲和性|/2×目标最大亲和性)+(|计算加和亲和性-目标加和亲和性|/2×目标加和亲和性)}。
23.如权利要求20的方法,其中所述加和亲和性相关系数是rSA 2,所述最大亲和性相关系数是rMA 2,其中所述适应性系数是F=(rMA 2×rSA 2)0.5,其中所述预选适应性系数大体上为1。
24.如权利要求20的方法,其中所述加和亲和性相关系数是rSA 2,所述最大亲和性相关系数是rMA 2,其中所述适应性相关系数是F=(rMA 2×(1-rSA-MA 2))0.5,其中所述预选适应性系数大体上为1。
25.如权利要求20的方法,其中受体线性字符序列中的每一个字符表示一个空间转动指令和一个不作转动的带电荷位置中的一个。
26.如权利要求25的方法,其中所述受体表型包括至少一个有大量子单元的线性聚合物,所述的子单元中的一个在所述的至少一个线性聚合物中是第一个子单元。
27.如权利要求26的方法,其中所述受体线性字符序列由一种有效的受体组合算法来进行解码,其中应用在所述第一个子单元之后的每一个子单元的转动指令,在执行时均相对于所述第一子单元的初始位置。
28.如权利要求27的方法,其中所述表示空间转动指令代码的字符规定了不转动、向右转、向左转、向上转、向下转,其中表示电荷位置代码的字符规定了不转动的带正电荷的位置以及不转动的带负电荷的位置。
29.如权利要求28的方法,其中所述子单元大体上为球形,其范德华半径大体上等于氢原子的范德华半径。
30.如权利要求27的方法,其中对所述受体基因型进行变异的步骤包括至少如下一种步骤:ⅰ)删除,其中来自受体基因型的一个字符被删除,ⅱ)复制,其中受体基因型中的一个字符被复制,ⅲ)倒置,其中受体基因型中的一个或多个字符的序列顺序被倒置,ⅳ)插入,其中来自受体基因型的一个字符被插入到基因型的不同位置。
31.如权利要求30的方法,其中变异所述受体基因型的步骤包括重组随机选择的所述保留的变异受体基因型对,并由此对所述受体线性序列中的相关字符进行交换。
32.一种设计模拟受体方法,该受体模拟了与对具有相似功能特性的化合物呈现选择亲和性的生物受体,包括如下步骤:
a)通过产生一个对空间占据和电荷进行编码的受体线性字符序列产生一个模拟受体基因型;
b)对基因型解码以产生一个受体表型,提供一组具有共有的相似功能特性的目标分子,对每个目标分子,采用一种有效的亲和性计算方法计算受体和大量取向中的每一目标分子之间的亲和性,计算每一个目标分子和受体之间的加和亲和性及最大亲和性,计算加和亲和性对每一个目标分子功能特性的加和亲和性相关系数,计算最大亲和性对所述每个目标分子功能特性的最大亲和性相关系数,基于所述加和亲和性及最大亲和性相关系数计算每个目标分子的适应性系数;以及
c)变异受体基因型并重复步骤b),保留并变异呈现适应性系数提高的受体直到得到一群具有预选适应性系数的受体。
33.如权利要求32的方法,其中受体线性字符序列中的每一个字符表示一个空间转动指令和一个不作转动的带电荷位置中的一个。
34.如权利要求33的方法,其中所述受体表型包括大量的由大量子单元提供的线性聚合物,每一个线性聚合物由相应线性字符序列编码,所述子单元中的一个是在至少一个所述的线性聚合物中是第一个子单元。
35.如权利要求34的方法,其中所述受体线性字符序列由一种有效的受体组合算法来进行解码,其中应用在所述第一个子单元之后的每一个子单元序列的转动指令,在执行时均相对于所述第一子单元的初始位置。
36.如权利要求35的方法,其中所述表示空间转动指令代码的字符规定了不转动、向右转、向左转、向上转、向下转,其中表示电荷位置代码的字符规定了不转动的带正电荷的位置以及不转动的带负电荷的位置。
37.如权利要求36的方法,其中所述子单元大体上为球形,其范德华半径大体上等于氢原子的范德华半径。
38.如权利要求35的方法,其中对所述受体基因型进行变异的步骤包括至少如下一种步骤:ⅰ)删除,其中来自受体基因型的一个字符被删除,ⅱ)复制,其中受体基因型中的一个字符被复制,ⅲ)倒置,其中受体基因型中的一个或多个字符的序列顺序被倒置,ⅳ)插入,其中来自受体基因型的一个字符被插入到基因型的不同位置。
40.如权利要求39的方法,其中变异所述受体基因型的步骤包括重组随机选择的所述保留的变异受体基因型对,并由此对所述受体线性序列中的相关字符进行交换。
41.如权利要求33的方法,其中所述的有效亲和性计算包括两种测量,第一种是一种近似测量,对所述模拟受体上不带电荷部分所占比例进行估计,这些不带电荷部分与所述分子结构上的非极性区域足够接近以产生有效London色散力,第二种测量是产生于所述模拟受体的带电荷部分与存在于所述分子结构中的偶极之间的电荷一偶极静电力相互作用的累加强度。
42.如权利要求41的方法,其中所述加和亲和性相关系数是rSA 2,所述最大亲和性相关系数是rMA 2,其中所述适应性系数是F=(rMA 2×rSA 2)0.5,其中所述预选适应性系数大体上为1。
43.如权利要求41的方法,其中所述加和亲和性相关系数是rSA -MA 2,所述最大亲和性相关系数是rMA 2,其中所述适应性相关系数是F=(rMA 2×(1-rSA-MA 2))0.5,其中所述预选适应性系数大体上为1。
44.一种用于设计具有预定功能特性的化学结构的基于计算机的方法,包括如下步骤:
(a)产生一个受体和一组目标分子的物理模型,这些目标分子具有至少一种可量化的功能特性;
(b)对每个目标分子;
  (ⅰ)对大量取向中的每一种取向采用一种有效的亲和性计算方
    法计算受体和目标分子之间的亲和性;
  (ⅱ)对计算得到的亲和性进行加和,计算出加和亲和性;
  (ⅲ)确定一个最大亲和性;
(c)应用计算得到的加和亲和性和最大亲和性
  (ⅰ)计算最大亲和性与可量化的功能特性之间的最大亲和性相
    关系数;
  (ⅱ)计算加和亲和性与可量化的功能特性之间的加和亲和性相
    关系数;
(d)利用最大相关系数和加和相关系数计算适应性系数;
(e)改变受体结构并重复步骤(b)至(d)直到得到一群具有预先选定的适应性系数的受体;
(f)提供一个化学结构的物理模型,运用所述的有效亲和性计算方法计算化学结构与大量取向中每一个受体之间的亲和性,应用计算所得的亲和性计算亲和性适应性值;
(g)改变化学结构以便产生不同的化学结构,重复步骤(f);以及
(h)保持并进一步改变亲和性值接近预选亲和性值的化学结构的变量。
45.如权利要求44的方法,其中提供受体物理模型的步骤包括产生受体线性字符序列,该序列确定了空间占据和电荷代码,其中产生化学结构的物理模型的步骤包括产生线性字符序列,该序列确定了空间占据和电荷代码。
46.如权利要求45的方法,其中所述化学结构线性字符序列包括大量的序列字符三合体,所述三合体的第一个字符随机选自第一个字符组并表示所述化学结构的分子骨架中占据原子的位置和性质,所述三合体的第二个字符随机选自第二个字符组并表示与所述占据原子相连接的取代基的性质,所述三合体的第三个字符随机选自第三个字符组并表示所述的取代基定位在三合体所述第一个字符所指定的原子上。
47.如权利要求46的方法,其中化学结构线性字符序列用一种有效分子组合算法来解码,该算法顺序翻译所述分子线性序列中的每个字符三合体并将氢原子填充在所述的分子骨架的未填充位置。
48.一种对包括元素的化学结构进行编码的方法,该方法包括提供一个对所述化学结构中每一个原子的空间占据和电荷进行编码的线性字符序列。
49.如权利要求48的方法,其中所述化学鲒构的线性字符序列包括大量的序列字符三合体,所述三合体的第一个字符随机选自第一个字符组并表示所述化学结构的分子骨架中占据原子的位置和性质,所述三合体的第二个字符随机选自第二个字符组并表示与所述占据原子相连接的取代基的性质,所述三合体的第三个字符随机选自第三个字符组并表示所述的取代基定位在三合体所述第一个字符所指定的原子上。
50.如权利要求46的方法,其中线性字符序列用一种有效分子组合算法来解码,该算法顺序翻译所述分子线性序列中的每个字符三合体并将预选原子填充在所述分子骨架上未填充的位置。
51.如权利要求50的方法,包括用一种计算机存储方法存储所述线性字符序列的步骤。
52.如权利要求19的方法,其中所述功能特性是生物毒性。
53.如权利要求19的方法,其中所述功能特性是催化活性。
CN96180229A 1996-03-22 1996-03-22 设计具有常见功能特性的化学结构的计算方法 Pending CN1215486A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN96180229A CN1215486A (zh) 1996-03-22 1996-03-22 设计具有常见功能特性的化学结构的计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN96180229A CN1215486A (zh) 1996-03-22 1996-03-22 设计具有常见功能特性的化学结构的计算方法

Publications (1)

Publication Number Publication Date
CN1215486A true CN1215486A (zh) 1999-04-28

Family

ID=5127766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN96180229A Pending CN1215486A (zh) 1996-03-22 1996-03-22 设计具有常见功能特性的化学结构的计算方法

Country Status (1)

Country Link
CN (1) CN1215486A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100565544C (zh) * 2003-10-31 2009-12-02 切夫里昂奥罗尼特有限责任公司 把大量建模用于化学组合物的产品开发过程的方法和系统
CN105593861A (zh) * 2013-10-23 2016-05-18 陶氏环球技术有限责任公司 用于设计分子的方法、系统和设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100565544C (zh) * 2003-10-31 2009-12-02 切夫里昂奥罗尼特有限责任公司 把大量建模用于化学组合物的产品开发过程的方法和系统
CN105593861A (zh) * 2013-10-23 2016-05-18 陶氏环球技术有限责任公司 用于设计分子的方法、系统和设备

Similar Documents

Publication Publication Date Title
CN1264110C (zh) 进行离散子结构分析的计算机系统的操作方法
CN1163837C (zh) 网络访问管理系统和方法
CN1215386C (zh) 根据量子软计算控制过程或处理数据的方法和硬件体系结构
CN1897556A (zh) 信息处理设备、信息处理方法和信息处理程序
CN1145902C (zh) 变形地图自动生成系统
CN1281064C (zh) 利用与像素块分类信息对应的映射系数的图像编码和解码
CN1668996A (zh) 解大型连续性或离散性最佳化问题的动态方法
CN1237502C (zh) 生成声音模型的方法、装置和生成声音模型的计算机程序
CN1624696A (zh) 信息处理设备、方法及其程序、信息处理系统及其方法
CN1357428A (zh) 加工计划方法和装置、及其加工数据作成方法和装置
CN1808414A (zh) 学习、识别和生成数据的方法和设备以及计算机程序
CN1637751A (zh) 多目的最优化装置、多目的最优化方法及多目的最优化程序
CN1449511A (zh) 多变量矩阵处理控制
CN1707506A (zh) 利用网络提供招募/求职信息及其关联信息的匹配系统
CN1749999A (zh) .net数据类型和实例的持久存储
CN1836041A (zh) 浏览突变
CN1592852A (zh) 应用产生自多重破坏表达文库的基因调控网络的生物发现
CN1839397A (zh) 用于处理诸如图像的具有现有拓扑的数据阵列的神经网络和网络应用
CN1309722A (zh) 定量分析基因表达的方法、系统及设备
CN1578265A (zh) 语义信息网络(sion)
CN1692358A (zh) 使用商业规则或用户角色而在环球网门户中选择小门户的方法和装置
CN1728152A (zh) 用于使用软计算优化器的机动车的智能强健控制系统
CN1328601A (zh) 预测蛋白质功能的方法和系统
CN1703699A (zh) 从门户服务器传递会话信息的方法和装置
CN1510593A (zh) 编排系统、编排程序和编排方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication