CN111279419A - 特征量计算方法、特征量计算程序及特征量计算装置、筛选方法、筛选程序及筛选装置、化合物创建方法、化合物创建程序及化合物创建装置 - Google Patents
特征量计算方法、特征量计算程序及特征量计算装置、筛选方法、筛选程序及筛选装置、化合物创建方法、化合物创建程序及化合物创建装置 Download PDFInfo
- Publication number
- CN111279419A CN111279419A CN201880067748.XA CN201880067748A CN111279419A CN 111279419 A CN111279419 A CN 111279419A CN 201880067748 A CN201880067748 A CN 201880067748A CN 111279419 A CN111279419 A CN 111279419A
- Authority
- CN
- China
- Prior art keywords
- compound
- compounds
- target
- feature amount
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/80—Data visualisation
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Pharmacology & Pharmacy (AREA)
- Medicinal Chemistry (AREA)
- Computing Systems (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供一种能够计算出准确表示对象结构体的化学性质的特征量的特征量计算方法、特征量计算程序、特征量计算装置、能够使用特征量来有效进行医药候选化合物的筛选的筛选方法、筛选程序、筛选装置及能够使用特征量来有效创建医药候选化合物的立体结构的化合物创建方法、化合物创建程序、化合物创建装置。对象结构体的化学性质被表示为对象结构体与其周围的探针之间的相互作用的结果,因此在对象结构体彼此之间探针的聚集程度(特征量)相似是表示这些对象结构体的化学性质相似的情况。因此,通过本发明的一方式所涉及的特征量计算方法,能够计算出准确表示对象结构体的化学性质的特征量。
Description
技术领域
本发明涉及一种进行特征量的计算、化合物的筛选及化合物的立体结构的创建的方法、程序及装置,尤其涉及一种搜索医药候选化合物的技术。
背景技术
以往,使用了计算机的药物研发中,通过准备收集数万到十万左右的现有的化合物而成的库且提供化合物的结构式来调查相对于1个目标蛋白质的键合力,搜索医药候选化合物(以下,称为“命中(hit)”)。例如,下述专利文献1中,提供化合物的结构式来预测键合力。并且,在专利文献2中,也记载有反复进行结构式的生成和键合力的预测来逐渐搜索具有所期望的键合力的化合物(反复试验)。
并且,在专利文献3中,记载有使用被称为“化合物指纹(指纹识别)”的描述符来进行搜索。“描述符”是指由化合物的结构式获得的信息,“化合物指纹”表示各种官能团的有无等信息。这种描述符的特征在于“若化合物的描述符相似,则化合物的骨架相似”。
以往技术文献
专利文献
专利文献1:美国专利第9373059号公报
专利文献2:日本专利第5946045号公报
专利文献3:日本专利第4564097号公报
发明内容
发明要解决的技术课题
近年来,需求高的目标蛋白质变得较复杂且高难度,仅通过库的筛选难以发现命中。另一方面,化合物的理论上的数量即使限制在分子量500以下的低分子也有(10的60次方)个,当扩大至分子量1,000左右的中分子时,其数量进一步增加,若考虑有史以来所合成的化合物为(10的9次方)个左右,则仍然有可能发现命中。但是,针对这种天文数字量的化合物整体调查键合力,不仅在实验中,即使在模拟中也几乎无法进行。即使在针对一部分的化合物调查键合力的情况下,如上述专利文献1,2那样反复进行反复试验时效率也低。并且,在如专利文献3中所记载的指纹(Fingerprint)那样的现有的描述符(特征量)的情况下,即使为显示出相同药效的化合物,其特征量也并不一定相似,特征量未准确表示对象结构体的化学性质,因此使用了特征量的搜索的效率低。
如此,现有的技术中,特征量未准确表示对象结构体的化学性质,因此使用了特征量的筛选及立体结构创建的效率低。
本发明是鉴于这种情况而完成的,其目的在于,提供一种能够计算出准确表示对象结构体的化学性质的特征量的特征量计算方法、特征量计算程序及特征量计算装置。并且,本发明的目的在于,提供一种能够使用特征量来有效进行医药候选化合物的筛选的筛选方法、筛选程序及筛选装置。并且,本发明的目的在于,提供一种能够使用特征量来有效创建医药候选化合物的立体结构的化合物创建方法、化合物创建程序及化合物创建装置。
用于解决技术课题的手段
为了达到上述目的,本发明的第1方式所涉及的特征量计算方法具有:对象结构体指定工序,指定具有化学性质的由多个单元结构体构成的对象结构体;立体结构生成工序,针对对象结构体生成基于多个单元结构体的立体结构;及特征量计算工序,计算出在三维空间中对立体结构的周围的1种类以上的探针的聚集程度进行定量化而获得的特征量,探针为分开配置具有实数电荷且产生范德华力的多个点的结构体。
对象结构体的化学性质被表示为对象结构体与其周围的1种类以上的探针之间的相互作用的结果,因此在对象结构体彼此之间探针的聚集程度相似是表示这些对象结构体的化学性质相似的情况。即,通过第1方式计算出的特征量相似的对象结构体显示出相似的化学性质。因此,通过第1方式,能够计算出准确表示对象结构体的化学性质的特征量。另外,在第1方式及以下的各方式中,探针可以为“具有实数电荷且产生范德华力的多个点隔开规定距离而配置的结构体”。
关于第2方式所涉及的特征量计算方法,在第1方式中,在对象结构体指定工序中指定化合物作为对象结构体,在立体结构生成工序中生成基于多个原子的化合物的立体结构,在特征量计算工序中,计算出在三维空间中对立体结构生成工序中所生成的化合物的立体结构的周围的、作为探针的氨基酸的聚集程度进行定量化而获得的特征量即第1特征量。第2方式中,将第1方式中的“探针”设为氨基酸,将第1方式中的“对象结构体”设为化合物,将第1方式中的“多个单元结构体”设为多个原子。另外,对聚集程度进行定量化的氨基酸并不限于1种类,可以为键合有2种类以上的氨基酸的肽。
与第1方式相同地,从局部来看,化合物的药效(对于目标蛋白质的键合力)被表示为化合物与各氨基酸之间的相互作用的结果,因此只要在化合物之间氨基酸的聚集程度为相似,则表示这些化合物与蛋白质的键合力相似。即,第2方式所涉及的特征量相似的化合物显示出相似的药效。因此,能够通过第2方式计算出准确表示化合物的化学性质的特征量。另外,第2方式中,能够将生物配体等已知对于立体结构及目标蛋白质的键合的化合物指定为对象结构体。
关于第3方式所涉及的特征量计算方法,在第2方式中,还具有不变量化工序,使第1特征量针对化合物的旋转及平移不变量化来计算出第1不变量化特征量。第3方式中,使第1特征量针对化合物的旋转及平移不变量化,因此容易处理特征量并且能够减小数据容量。关于第1特征量的不变量化,能够通过傅里叶变换、相关函数的角度积分等来进行。
关于第4方式所涉及的特征量计算方法,在第3方式中,在特征量计算工序中,针对2种类不同的氨基酸计算出第1特征量,并在不变量化工序中,使用针对2种类不同的氨基酸的第1特征量来计算出第1不变量化特征量。根据第4方式,能够在第1不变量化特征量的计算中,通过使用针对2种类不同的氨基酸的第1特征量来在维持氨基酸的相互作用的信息的同时进行不变量化,因此能够正确进行基于特征量(第1不变量化特征量)的化合物的比较(药效判定)。
关于第5方式所涉及的特征量计算方法,在第1方式中,在对象结构体指定工序中,作为对象结构体指定与目标蛋白质的活性部位即口袋(pocket)键合的口袋结构体,且在立体结构生成工序中生成基于多个虚拟球体的口袋结构体的立体结构,并在特征量计算工序中,计算出在三维空间中对立体结构生成工序中所生成的口袋结构体的立体结构的周围的、作为探针的氨基酸的聚集程度进行定量化而获得的特征量即第2特征量。第5方式中,将第1方式中的“探针”设为氨基酸,将第1方式中的“对象结构体”设为口袋结构体,将第1方式中的“单元结构体”设为多个虚拟球体。目标蛋白质的“活性部位”是指通过口袋结构体的键合而目标蛋白质的活性被促进或者抑制的部位,能够认为“虚拟球体”具有范德华半径、电荷等化学性质。
上述第2方式中,计算出对于所提供的化合物的氨基酸的聚集程度,相对于此,第5方式中,计算出对于与所提供的目标蛋白质的口袋键合的口袋结构体的氨基酸的聚集程度。与第2方式的上述内容相同地,第4方式所涉及的特征量相似的口袋结构体显示出相似的化学性质,因此能够通过第5方式计算出准确表示口袋结构体的化学性质的特征量。另外,口袋结构体对应于与目标蛋白质的口袋键合的化合物。并且,在第5方式中,能够将基于目标蛋白质的立体结构的实际测量结果、口袋的位置信息等的模拟用于第2特征量的计算中。另外,关于目标蛋白质的立体结构,只要为能够识别氨基酸的各残基的解像力的立体结构,则不限定测定技术(X射线晶体结构、NMR结构(NMR:Nuclear Magnetic Resonance:核磁共振)、低温TEM结构(TEM:Transmission Elec tron Microscopy:透射电子显微镜)等)。
关于第6方式所涉及的特征量计算方法,在第5方式中,还具有不变量化工序,使第2特征量针对口袋结构体的旋转及平移不变量化来计算出第2不变量化特征量。根据第6方式,与第3方式相同地,容易处理特征量并且能够减小数据容量。关于第2特征量的不变量化,与第3方式相同地,能够通过傅里叶变换、相关函数的角度积分等来进行。
关于第7方式所涉及的特征量计算方法,在第6方式中,在特征量计算工序中,针对2种类不同的氨基酸计算出第2特征量,并在不变量化工序中,使用针对2种类不同的氨基酸的第2特征量来计算出第2不变量化特征量。根据第7方式,能够在第2不变量化特征量的计算中,通过使用针对2种类不同的氨基酸的第2特征量来在维持氨基酸的相互作用的信息的同时进行不变量化,因此能够正确进行基于特征量(第2不变量化特征量)的化合物的比较(药效判定)。
关于第8方式所涉及的特征量计算方法,在第1方式中,在对象结构体指定工序中指定化合物作为对象结构体,且在立体结构生成工序中生成基于多个原子的化合物的立体结构,并在特征量计算工序中,计算出在三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第3特征量,所述聚集程度为在立体结构生成工序中所生成的化合物的立体结构的周围的探针的聚集程度,且为将1种类以上的核酸碱基、1种类以上的脂质分子、1种类以上的单糖分子、水及1种类以上的离子中的1个以上作为探针的聚集程度。第8方式中,将第1方式中的“探针”设为1种类以上的核酸碱基等(可以为任意种类、数量、组合),将第1方式中的“对象结构体”设为化合物,将第1方式中的“多个单元结构体”设为多个原子。
本发明中,作为医药的目标,能够使用除了蛋白质以外的生物高分子(化合物)的DNA(Deoxyribonucleic Acid:脱氧核糖核酸)、RNA(Ribonucleic Acid:核糖核酸)、细胞膜及多糖。第8方式规定针对这些目标化合物的特征量的计算方法,并将探针设成另一物质(各目标的组成部分)而不是氨基酸。具体而言,在目标为DNA、RNA、细胞膜及多糖的情况下,将探针分别设为1种类以上的核酸碱基、1种类以上的核酸碱基、1种类以上的脂质分子及1种类以上的单糖分子。并且,在将这些作为探针而对其聚集程度进行定量化时,可以考虑水、1种类以上的离子。与第2,第5方式相同地,从局部来看,化合物的药效(对于DNA等目标的键合力)被表示为化合物与核酸碱基等(探针)之间的相互作用的结果,因此只要在化合物之间核酸碱基等的聚集程度为相似,则表示这些化合物与目标的键合力相似。即,第8方式所涉及的特征量相似的化合物显示出相似的药效。因此,能够通过第8方式计算出准确表示化合物的化学性质的特征量。
关于第9方式所涉及的特征量计算方法,在第8方式中,还具有不变量化工序,使第3特征量针对化合物的旋转及平移不变量化来计算出第3不变量化特征量。根据第9方式,与第3,第6方式相同地,容易处理特征量并且能够减小数据容量。关于第3特征量的不变量化,与第3,第6方式相同地,能够通过傅里叶变换、相关函数的角度积分等来进行。
关于第10方式所涉及的特征量计算方法,在第9方式中,在特征量计算工序中,针对由1种类以上的核酸碱基、1种类以上的脂质分子、1种类以上的单糖分子、水及1种类以上的离子中的1个以上构成的第1探针和由1种类以上的核酸碱基、1种类以上的脂质分子、1种类以上的单糖分子、水及1种类以上的离子中的1个以上构成且与第1探针不同的第2探针计算出第3特征量,并在不变量化工序中,使用针对第1探针的第3特征量和针对第2探针的第3特征量来计算出第3不变量化特征量。根据第10方式,能够在第3不变量化特征量的计算中,通过使用针对2种类不同的探针(第1,第2探针)的第3特征量来在维持探针的相互作用的信息的同时进行不变量化,因此能够正确进行基于特征量(第3不变量化特征量)的化合物的比较(药效判定)。另外,在第10方式中,只要第1,第2探针的构成要件(1种类以上的核酸碱基等)的种类、数量、组合中的至少1个不同,则相当于“第2探针与第1探针不同”。
关于第11方式所涉及的特征量计算方法,在第1方式中,在对象结构体指定工序中指定化合物作为对象结构体,且在立体结构生成工序中生成基于多个原子的化合物的立体结构,并在特征量计算工序中,计算出在三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第4特征量,所述聚集程度为在立体结构生成工序中所生成的化合物的立体结构的周围的探针的聚集程度,且为将1种类以上的氨基酸即第1探针和1种类以上的核酸碱基、1种类以上的脂质分子、1种类以上的单糖分子、水及1种类以上的离子中的1个以上即第2探针作为探针的聚集程度。第11方式中,将第1方式中的“探针”设为1种类以上的氨基酸(第1探针)和1种类以上的核酸碱基等(第2探针;可以为任意种类、数量、组合)),将第1方式中的“对象结构体”设为化合物,将第1方式中的“多个单元结构体”设为多个原子。
与第2,第5,第8方式相同地,从局部来看,化合物的药效(对于蛋白质、DNA等目标的键合力)被表示为化合物与氨基酸、核酸碱基等之间的相互作用的结果,因此只要在化合物之间氨基酸、核酸碱基等的聚集程度为相似,则表示这些化合物与目标的键合力相似。即,第11方式所涉及的特征量相似的化合物显示出相似的药效。因此,通过将蛋白质及DNA等的组成部分设为探针,即使在将复合结构体设为目标的情况下,也能够计算出准确表示对象结构体的化学性质的特征量。
关于第12方式所涉及的特征量计算方法,在第11方式中,还具有不变量化工序,使第4特征量针对化合物的旋转及平移不变量化来计算出第4不变量化特征量。根据第12方式,与第3,第6,第9方式相同地,容易处理特征量并且能够减小数据容量。关于第4特征量的不变量化,与第3,第6,第9方式相同地,能够通过傅里叶变换、相关函数的角度积分等来进行。
关于第13方式所涉及的特征量计算方法,在第12方式中,在特征量计算工序中,针对第1探针和第2探针中的至少一个不同的2种类的探针计算出第4特征量,并在不变量化工序中,使用针对2种类的探针的第4特征量来计算出第4不变量化特征量。根据第13方式,能够在第4不变量化特征量的计算中,通过使用针对2种类的探针的第4特征量来在维持探针的相互作用的信息的同时进行不变量化,因此能够正确进行基于特征量(第4不变量化特征量)的化合物的比较(药效判定)。
另外,在第13方式中,“第1探针和第2探针中的至少一个不同的2种类的探针”包括如下情况,即,在为由第1探针和第2探针构成的探针且第1探针和第2探针的组合不同的2种类的探针中,如一个探针由赖氨酸(氨基酸的1种;第1探针的一例)及核酸碱基(第2探针的一例)构成而另一个探针由赖氨酸(第1探针的一例)及脂质分子(第2探针的另一例)构成的这种“第1探针为相同而第2探针为不同”的情况、如一个探针由赖氨酸(第1探针的一例)及核酸碱基(第2探针的一例)构成而另一个探针由精氨酸(氨基酸的1种;第1探针的另一例)及核酸碱基(第2探针的一例)构成的这种“第1探针为不同而第2探针为相同”的情况、如一个探针由赖氨酸(第1探针的一例)及核酸碱基(第2探针的一例)构成而另一个探针由精氨酸(第1探针的另一例)及脂质分子(第2探针的另一例)构成的这种“第1,第2探针的双方均不同”的情况。其中,只要探针的构成要件的种类、数量、组合中的至少1个不同,则相当于“一探针与另一探针不同”。
关于第14方式所涉及的特征量计算方法,在第1方式中,在对象结构体指定工序中作为对象结构体指定化合物,且在立体结构生成工序中生成基于多个原子的化合物的立体结构,并在特征量计算工序中,计算出在三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第5特征量,所述聚集程度为在立体结构生成工序中所生成的化合物的立体结构的周围的探针的聚集程度,且为将电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置第1点电荷和第2点电荷的偶极子及零电荷的第5点电荷中的1个以上(可以为任意种类、数量、组合)作为探针的聚集程度。第14方式规定针对虚拟(virtual)的探针的特征量计算方法,与第2,第5,第8,第11方式相同地,第14方式所涉及的特征量相似的化合物显示出相似的药效。因此,即使在使用虚拟的探针的情况下,也能够计算出准确表示对象结构体的化学性质的特征量。
关于第15方式所涉及的特征量计算方法,在第14方式中,还具有不变量化工序,使第5特征量针对化合物的旋转及平移不变量化来计算出第5不变量化特征量。根据第15方式,与第3,第6,第9,第12方式相同地,容易处理特征量并且能够减小数据容量。关于第5特征量的不变量化,与第3,第6,第9,第12方式相同地,能够通过傅里叶变换、相关函数的角度积分等来进行。
关于第16的方式所涉及的特征量计算方法,在第15方式中,在特征量计算工序中,针对由第1点电荷、第2点电荷、第3点电荷、第4点电荷、偶极子及第5点电荷中的1个以上(可以为任意种类、数量、组合)构成的第1探针和由第1点电荷、第2点电荷、第3点电荷、第4点电荷、偶极子及第5点电荷中的1个以上(可以为任意种类、数量、组合)构成且与第1探针不同的第2探针计算出第5特征量,并在不变量化工序中,使用针对第1探针的第5特征量和针对第2探针的第5特征量来计算出第5不变量化特征量。根据第16方式,能够在第5不变量化特征量的计算中,通过使用针对2种类不同的探针(第1,第2探针)的第5特征量来在维持探针的相互作用的信息的同时进行不变量化,因此能够正确进行基于特征量(第5不变量化特征量)的化合物的比较(药效判定)。另外,在第16方式中,只要第1,第2探针的构成要件(第1点电荷等)的种类、数量、组合中的至少1个不同,则相当于“第2探针与第1探针不同”。
关于第17方式所涉及的特征量计算方法,在第1方式中,在对象结构体指定工序中作为对象结构体指定化合物,且在立体结构生成工序中生成基于多个原子的化合物的立体结构,并在特征量计算工序中,计算出在三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第6特征量,所述聚集程度为在立体结构生成工序中所生成的化合物的立体结构的周围的探针的聚集程度,且为将1种类以上的氨基酸即第1探针和电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置第1点电荷和第2点电荷的偶极子及零电荷的第5点电荷中的1个以上(可以为任意种类、数量、组合)即第2探针作为探针的聚集程度。第17方式规定在将第1探针(1种类以上的氨基酸)和第2探针(点电荷等及其组合)作为探针的情况下的特征量计算方法,与第2,第5,第8,第11,第14方式相同地,第17方式所涉及的特征量相似的化合物显示出相似的药效。因此,即使在使用第1探针及第2探针的情况下,也能够计算出准确表示对象结构体的化学性质的特征量。
关于第18方式所涉及的特征量计算方法,在第17方式中,还具有不变量化工序,使第6特征针对化合物的旋转及平移不变量化来计算出第6不变量化特征量。根据第18方式,与第3,第6,第9,第12,第15方式相同地,容易处理特征量并且能够减小数据容量。关于第6特征量的不变量化,与第3,第6,第9,第12,第15方式相同地,能够通过傅里叶变换、相关函数的角度积分等来进行。
关于第19方式所涉及的特征量计算方法,在第18方式中,在特征量计算工序中,针对第1探针和第2探针中的至少一个不同的2种类的探针计算出第6特征量,并在不变量化工序中,使用针对2种类的探针的第6特征量来计算出第6不变量化特征量。根据第19方式,能够在第6不变量化特征量的计算中,通过使用针对2种类不同的探针的第6特征量来在维持探针的相互作用的信息的同时进行不变量化,因此能够正确进行基于特征量(第6不变量化特征量)的化合物的比较(药效判定)。另外,在第19方式中,“第1探针和第2探针中的至少一个不同的2种类的探针”包括如下情况,即,在为由第1探针和第2探针构成的探针且第1探针和第2探针的组合不同的2种类的探针中,如一个探针由赖氨酸(氨基酸的1种;第1探针的一例)及第1点电荷(第2探针的一例)构成而另一个探针由赖氨酸(第1探针的一例)及第2点电荷(第2探针的另一例)构成的这种“第1探针为相同而第2探针为不同”的情况、如一个探针由赖氨酸(第1探针的一例)及第1点电荷(第2探针的一例)构成而另一个探针由精氨酸(氨基酸的1种;第1探针的另一例)及第1点电荷(第2探针的一例)构成的这种“第1探针为不同而第2探针为相同”的情况、如一个探针由赖氨酸(第1探针的一例)及第1点电荷(第2探针的一例)构成而另一个探针由精氨酸(氨基酸的1种;第1探针的另一例)及第2点电荷(第2探针的另一例)构成的这种“第1,第2探针的双方均不同”的情况。其中,只要探针的构成要件的种类、数量、组合中的至少1个不同,则相当于“一探针与另一探针不同”。
关于第20方式所涉及的特征量计算方法,在第1方式中,在对象结构体指定工序中作为对象结构体指定化合物,且在立体结构生成工序中生成基于多个原子的化合物的立体结构,并在特征量计算工序中,计算出在三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第7特征量,所述聚集程度为在立体结构生成工序中所生成的化合物的立体结构的周围的探针的聚集程度,且为将1种类以上的核酸碱基、1种类以上的脂质分子、水、1种类以上的单糖分子及1种类以上的离子中的1个以上(可以为任意种类、数量、组合)即第1探针和电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置第1点电荷和第2点电荷的偶极子及零电荷的第5点电荷中的1个以上(可以为任意种类、数量、组合)即第2探针作为探针的聚集程度。第20方式规定在将第1探针(1种类以上的核酸碱基等及其组合)和第2探针(点电荷等及其组合)作为探针的情况下的特征量计算方法,与第2,第5,第8,第11,第14,第17方式相同地,第20方式所涉及的特征量相似的化合物显示出相似的药效。因此,即使在使用第1探针及第2探针的情况下,也能够计算出准确表示对象结构体的化学性质的特征量。
关于第21方式所涉及的特征量计算方法,在第20方式中,还具有不变量化工序,使第7特征量针对化合物的旋转及平移不变量化来计算出第7不变量化特征量。根据第21方式,与第3,第6,第9,第12,第15,第18方式相同地,容易处理特征量并且能够减小数据容量。关于第7特征量的不变量化,与第3,第6,第9,第12,第15,第18方式相同地,能够通过傅里叶变换、相关函数的角度积分等来进行。
关于第22方式所涉及的特征量计算方法,在第21方式中,在特征量计算工序中,针对第1探针和第2探针中的至少一个不同的2种类的探针计算出第7特征量,并在不变量化工序中,使用针对2种类的探针的第7特征量来计算出第7不变量化特征量。根据第22方式,能够在第7不变量化特征量的计算中,通过使用针对2种类不同的探针的第7特征量来在维持探针的相互作用的信息的同时进行不变量化,因此能够正确进行基于特征量(第7不变量化特征量)的化合物的比较(药效判定)。另外,在第22方式中,“第1探针和第2探针中的至少一个不同的2种类的探针”包括如下情况,即,在为由第1探针和第2探针构成的探针且第1探针和第2探针的组合不同的2种类的探针中,如一个探针由核酸碱基(氨基酸的1种;第1探针的一例)及第1点电荷(第2探针的一例)构成而另一个探针由核酸碱基(第1探针的一例)及第2点电荷(第2探针的另一例)构成的这种“第1探针为相同而第2探针为不同”的情况、如一个探针由核酸碱基(第1探针的一例)及第1点电荷(第2探针的一例)构成而另一个探针由脂质分子(第1探针的另一例)及第1点电荷(第2探针的一例)构成的这种“第1探针为不同而第2探针为相同”的情况、如一个探针由核酸碱基(第1探针的一例)及第1点电荷(第2探针的一例)构成而另一个探针由脂质分子(第1探针的另一例)及第2点电荷(第2探针的另一例)构成的这种“第1,第2探针的双方均不同”的情况。其中,只要探针的构成要件的种类、数量、组合中的至少1个不同,则相当于“一探针与另一探针不同”。
关于第23方式所涉及的特征量计算方法,在第1方式中,在对象结构体指定工序中作为对象结构体指定化合物,且在立体结构生成工序中生成基于多个原子的化合物的立体结构,并在特征量计算工序中,计算出在三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第8特征量,所述聚集程度为在立体结构生成工序中所生成的化合物的立体结构的周围的探针的聚集程度,且为将1种类以上的氨基酸即第1探针和1种类以上的核酸碱基、1种类以上的脂质分子、水、1种类以上的单糖分子及1种类以上的离子中的1个以上(可以为任意种类、数量、组合)即第2探针和电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置第1点电荷和第2点电荷的偶极子及零电荷的第5点电荷中的1个以上(可以为任意种类、数量、组合)即第3探针作为探针的聚集程度。第23方式规定在将第1探针(1种类以上的氨基酸)、第2探针(1种类以上的核酸碱基等及其组合)、第3探针(点电荷等及其组合)及第3探针作为探针的情况下的特征量计算方法,与第2,第5,第8,第11,第14,第17,第20方式相同地,第23方式所涉及的特征量相似的化合物显示出相似的药效。因此,即使在使用第1探针至第3探针的情况下,也能够计算出准确表示对象结构体的化学性质的特征量。
关于第24方式所涉及的特征量计算方法,在第23方式中,还具有不变量化工序,使第8特征量针对化合物的旋转及平移不变量化来计算出第8不变量化特征量。根据第24方式,与第3,第6,第9,第12,第15,第18,第21方式相同地,容易处理特征量并且能够减小数据容量。关于第8特征量的不变量化,与第3,第6,第9,第12,第15,第18,第21方式相同地,能够通过傅里叶变换、相关函数的角度积分等来进行。
关于第25方式所涉及的特征量计算方法,在第24方式中,在特征量计算工序中,针对第1探针、第2探针及第3探针中的至少1个不同的2种类的探针计算出第8特征量,并在不变量化工序中,使用针对2种类的探针的第8特征量来计算出第8不变量化特征量。根据第25方式,能够在第8不变量化特征量的计算中,通过使用针对2种类不同的探针的第8特征量来在维持探针的相互作用的信息的同时进行不变量化,因此能够正确进行基于特征量(第8不变量化特征量)的化合物的比较(药效判定)。另外,在第25方式中,“第1探针、第2探针及第3探针中的至少1个不同的2种类的探针”包括如下情况,即,在为由第1,第2及第3探针构成的探针且第1,第2及第3探针的组合不同的2种类的探针中,在一个探针与另一个探针之间“第1,第2及第3探针中的1个不同”的情况、“第1,第2及第3探针中的2个不同的”的情况、“第1,第2及第3探针均不同”的情况。其中,只要探针的构成要件的种类、数量、组合中的至少1个不同,则相当于“一探针与另一探针不同”。
为了达到上述目的,本发明的第26方式所涉及的特征量计算程序使计算机执行第1至第25方式中的任一个所涉及的特征量计算方法。关于第26方式中的“计算机”,能够使用1个以上的CPU(Central Processing Unit:中央处理单元)等各种处理器来实现。另外,也能够举出记录有第26方式所涉及的特征量计算程序的计算机能够读取的代码的非临时性记录介质来作为本发明的方式。
为了达到上述目的,本发明的第27方式所涉及的特征量计算装置具备:对象结构体指定部,指定具有化学性质的由多个单元结构体构成的对象结构体;立体结构生成部,针对对象结构体生成基于多个单元结构体的立体结构;及特征量计算部,计算出在三维空间中对立体结构的周围的1种类以上的探针的聚集程度进行定量化而获得的特征量,探针为分开配置具有实数电荷且产生范德华力的多个点的结构体。根据第27方式,与第1方式相同地,能够计算出准确表示对象结构体的化学性质的特征量。第27方式中,如第1至第26方式的上述内容,能够将目标化合物作为蛋白质、DNA等且将探针作为氨基酸、核酸碱基等虚拟电荷等来计算出第1~第5特征量。另外,在27方式中,探针可以为“具有实数电荷且产生范德华力的多个点隔开规定距离而配置的结构体”。
为了达到上述目的,本发明的第28方式所涉及的筛选方法从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第2方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第1特征量建立关联并进行存储;特征量计算工序,针对作为确认到与目标蛋白质的键合的化合物的配体计算出第1特征量;相似度计算工序,计算出针对多个化合物的第1特征量与针对配体的第1特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取目标化合物。如第2方式的上述内容,若配体和对象化合物的第1特征量(以三维的方式定量化而获得的特征量)相似,则两者的药效相似。因此,根据第28方式,根据第1特征量提取与配体的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第29方式所涉及的筛选方法从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与针对化合物的立体结构的第1不变量化特征量建立关联并进行存储;特征量计算工序,使用第3方式所涉及的特征量计算方法针对作为确认到与目标蛋白质的键合的化合物的配体计算出第1不变量化特征量;相似度计算工序,计算出针对多个化合物的第1不变量化特征量与针对配体的第1不变量化特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取目标化合物。在计算出针对配体的特征量的方面,第29方式与第28方式共通,在第29方式中,根据第1不变量化特征量的相似度提取与配体的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
关于第30方式所涉及的筛选方法,在第28或第29方式中,在化合物提取工序中提取相似度为阈值以上的化合物。第30方式规定基于相似度的目标化合物的提取的具体的基准,能够通过提取相似度为阈值以上的化合物来有效进行医药候选化合物的筛选。关于阈值,能够根据筛选的目的、精度等条件来进行设定,也可以根据由用户指定的值来进行设定。
关于第31方式所涉及的筛选方法,在第28至第30方式中的任一个中,在化合物提取工序中以相似度高到低的顺序提取化合物。第31方式规定基于相似度的目标化合物的提取的具体的基准,能够通过以相似度高到低的顺序提取化合物来有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第32方式所涉及的筛选方法从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第2方式所涉及的特征量计算方法计算出的第1特征量建立关联并进行存储;特征量计算工序,使用第5方式所涉及的特征量计算方法计算出针对目标蛋白质的口袋结构体的第2特征量;相似度计算工序,计算出针对多个化合物的第1特征量与针对口袋结构体的第2特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取目标化合物。如第5方式的上述内容,若口袋结构体和对象化合物的第2特征量相似,则两者的化学性质相似。因此,根据第32方式,提取与口袋结构体的化学性质相似的目标化合物而能够有效进行医药候选化合物的筛选。另外,口袋结构体对应于与目标蛋白质键合的化合物,因此能够将针对口袋结构体的特征量(第2特征量)和针对化合物的特征量(第1特征量)进行对比并能够计算出相似度。
为了达到上述目的,本发明的第33方式所涉及的筛选方法从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选方法具备:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第3方式所涉及的特征量计算方法计算出的第1不变量化特征量建立关联并进行存储;特征量计算工序,使用第6方式所涉及的特征量计算方法计算出针对目标蛋白质的口袋结构体的第2不变量化特征量;相似度计算工序,计算出针对多个化合物的第1不变量化特征量与针对口袋结构体的第2不变量化特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取目标化合物。第33方式中,使用第1,第2不变量化特征量来提取与口袋结构体的化学性质相似的目标化合物而能够有效进行医药候选化合物的筛选。另外,与第32方式的上述内容相同地,能够将针对口袋结构体的特征量(第2不变量化特征量)和针对化合物的特征量(第1不变量化特征量)进行对比并能够计算出相似度。
关于第34方式所涉及的筛选方法,在第32或第33方式中,在化合物提取工序中提取相似度为阈值以上的化合物。第34方式规定基于相似度的目标化合物的提取的具体的基准,能够通过提取相似度为阈值以上的化合物来有效进行医药候选化合物的筛选。关于阈值,能够根据筛选的目的、精度等条件来进行设定,也可以根据由用户指定的值来进行设定。
关于第35方式所涉及的筛选方法,在第32至第34方式中的任一个中,在化合物提取工序中以相似度高到低的顺序提取化合物。第35方式规定基于相似度的目标化合物的提取的具体的基准,能够通过以相似度高到低的顺序提取化合物来有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第36方式所涉及的筛选方法从多个化合物提取与除了蛋白质以外的目标生物高分子键合的目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第8方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第3特征量建立关联并进行存储;特征量计算工序,针对作为确认到与除了蛋白质以外的目标生物高分子键合的化合物的键合化合物计算出第3特征量;相似度计算工序,计算出针对多个化合物的第3特征量与针对键合化合物的第3特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取目标化合物。如第8方式的上述内容,本发明能够使用作为除了蛋白质以外的目标生物高分子的DNA等,若与目标生物高分子键合的键合化合物和对象化合物的第3特征量相似,则两者的药效相似。因此,根据第36方式,根据第3特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第37方式所涉及的筛选方法从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第11方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第4特征量建立关联并进行存储;特征量计算工序,针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第4特征量;相似度计算工序,计算出针对多个化合物的第4特征量与针对键合化合物的第4特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取目标化合物。如第11方式的上述内容,第4特征量相似的化合物显示出相似的药效。因此,根据第37方式,即使在将复合结构体设为目标的情况下,也根据第4特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第38方式所涉及的筛选方法从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第14方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第5特征量建立关联并进行存储;特征量计算工序,针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第5特征量;相似度计算工序,计算出针对多个化合物的第5特征量与针对键合化合物的第5特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取目标化合物。如第14方式的上述内容,第5特征量相似的化合物显示出相似的药效。因此,根据第38方式,即使在使用虚拟的探针的情况下,也根据第5特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第39方式所涉及的筛选方法从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第17方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第6特征量建立关联并进行存储;特征量计算工序,针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第6特征量;相似度计算工序,计算出针对多个化合物的第6特征量与针对键合化合物的第6特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取目标化合物。如第17方式的上述内容,第6特征量相似的化合物显示出相似的药效。因此,根据第39方式,即使在使用1种类以上的氨基酸(第1探针)和虚拟的电荷等(第2探针)的情况下,也根据第6特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第40方式所涉及的筛选方法从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第20方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第7特征量建立关联并进行存储;特征量计算工序,针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第7特征量;相似度计算工序,计算出针对多个化合物的第7特征量与针对键合化合物的第7特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取目标化合物。如第20方式的上述内容,第7特征量相似的化合物显示出相似的药效。因此,根据第40方式,即使在使用1种类以上的核酸碱基等(第1探针)和虚拟的电荷等(第2探针)的情况下,也根据第7特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第41方式所涉及的筛选方法从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第23方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第8特征量建立关联并进行存储;特征量计算工序,针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第8特征量;相似度计算工序,计算出针对多个化合物的第8特征量与针对键合化合物的第8特征量的相似度;及化合物提取工序,根据相似度从多个化合物提取目标化合物。如第23方式的上述内容,第8特征量相似的化合物显示出相似的药效。因此,根据第41方式,即使在使用1种类以上的氨基酸(第1探针)、1种类以上的核酸碱基等(第2探针)及虚拟的电荷等(第3探针)的情况下,也根据第8特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第42方式所涉及的筛选程序使计算机执行第28至第41方式中的任一个所涉及的筛选方法。关于第42方式中的“计算机”,能够使用1个以上的CPU(Central Processing Unit)等各种处理器来实现。另外,也能够举出记录有第42方式所涉及的筛选程序的计算机能够读取的代码的非临时性记录介质来作为本发明的方式。
为了达到上述目的,本发明的第43方式所涉及的筛选装置从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第2方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第1特征量建立关联并进行存储;特征量计算部,针对作为确认到与目标蛋白质的键合的化合物的配体计算出第1特征量;相似度计算部,计算出针对多个化合物的第1特征量与针对配体的第1特征量的相似度;及化合物提取部,根据相似度从多个化合物提取目标化合物。
如第2方式的上述内容,若配体和对象化合物的第1特征量(以三维的方式定量化而获得的特征量)相似,则两者的药效相似。因此,根据第43方式,基于第1特征量提取与配体的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第44方式所涉及的筛选装置从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与针对化合物的立体结构的第1不变量化特征量建立关联并进行存储;特征量计算部,使用第3方式所涉及的特征量计算方法针对作为确认到与目标蛋白质的键合的化合物的配体计算出第1不变量化特征量;相似度计算部,计算出针对多个化合物的第1不变量化特征量与针对配体的第1不变量化特征量的相似度;及化合物提取部,根据相似度从多个化合物提取目标化合物。
在计算出针对配体的特征量的方面,第44方式与第43方式共通,在第44方式中,根据第1不变量化特征量的相似度提取与配体的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
关于第45方式所涉及的筛选装置,在第43或第44方式中,化合物提取部提取相似度为阈值以上的化合物。第45方式规定基于相似度的目标化合物的提取的具体的基准,能够通过提取相似度为阈值以上的化合物来有效进行医药候选化合物的筛选。关于阈值,能够根据筛选的目的、精度等条件来进行设定,也可以根据由用户指定的值来进行设定。
关于第46方式所涉及的筛选装置,在第43至第45方式中的任一个中,化合物提取部以相似度高到低的顺序提取化合物。第46方式规定基于相似度的目标化合物的提取的具体的基准,能够通过以相似度高到低的顺序提取化合物来有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第47方式所涉及的筛选装置从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第2方式所涉及的特征量计算方法计算出的第1特征量建立关联并进行存储;特征量计算部,使用第5方式所涉及的特征量计算方法计算出针对目标蛋白质的口袋结构体的第2特征量;相似度计算部,计算出针对多个化合物的第1特征量与针对口袋结构体的第2特征量的相似度;及化合物提取部,根据相似度从多个化合物提取目标化合物。
如第5方式的上述内容,若口袋结构体和对象化合物的第2特征量相似,则两者的化学性质相似。因此,根据第47方式,提取与口袋结构体的化学性质相似的目标化合物而能够有效进行医药候选化合物的筛选。另外,口袋结构体对应于与目标蛋白质键合的化合物,因此能够将针对口袋结构体的特征量(第2特征量)和针对化合物的特征量(第1特征量)进行对比并能够计算出相似度。
为了达到上述目的,本发明的第48方式所涉及的筛选装置从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第3方式所涉及的特征量计算方法计算出的第1不变量化特征量建立关联并进行存储;特征量计算部,使用第6方式所涉及的特征量计算方法计算出针对目标蛋白质的口袋结构体的第2不变量化特征量;相似度计算部,计算出针对多个化合物的第1不变量化特征量与针对口袋结构体的第2不变量化特征量的相似度;及化合物提取部,根据相似度从多个化合物提取目标化合物。
第48方式中,使用第1,第2不变量化特征量来提取与口袋结构体的化学性质相似的目标化合物而能够有效进行医药候选化合物的筛选。另外,与第47方式的上述内容相同地,能够将针对口袋结构体的特征量(第2不变量化特征量)和针对化合物的特征量(第1不变量化特征量)进行对比并能够计算出相似度。
关于第49方式所涉及的筛选装置,在第47或第48方式中,化合物提取部提取相似度为阈值以上的化合物。第49方式规定基于相似度的目标化合物的提取的具体的基准,能够通过提取相似度为阈值以上的化合物来有效进行医药候选化合物的筛选。关于阈值,能够根据筛选的目的、精度等条件来进行设定,也可以根据由用户指定的值来进行设定。
关于第50方式所涉及的筛选装置,在第47至第49方式中的任一个中,化合物提取部以相似度高到低的顺序提取化合物。第50方式规定基于相似度的目标化合物的提取的具体的基准,能够通过以相似度高到低的顺序提取化合物来有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第51方式所涉及的筛选装置从多个化合物提取与除了蛋白质以外的目标生物高分子键合的目标化合物,所述筛选装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第8方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第3特征量建立关联并进行存储;特征量计算部,针对作为确认到与除了蛋白质以外的目标生物高分子的键合的化合物的键合化合物计算出第3特征量;相似度计算部,计算出针对多个化合物的第3特征量与针对键合化合物的第3特征量的相似度;及化合物提取部,根据相似度从多个化合物提取目标化合物。
如第8方式的上述内容,若除了蛋白质以外的目标生物高分子和对象化合物的第3特征量相似,则两者的药效相似。因此,根据第51方式,基于第3特征量提取与除了蛋白质以外的目标生物高分子的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第52方式所涉及的筛选装置从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第11方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第4特征量建立关联并进行存储;特征量计算部,针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第4特征量;相似度计算部,计算出针对多个化合物的第4特征量与针对键合化合物的第4特征量的相似度;及化合物提取部,根据相似度从多个化合物提取目标化合物。
如第11方式的上述内容,第4特征量相似的化合物显示出相似的药效。因此,根据第52方式,即使在将复合结构体设为目标的情况下,也根据第4特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第53方式所涉及的筛选装置从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第14方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第5特征量建立关联并进行存储;特征量计算部,针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第5特征量;相似度计算部,计算出针对多个化合物的第5特征量与针对键合化合物的第5特征量的相似度;及化合物提取部,根据相似度从多个化合物提取目标化合物。
如第14方式的上述内容,第5特征量相似的化合物显示出相似的药效。因此,根据第53方式,即使在使用虚拟的探针的情况下,也根据第5特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第54方式所涉及的筛选装置从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第17方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第6特征量建立关联并进行存储;特征量计算部,针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第6特征量;相似度计算部,计算出针对多个化合物的第6特征量与针对键合化合物的第6特征量的相似度;及化合物提取部,根据相似度从多个化合物提取目标化合物。
如第17方式的上述内容,第6特征量相似的化合物显示出相似的药效。因此,根据第54方式,即使在使用1种类以上的氨基酸即第1探针和虚拟的点电荷等及其组合即第2探针的情况下,也根据第6特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第55方式所涉及的筛选装置从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第20方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第7特征量建立关联并进行存储;特征量计算部,针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第7特征量;相似度计算部,计算出针对多个化合物的第7特征量与针对键合化合物的第7特征量的相似度;及化合物提取部,根据相似度从多个化合物提取目标化合物。
如第20方式的上述内容,第7特征量相似的化合物显示出相似的药效。因此,根据第55方式,即使在使用第1探针(1种类以上的核酸碱基等及其组合)和虚拟的点电荷等即第2探针的情况下,也根据第7特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第56方式所涉及的筛选装置从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第23方式所涉及的特征量计算方法计算出的针对化合物的立体结构的第8特征量建立关联并进行存储;特征量计算部,针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第8特征量;相似度计算部,计算出针对多个化合物的第8特征量与针对键合化合物的第8特征量的相似度;及化合物提取部,根据相似度从多个化合物提取目标化合物。
如第23方式的上述内容,第8特征量相似的化合物显示出相似的药效。因此,根据第56方式,即使在使用第1探针(1种类以上的氨基酸)、虚拟的探针即第2探针(1种类以上的核酸碱基等及其组合)及第3探针(虚拟的点电荷等及其组合)的情况下,也根据第8特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。
为了达到上述目的,本发明的第57方式所涉及的化合物创建方法从多个化合物创建与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第1特征量建立关联并进行存储;特征量计算工序,使用第2方式所涉及的特征量计算方法针对作为确认到与目标蛋白质的键合的化合物的配体计算出第1特征量;生成器构建工序,通过将多个化合物的立体结构设为教师数据且将第1特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从配体的第1特征量生成目标化合物的立体结构。
上述第28至第41方式所涉及的筛选方法中,从结构式已确定的(已被写下)多个化合物中发现与配体或者目标蛋白质匹配的化合物。因此,采用在计算出化合物的特征量之后,根据另外计算出的与配体或者目标蛋白质的口袋结构体的特征量的相似度提取化合物的方法即检索的方法。因此,只要预先记录化合物的结构式与特征量的对应关系,则能够发现相似度高的(或者阈值以上的)结构式。相对于此,第57方式中,生成具有与配体的特征量(第1特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索。
关于在提供特征量的情况下的结构式的生成,能够使用通过机器学习构建的生成器来进行。具体而言,第57方式中,通过将化合物的立体结构设为教师数据且将第1特征量设为解释变量的机器学习(学习方法并无特别限定)构建生成器,并使用该生成器,从配体的第1特征量生成目标化合物的立体结构。第57方式中,由于不进行检索,因此即使在成为“基于筛选的检索的结果为无解”的情况下也能够生成化合物的立体结构,从而能够有效创建医药候选化合物的立体结构。
另外,在第57方式中所生成的立体结构受到作为教师数据所提供的化合物的特征的影响。因此,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。例如,通过提供容易合成的化合物作为教师数据,能够生成具有容易合成的立体结构的化合物。
为了达到上述目的,本发明的第58方式所涉及的化合物创建方法从多个化合物创建与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第3方式所涉及的特征量计算方法计算出的第1不变量化特征量建立关联并进行存储;特征量计算工序,针对作为确认到与目标蛋白质的键合的化合物的配体计算出第1不变量化特征量;生成器构建工序,通过将多个化合物的立体结构设为教师数据且将第1不变量化特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从配体的第1不变量化特征量生成目标化合物的立体结构。第58方式中,与第57方式相同地,生成具有与配体的特征量(第1不变量化特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第57方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第59方式所涉及的化合物创建方法从多个化合物创建与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第2方式所涉及的特征量计算方法计算出的第1特征量建立关联并进行存储;特征量计算工序,使用第5方式所涉及的特征量计算方法针对目标蛋白质的口袋结构体计算出第2特征量;生成器构建工序,通过将多个化合物的立体结构设为教师数据且将第1特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从口袋结构体的第2特征量生成目标化合物的立体结构。根据第59方式,与第57,第58方式相同地,生成具有与口袋结构体的特征量(第2特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第57,第58方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第60方式所涉及的化合物创建方法从多个化合物创建与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第3方式所涉及的特征量计算方法计算出的第1不变量化特征量建立关联并进行存储;特征量计算工序,使用第6方式所涉及的特征量计算方法针对目标蛋白质的口袋结构体计算出第2不变量化特征量;生成器构建工序,通过将多个化合物的立体结构设为教师数据且将第1不变量化特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从口袋结构体的第2不变量化特征量生成目标化合物的立体结构。根据第60方式,与第57至第59方式相同地,生成具有与口袋结构体的特征量(第2不变量化特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第57至第59方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第61方式所涉及的化合物创建方法从多个化合物创建与除了蛋白质以外的目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第3特征量建立关联并进行存储;特征量计算工序,使用第8方式所涉及的特征量计算方法针对作为确认到与除了蛋白质以外的目标生物高分子的键合的化合物的键合化合物计算出第3特征量;生成器构建工序,通过将多个化合物的立体结构设为教师数据且将第3特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从键合化合物的第3特征量生成目标化合物的立体结构。
根据第61方式,与第57至第60方式相同地,生成具有与键合化合物的特征量(第3特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第57至第60方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第62方式所涉及的化合物创建方法从多个化合物创建与目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第4特征量建立关联并进行存储;特征量计算工序,使用第11方式所涉及的特征量计算方法针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第4特征量;生成器构建工序,通过将多个化合物的立体结构设为教师数据且将第4特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从键合化合物的第4特征量生成目标化合物的立体结构。
根据第62方式,与第57至第61方式相同地,生成具有与键合化合物的特征量(第4特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第57至第61方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第63方式所涉及的化合物创建方法从多个化合物创建与目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第5特征量建立关联并进行存储;特征量计算工序,使用第14方式所涉及的特征量计算方法针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第5特征量;生成器构建工序,通过将多个化合物的立体结构设为教师数据且将第5特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从键合化合物的第5特征量生成目标化合物的立体结构。
根据第63方式,与第57至第62方式相同地,生成具有与键合化合物的特征量(第5特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第57至第62方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第64方式所涉及的化合物创建方法从多个化合物创建与目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第6特征量建立关联并进行存储;特征量计算工序,使用第17方式所涉及的特征量计算方法针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第6特征量;生成器构建工序,通过将多个化合物的立体结构设为教师数据且将第6特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从键合化合物的第6特征量生成目标化合物的立体结构。
根据第64方式,与第57至第63方式相同地,生成具有与键合化合物的特征量(第6特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第57至第63方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第65方式所涉及的化合物创建方法从多个化合物创建与目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第7特征量建立关联并进行存储;特征量计算工序,使用第20方式所涉及的特征量计算方法针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第7特征量;生成器构建工序,通过将多个化合物的立体结构设为教师数据且将第7特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从键合化合物的第7特征量生成目标化合物的立体结构。
根据第65方式,与第57至第64方式相同地,生成具有与键合化合物的特征量(第7特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第57至第64方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第66方式所涉及的化合物创建方法从多个化合物创建与目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第8特征量建立关联并进行存储;特征量计算工序,使用第23方式所涉及的特征量计算方法针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第8特征量;生成器构建工序,通过将多个化合物的立体结构设为教师数据且将第8特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成工序,使用生成器从键合化合物的第8特征量生成目标化合物的立体结构。
根据第66方式,与第57至第65方式相同地,生成具有与键合化合物的特征量(第8特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第57至第65方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第67方式所涉及的化合物创建程序使计算机执行第57至第66方式中的任一个所涉及的化合物创建方法。关于第67方式中的“计算机”,能够使用1个以上的CPU(Central Processing Unit)等各种处理器来实现。另外,也能够举出记录有第67方式所涉及的化合物创建程序中计算机能够读取的代码的非临时性记录介质来作为本发明的方式。
为了达到上述目的,本发明的第68方式所涉及的化合物创建装置从多个化合物创建与目标蛋白质键合的目标化合物的立体结构,所述化合物创建装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第1特征量建立关联并进行存储;特征量计算部,使用第2方式所涉及的特征量计算方法针对作为确认到与目标蛋白质的键合的化合物的配体计算出第1特征量;生成器构建部,通过将多个化合物的立体结构设为教师数据且将第1特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成部,使用生成器从配体的第1特征量生成目标化合物的立体结构。
上述第43至第56方式所涉及的筛选装置中,从结构式已确定的(已被写下)多个化合物中发现与配体或者目标蛋白质匹配的化合物。因此,采用在计算出化合物的特征量之后,根据另外计算出的与配体或者目标蛋白质的口袋结构体的特征量的相似度提取化合物的方法即检索的方法。因此,只要预先记录化合物的结构式与特征量的对应关系,则能够发现相似度高的(或者阈值以上的)结构式。相对于此,第68方式中,生成具有与配体的特征量(第1特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索。
关于在提供特征量的情况下的结构式的生成,能够使用通过机器学习构建的生成器来进行。具体而言,第68方式中,通过将化合物的立体结构设为教师数据且将第1特征量设为解释变量的机器学习(学习方法并无特别限定)构建生成器,并使用该生成器,从配体的第1特征量生成目标化合物的立体结构。第68方式中,由于不进行检索,因此即使在成为“基于筛选的检索的结果为无解”的情况下也能够生成化合物的立体结构,从而能够有效创建医药候选化合物的立体结构。
另外,在第68方式中所生成的立体结构受到作为教师数据所提供的化合物的特征的影响。因此,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。例如,通过提供容易合成的化合物作为教师数据,能够生成具有容易合成的立体结构的化合物。
为了达到上述目的,本发明的第69方式所涉及的化合物创建装置从多个化合物创建与目标蛋白质键合的目标化合物的立体结构,所述化合物创建装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用第3方式所涉及的特征量计算方法计算出的第1不变量化特征量建立关联并进行存储;特征量计算部,针对作为确认到与目标蛋白质的键合的化合物的配体计算出第1不变量化特征量;生成器构建部,通过将多个化合物的立体结构设为教师数据且将第1不变量化特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成部,使用生成器从配体的第1不变量化特征量生成目标化合物的立体结构。第69方式中,与第68方式相同地,生成具有与配体的特征量(第1不变量化特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第68方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第70方式所涉及的化合物创建装置从多个化合物创建与目标蛋白质键合的目标化合物的立体结构,所述化合物创建装置具备:存储部,针对多个化合物的每一个,将使用第2方式所涉及的特征量计算方法计算出的第1特征量建立关联并进行存储;特征量计算部,使用第5方式所涉及的特征量计算方法针对目标蛋白质的口袋结构体计算出第2特征量;生成器构建部,通过将多个化合物的立体结构设为教师数据且将第1特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成部,使用生成器从口袋结构体的第2特征量生成目标化合物的立体结构。根据第70方式,与第68,第69方式相同地,生成具有与口袋结构体的特征量(第2特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第68,第69方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第71方式所涉及的化合物创建装置从多个化合物创建与目标蛋白质键合的目标化合物的立体结构,所述化合物创建装置具备:存储部,针对多个化合物的每一个,将使用第3方式所涉及的特征量计算方法计算出的第1不变量化特征量建立关联并进行存储;特征量计算部,使用第6方式所涉及的特征量计算方法针对目标蛋白质的口袋结构体计算出第2不变量化特征量;生成器构建部,通过将多个化合物的立体结构设为教师数据且将第1不变量化特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成部,使用生成器从口袋结构体的第2不变量化特征量生成目标化合物的立体结构。根据第71方式,与第68至第70方式相同地,生成具有与口袋结构体的特征量(第2不变量化特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第68至第70方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第72方式所涉及的化合物创建装置从多个化合物创建与除了蛋白质以外的目标生物高分子键合的目标化合物的立体结构,所述化合物创建装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第3特征量建立关联并进行存储;特征量计算部,使用第8方式所涉及的特征量计算方法针对作为确认到与除了蛋白质以外的目标生物高分子的键合的化合物的键合化合物计算出第3特征量;生成器构建部,通过将多个化合物的立体结构设为教师数据且将第3特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成部,使用生成器从键合化合物的第3特征量生成目标化合物的立体结构。
根据第72方式,与第68至第71方式相同地,生成具有与键合化合物的特征量(第3特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第68至第71方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第73方式所涉及的化合物创建装置从多个化合物创建与目标生物高分子键合的目标化合物的立体结构,所述化合物创建装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第4特征量建立关联并进行存储;特征量计算部,使用第11方式所涉及的特征量计算方法针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第4特征量;生成器构建部,通过将多个化合物的立体结构设为教师数据且将第4特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成部,使用生成器从键合化合物的第4特征量生成目标化合物的立体结构。
根据第73方式,与第68至第72方式相同地,生成具有与键合化合物的特征量(第4特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第68至第72方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第74方式所涉及的化合物创建装置从多个化合物创建与目标生物高分子键合的目标化合物的立体结构,所述化合物创建装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第5特征量建立关联并进行存储;特征量计算部,使用第14方式所涉及的特征量计算方法针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第5特征量;生成器构建部,通过将多个化合物的立体结构设为教师数据且将第5特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成部,使用生成器从键合化合物的第5特征量生成目标化合物的立体结构。
根据第74方式,与第68至第73方式相同地,生成具有与键合化合物的特征量(第5特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第68至第73方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第75方式所涉及的化合物创建装置从多个化合物创建与目标生物高分子键合的目标化合物的立体结构,所述化合物创建装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第6特征量建立关联并进行存储;特征量计算部,使用第17方式所涉及的特征量计算方法针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第6特征量;生成器构建部,通过将多个化合物的立体结构设为教师数据且将第6特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成部,使用生成器从键合化合物的第6特征量生成目标化合物的立体结构。
根据第75方式,与第68至第74方式相同地,生成具有与键合化合物的特征量(第6特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第68至第74方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第76方式所涉及的化合物创建装置从多个化合物创建与目标生物高分子键合的目标化合物的立体结构,所述化合物创建装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第7特征量建立关联并进行存储;特征量计算部,使用第20方式所涉及的特征量计算方法针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第7特征量;生成器构建部,通过将多个化合物的立体结构设为教师数据且将第7特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成部,使用生成器从键合化合物的第7特征量生成目标化合物的立体结构。
根据第76方式,与第68至第75方式相同地,生成具有与键合化合物的特征量(第7特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第68至第75方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
为了达到上述目的,本发明的第77方式所涉及的化合物创建装置从多个化合物创建与目标生物高分子键合的目标化合物的立体结构,所述化合物创建装置具备:存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与第8特征量建立关联并进行存储;特征量计算部,使用第23方式所涉及的特征量计算方法针对作为确认到与目标生物高分子的键合的化合物的键合化合物计算出第8特征量;生成器构建部,通过将多个化合物的立体结构设为教师数据且将第8特征量设为解释变量的机器学习来构建生成器;及化合物立体结构生成部,使用生成器从键合化合物的第8特征量生成目标化合物的立体结构。
根据第77方式,与第68至第76方式相同地,生成具有与键合化合物的特征量(第8特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。另外,与第68至第76方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
发明效果
如上所述,根据本发明的特征量计算方法、特征量计算程序及特征量计算装置,能够计算出准确表示对象结构体的化学性质的特征量。并且,根据本发明的筛选方法、筛选程序及筛选装置,能够有效进行医药候选化合物的筛选。并且,根据本发明的化合物创建方法、化合物创建程序及化合物创建装置,能够有效创建医药候选化合物的立体结构。
附图说明
图1是表示第1实施方式所涉及的筛选装置的结构的框图。
图2是表示处理部的结构的框图。
图3是表示存储于存储部的信息的图。
图4是表示将化合物的结构信息与特征量建立关联而进行存储的状态的图。
图5是表示化合物的三维AAM特征量的计算步骤的流程图。
图6是表示结构式的三维化的例的图。
图7是表示三维AAM特征量的例的图。
图8是表示三维AAM特征量的例的表。
图9是表示针对口袋结构体的三维AAM描述符的步骤的流程图。
图10是表示针对口袋结构体的三维AAM描述符的状态的概念图。
图11是表示不变量化AAM描述符的例的图。
图12是表示不变量化AAM描述符相似的化合物的例的图。
图13是表示在使用了不变量化AAM描述符的情况下的命中的发现容易度的图。
图14是表示在使用了不变量化AAM描述符的情况下的命中的搜索时间的图。
图15是表示在使用了不变量化AAM描述符的情况下的命中的搜索时间的另一图。
图16是表示基于描述符的相似度的目标化合物的提取步骤的图。
图17是表示基于描述符的相似度的目标化合物的提取结果的例的表。
图18是表示基于描述符的相似度的目标化合物的提取步骤的另一图。
图19是表示基于描述符的相似度的目标化合物的提取结果的例的另一表。
图20是表示第2实施方式所涉及的化合物创建装置的结构的框图。
图21是表示处理部的结构的图。
图22是表示存储于存储部的信息的图。
图23是表示在输入配体的情况下的立体结构生成步骤的流程图。
图24是表示使用了机器学习的结果的立体结构生成的状态的图。
图25是表示中间层的数量与cos相似度的关系的图。
图26是表示立体结构的生成例的图。
图27是表示在输入目标蛋白质的情况下的立体结构生成步骤的图。
图28是表示第3实施方式所涉及的医药候选化合物搜索装置的结构的框图。
图29是表示处理部的结构的图。
图30是表示存储于存储部的信息的图。
图31是表示命中的发现容易度的比较结果的图。
具体实施方式
以下,参考附图并对本发明的特征量计算方法、筛选装置及化合物创建装置的实施方式进行详细说明。
<第1实施方式>
图1是表示第1实施方式所涉及的筛选装置10(特征量计算装置、筛选装置)的结构的框图。筛选装置10为进行针对化合物(对象结构体)和/或口袋结构体(对象结构体)的特征量的计算及目标化合物的提取(筛选)的装置,并能够使用计算机来实现。如图1所示,筛选装置10具备处理部100、存储部200、显示部300及操作部400,并且相互连接而收发所需信息。针对这些构成要件能够采用各种设置方式,各构成要件可以设置于1处(1框体内、1室内等),也可以设置于隔开的位置而经由网络连接。并且,筛选装置10经由互联网等网络NW与外部服务器500及PDB(Protein Data Bank:大型数据库)等外部数据库510连接,并能够根据需要获取化合物的结构式、蛋白质的晶体结构等信息。
<处理部的结构>
图2是表示处理部100的结构的图。处理部100具备信息输入部110、特征量计算部120、相似度计算部130、化合物提取部140、显示控制部150、CPU160(CPU:CentralProcessing Unit)、ROM170(ROM:Read Only Memory:只读存储器)及RAM180(RAM:RandomAccess Memory:随机存取存储器)。
信息输入部110经由未图示的DVD驱动器、半导体存储器用端子等记录介质接口和/或网络NW输入化合物的结构式、目标蛋白质的X晶体结构及口袋位置等信息。特征量计算部120(对象结构体指定部、立体结构生成部、特征量计算部)计算出本发明所涉及的特征量(第1特征量、第1不变量化特征量、第2特征量、第2不变量化特征量)。相似度计算部130(相似度计算部)计算出所计算的特征量彼此的相似度。化合物提取部140(化合物提取部)从多个化合物根据相似度提取目标化合物。显示控制部150控制所输入的信息及处理结果在显示器310上的显示。对使用了处理部100的这些功能的特征量计算及目标化合物的筛选的处理的详细内容将进行后述。另外,基于这些功能的处理在CPU160的控制下进行。
上述处理部100的各部的功能能够使用各种处理器(processor)来实现。在各种处理器中,例如包含有CPU,所述CPU为执行软件(程序)来实现各种功能的通用的处理器。并且,在上述各种处理器中,还包含有作为专门用于图像处理的处理器的GPU(GraphicsProcessing Unit:图形处理单元)、作为FPGA(Field Programmable Gate Array:现场可编程门阵列)等在制造后能够变更电路结构的处理器的可编程逻辑设备(ProgrammableLogic Device:PLD)。而且,作为ASIC(Application Specific Integrated Circuit:专用集成电路)等具有为了执行特定的处理而专门设计的电路结构的处理器的专用电路等也包含于上述各种处理器中。
各部的功能可以通过1个处理器来实现,也可以由相同种类或者不同种类的多个处理器(例如,多个FPGA或者CPU和FPGA的组合或者CPU和GPU的组合)来实现。并且,可以由1个处理器实现多个功能。作为由1个处理器构成多个功能的例,第1有如下方式,即,如以客户端、服务器等计算机为代表,由1个以上的CPU和软件的组合构成1个处理器,并通过该处理器实现多个功能。第2有如下方式,即,如以片上系统(System On Chip:SoC)等为代表,使用由1个IC(Integrated Circuit:集成电路)芯片实现系统整体的功能的处理器。如此,使用1个以上的上述各种处理器来作为硬件结构来构成各种功能。而且,更具体而言,这些各种处理器的硬件结构为组合了半导体元件等电路元件的电路(circuitry)。
在上述处理器或者电路执行软件(程序)时,将欲执行的软件的处理器(计算机)能够读取的代码预先存储于ROM170(参考图2)等非临时性记录介质中,从而处理器参考该软件。预先存储于非临时性记录介质的软件包含用于执行本发明所涉及的特征量计算方法及目标化合物的提取处理的程序(特征量计算程序及筛选程序)。也可以在各种光磁记录装置、半导体存储器等的非临时性记录介质中记录代码而不是在ROM170中。在进行使用了软件的处理时,例如将RAM180用作临时存储区域,并且也能够参考例如存储于未图示的EEPROM(Electronically Erasable and Programmable Read Only Memory:电子可擦和可编程只读存储器)中的数据。
<存储部的结构>
存储部200由DVD(Digital Versatile Disk:数字通用光盘)、硬盘(Hard Disk)、各种半导体存储器等非临时性记录介质及其控制部构成,且存储有图3所示的图像及信息。结构信息210包含化合物的结构式、目标蛋白质的立体结构及口袋位置。立体结构信息220为从结构信息210生成的化合物和/或口袋结构体的立体结构的信息。三维AAM描述符230(第1特征量、第2特征量)为在三维空间中对化合物或者口袋结构体的立体结构的周围的1种类以上的氨基酸的聚集程度进行定量化而获得的特征量,并通过后述的特征量计算方法计算出。另外,“AAM”是指“氨基酸图谱(Amino Acid Mapping)”。不变量化AAM描述符240(第1不变量化特征量、第2不变量化特征量)为使三维AAM描述符230针对化合物或者口袋结构体的旋转及平移不变量化的特征量。相似度信息250为表示特征量彼此的相似度的信息,化合物提取结果260为表示根据相似度所提取的目标化合物的信息。
图4为表示使针对N个(N为2以上的整数)化合物的结构信息210、立体结构信息220、三维AAM描述符230及不变量化AAM描述符240建立关联而被存储于存储部200的状态的图。在图4中,例如能够将结构式设为结构信息210,并将被立体化的结构式(后述)设为立体结构信息220。并且,图4中,对于各化合物,针对20种类的氨基酸的每一个,将三维AAM描述符230(记载为“ga(r)”;a是表示氨基酸的种类的下标)与对应于其三维AAM描述符230的不变量化AAM描述符240(记载为“Fab(s)”;a,b是表示氨基酸的种类的下标)建立关联并进行存储。关于三维AAM描述符230及不变量化AAM描述符240,可以按照用于筛选的描述符的数量来针对一部分的氨基酸进行存储而不是针对20种类的氨基酸整体。
在存储部200中,可以存储多个如图4所示那样的信息的组(库)。另外,图4中示出了针对化合物的信息的存储状态,但是针对目标蛋白质也能够以相同的结构存储信息。并且,对使用了这种结构信息及立体结构信息的三维AAM描述符和/或不变量化AAM描述符的计算方法将进行后述。
<显示部及操作部的结构>
显示部300具备显示器310(表示装置),并能够显示所输入的图像、存储于存储部200的图像及信息、基于处理部100的处理的结果等。操作部400包括作为输入设备和/或定点设备的键盘410及鼠标420,用户能够经由这些设备及显示器310的画面进行本发明所涉及的特征量计算方法的执行及目标化合物的提取中所需的操作(后述)。用户能够执行的操作中例如包含有处理模式、欲计算的描述符的种类、用于筛选的描述符、对于相似度的阈值的指定等。
<筛选装置中的处理>
上述结构的筛选装置10中,能够按照用户经由操作部400进行的指示进行特征量(描述符)的计算和/或目标化合物的提取。以下,对各处理的详细内容进行说明。
<特征量的计算>
筛选装置10能够按照用户经由操作部400进行的指示计算出三维AAM描述符和/或不变量化AAM描述符。
<对于化合物的三维AAM描述符的计算>
图5是表示针对化合物(对象结构体)的三维AAM描述符的计算步骤的流程图。另外,配体为确认到与目标蛋白质的键合的化合物,能够以图5的步骤计算出三维AAM描述符。步骤S100中,信息输入部110按照用户的操作输入化合物的结构式。由此,由所输入的化学式表示的化合物被指定为对象结构体(对象结构体指定工序)。
特征量计算部120对所输入的结构式进行三维化,从而生成基于多个原子(具有化学性质的多个单元结构体)的化合物的立体结构(步骤S102:立体结构生成工序)。结构式的三维化已知有各种方法,步骤S102中所使用的方法并无特别限定。图6表示结构式的立体化的例,图6(a)部分表示所输入的结构式,图6(b)部分表示被三维化的结构式。
特征量计算部120计算出氨基酸“a”(a为表示氨基酸的种类的数字;1至20)的各原子“μ”所感受到的自由能的空间分布ΔGaμ(r)(步骤S104;特征量计算工序)。作为ΔGaμ(r)的计算方法能够采用分子动力学方法(MD:Molecular Dynamics),但是并不限定于此。计算出特征量的氨基酸可以为预定的种类,也可以按照用户的指示来确定(只要为1种类以上即可,也可以为多个种类)。
特征量计算部120根据ΔGaμ(r)计算出氨基酸“a”的各原子“μ”的分布函数gaμ(r)(步骤S106:特征量计算工序)。若将T设为室温且将KB设为玻尔兹曼常数,则gaμ(r)由以下式(1)表示。
[数式1]
gaμ(r)=exp(-ΔGaμ(r)/KBT)…(1)
特征量计算部120根据分布函数gaμ(r)计算出氨基酸的重心的分布函数ga(r)(步骤S108:特征量计算工序)。为了计算,将gaμ(r)对各原子“μ”进行几何平均。该分布函数ga(r)为在三维空间中对化合物的立体结构的周围的1种类以上的氨基酸“a”的聚集程度进行定量化而获得的三维AAM描述符(第1特征量)。特征量计算部120将所计算的三维AAM描述符作为三维AAM描述符230与化合物的结构信息(结构信息210)、立体结构信息(立体结构信息220)建立关联并存储于存储部200(参考图4)。
图7是针对图6所示的化合物的三维AAM描述符的例。图7(a)部分表示针对丙氨酸的三维AAM描述符,图7(b)部分表示针对缬氨酸的三维AAM描述符。在图7中,颜色深的区域为氨基酸的聚集程度(存在几率)高的区域。图8是表示针对图6所示的化合物的三维AAM描述符的另一例的表,且表示针对分别不同的方向1、方向2、方向3(分别为表的第1段、第2段、第3段)的三维AAM描述符。表的左栏表示三维AAM描述符(相对于阈值的等高面),右栏表示三维AAM描述符(相对于阈值的等高面)及化合物的立体结构。
<对于口袋结构体的三维AAM描述符的计算>
筛选装置10中,能够作为对象结构体指定与目标蛋白质键合的口袋结构体而不是化合物,并计算出对于该口袋结构体的特征量(三维AAM描述符;第2特征量)。口袋结构体为与目标蛋白质的活性部位即口袋键合的对象结构体,“活性部位”是指通过键合口袋结构体而促进或者抑制目标蛋白质的活性的部位。图9是表示对于口袋结构体的三维AAM描述符的计算步骤的流程图。并且,图10是表示对于口袋结构体的三维AAM描述符的状态的概念图。
图9的流程图中,信息输入部110输入目标蛋白质的立体结构的实际测量及口袋的位置信息(步骤S200:对象结构体指定工序)。图10中的图10(a)部分表示目标蛋白质TP中的口袋PO。通过步骤S200的处理,口袋结构体被指定为对象结构。
特征量计算部120在目标蛋白质的口袋上塞入多个虚拟球体(具有化学性质的多个单元结构体)(步骤S202:对象结构体指定工序、立体结构生成工序)。能够认为“虚拟球体”具有范德华半径、电荷等化学性质,“塞入虚拟球体”能够通过模拟(例如分子动力学方法)来进行。通过步骤S202,能够将所塞入的虚拟球体的集合(立体结构)作为口袋结构体(对象结构体)的立体结构而获得(步骤S204:立体结构生成工序)。图10中的图10(b)部分表示对于目标蛋白质TP的口袋结构体PS的例。
特征量计算部120使用目标蛋白质的立体结构的实际测量,以三维的方式对在口袋结构体的周围的1种类以上的氨基酸的聚集程度进行定量化(步骤S206:特征量计算工序)。实际上,能够读出在口袋结构体的周围聚集有哪一种类的氨基酸。图10中的图10(c)部分表示在口袋结构体PS的周围聚集有3种类的氨基酸A1,A2,A3的状态。另外,对聚集程度进行定量化的氨基酸只要为1种类以上即可(也可以为多个种类)。并且,可以针对所预定的种类的氨基酸进行定量化,也可以针对按照用户的操作所设定的氨基酸进行定量化。特征量计算部120将所计算的三维AAM描述符作为三维AAM描述符230与化合物的结构信息(结构信息210)、立体结构信息(立体结构信息220)建立关联并存储于存储部200(参考图3,图4;存储工序)。在已计算出后述的不变量化AAM描述符的情况下,特征量计算部120将三维AAM描述符与不变量化AAM描述符建立关联。
<三维AAM描述符的不变量化>
上述三维AAM描述符表示氨基酸的三维的聚集程度,但是即使化合物相同若进行重心移动、旋转等则值会改变,并且由于是三维信息,因此数据容量大。因此,第1实施方式所涉及的筛选装置10中,除了三维AAM描述符以外能够计算出“使三维AAM描述符对于化合物的旋转及平移不变量化的不变量化AAM描述符”或者代替三维AAM描述符能够计算出“使三维AAM描述符对于化合物的旋转及平移不变量化的不变量化AAM描述符”(第1不变量化特征量、第2不变量化特征量)。另外,不管是化合物的情况,还是口袋结构体的情况,均能够以相同步骤进行不变量化。在使用了针对化合物的三维AAM描述符(第1特征量)的情况下,可获得针对化合物的不变量化AAM描述符(第1不变量化特征量),在使用了针对口袋结构体的三维AAM描述符(第2特征量)的情况下,可获得针对口袋结构体的不变量化AAM描述符(第2不变量化特征量)。
特征量计算部120使用如以下式(2)所示的傅里叶变换计算出fa(k)(不变量化工序)。如上述,“a”是表示氨基酸的种类的下标(1~20)。并且,“i”是虚数单位。
[数式2]
fa(k)=∫d3r(ga(r)-1)eikr…(2)
特征量计算部120能够使用该fa(k)并通过以下式(3)计算出作为不变量化AAM描述符的Fab(s)(第1不变量化特征量、第2不变量化特征量)(不变量化工序)。式(3)中,使用针对2种类不同的氨基酸(由“a”,“b”表示)的三维AAM描述符(ga(r),gb(r)),通过相关函数的角度积分计算出不变量化AAM描述符。另外,用于计算20种类的氨基酸中的不变量化AAM描述符的2种类的氨基酸的组合并无特别限定。
[数式3]
Fab(s)=∫d3kfa(-k)fb(+k)δ(k2-s)…(3)
式(3)中,在进行不变量化时使用三角函数,但是如以下式(4)所示,能够使用任意函数(h(k2-s))进行不变量化。
[数式4]
Fab(s)=∫d3kfa(-k)fb(+k)h(k2-s)…(4)
将如此计算的不变量化AAM描述符的例示于图11中。图11中的图11(a)部分为作为不变量化AAM描述符的F12(s)(针对氨基酸1,氨基酸2的不变量化AAM描述符)的实部,图11(b)部分为虚部。如此,通过使用针对2种类不同的氨基酸的三维AAM描述符进行不变量化,能够在维持氨基酸的相互作用的信息的同时进行不变量化,并能够正确进行基于特征量(第1不变量化特征量,第2不变量化特征量)的化合物的比较(药效判定)。
特征量计算部120将所计算的不变量化AAM描述符作为不变量化AAM描述符240与化合物的结构信息(结构信息210)、立体结构信息(立体结构信息220)及原始的三维AAM描述符230建立关联并存储于存储部200(参考图3,图4;存储工序)。另外,第1实施方式中,使用针对2种类不同的氨基酸的三维AAM描述符计算出不变量化AAM描述符,因此也能够具有多个三维AAM描述符与不变量化AAM描述符的建立关联。
<不变量化AAM描述符的有效性评价>
对通过上述的处理计算出的不变量化AAM描述符的有效性进行说明。
<具有相似的不变量化AAM描述符的化合物的活性的例>
图12中的图12(a)部分表示对于蛋白质ABL1(目标蛋白质的一例)的配体的结构式。该配体的键合力为IC50(50%抑制浓度)且为1μM级别。相对于此,图12中的图12(b)部分为具有与配体几乎相同的不变量化AAM描述符的化合物的结构式。若实际测量该化合物的活性,则与配体的级别相同。即,图11为表示不变量化AAM描述符相似的化合物具有相似的药效的例。如此,根据第1实施方式,能够获得准确表示对象结构体的化学性质的特征量(不变量化AAM描述符)。
<命中的发现容易度>
通过以下步骤1~5,对基于不变量化AAM描述符的命中的发现容易度进行了评价。
(步骤1)对于某一蛋白质(目标蛋白质),将X个命中化合物和Y个不是命中的化合物进行混合。
(步骤2)针对(X+Y)个化合物整体计算出不变量化AAM描述符。
(步骤3)计算出每一个描述符的相似度。
(步骤4)根据不变量化AAM描述符的相似度对(X+Y)个化合物进行分组。
(步骤5)检查是否机械生成命中所聚集的组。
通过上述步骤对相对于蛋白质ABL1(激酶)包含183个命中的10,933个化合物(命中含有率1.6%)进行分组,其结果,被分成221组。某一组包含16个命中和14个其他化合物,命中含有率为53.3%。并且该组包含图12中的图12(a)部分所示的化合物及图12(b)部分所示的化合物,但是在使用了作为以往的描述符的指纹的情况下,这些化合物的相似度为25%,本来是命中,却被识别为另一物质。如此,可知在上述组中,在使用了本发明的第1实施方式所涉及的不变量化AAM描述符的情况下,即使在指纹方式中未能够聚在一起的命中也属于同一组。
将针对上述221组求出每一组的命中的发现容易度(=期待值;命中数量×命中含有率)的结果示于图13中。为了比较,示出随机进行分组的情况及使用指纹进行分组的情况的结果。根据该结果,可知当对于上述的化合物群使用了不变量化AAM描述符时,生成比随机的分组或使用了指纹的分组包含更多的命中的组。另外,在图13中,组号码根据分组方法(随机、不变量化AAM描述符、指纹)而不同,因此分组的优劣是通过“是否包含有期待值高的(包含更多的命中的)组”来进行判断而不是通过比较相同组号码中的期待值来进行判断。
<命中搜索时间(其1)>
图14是表示针对上述化合物群的Importance Sampling(重点采样)的模拟结果的图表。当使用了第1实施方式所涉及的不变量化AAM描述符时,与随机进行分组的情况相比,命中搜索时间(用于发现相同的命中数量的药效评价的次数)在50%搜索的情况下被缩短为约2分之1,在25%搜索的情况下被缩短为约4分之1。另一方面,在使用了指纹的分组的情况下,命中搜索时间未缩短。另外,其中的Importance Sampling(重点采样)的模拟是指,按每一组提供表示优先级的变量,在每一次测定中,一边以将出现命中的组的优先级提高而将未出现命中的组的优先级降低的方式更新变量一边以更少的测定次数聚集更多的命中的方法。图14中示出了对优先级的控制使用了作为机器学习方法的一种的NB法(NB:NaiveBayes:朴素贝叶斯)的例,但是无需限定于此。
<命中搜索时间(其2)>
针对相对于蛋白质AA2AR的32,464个化合物(包含483个命中)与(其1)相同地将Importance Sampling(重点采样)的模拟结果示于图15中。蛋白质AA2AR为难以获得X射线晶体结构的膜蛋白,但是即使为这种膜蛋白的情况下,命中搜索时间以50%搜索时也缩短至约2分之1。
根据上述不变量化AAM描述符,描述符相似的化合物显示出相似的药效(对于目标蛋白质的键合),因此准确表示对象结构体(化合物、口袋结构体)的化学性质。根据对三维AAM描述符进行不变量化而获得的不变量化AAM描述符,通过使用针对2种类不同的氨基酸的三维AAM描述符进行不变量化,正确进行基于描述符的化合物的比较(药效判定)的同时,容易处理且能够减少数据容量。而且,根据不变量化AAM描述符,容易发现命中而能够加快搜索。
<特征量计算方法及特征量计算程序的效果>
如上所述,第1实施方式所涉及的筛选装置10中,使用本发明所涉及的特征量计算方法及特征量计算程序能够计算出准确表示对象结构体的化学性质的特征量(三维AAM描述符、不变量化AAM描述符)。
<目标化合物的提取(筛选)>
对使用了上述三维AAM描述符及不变量化AAM描述符的从多个化合物中的目标化合物(医药候选化合物)的提取进行说明。目标化合物的提取具有根据配体的描述符(三维AAM描述符、不变量化AAM描述符)进行提取的模式(第1模式)和根据目标蛋白质的口袋结构体的描述符(三维AAM描述符、不变量化AAM描述符)进行提取的模式(第2模式)。能够按照用户经由操作部400进行的操作来选择通过哪一个模式进行提取。
<配体输入的筛选>
图16是表示使用了配体的三维AAM描述符的筛选的步骤的流程图。若开始进行处理,则特征量计算部120计算出配体的三维AAM描述符(步骤S300:特征量计算工序)。另外,配体为确认到与目标蛋白质的键合的化合物,因此步骤S300中的三维AAM描述符的计算能够通过图5的流程图所示的步骤进行。
如图4的上述内容,筛选装置10中,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与对应于该立体结构的三维AAM描述符(第1特征量)建立关联并存储于存储部200。相似度计算部130计算出针对化合物的三维AAM描述符与在步骤S300中所计算的配体的三维AAM描述符的相似度(步骤S302:相似度计算工序)。在计算出相似度之后,化合物提取部140根据相似度提取目标化合物(步骤S304:目标化合物提取工序)。如上述,只要三维AAM描述符相似,则显示出相似的药效(对于目标蛋白质的键合),因此通过使用三维AAM描述符的相似度,能够提取具有与配体相似的药效的化合物(即,作为医药候选的目标化合物)。另外,具体而言,基于相似度的目标化合物的提取(步骤S304)能够通过“提取相似度为阈值以上的化合物”、“以相似度高到低的顺序提取化合物”等来进行。
图16中,对使用了三维AAM描述符的筛选的步骤进行了说明,但是也能够以相同的步骤进行使用了不变量化AAM描述符的筛选。具体而言,特征量计算部120通过图5的步骤及上述式(2),上述式(3)计算出配体的不变量化AAM描述符(第1不变量化特征量),并由相似度计算部130计算出与存储于存储部200的化合物的不变量化AAM描述符的相似度。在计算出相似度之后,由化合物提取部140根据相似度提取目标化合物。基于相似度的目标化合物的提取的具体方式能够与三维AAM描述符相同地进行。
图17是表示配体输入的筛选结果的例的表。图17中的图17(a)部分表示设为使用三维AAM描述符“提取相似度为阈值以上的化合物”的情况的结果,图17(b)部分表示设为使用不变量化AAM描述符“以相似度高到低的顺序提取化合物”的情况的结果。另外,图17中的图17(a)部分中,根据针对氨基酸1的三维AAM描述符(g1(r))提取化合物,但是也可以根据针对其他氨基酸(氨基酸2~氨基酸20)的三维AAM描述符(例如,g2(r))提取化合物。并且,也可以分别计算出针对不同的氨基酸的多个三维AAM描述符(例如,g1(r)和g2(r))的相似度(g1(r)彼此的相似度和g2(r)彼此的相似度),并根据此提取化合物。用于化合物的提取的三维AAM描述符可以为1种类,但是通过使用多个种类的三维AAM描述符,能够正确进行基于相似度的化合物的提取。另外,在使用多个种类的三维AAM描述符的情况下,在这些描述符之间的氨基酸的组合并无特别限定(例如,可以为g1(r)和g2(r),也可以为g3(r)和g4(r))。
相同地,图17中的图17(b)部分中,根据针对氨基酸1,氨基酸2的不变量化AAM描述符(F12(s))提取化合物,但是进行不变量化AAM描述符的计算的氨基酸可以为其他组合(例如,基于氨基酸3,氨基酸4的F34(s))。并且,可以根据氨基酸的组合不同的多个不变量化AAM描述符(例如,F12(s)和F34(s))进行化合物的提取(例如,使用F12(s)彼此的相似度和F34(s)彼此的相似度)。用于化合物的提取的不变量化AAM描述符可以为1种类,但是通过使用多个种类的不变量化AAM描述符,能够正确进行基于相似度的化合物的提取。另外,在使用多个种类的不变量化AAM描述符的情况下,在这些描述符之间的氨基酸的组合并无特别限定(例如,可以为F12(s)和F34(s),也可以为F12(s)和F13(s))。关于针对哪一个氨基酸计算出描述符及相似度,可以按照用户经由操作部400进行的指示而由处理部100(特征量计算部120、相似度计算部130、化合物提取部140)进行确定,也可以不按照用户的指示而由处理部100进行确定。
另外,图17(a)部分中,将相似度的阈值设为80%,图17(b)部分中,将提取个数设为100个,但是这些值为例示,能够按照筛选的精度等条件设定阈值及提取个数。能够按照用户经由操作部400进行的输入来进行设定。并且,与图17相反地,可以在使用了三维AAM描述符的情况下,设为“以相似度高到低的顺序提取化合物”,在使用了不变量化AAM描述符的情况下,设为“提取相似度为阈值以上的化合物”。化合物提取部140将如图17所示那样的提取结果作为化合物提取结果260存储于存储部200(参考图3)。
<目标蛋白质输入的筛选>
图18是表示针对目标蛋白质的口袋结构体的使用了三维AAM描述符的筛选的步骤的流程图。若开始进行处理,则特征量计算部120计算出针对目标蛋白质的口袋结构体的三维AAM描述符(步骤S400:特征量计算工序)。步骤S400中的三维AAM描述符的计算能够通过图9的流程图所示的步骤进行计算。相似度计算部130计算出针对化合物的三维AAM描述符与在步骤S400中所计算的针对口袋结构体的三维AAM描述符的相似度(步骤S402:相似度计算工序)。在计算出相似度之后,化合物提取部140根据相似度提取目标化合物(步骤S404:目标化合物提取工序)。与上述配体输入的情况相同地,基于相似度的目标化合物的提取(步骤S404)具体能够通过“提取相似度为阈值以上的化合物”、“以相似度高到低的顺序提取化合物”等来进行。
在使用不变量化AAM描述符的情况下,也能够以与图18的流程图相同的步骤提取目标化合物。
图19是表示目标蛋白质输入的筛选结果的例的表。图19中的图19(a)部分表示设为使用三维AAM描述符“提取相似度为阈值以上的化合物”的情况的结果,图19(b)部分表示设为使用不变量化AAM描述符“以相似度高到低的顺序提取化合物”的情况的结果。能够按照筛选的精度等条件设定相似度的阈值及提取个数。能够按照用户经由操作部400进行的输入来进行设定。并且,与图19相反地,可以在使用了三维AAM描述符的情况下,设为“以相似度高到低的顺序提取化合物”,在使用了不变量化AAM描述符的情况下,设为“提取相似度为阈值以上的化合物”。
目标蛋白质输入的筛选的情况也与配体输入的筛选的情况(参考图17及其说明)相同地,可以改变氨基酸的种类,也可以使用针对不同的氨基酸的多个描述符(三维AAM描述符、不变量化AAM描述符)。用于化合物的提取的描述符可以为1种类,但是通过使用多个种类的描述符,能够正确进行基于相似度的化合物的提取。另外,在使用多个种类的描述符的情况下,在这些描述符之间的氨基酸的组合并无特别限定。关于针对哪一个氨基酸计算出描述符及相似度,可以按照用户经由操作部400进行的指示而由处理部100(特征量计算部120、相似度计算部130、化合物提取部140)进行确定,也可以不按照用户的指示而由处理部100进行确定。
化合物提取部140将如图19所示那样的提取结果作为化合物提取结果260存储于存储部200(参考图3)。
<筛选装置的效果>
如上所述,第1实施方式所涉及的筛选装置10中,使用通过本发明所涉及的特征量计算方法及特征量计算程序计算出的特征量(三维AAM描述符、不变量化AAM描述符),并通过本发明所涉及的筛选方法及筛选程序,能够有效进行医药候选化合物的筛选。
<第2实施方式>
对本发明的第2实施方式所涉及的化合物创建装置进行说明。图20是表示化合物创建装置20(特征量计算装置、化合物创建装置)的结构的框图。另外,针对与第1实施方式相同的要件标注相同的参考符号,并省略详细的说明。
化合物创建装置20包含处理部101。处理部101构成为如图21那样,且包含信息输入部110、特征量计算部120(特征量计算部)、生成器构建部132(生成器构建部)、化合物立体结构生成部142(化合物立体结构生成部)、显示控制部150。信息输入部110、特征量计算部120、显示控制部150的功能分别与上述筛选装置10中的信息输入部110、特征量计算部120、显示控制部150相同。与筛选装置10的上述内容相同地,能够使用各种处理器(processor)来实现这些各部的功能。
图22是表示存储于存储部201的信息的图。在存储部201中,存储有筛选装置10中的立体结构生成结果270来代替化合物提取结果260。与图4的上述内容相同地,存储于存储部201的信息相互建立关联地存储。
<目标化合物的立体结构生成>
对使用了上述三维AAM描述符及不变量化AAM描述符的目标化合物(医药候选化合物)的立体结构生成进行说明。基于化合物创建装置20的目标化合物的立体结构生成中,由于不进行检索,因此即使在成为“基于筛选的检索的结果为无解”的情况下也能够生成化合物的立体结构,从而能够有效创建医药候选化合物的立体结构。立体结构的生成具有根据配体的描述符(三维AAM描述符、不变量化AAM描述符)进行的模式和根据目标蛋白质的口袋结构体的描述符(三维AAM描述符、不变量化AAM描述符)进行的模式。能够按照用户经由操作部400进行的操作来选择通过哪一个模式进行立体结构的生成。
<输入配体时的立体结构生成>
图23是表示在输入配体的情况下的立体结构生成步骤的流程图。若开始进行处理,则特征量计算部120计算出配体的描述符(三维AAM描述符)(步骤S500:对象结构体指定工序、立体结构生成工序、特征量计算工序)。与第1实施方式相同地,步骤S500的处理能够使用本发明所涉及的特征量计算方法及特征量计算程序来进行(参考图5~图8及针对这些图的说明)。
步骤S502中,生成器构建部132通过机器学习构建生成器(生成器构建工序)。以下,参考图24并对步骤S502的处理进行说明。(步骤1)特征量计算部120针对多个化合物计算出三维AAM描述符,并制作结构式(被立体化的结构式)和三维AAM描述符的配对(三维数据彼此)。(步骤2)生成器构建部132通过将化合物的立体结构设为教师数据且将三维AAM描述符(第1特征量)设为解释变量的机器学习(深层学习)构建生成器。深层学习的方法并不限定于特定的方法,例如,可以为简单的全部键合的类神经网络,也可以为卷积类神经网络(CNN:Convolutional Neural Network)。然而,立体结构的生成精度取决于所使用的学习方法,因此优选按照立体结构的生成条件、要求精度等条件来选择学习方法。
若上述步骤1,步骤2的处理结束,则返回到图23的流程图。化合物立体结构生成部142使用所构建的生成器从配体的三维AAM描述符生成目标化合物(命中)的立体结构(被立体化的结构式)(步骤S504:化合物立体结构生成工序)。由此,能够获得具有与配体相似的药效(与目标蛋白质的键合)的化合物即医药候选化合物的立体结构。另外,提供相同的三维AAM描述符的立体结构能够存在多个。化合物立体结构生成部142将所生成的立体结构作为立体结构生成结果270与三维AAM描述符(三维AAM描述符230)建立关联并存储于存储部201(参考图22)。显示控制部150可以按照用户经由操作部400进行的指示将所生成的立体结构显示于显示器310。
另外,在上述步骤中,计算出用于机器学习的三维AAM描述符的氨基酸可以为1种类,也可以为多个种类。然而,通过计算出针对多个种类的氨基酸的三维AAM描述符并将其用于学习,能够提高所生成的立体结构的精度。另外,在使用氨基酸的种类不同的多个三维AAM描述符的情况下,在这些描述符之间的氨基酸的组合并无特别限定。关于针对哪一个氨基酸计算出三维AAM描述符并将其用于学习,可以按照用户经由操作部400进行的指示而由处理部100(特征量计算部120、相似度计算部130、化合物提取部140)进行确定,也可以不按照用户的指示而由处理部100进行确定。
<立体结构的生成例>
对使用通过机器学习所构建的生成器生成的立体结构的例进行说明。该例中,使用简单的全部键合的类神经网络并通过上述的方法对库化合物中的1,800个进行学习,且调查了剩余200个化合物的立体结构能够再现到哪一程度。其结果示于图25中。若增加类神经网络的中间层的数量,则平均cos相似度成为59%。图26是表示针对显示出这种相似度的例的从三维AAM描述符生成的立体结构(结构式)和正解结构式(分别为图26中的26(a)部分、26(b)部分)的图。
<教师数据的特征与所生成的立体结构的关系>
通过上述步骤所生成的立体结构受到作为教师数据所提供的化合物的特征的影响。因此,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。例如,通过提供具有容易合成的立体结构的化合物的三维AAM描述符作为教师数据,能够生成具有与配体相似的药效且具有容易合成的立体结构的化合物。关于提供针对哪一种化合物的三维AAM描述符作为教师数据,能够根据欲生成的化合物的特征来进行选择。
<使用了不变量化AAM描述符的立体结构的生成>
图23~图26中,对使用了三维AAM描述符的立体结构的生成进行了说明。相对于此,在使用了不变量化AAM描述符(第1不变量化特征量)的情况下,也与使用三维AAM描述符的情况相同地,能够通过将不变量化AAM描述符设为教师数据且将立体结构(被立体化的结构式)设为解释变量的机器学习(深层学习)生成目标化合物的立体结构。
<输入目标蛋白质的立体结构生成>
化合物创建装置20中,除了基于上述配体输入的立体结构生成以外,能够通过输入目标蛋白质来生成目标化合物的立体结构。在此情况下,也与配体输入的情况相同地,能够进行使用了三维AAM描述符(第2特征量)的立体结构生成和使用了不变量化AAM描述符(第2不变量化特征量)的立体结构生成。
图27是表示在输入目标蛋白质的情况下(设为使用三维AAM描述符)的立体结构生成步骤的流程图。若开始进行处理,则特征量计算部120计算出目标蛋白质的口袋结构体的三维AAM描述符(第2特征量)(步骤S600:对象结构体指定工序、立体结构生成工序、特征量计算工序)。与第1实施方式相同地,步骤S600的处理能够使用本发明所涉及的特征量计算方法来进行(参考图9,图10及针对这些图的说明)。
步骤S602中,与配体输入的情况相同地,生成器构建部132通过机器学习(深层学习)构建生成器(生成器构建工序)。能够以与上述步骤1,步骤2相同的方式进行生成器的构建。化合物立体结构生成部142使用所构建的生成器从口袋结构体的三维AAM描述符生成目标化合物(命中)的立体结构(被立体化的结构式)(步骤S604:化合物立体结构生成工序)。由此,能够获得具有与口袋结构体相似的药效(与目标蛋白质的键合)的化合物即医药候选化合物的立体结构。另外,提供相同的三维AAM描述符的立体结构能够存在多个。化合物立体结构生成部142将所生成的立体结构作为立体结构生成结果270与三维AAM描述符(三维AAM描述符230)建立关联并存储于存储部201(参考图22)。按照用户经由操作部400进行的指示,显示控制部150可以将所生成的立体结构显示于显示器310。
<化合物创建装置的效果>
如上所述,第2实施方式所涉及的化合物创建装置20中,使用通过本发明所涉及的特征量计算方法及特征量计算程序计算出的特征量(三维AAM描述符、不变量化AAM描述符),并通过本发明所涉及的化合物创建方法及化合物创建程序,能够有效创建医药候选化合物的立体结构。
<第3实施方式>
上述第1实施方式为进行特征量的计算及基于此的筛选的方式,第2实施方式为进行特征量的计算及基于此的目标化合物的立体结构创建的方式,但是除了特征量的计算以外,也可以进行筛选和目标化合物的立体结构创建这两个。因此,第3实施方式所涉及的医药候选化合物搜索装置30(特征量计算装置、筛选装置、化合物创建装置;参考图28)中,具有图28所示的处理部102来代替图1所示的筛选装置10的处理部100或者图20所示的化合物创建装置20的处理部101。如图29所示,处理部102具有特征量计算部120(特征量计算部)、相似度计算部130(相似度计算部)、生成器构建部132(生成器构建部)、化合物提取部140(化合物提取部)、化合物立体结构生成部142(化合物立体结构生成部),能够进行特征量的计算、筛选及化合物的立体结构创建。并且,医药候选化合物搜索装置30将与此相对应的信息存储于存储部202。具体而言,如图30所示,与存储于存储部200及存储部201的信息(参考图3,图22)相对应地存储于存储部202。
其他要件与图1所示的筛选装置10、图20所示的化合物创建装置20相同,因此标注相同的参考符号并省略详细的说明。
通过上述结构,在第3实施方式所涉及的医药候选化合物搜索装置30中,也与筛选装置10、化合物创建装置20相同地,能够计算出准确表示对象结构体的化学性质的特征量,且有效进行医药候选化合物的筛选,并有效创建医药候选化合物的立体结构。
以上,对本发明的实施方式进行了说明,但是本发明并不限定于上述方式,如以下所例示,在不脱离本发明的主旨的范围内能够进行各种变形。
<可处理的医药的目标>
本发明中,作为医药的目标,除了蛋白质以外能够使用DNA(Deoxyribonu cleicAcid)、RNA(Ribonucleic Acid)、细胞膜、多糖。然而,在第1~第3实施方式中,需要将氨基酸变更为另一物质。具体而言,在DNA的情况下,将氨基酸变更为核酸碱基,在RNA的情况下,将氨基酸变更为核酸碱基,在细胞膜的情况下,将氨基酸变更为脂质分子,在多糖的情况下,将氨基酸变更为单糖分子。以下,对本发明中通过该变更也可处理DNA、RNA、细胞膜、多糖的原因进行说明。蛋白质、DNA、RNA、细胞膜、多糖统称为生物高分子,且由固有的组成部分组成。具体而言,蛋白质的组成部分为氨基酸,DNA的组成部分为核酸碱基,RNA的组成部分相同地为核酸碱基,细胞膜的组成部分为脂质分子,多糖的组成部分为单糖分子。与蛋白质相同地,作为除了蛋白质以外的生物高分子的DNA、RNA、细胞膜、多糖中也具有作为活性部位的口袋,因此在医药的目标(目标生物高分子)为DNA、RNA、细胞膜、多糖的情况下,本发明也能够通过将在蛋白质的情况下所示的第1~第3实施方式中的氨基酸变更为目标的组成部分来进行应对。另外,对在化合物或者口袋结构体的周围的氨基酸、核酸碱基、脂质分子、单糖分子的聚集程度进行定量时,也能够考虑水。
<可处理的活性>
本发明中,除了“基于化合物的对目标生物分子的单独的活性”等通常的活性以外,还能够针对“基于化合物的除了目标生物分子以外对由其他生物分子组成的复合体的细胞的活性”进行使用。
<(变形例1)针对除了氨基酸以外的生物高分子的特征量及其利用>
<目标及探针>
在作为医药的目标(目标生物高分子)使用作为除了蛋白质以外的生物高分子(化合物)的DNA、RNA、细胞膜、多糖的情况下,在特征量的计算中,将探针设成不是氨基酸的另一物质(各目标的组成部分)。具体而言,在目标为“DNA、RNA、细胞膜及多糖”的情况下,将探针分别设为“1种类以上的核酸碱基、1种类以上的核酸碱基、1种类以上的脂质分子及1种类以上的单糖分子”。并且,在将这些作为探针而对其聚集程度进行定量化时,可以考虑水、1种类以上的离子。并且,在目标由“DNA、RNA、细胞膜、多糖”中的多个种类的生物高分子构成的情况下,探针也能够按照目标的结构设为“1种类以上的核酸碱基、1种类以上的核酸碱基、1种类以上的脂质分子、1种类以上的单糖分子、水及1种类以上的离子”中的1个以上(可以为与目标的结构相对应的种类、数量及它们的组合)。另外,以所有的探针均产生范德华力为前提。
<特征量的计算及筛选>
进行特征量(第3特征量)的计算及筛选的装置(特征量计算装置、筛选装置)的结构与第1实施方式相同(参考图1~图3)。然而,计算及存储第3描述符(第3特征量)来代替图3中的三维AAM描述符230,且计算及存储第3不变量化特征量来代替不变量化AAM描述符240。特征量的计算及筛选步骤与第1实施方式相同,能够使用本发明的特征量计算方法、特征量计算程序、筛选方法及筛选程序。具体而言,将作为第1特征量的计算(参考图5)中的探针的“氨基酸”设为“1种类以上的核酸碱基、1种类以上的脂质分子、1种类以上的单糖分子、水及1种类以上的离子中的1个以上(可以为任意种类、数量及组合)”并计算出分布函数(参考式(1)),根据该分布函数计算出第3特征量并对第3特征量进行傅里叶变换来计算出第3不变量化特征量(参考式(2))。并且,可以使用针对2种类不同的探针(由1种类以上的核酸碱基、1种类以上的脂质分子、1种类以上的单糖分子、水及1种类以上的离子中的1个以上构成的第1探针和由1种类以上的核酸碱基、1种类以上的脂质分子、1种类以上的单糖分子、水及1种类以上的离子中的1个以上构成且与第1探针不同的第2探针)的第3特征量,并通过相关函数的角度积分计算出第3不变量化特征量(参考式(3)、式(4))。
并且,能够使用第3特征量来代替第1实施方式中的三维AAM描述符,并根据针对多个化合物的第3特征量和针对键合化合物的第3特征量的相似度提取目标化合物。可以提取相似度为阈值以上的化合物,也可以以相似度高到低的顺序提取化合物。
<特征量的计算及化合物的创建>
进行特征量(第3特征量)的计算及化合物的创建的装置(特征量计算装置、化合物创建装置)的结构与第2实施方式相同(参考图20~图22)。然而,计算及存储第3描述符(第3特征量)来代替图22中的三维AAM描述符230,且计算及存储第3不变量化特征量来代替不变量化AAM描述符240。特征量的计算及化合物的创建步骤与第2实施方式相同,能够使用本发明的特征量计算方法、特征量计算程序、化合物创建方法及化合物创建程序。在变形例1中,通过将化合物的立体结构设为教师数据且将第3特征量设为解释变量的机器学习(深层学习)构建生成器,并能够使用所构建的生成器,从针对键合化合物的第3特征量生成目标生物高分子的立体结构,其中,所述键合化合物为确认到与目标生物高分子的键合的化合物。另外,与第1至第3实施方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
与第1至第3实施方式的上述内容相同地,从局部来看,化合物的药效(对于DNA等目标的键合力)被表示为化合物与核酸碱基等(探针)之间的相互作用的结果,因此只要在化合物之间核酸碱基等的聚集程度为相似,则这些化合物与目标的键合力相似。即,第3特征量相似的化合物显示出相似的药效。因此,变形例1中,能够通过第3特征量来准确表示化合物的化学性质。并且,若与目标生物高分子键合的键合化合物和对象化合物的第3特征量相似,则两者的药效相似。因此,根据变形例1,基于第3特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。并且,根据变形例1,与上述实施方式相同地,生成具有与键合化合物的特征量(第3特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。
另外,在进行特征量计算、筛选及化合物创建的情况(对应于第3实施方式)下,能够通过与图28~图30相同的结构来进行。
<(变形例2)针对除了氨基酸及氨基酸以外的特征量及其利用>
<目标及探针>
变形例2中,将“蛋白质与除了蛋白质以外的生物高分子(DNA、RNA、细胞膜、多糖)的复合体”设为目标。并且,将“1种类以上的氨基酸”(第1探针)和“1种类以上的核酸碱基、1种类以上的核酸碱基、1种类以上的脂质分子、1种类以上的单糖分子、水及1种类以上的离子中的1个以上”(第2探针;可以为任意种类、数量、组合)设为探针。能够按照目标的结构设定第1,第2探针的结构(种类、数量及它们的组合)。另外,以所有的探针均产生范德华力为前提。
<特征量的计算及筛选>
进行特征量(第4特征量)的计算及筛选的装置(特征量计算装置、筛选装置)的结构与第1实施方式相同(参考图1~图3)。然而,计算及存储第4描述符(第4特征量)来代替图3中的三维AAM描述符230,且计算及存储第4不变量化特征量来代替不变量化AAM描述符240。特征量的计算及筛选步骤与第1实施方式相同,能够使用本发明的特征量计算方法、特征量计算程序、筛选方法及筛选程序。具体而言,将作为第1特征量的计算(参考图5)中的探针的“氨基酸”设为“1种类以上的氨基酸”(第1探针)和“1种类以上的核酸碱基、1种类以上的脂质分子、水、1种类以上的单糖分子及1种类以上的离子中的1个以上”(第2探针;可以为任意种类、数量、组合)并计算出分布函数(参考式(1)),根据该分布函数计算出第4特征量并对第4特征量进行傅里叶变换来计算出第4不变量化特征量(参考式(2))。并且,可以使用针对“1种类以上的氨基酸”(第1探针)和“1种类以上的核酸碱基、1种类以上的脂质分子、1种类以上的单糖分子、水及1种类以上的离子中的1个以上”(第2探针;可以为任意种类、数量、组合)中的至少一个不同的2种类的探针的第4特征量,并通过相关函数的角度积分计算出第4不变量化特征量(参考式(3)、式(4))。
并且,能够使用第4特征量来代替第1实施方式中的三维AAM描述符,并根据针对多个化合物的第4特征量和针对键合化合物的第4特征量的相似度提取目标化合物。可以提取相似度为阈值以上的化合物,也可以以相似度高到低的顺序提取化合物。
<特征量的计算及化合物的创建>
进行特征量(第4特征量)的计算及化合物的创建的装置(特征量计算装置、化合物创建装置)的结构与第2实施方式相同(参考图20~图22)。然而,计算及存储第4描述符(第4特征量)来代替图22中的三维AAM描述符230,且计算及存储第4不变量化特征量来代替不变量化AAM描述符240。特征量的计算及化合物的创建步骤与第2实施方式相同,能够使用本发明的特征量计算方法、特征量计算程序、化合物创建方法及化合物创建程序。在变形例2中,通过将化合物的立体结构设为教师数据且将第4特征量设为解释变量的机器学习(深层学习)构建生成器,并能够使用所构建的生成器,从针对键合化合物的第3特征量生成目标生物高分子的立体结构,其中,所述键合化合物为确认到与目标生物高分子的键合的化合物。另外,与第1至第3实施方式及变形例1相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
与第1至第3实施方式及变形例1的上述内容相同地,从局部来看,化合物的药效(对于目标的键合力)被表示为化合物与探针之间的相互作用的结果,因此只要在化合物之间探针的聚集程度为相似,则这些化合物与目标的键合力相似。即,第4特征量相似的化合物显示出相似的药效。因此,变形例2中,能够通过第4特征量来准确表示化合物的化学性质。并且,若与目标生物高分子键合的键合化合物和对象化合物的第4特征量相似,则两者的药效相似。因此,根据变形例2,基于第4特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。并且,根据变形例2,与上述实施方式及变形例1相同地,生成具有与键合化合物的特征量(第4特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。
另外,在进行特征量计算、筛选及化合物创建的情况(对应于第3实施方式)下,能够通过与图28~图30相同的结构来进行。
<(变形例3)针对虚拟的点电荷等的特征量及其利用>
<目标及探针>
变形例3中,将生物高分子设为目标,并将“电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置第1点电荷和第2点电荷的偶极子及零电荷的第5点电荷中的1个以上(可以为任意种类、数量及它们的组合)”(具有实数电荷且产生范德华力的虚拟的点电荷等)设为探针。
<特征量的计算及筛选>
进行特征量(第5特征量)的计算及筛选的装置(特征量计算装置、筛选装置)的结构与第1实施方式相同(参考图1~图3)。然而,计算及存储第5描述符(第5特征量)来代替图3中的三维AAM描述符230,且计算及存储第5不变量化特征量来代替不变量化AAM描述符240。特征量的计算及筛选步骤与第1实施方式相同,能够使用本发明的特征量计算方法、特征量计算程序、筛选方法及筛选程序。具体而言,将作为第1特征量的计算(参考图5)中的探针的“氨基酸”设为“电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置第1点电荷和第2点电荷的偶极子及零电荷的第5点电荷中的1个以上(可以为任意种类、数量及它们的组合)”并计算出分布函数(参考式(1)),根据该分布函数计算出第5特征量并对第5特征量进行傅里叶变换来计算出第5不变量化特征量(参考式(2))。并且,可以使用针对2种类不同的探针(由第1点电荷、第2点电荷、第3点电荷、第4点电荷、偶极子及第5点电荷中的1个以上构成的第1探针和由第1点电荷、第2点电荷、第3点电荷、第4点电荷、偶极子及第5点电荷中的1个以上构成且与第1探针不同的第2探针)的第5特征量,并通过相关函数的角度积分计算出第5不变量化特征量(参考式(3)、式(4))。
并且,能够使用第5特征量来代替第1实施方式中的三维AAM描述符,并根据针对多个化合物的第5特征量和针对键合化合物的第5特征量的相似度提取目标化合物。可以提取相似度为阈值以上的化合物,也可以以相似度高到低的顺序提取化合物。
<特征量的计算及化合物的创建>
进行特征量(第5特征量)的计算及化合物的创建的装置(特征量计算装置、化合物创建装置)的结构与第2实施方式相同(参考图20~图22)。然而,计算及存储第5描述符(第5特征量)来代替图22中的三维AAM描述符230,且计算及存储第5不变量化特征量来代替不变量化AAM描述符240。特征量的计算及化合物的创建步骤与第2实施方式相同,能够使用本发明的特征量计算方法、特征量计算程序、化合物创建方法及化合物创建程序。在变形例3中,通过将化合物的立体结构设为教师数据且将第5特征量设为解释变量的机器学习(深层学习)构建生成器,并能够使用所构建的生成器,从针对键合化合物的第3特征量生成目标生物高分子的立体结构,其中,所述键合化合物为确认到与目标生物高分子的键合的化合物。另外,与第1至第3实施方式及变形例1、变形例2相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
与第1至第3实施方式及变形例1、变形例2的上述内容相同地,从局部来看,化合物的药效(对于目标的键合力)被表示为化合物与探针之间的相互作用的结果,因此只要在化合物之间探针的聚集程度为相似,则这些化合物与目标的键合力相似。即,第5特征量相似的化合物显示出相似的药效。因此,变形例3中,能够通过第5特征量来准确表示化合物的化学性质。并且,若与目标生物高分子键合的键合化合物和对象化合物的第5特征量相似,则两者的药效相似。因此,根据变形例3,基于第5特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。并且,根据变形例3,与第1至第3实施方式及变形例1、变形例2相同地,生成具有与键合化合物的特征量(第5特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。
另外,在进行特征量计算、筛选及化合物创建的情况(对应于第3实施方式)下,能够通过与图28~图30相同的结构来进行。
<(变形例4)针对氨基酸及虚拟的点电荷等的特征量及其利用>
<目标及探针>
变形例4中,将生物高分子(化合物)设为目标,并将“1种类以上的氨基酸即第1探针和电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置第1点电荷和第2点电荷的偶极子及零电荷的第5点电荷中的1个以上(可以为任意种类、数量及组合)即第2探针”设为探针。
<特征量的计算及筛选>
进行特征量(第6特征量)的计算及筛选的装置(特征量计算装置、筛选装置)的结构与第1实施方式相同(参考图1~图3)。然而,计算及存储第6描述符(第6特征量)来代替图3中的三维AAM描述符230,且计算及存储第6不变量化特征量来代替不变量化AAM描述符240。特征量的计算及筛选步骤与第1实施方式相同,能够使用本发明的特征量计算方法、特征量计算程序、筛选方法及筛选程序。具体而言,将作为第1特征量的计算(参考图5)中的探针的“氨基酸”设为“1种类以上的氨基酸即第1探针和电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置第1点电荷和第2点电荷的偶极子及零电荷的第5点电荷中的1个以上(可以为任意种类、数量及组合)即第2探针”并计算出分布函数(参考式(1)),根据该分布函数计算出第6特征量并对第6特征量进行傅里叶变换来计算出第6不变量化特征量(参考式(2))。并且,可以使用针对第1探针和第2探针中的至少一个不同的2种类的探针的第6特征量,并通过相关函数的角度积分计算出第6不变量化特征量(参考式(3)、式(4))。
并且,能够使用第6特征量来代替第1实施方式中的三维AAM描述符,并根据针对多个化合物的第6特征量和针对键合化合物的第6特征量的相似度提取目标化合物。可以提取相似度为阈值以上的化合物,也可以以相似度高到低的顺序提取化合物。
<特征量的计算及化合物的创建>
进行特征量(第6特征量)的计算及化合物的创建的装置(特征量计算装置、化合物创建装置)的结构与第2实施方式相同(参考图20~图22)。然而,计算及存储第6描述符(第6特征量)来代替图22中的三维AAM描述符230,且计算及存储第6不变量化特征量来代替不变量化AAM描述符240。特征量的计算及化合物的创建步骤与第2实施方式相同,能够使用本发明的特征量计算方法、特征量计算程序、化合物创建方法及化合物创建程序。在变形例4中,通过将化合物的立体结构设为教师数据且将第6特征量设为解释变量的机器学习(深层学习)构建生成器,并能够使用所构建的生成器,从针对键合化合物的第6特征量生成目标生物高分子的立体结构,其中,所述键合化合物为确认到与目标生物高分子的键合的化合物。另外,与第1至第3实施方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
与第1至第3实施方式的上述内容相同地,从局部来看,化合物的药效(对于目标的键合力)被表示为化合物与探针之间的相互作用的结果,因此只要在化合物之间探针的聚集程度为相似,则这些化合物与目标的键合力相似。即,第6特征量相似的化合物显示出相似的药效。因此,变形例4中,能够通过第6特征量来准确表示化合物的化学性质。并且,若与目标生物高分子键合的键合化合物和对象化合物的第6特征量相似,则两者的药效相似。因此,根据变形例4,基于第6特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。并且,根据变形例4,与上述实施方式相同地,生成具有与键合化合物的特征量(第6特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。
另外,在进行特征量计算、筛选及化合物创建的情况(对应于第3实施方式)下,能够通过与图28~图30相同的结构来进行。
<(变形例5)针对核酸碱基等及虚拟的点电荷等的特征量及其利用>
<目标及探针>
变形例5中,将生物高分子(化合物)设为目标,并将“1种类以上的核酸碱基、1种类以上的脂质分子、水、1种类以上的单糖分子及1种类以上的离子中的1个以上(可以为任意种类、数量及组合)”即第1探针和“电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置第1点电荷和第2点电荷的偶极子及零电荷的第5点电荷中的1个以上(可以为任意种类、数量及组合)”即第2探针设为探针。
<特征量的计算及筛选>
进行特征量(第7特征量)的计算及筛选的装置(特征量计算装置、筛选装置)的结构与第1实施方式相同(参考图1~图3)。然而,计算及存储第7描述符(第7特征量)来代替图3中的三维AAM描述符230,且计算及存储第7不变量化特征量来代替不变量化AAM描述符240。特征量的计算及筛选步骤与第1实施方式相同,能够使用本发明的特征量计算方法、特征量计算程序、筛选方法及筛选程序。具体而言,将作为第1特征量的计算(参考图5)中的探针的“氨基酸”设为“1种类以上的核酸碱基、1种类以上的脂质分子、水、1种类以上的单糖分子及1种类以上的离子中的1个以上(可以为任意种类、数量及组合)”即第1探针和“电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置第1点电荷和第2点电荷的偶极子及零电荷的第5点电荷中的1个以上(可以为任意种类、数量及组合)”即第2探针并计算出分布函数(参考式(1)),根据该分布函数计算出第7特征量并对第7特征量进行傅里叶变换来计算出第7不变量化特征量(参考式(2))。并且,可以使用针对第1探针和第2探针中的至少一个不同的2种类的探针的第7特征量,并通过相关函数的角度积分计算出第7不变量化特征量(参考式(3)、式(4))。
并且,能够使用第7特征量来代替第1实施方式中的三维AAM描述符,并根据针对多个化合物的第7特征量和针对键合化合物的第7特征量的相似度提取目标化合物。可以提取相似度为阈值以上的化合物,也可以以相似度高到低的顺序提取化合物。
<特征量的计算及化合物的创建>
进行特征量(第7特征量)的计算及化合物的创建的装置(特征量计算装置、化合物创建装置)的结构与第2实施方式相同(参考图20~图22)。然而,计算及存储第7描述符(第7特征量)来代替图22中的三维AAM描述符230,且计算及存储第7不变量化特征量来代替不变量化AAM描述符240。特征量的计算及化合物的创建步骤与第2实施方式相同,能够使用本发明的特征量计算方法、特征量计算程序、化合物创建方法及化合物创建程序。在变形例5中,通过将化合物的立体结构设为教师数据且将第7特征量设为解释变量的机器学习(深层学习)构建生成器,并能够使用所构建的生成器,从针对键合化合物的第7特征量生成目标生物高分子的立体结构,其中,所述键合化合物为确认到与目标生物高分子的键合的化合物。另外,与第1至第3实施方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
与第1至第3实施方式的上述内容相同地,从局部来看,化合物的药效(对于目标的键合力)被表示为化合物与探针之间的相互作用的结果,因此只要在化合物之间探针的聚集程度为相似,则这些化合物与目标的键合力相似。即,第7特征量相似的化合物显示出相似的药效。因此,变形例5中,能够通过第7特征量来准确表示化合物的化学性质。并且,若与目标生物高分子键合的键合化合物和对象化合物的第7特征量相似,则两者的药效相似。因此,根据变形例5,基于第7特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。并且,根据变形例5,与上述实施方式相同地,生成具有与键合化合物的特征量(第7特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。
另外,在进行特征量计算、筛选及化合物创建的情况(对应于第3实施方式)下,能够通过与图28~图30相同的结构来进行。
<(变形例6)针对核酸碱基等及虚拟的点电荷等的特征量及其利用>
<目标及探针>
变形例6中,将生物高分子(化合物)设为目标,并将“1种类以上的氨基酸”即第1探针和“1种类以上的核酸碱基、1种类以上的脂质分子、水、1种类以上的单糖分子及1种类以上的离子中的1个以上(可以为任意种类、数量及组合)”即第2探针和“电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置第1点电荷和第2点电荷的偶极子及零电荷的第5点电荷中的1个以上(可以为任意种类、数量及组合)”即第3探针设为探针。
<特征量的计算及筛选>
进行特征量(第8特征量)的计算及筛选的装置(特征量计算装置、筛选装置)的结构与第1实施方式相同(参考图1~图3)。然而,计算及存储第8描述符(第8特征量)来代替图3中的三维AAM描述符230,且计算及存储第8不变量化特征量来代替不变量化AAM描述符240。特征量的计算及筛选步骤与第1实施方式相同,能够使用本发明的特征量计算方法、特征量计算程序、筛选方法及筛选程序。具体而言,将作为第1特征量的计算(参考图5)中的探针的“氨基酸”设为“1种类以上的氨基酸”即第1探针和“1种类以上的核酸碱基、1种类以上的脂质分子、水、1种类以上的单糖分子及1种类以上的离子中的1个以上(可以为任意种类、数量及组合)”即第2探针和“电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置第1点电荷和第2点电荷的偶极子及零电荷的第5点电荷中的1个以上(可以为任意种类、数量及组合)”即第3探针并计算出分布函数(参考式(1)),根据该分布函数计算出第8特征量并对第8特征量进行傅里叶变换来计算出第8不变量化特征量(参考式(2))。并且,可以使用针对第1探针、第2探针及第3探针中的至少一个不同的2种类的探针的第8特征量,并通过相关函数的角度积分计算出第8不变量化特征量(参考式(3)、式(4))。
并且,能够使用第8特征量来代替第1实施方式中的三维AAM描述符,并根据针对多个化合物的第8特征量和针对键合化合物的第8特征量的相似度提取目标化合物。可以提取相似度为阈值以上的化合物,也可以以相似度高到低的顺序提取化合物。
<特征量的计算及化合物的创建>
进行特征量(第8特征量)的计算及化合物的创建的装置(特征量计算装置、化合物创建装置)的结构与第2实施方式相同(参考图20~图22)。然而,计算及存储第8描述符(第8特征量)来代替图22中的三维AAM描述符230,且计算及存储第8不变量化特征量来代替不变量化AAM描述符240。特征量的计算及化合物的创建步骤与第2实施方式相同,能够使用本发明的特征量计算方法、特征量计算程序、化合物创建方法及化合物创建程序。在变形例6中,通过将化合物的立体结构设为教师数据且将第8特征量设为解释变量的机器学习(深层学习)构建生成器,并能够使用所构建的生成器,从针对键合化合物的第8特征量生成目标生物高分子的立体结构,其中,所述键合化合物为确认到与目标生物高分子的键合的化合物。另外,与第1至第3实施方式相同地,通过选择作为教师数据所提供的化合物的特征,能够生成具有不同特征的立体结构的化合物。
与第1至第3实施方式的上述内容相同地,从局部来看,化合物的药效(对于目标的键合力)被表示为化合物与探针之间的相互作用的结果,因此只要在化合物之间探针的聚集程度为相似,则这些化合物与目标的键合力相似。即,第8特征量相似的化合物显示出相似的药效。因此,变形例6中,能够通过第8特征量来准确表示化合物的化学性质。并且,若与目标生物高分子键合的键合化合物和对象化合物的第8特征量相似,则两者的药效相似。因此,根据变形例6,基于第8特征量提取与键合化合物的药效相似的目标化合物而能够有效进行医药候选化合物的筛选。并且,根据变形例6,与上述实施方式相同地,生成具有与键合化合物的特征量(第8特征量)相似的(因此,药效相似的)特征量的化合物的结构式而不进行检索,因此能够有效创建医药候选化合物的立体结构。
另外,在进行特征量计算、筛选及化合物创建的情况(对应于第3实施方式)下,能够通过与图28~图30相同的结构来进行。
<基于各特征量的命中数量的比较>
图31是表示针对与上述图13相同的系统(蛋白质ABL1)对将化合物作为对象结构体的基于不变量化特征量(将氨基酸作为探针的第1不变量化特征量及将除了氨基酸以外作为探针的第3~第8不变量化特征量)的命中的发现容易度进行比较评价的结果的一例的图。根据图31,可知尽管效果根据描述符(特征量)的种类(命中数量的期待值)存在差异,但是与随机的情况(参考图13)相比期待值得到提高。另外,图31是在(组数量=183)的情况下的分群的结果,因此针对“AAM”的命中数量与图13的情况(在组数=221的情况下的分群的结果)不同。如此,在使用第3~第8方式的不变量化特征量的情况下,也能够有效进行医药候选化合物的筛选。
符号说明
10-筛选装置,20-化合物创建装置,30-医药候选化合物搜索装置,100-处理部,101-处理部,102-处理部,110-信息输入部,120-特征量计算部,130-相似度计算部,132-生成器构建部,140-化合物提取部,142-化合物立体结构生成部,150-显示控制部,160-CPU,170-ROM,180-RAM,200-存储部,201-存储部,202-存储部,210-结构信息,220-立体结构信息,230-三维AAM描述符,240-不变量化AAM描述符,250-相似度信息,260-化合物提取结果,270-立体结构生成结果,300-显示部,310-显示器,400-操作部,410-键盘,420-鼠标,500-外部服务器,510-外部数据库,A1-氨基酸,A2-氨基酸,A3-氨基酸,AA2AR-蛋白质,ABL1-蛋白质,NW-网络,PO-口袋,PS-口袋结构体,S100~S108-特征量计算方法的各步骤,S200~S206-特征量计算方法的各步骤,S300~S304-目标化合物提取方法的各步骤,S400~S404-目标化合物提取方法的各步骤,S500~S504-立体结构创建方法的各步骤,S600~S604-立体结构创建方法的各步骤,TP-目标蛋白质。
Claims (80)
1.一种特征量计算方法,其具有:
对象结构体指定工序,指定具有化学性质的由多个单元结构体构成的对象结构体;
立体结构生成工序,针对所述对象结构体生成基于所述多个单元结构体的立体结构;及
特征量计算工序,计算出在三维空间中对所述立体结构的周围的1种类以上的探针的聚集程度进行定量化而获得的特征量,
所述探针为分开配置有具有实数电荷且产生范德华力的多个点的结构体。
2.根据权利要求1所述的特征量计算方法,其中,
在所述对象结构体指定工序中,作为所述对象结构体指定化合物,
在所述立体结构生成工序中生成基于多个原子的所述化合物的立体结构,
在所述特征量计算工序中,计算出在所述三维空间中对在所述立体结构生成工序中所生成的所述化合物的所述立体结构的周围的、作为所述探针的氨基酸的聚集程度进行定量化而获得的特征量即第1特征量。
3.根据权利要求2所述的特征量计算方法,其还具有不变量化工序,使所述第1特征量针对所述化合物的旋转及平移不变量化来计算出第1不变量化特征量。
4.根据权利要求3所述的特征量计算方法,其中,
在所述特征量计算工序中,针对2种不同的氨基酸计算出所述第1特征量,
在所述不变量化工序中,使用针对所述2种不同的氨基酸的所述第1特征量来计算出所述第1不变量化特征量。
5.根据权利要求1所述的特征量计算方法,其中,
在所述对象结构体指定工序中,作为所述对象结构体指定与目标蛋白质的活性部位即口袋键合的口袋结构体,
在所述立体结构生成工序中生成基于多个虚拟球体的所述口袋结构体的立体结构,
在所述特征量计算工序中,计算出在所述三维空间中对在所述立体结构生成工序中所生成的所述口袋结构体的所述立体结构的周围的、作为所述探针的氨基酸的聚集程度进行定量化而获得的特征量即第2特征量。
6.根据权利要求5所述的特征量计算方法,其还具有不变量化工序,使所述第2特征量针对所述口袋结构体的旋转及平移不变量化而计算出第2不变量化特征量。
7.根据权利要求6所述的特征量计算方法,其中,
在所述特征量计算工序中,针对2种不同的氨基酸计算出所述第2特征量,
在所述不变量化工序中,使用针对所述2种不同的氨基酸的所述第2特征量来计算出所述第2不变量化特征量。
8.根据权利要求1所述的特征量计算方法,其中,
在所述对象结构体指定工序中,作为所述对象结构体指定化合物,
在所述立体结构生成工序中生成基于多个原子的所述化合物的立体结构,
在所述特征量计算工序中,计算出在所述三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第3特征量,所述聚集程度为在所述立体结构生成工序中所生成的所述化合物的所述立体结构的周围的所述探针的聚集程度,且为将1种类以上的核酸碱基、1种类以上的脂质分子、1种类以上的单糖分子、水及1种类以上的离子中的1个以上作为所述探针的聚集程度。
9.根据权利要求8所述的特征量计算方法,其还具有不变量化工序,使所述第3特征量针对所述化合物的旋转及平移不变量化而计算出第3不变量化特征量。
10.根据权利要求9所述的特征量计算方法,其中,
在所述特征量计算工序中,针对由所述1种类以上的核酸碱基、所述1种类以上的脂质分子、所述1种类以上的单糖分子、所述水及所述1种类以上的离子中的1个以上构成的第1探针和由所述1种类以上的核酸碱基、所述1种类以上的脂质分子、所述1种类以上的单糖分子、所述水及所述1种类以上的离子中的1个以上构成且与所述第1探针不同的第2探针计算出所述第3特征量,
在所述不变量化工序中,使用针对所述第1探针的所述第3特征量和针对所述第2探针的所述第3特征量来计算出所述第3不变量化特征量。
11.根据权利要求1所述的特征量计算方法,其中,
在所述对象结构体指定工序中,作为所述对象结构体指定化合物,
在所述立体结构生成工序中生成基于多个原子的所述化合物的立体结构,
在所述特征量计算工序中,计算出在所述三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第4特征量,所述聚集程度为在所述立体结构生成工序中所生成的所述化合物的所述立体结构的周围的所述探针的聚集程度,且为将1种类以上的氨基酸即第1探针及1种类以上的核酸碱基、1种类以上的脂质分子、水、1种类以上的单糖分子及1种类以上的离子中的1个以上即第2探针作为所述探针的聚集程度。
12.根据权利要求11所述的特征量计算方法,其还具有不变量化工序,使所述第4特征量针对所述化合物的旋转及平移不变量化来计算出第4不变量化特征量。
13.根据权利要求12所述的特征量计算方法,其中,
在所述特征量计算工序中,针对所述第1探针和所述第2探针中的至少一个不同的2种类的所述探针计算出所述第4特征量,
在所述不变量化工序中,使用针对所述2种类的所述探针的所述第4特征量来计算出所述第4不变量化特征量。
14.根据权利要求1所述的特征量计算方法,其中,
在所述对象结构体指定工序中,作为所述对象结构体指定化合物,
在所述立体结构生成工序中生成基于多个原子的所述化合物的立体结构,
在所述特征量计算工序中,计算出在所述三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第5特征量,所述聚集程度为在所述立体结构生成工序中所生成的所述化合物的所述立体结构的周围的所述探针的聚集程度,且为将电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置有所述第1点电荷和所述第2点电荷的偶极子及零电荷的第5点电荷中的1个以上作为所述探针的聚集程度。
15.根据权利要求14所述的特征量计算方法,其还具有不变量化工序,使所述第5特征量针对所述化合物的旋转及平移不变量化来计算出第5不变量化特征量。
16.根据权利要求15所述的特征量计算方法,其中,
在所述特征量计算工序中,针对由所述第1点电荷、所述第2点电荷、所述第3点电荷、所述第4点电荷、所述偶极子及所述第5点电荷中的1个以上构成的第1探针和由所述第1点电荷、所述第2点电荷、所述第3点电荷、所述第4点电荷、所述偶极子及所述第5点电荷中的1个以上构成且与所述第1探针不同的第2探针计算出所述第5特征量,
在所述不变量化工序中,使用针对所述第1探针的所述第5特征量和针对所述第2探针的所述第5特征量来计算出所述第5不变量化特征量。
17.根据权利要求1所述的特征量计算方法,其中,
在所述对象结构体指定工序中,作为所述对象结构体指定化合物,
在所述立体结构生成工序中生成基于多个原子的所述化合物的立体结构,
在所述特征量计算工序中,计算出在所述三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第6特征量,所述聚集程度为在所述立体结构生成工序中所生成的所述化合物的所述立体结构的周围的所述探针的聚集程度,且为将1种类以上的氨基酸即第1探针和电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置所述第1点电荷和所述第2点电荷的偶极子及零电荷的第5点电荷中的1个以上即第2探针作为所述探针的聚集程度。
18.根据权利要求17所述的特征量计算方法,其还具有不变量化工序,使所述第6特征量针对所述化合物的旋转及平移不变量化来计算出第6不变量化特征量。
19.根据权利要求18所述的特征量计算方法,其中,
在所述特征量计算工序中,针对所述第1探针和所述第2探针中的至少一个不同的2种类的所述探针计算出所述第6特征量,
在所述不变量化工序中,使用针对所述2种类的所述探针的所述第6特征量来计算出所述第6不变量化特征量。
20.根据权利要求1所述的特征量计算方法,其中,
在所述对象结构体指定工序中,作为所述对象结构体指定化合物,
在所述立体结构生成工序中生成基于多个原子的所述化合物的立体结构,
在所述特征量计算工序中,计算出在所述三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第7特征量,所述聚集程度为在所述立体结构生成工序中所生成的所述化合物的所述立体结构的周围的所述探针的聚集程度,且为将1种类以上的核酸碱基、1种类以上的脂质分子、水、1种类以上的单糖分子及1种类以上的离子中的1个以上即第1探针和电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置所述第1点电荷和所述第2点电荷的偶极子及零电荷的第5点电荷中的1个以上即第2探针作为所述探针的聚集程度。
21.根据权利要求20所述的特征量计算方法,其还具有不变量化工序,使所述第7特征量针对所述化合物的旋转及平移不变量化来计算出第7不变量化特征量。
22.根据权利要求21所述的特征量计算方法,其中,
在所述特征量计算工序中,针对所述第1探针和所述第2探针中的至少一个不同的2种类的所述探针计算出所述第7特征量,
在所述不变量化工序中,使用针对所述2种类的所述探针的所述第7特征量来计算出所述第7不变量化特征量。
23.根据权利要求1所述的特征量计算方法,其中,
在所述对象结构体指定工序中,作为所述对象结构体指定化合物,
在所述立体结构生成工序中生成基于多个原子的所述化合物的立体结构,
在所述特征量计算工序中,计算出在所述三维空间中对探针的如下聚集程度进行定量化而获得的特征量即第8特征量,所述聚集程度为在所述立体结构生成工序中所生成的所述化合物的所述立体结构的周围的所述探针的聚集程度,且为将1种类以上的氨基酸即第1探针和1种类以上的核酸碱基、1种类以上的脂质分子、水、1种类以上的单糖分子及1种类以上的离子中的1个以上即第2探针和电荷为+1的第1点电荷、电荷为-1的第2点电荷、电荷为+0.1的第3点电荷、电荷为-0.1的第4点电荷、分开配置所述第1点电荷和所述第2点电荷的偶极子及零电荷的第5点电荷中的1个以上即第3探针作为所述探针的聚集程度。
24.根据权利要求23所述的特征量计算方法,其还具有不变量化工序,使所述第8特征量针对所述化合物的旋转及平移不变量化来计算出第8不变量化特征量。
25.根据权利要求24所述的特征量计算方法,其中,
在所述特征量计算工序中,针对所述第1探针、所述第2探针及所述第3探针中的至少一个不同的2种类的所述探针计算出所述第8特征量,
在所述不变量化工序中,使用针对所述2种类的所述探针的所述第8特征量来计算出所述第8不变量化特征量。
26.一种特征量计算程序,其使计算机执行权利要求1至25中任一项所述的特征量计算方法。
27.一种特征量计算装置,其具有:
对象结构体指定部,指定具有化学性质的由多个单元结构体构成的对象结构体;
立体结构生成部,针对所述对象结构体生成基于所述多个单元结构体的立体结构;及
特征量计算部,计算出在三维空间中对所述立体结构的周围的1种类以上的探针的聚集程度进行定量化而获得的特征量,
所述探针为分开配置具有实数电荷且产生范德华力的多个点的结构体。
28.一种筛选方法,从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选方法具有:
存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求2所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第1特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标蛋白质的键合的化合物的配体计算出所述第1特征量;
相似度计算工序,计算出针对所述多个化合物的所述第1特征量与针对所述配体的所述第1特征量的相似度;及
化合物提取工序,根据所述相似度从所述多个化合物提取所述目标化合物。
29.一种筛选方法,从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选方法具有:
存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与针对所述化合物的所述立体结构的所述第1不变量化特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标蛋白质的键合的化合物的配体,使用权利要求3所述的特征量计算方法计算出所述第1不变量化特征量;
相似度计算工序,计算出针对所述多个化合物的所述第1不变量化特征量与针对所述配体的所述第1不变量化特征量的相似度;及
化合物提取工序,根据所述相似度从所述多个化合物提取所述目标化合物。
30.根据权利要求28或29所述的筛选方法,其中,
在所述化合物提取工序中提取所述相似度为阈值以上的化合物。
31.根据权利要求28至30中任一项所述的筛选方法,其中,
在所述化合物提取工序中以所述相似度高到低的顺序提取化合物。
32.一种筛选方法,从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选方法具有:
存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求2所述的特征量计算方法计算出的所述第1特征量建立关联并进行存储;
特征量计算工序,针对所述目标蛋白质的所述口袋结构体,使用权利要求5所述的特征量计算方法计算出所述第2特征量;
相似度计算工序,计算出针对所述多个化合物的所述第1特征量与针对所述口袋结构体的所述第2特征量的相似度;及
化合物提取工序,根据所述相似度从所述多个化合物提取所述目标化合物。
33.一种筛选方法,从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选方法具有:
存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求3所述的特征量计算方法计算出的所述第1不变量化特征量建立关联并进行存储;
特征量计算工序,针对所述目标蛋白质的口袋结构体,使用权利要求6所述的特征量计算方法计算出所述第2不变量化特征量;
相似度计算工序,计算出针对所述多个化合物的所述第1不变量化特征量与针对所述口袋结构体的所述第2不变量化特征量的相似度;及
化合物提取工序,根据所述相似度从所述多个化合物提取所述目标化合物。
34.根据权利要求32或33所述的筛选方法,其中,
在所述化合物提取工序中提取所述相似度为阈值以上的化合物。
35.根据权利要求32至34中任一项所述的筛选方法,其中,
在所述化合物提取工序中以所述相似度高到低的顺序提取化合物。
36.一种筛选方法,从多个化合物提取与除了蛋白质以外的目标生物高分子键合的目标化合物,所述筛选方法具有:
存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求8所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第3特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与除了所述蛋白质以外的所述目标生物高分子键合的化合物的键合化合物计算出所述第3特征量;
相似度计算工序,计算出针对所述多个化合物的所述第3特征量与针对所述键合化合物的所述第3特征量的相似度;及
化合物提取工序,根据所述相似度从所述多个化合物提取所述目标化合物。
37.一种筛选方法,从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选方法具有:
存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求11所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第4特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物计算出所述第4特征量;
相似度计算工序,计算出针对所述多个化合物的所述第4特征量与针对所述键合化合物的所述第4特征量的相似度;及
化合物提取工序,根据所述相似度从所述多个化合物提取所述目标化合物。
38.一种筛选方法,从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选方法具有:
存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求14所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第5特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物计算出所述第5特征量;
相似度计算工序,计算出针对所述多个化合物的所述第5特征量与针对所述键合化合物的所述第5特征量的相似度;及
化合物提取工序,根据所述相似度从所述多个化合物提取所述目标化合物。
39.一种筛选方法,从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选方法具有:
存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求17所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第6特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物计算出所述第6特征量;
相似度计算工序,计算出针对所述多个化合物的所述第6特征量与针对所述键合化合物的所述第6特征量的相似度;及
化合物提取工序,根据所述相似度从所述多个化合物提取所述目标化合物。
40.一种筛选方法,从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选方法具有:
存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求20所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第7特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物计算出所述第7特征量;
相似度计算工序,计算出针对所述多个化合物的所述第7特征量与针对所述键合化合物的所述第7特征量的相似度;及
化合物提取工序,根据所述相似度从所述多个化合物提取所述目标化合物。
41.一种筛选方法,从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选方法具有:
存储工序,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求23所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第8特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物计算出所述第8特征量;
相似度计算工序,计算出针对所述多个化合物的所述第8特征量与针对所述键合化合物的所述第8特征量的相似度;及
化合物提取工序,根据所述相似度从所述多个化合物提取所述目标化合物。
42.一种筛选程序,其使计算机执行权利要求28至41中任一项所述的筛选方法。
43.一种筛选装置,从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选装置具备:
存储部,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求2所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第1特征量建立关联并进行存储;
特征量计算部,针对作为确认到与目标蛋白质的键合的化合物的配体计算出所述第1特征量;
相似度计算部,计算出针对所述多个化合物的所述第1特征量与针对所述配体的所述第1特征量的相似度;及
化合物提取部,根据所述相似度从所述多个化合物提取所述目标化合物。
44.一种筛选装置,从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选装置具备:
存储部,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与针对所述化合物的所述立体结构的所述第1不变量化特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标蛋白质的键合的化合物的配体,使用权利要求3所述的特征量计算方法计算出所述第1不变量化特征量;
相似度计算部,计算出针对所述多个化合物的所述第1不变量化特征量与针对所述配体的所述第1不变量化特征量的相似度;及
化合物提取部,根据所述相似度从所述多个化合物提取所述目标化合物。
45.根据权利要求43或44所述的筛选装置,其中,
所述化合物提取部提取所述相似度为阈值以上的化合物。
46.根据权利要求43至45中任一项所述的筛选装置,其中,
所述化合物提取部以所述相似度高到低的顺序提取化合物。
47.一种筛选装置,从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选装置具备:
存储部,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求2所述的特征量计算方法计算出的所述第1特征量建立关联并进行存储;
特征量计算部,针对所述目标蛋白质的所述口袋结构体,使用权利要求5所述的特征量计算方法计算出所述第2特征量;
相似度计算部,计算出针对所述多个化合物的所述第1特征量与针对所述口袋结构体的所述第2特征量的相似度;及
化合物提取部,根据所述相似度从所述多个化合物提取所述目标化合物。
48.一种筛选装置,从多个化合物提取与目标蛋白质键合的目标化合物,所述筛选装置具备:
存储部,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求3所述的特征量计算方法计算出的所述第1不变量化特征量建立关联并进行存储;
特征量计算部,针对目标蛋白质的口袋结构体,使用权利要求6所述的特征量计算方法计算出所述第2不变量化特征量;
相似度计算部,计算出针对所述多个化合物的所述第1不变量化特征量与针对所述口袋结构体的所述第2不变量化特征量的相似度;及
化合物提取部,根据所述相似度从所述多个化合物提取所述目标化合物。
49.根据权利要求47或48所述的筛选装置,其中,
所述化合物提取部提取所述相似度为阈值以上的化合物。
50.根据权利要求47至49中任一项所述的筛选装置,其中,
所述化合物提取部以所述相似度高到低的顺序提取化合物。
51.一种筛选装置,从多个化合物提取与除了蛋白质以外的目标生物高分子键合的目标化合物,所述筛选装置具有:
存储部,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求8所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第3特征量建立关联并进行存储;
特征量计算部,针对作为确认到与除了所述蛋白质以外的所述目标生物高分子的键合的化合物的键合化合物计算出所述第3特征量;
相似度计算部,计算出针对所述多个化合物的所述第3特征量与针对键合化合物的所述第3特征量的相似度;及
化合物提取部,根据所述相似度从所述多个化合物提取所述目标化合物。
52.一种筛选装置,从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选装置具有:
存储部,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求11所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第4特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物计算出所述第4特征量;
相似度计算部,计算出针对所述多个化合物的所述第4特征量与针对所述键合化合物的所述第4特征量的相似度;及
化合物提取部,根据所述相似度从所述多个化合物提取所述目标化合物。
53.一种筛选装置,从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选装置具有:
存储部,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求14所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第5特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物计算出所述第5特征量;
相似度计算部,计算出针对所述多个化合物的所述第5特征量与针对所述键合化合物的所述第5特征量的相似度;及
化合物提取部,根据所述相似度从所述多个化合物提取所述目标化合物。
54.一种筛选装置,从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选装置具有:
存储部,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求17所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第6特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物计算出所述第6特征量;
相似度计算部,计算出针对所述多个化合物的所述第6特征量与针对所述键合化合物的所述第6特征量的相似度;及
化合物提取部,根据所述相似度从所述多个化合物提取所述目标化合物。
55.一种筛选装置,从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选装置具有:
存储部,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求20所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第7特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物计算出所述第7特征量;
相似度计算部,计算出针对所述多个化合物的所述第7特征量与针对所述键合化合物的所述第7特征量的相似度;及
化合物提取部,根据所述相似度从所述多个化合物提取所述目标化合物。
56.一种筛选装置,从多个化合物提取与目标生物高分子键合的目标化合物,所述筛选装置具有:
存储部,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求23所述的特征量计算方法计算出的针对所述化合物的所述立体结构的所述第8特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物计算出所述第8特征量;
相似度计算部,计算出针对所述多个化合物的所述第8特征量与针对所述键合化合物的所述第8特征量的相似度;及
化合物提取部,根据所述相似度从所述多个化合物提取所述目标化合物。
57.一种化合物创建方法,从多个化合物创建出与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:
存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第1特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标蛋白质的键合的化合物的配体,使用权利要求2所述的特征量计算方法计算出所述第1特征量;
生成器构建工序,通过将所述多个化合物的所述立体结构设为教师数据且将所述第1特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成工序,使用所述生成器从所述配体的所述第1特征量生成所述目标化合物的立体结构。
58.一种化合物创建方法,从多个化合物创建出与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:
存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求3所述的特征量计算方法计算出的所述第1不变量化特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标蛋白质的键合的化合物的配体计算出所述第1不变量化特征量;
生成器构建工序,通过将所述多个化合物的所述立体结构设为教师数据且将所述第1不变量化特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成工序,使用所述生成器从所述配体的所述第1不变量化特征量生成所述目标化合物的立体结构。
59.一种化合物创建方法,从多个化合物创建出与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:
存储工序,针对所述多个化合物的每一个,将使用权利要求2所述的特征量计算方法计算出的所述第1特征量建立关联并进行存储;
特征量计算工序,针对所述目标蛋白质的所述口袋结构体,使用权利要求5所述的特征量计算方法计算出所述第2特征量;
生成器构建工序,通过将所述多个化合物的立体结构设为教师数据且将所述第1特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成工序,使用所述生成器从所述口袋结构体的所述第2特征量生成所述目标化合物的立体结构。
60.一种化合物创建方法,从多个化合物创建出与目标蛋白质键合的目标化合物的立体结构,所述化合物创建方法具有:
存储工序,针对所述多个化合物的每一个,将使用权利要求3所述的特征量计算方法计算出的所述第1不变量化特征量建立关联并进行存储;
特征量计算工序,针对所述目标蛋白质的所述口袋结构体,使用权利要求6所述的特征量计算方法计算出所述第2不变量化特征量;
生成器构建工序,通过将所述多个化合物的立体结构设为教师数据且将所述第1不变量化特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成工序,使用所述生成器从所述口袋结构体的所述第2不变量化特征量生成所述目标化合物的立体结构。
61.一种化合物创建方法,从多个化合物创建出与除了蛋白质以外的目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:
存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第3特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与除了所述蛋白质以外的所述目标生物高分子的键合的化合物的键合化合物,使用权利要求8所述的特征量计算方法计算出所述第3特征量;
生成器构建工序,通过将所述多个化合物的所述立体结构设为教师数据且将所述第3特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成工序,使用所述生成器从所述键合化合物的所述第3特征量生成所述目标化合物的立体结构。
62.一种化合物创建方法,从多个化合物创建出与目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:
存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第4特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物,使用权利要求11所述的特征量计算方法计算出所述第4特征量;
生成器构建工序,通过将所述多个化合物的所述立体结构设为教师数据且将所述第4特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成工序,使用所述生成器从所述键合化合物的所述第4特征量生成所述目标化合物的立体结构。
63.一种化合物创建方法,从多个化合物创建出与目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:
存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第5特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物,使用权利要求14所述的特征量计算方法计算出所述第5特征量;
生成器构建工序,通过将所述多个化合物的所述立体结构设为教师数据且将所述第5特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成工序,使用所述生成器从所述键合化合物的所述第5特征量生成所述目标化合物的立体结构。
64.一种化合物创建方法,从多个化合物创建出与目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:
存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第6特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物,使用权利要求17所述的特征量计算方法计算出所述第6特征量;
生成器构建工序,通过将所述多个化合物的所述立体结构设为教师数据且将所述第6特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成工序,使用所述生成器从所述键合化合物的所述第6特征量生成所述目标化合物的立体结构。
65.一种化合物创建方法,从多个化合物创建出与目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:
存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第7特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物,使用权利要求20所述的特征量计算方法计算出所述第7特征量;
生成器构建工序,通过将所述多个化合物的所述立体结构设为教师数据且将所述第7特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成工序,使用所述生成器从所述键合化合物的所述第7特征量生成所述目标化合物的立体结构。
66.一种化合物创建方法,从多个化合物创建出与目标生物高分子键合的目标化合物的立体结构,所述化合物创建方法具有:
存储工序,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第8特征量建立关联并进行存储;
特征量计算工序,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物,使用权利要求23所述的特征量计算方法计算出所述第8特征量;
生成器构建工序,通过将所述多个化合物的所述立体结构设为教师数据且将所述第8特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成工序,使用所述生成器从所述键合化合物的所述第8特征量生成所述目标化合物的立体结构。
67.一种化合物创建程序,使计算机执行权利要求57至66中任一项所述的化合物创建方法。
68.一种化合物创建装置,从多个化合物创建出与目标蛋白质键合的目标化合物的立体结构,所述化合物创建装置具有:
存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第1特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标蛋白质的键合的化合物的配体,使用权利要求2所述的特征量计算方法计算出所述第1特征量;
生成器构建部,通过将所述多个化合物的所述立体结构设为教师数据且将所述第1特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成部,使用所述生成器并从所述配体的所述第1特征量生成所述目标化合物的立体结构。
69.一种化合物创建装置,从多个化合物创建出与目标蛋白质键合的目标化合物的立体结构,所述化合物创建装置具有:
存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求3所述的特征量计算方法计算出的所述第1不变量化特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标蛋白质的键合的化合物的配体计算出所述第1不变量化特征量;
生成器构建部,通过将所述多个化合物的所述立体结构设为教师数据且将所述第1不变量化特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成部,使用所述生成器并从所述配体的所述第1不变量化特征量生成所述目标化合物的立体结构。
70.一种化合物创建装置,从多个化合物创建出与目标蛋白质键合的目标化合物的立体结构,所述化合物创建装置具有:
存储部,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求2所述的特征量计算方法计算出的所述第1特征量建立关联并进行存储;
特征量计算部,针对所述目标蛋白质的所述口袋结构体,使用权利要求5所述的特征量计算方法计算出所述第2特征量;
生成器构建部,通过将所述多个化合物的立体结构设为教师数据且将所述第1特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成部,使用所述生成器并从所述口袋结构体的所述第2特征量生成所述目标化合物的立体结构。
71.一种化合物创建装置,从多个化合物创建出与目标蛋白质键合的目标化合物的立体结构,所述化合物创建装置具有:
存储部,针对所述多个化合物的每一个,将基于多个原子的化合物的立体结构与使用权利要求3所述的特征量计算方法计算出的所述第1不变量化特征量建立关联并进行存储;
特征量计算部,针对所述目标蛋白质的所述口袋结构体,使用权利要求6所述的特征量计算方法计算出所述第2不变量化特征量;
生成器构建部,通过将所述多个化合物的立体结构设为教师数据且将所述第1不变量化特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成部,使用所述生成器并从所述口袋结构体的所述第2不变量化特征量生成所述目标化合物的立体结构。
72.一种化合物创建装置,从多个化合物创建出与除了蛋白质以外的目标生物高分子键合的目标化合物的立体结构,所述化合物创建装置具备:
存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第3特征量建立关联并进行存储;
特征量计算部,针对作为确认到与除了所述蛋白质以外的所述目标生物高分子的键合的化合物的键合化合物,使用权利要求8所述的特征量计算方法计算出所述第3特征量;
生成器构建部,通过将所述多个化合物的所述立体结构设为教师数据且将所述第3特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成部,使用所述生成器并从所述键合化合物的所述第3特征量生成所述目标化合物的立体结构。
73.一种化合物创建装置,从多个化合物创建出与目标生物高分子键合的目标化合物的立体结构,所述化合物创建装置具备:
存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第4特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物,使用权利要求11所述的特征量计算方法计算出所述第4特征量;
生成器构建部,通过将所述多个化合物的所述立体结构设为教师数据且将所述第4特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成部,使用所述生成器并从所述键合化合物的所述第4特征量生成所述目标化合物的立体结构。
74.一种化合物创建装置,从多个化合物创建出与目标生物高分子键合的目标化合物的立体结构,所述化合物创建装置具备:
存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第5特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物,使用权利要求14所述的特征量计算方法计算出所述第5特征量;
生成器构建部,通过将所述多个化合物的所述立体结构设为教师数据且将所述第5特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成部,使用所述生成器并从所述键合化合物的所述第5特征量生成所述目标化合物的立体结构。
75.一种化合物创建装置,从多个化合物创建出与目标生物高分子键合的目标化合物的立体结构,所述化合物创建装置具备:
存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第6特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物,使用权利要求17所述的特征量计算方法计算出所述第6特征量;
生成器构建部,通过将所述多个化合物的所述立体结构设为教师数据且将所述第6特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成部,使用所述生成器并从所述键合化合物的所述第6特征量生成所述目标化合物的立体结构。
76.一种化合物创建装置,从多个化合物创建出与目标生物高分子键合的目标化合物的立体结构,所述化合物创建装置具备:
存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第7特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物,使用权利要求20所述的特征量计算方法计算出所述第7特征量;
生成器构建部,通过将所述多个化合物的所述立体结构设为教师数据且将所述第7特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成部,使用所述生成器并从所述键合化合物的所述第7特征量生成所述目标化合物的立体结构。
77.一种化合物创建装置,从多个化合物创建出与目标生物高分子键合的目标化合物的立体结构,所述化合物创建装置具备:
存储部,针对多个化合物的每一个,将基于多个原子的化合物的立体结构与所述第8特征量建立关联并进行存储;
特征量计算部,针对作为确认到与所述目标生物高分子的键合的化合物的键合化合物,使用权利要求23所述的特征量计算方法计算出所述第8特征量;
生成器构建部,通过将所述多个化合物的所述立体结构设为教师数据且将所述第8特征量设为解释变量的机器学习来构建生成器;及
化合物立体结构生成部,使用所述生成器并从所述键合化合物的所述第8特征量生成所述目标化合物的立体结构。
78.一种非临时性并且计算机能够读取的记录介质,存储有权利要求26所述的特征量计算程序。
79.一种非临时性并且计算机能够读取的记录介质,存储有权利要求42所述的筛选程序。
80.一种非临时性并且计算机能够读取的记录介质,存储有权利要求67所述的化合物创建程序。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2017201025 | 2017-10-17 | ||
JP2017-201025 | 2017-10-17 | ||
JP2018-058849 | 2018-03-26 | ||
JP2018058849 | 2018-03-26 | ||
PCT/JP2018/037051 WO2019078006A1 (ja) | 2017-10-17 | 2018-10-03 | 特徴量算出方法、特徴量算出プログラム、及び特徴量算出装置、スクリーニング方法、スクリーニングプログラム、及びスクリーニング装置、化合物創出方法、化合物創出プログラム、及び化合物創出装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111279419A true CN111279419A (zh) | 2020-06-12 |
CN111279419B CN111279419B (zh) | 2023-10-10 |
Family
ID=66173566
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880067748.XA Active CN111279419B (zh) | 2017-10-17 | 2018-10-03 | 特征量计算方法、筛选方法、以及化合物创建方法 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20200243166A1 (zh) |
EP (1) | EP3699916A4 (zh) |
JP (2) | JP6826672B2 (zh) |
CN (1) | CN111279419B (zh) |
IL (1) | IL273808A (zh) |
WO (1) | WO2019078006A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022077258A1 (zh) * | 2020-10-14 | 2022-04-21 | 深圳晶泰科技有限公司 | 基于机器学习的自由能微扰网络设计方法 |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3957989A4 (en) * | 2019-04-16 | 2022-10-12 | FUJIFILM Corporation | PROPERTY VALUE CALCULATION METHOD, PROPERTY VALUE CALCULATION PROGRAM, CHARACTERISTIC VALUE CALCULATION DEVICE, SCREENING METHOD, SCREENING PROGRAM AND METHOD OF CREATING A COMPOUND |
CN116157680A (zh) * | 2020-09-30 | 2023-05-23 | 富士胶片株式会社 | 特征量计算方法、筛选方法及化合物创建方法 |
JP7314963B2 (ja) * | 2021-03-08 | 2023-07-26 | 株式会社豊田中央研究所 | 結晶構造探索装置及び結晶構造探索方法 |
CN113247720A (zh) * | 2021-06-02 | 2021-08-13 | 浙江新再灵科技股份有限公司 | 基于视频的智能梯控方法及系统 |
JP7190147B1 (ja) | 2022-02-02 | 2022-12-15 | 株式会社アストライアーソフトウエア | 3次元形状記述子抽出器の製造方法、3次元形状検索方法及び3次元形状検索システム |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004287812A (ja) * | 2003-03-20 | 2004-10-14 | Japan Research Institute Ltd | 物性値算出方法、物性値算出装置、画像作成装置、コンピュータプログラム及び記録媒体 |
JPWO2005103994A1 (ja) * | 2004-04-23 | 2008-03-13 | キッセイ薬品工業株式会社 | リガンド分子の形状作成方法および装置 |
CN101344902A (zh) * | 2008-07-15 | 2009-01-14 | 北京科技大学 | 一种基于关联分析与关联分类的蛋白质二级结构预测技术 |
CN102930181A (zh) * | 2012-11-07 | 2013-02-13 | 四川大学 | 基于分子描述符的蛋白质-配体亲和力预测方法 |
WO2015168774A1 (en) * | 2014-05-05 | 2015-11-12 | Chematria Inc. | Binding affinity prediction system and method |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5946045B2 (ja) | 1976-08-10 | 1984-11-10 | ソニー株式会社 | 磁気再生装置 |
JP2002228656A (ja) | 2000-11-28 | 2002-08-14 | Matsushita Electric Ind Co Ltd | ポテンシャル尤度プロファイルの作成方法、タンパク質立体構造予測方法およびその装置、タンパク質のアミノ酸配列の設計方法およびその装置、プログラム並びに記憶媒体 |
JP4231922B2 (ja) | 2002-12-26 | 2009-03-04 | 独立行政法人産業技術総合研究所 | タンパク質立体構造予測システム |
JP2005049188A (ja) | 2003-07-28 | 2005-02-24 | Matsushita Electric Ind Co Ltd | タンパク質設計法 |
JP5142179B2 (ja) * | 2006-04-28 | 2013-02-13 | 一徳 辻 | 生体高分子における相互作用部位の予測方法 |
US8050599B2 (en) | 2007-09-04 | 2011-11-01 | Kabushiki Kaisha Toshiba | Toner cartridge and image forming apparatus having toner cartridge |
EP2216429A4 (en) | 2007-11-12 | 2011-06-15 | In Silico Sciences Inc | SILICO SCREENING SYSTEM AND SILICO SCREENING METHOD |
GB0916646D0 (en) * | 2009-09-23 | 2009-11-04 | Angeletti P Ist Richerche Bio | New method of calculating areas |
US9373059B1 (en) | 2014-05-05 | 2016-06-21 | Atomwise Inc. | Systems and methods for applying a convolutional network to spatial data |
-
2018
- 2018-10-03 CN CN201880067748.XA patent/CN111279419B/zh active Active
- 2018-10-03 EP EP18868536.6A patent/EP3699916A4/en active Pending
- 2018-10-03 WO PCT/JP2018/037051 patent/WO2019078006A1/ja active Search and Examination
- 2018-10-03 JP JP2019549195A patent/JP6826672B2/ja active Active
-
2020
- 2020-04-05 IL IL273808A patent/IL273808A/en unknown
- 2020-04-16 US US16/850,838 patent/US20200243166A1/en active Pending
-
2021
- 2021-01-15 JP JP2021004840A patent/JP7209751B2/ja active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004287812A (ja) * | 2003-03-20 | 2004-10-14 | Japan Research Institute Ltd | 物性値算出方法、物性値算出装置、画像作成装置、コンピュータプログラム及び記録媒体 |
JPWO2005103994A1 (ja) * | 2004-04-23 | 2008-03-13 | キッセイ薬品工業株式会社 | リガンド分子の形状作成方法および装置 |
CN101344902A (zh) * | 2008-07-15 | 2009-01-14 | 北京科技大学 | 一种基于关联分析与关联分类的蛋白质二级结构预测技术 |
CN102930181A (zh) * | 2012-11-07 | 2013-02-13 | 四川大学 | 基于分子描述符的蛋白质-配体亲和力预测方法 |
WO2015168774A1 (en) * | 2014-05-05 | 2015-11-12 | Chematria Inc. | Binding affinity prediction system and method |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022077258A1 (zh) * | 2020-10-14 | 2022-04-21 | 深圳晶泰科技有限公司 | 基于机器学习的自由能微扰网络设计方法 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2019078006A1 (ja) | 2020-09-10 |
JP7209751B2 (ja) | 2023-01-20 |
US20200243166A1 (en) | 2020-07-30 |
EP3699916A1 (en) | 2020-08-26 |
IL273808A (en) | 2020-05-31 |
EP3699916A4 (en) | 2020-11-04 |
CN111279419B (zh) | 2023-10-10 |
WO2019078006A1 (ja) | 2019-04-25 |
JP6826672B2 (ja) | 2021-02-10 |
JP2021073575A (ja) | 2021-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111279419A (zh) | 特征量计算方法、特征量计算程序及特征量计算装置、筛选方法、筛选程序及筛选装置、化合物创建方法、化合物创建程序及化合物创建装置 | |
Mylonas et al. | DeepSurf: a surface-based deep learning approach for the prediction of ligand binding sites on proteins | |
Wang et al. | Analysis of deep learning methods for blind protein contact prediction in CASP12 | |
Ballester et al. | Ultrafast shape recognition: evaluating a new ligand-based virtual screening technology | |
Ballester et al. | Ultrafast shape recognition to search compound databases for similar molecular shapes | |
WO2017196963A1 (en) | Computational method for classifying and predicting protein side chain conformations | |
Thalassinos et al. | Conformational States of macromolecular assemblies explored by integrative structure calculation | |
Melquiond et al. | Next challenges in protein–protein docking: from proteome to interactome and beyond | |
Nazem et al. | 3D U-Net: A voxel-based method in binding site prediction of protein structure | |
Ding et al. | Identification of protein-nucleotide binding residues via graph regularized k-local hyperplane distance nearest neighbor model | |
Ikebe et al. | Ab initio simulation of a 57‐residue protein in explicit solvent reproduces the native conformation in the lowest free‐energy cluster | |
US20220068441A1 (en) | Feature quantity calculating method, feature quantity calculating program, and feature quantity calculating device, screening method, screening program, and screening device, compound creating method, compound creating program, and compound creating device | |
US20230238084A1 (en) | Feature quantity calculating method, screening method, and compound creating method | |
Yue et al. | A systematic review on the state-of-the-art strategies for protein representation | |
Ghanbarpour et al. | On-the-fly prediction of protein hydration densities and free energies using deep learning | |
Sánchez‐González et al. | A beta‐complex statistical four body contact potential combined with a hydrogen bond statistical potential recognizes the correct native structure from protein decoy sets | |
CN113711035A (zh) | 特征量计算方法、特征量计算程序、特征量计算装置、筛选方法、筛选程序及化合物创建方法 | |
Tiwari et al. | Searching for 3D structural models from a library of biological shapes using a few 2D experimental images | |
Abbasi et al. | COYOTE: Sequence-derived structural descriptors-based computational identification of glycoproteins | |
Andreopoulos et al. | Triangle network motifs predict complexes by complementing high-error interactomes with structural information | |
Cipriano et al. | Local functional descriptors for surface comparison based binding prediction | |
CN118692592A (zh) | 一种基于超算的高精度ai药物虚拟筛选方法 | |
Tan et al. | Topology-enhanced machine learning model (Top-ML) for anticancer peptide prediction | |
Giannopoulou et al. | Data Mining Applications in the Post-Genomic Era | |
Nakamura et al. | Improvement of Pseudo-molecule Generation on Solvent Dipole Ordering Virtual Screening (SDO-VS) |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |