CN109637595B - 一种药物重定位方法、装置、电子设备及存储介质 - Google Patents
一种药物重定位方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN109637595B CN109637595B CN201811521644.XA CN201811521644A CN109637595B CN 109637595 B CN109637595 B CN 109637595B CN 201811521644 A CN201811521644 A CN 201811521644A CN 109637595 B CN109637595 B CN 109637595B
- Authority
- CN
- China
- Prior art keywords
- drug
- similarity
- medicine
- relocation
- similarity network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明涉及一种药物重定位方法、装置、电子设备及存储介质,属于生物信息学技术领域。该药物重定位方法,包括:获取不同维度下的药物相似度网络;通过相似性网络融合算法将不同维度下的药物相似度网络融合成一个目标药物相似度网络;通过预设规则从所述目标药物相似度网络中筛选出满足药物重定位条件的药物,作为药物重定位的候选药物。本申请实施例中,从不同维度获取药物相似度网络,并将各个维度下的药物相似度网络进行融合,再基于融合后的药物相似度网络进行药物重定位,减少了使用单一属性进行药物重定位带来的偏性,保证了药物重定位的可靠性。
Description
技术领域
本发明属于生物信息学技术领域,具体涉及一种药物重定位方法、装置、电子设备及存储介质。
背景技术
在过去的几十年中,尽管在基因组学与生命科学技术领域已经取得了较大的进展,但是创新药物的研发依然周期较长、耗资巨大,而且存在较高的风险和较低的成功率。如今在药物研发方面的投入不断增长,但是实际产出却停滞不前,因此如何有效提高药物研发的效率是制药企业所面临的挑战性问题。针对这个问题,药物重定位(Drugrepositioning or Drug repurposing)技术,即挖掘已有药物的新适应症,正在成为药物研发的重要策略。
发明内容
鉴于此,本发明实施例在于提供一种药物重定位方法、装置、电子设备及存储介质,以解决使用单一属性进行药物重定位带来的偏性。
本发明的实施例是这样实现的:
第一方面,本发明实施例提供了一种药物重定位方法,包括:获取不同维度下的药物相似度网络;通过相似性网络融合算法将不同维度下的药物相似度网络融合成一个目标药物相似度网络;通过预设规则从所述目标药物相似度网络中筛选出满足药物重定位条件的药物,作为药物重定位的候选药物。
本申请实施例中,从不同维度获取药物相似度网络,并将各个维度下的药物相似度网络进行融合,再基于融合后的药物相似度网络进行药物重定位,减少了使用单一属性进行药物重定位带来的偏性,保证了药物重定位的可靠性。
结合第一方面实施例的一种可能的实施方式,通过预设规则从所述目标药物相似度网络中筛选出满足药物重定位条件的药物,作为药物重定位的候选药物,包括:计算所述目标药物相似度网络中每两个药物之间的相似度;按照从高到低的顺序对计算结果进行排序;选取排名大于预设阈值的各个药物相似对,作为药物重定位的候选药物。本申请实施例中,通过计算目标药物相似度网络中每两个药物之间的相似度,最后筛选出目标药物相似度网络中高排名的药物-药物关联对,作为药物重定位的候选药物,因此,若两个药物相似,则他们可能具有相同的治疗属性,即一种药物的适应症可能是另一种药物的新适应症,保证了药物重定位的可靠性和可行性。
结合第一方面实施例的又一种可能的实施方式,通过预设规则从所述目标药物相似度网络中筛选出满足药物重定位条件的药物,作为药物重定位的候选药物,包括:通过谱聚类算法将所述目标药物相似度网络划分成多个社团;对所述多个社团中的每个社团进行富集分析,以确定每个社团的主题;从每个社团中筛选出与自身主题相异的药物,作为药物重定位的候选药物。本申请实施例中,通过将目标药物相似度网络划分成多个社团,然后再利用富集分析确定每个社团的主题,最后再从每个社团中筛选出与自身主题相异的药物作为药物重定位的候选药物,保证了药物重定位的可靠性和可行性。
结合第一方面实施例的又一种可能的实施方式,所述富集分析,包括:对药物类别的富集分析、对靶标类别的富集分析和/或对药物注释的富集分析。
结合第一方面实施例的又一种可能的实施方式,获取不同维度下的药物相似度网络,包括:获取以下任意两种或两种以上维度下的药物相似度网络,其中,第一种维度为:基于药物副作用数据的相似度网络;第二种维度为:基于药物表达谱数据的相似度网络;第三种维度为:基于药物三维结构数据的相似度网络;第四种维度为:基于药物二维结构数据的相似度网络;第五种维度为:基于药物靶标PPI网络数据的相似度网络;第六种维度为:基于药物靶标序列数据的相似度网络。本申请实施例中,可以从上述6个维度获取药物相似度网络,避免了特征之间的差异性带来的偏性,保证了药物重定位的可靠性。
第二方面,本发明实施例还提供了一种药物重定位装置,包括:获取模块、融合模块以及筛选模块;获取模块,用于获取不同维度下的药物相似度网络;融合模块,用于通过相似性网络融合算法将不同维度下的药物相似度网络融合成一个目标药物相似度网络;筛选模块,用于通过预设规则从所述目标药物相似度网络中筛选出满足药物重定位条件的药物,作为药物重定位的候选药物。
结合第二方面实施例的一种可能的实施方式,所述筛选模块,还用于计算所述目标药物相似度网络中每两个药物之间的相似度;按照从高到低的顺序对计算结果进行排序;选取排名大于预设阈值的各个药物相似对,作为药物重定位的候选药物。
结合第二方面实施例的又一种可能的实施方式,所述筛选模块,还用于通过谱聚类算法将所述目标药物相似度网络划分成多个社团;对所述多个社团中的每个社团进行富集分析,以确定每个社团的主题;从每个社团中筛选出与自身主题相异的药物,作为药物重定位的候选药物。
结合第二方面实施例的又一种可能的实施方式,所述富集分析,包括:对药物类别的富集分析、对靶标类别的富集分析和/或对药物注释的富集分析。
结合第二方面实施例的又一种可能的实施方式,所述获取模块,还用于获取以下任意两种或两种以上维度下的药物相似度网络,其中,第一种维度为:基于药物副作用数据的相似度网络;第二种维度为:基于药物表达谱数据的相似度网络;第三种维度为:基于药物三维结构数据的相似度网络;第四种维度为:基于药物二维结构数据的相似度网络;第五种维度为:基于药物靶标PPI网络数据的相似度网络;第六种维度为:基于药物靶标序列数据的相似度网络。
第三方面,本发明实施例还提供了一种电子设备,包括:存储器和处理器,所述存储器和所述处理器连接;所述存储器用于存储程序;所述处理器用于调用存储于所述存储器中的程序,以执行第一方面实施例和/或结合第一方面实施例的任一种可能的实施方式提供的方法。
第四方面,本发明实施例还提供了一种存储介质,所述存储介质包括计算机程序,所述计算机程序被计算机运行时执行第一方面实施例和/或结合第一方面实施例的任一种可能的实施方式提供的方法。
本发明的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明实施例而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本发明的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本发明的主旨。
图1示出了本发明实施例提供的一种电子设备的结构示意图。
图2示出了本发明实施例提供的一种药物重定位方法的流程示意图。
图3示出了本发明实施例提供的图3中步骤S103在一种实施方式下的流程示意图。
图4示出了本发明实施例提供的图3中步骤S103在又一种实施方式下的流程示意图。
图5示出了本发明实施例提供的一种药物重定位装置的模块示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本发明的描述中,需要说明的是,术语“第一”、“第二”、“第三”等仅用于区分描述,而不能理解为指示或暗示相对重要性。再者,本申请中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
如图1所示,图1示出了本发明实施例提供的一种电子设备100的结构框图。所述电子设备100包括:药物重定位装置110、存储器120、存储控制器130和处理器140。
所述存储器120、存储控制器130、处理器140各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述药物重定位装置110包括至少一个可以软件或固件(firmware)的形式存储于所述存储器120中或固化在所述电子设备100的操作系统(operating system,OS)中的软件功能模块。所述处理器140用于执行存储器120中存储的可执行模块,例如所述药物重定位装置110包括的软件功能模块或计算机程序。
其中,存储器120可以是,但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。其中,存储器120用于存储程序,所述处理器140在接收到执行指令后,执行所述程序,后述本发明实施例任一实施例揭示的流程定义的电子设备100所执行的方法可以应用于处理器140中,或者由处理器140实现。
处理器140可能是一种集成电路芯片,具有信号的处理能力。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本发明实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
其中,在本发明实施例中,所述电子设备100可以是,但不限于网络服务器、数据库服务器、云端服务器等。
请参阅图2,为本发明实施例提供的一种应用于上述电子设备100的药物重定位方法,下面将结合图2对其所包含的步骤进行说明。
步骤S101:获取不同维度下的药物相似度网络。
获取不同维度下的药物相似度网络,也即从不同的维度获取药物相似度网络,例如,获取以下任意两种或两种以上维度下的药物相似度网络,
其中,第一种维度为:基于药物副作用数据的相似度网络;第二种维度为:基于药物表达谱数据的相似度网络;第三种维度为:基于药物三维结构数据的相似度网络;第四种维度为:基于药物二维结构数据的相似度网络;第五种维度为:基于药物靶标PPI网络数据的相似度网络;第六种维度为:基于药物靶标序列数据的相似度网络。
其中,基于药物副作用数据的相似度网络的获取过程为:通过SIDER数据库获取药物副作用数据,该数据包含了1430种药物和5868种化合物之间139756条关联关系。由于数据库收集过程中可能存在观察或记录偏差,本申请只研究其中带有频率信息且发生频率大于0.1%的副作用数据。这样,每个药物d1都由一个具有2072维副作用特征向量E(d)所表示。然后,利用Tanimoto系数计算药物d1和d2之间基于副作用的相似性,计算公式如下:
其中,|E(d1)|和|E(d2)|分别表示药物d1和药物d2的副作用数量。E(d1)*E(d2)表示药物d1和药物d2共有的副作用数量。
基于药物表达谱数据的相似度网络的获取过程为:从LINCSL1000项目获取药物表达谱数据。在获得了根据基因差异表达排序的基因列表后,将对应于相同药物的所有基因排序列表合并,这样就得到了每种药物的基因的原型秩序列(Prototype Ranked List,PRL)。然后选择PRL排名最高的250个基因和排名最低的250个基因作为印记基因集。药物d相对于d′的PRL有一个富集分数计算如下:
ESup和ESdown是药物d的印记基因集(分别是上调基因和下调基因)相对于d′的PRL的富集分数。其中,可以使用基因集富集分析(GSEA)计算富集分数。然后就可以计算两种药物d和d′之间的表达谱的相似性,计算公式如下:
基于药物三维结构数据的相似度网络的获取过程为:提取每种药物的48个3D结构描述符,其中,这些描述符是根据Spectrophore进行计算的。Spectrophore是一种可以编码分子三维结构的分子指纹。通过计算3D结构描述符的Pearson相关系数作为药物d和d′之间的3D结构相似性。
基于药物二维结构数据的相似度网络的获取过程为:通过PubChem数据库获取药物的二维结构数据,利用R语言包ChemmineR计算药物的原子对描述符。原子对描述符用于定量描述小分子化合物的化学结构。而后,利用Tanimoto系数计算药物d1和d2之间基于化学结构的相似性,计算公式如下:
其中,|C(d1)|和|C(d2)|分别表示药物d1和药物d2的原子对描述符数量,C(d1)*C(d2)表示药物d1和药物d2共有的原子对描述符数量。
基于药物靶标PPI网络(protein-protein interaction network)数据的相似度网络的获取过程为:使用Dijkstra算法计算PPI网络中药物靶标对的最短路径D(t,t′),然后计算药靶t和t′之间的基于PPI网络的相似性,计算公式如下:
其中,D(t,t′)表示t和t′之间的距离。然后计算药物d和d′之间的基于PPI网络的相似性,计算公式如下:
其中,P(d)代表药物d的靶标集合,Pi(d)是药物d的第i个靶标,|P(d)|是药物d的靶标集合的大小。其中,PPI网络提取自[Menche J,Sharma A,Kitsak M,Ghiassian SD,Vidal M,Loscalzo J,et al.Uncovering disease-disease relationships throughthe incomplete interactome.Science 2015;347:1257601.]文献的数据。它整合了来自7个来源的PPI网络,包含了在13,460个蛋白质之间的141,296对关系。
其中,基于药物靶标序列数据的相似度网络的获取过程为:通过DrugBank数据库获取药物的靶标序列数据,其包含了7132种药物及其靶标的关联关系。靶蛋白的序列数据来源于UniProt数据库。利用标准化的Smith-Waterman分数计算基于药靶蛋白序列的相似性,计算公式如下:
其中,P(d1)表示药物d1的靶蛋白集合,Pi(d1)表示药物d1的第i个靶标,|P(d1)|表示药物d1的靶蛋白数量,SW(Pi(d1),Pi(d2))表示药物d1和药物d2之间的Smith-Waterman序列比对分数。
其中,获取不同维度下的药物相似度网络,可以是获取上述6种维度中的任意两种或两者以上维度下的药物相似度网络,如获取基于药物表达谱数据的相似度网络以及基于药物三维结构数据的相似度网络等,其余情况不在累赘。
步骤S102:通过相似性网络融合算法将不同维度下的药物相似度网络融合成一个目标药物相似度网络。
从不同维度获取到药物相似度网络后,通过相似性网络融合算法将不同维度下的药物相似度网络融合成一个目标药物相似度网络,例如,将上述六个单一属性的药物相似性网络融合成一个药物相似性网络。其中,为了研究哪种类型的数据对融合网络比较重要,还可以评估不同维度的数据对融合网络的贡献度。例如,二维结构数据的贡献度是30%,其他数据的贡献度都不到20%,则认为二维结构数据是比较重要的数据。
步骤S103:通过预设规则从所述目标药物相似度网络中筛选出满足药物重定位条件的药物,作为药物重定位的候选药物。
在得到融合网络也即目标药物相似度网络后,通过预设规则从所述目标药物相似度网络中筛选出满足药物重定位条件的药物,作为药物重定位的候选药物。
作为一种可选的实施方式,可以参阅图3所示的流程图对这一过程(步骤S103)进行说明。其中,图3包括步骤S201-S203。
步骤S201:计算所述目标药物相似度网络中每两个药物之间的相似度。
在得到目标药物相似度网络后,计算该目标药物相似度网络中每两个药物之间的相似度,为了便于理解,以包括5个药物(真实情况远大于5个药物)如A、B、C、D、E为例进行说明,则上述过程为,计算A与B的相似度,计算A与C的相似度,计算A与D的相似度,计算A与E的相似度,计算B与C的相似度,计算B与D的相似度,计算B与E的相似度,计算C与D的相似度,计算C与E的相似度,计算D与E的相似度,其中,重复的不再计算,如B与A的相似度、D与A的相似度等。
步骤S202:按照从高到低的顺序对计算结果进行排序。
在计算出各个药物对的相似度后,按照从高到低的顺序对计算结果进行排序。
步骤S203:选取排名大于预设阈值的各个药物相似对,作为药物重定位的候选药物。
排序完成后,根据排序结果,选取排名大于预设阈值的各个药物相似对,作为药物重定位的候选药物。例如,选取相似性分数排名前100的药物相似对,作为药物重定位的候选药物。若两个药物相似,则他们可能具有相同的治疗属性,即一种药物的适应症可能是另一种药物的新适应症。
其中,预设阈值为事先设定,根据药物重定位的研究范畴而不同,例如,在研究癌症方面的药物重定位的阈值与研究感冒方面的药物重定位的阈值。
作为另一种可选的实施方式,可以参阅图4所示的流程图对这一过程(步骤S103)进行说明。其中,图4包括步骤S301-S303。
步骤S301:通过谱聚类算法将所述目标药物相似度网络划分成多个社团。
在得到目标药物相似度网络后,通过谱聚类算法将所述目标药物相似度网络划分成多个社团。其中,每个社团内部的药物关联很强,社团之间的药物关联很弱。可以通过聚类有效性指标来确定要划分的社团个数,如根据轮廓系数,Dunn系数等指标。例如,先根据轮廓系数和Dunn系数确定应该把融合网络划分为32个社团,然后再使用谱聚类算法把融合网络划分为32个社团。
步骤S302:对所述多个社团中的每个社团进行富集分析,以确定每个社团的主题。
在将所述目标药物相似度网络划分成多个社团后,对所述多个社团中的每个社团进行富集分析,以确定每个社团的主题。其中,可以是对药物类别的富集分析、对靶标类别(包括靶标类别、KEGG和GO(Geneontology))的富集分析和/或对药物注释(其中,包括对药物的物化性质、化学基因组学和化学本体论等方面的注释)的富集分析。例如,若对社团28中的药物类别进行富集分析,可以得到社团28是神经系统类的药物。对靶标类别的富集分析,可以得到社团28的靶标类别主要是G蛋白偶联受体,对KEGG的富集分析,可以得到社团28的靶标主要集中在神经系统相关的通路上,对GO的富集分析可以得到社团28的靶标主要集中在神经系统相关的生物过程上。此外,通过分析药物的物化性质、化学基因组学和化学本体论等方面的注释也可以对社团28中的药物性质有一个全面的了解。
步骤S303:从每个社团中筛选出与自身主题相异的药物,作为药物重定位的候选药物。
在确定了每个社团的主题后,从每个社团中筛选出与自身主题相异的药物,作为药物重定位的候选药物。例如,通过步骤S202已经知道了社团28中大部分药物都是神经系统类的药物,但有一个特例,例如药物A不是神经系统类的药物,但它也在这个社团中,则可以认为药物A可能具有治疗神经系统类疾病的效果,从而找到药物A的新适应症,实现药物重定位,此时,就将药物A从这个社团中筛选出来,作为药物重定位的候选药物。此外,通过前面细致的富集分析也可以了解药物A为何被划分在这个社团中,它是通过怎样的机制影响神经系统的。
其中,在对各个社团进行富集分析时,可以是采用上述几种方式中的任一种或组合。其中,在对同一个融合网络中的各个社团进行富集分析时,所采用的标准应该一致,以较少不同标准带来的重定位误差。
本申请实施例还提供了一种药物重定位装置110,如图5所示。该药物重定位装置110包括:获取模块111、融合模块112以及筛选模块113。
获取模块111,用于获取不同维度下的药物相似度网络。
融合模块112,用于通过相似性网络融合算法将不同维度下的药物相似度网络融合成一个目标药物相似度网络。
筛选模块113,用于通过预设规则从所述目标药物相似度网络中筛选出满足药物重定位条件的药物,作为药物重定位的候选药物。
本申请实施例还提供了一种存储介质,所述存储介质包括计算机程序,所述计算机程序被计算机运行时执行上述的药物重定位方法。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本发明实施例所提供的药物重定位装置110,其实现原理及产生的技术效果和前述方法实施例相同,为简要描述,装置实施例部分未提及之处,可参考前述方法实施例中相应内容。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,笔记本电脑,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种药物重定位方法,其特征在于,包括:
获取不同维度下的药物相似度网络;
通过相似性网络融合算法将不同维度下的药物相似度网络融合成一个目标药物相似度网络;
通过预设规则从所述目标药物相似度网络中筛选出满足药物重定位条件的药物,作为药物重定位的候选药物,其中,通过预设规则从所述目标药物相似度网络中筛选出满足药物重定位条件的药物,作为药物重定位的候选药物,包括:
通过谱聚类算法将所述目标药物相似度网络划分成多个社团,其中,每个社团内部的药物关联强,社团之间的药物关联弱;
对所述多个社团中的每个社团进行富集分析,以确定每个社团的主题;
从每个社团中筛选出与自身主题相异的药物,作为药物重定位的候选药物。
2.根据权利要求1所述的方法,其特征在于,所述富集分析,包括:对药物类别的富集分析、对靶标类别的富集分析和/或对药物注释的富集分析。
3.根据权利要求1或2所述的方法,其特征在于,获取不同维度下的药物相似度网络,包括:
获取以下任意两种或两种以上维度下的药物相似度网络,
其中,第一种维度为:基于药物副作用数据的相似度网络;
第二种维度为:基于药物表达谱数据的相似度网络;
第三种维度为:基于药物三维结构数据的相似度网络;
第四种维度为:基于药物二维结构数据的相似度网络;
第五种维度为:基于药物靶标PPI网络数据的相似度网络;
第六种维度为:基于药物靶标序列数据的相似度网络。
4.一种药物重定位装置,其特征在于,包括:
获取模块,用于获取不同维度下的药物相似度网络;
融合模块,用于通过相似性网络融合算法将不同维度下的药物相似度网络融合成一个目标药物相似度网络;
筛选模块,用于通过预设规则从所述目标药物相似度网络中筛选出满足药物重定位条件的药物,作为药物重定位的候选药物,其中,所述筛选模块,还用于通过谱聚类算法将所述目标药物相似度网络划分成多个社团,其中,每个社团内部的药物关联强,社团之间的药物关联弱;对所述多个社团中的每个社团进行富集分析,以确定每个社团的主题;从每个社团中筛选出与自身主题相异的药物,作为药物重定位的候选药物。
5.一种电子设备,其特征在于,包括:存储器和处理器,所述存储器和所述处理器连接;
所述存储器用于存储程序;
所述处理器用于调用存储于所述存储器中的程序,以执行如权利要求1或2所述的方法。
6.一种存储介质,其特征在于,所述存储介质包括计算机程序,所述计算机程序被计算机运行时执行如权利要求1或2所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811521644.XA CN109637595B (zh) | 2018-12-12 | 2018-12-12 | 一种药物重定位方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811521644.XA CN109637595B (zh) | 2018-12-12 | 2018-12-12 | 一种药物重定位方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109637595A CN109637595A (zh) | 2019-04-16 |
CN109637595B true CN109637595B (zh) | 2020-04-10 |
Family
ID=66073384
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811521644.XA Active CN109637595B (zh) | 2018-12-12 | 2018-12-12 | 一种药物重定位方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109637595B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110289055B (zh) * | 2019-06-25 | 2021-09-07 | 中国人民解放军军事科学院军事医学研究院 | 药物靶标的预测方法、装置、计算机设备和存储介质 |
CN111191014A (zh) * | 2019-12-26 | 2020-05-22 | 上海科技发展有限公司 | 药品重定位方法、系统、终端以及介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107506591A (zh) * | 2017-08-28 | 2017-12-22 | 中南大学 | 一种基于多元信息融合和随机游走模型的药物重定位方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104965998B (zh) * | 2015-05-29 | 2017-09-15 | 华中农业大学 | 多靶标药物和/或药物组合的筛选方法 |
CN105653846B (zh) * | 2015-12-25 | 2018-08-31 | 中南大学 | 基于集成的相似性度量和双向随机游走的药物重定位方法 |
CN107292130B (zh) * | 2017-06-09 | 2019-11-26 | 西安电子科技大学 | 基于基因突变与基因表达的药物重定位方法 |
CN107194203A (zh) * | 2017-06-09 | 2017-09-22 | 西安电子科技大学 | 基于miRNA数据和组织特异性网络的药物重定位方法 |
CN107464035A (zh) * | 2017-06-30 | 2017-12-12 | 亳州中药材商品交易中心有限公司 | 中药材质量评定方法及系统 |
CN107451423B (zh) * | 2017-09-29 | 2019-09-06 | 武汉百药联科科技有限公司 | 一种基于热扩散网络的药物发现方法及其应用 |
CN108647489B (zh) * | 2018-05-15 | 2020-06-30 | 华中农业大学 | 一种筛选疾病药物靶标和靶标组合的方法及系统 |
CN108921905A (zh) * | 2018-07-16 | 2018-11-30 | 意力(广州)电子科技有限公司 | 靶标定位方法、装置、计算机设备和可读存储介质 |
-
2018
- 2018-12-12 CN CN201811521644.XA patent/CN109637595B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107506591A (zh) * | 2017-08-28 | 2017-12-22 | 中南大学 | 一种基于多元信息融合和随机游走模型的药物重定位方法 |
Non-Patent Citations (1)
Title |
---|
基于近邻传播的时间序列基因表达谱聚类算法;周运等;《河南师范大学学报(自然科学版)》;20151130;第43卷(第6期);前言、正文第4-5节 * |
Also Published As
Publication number | Publication date |
---|---|
CN109637595A (zh) | 2019-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Xue et al. | Review of drug repositioning approaches and resources | |
Rohani et al. | Drug-drug interaction predicting by neural network using integrated similarity | |
Feng et al. | DPDDI: a deep predictor for drug-drug interactions | |
Sridhar et al. | A probabilistic approach for collective similarity-based drug–drug interaction prediction | |
Masoudi-Sobhanzadeh et al. | Trader as a new optimization algorithm predicts drug-target interactions efficiently | |
Orozco-Arias et al. | Measuring performance metrics of machine learning algorithms for detecting and classifying transposable elements | |
US20140067813A1 (en) | Parallelization of synthetic events with genetic surprisal data representing a genetic sequence of an organism | |
Huang et al. | Drug–drug similarity measure and its applications | |
Davazdahemami et al. | A chronological pharmacovigilance network analytics approach for predicting adverse drug events | |
Ren et al. | A biomedical knowledge graph-based method for drug–drug interactions prediction through combining local and global features with deep neural networks | |
Youngs et al. | Parametric Bayesian priors and better choice of negative examples improve protein function prediction | |
Sun et al. | Autoencoder-based drug–target interaction prediction by preserving the consistency of chemical properties and functions of drugs | |
Yu et al. | Comparison of vocabularies, representations and ranking algorithms for gene prioritization by text mining | |
Ren et al. | BioDKG–DDI: predicting drug–drug interactions based on drug knowledge graph fusing biochemical information | |
CN109637595B (zh) | 一种药物重定位方法、装置、电子设备及存储介质 | |
Cretin et al. | SWORD2: hierarchical analysis of protein 3D structures | |
Zhu et al. | A unified approach to protein domain parsing with inter-residue distance matrix | |
Bravo et al. | Combining machine learning, crowdsourcing and expert knowledge to detect chemical-induced diseases in text | |
Gori et al. | LIDeB tools: A Latin American resource of freely available, open-source cheminformatics apps | |
Jonnagaddala et al. | Mining electronic health records to guide and support clinical decision support systems | |
van den Bent et al. | The power of universal contextualized protein embeddings in cross-species protein function prediction | |
Li et al. | ACP-GBDT: An improved anticancer peptide identification method with gradient boosting decision tree | |
Cui et al. | Fingerprinting protein structures effectively and efficiently | |
Vu et al. | NetSHy: network summarization via a hybrid approach leveraging topological properties | |
Ahmad et al. | A review of genetic variant databases and machine learning tools for predicting the pathogenicity of breast cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |