CN113053540A - 一种用于中药核心药物识别的社区发现方法 - Google Patents
一种用于中药核心药物识别的社区发现方法 Download PDFInfo
- Publication number
- CN113053540A CN113053540A CN202110354293.3A CN202110354293A CN113053540A CN 113053540 A CN113053540 A CN 113053540A CN 202110354293 A CN202110354293 A CN 202110354293A CN 113053540 A CN113053540 A CN 113053540A
- Authority
- CN
- China
- Prior art keywords
- label
- node
- labels
- nodes
- updated
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Toxicology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Chemical & Material Sciences (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开一种用于中药核心药物识别的社区发现方法,应用于中药方剂核心药物研究领域,针对现有技术识别中药核心药物准确率不高的问题;本发明通过设计药物节点传播能力、吸引能力、发射能力和接收能力,细粒度地衡量药物节点重要性;并首次提出标签融合思想,融合不同ID但相似的功效标签,减少冗余标签和迭代时间,快速地获得高质量的药物社区结果,以识别准确的核心药物。
Description
技术领域
本发明属于中药方剂核心药物研究领域,特别涉及一种中药方剂核心药物识别技术。
背景技术
中药方剂讲究“君臣佐使”配伍原则,即中药方剂一般由君药、臣药、佐药、使药四个部分组成:1)君药是对主证或主病起主要治疗作用的药物,它体现了方剂的主攻方向,其药力居方中之首,是组方中不可缺少的药物;2)臣药是辅助君药加强治疗主证或主病的药物;3)佐药一为佐助药,用于治疗次要兼证,二为佐制药,用以消除或减缓君药、臣药的毒性;4)使药:一是引经药,引方中诸药直达病所的药物,二是调和药,即调和诸药的作用,使其共同发挥治病的效果。综上,一个方剂的君药和臣药是核心药物,即在方剂中经常一起搭配的治疗某种疾病的重要药物组合。但是目前大量的方剂并没有记录方剂的君臣佐使信息,因此,设计有效的核心药物发现方法,有利于中医“君臣佐使”的配伍理论的研究。
目前关于中药方剂核心药物发现的研究主要有以下三个方向:
1)基于关联规则的方法:通过关联规则挖掘药物在方剂中共同出现的规律,将共现概率高的药物组合识别为方剂的核心药物。
2)基于社区发现的方法:通过建立药物网络,采用社区发现的手段,研究网络的内在结构,发现药物社区,针对每个药物社区,识别药物节点重要性,将重要性高的药物识别为核心药物。
3)实验方法:通过分析方剂药物的主要化学成分,选择具有主要化学成分的药物为该方剂的核心药物。
上述方法为中药核心药物的研究奠定了基础,但存在如下缺点:
1)基于关联规则的方法依赖于药物出现的频次,较难发现出现次数少但疗效好的核心药物;
2)基于社区发现的方法受限于构建药物网络的方剂数据较少,不能在较小的药物网络中发现针对特定疾病的全部核心药物。目前流行的社区发现算法主要是基于标签传播的算法,其主要问题是,第一,考虑节点重要性因素单一,不能准确地体现节点的重要程度;第二,只关注节点,没有关注标签,特别是标签的相似性没有关注;
3)实验方法成本高,操作过程复杂。
发明内容
为解决上述技术问题,本发明提供一种用于中药核心药物识别的社区发现方法,通过考虑节点本身和邻居节点,设计了节点传播能力、吸引能力、发射能力和接收能力的多能力模型,更细粒度地衡量节点的重要性;同时算法考虑标签的相似性,对相似度高的标签进行融合,减少冗余标签,减少算法迭代次数,提高发现药物社区和重要药物节点的准确度和稳定性,提高核心药物识别的准确度。
本发明采用的技术方案为:一种用于中药核心药物识别的社区发现方法,包括:
首先,将药物作为节点,两个药物共同出现在同一方剂中作为边,将药物功效作为标签;
然后,计算节点之间的最短距离;计算节点相似性;计算标签的相似性;计算每个节点的传播能力、吸引能力、发射能力、接收能力;并将药物节点按传播能力的大小从小到大进行排序;
其次,进行标签发射、标签融合与标签接收的处理;
最后,根据标签分布,将具有相同标签的节点划分为同一药物社区,识别为可以对同类证候有效的药物;在每个药物社区中,将传播能力Top-3的节点识别为该类证候的核心药物。
本发明的有益效果:本发明提供一种用于中药核心药物识别的社区发现方法,通过设计药物节点传播能力、吸引能力、发射能力和接收能力,细粒度地衡量药物节点重要性;并首次提出标签融合思想,融合不同ID但相似的功效标签,减少冗余标签和迭代时间,快速地获得高质量的药物社区结果,以识别核心药物。与现有技术相比,本发明具备以下优点:
1、本发明设计了节点的传播能力,吸引能力,发射能力和接收能力的多能力模型,可以更细粒度地衡量药物节点的重要性,降低了对药物节点重要性的计算误差,增加了准确度;
2、药物节点传播能力考虑了全局的节点中心性和局部的节点度数信息,可以更准确的体现药物节点的重要性,提高药物社区检测的准确度和稳定性;
3、本发明首次提出了标签融合策略,将相似度高的不同ID的功效标签进行融合,减少了冗余标签和算法迭代时间,提高了药物社区发现的准确率和稳定性;
4、本发明的方法适用范围广,只要给出药物网络,就可以快速地进行药物社区发现和核心药物识别。
附图说明
图1为本发明的方案实现流程。
具体实施方式
为便于本领域技术人员理解本发明的技术内容,下面结合附图对本发明内容进一步阐释。
本发明公开了一种用于中药核心药物识别的社区发现方法,其主要步骤包括:初始化、选择待更新标签的节点、确定向待更新节点传播标签的节点集合、标签发射、标签融合、标签接收、终止判断和后处理。总体流程如图1所示。其中基于标签传播的社区发现算法与核心药物发现问题的对应关系如表1所示。
表1核心药物发现问题与基于标签传播的社区发现算法的对应关系
核心药物发现 | 基于标签传播的社区发现算法 |
药物 | 节点 |
两个药物共同出现在同一方剂中 | 边 |
药物功效 | 标签 |
对同类证候有效的药物集合 | 社区 |
对该类证候有效的核心药物 | 社区中的重要节点 |
首先给出一些基础定义:
(1)给定药物网络G=(V,E),其中V={v1,...,vi,...,vN}是药物节点的集合,vi表示第i个药物节点,N是药物节点个数,E={e1,...,ej,...,eM}是边的集合,表示药物共同出现在一个方剂中,ej表示第j条边,M是边的条数。
(6)提出药物节点具有传播能力(节点标签传播的范围)、吸引能力(节点获取标签的范围)、接受能力(接收标签的个数)和发射能力(传播标签的个数)的多能力模型,以更细粒度地衡量药物节点在药物网络中的重要性:
1)传播能力P(vi):
公式的第一项表示药物节点本身在药物网络的传播能力,由药物节点的紧密性集中度和度数相乘,紧密性集中度度量药物节点的中心程度,度数度量药物节点的重要程度,两者共同度量药物节点本身在药物网络中的影响,药物节点越处于中心位置,度数越大,影响越大,从而传播能力越大;第二项体现药物节点邻居的传播能力,直观反映为两个度数和中心性相同的药物节点,如果药物节点邻居影响力更大,那么药物节点影响更大,从而传播能力越大。药物节点本身的传播能力和来自邻居的传播能力共同体现药物节点总的传播能力。其中,参数α是一个调节因子,用来平衡药物节点本身的传播能力和来自邻居的传播能力,α∈[0,1]。
2)吸引能力A(vi):
|A(vi)|=|-P(vi)|
3)发射能力L(vi):
β是用来控制药物节点可以发射的功效标签个数的参数,β∈[0,1]。发射能力与药物节点的传播能力成正比,药物节点的传播能力越大,可以向外传播的功效标签个数越多。
4)接收能力R(vi):
R(vi)=γ
γ是用来控制药物节点可以接收的功效标签个数的参数,γ∈[1,∞]。
一种用于中药核心药物识别的社区发现方法具体步骤如下:
1.初始化
初始化药物节点标签(标签初始化为节点的ID,归属系数为1,代表药物的主要功效),计算药物节点之间的最短距离,计算药物节点相似性,计算功效标签的相似性,计算每个药物节点的传播能力,吸引能力,发射能力和接收能力,并将药物节点按传播能力的大小从小到大进行排序。具体如下:
(2)利用迪杰斯特拉(Dijkstra)算法计算两个药物节点vi,vj之间的最短路径距离d(vi,vj);
(3)计算两个药物节点之间的相似性S(vi,vj),并作为其功效标签的相似性;
(4)计算每个药物节点的度数D(vi);
(5)计算每个药物节点的四种能力值P(vi),A(vi),L(vi),R(vi);
(6)将药物节点按传播能力升序排序,得到list(V),方便后续从传播能力小的开始更新。如果药物节点传播能力相同,则按节点ID的顺序进行排序。
2.选择待更新标签的节点
从已经排序好的药物节点列表list(V)中选择传播能力最小的药物节点vi,将药物节点vi从list(V)中移除。因为传播能力最小的药物节点一般最先受到传播能力大的药物节点影响,所有优先更新传播能力最小的药物节点的功效标签,以提高算法的稳定性。
3.确定向待更新节点传播标签的节点集合
首先根据待更新标签的药物节点的吸引能力,确定待更新标签的药物节点可以获取功效标签的其他药物节点集合,在该集合内的药物节点的传播能力如果覆盖了待更新药物节点,则该药物节点加入能够向待更新功效标签的药物节点传播标签的节点集合中。具体方法如下:
(1)根据药物节点vi的吸引能力,确定药物节点可以获取功效标签的药物节点范围,也就是可以向药物节点vi发射功效标签的药物节点集合:
有益效果:通过待更新标签的节点的吸引能力和其他节点的传播能力来确定可以传播标签的节点集合,从而考虑更多的网络拓扑信息,避免只考虑直接邻居节点的情况。
4.标签发射
按药物节点的发射能力发射标签内存中的功效标签,归属系数大的功效标签先发射,传播到待更新功效标签的药物节点vi。具体如下:
(3)对功效标签归属系数进行归一化。
有益效果:传统的标签传播只考虑单个标签的传播,忽略了节点标签内存在多个标签的信息,因此本算法考虑传播节点的多个标签,从而利用更多的标签信息。
5.标签融合
在待更新标签药物节点在接收标签之前,将相似高的不同ID的功效标签进行融合,以减少冗余标签和利用可能被过滤的标签信息。功效标签是药物节点属性的体现,药物节点之间存在相似性,功效标签之间应该也存在相似性。相同的功效标签需要合并,相似性高的功效标签也应该进行合并,合并之后可以减少冗余的标签,增加标签保留的概率,同时防止一些标签被过滤,减少迭代时间,加快算法收敛,从而增加标签代表药物功效的信息,提高药物社区和核心药物发现的准确率。
(2)从归属系数最小的功效标签开始,选择与归属系数最小的功效标签相似性大于相似性阈值λ且最大的功效标签进行融合(相似性阈值λ将通过参数讨论实验,设置λ从0到1间隔0.1进行实验获得最优值);
(4)重复上述步骤,融合两个功效标签,直到没有两个功效标签相似性大于相似性阈值λ为止;
6.标签接收
根据药物节点的接收能力过滤归属系数小的功效标签,保证功效标签的代表性,防止接收到代表性过小的功效标签。
(1)药物节点vi可以接收的功效标签个数与节点的接收能力R(vi)有关,从标签归属系数大的功效标签开始接收,直到个数达到R(vi),如果到达的功效标签总数小于R(vi),则全部接收;
(3)按归属系数对药物节点的功效标签集合进行排序,得到药物节点的更新标签内存;
(4)所有药物节点的标签内存是否完成一次更新,如果是,则进入步骤7,如果没有,则返回步骤2选择待更新的节点。
7.终止判断
判断算法是否可以进入后处理阶段。计算拥有各类功效标签的最小节点数的集合mt,当mt=mt-1时,算法停止迭代,进入步骤8进行后处理,当mt≠mt-1时,返回步骤2,开始下一轮迭代更新。
8.后处理
根据功效标签分布,将具有相同功效标签的药物节点划分为同一药物社区,识别为可以对同类证候有效的药物。在每个社区中,将传播能力Top-3的药物识别为该类证候的核心药物。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (7)
1.一种用于中药核心药物识别的社区发现方法,其特征在于,包括:
将药物作为节点,两个药物共同出现在同一方剂中作为边,将药物功效作为标签;一个节点对应一个标签内存,所述标签内存中包括多个标签,每一个标签对应一个归属系数;
计算每个节点的传播能力;
根据标签分布,将具有相同标签的节点划分为同一社区,识别为可以对同类证候有效的药物;在每个社区中,将传播能力最高的3个节点识别为该类证候的核心药物。
2.根据权利要求1所述的一种用于中药核心药物识别的社区发现方法,其特征在于,还包括确定可以传播标签的节点集合,具体的:计算待更新节点的吸引能力,确定可以获取标签的节点范围,根据该范围内节点的传播能力,确定向该待更新节点传播标签的节点集合。
3.根据权利要求2所述的一种用于中药核心药物识别的社区发现方法,其特征在于,向该待更新节点传播标签的节点集合中的节点根据各节点的发射能力发射各自标签内存中的标签。
4.根据权利要求3所述的一种用于中药核心药物识别的社区发现方法,其特征在于,根据各节点的发射能力发射各自标签内存中的标签,具体包括:
首先,如果向该待更新节点传播标签的节点的标签内存中的标签数量小于其发射能力对应的标签数量,则将其标签全部发射给待更新节点;
其次,当向该待更新节点传播标签的节点集合中节点传播的标签中存在ID相同的标签时,进行合并操作,并将标签归属系数相加;
最后,对标签归属系数进行归一化。
5.根据权利要求4所述的一种用于中药核心药物识别的社区发现方法,其特征在于,待更新节点接收标签之前,还包括标签融合处理,具体的:
将该待更新节点当前标签内存中所有标签按照归属系数从小到大排序;
从该节点归属系数最小的标签开始,选择该归属系数最小的标签相似性大于设定阈值且相似性数值最大的标签进行融合;
融合后保留归属系数较大的这个标签,并更新其归属系数;重复融合操作直至两个标签相似性小于或等于设定阈值。
7.根据权利要求6所述的一种用于中药核心药物识别的社区发现方法,其特征在于,待更新节点接收标签的具体过程为:
待更新节点按归属系数从大到小的顺序接收标签,最多接收的标签数量小于或等于其接收能力对应的标签数量;
对接收的标签进行筛选,保留归属系数大于其接收能力倒数的标签,然后归一化标签归属系数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110354293.3A CN113053540B (zh) | 2021-04-01 | 2021-04-01 | 一种用于中药核心药物识别的社区发现方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110354293.3A CN113053540B (zh) | 2021-04-01 | 2021-04-01 | 一种用于中药核心药物识别的社区发现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113053540A true CN113053540A (zh) | 2021-06-29 |
CN113053540B CN113053540B (zh) | 2023-03-03 |
Family
ID=76517094
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110354293.3A Active CN113053540B (zh) | 2021-04-01 | 2021-04-01 | 一种用于中药核心药物识别的社区发现方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113053540B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631748A (zh) * | 2015-12-21 | 2016-06-01 | 西北工业大学 | 一种基于并行标签传播的异构网络社区发现方法 |
CN108090132A (zh) * | 2017-11-24 | 2018-05-29 | 西北师范大学 | 融合标签平均划分距离和结构关系的社区可重叠划分方法 |
CN109903854A (zh) * | 2019-01-25 | 2019-06-18 | 电子科技大学 | 一种基于中医药文献的核心药物识别方法 |
WO2021003803A1 (zh) * | 2019-07-11 | 2021-01-14 | 同盾控股有限公司 | 数据处理方法、装置、存储介质及电子设备 |
CN112417316A (zh) * | 2021-01-21 | 2021-02-26 | 南京数联铭品科技有限公司 | 一种基于多标签传播的半监督重叠社区发现算法 |
-
2021
- 2021-04-01 CN CN202110354293.3A patent/CN113053540B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105631748A (zh) * | 2015-12-21 | 2016-06-01 | 西北工业大学 | 一种基于并行标签传播的异构网络社区发现方法 |
CN108090132A (zh) * | 2017-11-24 | 2018-05-29 | 西北师范大学 | 融合标签平均划分距离和结构关系的社区可重叠划分方法 |
CN109903854A (zh) * | 2019-01-25 | 2019-06-18 | 电子科技大学 | 一种基于中医药文献的核心药物识别方法 |
WO2021003803A1 (zh) * | 2019-07-11 | 2021-01-14 | 同盾控股有限公司 | 数据处理方法、装置、存储介质及电子设备 |
CN112417316A (zh) * | 2021-01-21 | 2021-02-26 | 南京数联铭品科技有限公司 | 一种基于多标签传播的半监督重叠社区发现算法 |
Non-Patent Citations (2)
Title |
---|
YUN ZHANG等: "LILPA: A label importance based label propagation algorithm for community detection with application to core drug discovery", 《NEUROCOMPUTING》 * |
王炎冰: "融合用户标签和微博内容的用户兴趣社区发现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
Also Published As
Publication number | Publication date |
---|---|
CN113053540B (zh) | 2023-03-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109903854B (zh) | 一种基于中医药文献的核心药物识别方法 | |
CN112926990B (zh) | 欺诈识别的方法和装置 | |
CN112308157A (zh) | 一种面向决策树的横向联邦学习方法 | |
CN110443120A (zh) | 一种人脸识别方法及设备 | |
CN113593661B (zh) | 临床术语标准化方法、装置、电子设备及存储介质 | |
CN106067039A (zh) | 基于决策树剪枝的模式匹配方法 | |
CN110490730A (zh) | 异常资金聚集行为检测方法、装置、设备及存储介质 | |
CN106650783A (zh) | 用于移动终端数据分类、生成、匹配的方法、装置及系统 | |
CN112464107A (zh) | 一种基于多标签传播的社交网络重叠社区发现方法及装置 | |
CN111753063A (zh) | 一种应答方法、装置、服务器及存储介质 | |
Jonckheere et al. | Generalized max-weight policies in stochastic matching | |
CN116578654A (zh) | 一种面向领域知识图谱的实体对齐方法 | |
CN113053540B (zh) | 一种用于中药核心药物识别的社区发现方法 | |
CN106874708A (zh) | 采用觅食机制的人工蜂群优化算法识别关键蛋白质的方法 | |
CN106126634A (zh) | 一种基于直播行业的主数据去重处理方法及系统 | |
WO2000065480A2 (en) | System and method for generating decision trees | |
Hasan et al. | Obscure giants: detecting the provider-free ASes | |
Chang et al. | Deferred‐query: An efficient approach for some problems on interval graphs | |
CN109218184B (zh) | 基于端口和结构信息的路由器归属as识别方法 | |
CN113470738B (zh) | 基于模糊聚类和基因本体语义相似性的可重叠蛋白质复合物识别方法和系统 | |
CN112966001B (zh) | 一种基于区块链的BCTkPQ查询方法 | |
CN115146022A (zh) | 用于知识图中的关键词搜索的计算机实现方法 | |
CN111462895A (zh) | 辅助诊断方法及系统 | |
CN115344713A (zh) | 基于疾病诊断标准知识图谱的疾病预测方法 | |
CN114124417B (zh) | 一种大规模网络下可扩展性增强的漏洞评估方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |