CN113628726A - 基于图神经网络的中医辩治推荐系统、方法和电子设备 - Google Patents
基于图神经网络的中医辩治推荐系统、方法和电子设备 Download PDFInfo
- Publication number
- CN113628726A CN113628726A CN202110913252.3A CN202110913252A CN113628726A CN 113628726 A CN113628726 A CN 113628726A CN 202110913252 A CN202110913252 A CN 202110913252A CN 113628726 A CN113628726 A CN 113628726A
- Authority
- CN
- China
- Prior art keywords
- chinese medicine
- traditional chinese
- graph
- node
- dialectical treatment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000003814 drug Substances 0.000 title claims abstract description 134
- 238000000034 method Methods 0.000 title claims abstract description 62
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 51
- 239000013598 vector Substances 0.000 claims abstract description 136
- 208000011580 syndromic disease Diseases 0.000 claims abstract description 82
- 208000024891 symptom Diseases 0.000 claims abstract description 37
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 28
- 201000010099 disease Diseases 0.000 claims abstract description 27
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 24
- 238000011156 evaluation Methods 0.000 claims abstract description 14
- 238000012512 characterization method Methods 0.000 claims abstract description 11
- 229940126678 chinese medicines Drugs 0.000 claims abstract description 8
- 238000010276 construction Methods 0.000 claims abstract description 5
- 238000005070 sampling Methods 0.000 claims description 47
- 238000004220 aggregation Methods 0.000 claims description 35
- 230000002776 aggregation Effects 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 30
- 238000012549 training Methods 0.000 claims description 18
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000000605 extraction Methods 0.000 claims description 15
- 229940126680 traditional chinese medicines Drugs 0.000 claims description 15
- 230000004931 aggregating effect Effects 0.000 claims description 7
- 238000009826 distribution Methods 0.000 claims description 5
- 238000005457 optimization Methods 0.000 claims description 5
- 238000005295 random walk Methods 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 238000013135 deep learning Methods 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 20
- 230000004069 differentiation Effects 0.000 description 9
- 238000012545 processing Methods 0.000 description 8
- 238000003058 natural language processing Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 229940079593 drug Drugs 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000003860 storage Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000005034 decoration Methods 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 201000009240 nasopharyngitis Diseases 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 1
- 241000555712 Forsythia Species 0.000 description 1
- 206010019233 Headaches Diseases 0.000 description 1
- 241000245240 Lonicera Species 0.000 description 1
- 206010028748 Nasal obstruction Diseases 0.000 description 1
- 241000756042 Polygonatum Species 0.000 description 1
- 235000008737 Polygonatum biflorum Nutrition 0.000 description 1
- 206010037660 Pyrexia Diseases 0.000 description 1
- 208000032023 Signs and Symptoms Diseases 0.000 description 1
- 208000031971 Yin Deficiency Diseases 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 230000010267 cellular communication Effects 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012804 iterative process Methods 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 210000001835 viscera Anatomy 0.000 description 1
- 239000008530 yinqiaosan Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/90—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to alternative medicines, e.g. homeopathy or oriental medicines
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Public Health (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Databases & Information Systems (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Pathology (AREA)
- Animal Behavior & Ethology (AREA)
- Alternative & Traditional Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明属于智能医疗技术领域,本发明提供一种基于图神经网络的中医辩治推荐系统、方法和电子设备,包括:知识图谱获取模块,用于基于结构化的中医辩治数据,得到中医辩治的知识图谱;构建模块,用于通过图神经网络对所述知识图谱提取特征向量,以构建所述中医辩治的低纬度表征信息;结果获取模块,用于利用相似度评估算法根据所述中医辩治的低纬度表征信息,得到所述中医辩治的预测结果;其中,所述历史中医辩治数据包括病症、证型以及中药的特性属性和关联关系。本发明使用了一种基于空间域的图神经网络进行辩治的系统。通过本发明的系统利用一种图的深度学习算法提取大规模图表达关系数据的中医病症向量、中医证型向量和中药向量的表征信息。通过计算表征向量关系,在病‑证‑药之间实现中医辩治的推荐召回。
Description
技术领域
本发明涉及智能医疗技术领域,尤指一种基于图神经网络的中医辩治推荐系统、方法和电子设备。
背景技术
在中医诊断学中指出中医诊断的基本原则是:整体观察,四诊合参,病症结合,动静合一,这是中医的核心辩证理论,即从辩证角度来分析病人证型分类,通过分型来综合确定用药。中医学科比较庞大,辩证又分为了八纲,六淫,阴阳,气血,津液,脏腑,六经,卫气营血,三焦,经络辩证等几大辩证方法,所以如何准确有效对病症进行辩证,分型和施治是中医辩治的核心难题。
由于辩证需要分析和输入的参考信息关联性比较强,很多病症因为一些细微的区别决定了辩证结果,医师在临床经验,辩证逻辑,学派思想,用药习惯各方面都存在着自己的主观判断意识。在全面性、综合性和准确性上都有一定偏差,这个偏差值决定了医师的技艺水平。
如何利用信息化技术进行辩治是各大医疗健康领域一直在探索的问题,现有技术中存在两类方法:1.利用代数或者聚类的方法解决症药匹配问题,有些甚至直接跳过辩证的过程,将病症和用药关联匹配,这在中医诊断学中是不严谨的。2.通过训练CNN卷积神经网络来预测结果,这种方法比较有效,但是在特征和权重训练学习过程中,不能够有效学习到关键特征,影响预测结果准确率。
发明内容
本发明提供一种基于图神经网络的中医辩治推荐系统、方法和电子设备,解决了现有技术中的问题。
本发明提供的技术方案如下:
一方面,本发明提供一种基于图神经网络的中医辩治推荐系统,包括:
知识图谱获取模块,用于基于结构化的中医辩治数据,得到中医辩治的知识图谱;
构建模块,用于通过图神经网络对所述知识图谱提取特征向量,以构建所述中医辩治的低纬度表征信息;
结果获取模块,用于利用相似度评估算法根据所述中医辩治的低纬度表征信息,得到所述中医辩治的预测结果;
其中,所述历史中医辩治数据包括病症、证型以及中药的特性属性和关联关系。
进一步优选地,所述知识图谱获取模块,还用于:
通过NLP进行结构化处理病症、证型以及中药的特征属性和关联关系,获取结构化的中医辩治数据。
进一步优选地,所述构建模块,包括:
提取模块,用于通过图神经网络对所述知识图谱进行采样获取至少一个子图,并提取所述子图的特征向量;
训练模块,用于利用所述子图的特征向量基于平均值聚合器卷积,使用负采样算法进行无监督训练后获取所述中医辩治的低纬度表征信息。
进一步优选地,所述提取模块,还用于:
特征向量提取子模块,用于提取所述子图中节点的特征向量,具体包括:
设定所述节点,对所述聚合近邻的深度k进行迭代,逐步聚合和更新所述节点的特征向量。
进一步优选地,所述批采样子模块,还用于:
基于所述知识图谱进行批采样,获得病症和证型二部图、证型和证型同构图、证型和中药二部图、中药和中药同构图。
进一步优选地,所述特征向量提取子模块,还用于:
基于矢量范数标准化所述节点信息的聚合,得到标准化后的所述节点信息的聚合结果,所述节点信息的聚合结果作为迭代的参数,具体包括:
进一步优选地,还包括:优化模块,用于:
定义损失函数,基于所述损失函数优化所述迭代的参数,具体包括:
其中,Jg(zu)为损失函数;zu,zv,表示节点u,v,vn的聚合输出结果嵌入特征向量;其中,v是固定长度随机游走时在所述节点u的邻居节点,vn为负采样节点,T为向量的转置表达,σ是sigmoid函数,Q表示负采样数量,是期望,Pn是负采样的分布;该损失函数在拟合过程中使zu的嵌入表达相似度与zv越大的时候,与的嵌入表达相似度越小。
进一步优选地,所述结果获取模块,还用于:
利用相似度评估算法计算每个节点对应的特征向量之间的相似度,并构建索引;
对所述索引进行排序,得到所述中医辩治的预测结果,其中,相似度计算公式如下:
其中,d(x,y)表示特征向量x和y的欧式距离,n表示特征向量的空间纬度,i表示当前求和计算的纬度,x与y计算结果越小则评分相似度越高,所述特征向量x为疾病时,所述特征向量y为证型;所述特征向量x为证型时,所述特征向量y为疾病。
一种基于图神经网络的中医辩治推荐方法,包括:
基于结构化的中医辩治数据,得到中医辩治的知识图谱;
通过图神经网络对所述知识图谱提取特征向量,以构建所述中医辩治的低纬度表征信息;
利用相似度评估算法根据所述中医辩治的低纬度表征信息,得到所述中医辩治的预测结果;
其中,所述历史中医辩治数据包括病症、证型以及中药的特性属性和关联关系。
一种电子设备,该电子设备包括:
处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行所述的基于图神经网络的中医辩治推荐方法。
本发明提供的一种基于图神经网络的中医辩治推荐系统、方法和电子设备至少具有以下一种有益效果:
1)本发明使用了图神经网络,采用无监督学习的方式模拟中医辩治的思想方法,通过采样聚合节点的k层近邻信息,生成具有空间相似度的特征向量。
2)本发明采用了图的批量采样方法,可以在大量的数据集中完成训练,同时对节点聚合采用的是近邻节点的信息属性,从而有新的节点加入时,不需要对整图重新训练,就可以很好的评估预测。
3)本发明由专业医师从医案和经方中收集了大量的能够结合上下文形成辩治思想的训练数据集,保证了训练内容的可靠性,训练好的embedding能够从病症、证型、中药中学习归纳辨证施治的规律。
附图说明
下面结合附图和具体实施方式对本发明作进一步详细说明:
图1是本发明的一种基于图神经网络的中医辩治推荐系统的一个实施例的流程示意图;
图2是本发明的一种基于图神经网络的中医辩治推荐方法的一种实施例的示意图;
图3是本发明的一种基于图神经网络的中医辩治推荐方法的一种实施例的示意图;
图4是本发明的电子设备的示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
在本文中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
实施例一
一方面,如图1所示,本发明提供一种基于图神经网络的中医辩治推荐系统的一个实施例,包括:
知识图谱获取模块301,用于基于结构化的中医辩治数据,得到中医辩治的知识图谱。
具体的,通过对收集的医案数据进行NLP(自然语言处理)后获取的大量结构化信息。通过人工标记和数据处理后得到大规模图信息,图信息种包含了病症、证型、中药等相关属性以及关联关系。
示例性的,图数据的整理:使用人工和系统对大量医案数据结构化处理。通过对医案等原始材料进行整理获取整理数据,以及数据的对应关系,并制作成一张知识图谱即知识图谱的构建。
构建模块302,用于通过图神经网络对所述知识图谱提取特征向量,以构建所述中医辩治的低纬度表征信息。
具体的,图的特征向量提取,使用图神经网络对图采样和特征提取,构建图的低纬度表征信息。
其中,将知识图谱一张图切分成子图进行采样,利用子图替代全图基于平均值聚合器卷积,使用负采样算法进行无监督训练后获取病症,证型,中药在图的低纬度空间特征向量即低纬度表征信息。
在本实施例中,通过数据采样在图神经网络中以顶点为中心聚合二阶邻居信息学习表征向量,以实现对医案数据的推荐召回。
结果获取模块303,用于利用相似度评估算法根据所述中医辩治的低纬度表征信息,得到所述中医辩治的预测结果。
其中,所述历史中医辩治数据包括病症、证型以及中药的特性属性和关联关系。
针对一般神经网络无法有效学习在中医辩治方法中的表达关系和权重信息问题,在本实施例中使用了一种基于空间域的图神经网络进行辩治的方法。该方法通过一种图的深度学习算法,使用无监督学习方式,提取大规模图表达关系数据的中医病症向量(symptom embedding)、中医证型向量(dialectic embedding)和中药向量(herbembedding)的表征信息。通过计算表征向量关系,在病-证-药之间实现中医辩治的推荐召回方法。
其中,所述历史中医辩治数据包括病症、证型以及中药的特性属性和关联关系。
实施例二
基于上述实施例,在本实施例中与上述实施例相同的部分就不一一赘述了,本实施例提供一种基于图神经网络的中医辩治推荐系统,包括:
所述知识图谱获取模块,还用于:
通过NLP进行结构化处理病症、证型以及中药的特征属性和关联关系,获取结构化的中医辩治数据。
所述构建模块,包括:
提取模块,用于通过图神经网络对所述知识图谱进行采样获取至少一个子图,并提取所述子图的特征向量;
训练模块,用于利用所述子图的特征向量基于平均值聚合器卷积,使用负采样算法进行无监督训练后获取所述中医辩治的低纬度表征信息。
所述提取模块,还包括:
特征向量提取子模块,用于提取所述子图中节点的特征向量,具体包括:
设定所述节点,对所述聚合近邻的深度k进行迭代,逐步聚合和更新所述节点的特征向量。
所述批采样子模块,还用于:
基于所述知识图谱进行批采样,获得病症和证型二部图、证型和证型同构图、证型和中药二部图、中药和中药同构图。
所述特征向量提取子模块,还用于:
基于矢量范数标准化所述节点信息的聚合,得到标准化后的所述节点信息的聚合结果,所述节点信息的聚合结果作为迭代的参数,具体包括:
具体的,还包括:优化模块,用于:
定义损失函数,基于所述损失函数优化所述迭代的参数,具体包括:
其中,Jg(zu)为损失函数;zu,zv,表示节点u,v,vn的聚合输出结果嵌入特征向量;其中,v是固定长度随机游走时在所述节点u的邻居节点,vn为负采样节点,T为向量的转置表达,σ是sigmoid函数,Q表示负采样数量,是期望,Pn是负采样的分布;该损失函数在拟合过程中使zu的嵌入表达相似度与zv越大的时候,与的嵌入表达相似度越小。
所述结果获取模块,还用于:
利用相似度评估算法计算每个节点对应的特征向量之间的相似度,并构建索引;
对所述索引进行排序,得到所述中医辩治的预测结果,其中,相似度计算公式如下:
其中,d(x,y)表示特征向量x和y的欧式距离,n表示特征向量的空间纬度,i表示当前求和计算的纬度,x与y计算结果越小则评分相似度越高,所述特征向量x为疾病时,所述特征向量y为证型;所述特征向量x为证型时,所述特征向量y为疾病。
其中,所提取模块,用于:
特征向量提取子模块,用于提取所述子图中节点u的特征向量,具体包括:
设定所述节点u=A,对所述聚合近邻的深度k进行迭代,逐步聚合和更新所述节点u的特征向量:
其中,zA为所述节点u经过嵌入k层近邻节点信息后的特征向量。
具体的,所述批采样子模块,用于对所述知识图谱进行批采样,获取至少一个子图,包括:
基于所述知识图谱进行批采样,获得病症和证型二部图、证型和证型同构图、证型和中药二部图、中药和中药同构图;
具体的,所述设定所述节点u=A,对所述聚合近邻的深度k进行迭代,包括:
基于矢量范数标准化所述节点信息的聚合,得到标准化后的所述节点信息的聚合结果,所述节点信息的聚合结果作为迭代的参数,具体包括:
具体的,还包括优化模块,用于定义损失函数,基于所述损失函数优化所述迭代的参数,具体包括:
其中,Jg(zu)为损失函数;zu,zv,表示节点u,v,vn的聚合输出结果嵌入特征向量;其中,v是固定长度随机游走时在所述节点u的邻居节点,vn为负采样节点,T为向量的转置表达,σ是sigmoid函数,Q表示负采样数量,是期望,Pn是负采样的分布;该损失函数在拟合过程中使zu的嵌入表达相似度与zv越大的时候,与的嵌入表达相似度越小。
所述结果获取模块,用于利用相似度评估算法根据所述中医辩治的低纬度表征信息,得到所述中医辩治的预测结果,包括:
利用相似度评估算法计算每个节点对应的特征向量之间的距离,并构建索引;
对所述索引进行排序,得到所述中医辩治的预测结果,其中,相似度计算公式如下:
其中,d(x,y)表示特征向量x和y的欧式距离,n表示特征向量的空间纬度,i表示当前求和计算的纬度,x与y计算结果越小则评分相似度越高,所述特征向量x为疾病时,所述特征向量y为证型;所述特征向量x为证型时,所述特征向量y为疾病。
示例性的,包括:
步骤1,图数据的整理:使用人工和系统对大量医案数据结构化处理,例如病症、证型以及中药的关系通过NLP进行结构化处理,获取结构化信息。
数据集结果如下所示:病症与药物之间的关系需要通过自然语言进行处理,通过学习医案等原始材料,抽取之后的数据是结构化的。
SD={恶寒,轻微发热,无汗,头痛,鼻塞,咳嗽,舌苔白,脉浮紧}
步骤2,图的特征向量提取,使用图神经网络对图采样和特征提取,构建图的低纬度表征信息。
步骤3,使用相似度评估算法,预测辩治结果。
进一步地,步骤2具体为:首先对图数据进行采样获取子图,然后利用子图代替全图基于平均值聚合器卷积,使用负采样算法进行无监督训练后获取病症、证型、中药在图的低纬度空间特征向量。其中,使用负采样算法是一种验证、迭代的过程,以使得结果更加准确。
进一步地,图的特征向量提取,具体步骤如下:
示例性的,聚合近邻进行采样,采样一个点以及这个点的临近点。
病症-证型二部图:
证型-证型同构图:
证型-中药二部图:
中药-中药同构图:
其中,同构图是同一类型的节点构成的子图,二部图是不同类型的节点构成的子图。
在聚合时可以避免过拟合,从而导致判断的准确率。对输入更加敏感,权重值更接近实际的应用。比如:输入症状后,一个症状和另一个症状有相同的属性特征,输出的时候根据同构图可以输出关联的两个症状。本实施例的二部图和同构图的构建,可以提高图神经网络输出的信息丰富度和准确度。
最终顶点输入向量表示如下:
示例性的,将顶点提取出来,计算顶点的特征向量,每一个顶点都会有一个特征向量(向量的特征值)。
其中xv代表节点的输入特征属性。
所述特征向量提取子模块,用于提取节点u的特征向量,设定当前要提取向量特征的节点u=A。
对k进行迭代,逐步聚合和更新节点特征向量:
其中k1展开后表示如下:
其中,A包含BCD的属性和关系。
其中k2展开后表示如下:
在本实施例中k为2,上述为聚合二阶邻居的信息,更新向量特征的过程。
对于以上迭代聚合近邻节点信息方法表示如下:
在本实施例中,为了防止梯度爆炸,特别的在聚合每个节点后都除以矢量范数来标准化节点信息的聚合,表示如下:
最终迭代k次后输出结果为:
其中zA为该顶点经过嵌入k层近邻节点信息后的特征向量表示。
该方法定义了以下损失函数以优化参数:
其中,Jg(zu)为损失函数;zu,zv,表示节点u,v,vn的聚合输出结果嵌入特征向量;其中,v是固定长度随机游走时在所述节点u的邻居节点,vn为负采样节点,T为向量的转置表达,σ是sigmoid函数,Q表示负采样数量,是期望,Pn是负采样的分布。
其中负采样为评估节点的非邻居节点,拟合更新权重的过程中,距离越近的节点相似度越高,距离越远的节点相似度越低。
通过对图的节点向量提取,最终得到病症、证型、中药的特征向量(embedding)。
使用最近邻检索特征向量相似度,构建索引后,获取topN条记录做为结果评分,相似度计算公式如下:
其中,d(x,y)表示特征向量x和y的欧式距离,n表示特征向量的空间纬度,i表示当前求和计算的纬度,x与y计算结果越小则评分相似度越高,所述特征向量x为疾病时,所述特征向量y为证型;所述特征向量x为证型时,所述特征向量y为疾病。
具体的,关于中医辩治的预测结果的获取,具体包括:
计算各个节点的关系,需要构建一个索引,也是属于一个迭代的过程。病症-证型-中药。
对索引进行排序,排序后,在理论中,相似度最高的就是结论值。
在应用时,证型是可以通过医生确定的。可以多给几个证型给医生,医生可以选择两个证型,就基于这两个证型给出对应的中药。
如下表所示的病症-证型召回结果
上表采用本发明方法预测的证型,由专业医师分析后,根据病症所召回的证型95.18%都符合临床经验的辩证,并可以用《中医诊断学》来验证结果。
如下表所示证型-中药召回结果:
证型(embedding) | 中药(embedding) |
风寒束表 | 荆防败毒汤加减 |
风热犯表 | 银翘散加减 |
阴虚感冒 | 加减葳蕤汤 |
气虚感冒 | 参苏饮汤 |
... | ... |
上表采用本发明方法预测的中药,由专业医师分析后,根据证型所召回的中药92.53%都符合临床经验的用药,部分结论可以用《中医内科学》来验证结果。
与现有技术对比,本发明使用了以下技术创新:将大图拆成小图,用批采样的方式进行处理,防止在图神经网络在训练时内存溢出。
本发明使用了图神经网络,采用无监督学习的方式模拟中医辩治的思想方法,通过采样聚合节点的k层近邻信息,生成具有空间相似度的特征向量。
本发明采用了图的批量采样方法,可以在大量的数据集中完成训练,同时对节点聚合采用的是近邻节点的信息属性,从而有新的节点加入时,不需要对整图重新训练,就可以很好的评估预测。
本发明由专业医师从医案和经方中收集了大量的能够结合上下文形成辩治思想的训练数据集,保证了训练内容的可靠性,训练好的embedding能够从病症、证型、中药中学习归纳辨证施治的规律。
实施例三
基于上述实施例,在本实施例中与上述实施例相同的部分就不一一赘述了,本实施例提供一种基于图神经网络的中医辩治推荐方法,应用所述基于图神经网络的中医辩治推荐方法,如图2所示,包括:
S100基于结构化的中医辩治数据,得到中医辩治的知识图谱。
具体的,通过对收集的医案数据进行NLP(自然语言处理)后获取的大量结构化信息。通过人工标记和数据处理后得到大规模图信息,图信息种包含了病症,证型,中药等相关属性以及关联关系。
示例性的,图数据的整理:使用人工和系统对大量医案数据结构化处理。通过对医案等原始材料进行整理获取整理数据,以及数据的对应关系,并制作成一张知识图谱即知识图谱的构建。
S200通过图神经网络对所述知识图谱提取特征向量,以构建所述中医辩治的低纬度表征信息。
具体的,图的特征向量提取,使用图神经网络对图采样和特征提取,构建图的低纬度表征信息。
其中,将知识图谱一张图切分成子图进行采样,利用子图替代全图基于平均值聚合器卷积,使用负采样算法进行无监督训练后获取病症、证型、中药在图的低纬度空间特征向量即低纬度表征信息。
在本实施例中,通过数据采样在图神经网络中以顶点为中心聚合二阶邻居信息学习表征向量,以实现对医案数据的推荐召回。
S300利用相似度评估算法根据所述中医辩治的低纬度表征信息,得到所述中医辩治的预测结果。
其中,所述历史中医辩治数据包括病症、证型以及中药的特性属性和关联关系。
针对一般神经网络无法有效学习在中医辩治方法中的表达关系和权重信息问题,在本实施例中使用了一种基于空间域的图神经网络进行辩治的方法。该方法通过一种图的深度学习算法,使用无监督学习方式,提取大规模图表达关系数据的中医病症向量(symptom embedding)、中医证型向量(dialectic embedding)和中药向量(herbembedding)的表征信息。通过计算表征向量关系,在病-证-药之间实现中医辩治的推荐召回方法。
实施例四
一种电子设备,该电子设备包括:
处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行所述的基于图神经网络的中医辩治推荐方法。
另一方面,如图4所示,本发明提供一种电子设备100,包括处理器110、存储器120,其中,存储器120,用于存放计算机程序121;处理器110,用于执行存储器120上所存放的计算机程序121,实现上述所对应方法实施例中的方法。
所述电子设备100可以为桌上型计算机、笔记本、掌上电脑、平板型计算机、手机、人机交互屏等设备。所述电子设备100可包括,但不仅限于处理器110、存储器120。本领域技术人员可以理解,图4仅仅是电子设备100的示例,并不构成对电子设备100的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,示例性的:电子设备100还可以包括输入/输出接口、显示设备、网络接入设备、通信总线、通信接口等。通信接口和通信总线,还可以包括输入/输出接口,其中,处理器110、存储器120、输入/输出接口和通信接口通过通信总线完成相互间的通信。该存储器120存储有计算机程序121,该处理器110用于执行存储器120上所存放的计算机程序121,实现上述所对应方法实施例中的方法。
所述处理器110可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器120可以是所述电子设备100的内部存储单元,示例性的:电子设备的硬盘或内存。所述存储器也可以是所述电子设备的外部存储设备,示例性的:所述电子设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器120还可以既包括所述电子设备100的内部存储单元也包括外部存储设备。所述存储器120用于存储所述计算机程序121以及所述电子设备100所需要的其他程序和数据。所述存储器还可以用于暂时地存储已经输出或者将要输出的数据。
通信总线是连接所描述的元素的电路并且在这些元素之间实现传输。示例性的,处理器110通过通信总线从其它元素接收到命令,解密接收到的命令,根据解密的命令执行计算或数据处理。存储器120可以包括程序模块,示例性的,内核(kernel),中间件(middleware),应用程序编程接口(Application Programming Interface,API)和应用。该程序模块可以是有软件、固件或硬件、或其中的至少两种组成。输入/输出接口转发用户通过输入/输出接口(示例性的,感应器、键盘、触摸屏)输入的命令或数据。通信接口将所述电子设备100与其它网络设备、用户设备、网络进行连接。示例性的,通信接口可以通过有线或无线连接到网络以连接到外部其它的网络设备或用户设备。无线通信可以包括以下至少一种:无线保真(WiFi),蓝牙(BT),近距离无线通信技术(NFC),全球卫星定位系统(GPS)和蜂窝通信等等。有线通信可以包括以下至少一种:通用串行总线(USB),高清晰度多媒体接口(HDMI),异步传输标准接口(RS-232)等等。网络可以是电信网络和通信网络。通信网络可以为计算机网络、因特网、物联网、电话网络。电子设备100可以通过通信接口连接网络,电子设备100和其它网络设备通信所用的协议可以被应用、应用程序编程接口(API)、中间件、内核和通信接口至少一个支持。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的装置和方法,可以通过其他的方式实现。示例性的,以上所描述的系统实施例仅仅是示意性的,示例性的,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,示例性的,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性、机械或其他的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可能集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
Claims (10)
1.一种基于图神经网络的中医辩治推荐系统,其特征在于,包括:
知识图谱获取模块,用于基于结构化的中医辩治数据,得到中医辩治的知识图谱;
构建模块,用于通过图神经网络对所述知识图谱提取特征向量,以构建所述中医辩治的低纬度表征信息;
结果获取模块,用于利用相似度评估算法根据所述中医辩治的低纬度表征信息,得到所述中医辩治的预测结果;
其中,所述历史中医辩治数据包括病症、证型以及中药的特性属性和关联关系。
2.根据权利要求1所述基于图神经网络的中医辩治推荐系统,其特征在于,所述知识图谱获取模块,还用于:
通过NLP进行结构化处理病症、证型以及中药的特征属性和关联关系,获取结构化的中医辩治数据。
3.根据权利要求2所述基于图神经网络的中医辩治推荐系统,其特征在于,所述构建模块,包括:
提取模块,用于通过图神经网络对所述知识图谱进行采样获取至少一个子图,并提取所述子图的特征向量;
训练模块,用于利用所述子图的特征向量基于平均值聚合器卷积,使用负采样算法进行无监督训练后获取所述中医辩治的低纬度表征信息。
5.根据权利要求4所述基于图神经网络的中医辩治推荐系统,其特征在于,所述批采样子模块,还用于:
基于所述知识图谱进行批采样,获得病症和证型二部图、证型和证型同构图、证型和中药二部图、中药和中药同构图。
9.一种基于图神经网络的中医辩治推荐方法,其特征在于,包括:
基于结构化的中医辩治数据,得到中医辩治的知识图谱;
通过图神经网络对所述知识图谱提取特征向量,以构建所述中医辩治的低纬度表征信息;
利用相似度评估算法根据所述中医辩治的低纬度表征信息,得到所述中医辩治的预测结果;
其中,所述历史中医辩治数据包括病症、证型以及中药的特性属性和关联关系。
10.一种电子设备,其特征在于,该电子设备包括:
处理器;以及,
存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行根据权利要求9所述的基于图神经网络的中医辩治推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110913252.3A CN113628726B (zh) | 2021-08-10 | 2021-08-10 | 基于图神经网络的中医辨治推荐系统、方法和电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110913252.3A CN113628726B (zh) | 2021-08-10 | 2021-08-10 | 基于图神经网络的中医辨治推荐系统、方法和电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113628726A true CN113628726A (zh) | 2021-11-09 |
CN113628726B CN113628726B (zh) | 2023-12-26 |
Family
ID=78384050
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110913252.3A Active CN113628726B (zh) | 2021-08-10 | 2021-08-10 | 基于图神经网络的中医辨治推荐系统、方法和电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113628726B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115147372A (zh) * | 2022-07-04 | 2022-10-04 | 海南榕树家信息科技有限公司 | 一种基于医学图像分割的中医舌像智能辨治方法及系统 |
CN115662647A (zh) * | 2022-12-27 | 2023-01-31 | 北京大学第三医院(北京大学第三临床医学院) | 一种相似疾病挖掘的方法和应用 |
CN116580808A (zh) * | 2023-04-28 | 2023-08-11 | 哈尔滨黎曼人工智能应用软件有限责任公司 | 基于机器学习的中医开方方法及系统 |
CN118395021A (zh) * | 2024-06-21 | 2024-07-26 | 安徽中医药大学第一附属医院 | 一种基于知识图谱的中医药智能查询系统 |
CN118800408B (zh) * | 2024-09-11 | 2024-11-15 | 四川互慧软件有限公司 | 基于图算法的中医用药推荐方法及装置 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110335676A (zh) * | 2019-07-09 | 2019-10-15 | 泰康保险集团股份有限公司 | 数据处理方法、装置、介质及电子设备 |
CN111191020A (zh) * | 2019-12-27 | 2020-05-22 | 江苏省人民医院(南京医科大学第一附属医院) | 基于机器学习和知识图谱的处方推荐方法和系统 |
CN111639190A (zh) * | 2020-04-30 | 2020-09-08 | 南京理工大学 | 医疗知识图谱构建方法 |
CN112364880A (zh) * | 2020-11-30 | 2021-02-12 | 腾讯科技(深圳)有限公司 | 基于图神经网络的组学数据处理方法、装置、设备及介质 |
CN112528037A (zh) * | 2020-12-04 | 2021-03-19 | 北京百度网讯科技有限公司 | 基于知识图谱的边关系预测方法、装置、设备及存储介质 |
CN112820375A (zh) * | 2021-02-04 | 2021-05-18 | 闽江学院 | 基于多图卷积神经网络的中药推荐方法 |
CN113012803A (zh) * | 2019-12-19 | 2021-06-22 | 京东方科技集团股份有限公司 | 计算机设备、系统、可读存储介质及医学数据分析方法 |
WO2021139231A1 (zh) * | 2020-06-30 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于神经网络模型的分诊方法、装置和计算机设备 |
WO2021151351A1 (zh) * | 2020-09-04 | 2021-08-05 | 平安科技(深圳)有限公司 | 一种数据处理方法、装置、计算机设备及存储介质 |
-
2021
- 2021-08-10 CN CN202110913252.3A patent/CN113628726B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110335676A (zh) * | 2019-07-09 | 2019-10-15 | 泰康保险集团股份有限公司 | 数据处理方法、装置、介质及电子设备 |
CN113012803A (zh) * | 2019-12-19 | 2021-06-22 | 京东方科技集团股份有限公司 | 计算机设备、系统、可读存储介质及医学数据分析方法 |
US20210192365A1 (en) * | 2019-12-19 | 2021-06-24 | Boe Technology Group Co., Ltd. | Computer device, system, readable storage medium and medical data analysis method |
CN111191020A (zh) * | 2019-12-27 | 2020-05-22 | 江苏省人民医院(南京医科大学第一附属医院) | 基于机器学习和知识图谱的处方推荐方法和系统 |
CN111639190A (zh) * | 2020-04-30 | 2020-09-08 | 南京理工大学 | 医疗知识图谱构建方法 |
WO2021139231A1 (zh) * | 2020-06-30 | 2021-07-15 | 平安科技(深圳)有限公司 | 基于神经网络模型的分诊方法、装置和计算机设备 |
WO2021151351A1 (zh) * | 2020-09-04 | 2021-08-05 | 平安科技(深圳)有限公司 | 一种数据处理方法、装置、计算机设备及存储介质 |
CN112364880A (zh) * | 2020-11-30 | 2021-02-12 | 腾讯科技(深圳)有限公司 | 基于图神经网络的组学数据处理方法、装置、设备及介质 |
CN112528037A (zh) * | 2020-12-04 | 2021-03-19 | 北京百度网讯科技有限公司 | 基于知识图谱的边关系预测方法、装置、设备及存储介质 |
CN112820375A (zh) * | 2021-02-04 | 2021-05-18 | 闽江学院 | 基于多图卷积神经网络的中药推荐方法 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115147372A (zh) * | 2022-07-04 | 2022-10-04 | 海南榕树家信息科技有限公司 | 一种基于医学图像分割的中医舌像智能辨治方法及系统 |
CN115147372B (zh) * | 2022-07-04 | 2024-05-03 | 海南榕树家信息科技有限公司 | 一种基于医学图像分割的中医舌像智能辨治方法及系统 |
CN115662647A (zh) * | 2022-12-27 | 2023-01-31 | 北京大学第三医院(北京大学第三临床医学院) | 一种相似疾病挖掘的方法和应用 |
CN115662647B (zh) * | 2022-12-27 | 2024-03-12 | 北京大学第三医院(北京大学第三临床医学院) | 一种相似疾病挖掘的方法和应用 |
CN116580808A (zh) * | 2023-04-28 | 2023-08-11 | 哈尔滨黎曼人工智能应用软件有限责任公司 | 基于机器学习的中医开方方法及系统 |
CN118395021A (zh) * | 2024-06-21 | 2024-07-26 | 安徽中医药大学第一附属医院 | 一种基于知识图谱的中医药智能查询系统 |
CN118395021B (zh) * | 2024-06-21 | 2024-08-20 | 安徽中医药大学第一附属医院 | 一种基于知识图谱的中医药智能查询系统 |
CN118800408B (zh) * | 2024-09-11 | 2024-11-15 | 四川互慧软件有限公司 | 基于图算法的中医用药推荐方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
CN113628726B (zh) | 2023-12-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110444263B (zh) | 基于联邦学习的疾病数据处理方法、装置、设备及介质 | |
CN113628726B (zh) | 基于图神经网络的中医辨治推荐系统、方法和电子设备 | |
US11257579B2 (en) | Systems and methods for managing autoimmune conditions, disorders and diseases | |
CN113421652B (zh) | 对医疗数据进行分析的方法、训练模型的方法及分析仪 | |
CN103690240A (zh) | 一种医疗系统 | |
CN108335755A (zh) | 数据分析方法和设备 | |
CN109582797A (zh) | 获取疾病分类推荐的方法、装置、介质及电子设备 | |
WO2021151295A1 (zh) | 患者治疗方案的确定方法、装置、计算机设备及介质 | |
US10448898B2 (en) | Methods and systems for predicting a health condition of a human subject | |
Karabatsos | Marginal maximum likelihood estimation methods for the tuning parameters of ridge, power ridge, and generalized ridge regression | |
CN111198905B (zh) | 用于理解二分网络中的缺失链路的视觉分析框架 | |
CN110276283B (zh) | 图片识别方法、目标识别模型训练方法及装置 | |
Li et al. | Fast clustering by affinity propagation based on density peaks | |
WO2021052150A1 (zh) | 放疗计划推荐方法、装置、电子设备及存储介质 | |
Chen et al. | Ssne: Effective node representation for link prediction in sparse networks | |
US11963788B2 (en) | Graph-based prostate diagnosis network and method for using the same | |
Vinas et al. | A graph-based imputation method for sparse medical records | |
Jiyun et al. | Patient similarity measuring with graph embedded learning and triplet network | |
Prabha et al. | Deep Learning for Medical Image Segmentation Using Convolutional Neural Networks | |
Ma et al. | Predicting the risk of mortality in ICU patients based on dynamic graph attention network of patient similarity. | |
CN118800408B (zh) | 基于图算法的中医用药推荐方法及装置 | |
Mu et al. | Diagnosis prediction via recurrent neural networks | |
Hou | Principal Component Analysis and Prediction of Students’ Physical Health Standard Test Results Based on Recurrent Convolution Neural Network | |
CN114610921B (zh) | 对象集群画像确定方法、装置、计算机设备和存储介质 | |
US20240379208A1 (en) | Systems and methods for managing autoimmune conditions, disorders and diseases |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |