CN116680412A - 一种基于知识图谱的中医处方推荐方法 - Google Patents
一种基于知识图谱的中医处方推荐方法 Download PDFInfo
- Publication number
- CN116680412A CN116680412A CN202310690324.1A CN202310690324A CN116680412A CN 116680412 A CN116680412 A CN 116680412A CN 202310690324 A CN202310690324 A CN 202310690324A CN 116680412 A CN116680412 A CN 116680412A
- Authority
- CN
- China
- Prior art keywords
- chinese medicine
- traditional chinese
- node
- vector
- symptom
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003814 drug Substances 0.000 title claims abstract description 176
- 238000000034 method Methods 0.000 title claims abstract description 27
- 208000024891 symptom Diseases 0.000 claims abstract description 92
- 229940079593 drug Drugs 0.000 claims abstract description 17
- 230000007246 mechanism Effects 0.000 claims abstract description 5
- 239000013598 vector Substances 0.000 claims description 136
- 239000011159 matrix material Substances 0.000 claims description 75
- 208000011580 syndromic disease Diseases 0.000 claims description 33
- 230000006870 function Effects 0.000 claims description 27
- 238000013528 artificial neural network Methods 0.000 claims description 16
- 230000004913 activation Effects 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 12
- 238000012549 training Methods 0.000 claims description 12
- 230000006698 induction Effects 0.000 claims description 7
- 229940126678 chinese medicines Drugs 0.000 claims description 6
- 239000013604 expression vector Substances 0.000 claims description 6
- 230000008014 freezing Effects 0.000 claims description 6
- 238000007710 freezing Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 206010060891 General symptom Diseases 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 241000411851 herbal medicine Species 0.000 claims description 3
- 238000011176 pooling Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 229940126680 traditional chinese medicines Drugs 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000003759 clinical diagnosis Methods 0.000 abstract description 3
- 238000011160 research Methods 0.000 abstract description 3
- 238000012377 drug delivery Methods 0.000 abstract 1
- 238000003745 diagnosis Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 9
- 239000000463 material Substances 0.000 description 6
- 238000011161 development Methods 0.000 description 4
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000005096 rolling process Methods 0.000 description 3
- 241000721047 Danaus plexippus Species 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000013078 crystal Substances 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001105 regulatory effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/90—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to alternative medicines, e.g. homeopathy or oriental medicines
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Biomedical Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Epidemiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Alternative & Traditional Medicine (AREA)
- Animal Behavior & Ethology (AREA)
- Databases & Information Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
一种基于知识图谱的中医处方推荐方法,应用了知识图嵌入模型、多头注意力机制、图卷积等将图谱特征与推荐系统相结合,综合考虑患者情况,进行中医处方推荐,以中医医案描述文本为研究对象,融合中医知识图谱信息,吸取名老中医的临床对症下药经验,充分综合考虑药性、功效、病情和患者的体质等多个个性化因素,在于依据中医的整体论原则及辨证论治的思想,根据患者的不同症状和病情归纳证候选择不同的药材组合,提出融合知识图谱的中医处方推荐方法,考虑个人体征及症状和药物之间的复杂关系,结合每个处方具体分析局部规律,为医生和患者推荐更可靠的处方药材,为中医临床诊疗提供辅助决策支持。
Description
技术领域
本发明涉及中医处方推荐领域,尤其涉及一种基于知识图谱的中医处方推荐方法。
背景技术
中医是源自中国古代,历经数千年实践及总结归纳的医学理论体系,是中华民族的宝贵财富和智慧结晶。近年来,中国政府高度重视中医药事业的发展和传承,积极采取措施,推动中医药在国内外的传播和应用,进一步促进中医药传承与开放创新发展。中医作为一种独树一帜的医学体系,采用望、闻、问、切等多种方法来获取病症信息,进而实施辨证论治。在中医临床实践中,必须立足于科学的辩证基础,根据患者的个体特征,遵循药材搭配规律来选取适当的药方。中医药方所发挥的功效并非单一药物效果的简单叠加,而是通过药物的综合作用,达到调和人体阴阳平衡,从而使疾病痊愈。
然而,目前中医诊疗主证和兼证区分不开,处方无的放矢,药物配伍杂乱无章,中医经典著作和名方秘法尚未形成规范诊疗的知识模型,基层医生经验不足,受人为因素影响导致治法用药不够客观。当前,中医知识分布于众多古籍和文献中,松散且非结构化的特点使得中医知识的利用率不高。此外,中医注重整体论,需要综合考虑患者的身体、年龄、性别、病史等多方面因素,而非仅仅针对单一症状或疾病进行治疗,目前一些研究使用注意神经网络用于检测中药方剂中不同药物分组等,然而其在个性化方面考虑不足。同时由于草药具有一定的副作用,需通过药材配伍的“君臣佐使”组合来达到平衡药效和防止药物间相互抵消或产生副作用的目的,但目前一些研究如使用BRNN等来学习草药表征,对药材配伍等处理效果不佳,这些问题限制中医的应用和发展。
而中医知识图谱的应用可以极大地提高中医知识的传播。通过中医知识图谱和人工智能算法的结合,可以重新梳理中医理论体系的复杂语义关系,找到其潜在的关联关系,从而使中医理论更加科学化和标准化。智能辅助诊疗系统可以利用中医知识图谱,对病历内容进行语义推理,为医生提供患者病情最相关的诊断证据和治疗方案,从而提高医生工作效率,减少误诊和漏诊的情况,为患者提供个性化的诊疗方案,提高患者的治疗质量。因此,中医辅助诊疗在中医诊疗现代化中扮演着关键角色,融合中医知识图谱信息,构建一种具备辨证论治内涵的智能中医辅助诊疗决策系统,为中医临床诊疗提供辅助决策支持,是促进中医诊疗智能化的发展的重点。
目前由于中医知识体系庞大、复杂,且分布在众多古籍和文献中,因此现有的中医处方推荐无法很好的处理松散、非结构化的知识,导致至中医知识的利用率不高;中医注重整体论,需要需要对患者的身体、年龄、性别、病史等多方面进行考虑,而非单纯地针对某一个症状或疾病进行治疗,但目前的中医处方推荐对患者个性化方面考虑不足;同时由于中药有一定的副作用,在遣药组方的过程中通过“君臣佐使”达到平衡药效和防止药物间相互抵消或产生副作用,然而目前的中医处方推荐对药材配伍的处理效果不好,存在诸多问题。
发明内容
为解决现有的中医处方推荐知识利用率不高,对患者个性化方面考虑不足,对药材配伍处理效果不好的问题,本发明提供了一种基于知识图谱的中医处方推荐方法。
本发明为解决上述技术问题所采用的技术方案是:一种基于知识图谱的中医处方推荐方法,包括以下步骤:
步骤一、收集中医数据并对数据进行预处理,去除重复数据、标准化实体名称;
步骤二、对预处理后的中医数据进行命名实体识别和关系抽取,得到实体集合E和关系集合R,将实体集合E中的实体要素作为节点,将关系集合R中的关系要素作为节点之间的连线,构建中医知识图谱;
步骤三、采用ComplEx模型对中医知识图谱进行表示学习,在中医知识图谱中选出所有症状节点和所有中药节点,并选出与症状节点或中药节点存在关系连线的年龄信息节点、性别信息节点、效用信息节点、药性信息节点、证候信息节点和治法治则信息节点,将上述选出的节点分别表示为复数向量,然后分别计算融合其它信息的症状节点向量表示s'和融合其它信息的中药节点向量表示h':
;
上式中,s为症状节点向量表示,h为中药节点向量表示,a为年龄向量表示,Wa为年龄权重矩阵,g为性别向量表示,Wg为性别权重矩阵,tr为治法治则向量表示,Wtr为治法治则权重矩阵,ef为效用向量表示,Wef为效用权重矩阵,p为药性向量表示,Wpr为药性权重矩阵,sy为证候向量表示,Wsy为证候权重矩阵;
然后通过ComplEx模型的嵌入层对融合其它信息的症状节点向量表示s'和融合其它信息的中药节点向量表示h'进行基于张量的知识图嵌入,将融合其它信息的症状节点向量表示s'映射到低维向量空间,得到使用图嵌入模型后的症状节点向量表示es',并将融合其它信息的中药节点向量表示h'映射到低维向量空间,得到使用图嵌入模型后的中药节点向量表示eh';
然后通过ComplEx模型的得分函数P(es',r,eh')对ComplEx模型进行训练并生成推荐训练集;
将使用图嵌入模型后的症状节点向量表示es'和使用图嵌入模型后的中药节点向量表示分别表示为:
;
上式中,Re(es')为es'的实部,Re(eh')为eh'的实部,Im(es')为es'的虚部,Im(eh')为eh'的虚部;
得分函数P(es',r,eh')的公式为:
;
;
上式中,r为es'和eh'之间的关系向量表示,σ为激活函数,Re(r)为r的实部,Im(r)为r的虚部;
步骤四、根据推荐训练集中KG实体的覆盖率,对ComplEx模型经过训练学习到的实体嵌入向量进行冻结或微调:
;
上式中,表示对实体嵌入向量/>进行冻结,/>表示对实体嵌入向量/>进行微调,threshold为实体覆盖率的判定阈值;
步骤五、通过图卷积神经网络学习症状节点自身特征信息rs和中药节点自身特征信息rh,症状节点自身特征信息rs通过症状节点在图卷积神经网络中每一层的向量表示获得,中药节点自身特征信息rh通过中药节点在图卷积神经网络中每一层的向量表示获得;
对于症状节点s,其一跳邻居草药节点集合为Ns,第k层邻居节点的消息为:
;
症状节点s在图卷积神经网络中第k层的向量表示为:
;
上式中,为症状节点的相邻节点数量,/>为症状节点在第k层的权重矩阵,为偏置项,tanh为激活函数,CONCAT为向量拼接操作,/>为第k-1层中药节点传递给症状节点的信息;
对于草药节点h,其一跳邻居症状节点集合为Nh,第k层邻居节点的消息为:
;
中药节点h在图卷积神经网络中第k层的向量表示为:
;
上式中,为中药节点的相邻节点数量,/>为中药节点在第k层的权重矩阵,为偏置项,tanh为激活函数,CONCAT为向量拼接操作,/>为第k-1层症状节点传递给中药节点的信息;
步骤六、采用注意力机制将图谱特征与推荐系统相结合,根据使用图嵌入模型后的症状节点向量表示es'和症状节点自身特征信息rs得到症状节点的Query矩阵、Key矩阵和Value 矩阵:
;
根据使用图嵌入模型后的中药节点向量表示eh'和中药节点自身特征信息rh得到中药节点的Query矩阵、Key矩阵和 Value 矩阵:
;
分别为从多头注意力层中的三个线性变换层学到的参数矩阵;
然后通过softmax函数计算症状节点的注意力矩阵As和中药节点的注意力矩阵Ah:
,式中dk为维度值;
然后求得症状节点的融合表示向量es *和中药节点的融合表示向量eh *:
;
步骤七、根据所需辨别的症状实体集合sc构建多热向量xsc:
;
根据症状节点的融合表示向量es *得到总体症状矩阵Es *:
;
然后将多热向量xsc作为掩码,对总体症状矩阵Es *进行抽取,得到辨别证候矩阵Msc:
,
通过diag函数将多热向量xsc转换为一个对角矩阵,并使辨别证候矩阵Msc中的非零行对应于症状实体集合sc中的症状节点的融合表示向量es *;
然后采用平均池化操作对辨别证候矩阵Msc进行单一归纳,得到单一表示向量esc:
;
将单一表示向量esc输入到多层感知机中,进行证候归纳,得到最终证候表示:
多层感知机的表达式为:
;
上式中,WL为第L层的权重矩阵,bL为第L层的偏置项,ReLU为非线性激活函数;
将多层感知机的输出作为最终证候表示向量ez,即ez=hL;
步骤八、根据中药节点的融合表示向量eh *得到总体中药矩阵EH *:
;
然后根据最终辨别向量ez和总体中药矩阵EH *得到预测概率向量m(sc):
,σ为激活函数;
对于每个候选中药,计算其预测概率与真实标签之间的二元交叉熵损失,并对所有中药求和,假设有H个候选中药,对于症状实体集合sc,通过m(sc)得到一个H维的预测概率向量,记为,模型选择m(sc)中概率最高的前k个中药作为推荐给症状sc的中药处方。
优选的,步骤一中,同时收集结构化数据和非结构化数据,结构化数据包括中医字典、数据库和本体论,非结构化数据包括中医文献、临床记录和专家知识。
根据上述技术方案,本发明的有益效果是:
本发明应用了知识图嵌入模型、多头注意力机制、图卷积等将图谱特征与推荐系统相结合,综合考虑患者情况,进行中医处方推荐。以中医医案描述文本为研究对象,融合中医知识图谱信息,吸取名老中医的临床对症下药经验,充分综合考虑药性、功效、病情和患者的体质等多个个性化因素,在于依据中医的整体论原则及辨证论治的思想,根据患者的不同症状和病情归纳证候选择不同的药材组合,提出融合知识图谱的中医处方推荐方法,考虑个人体征及症状和药物之间的复杂关系,结合每个处方具体分析局部规律,为医生和患者推荐更可靠的处方药材,为中医临床诊疗提供辅助决策支持。
具体实施方式
一种基于知识图谱的中医处方推荐方法,包括以下步骤:
步骤一、收集中医数据并对数据进行预处理,去除重复数据、标准化实体名称。同时收集结构化数据和非结构化数据,结构化数据包括中医字典、数据库和本体论,非结构化数据包括中医文献、临床记录和专家知识。
步骤二、对预处理后的中医数据进行命名实体识别和关系抽取,得到实体集合E和关系集合R,将实体集合E中的实体要素作为节点,将关系集合R中的关系要素作为节点之间的连线,构建中医知识图谱。
步骤三、采用ComplEx模型对中医知识图谱进行表示学习,在中医知识图谱中选出所有症状节点和所有中药节点,并选出与症状节点或中药节点存在关系连线的年龄信息节点、性别信息节点、效用信息节点、药性信息节点、证候信息节点和治法治则信息节点,将上述选出的节点分别表示为复数向量,然后分别计算融合其它信息的症状节点向量表示s'和融合其它信息的中药节点向量表示h':
;
上式中,s为症状节点向量表示,h为中药节点向量表示,a为年龄向量表示,Wa为年龄权重矩阵,g为性别向量表示,Wg为性别权重矩阵,tr为治法治则向量表示,Wtr为治法治则权重矩阵,ef为效用向量表示,Wef为效用权重矩阵,p为药性向量表示,Wpr为药性权重矩阵,sy为证候向量表示,Wsy为证候权重矩阵。
然后通过ComplEx模型的嵌入层对融合其它信息的症状节点向量表示s'和融合其它信息的中药节点向量表示h'进行基于张量的知识图嵌入,将融合其它信息的症状节点向量表示s'映射到低维向量空间,得到使用图嵌入模型后的症状节点向量表示es',并将融合其它信息的中药节点向量表示h'映射到低维向量空间,得到使用图嵌入模型后的中药节点向量表示eh'。
然后通过ComplEx模型的得分函数P(es',r,eh')对ComplEx模型进行训练并生成推荐训练集。
将使用图嵌入模型后的症状节点向量表示es'和使用图嵌入模型后的中药节点向量表示分别表示为:
;
上式中,Re(es')为es'的实部,Re(eh')为eh'的实部,Im(es')为es'的虚部,Im(eh')为eh'的虚部。
得分函数P(es',r,eh')的公式为:
;
;
上式中,r为es'和eh'之间的关系向量表示,σ为激活函数,Re(r)为r的实部,Im(r)为r的虚部。
步骤四、根据推荐训练集中KG实体的覆盖率,对ComplEx模型经过训练学习到的实体嵌入向量进行冻结或微调:
;
上式中,表示对实体嵌入向量/>进行冻结,/>表示对实体嵌入向量/>进行微调,threshold为实体覆盖率的判定阈值。
步骤五、通过图卷积神经网络学习症状节点自身特征信息和中药节点自身特征信息,症状节点自身特征信息通过症状节点在图卷积神经网络中每一层的向量表示获得,中药节点自身特征信息通过中药节点在图卷积神经网络中每一层的向量表示获得。
对于症状节点s,其一跳邻居草药节点集合为Ns,第k层邻居节点的消息为:
;
症状节点s在图卷积神经网络中第k层的向量表示为:
;
上式中,为症状节点的相邻节点数量,/>为症状节点在第k层的权重矩阵,为偏置项,tanh为激活函数,CONCAT为向量拼接操作,/>为第k-1层中药节点传递给症状节点的信息。
对于草药节点h,其一跳邻居症状节点集合为Nh,第k层邻居节点的消息为:
;
中药节点h在图卷积神经网络中第k层的向量表示为:
;
上式中,为中药节点的相邻节点数量,/>为中药节点在第k层的权重矩阵,为偏置项,tanh为激活函数,CONCAT为向量拼接操作,/>为第k-1层症状节点传递给中药节点的信息。
步骤六、采用注意力机制将图谱特征与推荐系统相结合,根据使用图嵌入模型后的症状节点向量表示和症状节点自身特征信息得到症状节点的Query矩阵、Key矩阵和Value 矩阵:
;
根据使用图嵌入模型后的中药节点向量表示eh'和中药节点自身特征信息rh得到中药节点的Query矩阵、Key矩阵和 Value 矩阵:
;
分别为从多头注意力层中的三个线性变换层学到的参数矩阵。
然后通过softmax函数计算症状节点的注意力矩阵As和中药节点的注意力矩阵Ah:
,式中dk为维度值。
然后求得症状节点的融合表示向量es *和中药节点的融合表示向量eh *:
。
步骤七、根据所需辨别的症状实体集合sc构建多热向量xsc:
;
根据症状节点的融合表示向量es *得到总体症状矩阵Es *:
。
然后将多热向量xsc作为掩码,对总体症状矩阵Es *进行抽取,得到辨别证候矩阵Msc:
,
通过diag函数将多热向量xsc转换为一个对角矩阵,并使辨别证候矩阵Msc中的非零行对应于症状实体集合sc中的症状节点的融合表示向量es *。
然后采用平均池化操作对辨别证候矩阵Msc进行单一归纳,得到单一表示向量esc:
。
将单一表示向量esc输入到多层感知机中,进行证候归纳,得到最终证候表示。
多层感知机的表达式为:
;
上式中,WL为第L层的权重矩阵,bL为第L层的偏置项,ReLU为非线性激活函数;
将多层感知机的输出作为最终证候表示向量ez,即ez=hL。
步骤八、根据中药节点的融合表示向量eh *得到总体中药矩阵EH *:
。
然后根据最终辨别向量ez和总体中药矩阵EH *得到预测概率向量m(sc):
,σ为激活函数。
对于每个候选中药,计算其预测概率与真实标签之间的二元交叉熵损失,并对所有中药求和,假设有H个候选中药,对于症状实体集合sc,通过m(sc)得到一个H维的预测概率向量,记为,模型选择m(sc)中概率最高的前k个中药作为推荐给症状sc的中药处方。
Claims (2)
1.一种基于知识图谱的中医处方推荐方法,其特征在于,包括以下步骤:
步骤一、收集中医数据并对数据进行预处理,去除重复数据、标准化实体名称;
步骤二、对预处理后的中医数据进行命名实体识别和关系抽取,得到实体集合E和关系集合R,将实体集合E中的实体要素作为节点,将关系集合R中的关系要素作为节点之间的连线,构建中医知识图谱;
步骤三、采用ComplEx模型对中医知识图谱进行表示学习,在中医知识图谱中选出所有症状节点和所有中药节点,并选出与症状节点或中药节点存在关系连线的年龄信息节点、性别信息节点、效用信息节点、药性信息节点、证候信息节点和治法治则信息节点,将上述选出的节点分别表示为复数向量,然后分别计算融合其它信息的症状节点向量表示s'和融合其它信息的中药节点向量表示h':
;
上式中,s为症状节点向量表示,h为中药节点向量表示,a为年龄向量表示,Wa为年龄权重矩阵,g为性别向量表示,Wg为性别权重矩阵,tr为治法治则向量表示,Wtr为治法治则权重矩阵,ef为效用向量表示,Wef为效用权重矩阵,p为药性向量表示,Wpr为药性权重矩阵,sy为证候向量表示,Wsy为证候权重矩阵;
然后通过ComplEx模型的嵌入层对融合其它信息的症状节点向量表示s'和融合其它信息的中药节点向量表示h'进行基于张量的知识图嵌入,将融合其它信息的症状节点向量表示s'映射到低维向量空间,得到使用图嵌入模型后的症状节点向量表示es',并将融合其它信息的中药节点向量表示h'映射到低维向量空间,得到使用图嵌入模型后的中药节点向量表示eh';
然后通过ComplEx模型的得分函数P(es',r,eh')对ComplEx模型进行训练并生成推荐训练集;
将使用图嵌入模型后的症状节点向量表示es'和使用图嵌入模型后的中药节点向量表示分别表示为:
;
上式中,Re(es')为es'的实部,Re(eh')为eh'的实部,Im(es')为es'的虚部,Im(eh')为eh'的虚部;
得分函数P(es',r,eh')的公式为:
;
;
上式中,r为es'和eh'之间的关系向量表示,σ为激活函数,Re(r)为r的实部,Im(r)为r的虚部;
步骤四、根据推荐训练集中KG实体的覆盖率,对ComplEx模型经过训练学习到的实体嵌入向量进行冻结或微调:
;
上式中,表示对实体嵌入向量/>进行冻结,/>表示对实体嵌入向量/>进行微调,threshold为实体覆盖率的判定阈值;
步骤五、通过图卷积神经网络学习症状节点自身特征信息rs和中药节点自身特征信息rh,症状节点自身特征信息rs通过症状节点在图卷积神经网络中每一层的向量表示获得,中药节点自身特征信息rh通过中药节点在图卷积神经网络中每一层的向量表示获得;
对于症状节点s,其一跳邻居草药节点集合为Ns,第k层邻居节点的消息为:
;
症状节点s在图卷积神经网络中第k层的向量表示为:
;
上式中,为症状节点的相邻节点数量,/>为症状节点在第k层的权重矩阵,/>为偏置项,tanh为激活函数,CONCAT为向量拼接操作,/>为第k-1层中药节点传递给症状节点的信息;
对于草药节点h,其一跳邻居症状节点集合为Nh,第k层邻居节点的消息为:
;
中药节点h在图卷积神经网络中第k层的向量表示为:
;
上式中,为中药节点的相邻节点数量,/>为中药节点在第k层的权重矩阵,/>为偏置项,tanh为激活函数,CONCAT为向量拼接操作,/>为第k-1层症状节点传递给中药节点的信息;
步骤六、采用注意力机制将图谱特征与推荐系统相结合,根据使用图嵌入模型后的症状节点向量表示es'和症状节点自身特征信息rs得到症状节点的Query矩阵、Key矩阵和Value 矩阵:
;
根据使用图嵌入模型后的中药节点向量表示eh'和中药节点自身特征信息rh得到中药节点的Query矩阵、Key矩阵和 Value 矩阵:
;
分别为从多头注意力层中的三个线性变换层学到的参数矩阵;
然后通过softmax函数计算症状节点的注意力矩阵As和中药节点的注意力矩阵Ah:
,式中dk为维度值;
然后求得症状节点的融合表示向量es *和中药节点的融合表示向量eh *:
;
步骤七、根据所需辨别的症状实体集合sc构建多热向量xsc:
;
根据症状节点的融合表示向量es *得到总体症状矩阵Es *:
;
然后将多热向量xsc作为掩码,对总体症状矩阵Es *进行抽取,得到辨别证候矩阵Msc:
,
通过diag函数将多热向量xsc转换为一个对角矩阵,并使辨别证候矩阵Msc中的非零行对应于症状实体集合sc中的症状节点的融合表示向量es *;
然后采用平均池化操作对辨别证候矩阵Msc进行单一归纳,得到单一表示向量esc:
;
将单一表示向量esc输入到多层感知机中,进行证候归纳,得到最终证候表示:
多层感知机的表达式为:
;
上式中,WL为第L层的权重矩阵,bL为第L层的偏置项,ReLU为非线性激活函数;
将多层感知机的输出作为最终证候表示向量ez,即ez=hL;
步骤八、根据中药节点的融合表示向量eh *得到总体中药矩阵EH *:
;
然后根据最终辨别向量ez和总体中药矩阵EH *得到预测概率向量m(sc):
,σ为激活函数;
对于每个候选中药,计算其预测概率与真实标签之间的二元交叉熵损失,并对所有中药求和,假设有H个候选中药,对于症状实体集合sc,通过m(sc)得到一个H维的预测概率向量,记为,模型选择m(sc)中概率最高的前k个中药作为推荐给症状sc的中药处方。
2.根据权利要求1所述的一种基于知识图谱的中医处方推荐方法,其特征在于:步骤一中,同时收集结构化数据和非结构化数据,结构化数据包括中医字典、数据库和本体论,非结构化数据包括中医文献、临床记录和专家知识。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310690324.1A CN116680412A (zh) | 2023-06-12 | 2023-06-12 | 一种基于知识图谱的中医处方推荐方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310690324.1A CN116680412A (zh) | 2023-06-12 | 2023-06-12 | 一种基于知识图谱的中医处方推荐方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116680412A true CN116680412A (zh) | 2023-09-01 |
Family
ID=87786931
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310690324.1A Pending CN116680412A (zh) | 2023-06-12 | 2023-06-12 | 一种基于知识图谱的中医处方推荐方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116680412A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117708338A (zh) * | 2024-02-05 | 2024-03-15 | 成都中医药大学 | 一种中文电子病历实体识别与四诊分类的抽取方法及模型 |
-
2023
- 2023-06-12 CN CN202310690324.1A patent/CN116680412A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117708338A (zh) * | 2024-02-05 | 2024-03-15 | 成都中医药大学 | 一种中文电子病历实体识别与四诊分类的抽取方法及模型 |
CN117708338B (zh) * | 2024-02-05 | 2024-04-26 | 成都中医药大学 | 一种中文电子病历实体识别与四诊分类的抽取方法及模型 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109086805B (zh) | 一种基于深度神经网络和成对约束的聚类方法 | |
CN107193919A (zh) | 一种电子病历的检索方法及系统 | |
CN111951975B (zh) | 一种基于深度学习模型gpt-2的脓毒症早期预警方法 | |
CN107038343A (zh) | 临床诊断模型的构建方法及构建系统、临床诊断系统 | |
CN110838368A (zh) | 一种基于中医临床知识图谱的机器人主动问诊方法 | |
Sharma et al. | Deep neuro‐fuzzy approach for risk and severity prediction using recommendation systems in connected health care | |
Jiang et al. | A hybrid intelligent model for acute hypotensive episode prediction with large-scale data | |
CN107180155A (zh) | 一种基于异构集成模型的疾病预测方法及系统 | |
CN116680412A (zh) | 一种基于知识图谱的中医处方推荐方法 | |
CN108511056A (zh) | 基于脑卒中患者相似性分析的治疗方案推荐方法及系统 | |
CN111477295B (zh) | 一种基于隐语义模型的中医组方推荐方法及系统 | |
CN112489769A (zh) | 基于深度神经网络的慢性病智慧中医诊断与药物推荐系统 | |
Balakrishnan et al. | Prediction of cardiovascular disease using machine learning | |
CN112086195A (zh) | 一种基于自适应集成学习模型的再入院风险预测方法 | |
Chowdary et al. | An effective approach for detecting diabetes using deep learning techniques based on convolutional LSTM networks | |
CN109360658A (zh) | 一种基于词向量模型的疾病模式挖掘方法及装置 | |
CN113539412B (zh) | 基于深度学习的中草药推荐系统 | |
CN107578822B (zh) | 一种针对医疗多模态大数据的预处理及特征提取方法 | |
Thinsungnoen et al. | Deep autoencoder networks optimized with genetic algorithms for efficient ECG clustering | |
CN114141361B (zh) | 基于症状术语映射与深度学习的中医处方推荐方法 | |
Hegde et al. | Symmetrized Feature Selection with Stacked Generalization based Machine Learning Algorithm for the Early Diagnosis of Chronic Diseases | |
Gupta et al. | An optimal multi-disease prediction framework using hybrid machine learning techniques: 10.48129/kjs. splml. 19321 | |
CN116682536A (zh) | 基于改进Bert4Rec的中医药方推荐方法 | |
CN115424696A (zh) | 一种基于迁移学习的中医罕见病中药处方生成方法和系统 | |
CN112836512B (zh) | 基于自然语义处理和知识图谱的icd-11编码检索方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |