CN115423052B - 基于多图注意力的中医证型分类方法 - Google Patents

基于多图注意力的中医证型分类方法 Download PDF

Info

Publication number
CN115423052B
CN115423052B CN202211381693.4A CN202211381693A CN115423052B CN 115423052 B CN115423052 B CN 115423052B CN 202211381693 A CN202211381693 A CN 202211381693A CN 115423052 B CN115423052 B CN 115423052B
Authority
CN
China
Prior art keywords
symptom
syndrome
graph
attention
symptoms
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211381693.4A
Other languages
English (en)
Other versions
CN115423052A (zh
Inventor
赵静
李文友
江肇洋
尹杰
陈莹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Dajing Tcm Information Technology Co ltd
Original Assignee
Nanjing Dajing Tcm Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Dajing Tcm Information Technology Co ltd filed Critical Nanjing Dajing Tcm Information Technology Co ltd
Priority to CN202211381693.4A priority Critical patent/CN115423052B/zh
Publication of CN115423052A publication Critical patent/CN115423052A/zh
Application granted granted Critical
Publication of CN115423052B publication Critical patent/CN115423052B/zh
Priority to US18/337,459 priority patent/US11948693B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/90ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to alternative medicines, e.g. homeopathy or oriental medicines
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Alternative & Traditional Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种基于多图注意力的中医证型分类方法,通过构造图结构的形式综合考虑了症状和证素在证型分类中的贡献,将症状‑症状图和症状‑证素图集成到分类中,并且使用多图注意力网络来聚合症状和证素的特征,最后通过多层感知机实现证型分类,同时在真实数据集上进行了广泛的实验,验证了多图注意力网络的有效性,实现了更精准的分类,取得了较好的分类效果。

Description

基于多图注意力的中医证型分类方法
技术领域
本发明涉及分类技术领域,具体但不限于涉及一种基于多图注意力的中医证型分类方法。
背景技术
中医历史悠久、底蕴深厚,为全人类的健康事业做出了巨大的贡献。证型是由不同的病因引起阴阳气血的不同变化导致人体的不同疾病状态,证型能够揭示病变的机理和发展趋势,中医学将其作为确定治法、处方开药的依据,因此实现精准的证型分类在中医治疗中至关重要。
医生是依据个人的经验来通过望、闻、问、切四种诊断方法来判断证型,仅靠个人经验其主观性强,这使得中医难以推广。随着人工智能技术的发展,目前已经有许多机器学习和深度学习的算法应用于证型分类中,使得传统中医与计算机辅助诊断相结合。朱文锋等在《贝叶斯网络在中医证素辨证体系中的应用》中提出,使用贝叶斯网络,结合相关的经验和算法模型,其模型的诊断结果和经验丰富的老中医的诊断结果一致。张承江等在《中医肾病治疗信息中关联规则的挖掘算法》中把经典的先验相关算法和fp-生长相关算法运用到中医证型分类,运用数据挖掘技术,寻找中医症状与中医综合征类型之间的映射关系。吴燎等在《基于共轭梯度下降算法的BP神经网络的中医糖尿病诊断模型研究》中构建了基于共轭梯度算法建立了治疗中医冠心病综合征的BP神经网络,该模型参考了14种综合征,表现良好。Hu等在《A preliminary study on imbalanced syndrome differentiation ofcold and heat》中使用神经网络分类器来区分冷综合征和热综合征,并通过fastText对不平衡数据的不敏感性来验证该方法的有效性。
但是现有方法只考虑了症状和证型之间的关系,并未考虑证素这个关键成分,同时症状和证型之间的关系是非常复杂和非线性的,使用传统的机器学习方法很难准确的提取两者之间的关系,这使得现有算法的准确率并不高。
有鉴于此,需要提供一种新的方法,以期解决上述至少部分问题。
发明内容
针对现有技术中的一个或多个问题,本发明提出了一种基于多图注意力的中医证型分类方法,通过构造图结构的形式综合考虑了症状和证素在证型分类中的贡献,将症状-症状图和症状-证素-症状图集成到分类中,并且使用多图注意力网络来聚合症状和证素的特征,最后通过多层感知机实现证型分类,同时在真实数据集上进行了广泛的实验,验证了多图注意力网络的有效性,实现了更精准的分类结果,取得了较好的效果。
实现本发明目的的技术解决方案为:
一种基于多图注意力的中医证型分类方法,包括:
步骤1、获取包含若干条临床数据的数据集,利用症状和证素的关系构建症状-症 状图
Figure 68814DEST_PATH_IMAGE001
、症状-证素图
Figure 200719DEST_PATH_IMAGE002
和症状嵌入矩阵
Figure 460799DEST_PATH_IMAGE003
步骤2、基于多图注意力网络对症状-症状图
Figure 70771DEST_PATH_IMAGE001
和症状-证素图
Figure 834328DEST_PATH_IMAGE002
分别进行图注 意力特征聚合,得到症状与症状之间的特征表示
Figure 137133DEST_PATH_IMAGE004
和症状与证素之间的特征表示
Figure 618930DEST_PATH_IMAGE005
; 将症状与症状之间的特征表示
Figure 32594DEST_PATH_IMAGE004
与症状与证素之间的特征表示
Figure 916237DEST_PATH_IMAGE005
进行矩阵拼接,得 到新的症状特征表示
Figure 389943DEST_PATH_IMAGE006
;将症状嵌入矩阵
Figure 93457DEST_PATH_IMAGE003
与新的症状特征表示
Figure 310812DEST_PATH_IMAGE006
相乘,获得症状组 合特征表示
Figure 48961DEST_PATH_IMAGE007
,所述症状组合特征表示
Figure 693569DEST_PATH_IMAGE007
包含了症状和证素的信息;
步骤3、基于症状组合特征表示
Figure 149958DEST_PATH_IMAGE007
,使用多层感知机MLP作为分类器进行证型分类预测。
进一步的,本发明的基于多图注意力的中医证型分类方法,步骤1中,每条临床数 据均由症状、证素和证型的多热编码表示:症状集合
Figure 905424DEST_PATH_IMAGE008
、证素集合
Figure 498079DEST_PATH_IMAGE009
和证型集合
Figure 313589DEST_PATH_IMAGE010
Figure 991695DEST_PATH_IMAGE011
为数据集中包 含的症状的数量,
Figure 550852DEST_PATH_IMAGE012
为数据集中包含的证素数量,l为数据集中包含的证型数量;对于任意 一条临床数据,若第
Figure 263593DEST_PATH_IMAGE013
个症状/证素/证型出现,则在对应症状集合
Figure 250004DEST_PATH_IMAGE014
/证素集合
Figure 415406DEST_PATH_IMAGE015
/证型集 合
Figure 512675DEST_PATH_IMAGE016
中相应的位置置1,否则置0。
进一步的,本发明的基于多图注意力的中医证型分类方法,步骤1中构建症状-症状图、症状-证素图和症状嵌入矩阵的具体步骤包括:
步骤1-1:构建症状-症状无向图
Figure 345502DEST_PATH_IMAGE017
:统计所有症状在临床数据中出现的频次,把 频次≥阈值的症状提取出来,并两两相连构成症状-症状无向图
Figure 237234DEST_PATH_IMAGE017
步骤1-2:构建症状-证素无向图
Figure 889932DEST_PATH_IMAGE002
:比较任意两条临床数据,统计两者中相同证 素的数量,如果相同证素的数量>阈值,则将该两条临床数据的症状相互连接;
步骤1-3:构建症状嵌入矩阵
Figure 790892DEST_PATH_IMAGE018
,定义
Figure 478226DEST_PATH_IMAGE019
,其中,
Figure 72018DEST_PATH_IMAGE020
是临床数据的总数。
进一步的,本发明的基于多图注意力的中医证型分类方法,步骤2中基于多层图注 意力网络对症状-症状图
Figure 212012DEST_PATH_IMAGE001
和症状-证素图
Figure 651084DEST_PATH_IMAGE002
分别进行图注意力特征聚合的具体步骤包 括:
1)分别计算症状-症状图
Figure 192924DEST_PATH_IMAGE001
和症状-证素图
Figure 697898DEST_PATH_IMAGE002
中节点对
Figure 590767DEST_PATH_IMAGE021
的注意力系数
Figure 567950DEST_PATH_IMAGE022
Figure 964297DEST_PATH_IMAGE024
(1)
其中,
Figure 634313DEST_PATH_IMAGE025
为共享权重矩阵,
Figure 748899DEST_PATH_IMAGE026
是输入特征的个数,
Figure 795352DEST_PATH_IMAGE027
是输出特征的个 数,
Figure 46205DEST_PATH_IMAGE028
Figure 887122DEST_PATH_IMAGE029
节点的特征,
Figure 489005DEST_PATH_IMAGE030
Figure 73570DEST_PATH_IMAGE031
节点的特征,
Figure 444508DEST_PATH_IMAGE032
是拼接向量映射到实数上,LeakyReLU为 激活函数,节点对
Figure 456327DEST_PATH_IMAGE021
是指在无向图中有边连接的两个点;
对每个节点对
Figure 545506DEST_PATH_IMAGE021
的注意力系数进行归一化,得到归一化的注意力系数
Figure 668182DEST_PATH_IMAGE033
Figure 893627DEST_PATH_IMAGE034
(2)
其中,
Figure 341926DEST_PATH_IMAGE035
Figure 652822DEST_PATH_IMAGE013
的邻居节点;
2)将症状-症状图
Figure 579190DEST_PATH_IMAGE001
的症状聚集到其一阶邻近点,得到一阶症状聚合表示
Figure 924720DEST_PATH_IMAGE036
Figure 278341DEST_PATH_IMAGE037
(3)
其中,
Figure 76533DEST_PATH_IMAGE038
表示注意力的头数,
Figure 806592DEST_PATH_IMAGE039
是节点
Figure 6629DEST_PATH_IMAGE040
的一阶邻居,
Figure 531151DEST_PATH_IMAGE041
为症状-症状图注 意力的互相关系数,
Figure 816639DEST_PATH_IMAGE042
为症状-症状图输入特征的线性变换矩阵,
Figure 84809DEST_PATH_IMAGE043
为症状-症状图相 邻节点的原始特征表示,
Figure 139353DEST_PATH_IMAGE044
Figure 100356DEST_PATH_IMAGE045
激活函数;
对一阶症状聚合表示
Figure 873139DEST_PATH_IMAGE046
加入残差项,得到症状-症状图
Figure 679421DEST_PATH_IMAGE001
的第1层图注意力网 络的特征聚合结果
Figure 854051DEST_PATH_IMAGE047
为:
Figure 454796DEST_PATH_IMAGE048
(4)
其中,Linear是线性层,
Figure 732455DEST_PATH_IMAGE049
为症状-症状图在模型中的残差项;
同理,症状-证素图
Figure 342427DEST_PATH_IMAGE050
的第1层图注意力网络的特征聚合结果
Figure 637143DEST_PATH_IMAGE051
为:
Figure 674369DEST_PATH_IMAGE053
(5)
其中,
Figure 421745DEST_PATH_IMAGE054
是节点
Figure 835409DEST_PATH_IMAGE055
的一阶邻居,
Figure 719051DEST_PATH_IMAGE056
为症状-证素图注意力的互相关系数,
Figure 458337DEST_PATH_IMAGE057
为症状-证素图输入特征的线性变换矩阵,
Figure 427430DEST_PATH_IMAGE058
为症状-证素图相邻节点的原始特征表示,
Figure 644785DEST_PATH_IMAGE059
为症状-证素图在模型中的残差项;
3)通过堆叠多层图注意力分别聚合症状-症状图
Figure 648513DEST_PATH_IMAGE001
、症状-证素图
Figure 293121DEST_PATH_IMAGE002
的高阶相邻 节点特征,得到症状-症状图
Figure 749510DEST_PATH_IMAGE001
Figure 504976DEST_PATH_IMAGE060
层图注意力网络的特征聚合结果
Figure 363211DEST_PATH_IMAGE061
为:
Figure 444299DEST_PATH_IMAGE063
(6)
其中,
Figure 653564DEST_PATH_IMAGE060
为当前的层数, />
Figure 947142DEST_PATH_IMAGE064
为图注意力网络的总层数;
症状-证素图
Figure 659883DEST_PATH_IMAGE002
Figure 380714DEST_PATH_IMAGE060
层图注意力网络的特征聚合结果
Figure 811696DEST_PATH_IMAGE065
为:
Figure 908965DEST_PATH_IMAGE066
(7)
4)最后一层的多头注意力是取所有多头注意力的平均值,则症状-症状图
Figure 476212DEST_PATH_IMAGE001
Figure 367945DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 286222DEST_PATH_IMAGE067
为:
Figure 187182DEST_PATH_IMAGE068
(8)
症状-证素图
Figure 608936DEST_PATH_IMAGE002
Figure 937149DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 811565DEST_PATH_IMAGE069
为:
Figure 516215DEST_PATH_IMAGE070
(9)
症状-症状图
Figure 63914DEST_PATH_IMAGE001
Figure 828608DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 455899DEST_PATH_IMAGE071
即为症状与症状之间 的特征表示
Figure 698661DEST_PATH_IMAGE072
,症状-证素图
Figure 95007DEST_PATH_IMAGE002
Figure 765023DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 879610DEST_PATH_IMAGE073
即为症状与 证素之间的特征表示
Figure 660484DEST_PATH_IMAGE074
进一步的,本发明的基于多图注意力的中医证型分类方法,步骤2中矩阵拼接操作的公式为:
Figure 176916DEST_PATH_IMAGE075
(10)
其中,
Figure 17833DEST_PATH_IMAGE076
为两个矩阵的拼接操作。
进一步的,本发明的基于多图注意力的中医证型分类方法,症状组合特征表示
Figure 354136DEST_PATH_IMAGE007
为:
Figure 204281DEST_PATH_IMAGE077
(11)
其中,
Figure 309640DEST_PATH_IMAGE078
为两个矩阵进行相乘操作。
进一步的,本发明的基于多图注意力的中医证型分类方法,使用多层感知机MLP进行证型分类预测的具体步骤包括:
将症状组合特征表示
Figure 321458DEST_PATH_IMAGE007
输入多层感知机MLP,经过计算后得到模型预测的证型类 别
Figure 145058DEST_PATH_IMAGE079
Figure 533314DEST_PATH_IMAGE081
(12)
其中,
Figure 758759DEST_PATH_IMAGE082
和/>
Figure 941478DEST_PATH_IMAGE083
分别为第一层和第二层的权值矩阵,/>
Figure 517953DEST_PATH_IMAGE084
和/>
Figure 178742DEST_PATH_IMAGE085
分别为第一层和第二层的偏置向量,概率最大的类别即为分类的结果;
利用BCE损失函数来计算模型预测和用于训练模型的实际输出之间的差距
Figure 258693DEST_PATH_IMAGE064
Figure 877893DEST_PATH_IMAGE087
(13)
其中,
Figure 676085DEST_PATH_IMAGE020
是证型类别的数量,
Figure 406144DEST_PATH_IMAGE088
是真实的类别。
一种基于多图注意力和多层感知机的中医证型分类系统,包括:
多图构造模块,基于临床数据集,利用症状和证素的关系构建症状-症状图、症状-证素图和症状嵌入矩阵;
多图注意力特征聚合模块,基于多图注意力网络对症状-症状图
Figure 340602DEST_PATH_IMAGE001
和症状-证素 图
Figure 865124DEST_PATH_IMAGE002
分别进行图注意力特征聚合,再进行矩阵拼接,得到新的症状特征表示;将症状嵌入 矩阵与新的症状特征表示相乘,获得症状组合特征表示;
证型分类模块,基于症状组合特征表示,使用多层感知机作为分类器进行证型分类预测。
本发明采用以上技术方案与现有技术相比,具有以下技术效果:
1、本发明的基于多图注意力的中医证型分类方法运用多个无向图,构建了一个多图注意力网络(MGAT)模型,获得了更具表达能力的症状综合嵌入表示。
2、本发明的基于多图注意力的中医证型分类方法引入多个图聚合症状和证素之间的关系,运用多图注意力网络得到包含症状和证素信息的新的特征表示。
3、本发明的基于多图注意力的中医证型分类方法中构建的多图注意力网络(MGAT)模型不但符合中医理论,且在证型分类性能上表现突出,在中医领域广泛采用的伤寒论数据集上进行实验,验证了本发明分类方法的优越性。
附图说明
附图用来提供对本发明的进一步理解,与说明描述一起用于解释本发明的实施例,并不构成对本发明的限制。在附图中:
图1示出了本发明的基于多图注意力的中医证型分类方法的流程图。
图2示出了本发明的基于多图注意力的中医证型分类方法的多图注意力网络模型示意图。
具体实施方式
为了进一步理解本发明,下面结合实施例对本发明优选实施方案进行描述,但是应当理解,这些描述只是为进一步说明本发明的特征和优点,而不是对本发明权利要求的限制。
该部分的描述只针对典型的实施例,本发明并不仅局限于实施例描述的范围。不同实施例的组合、不同实施例中的一些技术特征进行相互替换,相同或相近的现有技术手段与实施例中的一些技术特征进行相互替换也在本发明描述和保护的范围内。
由于单个症状图只能聚合部分信息,这导致图注意力网络不能够很好的表示症状和证型之间的关系。本发明通过将症状-症状图和症状-证素-症状图集成到分类中,提出了一个多图注意力网络(MGAT)。
根据本发明的一个方面,一种基于多图注意力的中医证型分类方法,如图1所示,包括:
步骤1、获取包含若干条临床数据的数据集,利用症状和证素的关系构建症状-症 状图
Figure 150612DEST_PATH_IMAGE001
、症状-证素图
Figure 418782DEST_PATH_IMAGE002
和症状嵌入矩阵
Figure 473326DEST_PATH_IMAGE089
。具体步骤包括:
步骤1-1:构建症状-症状无向图
Figure 434328DEST_PATH_IMAGE001
:统计所有症状在临床数据中出现的频次,把 频次≥阈值
Figure 941533DEST_PATH_IMAGE090
的症状提取出来,并两两相连构成症状-症状无向图
Figure 747815DEST_PATH_IMAGE001
步骤1-2:构建症状-证素无向图
Figure 922445DEST_PATH_IMAGE002
:比较任意两条临床数据,统计两者中相同证 素的数量,如果相同证素的数量>阈值,则将该两条临床数据的症状相互连接。如果两个症 状和多个证素同时存在,则两种症状之间存在特殊的关系,这是构建症状-证素无向图的依 据。
步骤1-3:构建症状嵌入矩阵
Figure 788769DEST_PATH_IMAGE018
,定义
Figure 42990DEST_PATH_IMAGE019
,其中,
Figure 652963DEST_PATH_IMAGE091
是临床数据的总数。
优选的,每条临床数据均由症状、证素和证型的多热编码表示:症状集合
Figure 416520DEST_PATH_IMAGE008
、证素集合
Figure 453746DEST_PATH_IMAGE009
和证型集合
Figure 201122DEST_PATH_IMAGE010
Figure 614786DEST_PATH_IMAGE011
为数据集中包含的症状的数量,
Figure 498428DEST_PATH_IMAGE012
为数据集中包含的证 素数量,l为数据集中包含的证型数量;对于任意一条临床数据,若第
Figure 972135DEST_PATH_IMAGE092
个症状/证素/证型 出现,则在对应症状集合
Figure 941228DEST_PATH_IMAGE014
/证素集合
Figure 893003DEST_PATH_IMAGE015
/证型集合
Figure 896731DEST_PATH_IMAGE016
中相应的位置置1,否则置0。
步骤2、基于多图注意力网络对症状-症状图
Figure 275760DEST_PATH_IMAGE001
和症状-证素图
Figure 466570DEST_PATH_IMAGE002
分别进行图注 意力特征聚合,得到症状与症状之间的特征表示
Figure 222036DEST_PATH_IMAGE004
和症状与证素之间的特征表示
Figure 80271DEST_PATH_IMAGE005
; 具体步骤包括:
1)分别计算症状-症状图
Figure 895780DEST_PATH_IMAGE001
和症状-证素图
Figure 839465DEST_PATH_IMAGE002
中节点对
Figure 133044DEST_PATH_IMAGE021
的注意力系数
Figure 845785DEST_PATH_IMAGE022
Figure 566616DEST_PATH_IMAGE024
(1)
其中,
Figure 997597DEST_PATH_IMAGE025
为共享权重矩阵,
Figure 94866DEST_PATH_IMAGE026
是输入特征的个数,
Figure 662114DEST_PATH_IMAGE027
是输出特征的个数,
Figure 819426DEST_PATH_IMAGE028
Figure 737703DEST_PATH_IMAGE029
节点的特征,
Figure 638663DEST_PATH_IMAGE030
Figure 60417DEST_PATH_IMAGE031
节点的特征,
Figure 654209DEST_PATH_IMAGE032
是拼接向量映射到实数上,LeakyReLU为激 活函数,节点对
Figure 794204DEST_PATH_IMAGE021
是指在无向图中有边连接的两个点;
对每个节点对
Figure 233275DEST_PATH_IMAGE021
的注意力系数进行归一化,得到归一化的注意力系数
Figure 775115DEST_PATH_IMAGE033
Figure 274230DEST_PATH_IMAGE034
(2)
其中,
Figure 901520DEST_PATH_IMAGE035
Figure 613124DEST_PATH_IMAGE013
的邻居节点;
2)将症状-症状图
Figure 280909DEST_PATH_IMAGE001
的症状聚集到其一阶邻近点,得到一阶症状聚合表示
Figure 950925DEST_PATH_IMAGE036
Figure 65511DEST_PATH_IMAGE037
(3)
其中,
Figure 846385DEST_PATH_IMAGE038
表示注意力的头数,
Figure 362817DEST_PATH_IMAGE039
是节点
Figure 469314DEST_PATH_IMAGE040
的一阶邻居,
Figure 805617DEST_PATH_IMAGE041
为症状-症状图注意 力的互相关系数,
Figure 390182DEST_PATH_IMAGE042
为症状-症状图输入特征的线性变换矩阵,
Figure 761121DEST_PATH_IMAGE043
为症状-症状图相邻节 点的原始特征表示,
Figure 772939DEST_PATH_IMAGE044
Figure 596539DEST_PATH_IMAGE045
激活函数;
对一阶症状聚合表示
Figure 984795DEST_PATH_IMAGE046
加入残差项,得到症状-症状图
Figure 210240DEST_PATH_IMAGE001
的第1层图注意力网 络的特征聚合结果
Figure 127380DEST_PATH_IMAGE047
为:
Figure 703855DEST_PATH_IMAGE048
(4)
其中,Linear是线性层,
Figure 630223DEST_PATH_IMAGE049
为症状-症状图在模型中的残差项;
同理,症状-证素图
Figure 710174DEST_PATH_IMAGE050
的第1层图注意力网络的特征聚合结果
Figure 329374DEST_PATH_IMAGE051
为:
Figure 127566DEST_PATH_IMAGE053
(5)
其中,
Figure 326466DEST_PATH_IMAGE054
是节点
Figure 526503DEST_PATH_IMAGE055
的一阶邻居,
Figure 316605DEST_PATH_IMAGE056
为症状-证素图注意力的互相关系数,
Figure 336513DEST_PATH_IMAGE057
为 症状-证素图输入特征的线性变换矩阵,
Figure 870263DEST_PATH_IMAGE058
为症状-证素图相邻节点的原始特征表示,
Figure 924807DEST_PATH_IMAGE059
为症状-证素图在模型中的残差项;
3)通过堆叠多层图注意力分别聚合症状-症状图
Figure 354651DEST_PATH_IMAGE001
、症状-证素图
Figure 127435DEST_PATH_IMAGE002
的高阶相邻 节点特征,得到症状-症状图
Figure 199296DEST_PATH_IMAGE001
Figure 373925DEST_PATH_IMAGE060
层图注意力网络的特征聚合结果
Figure 505829DEST_PATH_IMAGE061
为:
Figure 765909DEST_PATH_IMAGE094
(6)/>
其中,
Figure 642728DEST_PATH_IMAGE060
为当前的层数, />
Figure 734181DEST_PATH_IMAGE064
为图注意力网络的总层数;
症状-证素图
Figure 302565DEST_PATH_IMAGE002
Figure 315521DEST_PATH_IMAGE060
层图注意力网络的特征聚合结果
Figure 729185DEST_PATH_IMAGE095
为:
Figure 612827DEST_PATH_IMAGE097
(7)
4)最后一层的多头注意力是取所有多头注意力的平均值,则症状-症状图
Figure 820954DEST_PATH_IMAGE001
Figure 790047DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 7402DEST_PATH_IMAGE071
为:
Figure 745551DEST_PATH_IMAGE098
(8)
症状-证素图
Figure 390159DEST_PATH_IMAGE002
Figure 846548DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 602015DEST_PATH_IMAGE073
为:
Figure 460249DEST_PATH_IMAGE099
(9)
由此,症状-症状图
Figure 275758DEST_PATH_IMAGE001
Figure 688285DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 247442DEST_PATH_IMAGE071
即为症状与症状 之间的特征表示
Figure 960184DEST_PATH_IMAGE100
,症状-证素图
Figure 946594DEST_PATH_IMAGE002
Figure 377575DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 474844DEST_PATH_IMAGE073
即为症状 与证素之间的特征表示
Figure 776513DEST_PATH_IMAGE101
将症状与症状之间的特征表示
Figure 933825DEST_PATH_IMAGE072
与症状与证素之间的特征表示
Figure 592382DEST_PATH_IMAGE074
进行矩阵拼 接,得到新的症状特征表示
Figure 493342DEST_PATH_IMAGE102
;矩阵拼接操作的公式为:
Figure 180675DEST_PATH_IMAGE075
(10)
其中,
Figure 243309DEST_PATH_IMAGE076
为两个矩阵的拼接操作。
将症状嵌入矩阵
Figure 383304DEST_PATH_IMAGE003
与新的症状特征表示
Figure 822375DEST_PATH_IMAGE103
相乘,获得症状组合特征表示
Figure 364215DEST_PATH_IMAGE007
, 所述症状组合特征表示
Figure 863330DEST_PATH_IMAGE007
包含了症状和证素的信息。症状组合特征表示
Figure 490620DEST_PATH_IMAGE007
为:
Figure 733382DEST_PATH_IMAGE077
(11)
其中,
Figure 129729DEST_PATH_IMAGE104
为两个矩阵进行相乘操作。
步骤3、基于症状组合特征表示
Figure 799744DEST_PATH_IMAGE007
,使用多层感知机MLP作为分类器进行证型分类预测。具体步骤包括:
将症状组合特征表示
Figure 648752DEST_PATH_IMAGE007
输入多层感知机MLP,经过计算后得到模型预测的证型类 别
Figure 695205DEST_PATH_IMAGE079
Figure 211637DEST_PATH_IMAGE106
(12)/>
其中,
Figure 318133DEST_PATH_IMAGE082
和/>
Figure 654437DEST_PATH_IMAGE083
分别为第一层和第二层的权值矩阵,/>
Figure 504581DEST_PATH_IMAGE084
和/>
Figure 875520DEST_PATH_IMAGE085
分别为第一层和第二层的偏置向量,概率最大的类别即为分类的结果;
利用BCE损失函数来计算模型预测和用于训练模型的实际输出之间的差距
Figure 887338DEST_PATH_IMAGE107
Figure 976517DEST_PATH_IMAGE109
(13)
其中,
Figure 99194DEST_PATH_IMAGE020
是证型类别的数量,
Figure 590218DEST_PATH_IMAGE088
是真实的类别。
根据本发明的另一个发明,一种基于多图注意力和多层感知机的中医证型分类系统,如图2所示,包括:
多图构造模块,基于临床数据集,利用症状和证素的关系构建症状-症状图、症状-证素图和症状嵌入矩阵;
多图注意力特征聚合模块,基于多图注意力网络对症状-症状图
Figure 772937DEST_PATH_IMAGE001
和症状-证素图/>
Figure 349412DEST_PATH_IMAGE002
分别进行图注意力特征聚合,再进行矩阵拼接,得到新的症状特征表示;将症状嵌入矩阵与新的症状特征表示相乘,获得症状组合特征表示;
证型分类模块,基于症状组合特征表示,使用多层感知机作为分类器进行证型分类预测。
实施例1
一种基于多图注意力的中医证型分类方法,包括:
(1)多图构造
在数据集中,每条临床数据都可以由症状、证素和证型的多热编码表示,分别为
Figure 10201DEST_PATH_IMAGE008
Figure 355731DEST_PATH_IMAGE009
Figure 709352DEST_PATH_IMAGE010
,如 果第
Figure 773123DEST_PATH_IMAGE110
个症状出现,则在症状集合
Figure 237603DEST_PATH_IMAGE111
相应的位置
Figure 437640DEST_PATH_IMAGE112
置1,否则置0。同理证素集合
Figure 962162DEST_PATH_IMAGE002
和 证症集合
Figure 241791DEST_PATH_IMAGE113
也可以这样表示。
然后定义构建的两个无向图,分别为症状-症状图
Figure 41119DEST_PATH_IMAGE001
和症状-证素图
Figure 95663DEST_PATH_IMAGE002
。症状-症 状图
Figure 525507DEST_PATH_IMAGE001
的构造规则是统计所有临床数据中出现的症状频次,把出现频次大于等于阈值
Figure 298291DEST_PATH_IMAGE090
的症状提取出来,让其相互连接构图。症状-证素图
Figure 370152DEST_PATH_IMAGE002
的构造规则是比较两条临床数 据中证素相同的个数。如果相同证素的数量大于阈值
Figure 279203DEST_PATH_IMAGE114
,则让两条数据的症状相互连接构 图。如果两个症状和多个状态元素同时存在,则两种症状之间存在特殊的关系。
症状嵌入矩阵
Figure 411107DEST_PATH_IMAGE018
,其中
Figure 140028DEST_PATH_IMAGE115
是临床数据的总数,然后定义
Figure 15580DEST_PATH_IMAGE019
,其中
Figure 779137DEST_PATH_IMAGE116
是数据集中包含的症状类型的数量。如果症状
Figure 81942DEST_PATH_IMAGE117
出 现在临床数据
Figure 563739DEST_PATH_IMAGE092
中,则设置为1,否则设置为0。
(2)多图注意力特征聚合模块
在这一模块中分别将症状-症状图
Figure 977403DEST_PATH_IMAGE001
和症状-证素图
Figure 595466DEST_PATH_IMAGE002
输入到不同的GAT模块中 进行计算,得到新的症状的特征表示
Figure 69173DEST_PATH_IMAGE072
Figure 38266DEST_PATH_IMAGE074
,其中
Figure 255621DEST_PATH_IMAGE072
集合了症状与症状之间的特征,
Figure 993770DEST_PATH_IMAGE074
集合了症状与证素之间的特征。然后,将
Figure 638378DEST_PATH_IMAGE072
Figure 94767DEST_PATH_IMAGE074
合并,得到新的症状特征表示
Figure 584654DEST_PATH_IMAGE103
。 最后,将症状嵌入矩阵
Figure 442888DEST_PATH_IMAGE003
Figure 992818DEST_PATH_IMAGE103
相乘,获得症状组合特征表示
Figure 936504DEST_PATH_IMAGE007
首先,介绍注意力系数的计算。计算症状-症状图
Figure 495661DEST_PATH_IMAGE001
和症状-证素图
Figure 942823DEST_PATH_IMAGE002
中有边连 接的任意两个点形成的节点对
Figure 929233DEST_PATH_IMAGE021
之间的注意力值
Figure 94636DEST_PATH_IMAGE022
Figure 191905DEST_PATH_IMAGE024
(1)
其中,
Figure 24731DEST_PATH_IMAGE025
为共享权重矩阵,
Figure 182043DEST_PATH_IMAGE026
是输入特征的个数,
Figure 569162DEST_PATH_IMAGE027
是输出特征的个数,
Figure 470122DEST_PATH_IMAGE028
Figure 157455DEST_PATH_IMAGE029
节点的特征,
Figure 491528DEST_PATH_IMAGE030
Figure 631522DEST_PATH_IMAGE031
节点的特征,
Figure 805015DEST_PATH_IMAGE032
是拼接向量映射到实数上,并通过 LeakyReLU激活。
聚合邻居信息时,需要对每个节点对的注意力系数进行归一化得到
Figure 346854DEST_PATH_IMAGE033
Figure 845969DEST_PATH_IMAGE034
(2)
其中,
Figure 4418DEST_PATH_IMAGE035
Figure 981601DEST_PATH_IMAGE013
的邻居节点。
对于症状-症状图
Figure 377947DEST_PATH_IMAGE001
,将症状聚集到其一阶邻近点的过程定义为:
Figure 47963DEST_PATH_IMAGE037
(3)
其中,
Figure 162550DEST_PATH_IMAGE038
表示注意力的头数,
Figure 209003DEST_PATH_IMAGE039
是节点
Figure 725435DEST_PATH_IMAGE040
的一阶邻居,
Figure 566352DEST_PATH_IMAGE041
为注意力的互相关 系数,
Figure 168235DEST_PATH_IMAGE042
为输入特征的线性变换矩阵,
Figure 752800DEST_PATH_IMAGE043
为相邻节点的原始特征表示。
Figure 389317DEST_PATH_IMAGE044
Figure 401136DEST_PATH_IMAGE045
激 活函数。
为了避免层数太深导致的梯度消失问题,在本模型中加入了残差项,则经过第一层GAT得到的结果为:
Figure 224735DEST_PATH_IMAGE048
(4)
其中,
Figure 347412DEST_PATH_IMAGE046
是一阶症状聚合表示,Linear是线性层,因为
Figure 572857DEST_PATH_IMAGE049
Figure 21156DEST_PATH_IMAGE046
维度不同,不 能直接相加。
类似地,对于症状-证素图
Figure 332052DEST_PATH_IMAGE002
的节点聚合过程可以定义为:/>
Figure 258419DEST_PATH_IMAGE053
(5)
其中,
Figure 338371DEST_PATH_IMAGE054
是节点
Figure 691992DEST_PATH_IMAGE055
的一阶邻居,
Figure 490183DEST_PATH_IMAGE056
为注意力的互相关系数,
Figure 220242DEST_PATH_IMAGE057
为输入特征的 线性变换矩阵,
Figure 420279DEST_PATH_IMAGE058
为相邻节点的原始特征表示。
以上内容只是在一层的图注意力特征聚合,可以扩展为多层的特征聚合。对于第
Figure 944801DEST_PATH_IMAGE060
层的特征聚合,聚合过程定义为:
Figure 230289DEST_PATH_IMAGE094
(6)
Figure 498460DEST_PATH_IMAGE097
(7)
其中,
Figure 553003DEST_PATH_IMAGE060
为当前的层数, />
Figure 531584DEST_PATH_IMAGE064
为GAT模块的层数。通过堆叠多层图注意力来聚合高阶相邻节点特征。
最后一层的图注意力与前面层数的定义不同,最后一层的多头注意力是取所有多头注意力的平均值:
Figure 304368DEST_PATH_IMAGE118
(8)
Figure 110650DEST_PATH_IMAGE119
(9)
然后,将获得的两个新的症状特征表示进行矩阵拼接操作:
Figure 19700DEST_PATH_IMAGE075
(10)
其中,
Figure 886025DEST_PATH_IMAGE076
为两个矩阵的拼接操作。
最后,将症状嵌入矩阵
Figure 146105DEST_PATH_IMAGE003
Figure 756078DEST_PATH_IMAGE103
相乘,获得症状组合特征表示
Figure 785214DEST_PATH_IMAGE007
,换句话说,这 一步是从单一症状到一组症状的聚合,具体定义如下:
Figure 88019DEST_PATH_IMAGE077
(11)
其中,
Figure 569816DEST_PATH_IMAGE078
为两个矩阵进行相乘操作。
(3)证型分类模块
新的症状组合特征表示
Figure 983480DEST_PATH_IMAGE007
包含了症状和证素的信息。在证型分类模块中,使用
Figure 867122DEST_PATH_IMAGE007
作为MLP的输入,经过计算后得到一组概率值,概率最大的类别就是分类的结果。具体步骤如下:
Figure 340829DEST_PATH_IMAGE106
(12)/>
其中,
Figure 309922DEST_PATH_IMAGE082
Figure 261698DEST_PATH_IMAGE083
分别为第一层和第二层的权值矩阵,
Figure 265426DEST_PATH_IMAGE084
Figure 910034DEST_PATH_IMAGE085
分别为第一层和第二 层的偏置向量。
Figure 366423DEST_PATH_IMAGE120
是预测的证型类别的概率向量。
最后,在网络训练中使用BCE损失函数来计算模型预测和用于训练模型的实际输出之间的差距:
Figure 121889DEST_PATH_IMAGE109
(13)
其中,
Figure 714544DEST_PATH_IMAGE020
是证型类别的数量,
Figure 530054DEST_PATH_IMAGE120
是模型预测的类别,
Figure 473739DEST_PATH_IMAGE088
是真实的类别。
下面,采用实验数据集对本实施例的方法进行验证评价。
1)实验数据集及评价指标
本实验是在Python3.9环境中使用Pytorch1.10深度学习库进行的。实验设备包括一个英特尔酷睿i5-11400H处理器、英伟达GeForce RTX 3050显卡和Windows11操作系统。
为验证本发明方法的有效性,采用真实中医数据集进行了实验。
伤寒论数据集:该数据集整理自中医学的经典著作《伤寒论》。处理完成后的数据集共包含173条数据,包括697个症状、925个证素和173个证型。在本实验中,训练集和测试集的比例是9:1。
在本实施例中,采用四个常用的指标来评估:准确率(Accuracy)、精确率(Precision)、召回率(Recall)和F1评分(F1-score)。准确率代表证型分类算法正确分类样本占总样本的比例。精确率代表算法正确预测的比例。召回率代表算法正确预测的真实标签证型的比例。F1分数是精确率和召回率两个指标的加权均值。这四个评价指标均呈正相关,数值越大,模型性能越好。这些指标的定义如下所示:
Figure 32896DEST_PATH_IMAGE121
(14)
Figure 745637DEST_PATH_IMAGE122
(15)
Figure 466469DEST_PATH_IMAGE123
(16)
Figure 897450DEST_PATH_IMAGE124
(17)
其中,
Figure 994719DEST_PATH_IMAGE125
表示正确预测的正样本数,/>
Figure 827546DEST_PATH_IMAGE126
表示正确预测的负样本数。/>
Figure DEST_PATH_IMAGE127
是预测为正的负样本数,/>
Figure 984858DEST_PATH_IMAGE128
是预测为负的正样本数。
2)基线
本实施例使用以下几种方法来进行对比实验:
·Support vector machine(SVM): SVM是一组用于分类和回归的相关监督学习方法。通过SVM建立证型分类模型,找到最佳的超平面实现分类[11]
·MLP: MLP证型分类模型有两层隐藏层,输入层的维度是症状特征数量,输出层维度是证型类别数量,用于预测证型[12]
·CNN:卷积神经网络分类模型由卷积层和全连接层组成。卷积层用于提取症状特征,全连接层实现分类。该模型实现了相对准确的分类[13]
·GCN:图卷积神经网络模型能够更好的表示特征的关系。该模型由GCN层和全连接层组成。GCN层的输入是症状与症状关系的图,最后一层全连接层的输出维度是证型类别的数量,用于预测证型类别。
3)实验结果
为最小化随机性对实验结果带来的影响,本实施例中所有的实验结果均展示为运行50次的平均结果。
a)定量分析
表1显示了MGAT的实验结果和其他四种算法的比较。MGAT在准确性、精确率、召回率和F1分数评价指标上优于其他四种算法。具体来说,MGAT的准确率为82.11%,精确率为74.18%,召回率为81.73%,F1分数为76.51%。此外,实验结果表明,GCN是其他对比算法中性能最好的。在准确率、精确率、召回率和F1分数方面,MGAT分别比GCN高7.29%、4.31%、8.84%、5.69%。本定量实验表明,本发明的MGAT显著提高了中医证型分类的准确性。
表1 不同方法的实验结果
Figure 903135DEST_PATH_IMAGE129
b)定性分析
表2显示了MGAT分类结果和真实标签的比较,可以看出,前两个证型预测正确,最后一个错误的将阳明热结轻证预测为阳明热结重证。因为阳明热结轻证的证素主要有热、燥屎、胃、肠,与阳明热结重证的证素非常类似,所以导致预测错误。这些结果表明,MGAT可以提供一个更准确的证型分类模型,并具有实用价值。
表2 案例分析
Figure DEST_PATH_IMAGE130
本发明提出的基于多图注意力的中医证型分类方法提供了一个更准确的证型分类模型,并具有实用价值,能够显著提高中医证型分类的准确性。
这里本发明的描述和应用是说明性的,并非想将本发明的范围限制在上述实施例中。说明书中所涉及的效果或优点等相关描述可因具体条件参数的不确定或其它因素影响而可能在实际实验例中不能体现,效果或优点等相关描述不用于对发明范围进行限制。这里所披露的实施例的变形和改变是可能的,对于那些本领域的普通技术人员来说实施例的替换和等效的各种部件是公知的。本领域技术人员应该清楚的是,在不脱离本发明的精神或本质特征的情况下,本发明可以以其它形式、结构、布置、比例,以及用其它组件、材料和部件来实现。在不脱离本发明范围和精神的情况下,可以对这里所披露的实施例进行其它变形和改变。

Claims (8)

1.一种基于多图注意力的中医证型分类方法,其特征在于,包括:
步骤1、获取包含若干条临床数据的数据集,利用症状和证素的关系构建症状-症状图
Figure 763134DEST_PATH_IMAGE001
、症状-证素图
Figure 149116DEST_PATH_IMAGE002
和症状嵌入矩阵
Figure 273061DEST_PATH_IMAGE003
步骤2、基于多图注意力网络对症状-症状图
Figure 137112DEST_PATH_IMAGE001
和症状-证素图
Figure 544959DEST_PATH_IMAGE002
分别进行图注意力 特征聚合,得到症状与症状之间的特征表示
Figure 836264DEST_PATH_IMAGE004
和症状与证素之间的特征表示
Figure 181925DEST_PATH_IMAGE005
;将症 状与症状之间的特征表示
Figure 974301DEST_PATH_IMAGE004
与症状与证素之间的特征表示
Figure 112021DEST_PATH_IMAGE005
进行矩阵拼接,得到新的 症状特征表示
Figure 443733DEST_PATH_IMAGE006
;将症状嵌入矩阵
Figure 666904DEST_PATH_IMAGE007
与新的症状特征表示
Figure 731812DEST_PATH_IMAGE006
相乘,获得症状组合特征 表示
Figure 724039DEST_PATH_IMAGE008
,所述症状组合特征表示
Figure 498091DEST_PATH_IMAGE008
包含了症状和证素的信息;
步骤3、基于症状组合特征表示
Figure 208558DEST_PATH_IMAGE008
,使用多层感知机MLP作为分类器进行证型分类预测。
2.根据权利要求1所述的基于多图注意力的中医证型分类方法,其特征在于,步骤1中, 每条临床数据均由症状、证素和证型的多热编码表示:症状集合
Figure 77157DEST_PATH_IMAGE009
、 证素集合
Figure 189470DEST_PATH_IMAGE010
和证型集合
Figure 868844DEST_PATH_IMAGE011
,m为 数据集中包含的症状的数量,k为数据集中包含的证素数量,l为数据集中包含的证型数量; 对于任意一条临床数据,若第
Figure 66607DEST_PATH_IMAGE012
个症状/证素/证型出现,则在对应症状集合
Figure 4476DEST_PATH_IMAGE013
/证素集合
Figure 971295DEST_PATH_IMAGE014
/证型集合
Figure 87150DEST_PATH_IMAGE015
中相应的位置置1,否则置0。
3.根据权利要求1或2所述的基于多图注意力的中医证型分类方法,其特征在于,步骤1中构建症状-症状图、症状-证素图和症状嵌入矩阵的具体步骤包括:
步骤1-1:构建症状-症状无向图
Figure 506630DEST_PATH_IMAGE001
:统计所有症状在临床数据中出现的频次,把频次 ≥阈值
Figure 982610DEST_PATH_IMAGE016
的症状提取出来,并两两相连构成症状-症状无向图
Figure 803936DEST_PATH_IMAGE001
步骤1-2:构建症状-证素无向图
Figure 480905DEST_PATH_IMAGE002
:比较任意两条临床数据,统计两者中相同证素的 数量,如果相同证素的数量>阈值
Figure 263047DEST_PATH_IMAGE017
,则将该两条临床数据的症状相互连接;
步骤1-3:构建症状嵌入矩阵
Figure 152506DEST_PATH_IMAGE018
,定义
Figure 218551DEST_PATH_IMAGE019
,其中,
Figure 800842DEST_PATH_IMAGE020
是临床数据的总数。
4.根据权利要求1所述的基于多图注意力的中医证型分类方法,其特征在于,步骤2中 基于多层图注意力网络对症状-症状图
Figure 70280DEST_PATH_IMAGE001
和症状-证素图
Figure 29009DEST_PATH_IMAGE002
分别进行图注意力特征聚合 的具体步骤包括:
1)分别计算症状-症状图
Figure 683981DEST_PATH_IMAGE001
和症状-证素图
Figure 437173DEST_PATH_IMAGE002
中节点对
Figure 193908DEST_PATH_IMAGE021
的注意力系数
Figure 690748DEST_PATH_IMAGE022
Figure 465806DEST_PATH_IMAGE024
(1)
其中,
Figure 124321DEST_PATH_IMAGE025
为共享权重矩阵,
Figure 758565DEST_PATH_IMAGE026
是输入特征的个数,
Figure 668883DEST_PATH_IMAGE027
是输出特征的个数,
Figure 439393DEST_PATH_IMAGE028
Figure 393442DEST_PATH_IMAGE029
节点的特征,
Figure 249403DEST_PATH_IMAGE030
Figure 957553DEST_PATH_IMAGE031
节点的特征,
Figure 316990DEST_PATH_IMAGE032
是拼接向量映射到实数上,LeakyReLU为激活 函数,节点对
Figure 973099DEST_PATH_IMAGE021
是指在无向图中有边连接的两个点;
对每个节点对
Figure 50777DEST_PATH_IMAGE021
的注意力系数进行归一化,得到归一化的注意力系数
Figure 568477DEST_PATH_IMAGE033
Figure 48000DEST_PATH_IMAGE034
(2)
其中,
Figure 609431DEST_PATH_IMAGE035
Figure 174404DEST_PATH_IMAGE036
的邻居节点;
2)将症状-症状图
Figure 230216DEST_PATH_IMAGE001
的症状聚集到其一阶邻近点,得到一阶症状聚合表示
Figure 564246DEST_PATH_IMAGE037
Figure 296578DEST_PATH_IMAGE038
(3)
其中,
Figure 83269DEST_PATH_IMAGE039
表示注意力的头数,
Figure 677192DEST_PATH_IMAGE040
是节点
Figure 131307DEST_PATH_IMAGE041
的一阶邻居,
Figure 768962DEST_PATH_IMAGE042
为症状-症状图注意力 的互相关系数,
Figure 183894DEST_PATH_IMAGE043
为症状-症状图输入特征的线性变换矩阵,
Figure 706142DEST_PATH_IMAGE044
为症状-症状图相邻节 点的原始特征表示,
Figure 139398DEST_PATH_IMAGE045
Figure 88899DEST_PATH_IMAGE046
激活函数;
对一阶症状聚合表示
Figure 725548DEST_PATH_IMAGE047
加入残差项,得到症状-症状图
Figure 51487DEST_PATH_IMAGE001
的第1层图注意力网络的 特征聚合结果
Figure 73670DEST_PATH_IMAGE048
为:
Figure 803859DEST_PATH_IMAGE049
(4)
其中,Linear是线性层,
Figure 318017DEST_PATH_IMAGE050
为症状-症状图在模型中的残差项;
同理,症状-证素图
Figure 306702DEST_PATH_IMAGE002
的第1层图注意力网络的特征聚合结果
Figure 324336DEST_PATH_IMAGE051
为:
Figure 756586DEST_PATH_IMAGE053
(5)
其中,
Figure 492461DEST_PATH_IMAGE054
是节点
Figure 284836DEST_PATH_IMAGE055
的一阶邻居,
Figure 422557DEST_PATH_IMAGE056
为症状-证素图注意力的互相关系数,
Figure 150341DEST_PATH_IMAGE057
为症 状-证素图输入特征的线性变换矩阵,
Figure 243019DEST_PATH_IMAGE058
为症状-证素图相邻节点的原始特征表示,
Figure 448872DEST_PATH_IMAGE059
为症状-证素图在模型中的残差项;
3)通过堆叠多层图注意力分别聚合症状-症状图
Figure 565733DEST_PATH_IMAGE001
、症状-证素图
Figure 464419DEST_PATH_IMAGE002
的高阶相邻节点 特征,得到症状-症状图
Figure 784673DEST_PATH_IMAGE001
Figure 59796DEST_PATH_IMAGE060
层图注意力网络的特征聚合结果
Figure 31163DEST_PATH_IMAGE061
为:
Figure 100751DEST_PATH_IMAGE063
(6)
其中,
Figure 173880DEST_PATH_IMAGE060
为当前的层数,
Figure 721536DEST_PATH_IMAGE064
为图注意力网络的总层数,
Figure 812989DEST_PATH_IMAGE065
症状-证素图
Figure 787898DEST_PATH_IMAGE002
Figure 348323DEST_PATH_IMAGE060
层图注意力网络的特征聚合结果
Figure 699670DEST_PATH_IMAGE066
为:
Figure 645630DEST_PATH_IMAGE068
(7)
4)最后一层的多头注意力是取所有多头注意力的平均值,则症状-症状图
Figure 322599DEST_PATH_IMAGE001
Figure 229375DEST_PATH_IMAGE064
层图 注意力网络的特征聚合结果
Figure 994200DEST_PATH_IMAGE069
为:
Figure 935611DEST_PATH_IMAGE070
(8)
症状-证素图
Figure 376956DEST_PATH_IMAGE002
Figure 771029DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 339544DEST_PATH_IMAGE071
为:
Figure 135462DEST_PATH_IMAGE072
(9)
症状-症状图
Figure 13288DEST_PATH_IMAGE001
Figure 894656DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 1284DEST_PATH_IMAGE073
即为症状与症状之间的特 征表示
Figure 651708DEST_PATH_IMAGE074
,症状-证素图
Figure 700436DEST_PATH_IMAGE002
Figure 69100DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 979418DEST_PATH_IMAGE075
即为症状与证 素之间的特征表示
Figure 484349DEST_PATH_IMAGE076
5.根据权利要求1所述的基于多图注意力的中医证型分类方法,其特征在于,步骤2中矩阵拼接操作的公式为:
Figure 703978DEST_PATH_IMAGE077
(10)
其中,
Figure 999803DEST_PATH_IMAGE078
为两个矩阵的拼接操作。
6.根据权利要求1所述的基于多图注意力的中医证型分类方法,其特征在于,症状组合特征表示
Figure 572867DEST_PATH_IMAGE008
为:
Figure 322517DEST_PATH_IMAGE079
(11)
其中,
Figure 322834DEST_PATH_IMAGE080
为两个矩阵进行相乘操作。
7.根据权利要求1所述的基于多图注意力的中医证型分类方法,其特征在于,步骤3中使用多层感知机MLP进行证型分类预测的具体步骤包括:
将症状组合特征表示
Figure 275878DEST_PATH_IMAGE008
输入多层感知机MLP,经过计算后得到模型预测的证型类别
Figure 918212DEST_PATH_IMAGE081
Figure 522369DEST_PATH_IMAGE083
(12)
其中,
Figure 959166DEST_PATH_IMAGE084
Figure 399506DEST_PATH_IMAGE085
分别为第一层和第二层的权值矩阵,
Figure 314372DEST_PATH_IMAGE086
Figure 38615DEST_PATH_IMAGE087
分别为第一层和第二层的偏置向量,概率最大的类别即为分类的结果;
利用BCE损失函数来计算模型预测和用于训练模型的实际输出之间的差距
Figure 646314DEST_PATH_IMAGE064
Figure 573949DEST_PATH_IMAGE089
(13)
其中,
Figure 292507DEST_PATH_IMAGE090
是证型类别的数量,
Figure 871256DEST_PATH_IMAGE091
是真实的类别。
8.一种基于多图注意力和多层感知机的中医证型分类系统,其特征在于,包括:
多图构造模块,基于临床数据集,利用症状和证素的关系构建症状-症状图、症状-证素图和症状嵌入矩阵;
多图注意力特征聚合模块,基于多图注意力网络对症状-症状图
Figure 649856DEST_PATH_IMAGE001
和症状-证素图
Figure 64788DEST_PATH_IMAGE002
分别进行图注意力特征聚合,再进行矩阵拼接,得到新的症状特征表示;将症状嵌入矩阵与 新的症状特征表示相乘,获得症状组合特征表示;具体包括:
1)分别计算症状-症状图
Figure 587036DEST_PATH_IMAGE001
和症状-证素图
Figure 20291DEST_PATH_IMAGE002
中节点对
Figure 969793DEST_PATH_IMAGE021
的注意力系数
Figure 872021DEST_PATH_IMAGE092
Figure 197960DEST_PATH_IMAGE024
(1)
其中,
Figure 485722DEST_PATH_IMAGE093
为共享权重矩阵,
Figure 606125DEST_PATH_IMAGE026
是输入特征的个数,
Figure 995649DEST_PATH_IMAGE027
是输出特征的个数,
Figure 859699DEST_PATH_IMAGE094
Figure 1968DEST_PATH_IMAGE095
节点的特征,
Figure 558851DEST_PATH_IMAGE096
Figure 170092DEST_PATH_IMAGE031
节点的特征,
Figure 837834DEST_PATH_IMAGE097
是拼接向量映射到实数上,LeakyReLU为 激活函数,节点对
Figure 975554DEST_PATH_IMAGE021
是指在无向图中有边连接的两个点;
对每个节点对
Figure 827973DEST_PATH_IMAGE021
的注意力系数进行归一化,得到归一化的注意力系数
Figure 389492DEST_PATH_IMAGE098
Figure 860924DEST_PATH_IMAGE099
(2)
其中,
Figure 977785DEST_PATH_IMAGE100
Figure 610892DEST_PATH_IMAGE012
的邻居节点;
2)将症状-症状图
Figure 196725DEST_PATH_IMAGE001
的症状聚集到其一阶邻近点,得到一阶症状聚合表示
Figure 206269DEST_PATH_IMAGE101
Figure 177636DEST_PATH_IMAGE102
(3)
其中,
Figure 247223DEST_PATH_IMAGE039
表示注意力的头数,
Figure 54774DEST_PATH_IMAGE103
是节点
Figure 133588DEST_PATH_IMAGE104
的一阶邻居,
Figure 959462DEST_PATH_IMAGE104
为症状-症状图注意力的互 相关系数,
Figure 934371DEST_PATH_IMAGE105
为症状-症状图输入特征的线性变换矩阵,
Figure 494796DEST_PATH_IMAGE106
为症状-症状图相邻节点的 原始特征表示,
Figure 846143DEST_PATH_IMAGE107
Figure 792103DEST_PATH_IMAGE046
激活函数;
对一阶症状聚合表示
Figure 937913DEST_PATH_IMAGE108
加入残差项,得到症状-症状图
Figure 454476DEST_PATH_IMAGE001
的第1层图注意力网络的 特征聚合结果
Figure 875093DEST_PATH_IMAGE109
为:
Figure 675559DEST_PATH_IMAGE110
(4)
其中,Linear是线性层,
Figure 257850DEST_PATH_IMAGE111
为症状-症状图在模型中的残差项;
同理,症状-证素图
Figure 261709DEST_PATH_IMAGE002
的第1层图注意力网络的特征聚合结果
Figure 813913DEST_PATH_IMAGE112
为:
Figure 609831DEST_PATH_IMAGE114
(5)
其中,
Figure 238390DEST_PATH_IMAGE115
是节点
Figure 854179DEST_PATH_IMAGE116
的一阶邻居,
Figure 616598DEST_PATH_IMAGE117
为症状-证素图注意力的互相关系数,
Figure 391656DEST_PATH_IMAGE118
为 症状-证素图输入特征的线性变换矩阵,
Figure 315750DEST_PATH_IMAGE119
为症状-证素图相邻节点的原始特征表示,
Figure 559781DEST_PATH_IMAGE120
为症状-证素图在模型中的残差项;
3)通过堆叠多层图注意力分别聚合症状-症状图
Figure 594733DEST_PATH_IMAGE001
、症状-证素图
Figure 224297DEST_PATH_IMAGE002
的高阶相邻节点 特征,得到症状-症状图
Figure 319292DEST_PATH_IMAGE001
Figure 779180DEST_PATH_IMAGE060
层图注意力网络的特征聚合结果
Figure 617823DEST_PATH_IMAGE121
为:
Figure 367474DEST_PATH_IMAGE063
(6)
其中,
Figure 898949DEST_PATH_IMAGE060
为当前的层数,
Figure 851993DEST_PATH_IMAGE064
为图注意力网络的总层数,
Figure 228747DEST_PATH_IMAGE065
症状-证素图
Figure 832904DEST_PATH_IMAGE002
Figure 269702DEST_PATH_IMAGE060
层图注意力网络的特征聚合结果
Figure 710041DEST_PATH_IMAGE122
为:
Figure 890487DEST_PATH_IMAGE123
(7)
4)最后一层的多头注意力是取所有多头注意力的平均值,则症状-症状图
Figure 614729DEST_PATH_IMAGE001
Figure 222428DEST_PATH_IMAGE064
层图 注意力网络的特征聚合结果
Figure 884485DEST_PATH_IMAGE124
为:
Figure 868621DEST_PATH_IMAGE125
(8)
症状-证素图
Figure 447370DEST_PATH_IMAGE002
Figure 225970DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 765536DEST_PATH_IMAGE126
为:
Figure 897571DEST_PATH_IMAGE127
(9)
由此,症状-症状图
Figure 471772DEST_PATH_IMAGE001
Figure 545907DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 572769DEST_PATH_IMAGE128
即为症状与症状之 间的特征表示
Figure 508495DEST_PATH_IMAGE129
,症状-证素图
Figure 937203DEST_PATH_IMAGE002
Figure 182239DEST_PATH_IMAGE064
层图注意力网络的特征聚合结果
Figure 430818DEST_PATH_IMAGE130
即为症状 与证素之间的特征表示
Figure 170235DEST_PATH_IMAGE131
将症状与症状之间的特征表示
Figure 453449DEST_PATH_IMAGE132
与症状与证素之间的特征表示
Figure 134966DEST_PATH_IMAGE133
进行矩阵拼接, 得到新的症状特征表示
Figure 605261DEST_PATH_IMAGE134
;矩阵拼接操作的公式为:
Figure 413949DEST_PATH_IMAGE135
(10)
其中,
Figure 551669DEST_PATH_IMAGE078
为两个矩阵的拼接操作;
将症状嵌入矩阵
Figure 138508DEST_PATH_IMAGE007
与新的症状特征表示
Figure 361679DEST_PATH_IMAGE136
相乘,获得症状组合特征表示
Figure 702618DEST_PATH_IMAGE008
,所述 症状组合特征表示
Figure 694845DEST_PATH_IMAGE008
包含了症状和证素的信息,症状组合特征表示
Figure 452586DEST_PATH_IMAGE008
为:
Figure 163053DEST_PATH_IMAGE137
(11)
其中,
Figure 782384DEST_PATH_IMAGE080
为两个矩阵进行相乘操作;
证型分类模块,基于症状组合特征表示,使用多层感知机作为分类器进行证型分类预测。
CN202211381693.4A 2022-11-07 2022-11-07 基于多图注意力的中医证型分类方法 Active CN115423052B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211381693.4A CN115423052B (zh) 2022-11-07 2022-11-07 基于多图注意力的中医证型分类方法
US18/337,459 US11948693B2 (en) 2022-11-07 2023-06-20 Traditional Chinese medicine syndrome classification method based on multi-graph attention

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211381693.4A CN115423052B (zh) 2022-11-07 2022-11-07 基于多图注意力的中医证型分类方法

Publications (2)

Publication Number Publication Date
CN115423052A CN115423052A (zh) 2022-12-02
CN115423052B true CN115423052B (zh) 2023-03-24

Family

ID=84207782

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211381693.4A Active CN115423052B (zh) 2022-11-07 2022-11-07 基于多图注意力的中医证型分类方法

Country Status (2)

Country Link
US (1) US11948693B2 (zh)
CN (1) CN115423052B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115423052B (zh) * 2022-11-07 2023-03-24 南京大经中医药信息技术有限公司 基于多图注意力的中医证型分类方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060129324A1 (en) * 2004-12-15 2006-06-15 Biogenesys, Inc. Use of quantitative EEG (QEEG) alone and/or other imaging technology and/or in combination with genomics and/or proteomics and/or biochemical analysis and/or other diagnostic modalities, and CART and/or AI and/or statistical and/or other mathematical analysis methods for improved medical and other diagnosis, psychiatric and other disease treatment, and also for veracity verification and/or lie detection applications.
CN107468754A (zh) 2017-09-07 2017-12-15 无限极(中国)有限公司 一种中药组合物及其用途
CN107375438A (zh) 2017-09-07 2017-11-24 无限极(中国)有限公司 一种中药组合物及其用途
CN107468730A (zh) 2017-09-07 2017-12-15 无限极(中国)有限公司 一种中药组合物及其用途
EP3794511A1 (en) * 2018-05-18 2021-03-24 BenevolentAI Technology Limited Graph neutral networks with attention
WO2020016579A2 (en) * 2018-07-17 2020-01-23 Gtn Ltd Machine learning based methods of analysing drug-like molecules
US10599686B1 (en) * 2018-09-27 2020-03-24 Babylon Partners Limited Method and system for extracting information from graphs
US10824949B2 (en) * 2018-09-27 2020-11-03 Babylon Partners Limited Method and system for extracting information from graphs
JP7271216B2 (ja) * 2019-02-19 2023-05-11 株式会社東芝 情報処理装置、情報処理方法、およびプログラム
CN110459321B (zh) * 2019-08-20 2020-10-23 山东众阳健康科技集团有限公司 一种基于证素的中医辅助诊断系统
US20210233658A1 (en) * 2020-01-23 2021-07-29 Babylon Partners Limited Identifying Relevant Medical Data for Facilitating Accurate Medical Diagnosis
US11868730B2 (en) * 2020-09-23 2024-01-09 Jingdong Digits Technology Holding Co., Ltd. Method and system for aspect-level sentiment classification by graph diffusion transformer
CN113035362B (zh) * 2021-02-26 2024-04-09 北京工业大学 一种基于语义图网络的医疗预测方法及系统
US20220383108A1 (en) * 2021-05-21 2022-12-01 Nec Laboratories America, Inc. Information-aware graph contrastive learning
CN113693563B (zh) * 2021-08-27 2023-10-13 北京工业大学 一种基于超图注意力网络的脑功能网络分类方法
WO2023158333A1 (en) * 2022-02-18 2023-08-24 Google Llc Large-scale architecture search in graph neural networks via synthetic data
CN115618225A (zh) * 2022-10-10 2023-01-17 闽江学院 基于图注意力网络的中医状态辨识方法
CN115423052B (zh) * 2022-11-07 2023-03-24 南京大经中医药信息技术有限公司 基于多图注意力的中医证型分类方法

Also Published As

Publication number Publication date
US20230335296A1 (en) 2023-10-19
CN115423052A (zh) 2022-12-02
US11948693B2 (en) 2024-04-02

Similar Documents

Publication Publication Date Title
Qin et al. A machine learning methodology for diagnosing chronic kidney disease
Gomes et al. IKONOS: an intelligent tool to support diagnosis of COVID-19 by texture analysis of X-ray images
Liu et al. Heterogeneous similarity graph neural network on electronic health records
CN111834012A (zh) 基于深度学习和注意力机制的中医证候诊断方法及装置
CN115423052B (zh) 基于多图注意力的中医证型分类方法
Zhang et al. DsNet: Dual stack network for detecting diabetes mellitus and chronic kidney disease
Hegde et al. Symmetrized Feature Selection with Stacked Generalization based Machine Learning Algorithm for the Early Diagnosis of Chronic Diseases
Lin et al. Learning patient similarity via heterogeneous medical knowledge graph embedding
Lin et al. Medical Concept Embedding with Variable Temporal Scopes for Patient Similarity.
Jiang et al. Explainable deep learning for readmission prediction with tree-glove embedding
Cao et al. Temporal graph representation learning for autism spectrum disorder brain networks
Othman et al. Early prediction of hemodialysis complications employing ensemble techniques
Wang et al. Multimodal autism spectrum disorder diagnosis method based on DeepGCN
Liao et al. Towards use of electronic health records: cancer classification
CN114582497A (zh) 基于图卷积神经网络的中医证型分类方法
Nurmaini et al. Breast cancer classification using deep learning
Nahian et al. Common human diseases prediction using machine learning based on survey data
Jamshidnezhad et al. Evaluation of suspected pediatric appendicitis with Alvarado method using a computerized intelligent model
Vineetha et al. Classification of adaptive back propagation neural network along with fuzzy logic in chronic kidney disease
Mallya et al. SAVEHR: self attention vector representations for EHR based personalized chronic disease onset prediction and interpretability
Liang et al. Learning to detect pathogenic microorganism of community-acquired pneumonia
Lavanya et al. An ensemble deep learning classifier of entropy convolutional neural network and divergence weight bidirectional LSTM for efficient disease prediction
Ngo et al. Predicting Drug-Drug Interactions using Deep Generative Models on Graphs
Rodríguez-González et al. IKS index: A knowledge-model driven index to estimate the capability of medical diagnosis systems to produce results
Jamshidnezhad et al. Bees Reproduction Cycle: A Solution to Diagnosis of Acute Appendicitis.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant