CN114582497A - 基于图卷积神经网络的中医证型分类方法 - Google Patents

基于图卷积神经网络的中医证型分类方法 Download PDF

Info

Publication number
CN114582497A
CN114582497A CN202210213917.4A CN202210213917A CN114582497A CN 114582497 A CN114582497 A CN 114582497A CN 202210213917 A CN202210213917 A CN 202210213917A CN 114582497 A CN114582497 A CN 114582497A
Authority
CN
China
Prior art keywords
symptom
chinese medicine
traditional chinese
syndrome
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210213917.4A
Other languages
English (en)
Inventor
李佐勇
付阿敏
樊好义
滕升华
刘伟霞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minjiang University
Original Assignee
Minjiang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minjiang University filed Critical Minjiang University
Priority to CN202210213917.4A priority Critical patent/CN114582497A/zh
Publication of CN114582497A publication Critical patent/CN114582497A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/90ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to alternative medicines, e.g. homeopathy or oriental medicines
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Public Health (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Alternative & Traditional Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种基于图卷积神经网络的中医证型分类方法。结合了“辨证论治”和“状态辨识”两种中医诊疗逻辑,实现中医症状到中医证型的自动分类。本发明提出的模型由三个模块组成,即图构建、图卷积、分类器。首先,使用中医知识构建处方图;然后,在处方知识图谱上应用图卷积;最后,采用感知机分类器来实现对不同证型的分类。该模型采用中医关系建立图结构,基于图卷积进行症状与状态元素之间的关系表示学习,实现更准确的证型分类。本发明通过构建症状‑状态要素‑症状图结构,发掘中医症状、状态要素和证型之间的关系,基于图卷积神经网络实现证型的自动分类,为中医诊疗提供技术支撑,实现中医诊疗的计算机辅助化。

Description

基于图卷积神经网络的中医证型分类方法
技术领域
本发明属于分类技术领域,具体涉及一种基于图卷积神经网络的中医证型分类方法。
背景技术
自古以来,中医在维护人体健康和治疗疾病方面发挥了重要作用。随着计算机和人工智能的发展,计算机辅助诊疗在中医领域有了很大的提高。在中医临床诊疗过程中,“辩证论治”是最常用的中医诊疗理论,其起源于《黄帝内经》,发展于《伤寒论》,主张从病人当前阶段的症状中所反映的病因、病位、病性和病势总结出一个中医证型[1]。证是对疾病某一阶段机体整体反应状态的病理概括,证型是指证的类型,是临床常用而规范的标准证名,是由不同的病因引起阴阳气血的不同变化导致人体的不同疾病状态[2],任何病变都可以进行证型的辨别,其证名都是由状态要素组合而成的。在进行治疗之前,有经验的医生可以根据症状和状态要素(疾病的位置和性质)对证型进行区分。患者的症状可以通过四种诊断方法获得:望、闻、问、切[3]。但是由于四诊信息不全面、不够准确等问题[4],阻碍了医师的治疗效果的提升。近年来,李灿东等[5]提出了另一种诊疗逻辑——“状态辨识”,该逻辑引入了“病位”、“病性”、“程度”等状态要素信息。任何一个证都是由病位、病性等要素构成,通过对状态要素的辨识能够把握病理状态的本质。因此辨证时只要能根据症状和状态要素,正确归纳出证型,便抓住了病变当前的病理本质,并开出药方进行治疗,增加辅助了诊疗的实用性,为医生和患者推荐更加可靠的诊疗方案。
准确高效的分类算法可以挖掘出症状-证型间的关系,从而确保辩证的准确性[6]。现有的中医证型分类方法,没有充分考虑中医症状和状态要素的全局关系,没有融入中医“状态辨识”的诊疗原则,或者准确率不高。如丁亮等人提出采用模糊数学和深度神经网络相结合的方法[7],建立了原发性肝癌病证型诊断分类的预测模型,张守宾等人提出一种基于多模态扰动策略的集成学习算法[6]。穆广春等人基于心脏的彩超指标,研究了高血压中医证型与心脏结构功能之间的关系[8]。因此,为了更客观、更准确的根据病人症状,快速诊断出正确的证型,在中医诊疗领域出现了较多基于机器学习算法的相关研究[9]。例如苏翀[10]等人利用基于KL距离的决策树建立诊断模型,可实现对慢性阻塞性肺病患者的初步筛查,用临床上的AUROC评价指标,确诊率达到了82.3%。许朝霞[11]等人基于多支持向量机和人工神经网络的中医证候识别效果良好。陈菊萍[12]等人用支持向量机算法实现了《中医证候学》讲述的六类辨证中包含的125种中医证候的分类,通过选取不同核函数以及参数的调整,模型准确率从最初的34.8%到最终的98.9%。近年来,图卷积神经网络也被广泛应用于医疗领域,在疾病的诊疗中发挥着重要的作用[13]。随着计算机技术的迅猛发展,研究学者们对深度学习网络的钻研,人们对基于深度学习的中医辅助诊断作出了越来越多的创新性研究[14]。
中医证型是身体状态的病理特性的总结,表现为具有内在联系的症状。中医证型分类现有的挑战如下:(a)现有的经典医学书籍中有复杂多样的症状和数千种中医证型类型,并且命名方式灵活多样;(b)由于临床医生的不同诊断方式,症状、状态要素和证型的信息普遍收集不完善,不可避免地带来同一症状却是不同的证型分类结果。(c)中医将人体视为诊断和治疗的统一实体,输入和输出之间的逻辑关系是非线性的。因此,上述特点和困难给中医证型分类带来了挑战,也减缓了在中医领域计算机辅助诊断的改进。为了应对上述挑战,本申请提出了一种新的方法,称为图卷积神经网络(SSGCN)。具体地,首先在两个真实世界的中医处方数据集中构建图结构,其中病人的病情被定义为节点,状态要素被定义为边缘。一个多层感知机被作为分类器进行证型标签分类。实验从整体上证明了SSGCN方法的有效性和优越性。本分类方法提供了一个使用中医领域知识组织处方的通用思路,并对不同的症状组合能够预测出合理的证型类别,挖掘症状和证型之间的关系,对中医诊疗在人工智能方向的研究非常具有参考价值。
发明内容
本发明的目的在于提供一种基于图卷积神经网络的中医证型分类方法,结合“辨证论治”和“状态辨识”两种中医诊疗逻辑,实现中医症状到中医证型的自动分类。
为实现上述目的,本发明的技术方案是:一种基于图卷积神经网络的中医证型分类方法,包括:
构建处方知识图谱;
在处方知识图谱上应用图卷积;
采用感知机分类器MLP实现对不同证型的分类。
在本发明一实施例中,所述构建处方知识图谱,通过构建症状-状态要素-症状图结构,发掘中医症状、状态要素和证型之间的关系,症状-状态要素-症状图结构用元组G=(V,E)表示,并定义症状集V表示节点,状态要素集E和症状集V之间的关系表示边缘;具体地,
将症状集、状态要素集和证型集分别用独热One-hot编码,每个元素都由一个向量表示,当元素存在时向量按位置编码为1,其他位置编码为0;症状集被编码为特征矩阵F,证型集被编码为矩阵T;用多热Multi-hot编码对症状组嵌入块和状态要素组编码,xi=(v1,v2,…,vp),si=(e1,e2,…,eq);为表示空间结构中症状之间的关系,定义节点症状用特征矩阵F表示,边缘表示症状与状态要素之间的相关性,并用邻接矩阵A表示;
症状-状态要素-症状图由症状的特征矩阵F和状态要素矩阵S组成;而图结构G对应于邻接矩阵A;在同一处方中,症状组中的所有症状都被认为是相关的,因为完全相同的状态元素使节点之间构成边缘,因此它们彼此连接,对应于邻接矩阵A中的1;在不同的处方中,具有N个共同的状态要素来连接它们时,症状组中的任意两个症状并定义为相关,并且节点是连接的;根据症状和状态要素之间的空间关系能够表示出图结构G,并用邻接矩阵A表示;然后将一个单位矩阵添加到A中,因为每个症状节点都被认为与自身相关,
Figure BDA0003532725080000031
其中I是单位矩阵;然后计算渡矩阵D,
Figure BDA0003532725080000032
表示每个症状节点和其他节点的相关性;最后,归一化邻接矩阵可以表示为:
Figure BDA0003532725080000033
在本发明一实施例中,所述在处方知识图谱上应用图卷积的具体实现方式如下:
将特征矩阵F和邻接矩阵A作为输入,H0上的第一个卷积层可以定义为:
Figure BDA0003532725080000034
其中σ()是ReLU(),W0是权重,H0定义为特征矩阵F;由此得到图卷积的第一层特征H1;为防止在图层太深时梯度消失,使用残差块应用于高阶的图卷积层;卷积过程可以定义为:
Figure BDA0003532725080000035
上式除了将特征矩阵Hl-1和归一化邻接矩阵
Figure BDA0003532725080000036
相乘外,还添加了前一层的残差结构;从上式可以看出,只要计算邻接矩阵
Figure BDA0003532725080000037
和特征矩阵Hl-1,就可以得到每层的特征矩阵Hl;通过堆叠卷积层来捕获高阶相邻节点的特征。
在本发明一实施例中,所述采用感知机分类器MLP实现对不同证型的分类的具体实现方式如下:
通过K层图卷积层的传播,从图卷积层获得症状特征的嵌入表示HK,其中l(1<l≤K),表示GCN的当前层的特征;处方代表可以定义为:
Z=XHk
X是症状组构成的嵌入块矩阵,处方Z表示症状组的特征与状态元素之间的关系,能够自动聚合一组症状的特征,并且输入到更深层次的神经网络中;使用多层感知器MLP进行分类,如下所示:
Figure BDA0003532725080000038
Wi是权重参数,bi偏置,yi是输出的概率,其中每个输出对应于对证型正确分类的概率,σ()是激活函数ReLU();上式是一个双层感知器分类器,把n作为输出层中神经元的个数,也就是证型类别数m,ti和yi表示证型的真实值和预测值;最后,证型分类的训练损失函数被定义为BCE损失函数:
Figure BDA0003532725080000041
相较于现有技术,本发明具有以下有益效果:现有主流中医证型分类主要是基于机器学习算法及其拓展方法进行分类,这些方法都注重于使用症状到证型的共现关系,而忽略了与状态要素的关系,并且只使用了“辨证论治”的诊疗思想。本发明将图卷积神经网络运用于证型分类场景中,构建了一个图卷积神经网络(SSGCN)模型,利用图卷积神经网络良好的图表示学习拟合能力,获得了更具表达能力的中医病症综合嵌入表示,挖掘中医症状、状态要素与证型之间的联系,实现中医病症到证型的快速分类。本发明的创新点在于引入了症状和状态要素两个中医领域知识,从一个新的角度研究中医证型分类的任务,运用图卷积神经网络建模了处方数据的高阶相关性。该模型的设计不但符合中医理论,且在中医证型分类性能上表现突出。在中医领域广泛采用的伤寒论和中医方剂大辞典数据集上的实验,验证了本发明算法的优越性。
附图说明
图1为本发明SSGCN模型图。
图2为本发明图卷积结构示意图。
具体实施方式
下面结合附图,对本发明的技术方案进行具体说明。
本发明一种基于图卷积神经网络的中医证型分类方法,包括:
构建处方知识图谱;
在处方知识图谱上应用图卷积;
采用感知机分类器MLP实现对不同证型的分类。
以下为本发明具体实现过程。
本发明提出的SSGCN(Symptoms-State elements Graph ConvolutionalNetwork)模型,如图1所示,由三个模块组成,分别名为图构建(Graph Construction)、图卷积(Graph Convolution)和分类器(Classifier)。该模型的新颖之处在于,该模型采用中医关系建立图结构,实现更准确的证型分类,所提方法基于图卷积进行症状与状态元素之间的关系表示学习。首先使用中医知识构建处方图。然后,在处方知识图谱上应用图卷积。最后,采用感知机分类器(Multilayer Perceptron,MLP)来实现对不同证型的分类。
1、图构建
为了给临床诊疗提供相应的技术支持,提高中医证型分类的准确性和科学性,本发明构建了症状-状态要素-症状图结构,发掘中医症状、状态要素和证型之间的关系。构建图结构的数据集如表1所示,症状-状态要素-症状图结构用元组G=(V,E)表示,定义症状集V表示节点,状态要素集E和症状集V之间的关系表示边缘。
表1中医处方实例
Figure BDA0003532725080000051
将症状集(Symptoms)、状态元素集(Element States)和证型集(Syndromes)分别用One-hot(独热)编码,每个元素都由一个向量表示,当元素存在时向量按位置编码为1,其他位置编码为0。症状集被编码为特征矩阵F(Feature Matrix),证型集被编码为矩阵T。比如,怕冷编码为向量v1=(1,0,0,…,0),霍乱证被编码为向量tm=(0,0,0,…,1)。用Multi-hot(多热)编码对症状组嵌入块(Symptoms Embedding)和状态要素组编码,xi=(v1,v2,…,vp),si=(e1,e2,…,eq)。比如,在处方中症状组(怕冷、发热、无汗)被编码为x1=(1,1,1,0,0,0,0,0,0,...,0)。为了表示空间结构中症状之间的关系,我们定义节点症状用特征矩阵用F表示,边缘表示症状与状态元素之间的相关性,并用邻接矩阵A(Adjacency Matrix)表示。
如图1所示,症状-状态元素-症状图由症状矩阵F和状态元素矩阵S组成。而图G对应于邻接矩阵A。在同一处方中,症状组中的所有症状都被认为是相关的,因为完全相同的状态元素使节点之间构成边缘,因此它们彼此连接,对应于邻接矩阵A中的1。比如在第一个处方中,症状组x1=(怕冷-v1,发热-v2,无汗-v3)由状态元素组s1=(外风-e1、冷-e2、表-e3)建立了边缘关系,他们之间的节点是相互关联的。因此,第2列和第3列在第一行中为1,第1列和第3列第2行中为1,第1列和第2列在第3行中为1,其他位置为0。在不同的处方中,具有N个共同的状态元素来连接它们时,症状组中的任意两个症状并定义为相关,并且节点是连接的。比如怕冷和口渴之间的连接关系取决于同一组状态元素(外风,寒和表)是否能够构造出边。仅在表1的实例中,当N小于等于3时,怕冷和口渴之间的边关系是存在的,这两个节点相连。根据症状和状态元素之间的空间关系能够表示出图结构G,并用邻接矩阵A表示。然后将一个单位矩阵添加到A中,因为每个症状节点都被认为与自身相关,
Figure BDA0003532725080000061
其中I是单位矩阵。然后计算渡矩阵D,
Figure BDA0003532725080000062
表示每个症状节点和其他节点的相关性。最后,归一化邻接矩阵可以表示为:
Figure BDA0003532725080000063
2、图卷积
通过上述编码预处理获得中医数据的症状特征矩阵F和症状-状态要素关系图的邻接矩阵A。图卷积模块将特征矩阵F和邻接矩阵A作为输入,H0上的第一个卷积层可以定义为:
Figure BDA0003532725080000064
其中σ()是ReLU(),W0是权重,H0定义为特征矩阵F。由此得到图卷积的第一层特征H1。为了防止在图层太深时梯度消失,使用残差块应用于高阶的图卷积层。卷积过程可以定义为:
Figure BDA0003532725080000065
如图2所示,除了将特征矩阵Hl-1和归一化邻接矩阵
Figure BDA0003532725080000066
相乘外,还添加了前一层的残差结构。从公式(2)可以看出,只要计算邻接矩阵
Figure BDA0003532725080000067
和特征矩阵Hl-1,就可以得到每层的特征矩阵Hl。我们通过堆叠卷积层来捕获高阶相邻节点的特征。
3、分类器
通过K层图卷积层的传播,从图卷积层获得症状特征的嵌入表示HK,其中l(1<l≤K),表示GCN的当前层的特征。处方代表可以定义为:
Z=XHk (3)
X是症状组构成的嵌入块矩阵,处方Z表示症状组的特征与状态元素之间的关系,能够自动聚合一组症状的特征---从怕冷、发热和无汗的单一症状到一组症状(怕冷、发热和无汗),并且输入到更深层次的神经网络中。使用多层感知器(MLP)进行分类,如下所示:
Figure BDA0003532725080000068
Wi是权重参数,bi偏置,yi是输出的概率,其中每个输出对应于对证型正确分类的概率,σ()是激活函数ReLU()。由公式(4)看出,是一个双层感知器分类器,把n作为输出层中神经元的个数,也就是证型类别数m,ti和yi表示证型的真实值和预测值。最后,证型分类的训练损失函数被定义为BCE损失函数:
Figure BDA0003532725080000071
本发明通过局部一阶近似来学习节点表示,可以捕获拓扑图的结构信息。为了学习不同的节点特征,所提出方法的框架整合了从中医知识图谱中获得的嵌入表示,不仅考虑了症状信息,还考虑了症状与图中状态要素的综合相关性,融合了中医“辨证论治”和“状态辨识”的诊疗逻辑,从而实现更准确的证型分类。
4、实验数据集及评价指标
本研究的实验基于python3.7环境,使用Pytorch进行编程实现。实验设备的处理器为Intel(R)Core(TM)i7-10750H,显卡为Nvidia 1650Ti,操作系统为Windows 10。为验证本发明方法的有效性,本发明在两个真实中医数据集上进行了实验。
1)伤寒论数据集:该数据集整理自中医学的经典著作《伤寒论》。预处理完成后的数据集共包含173条处方,其中共包括症状107种、状态要素41种、证型38种。
2)中医方剂大辞典数据集:该数据集由Yao[15]等人公开,其处方数据出自中医学的著作《中医方剂大辞典》。规范处理后的数据集还保留299条处方,其中共包括症状158种、状态要素58种、证型8种。
在本发明中,选用了文本多分类常用的4个评价指标,分别是准确率(Accuracy)、精确度(Precision)、召回率(Recall)和F1分数(F1-score),这些指标的定义如下所示:
Figure BDA0003532725080000072
Figure BDA0003532725080000073
Figure BDA0003532725080000074
Figure BDA0003532725080000075
5、基线
本研究使用以下几种方法来进行对比实验:
(1)卷积神经网络(CNN):实现证型分类的卷积神经网络模型包括一个卷积层和两个全连接层。输入层是症状,维度为1×4的卷积核用于提取特征,全连接层可实现分类。
(2)支持向量机(SVM):使用该方法对证型进行分类,使从采样点到最优超平面的最小距离之和最大化。存在的映射关系是将原始训练数据映射到高维空间。然后搜索最佳的分离超平面可以在新空间中实现分类。
(3)多项朴素贝叶斯(NB):此算法假设每个样本彼此独立。为了获得测试数据的后验概率,从训练数据中获得先验概率。通过贝叶斯公式实现证型分类。
(4)逻辑回归(LR):症状被输入到逻辑回归模型中,转换为经过验证的预测值,然后映射到Sigmoid函数中。最后,通过逻辑回归算法分类证型。
(5)随机森林分类器(RF):从原始数据集中提取多个样本,首先用弱分类器决策树对提取的样本进行训练,然后将这些决策树组合在一起,通过投票得到最终的分类或预测结果。
(6)多层感知器分类器(MLP):感知器模型由输入层、输出层和一个隐藏层组成,用于证型分类。
6、实验结果
本实验中两个数据集的训练集与测试集比例均为9:1,且为最小化随机性对实验结果带来的影响,所有的实验结果均展示为运行50次的平均结果。
1)、定量分析
表2中展示了不同基线的定量实验结果。可以看出本发明提出的SSGCN方法在所有基线中表现最好。在准确率、精确度、召回率、F1_分数共四个指标中均不同程度高于其他基线。
表2不同基线方法对比的实验结果
Figure BDA0003532725080000081
与基线方法相比,我们的模型在利用图结构学习症状和状态元素的相关性方面更胜一筹。如表2所示,两个数据集的准确率分别达到75.59%和69.63%,优于其他对比算法2%-27%。SSGCN模型利用症状和状态元素之间的关系来聚合相关的症状节点。网络不仅学习节点的特征,还学习关联节点之间的边缘信息,因此可以更准确的分类。实验结果表明,应用中医"辩证论治"和“状态辨识”诊疗逻辑,结合状态要素,可以更好地模拟症状与证型之间的非线性关系,与基线方法相比,可以实现更准确的证型分类。
2)、定性分析
通过表3的实例可以看出,SSGCN模型具有正确分类中医证型的性能。如实例1中,根据症状谵语、发热、腹满,和状态要素亡阴、燥屎、心神、胃、热等信息,可以由训练好的模型对证型正确分类,预测为阳明热郁证。
表3 SSGCN模型证型分类结果实例
Figure BDA0003532725080000091
参考文献:
[1]陈晖,吕朝晖,廖柳,侯秋科.基于“以方测证”论《伤寒论》《金匮要略》辨证论治思维[J].山东中医药大学学报,45(02):183-186,2021.
[2]徐佳君,罗志明,赵文,雷黄伟,周常恩,李绍滋,李灿东.基于人工智能算法的中医状态辨识规则[J].中医杂志,61(03):204-208,2020.
[3]陆广莘.论辨证与辨病问题[J].中国医药学报,1990(2):3-9+80.
[4]张晓航,石清磊,王斌,王炳蔚,王永吉,陈力,吴敬征.机器学习算法在中医诊疗中的研究综述[J].计算机科学,45(S2):32-36,2018.
[5]李灿东,杨雪梅,甘慧娟,等.健康状态辨识模型算法的探讨[J].中华中医药杂志,26(6):1351-1355,2011.
[6]张守宾,朱习军.集成学习算法在中医证型分类预测中的应用[J].计算机工程与科学,41(02):328-334,2019.
[7]丁亮,章新友,刘莉萍,牛晓录,郭永坤.基于深度神经网络的原发性肝癌证型诊断分类预测模型[J].世界科学技术-中医药现代化,22(12):4185-4192,2020.
[8]穆广春.试析高血压病中医证型与心脏结构功能的关系[J].中医临床研究,7(17):31-32,2015.
[9]赵文,林雪娟,周常恩,等.中医辨证的内涵与外延[J].中国中医基础医学杂志,1-11,2021.
[10]苏翀,任曈,王国品,殷杰.利用决策树建立慢性阻塞性肺病中医诊断模型[J].计算机工程与应用,55(03):225-230,2019.
[11]许朝霞,王忆勤,颜建军,等.基于支持向量机和人工神经网络的心血管疾病中医证候分类识别研究[J].北京中医药大学学报,34(08):539-543,2011.
[12]陈菊萍.支持向量机在中医证候分类中的应用研究[D].兰州大学,2017.
[13]张晓航,石清磊,王斌,王炳蔚,王永吉,陈力,吴敬征.机器学习算法在中医诊疗中的研究综述[J].计算机科学,45(S2):32-36,2018.
[14]赵文,李书楠,徐佳君,许鸿本,周常恩,李灿东.智能化中医辅助诊疗系统模型构建[J].中华中医药杂志,35(05):2421-2424,2020.
[15]L.Yao,Y.Zhang,B.Wei,W.Zhang,Z.Jin,A topic modeling approach fortraditional Chinese medicine prescriptions,IEEE Transactions on Knowledge andData Engineering,30(6):1007-1021,2018.。
以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

Claims (4)

1.一种基于图卷积神经网络的中医证型分类方法,其特征在于,包括:
构建处方知识图谱;
在处方知识图谱上应用图卷积;
采用感知机分类器MLP实现对不同证型的分类。
2.根据权利要求1所述的基于图卷积神经网络的中医证型分类方法,其特征在于,所述构建处方知识图谱,通过构建症状-状态要素-症状图结构,发掘中医症状、状态要素和证型之间的关系,症状-状态要素-症状图结构用元组G=(V,E)表示,并定义症状集V表示节点,状态要素集E和症状集V之间的关系表示边缘;具体地,
将症状集、状态要素集和证型集分别用独热One-hot编码,每个元素都由一个向量表示,当元素存在时向量按位置编码为1,其他位置编码为0;症状集被编码为特征矩阵F,证型集被编码为矩阵T;用多热Multi-hot编码对症状组嵌入块和状态要素组编码,xi=(v1,v2,…,vp),si=(e1,e2,…,eq);为表示空间结构中症状之间的关系,定义节点症状用特征矩阵F表示,边缘表示症状与状态要素之间的相关性,并用邻接矩阵A表示;
症状-状态要素-症状图由症状的特征矩阵F和状态要素矩阵S组成;而图结构G对应于邻接矩阵A;在同一处方中,症状组中的所有症状都被认为是相关的,因为完全相同的状态元素使节点之间构成边缘,因此它们彼此连接,对应于邻接矩阵A中的1;在不同的处方中,具有N个共同的状态要素来连接它们时,症状组中的任意两个症状并定义为相关,并且节点是连接的;根据症状和状态要素之间的空间关系能够表示出图结构G,并用邻接矩阵A表示;然后将一个单位矩阵添加到A中,因为每个症状节点都被认为与自身相关,
Figure FDA0003532725070000011
其中I是单位矩阵;然后计算渡矩阵D,
Figure FDA0003532725070000012
表示每个症状节点和其他节点的相关性;最后,归一化邻接矩阵可以表示为:
Figure FDA0003532725070000013
3.根据权利要求2所述的基于图卷积神经网络的中医证型分类方法,其特征在于,所述在处方知识图谱上应用图卷积的具体实现方式如下:
将特征矩阵F和邻接矩阵A作为输入,H0上的第一个卷积层可以定义为:
Figure FDA0003532725070000014
其中σ()是ReLU(),W0是权重,H0定义为特征矩阵F;由此得到图卷积的第一层特征H1;为防止在图层太深时梯度消失,使用残差块应用于高阶的图卷积层;卷积过程可以定义为:
Figure FDA0003532725070000021
上式除了将特征矩阵Hl-1和归一化邻接矩阵
Figure FDA0003532725070000022
相乘外,还添加了前一层的残差结构;从上式可以看出,只要计算邻接矩阵
Figure FDA0003532725070000023
和特征矩阵Hl-1,就可以得到每层的特征矩阵Hl;通过堆叠卷积层来捕获高阶相邻节点的特征。
4.根据权利要求3所述的基于图卷积神经网络的中医证型分类方法,其特征在于,所述采用感知机分类器MLP实现对不同证型的分类的具体实现方式如下:
通过K层图卷积层的传播,从图卷积层获得症状特征的嵌入表示HK,其中l(1<l≤K),表示GCN的当前层的特征;处方代表可以定义为:
Z=XHk
X是症状组构成的嵌入块矩阵,处方Z表示症状组的特征与状态元素之间的关系,能够自动聚合一组症状的特征,并且输入到更深层次的神经网络中;使用多层感知器MLP进行分类,如下所示:
Figure FDA0003532725070000024
Wi是权重参数,bi偏置,yi是输出的概率,其中每个输出对应于对证型正确分类的概率,σ()是激活函数ReLU();上式是一个双层感知器分类器,把n作为输出层中神经元的个数,也就是证型类别数m,ti和yi表示证型的真实值和预测值;最后,证型分类的训练损失函数被定义为BCE损失函数:
Figure FDA0003532725070000025
CN202210213917.4A 2022-03-04 2022-03-04 基于图卷积神经网络的中医证型分类方法 Pending CN114582497A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210213917.4A CN114582497A (zh) 2022-03-04 2022-03-04 基于图卷积神经网络的中医证型分类方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210213917.4A CN114582497A (zh) 2022-03-04 2022-03-04 基于图卷积神经网络的中医证型分类方法

Publications (1)

Publication Number Publication Date
CN114582497A true CN114582497A (zh) 2022-06-03

Family

ID=81773160

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210213917.4A Pending CN114582497A (zh) 2022-03-04 2022-03-04 基于图卷积神经网络的中医证型分类方法

Country Status (1)

Country Link
CN (1) CN114582497A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115050481A (zh) * 2022-06-17 2022-09-13 湖南中医药大学 一种基于图卷积神经网络的中医方剂功效预测方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115050481A (zh) * 2022-06-17 2022-09-13 湖南中医药大学 一种基于图卷积神经网络的中医方剂功效预测方法
CN115050481B (zh) * 2022-06-17 2023-10-31 湖南中医药大学 一种基于图卷积神经网络的中医方剂功效预测方法

Similar Documents

Publication Publication Date Title
Yu et al. Clinical big data and deep learning: Applications, challenges, and future outlooks
LaFreniere et al. Using machine learning to predict hypertension from a clinical dataset
CN109920501B (zh) 基于卷积神经网络和主动学习的电子病历分类方法及系统
WO2023202508A1 (zh) 一种基于认知图谱的全科患者个性化诊疗方案推荐系统
Lu et al. Collaborative graph learning with auxiliary text for temporal event prediction in healthcare
Wu et al. Medical knowledge graph: Data sources, construction, reasoning, and applications
Kong et al. Artificial intelligence: a key to relieve China’s insufficient and unequally-distributed medical resources
Yan et al. Comparison of support vector machine, back propagation neural network and extreme learning machine for syndrome element differentiation
Ren et al. Interpretable pneumonia detection by combining deep learning and explainable models with multisource data
Huan et al. Deep convolutional neural networks for classifying body constitution based on face image
Zhang et al. A two-stage deep transfer learning model and its application for medical image processing in Traditional Chinese Medicine
CN115602273A (zh) 一种结合临床知识图谱与多模态信息融合的中医辅助决策方法及系统
Chen et al. Unite: Uncertainty-based health risk prediction leveraging multi-sourced data
Huan et al. Transfer learning with deep convolutional neural network for constitution classification with face image
CN115423052B (zh) 基于多图注意力的中医证型分类方法
CN114255851A (zh) 基于超图神经网络的中草药方剂推荐方法
Chang et al. The study that applies artificial intelligence and logistic regression for assistance in differential diagnostic of pancreatic cancer
Ma et al. Machine learning in TCM with natural products and molecules: current status and future perspectives
CN114582497A (zh) 基于图卷积神经网络的中医证型分类方法
Waheeb et al. An efficient sentiment analysis based deep learning classification model to evaluate treatment quality
AlZu’Bi et al. transfer learning enabled CAD system for monkey pox classification
Lin et al. Learning patient similarity via heterogeneous medical knowledge graph embedding
Chaudhuri et al. Variable Selection in Genetic Algorithm Model with Logistic Regression for Prediction of Progression to Diseases
Lin et al. Medical Concept Embedding with Variable Temporal Scopes for Patient Similarity.
CN117133414A (zh) 一种中草药推荐方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination