CN113539409A - 治疗方案推荐方法、装置、设备及存储介质 - Google Patents

治疗方案推荐方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN113539409A
CN113539409A CN202110856168.2A CN202110856168A CN113539409A CN 113539409 A CN113539409 A CN 113539409A CN 202110856168 A CN202110856168 A CN 202110856168A CN 113539409 A CN113539409 A CN 113539409A
Authority
CN
China
Prior art keywords
medical
vector
case
current case
treatment scheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110856168.2A
Other languages
English (en)
Other versions
CN113539409B (zh
Inventor
李春宇
倪渊
谢国彤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN202110856168.2A priority Critical patent/CN113539409B/zh
Publication of CN113539409A publication Critical patent/CN113539409A/zh
Application granted granted Critical
Publication of CN113539409B publication Critical patent/CN113539409B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Software Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Primary Health Care (AREA)
  • Databases & Information Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Pathology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种治疗方案推荐方法,该方法包括:获取当前病例症状以及医疗病例数据库,基于自注意力机制从医疗病例数据库中提取与当前病例症状对应的候选治疗方案;对候选治疗方案进行预处理,获得第一向量集合;构建医疗知识图谱,从医疗知识图谱中抽取医学节点集,采用异质图神经网络对医学节点集进行表征学习,根据当前病例症状对表征结果进行筛选,获得与当前病例症状对应的第二向量集合;计算第一向量集合与第二向量集合之间的相似度;根据相似度计算结果从第一向量集合中确定目标向量,将目标向量对应的候选治疗方案作为推荐治疗方案。通过上述方式,本发明能够充分结合医疗知识图谱和医生的候选治疗方案,保证推荐治疗方案的可靠性。

Description

治疗方案推荐方法、装置、设备及存储介质
技术领域
本发明涉及医疗信息数据处理技术领域,特别是涉及一种治疗方案推荐方法、装置、设备及存储介质。
背景技术
疾病治疗方案的推荐方式是十分复杂,现有的推荐方式通常采用基于规则决策树的方式进行,或者是基于现有病例搜索相似方案的方式进行。
基于规则决策树的方式在构建关键决策点后,通常存在特征缺失或者不完整,以及并发症过多,导致通过原有的决策规则无法匹配,因此,基于规则决策树的方式推荐疾病治疗方案的可靠性强,但个性化很差。
基于现有病例搜索相似方案的方式可以针对现实世界的病例进行循证,并有依据地进行新方案的选取,但是,患者发病特征不尽相同,无法找到百分百完全匹配的相似病例。
发明内容
本发明提供一种治疗方案推荐方法、装置、设备及存储介质,能够充分结合医疗知识图谱和医生的候选治疗方案,保证推荐治疗方案的可靠性。
为解决上述技术问题,本发明采用的一个技术方案是:提供一种基于医疗知识图谱的治疗方案推荐方法,包括:
获取当前病例症状以及医疗病例数据库,基于自注意力机制从所述医疗病例数据库中提取与所述当前病例症状对应的候选治疗方案,所述医疗病例数据库中存储有历史治疗方案;
对所述候选治疗方案进行预处理,获得第一向量集合;
构建医疗知识图谱,从所述医疗知识图谱中抽取医学节点集,采用异质图神经网络对所述医学节点集进行表征学习,根据所述当前病例症状对表征结果进行筛选,获得与所述当前病例症状对应的第二向量集合;
计算所述第一向量集合与所述第二向量集合之间的相似度;
根据相似度计算结果从所述第一向量集合中确定目标向量,将所述目标向量对应的候选治疗方案作为推荐治疗方案。
根据本发明的一个实施例,获取当前病例症状以及医疗病例数据库,基于自注意力机制从所述医疗病例数据库中提取与所述当前病例症状对应的候选治疗方案的步骤包括:
从所述医疗病例数据库中获取病例信息,采用自注意力机制从所述病例信息中抽取病例特征;
将所述病例特征与所述当前病例症状进行匹配以对所述病例信息进行分类;
根据分类结果从所述病例信息中筛选出与所述当前病例症状对应的候选治疗方案。
根据本发明的一个实施例,对所述候选治疗方案进行预处理,获得第一向量集合的步骤包括:
对所述候选治疗方案进行排列形成方案序列;
依次对所述方案序列中的每一个所述候选治疗方案进行嵌入处理,得到每一个所述候选治疗方案的向量表示;
将多个所述候选治疗方案的向量表示进行合并处理组成集合,获得所述第一向量集合。
根据本发明的一个实施例,计算所述第一向量集合与所述第二向量集合之间的相似度的步骤包括:
计算所述第一向量集合中每个分量与所述第二向量集合之间的欧几里得距离;
根据所述欧几里得距离计算所述第一向量集合中每个分量与所述第二向量集合之间的相似度。
根据本发明的一个实施例,根据相似度计算结果从所述第一向量集合中确定目标向量,将所述目标向量对应的候选治疗方案作为推荐治疗方案的步骤还包括:
将所述相似度计算结果与预设阈值进行比较;
根据比较结果对所述第一向量集合中的分量进行分类,并从分类结果中确定目标向量,将所述目标向量对应的候选治疗方案作为推荐治疗方案。
根据本发明的一个实施例,构建医疗知识图谱,从所述医疗知识图谱中抽取医学节点集,采用异质图神经网络对所述医学节点集进行表征学习,根据所述当前病例症状对表征结果进行筛选,获得与所述当前病例症状对应的第二向量集合的步骤包括:
构建医疗知识图谱,从所述医疗知识图谱中获取医学节点集,所述医疗节点集包括同一疾病的症状、用药、手术和检验检查对应的医学节点;
将所述医学节点集对应的节点特征转化为节点集邻接矩阵,采用异质图神经网络对所述节点集邻接矩阵进行表征学习,获取节点集关联向量;
基于所述当前病例症状对所述节点集关联向量进行筛选,获取与所述当前病例症状对应的第二向量集合。
根据本发明的一个实施例,基于所述当前病例症状对所述节点集关联向量进行筛选,获取与所述当前病例症状对应的第二向量集合的步骤之前,还包括:
当所述医学知识图谱中不存在与所述当前病例症状对应的医学节点时,将所述当前病例症状添加入异质图中,获取所述当前病例症状的邻居节点;
根据所述邻居节点生成对应的计算图,从所述计算图中获得与所述当前病例症状对应的医学节点。
为解决上述技术问题,本发明采用的另一个技术方案是:提供一种基于医疗知识图谱的治疗方案推荐装置,包括:
第一获取模块,用于获取当前病例症状以及医疗病例数据库,基于自注意力机制从所述医疗病例数据库中提取与所述当前病例症状对应的候选治疗方案,所述医疗病例数据库中存储有历史治疗方案;
预处理模块,用于对所述候选治疗方案进行预处理,获得第一向量集合;
第二获取模块,用于构建医疗知识图谱,从所述医疗知识图谱中抽取医学节点集,采用异质图神经网络对所述医学节点集进行表征学习,根据所述当前病例症状对表征结果进行筛选,获得与所述当前病例症状对应的第二向量集合;
计算模块,用于计算所述第一向量集合与所述第二向量集合之间的相似度;
推荐模块,用于根据相似度计算结果从所述第一向量集合中确定目标向量,将所述目标向量对应的候选治疗方案作为推荐治疗方案。
为解决上述技术问题,本发明采用的再一个技术方案是:提供一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述的基于医疗知识图谱的治疗方案推荐方法。
为解决上述技术问题,本发明采用的再一个技术方案是:提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于医疗知识图谱的治疗方案推荐方法。
本发明的有益效果是:与现有的直接从医疗知识图谱中获取推荐方案的方式相比,将医疗知识图谱与医疗病例数据库相结合,基于当前病例症状采用自注意力机制从医疗病例数据库中选取候选治疗方案,基于当前病例症状采用异质图神经网络从医疗知识图谱中获取治疗方案,通过比较医疗知识图谱中获取的治疗方案和医疗病例数据库中选取的候选治疗方案之间的相似度,在候选治疗方案中进一步找出更可靠的治疗方案,既能防止因推荐模型的训练数据错误而推荐出异常治疗方案,还能够保证推荐方案的个性化和可靠性。
附图说明
图1是本发明第一实施例的基于医疗知识图谱的治疗方案推荐方法的流程示意图;
图2是本发明实施例的基于医疗知识图谱的治疗方案推荐方法的步骤S101的流程示意图;
图3是本发明实施例的基于医疗知识图谱的治疗方案推荐方法的步骤S102的流程示意图;
图4是本发明实施例的基于医疗知识图谱的治疗方案推荐方法的步骤S103的流程示意图;
图5是本发明实施例的基于医疗知识图谱的治疗方案推荐方法的步骤S105的流程示意图;
图6是本发明第二实施例的基于医疗知识图谱的治疗方案推荐方法的流程示意图;
图7是本发明第三实施例的基于医疗知识图谱的治疗方案推荐方法的流程示意图;
图8是本发明实施例的基于医疗知识图谱的治疗方案推荐装置的结构示意图;
图9是本发明实施例的计算机设备的结构示意图;
图10是本发明实施例的计算机存储介质的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明中的术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”、“第三”的特征可以明示或者隐含地包括至少一个该特征。本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
图1是本发明第一实施例的基于医疗知识图谱的治疗方案推荐方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图1所示的流程顺序为限。如图1所示,该方法包括步骤:
步骤S101:获取当前病例症状以及医疗病例数据库,基于自注意力机制从医疗病例数据库中提取与当前病例症状对应的候选治疗方案,医疗病例数据库中存储有历史治疗方案。
在步骤S101中,历史治疗方案根据医生的工作经验获得,根据当前病例症状可以从医疗病例数据库中筛选出比较合适的历史治疗方案,并将筛出结果作为候选治疗方案,本实施例的候选治疗方案不少于两个,候选治疗方案记录的病例信息包括但不限于症状、疾病、用药、手术以及检查检验。在本实施例中,当病例信息中的症状与当前病例症状相同或相似时,将记录有该病例信息的历史治疗方案作为候选治疗方案。
进一步地,请参见图2,步骤S101还包括以下步骤:
步骤S201:从医疗病例数据库中获取病例信息,采用自注意力机制从病例信息中抽取病例特征。
在步骤S201中,医疗病例数据库中存储有一条条的病例信息,没条病例信息对应一个历史治疗方案。通过自注意力机制计算病例特征的自注意力值,能够学习病例特征在病例信息中的隐含特征,具体地,自注意力值按照如下公式进行计算:
Figure BDA0003184241180000071
其中,Q为query,K为key,V为value;dk为key的维度。
本实施例通过自注意力机制能够学习病例信息中的上下文语义,从而准确地将病例信息中的病例特征提取出来。
步骤S202:将病例特征与当前病例症状进行匹配以对病例信息进行分类。
在步骤S202中,根据与当前病例症状相匹配的病例特征的数量与病例特征总量计算匹配率,将匹配率与预设阈值进行比较,根据比较结果对病例信息进行分类预测。
步骤S203:根据分类结果从病例信息中筛选出与当前病例症状对应的候选治疗方案。
在步骤S203中,当匹配率超过预设阈值时,保留该匹配率对应的病例信息,并将该病例信息作为与当前病例症状对应的候选治疗方案,否则,删除对应的病例信息。
步骤S102:对候选治疗方案进行预处理,获得第一向量集合。
在步骤S102中,对候选治疗方案进行预处理,将候选治疗方案转化成向量表示,在本实施例中,候选治疗方案为多个,第一向量集合中的每个分量代表一个候选治疗方案。具体地,请参见图3,步骤S102还包括以下步骤:
步骤S301:对候选治疗方案进行排列形成方案序列。
步骤S302:依次对方案序列中的每一个候选治疗方案进行嵌入处理,得到每一个候选治疗方案的向量表示。
在步骤S302中,对每个候选治疗方案进行分词处理,得到分词序列;对分词序列进行词嵌入处理得到分词向量,将同一个候选治疗方案的分词向量进行合并处理,得到第一向量集合的分量。具体地,本实施例通过TF-IDF方法、TextRank方法或Word2Vec词聚类方法等自然语音处理(NLP)对候选治疗方案进行分词处理,得到分词序列,采用Word2Vec模型对得到分词序列进行词嵌入处理,得到分词向量。
步骤S303:将多个候选治疗方案的向量表示进行合并处理组成集合,获得第一向量集合。
在步骤S303中,以候选治疗方案有3个为例进行说明,第一向量集合为[A,B,C],分量A,B,C分别对应一个候选治疗方案,则分量A表示成A={a1,a2,...,ai},分量B表示成B={b1,b2,...,bi},分量C表示成C={c1,c2,...,ci}。
步骤S103:构建医疗知识图谱,从医疗知识图谱中抽取医学节点集,采用异质图神经网络对医学节点集进行表征学习,根据当前病例症状对表征结果进行筛选,获得与当前病例症状对应的第二向量集合。
在步骤S103中,医疗知识图谱由通用的医疗知识图谱与医生提供的治疗方案进行整合获得。医疗知识图谱包括症状(发热和咳嗽等)、疾病(肺炎、肿瘤等)、用药(指治疗疾病的药,例如泰洛和布洛芬等)、手术(对疾病进行治疗的手段,例如切除肿瘤)以及检查检验(检测疾病的项目,例如CT)等医学节点中至少一种,医疗知识图谱具体是依据医学节点对应的节点特征间的关联关系得到的,医学节点包括症状、疾病、用药、手术以及检查检验,节点特征是指医学节点对应的特征,例如,医学节点为症状,节点特征为咳嗽。
医疗知识图谱包括异质图和同质图,同质图是指医学节点和边类型的数量均只有一种的图,异质图指的是医学节点或边类型的数量大于一种的图,在本实施例中,异质图的医学节点包括症状、疾病、用药、手术以及检查检验,也就是说,异质图为症状、疾病、用药、手术以及检查检验等医学节点对应的节点特征形成的图,异质图中相连的节点特征的关联性较强,不相连的节点特征的关联性较弱,后续对异质图进行表征学习,能够得到异质图的深层信息。
异质图神经网络是将计算机中的图结构转化为可以量化且对深度学习模型友好的向量表示,异质图神经网络可以忽略图结构中节点的输入顺序,但在计算过程中,节点的表示受其周围邻居节点的影响,但图本身连接不变,图结构的表示可以进行基于图的解释和推理,从而提取图结构中的节点和节点之间的关联关系。
进一步地,请参见图4,步骤S103还包括以下步骤:
步骤S401:构建医疗知识图谱,从医疗知识图谱中获取医学节点集,医疗节点集包括同一疾病的症状、用药、手术和检验检查对应的医学节点。
在步骤S401中,医学节点集以疾病为重点,将同一疾病相关的症状、用药、手术和检验检查对应的节点特征形成集合。例如,以肺炎为例,与肺炎相关的症状为呼吸困难、咳嗽和发热;与肺炎相关的用药为抗生素,与肺炎相关的检验检查为肺部CT,则肺炎对应的医学节点集为肺炎-呼吸困难、咳嗽和发热-抗生素-肺部CT。
步骤S402:将医学节点集对应的节点特征转化为节点集邻接矩阵,采用异质图神经网络对所述节点集邻接矩阵进行表征学习,获取节点集关联向量。
在步骤S402中,节点集关联向量是表征同一疾病对应的症状、用药、手术和检验检查对应的节点特征的关联关系的向量,本实施例采用异质图神经网络对同一疾病形成的医学节点集的关系进行表征学习,得到同一疾病的医学节点集关系形成的节点集关联向量,以实现对同一疾病的信息进行挖掘,深入学习同一疾病的节点特征的关联性,以使获得的节点关联向量具有更深层次的联系。
步骤S403:基于当前病例症状对节点集关联向量进行筛选,获取与当前病例症状对应的第二向量集合。
在步骤S403中,将当前病例症状作为一个医学节点,可通过与当前病例症状对应医学节点以及节点特征之间的关联关系,筛选出与当前病例症状相关联的一系列医学节点,并将筛出结果组成集合,从而获得第二向量集合。
步骤S104:计算第一向量集合与第二向量集合之间的相似度。
在步骤S104中,将第一向量集合中的每一个分量与第二向量集合计算相似度,获得与候选治疗方案数量相匹配的相似度计算结果,本实施例的第一向量集合中一个分量代表一个候选治疗方案。
进一步地,请参见图5,步骤S104还包括以下步骤:
步骤S501:计算第一向量集合中每个分量与第二向量集合之间的欧几里得距离。
在步骤S501中,欧几里得距离计算公式如下:
A·B=‖A‖‖B‖cosθ,其中,A为第一向量集合中的分量,B为第二向量集合,θ为第一向量集合中的分量与第二向量集合之间的夹角。
步骤S502:根据欧几里得距离计算第一向量集合中每个分量与第二向量集合之间的相似度。
在步骤S502中,相似度计算公式如下:
Figure BDA0003184241180000101
其中,A为第一向量集合中的分量,B为第二向量集合,θ为第一向量集合中的分量与第二向量集合之间的夹角,Ai表示分量中的子分量,Bi为第二向量集合的分量,n表示各分量或子分量的数量。
步骤S105:根据相似度计算结果从第一向量集合中确定目标向量,将目标向量对应的候选治疗方案作为推荐治疗方案。
在步骤S105中,推荐治疗方案可以有一个或多个,本实施例的推荐治疗方案为一个,将相似度计算结果进行排序处理,从第一向量集合中选择相似度最高的分量对应的候选治疗方案作为推荐治疗方案。
本发明第一实施例的基于医疗知识图谱的治疗方案推荐方法与现有的直接从医疗知识图谱中获取推荐方案的方式相比,通过将医疗知识图谱与医疗病例数据库相结合,基于当前病例症状采用自注意力机制从医疗病例数据库中选取候选治疗方案,基于当前病例症状采用异质图神经网络从医疗知识图谱中获取治疗方案,通过比较医疗知识图谱中获取的治疗方案和医疗病例数据库中选取的候选治疗方案之间的相似度,在候选治疗方案中进一步找出更可靠的治疗方案,既能防止因推荐模型的训练数据错误而推荐出异常治疗方案,还能够保证推荐方案的个性化和可靠性。
图6是本发明第二实施例的基于医疗知识图谱的治疗方案推荐方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图6所示的流程顺序为限。如图6所示,该方法包括步骤:
步骤S601:获取当前病例症状以及医疗病例数据库,基于自注意力机制从医疗病例数据库中提取与当前病例症状对应的候选治疗方案,医疗病例数据库中存储有历史治疗方案。
在本实施例中,图6中的步骤S601和图1中的步骤S101类似,为简约起见,在此不再赘述。
步骤S602:对候选治疗方案进行预处理,获得第一向量集合。
在本实施例中,图6中的步骤S602和图1中的步骤S102类似,为简约起见,在此不再赘述。
步骤S603:构建医疗知识图谱,从医疗知识图谱中获取医学节点集,医疗节点集包括同一疾病的症状、用药、手术和检验检查对应的医学节点。
在本实施例中,图6中的步骤S603和图4中的步骤S401类似,为简约起见,在此不再赘述。
步骤S604:将医学节点集对应的节点特征转化为节点集邻接矩阵,采用异质图神经网络对节点集邻接矩阵进行表征学习,获取节点集关联向量。
在本实施例中,图6中的步骤S604和图4中的步骤S402类似,为简约起见,在此不再赘述。
步骤S605:当医学知识图谱中不存在与当前病例症状对应的医学节点时,将当前病例症状添加入异质图中,获取当前病例症状的邻居节点。
在步骤S605中,若当前病例症状为新的病例症状时,即医学知识图谱中不存在当前病例症状对应的医学节点,则需将当前病例症状添加入异质图中,获取当前病例症状的邻居节点。
步骤S606:根据邻居节点生成对应的计算图,从计算图中获得与当前病例症状对应的医学节点。
在步骤S606中,通过邻居节点获得当前病例症状对应的医学节点,克服了传统的决策树无法扩展以及特征点缺失等缺陷,针对罕见的病例案件也能够给出推荐治疗方案。
步骤S607:基于当前病例症状对节点集关联向量进行筛选,获取与当前病例症状对应的第二向量集合。
在本实施例中,图6中的步骤S607和图4中的步骤S403类似,为简约起见,在此不再赘述。
步骤S608:计算第一向量集合与第二向量集合之间的相似度。
在本实施例中,图6中的步骤S608和图1中的步骤S104类似,为简约起见,在此不再赘述。
步骤S609:根据相似度计算结果从第一向量集合中确定目标向量,将目标向量对应的候选治疗方案作为推荐治疗方案。
在本实施例中,图6中的步骤S609和图1中的步骤S105类似,为简约起见,在此不再赘述。
本发明第二实施例的治疗方案推荐方法在第一实施例的基础上,克服了传统的决策树无法扩展以及特征点缺失等缺陷,针对罕见的病例案件也能够给出推荐治疗方案。
图7是本发明第三实施例的治疗方案推荐方法的流程示意图。需注意的是,若有实质上相同的结果,本发明的方法并不以图7所示的流程顺序为限。如图7所示,该方法包括步骤:
步骤S701:获取当前病例症状以及医疗病例数据库,基于自注意力机制从医疗病例数据库中提取与当前病例症状对应的候选治疗方案,医疗病例数据库中存储有历史治疗方案。
在本实施例中,图7中的步骤S701和图1中的步骤S101类似,为简约起见,在此不再赘述。
步骤S702:对候选治疗方案进行预处理,获得第一向量集合。
在本实施例中,图7中的步骤S702和图1中的步骤S102类似,为简约起见,在此不再赘述。
步骤S703:构建医疗知识图谱,从医疗知识图谱中抽取医学节点集,采用异质图神经网络对医学节点集进行表征学习,根据当前病例症状对表征结果进行筛选,获得与当前病例症状对应的第二向量集合。
在本实施例中,图7中的步骤S703和图1中的步骤S103类似,为简约起见,在此不再赘述。
步骤S704:计算第一向量集合与第二向量集合之间的相似度。
在本实施例中,图7中的步骤S704和图1中的步骤S104类似,为简约起见,在此不再赘述。
步骤S705:将相似度计算结果与预设阈值进行比较。
步骤S706:根据比较结果对第一向量集合中的分量进行分类,并从分类结果中确定目标向量,将目标向量对应的候选治疗方案作为推荐治疗方案。
在步骤S706中,推荐治疗方案为至少两个,当相似度计算结果超过预设阈值,将对应的分量确定为目标向量,将目标向量对应的候选治疗方案作为推荐治疗方案。
本发明第三实施例的治疗方案推荐方法与现有的直接从医疗知识图谱中获取一个推荐方案的方式相比,通过相似度计算结果对候选治疗方案进行分类,能够获得多个更可靠的治疗方案,多个治疗方案具有相似性,有效防止因推荐模型的训练数据错误而推荐出异常治疗方案,还能够保证推荐方案的个性化和可靠性。
图8是本发明实施例的基于医疗知识图谱的治疗方案推荐装置的结构示意图。如图8所示,该装置80包括第一获取模块81、预处理模块82、第二获取模块83、计算模块84以及推荐模块85。
第一获取模块81用于获取当前病例症状以及医疗病例数据库,基于自注意力机制从所述医疗病例数据库中提取与所述当前病例症状对应的候选治疗方案,所述医疗病例数据库中存储有历史治疗方案。
预处理模块82用于对所述候选治疗方案进行预处理,获得第一向量集合。
第二获取模块83用于构建医疗知识图谱,从所述医疗知识图谱中抽取医学节点集,采用异质图神经网络对所述医学节点集进行表征学习,根据所述当前病例症状对表征结果进行筛选,获得与所述当前病例症状对应的第二向量集合。
计算模块84用于计算所述第一向量集合与所述第二向量集合之间的相似度。
推荐模块85用于根据相似度计算结果从所述第一向量集合中确定目标向量,将所述目标向量对应的候选治疗方案作为推荐治疗方案。
请参阅图9,图9为本发明实施例的计算机设备的结构示意图。如图9所示,该计算机设备90包括处理器91及和处理器91耦接的存储器92。
存储器92存储有用于实现上述任一实施例所述的基于医疗知识图谱的治疗方案推荐方法的程序指令。
处理器91用于执行存储器92存储的程序指令以推荐治疗方案。
其中,处理器91还可以称为CPU(Central Processing Unit,中央处理单元)。处理器91可能是一种集成电路芯片,具有信号的处理能力。处理器91还可以是通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
参阅图10,图10为本发明实施例的计算机存储介质的结构示意图。本发明实施例的计算机存储介质存储有能够实现上述所有方法的程序文件101,其中,该程序文件101可以以软件产品的形式存储在上述计算机存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式所述方法的全部或部分步骤。而前述的计算机存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,或者是计算机、服务器、手机、平板等终端设备。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
以上仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种基于医疗知识图谱的治疗方案推荐方法,其特征在于,包括:
获取当前病例症状以及医疗病例数据库,基于自注意力机制从所述医疗病例数据库中提取与所述当前病例症状对应的候选治疗方案,所述医疗病例数据库中存储有历史治疗方案;
对所述候选治疗方案进行预处理,获得第一向量集合;
构建医疗知识图谱,从所述医疗知识图谱中抽取医学节点集,采用异质图神经网络对所述医学节点集进行表征学习,根据所述当前病例症状对表征结果进行筛选,获得与所述当前病例症状对应的第二向量集合;
计算所述第一向量集合与所述第二向量集合之间的相似度;
根据相似度计算结果从所述第一向量集合中确定目标向量,将所述目标向量对应的候选治疗方案作为推荐治疗方案。
2.根据权利要求1所述的治疗方案推荐方法,其特征在于,获取当前病例症状以及医疗病例数据库,基于自注意力机制从所述医疗病例数据库中提取与所述当前病例症状对应的候选治疗方案的步骤包括:
从所述医疗病例数据库中获取病例信息,采用自注意力机制从所述病例信息中抽取病例特征;
将所述病例特征与所述当前病例症状进行匹配以对所述病例信息进行分类;
根据分类结果从所述病例信息中筛选出与所述当前病例症状对应的候选治疗方案。
3.根据权利要求1所述的治疗方案推荐方法,其特征在于,对所述候选治疗方案进行预处理,获得第一向量集合的步骤包括:
对所述候选治疗方案进行排列形成方案序列;
依次对所述方案序列中的每一个所述候选治疗方案进行嵌入处理,得到每一个所述候选治疗方案的向量表示;
将多个所述候选治疗方案的向量表示进行合并处理组成集合,获得所述第一向量集合。
4.根据权利要求3所述的治疗方案推荐方法,其特征在于,计算所述第一向量集合与所述第二向量集合之间的相似度的步骤包括:
计算所述第一向量集合中每个分量与所述第二向量集合之间的欧几里得距离;
根据所述欧几里得距离计算所述第一向量集合中每个分量与所述第二向量集合之间的相似度。
5.根据权利要求4所述的治疗方案推荐方法,其特征在于,根据相似度计算结果从所述第一向量集合中确定目标向量,将所述目标向量对应的候选治疗方案作为推荐治疗方案的步骤还包括:
将所述相似度计算结果与预设阈值进行比较;
根据比较结果对所述第一向量集合中的分量进行分类,并从分类结果中确定目标向量,将所述目标向量对应的候选治疗方案作为推荐治疗方案。
6.根据权利要求1所述的治疗方案推荐方法,其特征在于,构建医疗知识图谱,从所述医疗知识图谱中抽取医学节点集,采用异质图神经网络对所述医学节点集进行表征学习,根据所述当前病例症状对表征结果进行筛选,获得与所述当前病例症状对应的第二向量集合的步骤包括:
构建医疗知识图谱,从所述医疗知识图谱中获取医学节点集,所述医疗节点集包括同一疾病的症状、用药、手术和检验检查对应的医学节点;
将所述医学节点集对应的节点特征转化为节点集邻接矩阵,采用异质图神经网络对所述节点集邻接矩阵进行表征学习,获取节点集关联向量;
基于所述当前病例症状对所述节点集关联向量进行筛选,获取与所述当前病例症状对应的第二向量集合。
7.根据权利要求6所述的治疗方案推荐方法,其特征在于,基于所述当前病例症状对所述节点集关联向量进行筛选,获取与所述当前病例症状对应的第二向量集合的步骤之前,还包括:
当所述医学知识图谱中不存在与所述当前病例症状对应的医学节点时,将所述当前病例症状添加入异质图中,获取所述当前病例症状的邻居节点;
根据所述邻居节点生成对应的计算图,从所述计算图中获得与所述当前病例症状对应的医学节点。
8.一种基于医疗知识图谱的治疗方案推荐装置,其特征在于,包括:
第一获取模块,用于获取当前病例症状以及医疗病例数据库,基于自注意力机制从所述医疗病例数据库中提取与所述当前病例症状对应的候选治疗方案,所述医疗病例数据库中存储有历史治疗方案;
预处理模块,用于对所述候选治疗方案进行预处理,获得第一向量集合;
第二获取模块,用于构建医疗知识图谱,从所述医疗知识图谱中抽取医学节点集,采用异质图神经网络对所述医学节点集进行表征学习,根据所述当前病例症状对表征结果进行筛选,获得与所述当前病例症状对应的第二向量集合;
计算模块,用于计算所述第一向量集合与所述第二向量集合之间的相似度;
推荐模块,用于根据相似度计算结果从所述第一向量集合中确定目标向量,将所述目标向量对应的候选治疗方案作为推荐治疗方案。
9.一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-7任一项所述的基于医疗知识图谱的治疗方案推荐方法。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-7中任一项所述的基于医疗知识图谱的治疗方案推荐方法。
CN202110856168.2A 2021-07-28 2021-07-28 治疗方案推荐方法、装置、设备及存储介质 Active CN113539409B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110856168.2A CN113539409B (zh) 2021-07-28 2021-07-28 治疗方案推荐方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110856168.2A CN113539409B (zh) 2021-07-28 2021-07-28 治疗方案推荐方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN113539409A true CN113539409A (zh) 2021-10-22
CN113539409B CN113539409B (zh) 2024-04-26

Family

ID=78121119

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110856168.2A Active CN113539409B (zh) 2021-07-28 2021-07-28 治疗方案推荐方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN113539409B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114005509A (zh) * 2021-10-30 2022-02-01 平安国际智慧城市科技股份有限公司 一种治疗方案推荐系统、方法、装置和存储介质
CN115662647A (zh) * 2022-12-27 2023-01-31 北京大学第三医院(北京大学第三临床医学院) 一种相似疾病挖掘的方法和应用
CN116246749A (zh) * 2023-05-11 2023-06-09 西南医科大学附属医院 集成电子病历的内分泌病人个性化健康管理系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808931A (zh) * 2016-03-03 2016-07-27 北京大学深圳研究生院 一种基于知识图谱的针灸决策支持方法及装置
CN108388580A (zh) * 2018-01-24 2018-08-10 平安医疗健康管理股份有限公司 融合医学知识及应用病例的动态知识图谱更新方法
CN110704640A (zh) * 2019-09-30 2020-01-17 北京邮电大学 一种知识图谱的表示学习方法及装置
CN111414393A (zh) * 2020-03-26 2020-07-14 湖南科创信息技术股份有限公司 一种基于医学知识图谱的语义相似病例检索方法及设备
US20200303072A1 (en) * 2017-12-29 2020-09-24 Obshchestvo S Ogranichennoj Otvetstvennostyu "Intellodzhik" Method and system for supporting medical decision making
CN112364174A (zh) * 2020-10-21 2021-02-12 山东大学 基于知识图谱的病人病历相似度评估方法及系统
WO2021041241A1 (en) * 2019-08-26 2021-03-04 Healthpointe Solutions, Inc. System and method for defining a user experience of medical data systems through a knowledge graph
CN113010778A (zh) * 2021-03-10 2021-06-22 北京明略软件系统有限公司 一种基于用户历史兴趣的知识图谱推荐方法和系统
KR20210091671A (ko) * 2020-01-14 2021-07-22 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 의료 사실의 검증 방법 및 장치

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105808931A (zh) * 2016-03-03 2016-07-27 北京大学深圳研究生院 一种基于知识图谱的针灸决策支持方法及装置
US20200303072A1 (en) * 2017-12-29 2020-09-24 Obshchestvo S Ogranichennoj Otvetstvennostyu "Intellodzhik" Method and system for supporting medical decision making
CN108388580A (zh) * 2018-01-24 2018-08-10 平安医疗健康管理股份有限公司 融合医学知识及应用病例的动态知识图谱更新方法
WO2021041241A1 (en) * 2019-08-26 2021-03-04 Healthpointe Solutions, Inc. System and method for defining a user experience of medical data systems through a knowledge graph
CN110704640A (zh) * 2019-09-30 2020-01-17 北京邮电大学 一种知识图谱的表示学习方法及装置
KR20210091671A (ko) * 2020-01-14 2021-07-22 베이징 바이두 넷컴 사이언스 앤 테크놀로지 코., 엘티디. 의료 사실의 검증 방법 및 장치
CN111414393A (zh) * 2020-03-26 2020-07-14 湖南科创信息技术股份有限公司 一种基于医学知识图谱的语义相似病例检索方法及设备
CN112364174A (zh) * 2020-10-21 2021-02-12 山东大学 基于知识图谱的病人病历相似度评估方法及系统
CN113010778A (zh) * 2021-03-10 2021-06-22 北京明略软件系统有限公司 一种基于用户历史兴趣的知识图谱推荐方法和系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ZHIHUANG LIN ET AL.: ""Patient Similarity via Joint Embeddings of Medical Knowledge Graph and Medical Entity Descriptions"", 《IEEE ACCESS》, vol. 8, pages 156663 - 156674 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114005509A (zh) * 2021-10-30 2022-02-01 平安国际智慧城市科技股份有限公司 一种治疗方案推荐系统、方法、装置和存储介质
CN115662647A (zh) * 2022-12-27 2023-01-31 北京大学第三医院(北京大学第三临床医学院) 一种相似疾病挖掘的方法和应用
CN115662647B (zh) * 2022-12-27 2024-03-12 北京大学第三医院(北京大学第三临床医学院) 一种相似疾病挖掘的方法和应用
CN116246749A (zh) * 2023-05-11 2023-06-09 西南医科大学附属医院 集成电子病历的内分泌病人个性化健康管理系统

Also Published As

Publication number Publication date
CN113539409B (zh) 2024-04-26

Similar Documents

Publication Publication Date Title
US11868394B2 (en) Analyzing content of digital images
US11669965B2 (en) AI-based label generating system and methods for use therewith
CN113539409B (zh) 治疗方案推荐方法、装置、设备及存储介质
US11514244B2 (en) Structured knowledge modeling and extraction from images
CN109243618B (zh) 医学模型的构建方法、疾病标签构建方法及智能设备
Reza Zare et al. Automatic classification of medical X‐ray images using a bag of visual words
WO2021046536A1 (en) Automated information extraction and enrichment in pathology report using natural language processing
Ahmad et al. SiNC: Saliency-injected neural codes for representation and efficient retrieval of medical radiographs
Arias et al. Medical image modality classification using discrete Bayesian networks
Reza Zare et al. Automatic classification of medical X‐ray images: hybrid generative‐discriminative approach
US20230112591A1 (en) Machine learning based medical data checker
CN113793696A (zh) 一种基于相似性的新药副作用发生频率预测方法、系统、终端及可读存储介质
CN115410717A (zh) 模型训练方法、数据检索方法、影像数据检索方法和装置
Aman et al. Content-based image retrieval on CT colonography using rotation and scale invariant features and bag-of-words model
Hassan et al. Comparison of distance metrics for hierarchical data in medical databases
Aghamirmohammadali et al. Modelling of retinal vasculature based on genetically tuned parametric L-system
Rashad et al. Content-based medical image retrieval based on deep features expansion
JP2024508852A (ja) 医療画像における病変分析方法
JP2024500470A (ja) 医療画像における病変分析方法
CN110033862B (zh) 一种基于加权有向图的中医量化诊断系统及存储介质
Zhao et al. Multi-label Node Classification On Graph-Structured Data
CN110689964B (zh) 一种健康数据样例搜索方法及系统
Akhtar et al. Effective voting ensemble of homogenous ensembling with multiple attribute-selection approaches for improved identification of thyroid disorder. Electron. 2021; 10 (23): 3026
Hadavi et al. Classification of normal and abnormal lung ct-scan images using cellular learning automata
CN111402979B (zh) 病情描述与诊断一致性检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant