CN109616169B - 相似患者挖掘方法、装置、计算机设备和存储介质 - Google Patents

相似患者挖掘方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109616169B
CN109616169B CN201811581104.0A CN201811581104A CN109616169B CN 109616169 B CN109616169 B CN 109616169B CN 201811581104 A CN201811581104 A CN 201811581104A CN 109616169 B CN109616169 B CN 109616169B
Authority
CN
China
Prior art keywords
node
medical
entity
path
patient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811581104.0A
Other languages
English (en)
Other versions
CN109616169A (zh
Inventor
李菁
许孟可
李师众
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangzhou Tianpeng Computer Technology Co ltd
Original Assignee
Guangzhou Tianpeng Computer Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangzhou Tianpeng Computer Technology Co ltd filed Critical Guangzhou Tianpeng Computer Technology Co ltd
Priority to CN201811581104.0A priority Critical patent/CN109616169B/zh
Publication of CN109616169A publication Critical patent/CN109616169A/zh
Application granted granted Critical
Publication of CN109616169B publication Critical patent/CN109616169B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本申请涉及一种相似患者挖掘方法、装置、计算机设备和存储介质。所述方法包括:获取医疗知识图谱;在所述医疗知识图谱中,提取患者的医疗特征实体节点;在所述医疗特征实体节点中,确定随机游走节点;确定游走节点路径;所述游走节点路径包括所述随机游走节点和所述随机游走节点之间的关联关系。采用本方法能够通过深层次的医疗特征及医疗特征之间的关联关系挖掘相似患者,所挖掘患者的病患情况的相似程度较高,提升了对相似患者挖掘的准确性。

Description

相似患者挖掘方法、装置、计算机设备和存储介质
技术领域
本申请涉及医疗数据处理技术领域,特别是涉及一种基于知识图谱的相似患者挖掘方法、装置、计算机设备和存储介质。
背景技术
在电子病历中,存在有大量的诊断、治疗、实验室检查等数据,这些数据可以用于进行医疗数据分析。例如,利用诊断、治疗、实验室检查等数据挖掘出相似患者,从而可以对相似患者的数据进行比对分析。
目前挖掘相似患者的方式,主要是基于患者的年龄、性别等较为浅层的患者特征。然而,即使患者之间年龄、性别较为相似,并不代表患者实际的病患情况相似,也即是说,基于患者年龄、性别等患者特征挖掘相似患者的方式,挖掘出的患者可能并不相似。
因此,目前的相似患者挖掘方式存在着无法准确挖掘相似患者的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种相似患者挖掘方法、装置、计算机设备和存储介质。
一种基于知识图谱的相似患者挖掘方法,包括:
获取医疗知识图谱;
在所述医疗知识图谱中,提取患者的医疗特征实体节点;所述医疗特征实体节点为所述医疗知识图谱中记录患者的医疗特征的实体节点;
在所述医疗特征实体节点中,确定随机游走节点;所述随机游走节点之间具有关联关系;
确定游走节点路径;所述游走节点路径包括所述随机游走节点和所述随机游走节点之间的关联关系;所述游走节点路径用于挖掘医疗特征相似的患者。
在一个实施例中,所述在所述医疗特征实体节点中,确定随机游走节点,包括:
在所述医疗特征实体节点中,确定起始实体节点;
随机游走所述医疗特征实体节点,得到从所述起始实体节点到达任意一个具有关联关系的实体顶点的概率分布;所述实体顶点为属于所述医疗知识图谱的顶点的实体节点;
根据所述概率分布,在所述医疗特征实体节点中,确定所述随机游走节点。
在一个实施例中,所述随机游走所述医疗特征实体节点,包括:
在所述医疗知识图谱中,确定所述起始实体节点的相邻节点;
计算所述相邻节点与所述起始实体节点之间的节点关联度;
当所述节点关联度符合设定的关联度范围,将所述相邻节点作为当前的起始实体节点,并迭代计算当前的起始实体节点与其相邻的相邻节点之间的节点关联度,直至遍历所述医疗特征实体节点。
在一个实施例中,还包括:
获取第一患者的游走节点路径,以及,获取第二患者的游走节点路径;
计算所述第一患者的游走节点路径和所述第二患者的游走节点路径之间的路径相似度;
当所述路径相似度大于预设的相似度阈值,判定所述第一患者和所述第二患者为相似患者。
在一个实施例中,所述计算所述第一患者的游走节点路径和所述第二患者的游走节点路径之间的路径相似度,包括:
根据所述第一患者的游走节点路径,生成第一路径特征向量;
根据所述第二患者的游走节点路径,生成第二路径特征向量;
计算所述第一路径特征向量和所述第二路径特征向量之间的欧式空间距离,作为所述路径相似度。
在一个实施例中,所述获取医疗知识图谱,包括:
接收电子病历;
从所述电子病历中,提取原始病历信息;
将所述原始病历信息转换为结构化医疗特征;
生成与所述结构化医疗特征对应的实体节点及关系,得到所述医疗特征实体节点及关系;
采用所述医疗特征实体节点及关系构建所述医疗知识图谱。
在一个实施例中,所述结构化医疗特征包括患者人口学特征、诊断特征、症状特征、检查特征、实验室检验特征、影像学报告特征、治疗特征、病情变化特征、手术特征、转归特征中的至少一种。
一种相似患者挖掘装置,包括:
图谱获取模块,用于获取医疗知识图谱;
节点提取模块,用于在所述医疗知识图谱中,提取患者的医疗特征实体节点;所述医疗特征实体节点为所述医疗知识图谱中记录患者的医疗特征的实体节点;
随机游走节点确定模块,用于在所述医疗特征实体节点中,确定随机游走节点;所述随机游走节点之间具有关联关系;
路径确定模块,用于确定游走节点路径;所述游走节点路径包括所述随机游走节点和所述随机游走节点之间的关联关系;所述游走节点路径用于挖掘医疗特征相似的患者。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取医疗知识图谱;
在所述医疗知识图谱中,提取患者的医疗特征实体节点;所述医疗特征实体节点为所述医疗知识图谱中记录患者的医疗特征的实体节点;
在所述医疗特征实体节点中,确定随机游走节点;所述随机游走节点之间具有关联关系;
确定游走节点路径;所述游走节点路径包括所述随机游走节点和所述随机游走节点之间的关联关系;所述游走节点路径用于挖掘医疗特征相似的患者。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取医疗知识图谱;
在所述医疗知识图谱中,提取患者的医疗特征实体节点;所述医疗特征实体节点为所述医疗知识图谱中记录患者的医疗特征的实体节点;
在所述医疗特征实体节点中,确定随机游走节点;所述随机游走节点之间具有关联关系;
确定游走节点路径;所述游走节点路径包括所述随机游走节点和所述随机游走节点之间的关联关系;所述游走节点路径用于挖掘医疗特征相似的患者。
上述相似患者挖掘方法、装置、计算机设备和存储介质,通过在医疗知识图谱中提取出记录患者的医疗特征的实体节点,并通过随机游走算法的方式,在实体节点中确定随机游走节点,并生成记录有随机游走节点及之间的关联关系的游走节点路径,从而可以基于患者的游走节点路径挖掘医疗特征相似的患者,从而,利用随机游走的方式,通过深层次的医疗特征及医疗特征之间的关联关系挖掘相似患者,所挖掘患者的病患情况的相似程度较高,提升了对相似患者挖掘的准确性。
附图说明
图1是一个实施例的一种相似患者挖掘方法的流程示意图;
图2是一个实施例的一种相似患者挖掘装置的结构框图;
图3是一个实施例的一种计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种基于知识图谱的相似患者挖掘方法,包括以下步骤:
步骤S110,获取医疗知识图谱。
其中,医疗知识图谱可以为用于记录患者的医疗特征及特征之间联系的知识图谱。医疗特征可以具体包括患者人口学特征、诊断特征、症状特征、检查特征、实验室检验特征、影像学报告特征、治疗特征、病情变化特征、手术特征、转归特征等。知识图谱(Knowledge Graph)是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。
具体实现中,可以从某个患者的电子病历中提取出原始病历信息,将原始病历信息转换为结构化医疗特征,生成结构化医疗特征对应的实体节点及关系,构建实体节点及实体节点之间的关联关系,从而构建出医疗知识图谱。当然,在实际应用中,除了通过电子病历获取医疗知识图谱,本领域技术人员还可以采用各种方式建立医疗知识图谱,例如,可以通过人工输入的方式构建医疗知识图谱。
实际应用中,可以将实体节点和实体节点之间关联关系的数据录入至Neo4j(一种图形数据库)图数据库,以建立起以患者为中心的医疗知识图谱。其中,Neo4j是一个高性能的NoSQL(Not Only SQL,非关系型数据库)图形数据库,它将结构化数据存储在网络上而不是表中。
步骤S120,在所述医疗知识图谱中,提取患者的医疗特征实体节点。
其中,医疗特征实体节点可以为记录患者的医疗特征的实体节点。每个实体节点所记录的医疗特征,可以具体包括患者人口学特征、诊断特征、症状特征、检查特征、实验室检验特征、影像学报告特征、治疗特征、病情变化特征、手术特征、转归特征等特征。
具体实现中,可以从某个患者的医疗知识图谱中,提取出记录该患者的医疗特征的多个实体节点,作为医疗特征实体节点。
步骤S130,在所述医疗特征实体节点中,确定随机游走节点;所述随机游走节点之间具有关联关系。
其中,随机游走节点可以为通过随机游走算法(Random Walk)所确定的与当前的实体节点相邻的另一实体节点。随机游走算法是基于扩散运输定律而形成的算法,随机游走算法的核心概念是指任何无规则行走者所带的守恒量都各自对应着一个扩散运输定律,是布朗运动理想的数学状态。目前随机游走算法主要应用于互联网链接分析中。
具体实现中,可以首先在多个医疗特征实体节点中,确定起始实体节点。例如,可以将记录患者个人身份信息的实体节点,作为起始实体节点。从该起始实体节点出发,通过随机游走算法,确定与起始实体节点相邻的另一个实体节点,通过迭代的随机游走,直至游走至医疗知识图谱的顶点,得到多个的具有关联关系的实体节点,根据起始实体节点到达任意一个作为顶点的实体节点的概率分布,根据该概率分布,可以确定从起始实体节点到达顶点的概率较高的多个实体节点,作为随机游走节点。
步骤S140,确定游走节点路径;所述游走节点路径包括所述随机游走节点和所述随机游走节点之间的关联关系;所述游走节点路径用于挖掘医疗特征相似的患者。
具体实现中,可以得到多个随机游走节点之间的关联关系,由多个随机游走节点及其之间的关联关系,形成一条游走节点路径。由此,针对每个患者,均可以得到对应的一条游走节点路径。在挖掘相似患者时,可以将各个患者的游走节点路径进行向量化,得到游走节点路径的路径特征向量,基于路径特征向量之间的欧式空间距离,判断患者的医疗特征是否相似,从而挖掘出相似患者。
根据本申请实施例的技术方案,通过在医疗知识图谱中提取出记录患者的医疗特征的实体节点,并通过随机游走算法的方式,在实体节点中确定随机游走节点,并生成记录有随机游走节点及之间的关联关系的游走节点路径,从而可以基于患者的游走节点路径挖掘医疗特征相似的患者,从而,利用随机游走的方式,通过深层次的医疗特征及医疗特征之间的关联关系挖掘相似患者,所挖掘患者的病患情况的相似程度较高,提升了对相似患者挖掘的准确性。
在另一个实施例中,所述步骤S130,包括:
在所述医疗特征实体节点中,确定起始实体节点;随机游走所述医疗特征实体节点,得到从所述起始实体节点到达任意一个具有关联关系的实体顶点的概率分布;所述实体顶点为属于所述医疗知识图谱的顶点的实体节点;根据所述概率分布,在所述医疗特征实体节点中,确定所述随机游走节点。
具体实现中,可以将记录患者的个人身份信息的实体节点,作为起始实体节点。例如,患者ID、患者姓名等。
然后,通过随机游走算法,随机游走医疗知识图谱中的各个医疗特征实体节点。例如,确定与起始实体节点相邻的某个实体节点,将相邻的某个实体节点作为新的起始实体节点,游走至下一个相邻的实体节点。通过迭代计算的方式,随机游走各个具有关联关系的医疗特征实体节点,直至游走至属于医疗知识图谱的顶点的实体节点,将该属于医疗知识图谱的顶点的实体节点,命名为实体顶点。
计算从起始实体节点游走至各个实体顶点的概率,得到从起始实体节点到达任意一个具有关联关系的实体顶点的概率分布。最后,根据该概率分布,即可以确定从起始实体节点到达实体顶点的概率较高的多个实体节点,作为随机游走节点。
在另一个实施例中,所述随机游走所述医疗特征实体节点,包括:
在所述医疗知识图谱中,确定所述起始实体节点的相邻节点;计算所述相邻节点与所述起始实体节点之间的节点关联度;当所述节点关联度符合设定的关联度范围,将所述相邻节点作为当前的起始实体节点,并迭代计算当前的起始实体节点与其相邻的相邻节点之间的节点关联度,直至遍历所述医疗特征实体节点。
具体实现中,在随机游走过程中,可以在医疗知识图谱中,随机游走至任意一个与起始实体节点相邻的实体节点,作为相邻节点。然后,计算相邻节点与起始实体节点之间的节点关联度。当节点关联度符合预设的一个关联度范围,将相邻节点作为当前的、新的起始实体节点,迭代计算当前的起始实体节点与其相邻的相邻节点之间的节点关联度,直至遍历医疗知识图谱中的各个医疗特征实体节点。
在另一个实施例中,所述步骤S110,包括:
接收电子病历;从所述电子病历中,提取原始病历信息;将所述原始病历信息转换为结构化医疗特征;生成与所述结构化医疗特征对应的实体节点及关系,得到所述医疗特征实体节点及关系;采用所述医疗特征实体节点及关系构建所述医疗知识图谱。
具体实现中,可以将某个患者的电子病历输入,由此可以从电子病历中,提取出原始的、非结构化的病历信息,将原始病历信息转换为结构化医疗特征,生成结构化医疗特征对应的实体节点以及实体节点之间的关联关系,构建实体节点及实体节点之间的关联关系,从而构建出医疗知识图谱。
在另一个实施例中,所述结构化医疗特征包括患者人口学特征、诊断特征、症状特征、检查特征、实验室检验特征、影像学报告特征、治疗特征、病情变化特征、手术特征、转归特征中的至少一种。
在另一个实施例中,还包括:
获取第一患者的游走节点路径,以及,获取第二患者的游走节点路径;计算所述第一患者的游走节点路径和所述第二患者的游走节点路径之间的路径相似度;当所述路径相似度大于预设的相似度阈值,判定所述第一患者和所述第二患者为相似患者。
具体实现中,可以计算两个患者的游走节点路径之间的路径相似度。将计算出的路径相似度与预设的相似度阈值进行比较,当路径相似度大于预设的相似度阈值,判定第一患者和第二患者为相似患者。
在另一个实施例中,所述计算所述第一患者的游走节点路径和所述第二患者的游走节点路径之间的路径相似度,包括:
根据所述第一患者的游走节点路径,生成第一路径特征向量;根据所述第二患者的游走节点路径,生成第二路径特征向量;计算所述第一路径特征向量和所述第二路径特征向量之间的欧式空间距离,作为所述路径相似度。
具体实现中,可以利用游走节点路径上各个实体节点、实体节点之间的关联关系、实体节点的属性、关联关系的属性,生成游走节点路径的路径特征向量。针对路径特征向量,应用非监督深度学习模型(AutoEncoder)进行训练,将训练出的非监督深度学习模型的嵌入层(embedding)所产生的降维后低维空间的路径特征向量,进行欧式空间距离计算,得到路径特征向量之间的欧式空间距离,作为路径相似度。从而,可以基于路径相似度作为挖掘相似患者的依据。
应该理解的是,虽然图1的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图2所示,提供了一种相似患者挖掘装置,包括:图谱获取模块210、节点提取模块220、随机游走节点确定模块230和路径确定模块240,其中:
图谱获取模块210,用于获取医疗知识图谱;
节点提取模块220,用于在所述医疗知识图谱中,提取患者的医疗特征实体节点;所述医疗特征实体节点为所述医疗知识图谱中记录患者的医疗特征的实体节点;
随机游走节点确定模块230,用于在所述医疗特征实体节点中,确定随机游走节点;所述随机游走节点之间具有关联关系;
路径确定模块240,用于确定游走节点路径;所述游走节点路径包括所述随机游走节点和所述随机游走节点之间的关联关系;所述游走节点路径用于挖掘医疗特征相似的患者。
根据本申请实施例的技术方案,通过在医疗知识图谱中提取出记录患者的医疗特征的实体节点,并通过随机游走算法的方式,在实体节点中确定随机游走节点,并生成记录有随机游走节点及之间的关联关系的游走节点路径,从而可以基于患者的游走节点路径挖掘医疗特征相似的患者,从而,利用随机游走的方式,通过深层次的医疗特征及医疗特征之间的关联关系挖掘相似患者,所挖掘患者的病患情况的相似程度较高,提升了对相似患者挖掘的准确性。
在一个实施例中,所述随机游走节点确定模块230,包括:
起始节点确定子模块,用于在所述医疗特征实体节点中,确定起始实体节点;
随机游走子模块,用于随机游走所述医疗特征实体节点,得到从所述起始实体节点到达任意一个具有关联关系的实体顶点的概率分布;所述实体顶点为属于所述医疗知识图谱的顶点的实体节点;
节点确定子模块,用于根据所述概率分布,在所述医疗特征实体节点中,确定所述随机游走节点。
在一个实施例中,所述随机游走子模块,包括:
相邻节点确定单元,用于在所述医疗知识图谱中,确定所述起始实体节点的相邻节点;
关联度计算单元,用于计算所述相邻节点与所述起始实体节点之间的节点关联度;
迭代计算单元,用于当所述节点关联度符合设定的关联度范围,将所述相邻节点作为当前的起始实体节点,并迭代计算当前的起始实体节点与其相邻的相邻节点之间的节点关联度,直至遍历所述医疗特征实体节点。
在一个实施例中,还包括:
路径获取模块,用于获取第一患者的游走节点路径,以及,获取第二患者的游走节点路径;
路径相似度计算模块,用于计算所述第一患者的游走节点路径和所述第二患者的游走节点路径之间的路径相似度;
相似患者判定模块,用于当所述路径相似度大于预设的相似度阈值,判定所述第一患者和所述第二患者为相似患者。
在一个实施例中,所述路径相似度计算模块,包括:
特征向量生成子模块,用于根据所述第一患者的游走节点路径,生成第一路径特征向量;以及,根据所述第二患者的游走节点路径,生成第二路径特征向量;
欧式空间距离计算子模块,用于计算所述第一路径特征向量和所述第二路径特征向量之间的欧式空间距离,作为所述路径相似度。
在一个实施例中,所述图谱获取模块210,包括:
病历接收子模块,用于接收电子病历;
病历信息提取子模块,用于从所述电子病历中,提取原始病历信息;
转换子模块,用于将所述原始病历信息转换为结构化医疗特征;
实体节点及关系生成子模块,用于生成与所述结构化医疗特征对应的实体节点及关系,得到所述医疗特征实体节点及关系;
图谱构建子模块,用于采用所述医疗特征实体节点及关系构建所述医疗知识图谱。
在一个实施例中,所述结构化医疗特征包括患者人口学特征、诊断特征、症状特征、检查特征、实验室检验特征、影像学报告特征、治疗特征、病情变化特征、手术特征、转归特征中的至少一种。
关于相似患者挖掘装置的具体限定可以参见上文中对于相似患者挖掘方法的限定,在此不再赘述。上述相似患者挖掘装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
上述提供的相似患者挖掘装置可用于执行上述任意实施例提供的相似患者挖掘方法,具备相应的功能和有益效果。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种相似患者挖掘方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取医疗知识图谱;
在所述医疗知识图谱中,提取患者的医疗特征实体节点;所述医疗特征实体节点为所述医疗知识图谱中记录患者的医疗特征的实体节点;
在所述医疗特征实体节点中,确定随机游走节点;所述随机游走节点之间具有关联关系;
确定游走节点路径;所述游走节点路径包括所述随机游走节点和所述随机游走节点之间的关联关系;所述游走节点路径用于挖掘医疗特征相似的患者。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
在所述医疗特征实体节点中,确定起始实体节点;
随机游走所述医疗特征实体节点,得到从所述起始实体节点到达任意一个具有关联关系的实体顶点的概率分布;所述实体顶点为属于所述医疗知识图谱的顶点的实体节点;
根据所述概率分布,在所述医疗特征实体节点中,确定所述随机游走节点。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
在所述医疗知识图谱中,确定所述起始实体节点的相邻节点;
计算所述相邻节点与所述起始实体节点之间的节点关联度;
当所述节点关联度符合设定的关联度范围,将所述相邻节点作为当前的起始实体节点,并迭代计算当前的起始实体节点与其相邻的相邻节点之间的节点关联度,直至遍历所述医疗特征实体节点。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取第一患者的游走节点路径,以及,获取第二患者的游走节点路径;
计算所述第一患者的游走节点路径和所述第二患者的游走节点路径之间的路径相似度;
当所述路径相似度大于预设的相似度阈值,判定所述第一患者和所述第二患者为相似患者。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据所述第一患者的游走节点路径,生成第一路径特征向量;
根据所述第二患者的游走节点路径,生成第二路径特征向量;
计算所述第一路径特征向量和所述第二路径特征向量之间的欧式空间距离,作为所述路径相似度。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
接收电子病历;
从所述电子病历中,提取原始病历信息;
将所述原始病历信息转换为结构化医疗特征;
生成与所述结构化医疗特征对应的实体节点及关系,得到所述医疗特征实体节点及关系;
采用所述医疗特征实体节点及关系构建所述医疗知识图谱。
在一个实施例中,所述结构化医疗特征包括患者人口学特征、诊断特征、症状特征、检查特征、实验室检验特征、影像学报告特征、治疗特征、病情变化特征、手术特征、转归特征中的至少一种。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取医疗知识图谱;
在所述医疗知识图谱中,提取患者的医疗特征实体节点;所述医疗特征实体节点为所述医疗知识图谱中记录患者的医疗特征的实体节点;
在所述医疗特征实体节点中,确定随机游走节点;所述随机游走节点之间具有关联关系;
确定游走节点路径;所述游走节点路径包括所述随机游走节点和所述随机游走节点之间的关联关系;所述游走节点路径用于挖掘医疗特征相似的患者。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
在所述医疗特征实体节点中,确定起始实体节点;
随机游走所述医疗特征实体节点,得到从所述起始实体节点到达任意一个具有关联关系的实体顶点的概率分布;所述实体顶点为属于所述医疗知识图谱的顶点的实体节点;
根据所述概率分布,在所述医疗特征实体节点中,确定所述随机游走节点。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
在所述医疗知识图谱中,确定所述起始实体节点的相邻节点;
计算所述相邻节点与所述起始实体节点之间的节点关联度;
当所述节点关联度符合设定的关联度范围,将所述相邻节点作为当前的起始实体节点,并迭代计算当前的起始实体节点与其相邻的相邻节点之间的节点关联度,直至遍历所述医疗特征实体节点。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取第一患者的游走节点路径,以及,获取第二患者的游走节点路径;
计算所述第一患者的游走节点路径和所述第二患者的游走节点路径之间的路径相似度;
当所述路径相似度大于预设的相似度阈值,判定所述第一患者和所述第二患者为相似患者。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据所述第一患者的游走节点路径,生成第一路径特征向量;
根据所述第二患者的游走节点路径,生成第二路径特征向量;
计算所述第一路径特征向量和所述第二路径特征向量之间的欧式空间距离,作为所述路径相似度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
接收电子病历;
从所述电子病历中,提取原始病历信息;
将所述原始病历信息转换为结构化医疗特征;
生成与所述结构化医疗特征对应的实体节点及关系,得到所述医疗特征实体节点及关系;
采用所述医疗特征实体节点及关系构建所述医疗知识图谱。
在一个实施例中,所述结构化医疗特征包括患者人口学特征、诊断特征、症状特征、检查特征、实验室检验特征、影像学报告特征、治疗特征、病情变化特征、手术特征、转归特征中的至少一种。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种基于知识图谱的相似患者挖掘方法,其特征在于,包括:
获取医疗知识图谱;
在所述医疗知识图谱中,提取记录患者医疗特征的实体节点,得到医疗特征实体节点;所述医疗特征实体节点为所述医疗知识图谱中记录患者的医疗特征的实体节点;
在所述医疗特征实体节点中,通过随机游走,确定随机游走节点;所述随机游走节点之间具有关联关系;
确定游走节点路径;所述游走节点路径包括所述随机游走节点和所述随机游走节点之间的关联关系;所述游走节点路径用于挖掘医疗特征相似的患者。
2.根据权利要求1所述的方法,其特征在于,所述在所述医疗特征实体节点中,确定随机游走节点,包括:
在所述医疗特征实体节点中,确定起始实体节点;
随机游走所述医疗特征实体节点,得到从所述起始实体节点到达任意一个具有关联关系的实体顶点的概率分布;所述实体顶点为属于所述医疗知识图谱的顶点的实体节点;
根据所述概率分布,在所述医疗特征实体节点中,确定所述随机游走节点。
3.根据权利要求2所述的方法,其特征在于,所述随机游走所述医疗特征实体节点,包括:
在所述医疗知识图谱中,确定所述起始实体节点的相邻节点;
计算所述相邻节点与所述起始实体节点之间的节点关联度;
当所述节点关联度符合设定的关联度范围,将所述相邻节点作为当前的起始实体节点,并迭代计算当前的起始实体节点与其相邻的相邻节点之间的节点关联度,直至遍历所述医疗特征实体节点。
4.根据权利要求1所述的方法,其特征在于,还包括:
获取第一患者的游走节点路径,以及,获取第二患者的游走节点路径;
计算所述第一患者的游走节点路径和所述第二患者的游走节点路径之间的路径相似度;
当所述路径相似度大于预设的相似度阈值,判定所述第一患者和所述第二患者为相似患者。
5.根据权利要求4所述的方法,其特征在于,所述计算所述第一患者的游走节点路径和所述第二患者的游走节点路径之间的路径相似度,包括:
根据所述第一患者的游走节点路径,生成第一路径特征向量;
根据所述第二患者的游走节点路径,生成第二路径特征向量;
计算所述第一路径特征向量和所述第二路径特征向量之间的欧式空间距离,作为所述路径相似度。
6.根据权利要求1所述的方法,其特征在于,所述获取医疗知识图谱,包括:
接收电子病历;
从所述电子病历中,提取原始病历信息;
将所述原始病历信息转换为结构化医疗特征;
生成与所述结构化医疗特征对应的实体节点及关系,得到所述医疗特征实体节点及关系;
采用所述医疗特征实体节点及关系构建所述医疗知识图谱。
7.根据权利要求6所述的方法,其特征在于,所述结构化医疗特征包括患者人口学特征、诊断特征、症状特征、检查特征、实验室检验特征、影像学报告特征、治疗特征、病情变化特征、手术特征、转归特征中的至少一种。
8.一种相似患者挖掘装置,其特征在于,包括:
图谱获取模块,用于获取医疗知识图谱;
节点提取模块,用于在所述医疗知识图谱中,提取记录患者医疗特征的实体节点,得到医疗特征实体节点;所述医疗特征实体节点为所述医疗知识图谱中记录患者的医疗特征的实体节点;
随机游走节点确定模块,用于在所述医疗特征实体节点中,通过随机游走,确定随机游走节点;所述随机游走节点之间具有关联关系;
路径确定模块,用于确定游走节点路径;所述游走节点路径包括所述随机游走节点和所述随机游走节点之间的关联关系;所述游走节点路径用于挖掘医疗特征相似的患者。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201811581104.0A 2018-12-24 2018-12-24 相似患者挖掘方法、装置、计算机设备和存储介质 Active CN109616169B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811581104.0A CN109616169B (zh) 2018-12-24 2018-12-24 相似患者挖掘方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811581104.0A CN109616169B (zh) 2018-12-24 2018-12-24 相似患者挖掘方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN109616169A CN109616169A (zh) 2019-04-12
CN109616169B true CN109616169B (zh) 2020-11-13

Family

ID=66011339

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811581104.0A Active CN109616169B (zh) 2018-12-24 2018-12-24 相似患者挖掘方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN109616169B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110188240A (zh) * 2019-05-31 2019-08-30 贵州精准健康数据有限公司 医疗影像数据存储系统
CN110706772B (zh) * 2019-10-11 2023-05-09 北京百度网讯科技有限公司 一种排序方法及装置、电子设备、存储介质
CN110807103A (zh) * 2019-10-18 2020-02-18 中国银联股份有限公司 知识图谱构建方法、装置、电子设备及存储介质
CN113012803A (zh) * 2019-12-19 2021-06-22 京东方科技集团股份有限公司 计算机设备、系统、可读存储介质及医学数据分析方法
CN111177545B (zh) * 2019-12-24 2023-06-09 百度国际科技(深圳)有限公司 广告投放方法、平台、电子设备及存储介质
CN113704326A (zh) * 2021-08-30 2021-11-26 中国银联股份有限公司 基于知识图谱的异常结构挖掘方法、装置及可读存储介质
CN114218955A (zh) * 2021-12-28 2022-03-22 上海柯林布瑞信息技术有限公司 基于医疗知识图谱的辅助参考信息的确定方法及系统
CN115662647B (zh) * 2022-12-27 2024-03-12 北京大学第三医院(北京大学第三临床医学院) 一种相似疾病挖掘的方法和应用

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10535007B2 (en) * 2012-04-24 2020-01-14 International Business Machines Corporation Determining a similarity between graphs
CN108427735A (zh) * 2018-02-28 2018-08-21 东华大学 基于电子病历的临床知识图谱构建方法
CN108492887B (zh) * 2018-04-13 2020-09-22 合肥工业大学 医疗知识图谱构建方法及装置
CN108614885B (zh) * 2018-05-03 2019-04-30 杭州认识科技有限公司 基于医学信息的知识图谱分析方法及装置

Also Published As

Publication number Publication date
CN109616169A (zh) 2019-04-12

Similar Documents

Publication Publication Date Title
CN109616169B (zh) 相似患者挖掘方法、装置、计算机设备和存储介质
Ouyang et al. Video-based AI for beat-to-beat assessment of cardiac function
CN112037912A (zh) 基于医疗知识图谱的分诊模型训练方法、装置及设备
US9265441B2 (en) Assessment of traumatic brain injury
WO2020220545A1 (zh) 基于长短期记忆模型的疾病预测方法、装置和计算机设备
CN109887596A (zh) 基于知识图谱的慢阻肺疾病诊断方法、装置和计算机设备
CN110797101B (zh) 医学数据处理方法、装置、可读存储介质和计算机设备
CN111383259A (zh) 图像分析方法、计算机设备和存储介质
CN111210465B (zh) 图像配准方法、装置、计算机设备和可读存储介质
CN109377388B (zh) 医保投保方法、装置、计算机设备和存储介质
US20220036575A1 (en) Method for measuring volume of organ by using artificial neural network, and apparatus therefor
CN110796652B (zh) 图像处理方法、计算机设备和存储介质
CN110310257B (zh) 医学图像处理方法、装置、计算机设备和存储介质
CN110929730A (zh) 图像处理方法、装置、计算机设备和存储介质
Ren et al. A novel federated multi-view clustering method for unaligned and incomplete data fusion
CN111008311B (zh) 基于邻域弱连接的复杂网络节点重要性评估方法和装置
Wang et al. Image-driven constitutive modeling of myocardial fibrosis
CN111370086A (zh) 电子病例检测方法、装置、计算机设备和存储介质
CN110992312A (zh) 医学图像处理方法、装置、存储介质及计算机设备
CN111145152A (zh) 图像检测方法、计算机设备和存储介质
CN112365504A (zh) Ct左心室分割方法、装置、设备和存储介质
Mei et al. Check for updates Exploiting Partial Common Information Microstructure for Multi-modal Brain Tumor Segmentation
EP4198997A1 (en) A computer implemented method, a method and a system
CN110648346A (zh) 肿瘤网络构建的方法、装置、计算机设备和存储介质
CN111882449B (zh) 社交网络去匿名方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant