CN112102937B - 一种慢性病辅助决策的患者数据可视化方法及系统 - Google Patents

一种慢性病辅助决策的患者数据可视化方法及系统 Download PDF

Info

Publication number
CN112102937B
CN112102937B CN202011270972.4A CN202011270972A CN112102937B CN 112102937 B CN112102937 B CN 112102937B CN 202011270972 A CN202011270972 A CN 202011270972A CN 112102937 B CN112102937 B CN 112102937B
Authority
CN
China
Prior art keywords
patient
data
knowledge
chronic disease
patient information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011270972.4A
Other languages
English (en)
Other versions
CN112102937A (zh
Inventor
李劲松
朱世强
周天舒
田雨
苟玲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Lab
Original Assignee
Zhejiang Lab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Lab filed Critical Zhejiang Lab
Priority to CN202011270972.4A priority Critical patent/CN112102937B/zh
Publication of CN112102937A publication Critical patent/CN112102937A/zh
Priority to PCT/CN2021/073125 priority patent/WO2021175038A1/zh
Application granted granted Critical
Publication of CN112102937B publication Critical patent/CN112102937B/zh
Priority to US17/553,832 priority patent/US11521751B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/245Classification techniques relating to the decision surface
    • G06F18/2451Classification techniques relating to the decision surface linear, e.g. hyperplane
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/01Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/20ICT specially adapted for the handling or processing of medical references relating to practices or guidelines
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Biomedical Technology (AREA)
  • Databases & Information Systems (AREA)
  • Pathology (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Animal Behavior & Ethology (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明公开了一种慢性病辅助决策的患者数据可视化方法及系统,本发明通过构建慢性病知识图谱,并结合患者静态数据和动态数据构建患者在超平面的管理数据模型图,再将其投影至二维平面。比较患者信息模型在二维平面图上特征之间的欧式距离和标准特征之间的距离差异,结合路径节点概念以及概念间的属性关系,生成并推荐管理方案。融合患者信息模型和慢性病知识图谱可以充分运用各个特征的语义信息,在二维平面上以位置、颜色等方式全面、系统地展示各个风险因素的重要性以及关联。通过几何位置评估患者慢病管理的效果,然后利用路径制定个性化的患者健康管理方案,帮助患者从多个维度提升慢病管理能力。

Description

一种慢性病辅助决策的患者数据可视化方法及系统
技术领域
本发明属于医疗及数据可视化技术领域,尤其涉及一种慢性病辅助决策的患者数据可视化方法及系统。
背景技术
慢性病又称慢性非传染性疾病,主要包括心脑血管疾病(高血压、冠心病、脑卒中)、糖尿病和慢性呼吸系统疾病等,具有起病隐匿、病程长且病情迁延不愈、病因复杂且有些尚未完全被确认等特点。随着我国经济迅速发展、居民生活方式改变,慢性病患病和死亡人数不断增多,群众疾病负担日益沉重,已成为严重威胁我国居民健康、影响国家经济社会发展的重大公共卫生问题之一。有数据显示,国内慢性病约占疾病死亡率的86%、占疾病负担的76%。慢性病难以根治,主要依赖患者长期的自我健康管理。对于患者电子病历信息以及日常管理所记录的数据,如饮食、运动、日常体征数据,进行一定的分析,提供一种辅助决策的数据可视化方法,有利于患者了解自身健康状况及时调整健康管理方案,也有助于医生为患者制定并推荐管理方案,节省医疗资源。可视化的方式能够清晰地展现患者管理目标,提供健康相关的精准帮助,从而提升患者管理的依从性。
现有的慢性病数据可视化技术主要是指患者日常管理记录的数据在应用程序中以数据图表形式呈现,比较常用的数据设计组件是柱状图、折线图、环形图等,它们简单易懂,容易被用户接受。患者在移动端通过多点触控技术实现图片的放大、缩小、旋转、位移效果。辅助决策支持可视化主要通过重要性排序、相关矩阵等形式展现,不是用户友好的可视化方案同时信息传达不够全面、丰富;现有慢病数据可视化方案的不足具体如下:
(1)只是展示患者日常在移动端记录的体征等数据,以表达某种趋势,缺少了患者日常管理效果的评估体系,患者和医护人员无法明确患者健康管理对其健康状况的影响效果。
(2)大多以折线图、柱状图等基础图形表示,无法体现慢病风险因素之间的关联,并且各类型数据分开统计并绘制,不能系统化、全面地整合患者多维度信息及其慢病风险因素的关联、重要程度等语义信息。
(3)健康管理方案没有综合考虑患者个人身体状况、运动饮食习惯等各类型数据,从而决策缺少个性化,患者数据没有在制定并推荐其管理方案内容时得到充分应用。
发明内容
本发明根据患者电子病历数据以及日常所记录的各类数据(运动、饮食、体征、用药、化验等),结合语义技术、临床决策支持技术与可视化技术,提出了一种用于慢性病辅助决策的患者数据可视化方法及系统。
本发明通过构建慢性病知识图谱,并结合患者静态数据和动态数据构建患者在超平面的管理数据模型图,再将其投影至二维平面。比较患者信息模型在二维平面图上特征之间的欧式距离和标准特征之间的距离(被医生诊断为管理效果好的患者二维平面映射图)差异,结合路径节点概念以及概念间的属性关系,生成并推荐管理方案。融合患者信息模型和慢性病知识图谱可以充分运用各个特征的语义信息,在二维平面上以位置、颜色等方式全面、系统地展示各个风险因素的重要性以及关联。通过几何位置评估患者慢病管理的效果,然后利用路径制定个性化的患者健康管理方案,帮助患者从多个维度提升慢病管理能力。
本申请提出的慢性病辅助决策的患者数据可视化方法,该方法的具体实现包括以下步骤:
(1)构建慢性病知识图谱:慢性病相关临床指南、知识文献作为知识图谱的知识源,通过SNOMED CT对数据语义进行唯一标识,手动构建类、属性与实例,添加数据关系和属性关系,生成知识图谱原型文件;
(2)建立患者信息模型:采集患者信息;进行患者数据RDF转换,将患者数据库中的数据转换成符合OWL语言规范的RDF三元组关系;以SNOMED CT标识患者信息模型的节点,实现患者数据向领域知识的语义扩展,融合患者信息和慢性病知识图谱构建患者信息模型;
(3)超平面特征图绘制:患者信息模型通过分布式表示转换为超平面特征图,分布式表示采用实体向量与关系向量之间基于翻译的模型;
(4)二维平面映射:二维平面节点的位置信息对应患者信息模型超平面特征图降维后的二维位置,利用节点的颜色区分知识图谱中所属的信息类别不同,利用RegularizedGradient Boosted Decision Tree算法特征重要性排序作为各个节点与疾病进展相关性的排序,特征权重值作为欧式距离计算的权重;
(5)决策支持反馈:以领域专家标注结果为慢病管理效果理想的患者信息模型作为标准,通过分布式表示和降维可视化绘制出患者数据的二维平面映射图像,结合特征权重值计算映射图像中各个特征区域的几何中心之间的欧式距离,作为标准化的管理目标;计算需要决策支持反馈的患者在二维平面映射图像中特征之间的欧式距离,并结合其计算出的特征权重值,将其与标准数值进行比较,寻找相似距离的路径;根据特征的距离信息获取知识图谱内的知识。
进一步地,所述知识图谱的知识内容覆盖疾病诊断、检查项目、体征状态、相关疾病、治疗药物、生活习惯、计量单位和检测量。
进一步地,步骤(2)采集的患者信息包括日常移动端手动输入或者可穿戴设备采集的患者健康数据,以及区域慢病管理中心所记录的患者电子病历数据。
进一步地,步骤(2)患者数据RDF转换过程中,采用D2R语义映射技术将关系型数据库中的数据映射到RDF格式;D2R包括D2R Server、D2RQ Engine和D2RQ Mapping语言;D2RQMapping语言定义关系型数据转换成RDF格式的 Mapping规则;D2RQ Engine使用定制的D2RQ Mapping文件完成数据映射,具体是指将关系型数据库的表和字段分别映射为OWL文件中的类和属性,类之间的关系从表示关系的表中得出。
进一步地,步骤(3)超平面特征图绘制具体包括以下子步骤:
(3.1)采用TransH模型将三元组编码为空间的分布式向量,具体为:
患者信息模型中知识被存储为(hrt)的三元组形式,其中h表示头实体向量,r表示关系向量,t表示尾实体向量;三元组集合组成有向图,图形节点代表实体,边代表不同类型的关系,边是有向的表明关系是非对称的;通过TransH模型构建自反关系、多对一、一对多、多对多关系的实体分布式向量;
(3.2)优化目标函数,具体为:
TransH模型对于每一个关系r,假设有一个对应的超平面,r在超平面上的关系投 影表示为
Figure 884049DEST_PATH_IMAGE001
,该超平面法向量表示为
Figure 41361DEST_PATH_IMAGE002
,且有
Figure 772688DEST_PATH_IMAGE003
Figure 611331DEST_PATH_IMAGE004
Figure 360981DEST_PATH_IMAGE005
分别表示ht在该超平面的 投影,则有:
Figure 626877DEST_PATH_IMAGE006
定义评分函数为:
Figure 579921DEST_PATH_IMAGE007
得到目标函数:
Figure 222255DEST_PATH_IMAGE008
其中S是知识库中的三元组,
Figure 29674DEST_PATH_IMAGE009
是负采样的三元组,
Figure 341838DEST_PATH_IMAGE010
是取值大于0的间隔距离参 数;
在优化目标函数L的过程中,需要使正例三元组的值小,负例三元组的值大,即排序损失最小化;使用随机梯度下降训练方法,TransH模型训练完成后,得到实体和关系的向量表示。
进一步地,步骤(4)二维平面映射具体包括以下子步骤:
(4.1)使用t-SNE算法进行降维可视化,具体为:
步骤一:假设数据集X,它共有N个数据点,每个数据点
Figure 906811DEST_PATH_IMAGE011
的维度为D,降维为二维, 即在平面上表示出所有数据;
计算数据点高维空间中的相似性的条件概率;将数据点之间的高维欧几里得距离 转换为表示相似性的条件概率,高维数据点
Figure 211890DEST_PATH_IMAGE012
Figure 811499DEST_PATH_IMAGE013
之间的相似性条件概率
Figure 297494DEST_PATH_IMAGE014
如下:
Figure 349763DEST_PATH_IMAGE015
其中
Figure 192955DEST_PATH_IMAGE016
是以数据点
Figure 725698DEST_PATH_IMAGE012
为中心的高斯方差;
步骤二:计算数据点低维空间中的相似性的条件概率;对于高维数据点
Figure 769878DEST_PATH_IMAGE012
Figure 434077DEST_PATH_IMAGE017
的低 维对应点
Figure 956325DEST_PATH_IMAGE018
Figure 140313DEST_PATH_IMAGE019
,计算条件概率
Figure 417711DEST_PATH_IMAGE020
如下:
Figure 178993DEST_PATH_IMAGE021
步骤三:最小化条件概率的差异,即令条件概率
Figure 380299DEST_PATH_IMAGE020
近似于
Figure 809006DEST_PATH_IMAGE022
;通过最小化两个条 件概率分布之间的Kullback-Leibler散度实现,并使用梯度下降进行迭代更新,损失函数 如下:
Figure 54042DEST_PATH_IMAGE023
(4.2)特征重要性排序:使用Regularized Gradient Boosted Decision Tree算法实现知识图谱中的各实体的重要性排序以及获得特征权重值,具体为:
数据集为已知慢病管理效果或者结局的患者信息模型,每个样本包含n维特征(患 者信息模型实体数);Regularized Gradient Boosted Decision Tree的目标函数
Figure 568200DEST_PATH_IMAGE024
包括损 失函数和复杂度,定义为:
Figure 304688DEST_PATH_IMAGE025
Figure 650218DEST_PATH_IMAGE026
其中i表示第i个样本,k是第k颗树,
Figure 207102DEST_PATH_IMAGE027
为预测输出,
Figure 818343DEST_PATH_IMAGE018
为标签值,T表示叶子节点数, ω表示叶子权重值;
Figure 486084DEST_PATH_IMAGE028
为叶子树惩罚正则项,具有剪枝作用;
Figure DEST_PATH_IMAGE029
为叶子权重惩罚正则项,防止 过拟合;
Figure 295909DEST_PATH_IMAGE030
表示第i个样本的预测误差;
Figure 23693DEST_PATH_IMAGE031
表示损失函数;
Figure 371498DEST_PATH_IMAGE032
表示 树的复杂度函数;
树的生长过程中,通过对比分裂前后的目标函数值,分裂后目标函数值最小的分裂为最佳分裂点;
Figure 577351DEST_PATH_IMAGE033
其中
Figure 444944DEST_PATH_IMAGE034
为加入新叶子节点引入的复杂度代价,
Figure 343630DEST_PATH_IMAGE035
为左子树梯度值,
Figure 178731DEST_PATH_IMAGE036
为左子树样 本集合二阶导数;
Figure 188275DEST_PATH_IMAGE037
为右子树梯度值,
Figure 3102DEST_PATH_IMAGE038
为右子树样本集合二阶导数;如果Gain<0,则此叶 子节点不做分割;
特征重要性分数通过计算所有树中某特征在每次分裂节点时带来的总增益实现;通过调用booster参数的get_score方法获取对应的特征权重值。
进一步地,步骤(4)特征重要性排序过程中,Regularized Gradient BoostedDecision Tree参数训练采用网格搜索方法进行,包括一般参数、提升参数和学习目标参数;一般参数控制宏观参数,提升参数控制每一步的提升,学习目标参数控制训练目标的表现。
进一步地,步骤(5)中,根据特征的距离信息使用SPARQL查询语言和Jena规则推理获取知识图谱内的知识,生成患者个性化管理方案。
进一步地,步骤(5)中,SPARQL查询语句包括查询信息以及名称应该符合的条件,条件以三元组形式出现,按照<subject,predicate,object>,即主谓宾的顺序排列,查询的结果实际就是条件三元组与数据文件中RDF三元组匹配的结果。
本申请提出的慢性病辅助决策的患者数据可视化系统,该系统包括以下模块:
慢性病知识图谱构建模块:慢性病相关临床指南、知识文献作为知识图谱的知识源,通过SNOMED CT对数据语义进行唯一标识,手动构建类、属性与实例,添加数据关系和属性关系,生成知识图谱原型文件;
患者信息模型构建模块:采集患者信息,将患者数据库中的数据转换成符合OWL语言规范的RDF三元组关系;以SNOMED CT标识患者信息模型的节点,实现患者数据向领域知识的语义扩展,融合患者信息和慢性病知识图谱构建患者信息模型;
超平面特征图绘制模块:患者信息模型通过分布式表示转换为超平面特征图,分布式表示采用实体向量与关系向量之间基于翻译的模型;
二维平面映射模块:二维平面节点的位置信息对应患者信息模型超平面特征图降维后的二维位置,利用节点的颜色区分知识图谱中所属的信息类别不同,利用RegularizedGradient Boosted Decision Tree算法特征重要性排序作为各个节点与疾病进展相关性的排序,特征权重值作为欧式距离计算的权重;
决策支持反馈模块:以领域专家标注结果为慢病管理效果理想的患者信息模型作为标准,通过分布式表示和降维可视化绘制出患者数据的二维平面映射图像,结合特征权重值计算映射图像中各个特征区域的几何中心之间的欧式距离,作为标准化的管理目标;计算需要决策支持反馈的患者在二维平面映射图像中特征之间的欧式距离,并结合其计算出的特征权重值,将其与标准数值进行比较,寻找相似距离的路径;根据特征的距离信息获取知识图谱内的知识。
本发明的有益效果是:较之现有的慢病数据可视化方案,本发明结合知识图谱,能够以可视化的方式构建患者各类型数据的二维平面映射图像,是用户友好的可视化方案。通过二维平面上节点距离、颜色等方式能够表达患者信息之间的关联、特征和重要性,能够传达全面且丰富的信息。通过几何位置评估患者慢病管理的效果,然后利用路径制定个性化的患者健康管理方案,帮助患者从多个维度提升慢病管理能力,有助于提升患者依从性。本发明从健康信息收集、健康评估到健康促进实现了长期连续、周而复始、螺旋上升的全程全方位的可视化健康管理服务。
附图说明
图1为本发明慢性病辅助决策的患者数据可视化方法实现流程图;
图2为TransH模型示意图;
图3为二维平面映射示意图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图对本发明的具体实施方式做详细的说明。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是本发明还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本发明内涵的情况下做类似推广,因此本发明不受下面公开的具体实施例的限制。
本申请提出的一种慢性病辅助决策的患者数据可视化方法及系统,能够帮助患者更好地了解个人健康状况和疾病干预情况,帮助医生更高效地查看患者病情并制定健康管理方案。如图1所示,本发明方法的具体实现包括以下步骤:
(1)慢性病知识图谱构建
慢性病相关的临床指南、知识文献作为知识图谱的知识源,知识内容覆盖疾病诊断、检查项目、体征状态、相关疾病、治疗药物、生活习惯等方面,还包括了计量单位、检测量等医学辅助词。选择SNOMED CT(Systematized Nomenclature of Medicine -- ClinicalTerms,医学系统命名法-临床术语)作为标准化编码体系,通过 SNOMED CT对数据语义进行唯一标识,手动构建类、属性与实例等信息,添加数据关系和属性关系,生成知识图谱原型文件。
(2)患者信息模型建立
(2.1)患者信息采集
患者信息主要来源有两类:一类是日常移动端手动输入或者可穿戴设备采集的患者健康数据;另一类是区域慢病管理中心所记录的患者电子病历数据。
(2.2)患者数据RDF转换
患者数据库中的XML、JSON等格式数据需要转换成符合OWL(Web OntologyLanguage)语言规范的RDF(Resource Description Framework)三元组关系。此处采用D2R(Database to RDF)语义映射技术将关系型数据库中的数据映射到RDF格式。D2R主要包括D2R Server、D2RQ Engine和D2RQ Mapping语言。D2RQ Mapping语言定义关系型数据转换成RDF格式的 Mapping规则。D2RQ Engine则是使用定制的D2RQ Mapping文件完成数据映射,具体是指将关系型数据库的表和字段分别映射为OWL文件中的类和属性,类之间的关系可以从表示关系的表中得出。同慢性病知识图谱一样,还是以SNOMED CT标识患者数据模型的节点,从而实现患者数据向领域知识的语义扩展,融合患者信息和慢性病知识图谱构建患者信息模型。
(3)超平面特征图绘制
患者信息模型通过分布式表示转换为超平面特征图,分布式表示采用实体向量与关系向量之间基于翻译的模型。
步骤一:采用TransH模型将三元组编码为空间的分布式向量,如图2所示。
TransH根据关系r的类型(一对一、一对多、多对一、多对多),以不同的概率替换头 尾实体。例如,对于一对多关系,替换头实体比替换尾实体有更大的可能获得合法的负样 本,因此可以以更大的概率替换头实体。对于关系
Figure 807110DEST_PATH_IMAGE039
所对应的三元组,TransH首先统计平均 每个头实体对应的尾实体个数tph以及平均每个尾实体对应的头实体个数hpt,然后定义一 个伯努利分布,以概率
Figure 332770DEST_PATH_IMAGE040
替换头实体,以概率
Figure 755792DEST_PATH_IMAGE041
替换尾实体。
患者信息模型中知识被存储为(hrt)的三元组形式,其中h表示头实体向量,r表示关系向量,t表示尾实体向量。三元组集合组成有向图,图形节点代表实体,边代表不同类型的关系,边是有向的表明关系是非对称的。TransH模型可以构建自反关系、多对一、一对多、多对多关系的实体分布式向量。
步骤二:优化目标函数。TransH模型对于每一个关系r,假设有一个对应的超平面 (关系r落在该超平面),r在超平面上的关系投影表示为
Figure 722611DEST_PATH_IMAGE001
,该超平面法向量表示为
Figure 822154DEST_PATH_IMAGE002
,且有
Figure 772792DEST_PATH_IMAGE042
Figure 202768DEST_PATH_IMAGE043
Figure 148727DEST_PATH_IMAGE005
分别表示ht在该超平面的投影,则有:
Figure 560117DEST_PATH_IMAGE006
定义评分函数为:
Figure 342259DEST_PATH_IMAGE044
得到目标函数:
Figure 497297DEST_PATH_IMAGE045
其中S是知识库中的三元组,
Figure 563342DEST_PATH_IMAGE009
是负采样的三元组,
Figure 880054DEST_PATH_IMAGE010
是取值大于0的间隔距离参 数,是一个超参数,[x]+表示正值函数,即x > 0时,[x]+ = x,当
Figure 349825DEST_PATH_IMAGE046
时,[x]+ = 0。两个节 点评分函数值比较低,表示距离较近,反之距离较远。在优化目标函数L的过程中,需要使正 例三元组的值小,负例三元组的值大,也就是排序损失最小化。使用随机梯度下降 (Stochastic Gradient Descent,SGD)训练方法,TransH模型训练完成后,可得到实体和关 系的向量表示。
(4)二维平面映射
二维平面节点的位置信息对应患者信息模型超平面特征图降维后的二维位置,利用节点的颜色区分知识图谱中所属的信息类别不同,利用Regularized Gradient BoostedDecision Tree算法特征重要性排序作为各个节点与疾病进展相关性的排序,特征权重值作为欧式距离计算的权重。
(4.1)降维可视化
使用t-SNE算法(t-distributed Stochastic Neighbor Embedding,t-分布邻域嵌入算法)进行降维可视化。
t-SNE算法是一种用于降维的机器学习方法,它能帮我们识别相关联的模式。t-SNE主要的优势就是保持局部结构的能力。这意味着高维数据空间中距离相近的点投影到低维中仍然相近。t-SNE 同样能生成漂亮的可视化。
t-SNE算法对每个数据点近邻的分布进行建模,其中近邻是指相互靠近数据点的集合。在原始高维空间中,我们将高维空间建模为高斯分布,而在二维输出空间中,我们可以将其建模为t分布。该过程的目标是找到将高维空间映射到二维空间的变换,并且最小化所有点在这两个分布之间的差距。与高斯分布相比t分布有较长的尾部,这有助于数据点在二维空间中更均匀地分布。
步骤一:假设数据集X,它共有N个数据点,每个数据点
Figure 167608DEST_PATH_IMAGE011
的维度为D,降维为d维,这 里d取值为2,即在平面上表示出所有数据。计算数据点高维空间中的相似性的条件概率。将 数据点之间的高维欧几里得距离转换为表示相似性的条件概率,高维数据点
Figure 963526DEST_PATH_IMAGE012
Figure 857664DEST_PATH_IMAGE017
之间的 相似性条件概率
Figure 66928DEST_PATH_IMAGE014
如下:
Figure 298189DEST_PATH_IMAGE047
其中
Figure 823980DEST_PATH_IMAGE016
是以数据点
Figure 13653DEST_PATH_IMAGE012
为中心的高斯方差。
步骤二:计算数据点低维空间中的相似性的条件概率;对于高维数据点
Figure 710213DEST_PATH_IMAGE012
Figure 620532DEST_PATH_IMAGE017
的低 维对应点
Figure 125462DEST_PATH_IMAGE018
Figure 345091DEST_PATH_IMAGE019
,计算条件概率
Figure 201052DEST_PATH_IMAGE048
如下:
Figure 917990DEST_PATH_IMAGE049
步骤三:最小化条件概率的差异,即令条件概率
Figure 543007DEST_PATH_IMAGE050
近似于
Figure 933537DEST_PATH_IMAGE014
。这一步骤通过最小 化两个条件概率分布之间的Kullback-Leibler散度(KL散度)实现。这一过程使用梯度下降 进行迭代更新,损失函数如下,即最小化损失函数:
Figure 11214DEST_PATH_IMAGE051
二维平面映射示意图如图3所示。图中显示了两类不同特征各个实体的投影点,对应了此类特征大概的投影区域,并标志出了每类特征的中心点。中心点的距离以及投影点的集群情况可以判断出特征之间的相关性。
(4.2)特征重要性排序
使用Regularized Gradient Boosted Decision Tree算法(eXtreme GradientBoosting,极值梯度提升算法)实现知识图谱中的各实体的重要性排序以及获得特征权重值。数据集为已知慢病管理效果或者结局的患者信息模型,每个样本包含n维特征(患者信息模型实体数)。Regularized Gradient Boosted Decision Tree的目标函数L包括损失函数和复杂度,定义为:
Figure 528914DEST_PATH_IMAGE025
Figure 336333DEST_PATH_IMAGE052
其中i表示第i个样本,k是第k颗树,
Figure 773131DEST_PATH_IMAGE053
为预测输出,
Figure 213471DEST_PATH_IMAGE018
为标签值,T表示叶子节点数, ω表示叶子权重值;
Figure 128337DEST_PATH_IMAGE028
为叶子树惩罚正则项,具有剪枝作用;
Figure 118159DEST_PATH_IMAGE029
为叶子权重惩罚正则项,防止 过拟合;
Figure 725858DEST_PATH_IMAGE054
表示第i个样本的预测误差,该误差值越小越好;
Figure 653493DEST_PATH_IMAGE055
表示损失函 数;
Figure 372051DEST_PATH_IMAGE032
表示树的复杂度函数,该复杂度越低,表示模型的泛化能力越强。
树的生长过程中,通过对比分裂前后的目标函数值,分裂后目标函数值最小的分 裂为最佳分裂点。这里的Gain可以看作是未分割前的目标函数值减去分裂后的左右目标函 数值,因此如果Gain<0,则此叶子节点不做分割。
Figure 154062DEST_PATH_IMAGE034
为加入新叶子节点引入的复杂度代价,
Figure 70678DEST_PATH_IMAGE035
为左子树梯度值,
Figure 610244DEST_PATH_IMAGE056
为左子树样本集合二阶导数;
Figure 257126DEST_PATH_IMAGE057
为右子树梯度值,
Figure 565747DEST_PATH_IMAGE038
为右子树样本集 合二阶导数;
Figure 593877DEST_PATH_IMAGE058
可以评价一棵树的结构。
Figure 479794DEST_PATH_IMAGE059
特征重要性分数是通过计算所有树中某特征在每次分裂节点时带来的总增益,即total_gain实现。该分数衡量了特征在提升决策树构建中的价值,因此可以作为特征重要性排序的指标。最后,通过调用booster参数的get_score方法获取对应的特征权重值。
该步骤中Regularized Gradient Boosted Decision Tree参数训练采用网格搜索方法进行,包括一般参数、提升参数和学习目标参数。一般参数控制宏观参数,提升参数控制每一步的提升,学习目标参数控制训练目标的表现。
(5)决策支持反馈
以领域专家标注结果为慢病管理效果理想的患者信息模型作为标准,通过上述的分布式表示和降维可视化绘制出患者数据的二维平面映射图像,结合特征权重值计算映射图像中各个特征区域的几何中心之间的欧式距离,作为标准化的管理目标。计算需要决策支持反馈的患者在二维平面映射图像中特征之间的欧式距离,并结合其计算出的特征权重值,将其跟标准数值进行比较,寻找相似距离的路径。根据特征的距离信息使用SPARQL(SPARQL Protocol and RDF Query Language, SPARQL协议与RDF查询语言)查询语言和Jena规则推理获取知识图谱内的知识,生成患者个性化管理方案,包括运动建议、饮食建议、用药建议、检查建议、生活习惯建议等。SPARQL查询语句包括查询信息以及名称应该符合的条件,条件以三元组形式出现,按照<subject,predicate,object>(主谓宾)的顺序排列,查询条件也成为一个模式,查询的结果实际就是条件三元组与数据文件中RDF三元组匹配的结果。Jena推理基于规则,规则通过Rule对象来进行定义。
本申请还提出了一种慢性病辅助决策的患者数据可视化系统,该系统包括以下模块:
慢性病知识图谱构建模块:慢性病相关临床指南、知识文献作为知识图谱的知识源,通过SNOMED CT对数据语义进行唯一标识,手动构建类、属性与实例,添加数据关系和属性关系,生成知识图谱原型文件;
患者信息模型构建模块:采集患者信息,将患者数据库中的数据转换成符合OWL语言规范的RDF三元组关系;以SNOMED CT标识患者信息模型的节点,实现患者数据向领域知识的语义扩展,融合患者信息和慢性病知识图谱构建患者信息模型;
超平面特征图绘制模块:患者信息模型通过分布式表示转换为超平面特征图,分布式表示采用实体向量与关系向量之间基于翻译的模型;
二维平面映射模块:二维平面节点的位置信息对应患者信息模型超平面特征图降维后的二维位置,利用节点的颜色区分知识图谱中所属的信息类别不同,利用RegularizedGradient Boosted Decision Tree算法特征重要性排序作为各个节点与疾病进展相关性的排序,特征权重值作为欧式距离计算的权重;
决策支持反馈模块:以领域专家标注结果为慢病管理效果理想的患者信息模型作为标准,通过分布式表示和降维可视化绘制出患者数据的二维平面映射图像,结合特征权重值计算映射图像中各个特征区域的几何中心之间的欧式距离,作为标准化的管理目标;计算需要决策支持反馈的患者在二维平面映射图像中特征之间的欧式距离,并结合其计算出的特征权重值,将其与标准数值进行比较,寻找相似距离的路径;根据特征的距离信息获取知识图谱内的知识。
以上所述仅是本发明的优选实施方式,虽然本发明已以较佳实施例披露如上,然而并非用以限定本发明。任何熟悉本领域的技术人员,在不脱离本发明技术方案范围情况下,都可利用上述揭示的方法和技术内容对本发明技术方案做出许多可能的变动和修饰,或修改为等同变化的等效实施例。例如,特征重要性排序还可以运用CatBoost(Categorical Boosting)算法、Light GBM算法。分布式表示还可以运用TransG、TransR和CTransR等翻译模型。二维平面映射还可以使用主成分分析(Principal ComponentAnalysis,PCA)、Sammon映射、SNE等降维算法。因此,凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所做的任何的简单修改、等同变化及修饰,均仍属于本发明技术方案保护的范围内。

Claims (10)

1.一种慢性病辅助决策的患者数据可视化方法,其特征在于,该方法包括以下步骤:
(1)构建慢性病知识图谱:慢性病相关临床指南、知识文献作为知识图谱的知识源,通过医学系统命名法-临床术语SNOMED CT对数据语义进行唯一标识,手动构建类、属性与实例,添加数据关系和属性关系,生成知识图谱原型文件;
(2)建立患者信息模型:采集患者信息;进行患者数据RDF转换,将患者数据库中的数据转换成符合OWL语言规范的RDF三元组关系;以SNOMED CT标识患者信息模型的节点,实现患者数据向领域知识的语义扩展,融合患者信息和慢性病知识图谱构建患者信息模型;
(3)超平面特征图绘制:患者信息模型通过分布式表示转换为超平面特征图,分布式表示采用实体向量与关系向量之间基于翻译的模型;
(4)二维平面映射:二维平面节点的位置信息对应患者信息模型超平面特征图降维后的二维位置,利用节点的颜色区分知识图谱中所属的信息类别不同,利用RegularizedGradient Boosted Decision Tree算法特征重要性排序作为各个节点与疾病进展相关性的排序,特征权重值作为欧式距离计算的权重;
(5)决策支持反馈:以领域专家标注结果为慢病管理效果理想的患者信息模型作为标准,通过分布式表示和降维可视化绘制出患者数据的二维平面映射图像,结合特征权重值计算二维平面映射图像中各个特征区域的几何中心之间的欧式距离,作为标准化的管理目标;计算需要决策支持反馈的患者在二维平面映射图像中特征之间的欧式距离,将欧式距离与标准数值进行比较,寻找相似距离的路径;根据特征的距离信息获取知识图谱内的知识。
2.根据权利要求1所述的一种慢性病辅助决策的患者数据可视化方法,其特征在于,所述知识图谱的知识内容覆盖疾病诊断、检查项目、体征状态、相关疾病、治疗药物、生活习惯、计量单位和检测量。
3.根据权利要求1所述的一种慢性病辅助决策的患者数据可视化方法,其特征在于,步骤(2)采集的患者信息包括日常移动端手动输入或者可穿戴设备采集的患者健康数据,以及区域慢病管理中心所记录的患者电子病历数据。
4.根据权利要求1所述的一种慢性病辅助决策的患者数据可视化方法,其特征在于,步骤(2)患者数据RDF转换过程中,采用D2R语义映射技术将关系型数据库中的数据映射到RDF格式;D2R包括D2R Server、D2RQ Engine和D2RQ Mapping语言;D2RQ Mapping语言定义关系型数据转换成RDF格式的 Mapping规则;D2RQ Engine使用定制的D2RQ Mapping文件完成数据映射,具体是指将关系型数据库的表和字段分别映射为OWL文件中的类和属性,类之间的关系从表示关系的表中得出。
5.根据权利要求1所述的一种慢性病辅助决策的患者数据可视化方法,其特征在于,步骤(3)超平面特征图绘制具体包括以下子步骤:
(3.1)采用TransH模型将三元组编码为空间的分布式向量,具体为:
患者信息模型中知识被存储为(hrt)的三元组形式,其中h表示头实体向量,r表示关系向量,t表示尾实体向量;三元组集合组成有向图,图形节点代表实体,边代表不同类型的关系,边是有向的表明关系是非对称的;通过TransH模型构建自反关系、多对一、一对多、多对多关系的实体分布式向量;
(3.2)优化目标函数,具体为:
TransH模型对于每一个关系r,假设有一个对应的超平面,r在超平面上的关系投影表示为
Figure DEST_PATH_IMAGE002
,该超平面法向量表示为
Figure DEST_PATH_IMAGE004
,且有
Figure DEST_PATH_IMAGE006
Figure DEST_PATH_IMAGE008
Figure DEST_PATH_IMAGE010
分别表示ht在该超平面的投影,则有:
Figure DEST_PATH_IMAGE012
定义评分函数为:
Figure DEST_PATH_IMAGE014
得到目标函数:
Figure DEST_PATH_IMAGE016
其中S是知识库中的三元组,
Figure DEST_PATH_IMAGE018
是负采样的三元组,
Figure DEST_PATH_IMAGE020
是取值大于0的间隔距离参数;
使用随机梯度下降训练方法,TransH模型训练完成后,得到实体和关系的向量表示。
6.根据权利要求1所述的一种慢性病辅助决策的患者数据可视化方法,其特征在于,步骤(4)二维平面映射具体包括以下子步骤:
(4.1)使用t-SNE算法进行降维可视化,具体为:
步骤一:假设数据集X,它共有N个数据点,每个高维数据点
Figure DEST_PATH_IMAGE022
的维度为D,降维为二维,即在平面上表示出所有数据;
计算数据点高维空间中的相似性的条件概率;将数据点之间的高维欧几里得距离转换为表示相似性的条件概率,高维数据点
Figure DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE026
之间的相似性条件概率
Figure DEST_PATH_IMAGE028
如下:
Figure DEST_PATH_IMAGE030
其中
Figure DEST_PATH_IMAGE032
是以高维数据点
Figure 389111DEST_PATH_IMAGE024
为中心的高斯方差;
步骤二:计算数据点低维空间中的相似性的条件概率;对于高维数据点
Figure 40672DEST_PATH_IMAGE024
Figure DEST_PATH_IMAGE033
的低维对应点
Figure DEST_PATH_IMAGE035
Figure DEST_PATH_IMAGE037
,计算条件概率
Figure DEST_PATH_IMAGE039
如下:
Figure DEST_PATH_IMAGE041
步骤三:最小化条件概率的差异,即令条件概率
Figure 961355DEST_PATH_IMAGE039
近似于
Figure 90985DEST_PATH_IMAGE028
;通过最小化两个条件概率分布之间的Kullback-Leibler散度实现,并使用梯度下降进行迭代更新,损失函数如下:
Figure DEST_PATH_IMAGE043
(4.2)特征重要性排序:使用Regularized Gradient Boosted Decision Tree算法实现知识图谱中的各实体的重要性排序以及获得特征权重值,具体为:
数据集为已知慢病管理效果或者结局的患者信息模型,每个样本包含n维特征;Regularized Gradient Boosted Decision Tree的目标函数L包括损失函数和复杂度,定义为:
Figure DEST_PATH_IMAGE045
Figure DEST_PATH_IMAGE047
其中i表示第i个样本,k是第k颗树,
Figure DEST_PATH_IMAGE049
为预测输出,
Figure 577461DEST_PATH_IMAGE035
为标签值,T表示叶子节点数,ω表示叶子权重值;
Figure DEST_PATH_IMAGE051
为叶子树惩罚正则项,具有剪枝作用;
Figure DEST_PATH_IMAGE053
为叶子权重惩罚正则项,防止过拟合;
Figure DEST_PATH_IMAGE055
表示第i个样本的预测误差;
Figure DEST_PATH_IMAGE057
表示损失函数;
Figure DEST_PATH_IMAGE059
表示树的复杂度函数;
树的生长过程中,通过对比分裂前后的目标函数值,分裂后目标函数值最小的分裂为最佳分裂点;
Figure DEST_PATH_IMAGE061
其中
Figure DEST_PATH_IMAGE063
为加入新叶子节点引入的复杂度代价,
Figure DEST_PATH_IMAGE065
为左子树梯度值,
Figure DEST_PATH_IMAGE067
为左子树样本集合二阶导数;
Figure DEST_PATH_IMAGE069
为右子树梯度值,
Figure DEST_PATH_IMAGE071
为右子树样本集合二阶导数;如果Gain<0,则此叶子节点不做分割;
特征重要性分数通过计算所有树中特征在每次分裂节点时带来的总增益实现;通过调用booster参数的get_score方法获取对应的特征权重值。
7.根据权利要求1所述的一种慢性病辅助决策的患者数据可视化方法,其特征在于,步骤(4)特征重要性排序过程中,Regularized Gradient Boosted Decision Tree参数训练采用网格搜索方法进行,包括一般参数、提升参数和学习目标参数;一般参数控制宏观参数,提升参数控制每一步的提升,学习目标参数控制训练目标的表现。
8.根据权利要求1所述的一种慢性病辅助决策的患者数据可视化方法,其特征在于,步骤(5)中,根据特征的距离信息使用SPARQL查询语言和Jena规则推理获取知识图谱内的知识,生成患者个性化管理方案。
9.根据权利要求8所述的一种慢性病辅助决策的患者数据可视化方法,其特征在于,步骤(5)中,SPARQL查询语句包括查询信息以及名称应该符合的条件,条件以三元组形式出现,按照<subject,predicate,object>,即主谓宾的顺序排列,查询的结果实际就是条件三元组与数据文件中RDF三元组匹配的结果。
10.一种慢性病辅助决策的患者数据可视化系统,其特征在于,包括:
慢性病知识图谱构建模块:慢性病相关临床指南、知识文献作为知识图谱的知识源,通过SNOMED CT对数据语义进行唯一标识,手动构建类、属性与实例,添加数据关系和属性关系,生成知识图谱原型文件;
患者信息模型构建模块:采集患者信息,将患者数据库中的数据转换成符合OWL语言规范的RDF三元组关系;以医学系统命名法-临床术语SNOMED CT标识患者信息模型的节点,实现患者数据向领域知识的语义扩展,融合患者信息和慢性病知识图谱构建患者信息模型;
超平面特征图绘制模块:患者信息模型通过分布式表示转换为超平面特征图,分布式表示采用实体向量与关系向量之间基于翻译的模型;
二维平面映射模块:二维平面节点的位置信息对应患者信息模型超平面特征图降维后的二维位置,利用节点的颜色区分知识图谱中所属的信息类别不同,利用RegularizedGradient Boosted Decision Tree算法特征重要性排序作为各个节点与疾病进展相关性的排序,特征权重值作为欧式距离计算的权重;
决策支持反馈模块:以领域专家标注结果为慢病管理效果理想的患者信息模型作为标准,通过分布式表示和降维可视化绘制出患者数据的二维平面映射图像,结合特征权重值计算二维平面映射图像中各个特征区域的几何中心之间的欧式距离,作为标准化的管理目标;计算需要决策支持反馈的患者在二维平面映射图像中特征之间的欧式距离,将欧式距离与标准数值进行比较,寻找相似距离的路径;根据特征的距离信息获取知识图谱内的知识。
CN202011270972.4A 2020-11-13 2020-11-13 一种慢性病辅助决策的患者数据可视化方法及系统 Active CN112102937B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN202011270972.4A CN112102937B (zh) 2020-11-13 2020-11-13 一种慢性病辅助决策的患者数据可视化方法及系统
PCT/CN2021/073125 WO2021175038A1 (zh) 2020-11-13 2021-01-21 一种慢性病辅助决策的患者数据可视化方法及系统
US17/553,832 US11521751B2 (en) 2020-11-13 2021-12-17 Patient data visualization method and system for assisting decision making in chronic diseases

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011270972.4A CN112102937B (zh) 2020-11-13 2020-11-13 一种慢性病辅助决策的患者数据可视化方法及系统

Publications (2)

Publication Number Publication Date
CN112102937A CN112102937A (zh) 2020-12-18
CN112102937B true CN112102937B (zh) 2021-02-12

Family

ID=73785227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011270972.4A Active CN112102937B (zh) 2020-11-13 2020-11-13 一种慢性病辅助决策的患者数据可视化方法及系统

Country Status (3)

Country Link
US (1) US11521751B2 (zh)
CN (1) CN112102937B (zh)
WO (1) WO2021175038A1 (zh)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112102937B (zh) * 2020-11-13 2021-02-12 之江实验室 一种慢性病辅助决策的患者数据可视化方法及系统
CN113033179B (zh) * 2021-03-24 2024-05-24 北京百度网讯科技有限公司 知识获取方法、装置、电子设备及可读存储介质
CN113380406B (zh) * 2021-04-28 2024-05-31 航天医疗健康科技集团有限公司 疾病风险智能化评估方法及装置
CN114005509B (zh) * 2021-10-30 2024-06-18 深圳平安智慧医健科技有限公司 一种治疗方案推荐系统、方法、装置和存储介质
CN113921141B (zh) * 2021-12-14 2022-04-08 之江实验室 一种个体慢病演进风险可视化评估方法及系统
CN114117081A (zh) * 2022-01-28 2022-03-01 北京明略软件系统有限公司 知识图谱的展示方法、装置、电子设备及可读存储介质
CN114254131B (zh) * 2022-02-28 2022-06-07 南京众智维信息科技有限公司 一种网络安全应急响应知识图谱实体对齐方法
CN114741591B (zh) * 2022-04-02 2024-06-25 西安电子科技大学 一种向学习者推荐学习路径的方法及电子设备
CN114496234B (zh) * 2022-04-18 2022-07-19 浙江大学 一种基于认知图谱的全科患者个性化诊疗方案推荐系统
CN115050438B (zh) * 2022-06-08 2024-08-06 中国人民解放军总医院第八医学中心 一种基于大数据慢病管理路径的方法
CN114780083B (zh) * 2022-06-17 2022-10-18 之江实验室 一种知识图谱系统的可视化构建方法及装置
CN115236058A (zh) * 2022-06-22 2022-10-25 浙江大学 一种基于拉曼光谱的红茶发酵度识别方法及系统
CN115019960B (zh) * 2022-08-01 2022-11-29 浙江大学 一种基于个性化状态空间进展模型的疾病辅助决策系统
CN115036034B (zh) * 2022-08-11 2022-11-08 之江实验室 一种基于患者表征图的相似患者识别方法及系统
CN115762698B (zh) * 2022-12-01 2024-02-13 武汉博科国泰信息技术有限公司 一种医疗慢病检查报告数据提取方法及系统
CN115762813B (zh) * 2023-01-09 2023-04-18 之江实验室 一种基于患者个体知识图谱的医患交互方法及系统
CN116092627B (zh) * 2023-04-04 2023-06-27 南京大经中医药信息技术有限公司 中医病机辨证智慧开方系统
CN116994704B (zh) * 2023-09-22 2023-12-15 北斗云方(北京)健康科技有限公司 基于临床多模态数据深度表示学习的合理用药判别方法
CN117219247B (zh) * 2023-11-08 2024-02-23 厦门培邦信息科技有限公司 一种用于患者就诊的智慧管理系统
CN117828002B (zh) * 2024-03-04 2024-05-10 济宁蜗牛软件科技有限公司 一种土地资源信息数据智能管理方法及系统
CN117936012B (zh) * 2024-03-21 2024-05-17 四川省医学科学院·四川省人民医院 一种基于慢性疼痛的检查项目决策方法、介质及系统
CN118197651B (zh) * 2024-05-20 2024-09-20 中国人民解放军总医院 一种用于跨医疗中心慢性病分类模型构建方法
CN118278621A (zh) * 2024-06-03 2024-07-02 水利部珠江水利委员会珠江水利综合技术中心 应用于水利数据中心的大数据治理分析方法及系统

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7921068B2 (en) * 1998-05-01 2011-04-05 Health Discovery Corporation Data mining platform for knowledge discovery from heterogeneous data types and/or heterogeneous data sources
AU2002304006A1 (en) * 2001-06-15 2003-01-02 Biowulf Technologies, Llc Data mining platform for bioinformatics and other knowledge discovery
US7730063B2 (en) * 2002-12-10 2010-06-01 Asset Trust, Inc. Personalized medicine service
US20150317337A1 (en) * 2014-05-05 2015-11-05 General Electric Company Systems and Methods for Identifying and Driving Actionable Insights from Data
US20190006027A1 (en) * 2017-06-30 2019-01-03 Accenture Global Solutions Limited Automatic identification and extraction of medical conditions and evidences from electronic health records
US11735320B2 (en) * 2018-12-04 2023-08-22 Merative Us L.P. Dynamic creation and manipulation of data visualizations
EP3903241A4 (en) * 2018-12-24 2022-09-14 Roam Analytics, Inc. BUILDING A KNOWLEDGE GRAPH USING MULTIPLE SUB-GRAPHS AND A LINK LAYER INCLUDING MULTIPLE LINK NODES
CN109918475B (zh) * 2019-01-24 2021-01-19 西安交通大学 一种基于医疗知识图谱的可视查询方法及查询系统
CN109830303A (zh) * 2019-02-01 2019-05-31 上海众恒信息产业股份有限公司 基于互联网一体化医疗平台的临床数据挖掘分析与辅助决策方法
US20200342954A1 (en) * 2019-04-24 2020-10-29 Accenture Global Solutions Limited Polypharmacy Side Effect Prediction With Relational Representation Learning
CN110085325B (zh) * 2019-04-30 2021-06-01 王小岗 关于中医经验数据的知识图谱的构建方法及装置
CN110275959B (zh) * 2019-05-22 2023-04-28 广东工业大学 一种面向大规模知识库的快速学习方法
CN110335676A (zh) * 2019-07-09 2019-10-15 泰康保险集团股份有限公司 数据处理方法、装置、介质及电子设备
CN110866124B (zh) * 2019-11-06 2022-05-31 北京诺道认知医学科技有限公司 基于多数据源的医学知识图谱融合方法及装置
CN111191048B (zh) * 2020-01-02 2023-06-02 南京邮电大学 基于知识图谱的急诊问答系统构建方法
CN111370127B (zh) * 2020-01-14 2022-06-10 之江实验室 一种基于知识图谱的跨科室慢性肾病早期诊断决策支持系统
CN111275486A (zh) * 2020-01-17 2020-06-12 北京光速斑马数据科技有限公司 消费者研究方法和系统
CN111382272B (zh) * 2020-03-09 2022-11-01 西南交通大学 一种基于知识图谱的电子病历icd自动编码方法
US11854531B2 (en) * 2020-03-23 2023-12-26 Sorcero, Inc. Cross-class ontology integration for language modeling
CN111667894A (zh) * 2020-06-03 2020-09-15 长沙瀚云信息科技有限公司 基于rete算法规则引擎的医院电子病历质量监控和管理系统
CN112102937B (zh) * 2020-11-13 2021-02-12 之江实验室 一种慢性病辅助决策的患者数据可视化方法及系统

Also Published As

Publication number Publication date
CN112102937A (zh) 2020-12-18
WO2021175038A1 (zh) 2021-09-10
US11521751B2 (en) 2022-12-06
US20220157468A1 (en) 2022-05-19

Similar Documents

Publication Publication Date Title
CN112102937B (zh) 一种慢性病辅助决策的患者数据可视化方法及系统
CN111414393B (zh) 一种基于医学知识图谱的语义相似病例检索方法及设备
RU2703679C2 (ru) Способ и система поддержки принятия врачебных решений с использованием математических моделей представления пациентов
Zhao et al. Advances in patient classification for traditional Chinese medicine: a machine learning perspective
CN111292848B (zh) 一种基于贝叶斯估计的医疗知识图谱辅助推理方法
Yan et al. Comparison of support vector machine, back propagation neural network and extreme learning machine for syndrome element differentiation
US20070130206A1 (en) System and Method For Integrating Heterogeneous Biomedical Information
Yang et al. Semantic inference on clinical documents: combining machine learning algorithms with an inference engine for effective clinical diagnosis and treatment
CN111191048A (zh) 基于知识图谱的急诊问答系统构建方法
Harshavardhan et al. LSGDM with Biogeography‐Based Optimization (BBO) Model for Healthcare Applications
JP7526316B2 (ja) 汎用モデルに基づく標準的な医学用語管理システム及び方法
Gurbuz et al. Deep graph normalizer: a geometric deep learning approach for estimating connectional brain templates
Habib et al. Machine learning based healthcare system for investigating the association between depression and quality of life
CN117271804B (zh) 一种共病特征知识库生成方法、装置、设备及介质
RU2720363C2 (ru) Способ формирования математических моделей пациента с использованием технологий искусственного интеллекта
Sherkat et al. A visual analytics approach for interactive document clustering
CN116737945B (zh) 一种患者emr知识图谱映射方法
Hussein et al. Smart collaboration framework for managing chronic disease using recommender system
Wang A multi-modal knowledge graph platform based on medical data lake
Zhang et al. Self-organizing map methodology and google maps services for geographical epidemiology mapping
Müller-Sielaff et al. Visual assistance in development and validation of bayesian networks for clinical decision support
Kyriazos et al. A semantically-aided approach for online annotation and retrieval of medical images
Hu et al. [Retracted] Visualization Method of Key Knowledge Points of Nursing Teaching Management System Based on SOM Algorithm and Biomedical Diagnosis
Signature Signature. ca
Glueck Ontology-based Context in Visualizations to Facilitate Sensemaking: Case Studies of Phenotype Comparisons

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant