CN110957046A - 医疗健康案例知识匹配方法和系统 - Google Patents

医疗健康案例知识匹配方法和系统 Download PDF

Info

Publication number
CN110957046A
CN110957046A CN201911116645.0A CN201911116645A CN110957046A CN 110957046 A CN110957046 A CN 110957046A CN 201911116645 A CN201911116645 A CN 201911116645A CN 110957046 A CN110957046 A CN 110957046A
Authority
CN
China
Prior art keywords
medical health
case
feature
external
similarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911116645.0A
Other languages
English (en)
Other versions
CN110957046B (zh
Inventor
顾东晓
赵旺
梁昌勇
王晓玉
杨雪洁
苏凯翔
陆文星
赵树平
欧阳纯萍
刘永彬
李晓玥
鲍超
丁庆秀
解玉光
苗夏雨
周晨
张波达
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hefei University of Technology
Original Assignee
Hefei University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hefei University of Technology filed Critical Hefei University of Technology
Priority to CN201911116645.0A priority Critical patent/CN110957046B/zh
Publication of CN110957046A publication Critical patent/CN110957046A/zh
Application granted granted Critical
Publication of CN110957046B publication Critical patent/CN110957046B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供一种医疗健康案例知识匹配方法和系统,涉及数据处理技术领域。本发明首先获取医疗健康案例数据和外部标注性特征信息,并对所述医疗健康案例数据和所述外部标注性特征信息进行预处理;对经过预处理后的医疗健康案例数据进行特征选择处理,得到关键特征;再基于遗传算法获取关键特征的特征权重;基于所述特征权重和Pearson参数r法获取初步案件相似度;最后基于所述初步案件相似度和所述经过预处理后外部标注性特征信息获取最终案例相似度,基于最终案例相似度得到相似医疗健康案例。本发明引入外部标注性特征信息,能有效的降低质量差、水平低的信息对检索结果的影响,在一定程度上有效地提高了检索结果和健康诊疗决策的准确度。

Description

医疗健康案例知识匹配方法和系统
技术领域
本发明涉及数据处理技术领域,具体涉及一种医疗健康案例知识匹配方法和系统。
背景技术
随着医疗信息化的进一步推进,医疗信息资源的规模也随之庞大起来,这为医疗信息资源管理的发展提出来挑战,也为辅助决策专家系统的性能改进提供了思路,例如基于案例的推理。以CBR技术为核心的案例推理系统能够有效地实现人类推理思维的模拟,成为医疗智能决策支持系统的新的发展方向。
目前常见的CBR技术为基于集成角度与距离的相似案例检索方法改进的案例推理流程。该技术方案是在医疗信息化的环境下,将角度与距离的相似度检索方法集成为一个新的相似度检索方法,并通过收集的实验数据,对该方法的实验结果与仅基于角度或距离的相似度检索方法的实验结果进行对比,验证该技术方案所用的相似度检索方法更加有效,最后提出这种基于集成角度与距离的相似案例检索方法的新的案例推理流程,利用这种改进的案例推理流程来检索相似的案例。
然而,大数据时代的来临,促使医疗类信息资源的数量出现爆发式增长,在这些大量的医疗数据中总会有利用率低,质量差,水平低下的医疗诊断信息。然而这些质量差、水平低的信息可能误导医生进行医疗诊断,损害诊断决策的正确性,导致案例检索的准确度低。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种医疗健康案例知识匹配方法和系统,解决了现有的案例检索的准确度低的技术问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:
本发明提供一种医疗健康案例知识匹配方法,所述方法由计算机执行,包括以下步骤:
S1、获取医疗健康案例数据和外部标注性特征信息,并对所述医疗健康案例数据和所述外部标注性特征信息进行预处理;
S2、对经过预处理后的医疗健康案例数据进行特征选择处理,得到关键特征;
S3、基于遗传算法获取所述关键特征的特征权重;
S4、基于所述特征权重和Pearson参数r法获取初步案件相似度;
S5、基于所述初步案件相似度和所述经过预处理后外部标注性特征信息获取最终案例相似度,基于最终案例相似度得到相似医疗健康案例。
优选的,所述预处理包括标准化处理,所述标准化处理包括0-1标准化方法和最大最小值0-1标准化方法。
优选的,在S2中,所述特征选择处理的方法包括:
计算每个特征的F-Score值,并根据F-Score值进行降序排序;
确定一个被选特征子集,利用SVM的分类正确率对当前特征集合进行评估;
迭代,每一次从未被选择的特征中选取一个F-Score值最大的特征加入上一阶段的待选集合中,再利用SVM对当前集合进行评价;
迭代完所有特征之后,根据SVM的分类准确度获取关键特征。
优选的,所述F-Score值计算公式包括:
Figure BDA0002274251000000031
其中:
n+为正类样本的个数,n-为负类样本的个数,
Figure BDA0002274251000000032
为第j个特征在全部医疗健康案例数据样本上的特征平均值;
Figure BDA0002274251000000033
为在正类样本中的特征平均值,
Figure BDA0002274251000000034
为在负类样本中的特征平均值;
Figure BDA0002274251000000035
代表的是第i个正类样本中第j个特征的特征值,
Figure BDA0002274251000000036
为第i个负类样本中第j个特征的特征值;公式中的分子表明的是正类样本和负类样本之间的差别,公式中的分母部分则表明的是每个样本类的总差别。
优选的,在S4中,Pearson参数r法的计算公式包括:
Figure BDA0002274251000000037
x和y表示向量空间中的两个医疗健康病例,n是向量空间的维数;
x=(a1,a2,a3,……,ai,……,an);
y=(b1,b2,b3,……,bi,……,bn);
S(x,y)表示x和y之间的相似性。
优选的,在S5中,所述最终案例相似度的计算公式包括:
Figure BDA0002274251000000041
P=Wi*Xi
其中:
S为仅考虑案例内在属性的计算结果;
P为两个外部特征属性的集成结果;
Wi为不同属性的权重;
Sp则为考虑外部标注性属性的集成结果。
本发明还提供一种医疗健康案例知识匹配系统,所述系统包括计算机,所述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,所述至少一个存储单元中存储有至少一条指令,所述至少一条指令由所述至少一个处理单元加载并执行以实现以下步骤:
S1、获取医疗健康案例数据和外部标注性特征信息,并对所述医疗健康案例数据和所述外部标注性特征信息进行预处理;
S2、对经过预处理后的医疗健康案例数据进行特征选择处理,得到关键特征;
S3、基于遗传算法获取所述关键特征的特征权重;
S4、基于所述特征权重和Pearson参数r法获取初步案件相似度;
S5、基于所述初步案件相似度和所述经过预处理后外部标注性特征信息获取最终案例相似度,基于最终案例相似度得到相似医疗健康案例。
(三)有益效果
本发明提供了一种医疗健康案例知识匹配方法和系统。与现有技术相比,具备以下有益效果:
本发明首先获取医疗健康案例数据和外部标注性特征信息,并对所述医疗健康案例数据和所述外部标注性特征信息进行预处理;对经过预处理后的医疗健康案例数据进行特征选择处理,得到关键特征;再基于遗传算法获取关键特征的特征权重;基于所述特征权重和Pearson参数r法获取初步案件相似度;最后基于所述初步案件相似度和所述经过预处理后外部标注性特征信息获取最终案例相似度,基于最终案例相似度得到相似医疗健康案例。本发明中运用Pearson参数r相似度度量两个医疗健康案例的相似度,提升了信息检索的准确率和加快了信息检索的速度。本发明引入外部标注性特征信息,能有效的降低质量差、水平低的信息对检索结果的影响,在一定程度上有效地提高了检索结果和健康诊疗决策的准确度。同时本发明综合考虑案例内外部特征信息,检索出来的案例相似度更高,将更有利于后面工作人员的使用;同时外部标注性特征信息的增加使案例在权威和评价方面更加具体,会让案例质量变得更好。本发明的医疗健康案例知识匹配方法和系统能够快速、精确地找到一个合适患者的诊疗方案,为医院诊疗决策提供知识支持。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的一种医疗健康案例知识匹配方法的框图;
图2为本发明实施例中ROC曲线图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本申请实施例通过提供一种医疗健康案例知识匹配方法和系统,解决了现有的医疗健康案例检索准确度低的问题,实现提高医疗健康案例检索的准确度。
本申请实施例中的技术方案为解决上述技术问题,总体思路如下:
本发明实施例首先获取医疗健康案例数据和外部标注性特征信息,并对上述医疗健康案例数据和上述外部标注性特征信息进行预处理;对经过预处理后的医疗健康案例数据进行特征选择处理,得到关键特征;再基于遗传算法获取关键特征的特征权重;基于上述特征权重和Pearson参数r法获取初步案件相似度;最后基于上述初步案件相似度和上述经过预处理后外部标注性特征信息获取最终案例相似度,基于最终案例相似度得到相似医疗健康案例。本发明实施例引入外部标注性特征信息,能有效的降低质量差、水平低的信息对检索结果的影响,在一定程度上有效地提高了检索结果和健康诊疗决策的准确度。
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案进行详细的说明。
本发明提供一种医疗健康案例知识匹配方法,该方法由计算机执行,如图1所示,包括步骤S1~S5:
S1、获取医疗健康案例数据和外部标注性特征信息,并对上述医疗健康案例数据和上述外部标注性特征信息进行预处理;
S2、对经过预处理后的医疗健康案例数据进行特征选择处理,得到关键特征;
S3、基于遗传算法获取关键特征的特征权重;
S4、基于上述特征权重和Pearson参数r法获取初步案件相似度;
S5、基于上述初步案件相似度和上述经过预处理后外部标注性特征信息获取最终案例相似度,基于最终案例相似度得到相似医疗健康案例。
本发明实施例中运用Pearson参数r相似度度量两个医疗健康案例的相似度,提升信息检索的准确率和加快了信息检索的速度。本发明实施例引入外部标注性特征信息,能有效的降低质量差、水平低的信息对检索结果的影响,在一定程度上有效地提高了检索结果和健康诊疗决策的准确度。同时本发明实施例综合考虑案例内外部特征信息,检索出来的案例相似度更高,将更有利于后面工作人员的使用;同时外部标注性特征信息的增加使案例在权威和评价方面更加具体,会让案例质量变得更好。本发明实施例的医疗健康案例知识匹配方法和系统能够快速、精确地找到一个合适患者的诊疗方案,为医院诊疗决策提供知识支持。
下面对各个步骤进行详细描述:
在步骤S1中,获取医疗健康案例数据和外部标注性特征信息,并上述医疗健康案例数据和上述外部标注性特征信息进行预处理。具体实施过程如下:
S101、获取数据平台UCI中的数据,在本发明实施例中,获取303条医疗健康案列数据,其中,有216个为CAD患者,87个为正常,每条记录共59个特征,对这59个特征进行描述。具体如下:
第一类:人口、病史特征17个,详细信息如表1所示;
第二类:症状、体检特征14个,详细信息如表2所示;
第三类:心电图特征7个,详细信息如表3所示;
第四类:化验、超声心动图特征17个,详细信息如表4所示;
第五类:血管照影特征3个,详细信息如表5所示;
第六类:CAD分类特征1个,即CAD患者和Normal患者。
此外,CAD患者的临床诊断流程为:通过血管照影技术对冠状动脉的整体变化情况进行探测,并找到病变的部位,确定病变的程度,如果患者的动脉直径狭窄程度等于或大于50%,则判定其为CAD患者,否则为正常。
表1人口统计与病史特征
Figure BDA0002274251000000081
Figure BDA0002274251000000091
表2躯体症状与体检特征
Figure BDA0002274251000000092
表3心电图ECG特征
Figure BDA0002274251000000093
Figure BDA0002274251000000101
表4血液化验与超声心动图特征
Figure BDA0002274251000000102
表5血管照影与CAD分类特征
Figure BDA0002274251000000103
S102、获取外部标注性特征信息。具体为获取医疗健康案例的案例来源权威性和医生对医疗健康案例的评价。
S103、医疗健康案例数据和外部标注性特征信息进行预处理,具体为:
对医疗健康案例数据和外部标注性特征信息进行赋值。
采用最大最小值0-1标准化方法对赋值后的医疗健康案例数据进行标准化处理,计算公式如下:
Figure BDA0002274251000000111
其中:
rif为第i个对象的等级排序;Mf为所有对象的有序状态数。
采用0-1标准化方法对赋值后的外部标注性特征信息进行标准化处理,计算公式如下:
Figure BDA0002274251000000112
其中:X'ij为当前特征的特征值;min{X'ij}为最小特征值;max{X'ij}为最大特征值。
在步骤S2中,对经过预处理后的医疗健康案例数据进行特征选择处理,得到关键特征。具有实施过程如下:
S201、计算每个特征的F-Score值,并根据F-Score值进行降序排序。计算公式如下:
Figure BDA0002274251000000113
其中:
n+为正类样本的个数,n-为负类样本的个数,
Figure BDA0002274251000000114
为第j个特征在全部医疗健康案例数据样本上的特征平均值;
Figure BDA0002274251000000115
为在正类样本中的特征平均值,
Figure BDA0002274251000000116
为在负类样本中的特征平均值;
Figure BDA0002274251000000117
代表的是第i个正类样本中第j个特征的特征值,
Figure BDA0002274251000000118
为第i个负类样本中第j个特征的特征值;公式中的分子表明的是正类样本和负类样本之间的差别,公式中的分母部分则表明的是每个样本类的总差别。
S202、确定一个被选特征子集,利用SVM的分类正确率对当前特征集合进行评估。
S203、迭代,每一次从未被选择的特征中选取一个F-Score值最大的特征加入上一阶段的待选集合中,再利用SVM(support vector machine支持向量机)对当前集合进行评价。
S204、迭代完所有特征属性之后,根据SVM的分类准确度获取关键特征。
在本发明实施例中,最终得到的22个关键特征,如表6所示。
表6关键特征
Figure BDA0002274251000000121
在步骤S3中,基于遗传算法获取关键特征的特征权重。具体实施过程如下:
采用遗传算法,首先每次将收集的所有数据分为十组,抽取一组为测试组,另外九组为对照组,共进行10次这样的实验,然后对10组权重值取平均数,然后迭代2000次,最后适应度函数为相似度计算方法的分类准确度。具体为:算法在开始阶段,将需要确定属性权值的数据库的数据分成两部分,即产生参考案例集REF和测试案例集TEST,ref[i]∈REF,test[j]∈TEST,i=0,,m,j=0,,n,其中ref[i]test[j]分别表示参考集和测试集中的第i、j个案例,m为参考集中的案例数,n为测试集中的案例数。一个染色体代表一个权矢量,一个染色体由多个基因组成,每个基因表示的就是单个基因项的权重。一个染色体所含的基因个数,等同于在案例集中独立特征项的个数。对于每个权矢量weight[i],找到与每个测试案例test[j]距离最近的训练案例,利用所有的测试案例与它们在参考集中最近邻的距离dist(j,k)之和作为适应度函数iter[i],并以此来评估每一个权矢量的遗传能力。最后的得到的特征权重如表7所示。
表7特征权重
Figure BDA0002274251000000131
在步骤S4中,基于上述特征权重和Pearson参数r法获取初步案件相似度。Pearson参数r法的计算公式包括:
Figure BDA0002274251000000132
其中:
x和y表示向量空间中的两个医疗健康病例,n是向量空间的维数;
x=(a1,a2,a3,……,ai,……,an);
y=(b1,b2,b3,……,bi,……,bn);
S(x,y)表示x和y之间的相似性。
在步骤S5中,基于上述初步案件相似度和上述经过预处理后外部标注性特征信息获取最终案例相似度,基于最终案例相似度得到相似医疗健康案例。最终案例相似度的计算公式包括:
Figure BDA0002274251000000141
P=Wi*Xi
其中:
S为仅考虑案例内在属性的计算结果;
P为两个外部特征属性的集成结果;
Wi为不同属性的权重;
Sp则为考虑外部标注性属性的集成结果。
为了验证本发明实施例提供的方法的有效性,用基于欧式距离算法+统一权重法和基于欧式距离算法+专家权重法作为对照组,和本发实施例的方法进行对比。
表8和图2为三种方法比较所得出的实验结果。较之前两种方法,本文方法总体效果略有改善,实验结果表明,本文方法具有一定的有效性。
表8评估指标结果对比
Figure BDA0002274251000000142
Figure BDA0002274251000000151
从结合评估指标和ROC曲线来看,本发明实施例的方法明显优于另外两种方法。
本发明实施例还提供一种医疗健康案例知识匹配方法检索系统,上述系统包括计算机,上述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,上述至少一个存储单元中存储有至少一条指令,上述至少一条指令由上述至少一个处理单元加载并执行以实现以下步骤:
S1、获取医疗健康案例数据和外部标注性特征信息,并对上述医疗健康案例数据和上述外部标注性特征信息进行预处理;
S2、对经过预处理后的医疗健康案例数据进行特征选择处理,得到关键特征;
S3、基于遗传算法获取上述关键特征的特征权重;
S4、基于上述特征权重和Pearson参数r法获取初步案件相似度;
S5、基于上述初步案件相似度和上述经过预处理后外部标注性特征信息获取最终案例相似度,基于最终案例相似度得到相似医疗健康案例。
可理解的是,本发明实施例提供的上述医疗健康案例知识匹配方法系统与上述医疗健康案例知识匹配方法相对应,其有关内容的解释、举例、有益效果等部分可以参考医疗健康案例知识匹配方法中的相应内容,此处不再赘述。
综上所述,与现有技术相比,具备以下有益效果:
本发明实施例中运用Pearson参数r相似度度量两个医疗健康案例的相似度,提升信息检索的准确率和加快了信息检索的速度。本发明引入外部标注性特征信息,能有效的降低质量差、水平低的信息对检索结果的影响,在一定程度上有效地提高了检索结果和健康诊疗决策的准确度。同时本发明实施例综合考虑案例内外部特征信息,检索出来的案例相似度更高,将更有利于后面工作人员的使用;同时外部标注性特征信息的增加使案例在权威和评价方面更加具体,会让案例质量变得更好。本发明的医疗健康案例知识匹配方法和系统能够快速、精确地找到一个合适患者的诊疗方案,为医院诊疗决策提供知识支持。
需要说明的是,通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (7)

1.一种医疗健康案例知识匹配方法,其特征在于,所述方法由计算机执行,包括以下步骤:
S1、获取医疗健康案例数据和外部标注性特征信息,并对所述医疗健康案例数据和所述外部标注性特征信息进行预处理;
S2、对经过预处理后的医疗健康案例数据进行特征选择处理,得到关键特征;
S3、基于遗传算法获取所述关键特征的特征权重;
S4、基于所述特征权重和Pearson参数r法获取初步案件相似度;
S5、基于所述初步案件相似度和所述经过预处理后外部标注性特征信息获取最终案例相似度,基于最终案例相似度得到相似医疗健康案例。
2.如权利要求1所述的医疗健康案例知识匹配方法,其特征在于,所述预处理包括标准化处理,所述标准化处理包括0-1标准化方法和最大最小值0-1标准化方法。
3.如权利要求1所述的医疗健康案例知识匹配方法,其特征在于,在S2中,所述特征选择处理的方法包括:
计算每个特征的F-Score值,并根据F-Score值进行降序排序;
确定一个被选特征子集,利用SVM的分类正确率对当前特征集合进行评估;
迭代,每一次从未被选择的特征中选取一个F-Score值最大的特征加入上一阶段的待选集合中,再利用SVM对当前集合进行评价;
迭代完所有特征之后,根据SVM的分类准确度获取关键特征。
4.如权利要求3所述的医疗健康案例知识匹配方法,其特征在于,所述F-Score值计算公式包括:
Figure FDA0002274250990000021
其中:
n+为正类样本的个数,n-为负类样本的个数,
Figure FDA0002274250990000022
为第j个特征在全部医疗健康案例数据样本上的特征平均值;
Figure FDA0002274250990000023
为在正类样本中的特征平均值,
Figure FDA0002274250990000024
为在负类样本中的特征平均值;
Figure FDA0002274250990000025
代表的是第i个正类样本中第j个特征的特征值,
Figure FDA0002274250990000026
为第i个负类样本中第j个特征的特征值;公式中的分子表明的是正类样本和负类样本之间的差别,公式中的分母部分则表明的是每个样本类的总差别。
5.如权利要求1所述的医疗健康案例知识匹配方法,其特征在于,在S4中,Pearson参数r法的计算公式包括:
Figure FDA0002274250990000027
x和y表示向量空间中的两个医疗健康病例,n是向量空间的维数;
x=(a1,a2,a3,……,ai,……,an);
y=(b1,b2,b3,……,bi,……,bn);
S(x,y)表示x和y之间的相似性。
6.如权利要求5所述的医疗健康案例知识匹配方法,其特征在于,在S5中,所述最终案例相似度的计算公式包括:
Figure FDA0002274250990000031
其中:
S为仅考虑案例内在属性的计算结果;
P为两个外部特征属性的集成结果;
Wi为不同属性的权重;
Sp则为考虑外部标注性属性的集成结果。
7.一种医疗健康案例知识匹配系统,其特征在于,所述系统包括计算机,所述计算机包括:
至少一个存储单元;
至少一个处理单元;
其中,所述至少一个存储单元中存储有至少一条指令,所述至少一条指令由所述至少一个处理单元加载并执行以实现以下步骤:
S1、获取医疗健康案例数据和外部标注性特征信息,并对所述医疗健康案例数据和所述外部标注性特征信息进行预处理;
S2、对经过预处理后的医疗健康案例数据进行特征选择处理,得到关键特征;
S3、基于遗传算法获取所述关键特征的特征权重;
S4、基于所述特征权重和Pearson参数r法获取初步案件相似度;
S5、基于所述初步案件相似度和所述经过预处理后外部标注性特征信息获取最终案例相似度,基于最终案例相似度得到相似医疗健康案例。
CN201911116645.0A 2019-11-15 2019-11-15 医疗健康案例知识匹配方法和系统 Active CN110957046B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911116645.0A CN110957046B (zh) 2019-11-15 2019-11-15 医疗健康案例知识匹配方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911116645.0A CN110957046B (zh) 2019-11-15 2019-11-15 医疗健康案例知识匹配方法和系统

Publications (2)

Publication Number Publication Date
CN110957046A true CN110957046A (zh) 2020-04-03
CN110957046B CN110957046B (zh) 2024-01-19

Family

ID=69977279

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911116645.0A Active CN110957046B (zh) 2019-11-15 2019-11-15 医疗健康案例知识匹配方法和系统

Country Status (1)

Country Link
CN (1) CN110957046B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950285A (zh) * 2020-07-31 2020-11-17 合肥工业大学 多模态数据融合的医疗知识图谱智能自动构建系统和方法
CN113345587A (zh) * 2021-06-16 2021-09-03 北京邮电大学 基于慢病大数据的人机协同健康案例匹配方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105260598A (zh) * 2015-09-29 2016-01-20 中南大学 口腔诊疗决策支持系统及决策方法
WO2016082263A1 (zh) * 2014-11-28 2016-06-02 东莞中国科学院云计算产业技术创新与育成中心 一种基于预案的多目标辅助决策平台及其实施方法
CN106649551A (zh) * 2016-11-07 2017-05-10 大连工业大学 基于cbr有限元模板的检索方法
CN108847280A (zh) * 2018-06-20 2018-11-20 南京邮电大学 基于案例推理的智慧云医疗实时管理系统
CN109785928A (zh) * 2018-12-25 2019-05-21 平安科技(深圳)有限公司 诊疗方案推荐方法、装置及存储介质
CN109992763A (zh) * 2017-12-29 2019-07-09 北京京东尚科信息技术有限公司 语言标注处理方法、系统、电子设备及计算机可读介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016082263A1 (zh) * 2014-11-28 2016-06-02 东莞中国科学院云计算产业技术创新与育成中心 一种基于预案的多目标辅助决策平台及其实施方法
CN105260598A (zh) * 2015-09-29 2016-01-20 中南大学 口腔诊疗决策支持系统及决策方法
CN106649551A (zh) * 2016-11-07 2017-05-10 大连工业大学 基于cbr有限元模板的检索方法
CN109992763A (zh) * 2017-12-29 2019-07-09 北京京东尚科信息技术有限公司 语言标注处理方法、系统、电子设备及计算机可读介质
CN108847280A (zh) * 2018-06-20 2018-11-20 南京邮电大学 基于案例推理的智慧云医疗实时管理系统
CN109785928A (zh) * 2018-12-25 2019-05-21 平安科技(深圳)有限公司 诊疗方案推荐方法、装置及存储介质

Non-Patent Citations (11)

* Cited by examiner, † Cited by third party
Title
MICROSOFT公司著: "《Microsoft Excel 5 工作表函数手册》", 30 April 1995, pages: 155 - 156 *
SHI, CY (SHI, CHONGYANG) ; LAI, LJ (LAI, LINJING) ; FAN, J (FAN, JING) ; BAI, Y (BAI, YU): ""Similarity Model Based on CBR and FCA"", 《2016 17TH IEEE/ACIS INTERNATIONAL CONFERENCE ON SOFTWARE ENGINEERING, ARTIFICIAL INTELLIGENCE, NETWORKING AND PARALLEL/DISTRIBUTED COMPUTING (SNPD) 》, pages 167 - 168 *
杨光华;王萍;饶淑华;余俊英;黄利兴;: "择医习惯与互联网医疗平台精准搜索的关联性研究", 《中华医学图书情报杂志》, no. 10 *
武璠菲: ""牙齿正畸病例相似性分析方法研究及应用"", 《中国优秀博硕士学位论文全文数据库(硕士) 医药卫生科技辑》 *
武璠菲: ""牙齿正畸病例相似性分析方法研究及应用"", 《中国优秀博硕士学位论文全文数据库(硕士) 医药卫生科技辑》, 15 January 2019 (2019-01-15), pages 16 - 18 *
王观玉等: ""案例系统特征权值优化算法的仿真研究"", 《计算机工程与应用》 *
王观玉等: ""案例系统特征权值优化算法的仿真研究"", 《计算机工程与应用》, 1 January 2013 (2013-01-01), pages 261 - 264 *
秦彩杰等: "一种基于F-Score的特征选择方法", 《宜宾学院学报》 *
秦彩杰等: "一种基于F-Score的特征选择方法", 《宜宾学院学报》, no. 06, 22 December 2017 (2017-12-22), pages 4 - 8 *
秦霜霜;吕伟;余惠琴;宋玲玲;周婷;: "基于案例推理的火灾事故相似度及应对措施研究", 《安全与环境工程》, no. 05 *
谢开池;薛醒思;: "基于改进KNN的案例匹配模块的设计与实现", 《福建工程学院学报》, no. 04 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111950285A (zh) * 2020-07-31 2020-11-17 合肥工业大学 多模态数据融合的医疗知识图谱智能自动构建系统和方法
CN111950285B (zh) * 2020-07-31 2024-01-23 合肥工业大学 多模态数据融合的医疗知识图谱智能自动构建系统和方法
CN113345587A (zh) * 2021-06-16 2021-09-03 北京邮电大学 基于慢病大数据的人机协同健康案例匹配方法及系统

Also Published As

Publication number Publication date
CN110957046B (zh) 2024-01-19

Similar Documents

Publication Publication Date Title
Spencer et al. Exploring feature selection and classification methods for predicting heart disease
Mehmood et al. Prediction of heart disease using deep convolutional neural networks
Mohammed et al. Benchmarking methodology for selection of optimal COVID-19 diagnostic model based on entropy and TOPSIS methods
Akella et al. Machine learning algorithms for predicting coronary artery disease: efforts toward an open source solution
Masood et al. Novel approach to evaluate classification algorithms and feature selection filter algorithms using medical data
Bashir et al. BagMOOV: A novel ensemble for heart disease prediction bootstrap aggregation with multi-objective optimized voting
Anbarasi et al. Enhanced prediction of heart disease with feature subset selection using genetic algorithm
Himes et al. Prediction of chronic obstructive pulmonary disease (COPD) in asthma patients using electronic medical records
CN109036577B (zh) 糖尿病并发症分析方法及装置
Padula et al. Machine learning methods in health economics and outcomes research—the PALISADE checklist: a good practices report of an ISPOR task force
CN111091907A (zh) 基于相似病例库的健康医疗知识检索方法和系统
CN109935337B (zh) 一种基于相似性度量的病案查找方法及系统
US20210104330A1 (en) Systems and methods for generating a genotypic causal model of a disease state
CN110991530A (zh) 缺失数据处理方法及装置、电子设备和存储介质
Chaplot et al. A comprehensive analysis of artificial intelligence techniques for the prediction and prognosis of genetic disorders using various gene disorders
CN112259210A (zh) 医疗大数据访问控制方法、装置及计算机可读存储介质
CN110957046A (zh) 医疗健康案例知识匹配方法和系统
CN109997201A (zh) 针对多种医学知识模块的利用数据驱动方法的精确临床决策支持
Simić et al. A hybrid clustering approach for diagnosing medical diseases
Sirbu et al. Early outcome detection for COVID-19 patients
Huang et al. Study on patient similarity measurement based on electronic medical records
Vinutha et al. EPCA—enhanced principal component analysis for medical data dimensionality reduction
Zhao et al. Construction of guideline-based decision tree for medication recommendation
Irene et al. Improved deep convolutional neural network-based COOT optimization for multimodal disease risk prediction
AU2021102593A4 (en) A Method for Detection of a Disease

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant