CN105184103A - 基于病历数据库的虚拟名医 - Google Patents

基于病历数据库的虚拟名医 Download PDF

Info

Publication number
CN105184103A
CN105184103A CN201510665261.XA CN201510665261A CN105184103A CN 105184103 A CN105184103 A CN 105184103A CN 201510665261 A CN201510665261 A CN 201510665261A CN 105184103 A CN105184103 A CN 105184103A
Authority
CN
China
Prior art keywords
similarity
diagnosis
patient
treatment
database
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510665261.XA
Other languages
English (en)
Other versions
CN105184103B (zh
Inventor
袁克虹
王庆阳
李玉婵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen International Graduate School of Tsinghua University
Original Assignee
Shenzhen Graduate School Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Tsinghua University filed Critical Shenzhen Graduate School Tsinghua University
Priority to CN201510665261.XA priority Critical patent/CN105184103B/zh
Publication of CN105184103A publication Critical patent/CN105184103A/zh
Application granted granted Critical
Publication of CN105184103B publication Critical patent/CN105184103B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

一种基于病历数据库的虚拟名医,其包括:病历数据录入装置;自诉相似度计算模块、诊断经验相似度计算模块及医学影像相似度计算模块,分别用于计算待诊疗患者与病历数据库记载的已诊疗患者针对患者自诉、检查结果及医学影像的相似度指标;综合相似度计算模块,用于将针对患者自诉、检查结果和医学影像的三个相似度指标,以及基于专家打分的患者自诉、检查结果和医学影像三者的临床判断重要性指标相融合,计算待诊疗患者与病历数据库记载的已诊疗患者的综合相似度;以及诊疗方案生成模块,用于从病历数据库选出综合相似度最高的已诊疗患者的病历并输出其诊疗方案。其能够充分发挥电子病历信息资源的临床价值,为医生或者用户提供诊疗建议。

Description

基于病历数据库的虚拟名医
技术领域
本发明涉及医疗数据挖掘领域,更具体地说,涉及一种基于病历数据库的虚拟名医。
背景技术
虚拟名医的目的是通过信息技术模拟现实医生诊疗过程,利用数据挖掘技术从病历中“学习”医生的诊疗经验,通过检索到最为相似的病历为医生或者网上用户提供诊断建议。传统医疗中,医生通过结合患者的自诉、体征、病史、医学影像等主要诊疗判据为患者诊断。病历是医生工作内容的记录,内容上包含了患者的个人信息、病史、治疗过程及结果,但本质上这些信息确蕴含了医生的诊断经验。电子病历是医疗信息化的必然产物,包含了患者自诉、体征、病史、医学影像等主要患者信息,并且具备传统纸质病历所不具备的优点,比如便于保存、传阅以及作为医疗数据挖掘的数据源。近年来,有关电子病历的应用研究逐渐增多,但大多数仅限于提高电子病历的结构化存储能力,用于记录患者的症状和治疗过程,而对其包含的大量信息再应用涉及较少。电子病历既是患者的诊疗过程的记录,也是医生经验的载体,其包含了医生的经验以及患者个体化差异的大量信息。所以对于电子病历的信息挖掘,会极大地发挥电子病历信息资源的临床价值。目前在医疗数据挖掘领域主流的研究方向是医学图像搜索。
发明内容
本发明的目的是提供一种基于病历数据库的虚拟名医,以充分发挥电子病历信息资源的临床价值,为医生或者用户提供诊疗建议。
本发明的具体技术方案如下:
一种基于病历数据库的虚拟名医,所述病历数据库记载了已诊疗患者的患者自述、检查结果、医学影像以及诊疗方案,所述虚拟名医包括:
病历数据录入装置,用于录入待诊疗患者的患者自述、检查结果以及医学影像;
自诉相似度计算模块,用于计算待诊疗患者与病历数据库记载的已诊疗患者针对患者自诉的相似度指标;
诊断经验相似度计算模块,用于计算待诊疗患者与病历数据库记载的已诊疗患者针对检查结果的相似度指标;
医学影像相似度计算模块,用于计算待诊疗患者与病历数据库记载的已诊疗患者针对医学影像的相似度指标;
综合相似度计算模块,用于将针对患者自诉、检查结果和医学影像的三个相似度指标,以及基于专家打分的患者自诉、检查结果和医学影像三者的临床判断重要性指标相融合,计算待诊疗患者与病历数据库记载的已诊疗患者的综合相似度;以及
诊疗方案生成模块,用于从病历数据库选出综合相似度最高的已诊疗患者的病历并输出其诊疗方案。
在上述的基于病历数据库的虚拟名医中,优选地,所述自诉相似度计算模块为文本相似度计算模块,自诉相似度计算模块设置有关键词的同义词表,用关键词计算相似度包括用关键词及其同义词计算相似度。
在上述的基于病历数据库的虚拟名医中,优选地,所述诊断经验相似度计算模块包括:
层次模型构造子模块,用于以待诊疗患者的已检查的项目为准则、病历数据库中记载的已诊疗患者的病历为待选方案建立目标层-准则层-方案层三层结构的层次模型;
权重计算子模块,用于计算准则层相对于目标层的权重,其权重计算方法包括:用各个已检查的项目与疾病的关联度指数构造准则层相对于目标层的判断矩阵,将判断矩阵的各行向量进行几何平均,然后进行归一化处理得到准则层相对于目标层的权重;
单项相似度计算子模块,用于计算待诊疗患者与病历数据库记载的已诊疗患者针对单个检查结果的相似度;以及
多项综合相似度计算子模块,用于将相对同一个已诊疗患者的各个单项相似度与权重对应相乘获取诊断经验相似度。
在上述的基于病历数据库的虚拟名医中,优选地,在所述单项相似度计算子模块中,采用距离系数来判定针对单个检查结果的相似度。
在上述的基于病历数据库的虚拟名医中,优选地,在所述单项相似度计算子模块中,所述距离系数为相对海明距离Dijn,单项相似度Sijn计算如下:
S i j n = 1 - 1 m D i j n = 1 - 1 m Σ k = 1 m | x k i - x k j | | x k max - x k min |
其中,i和j表示进行比较的两个病历,n代表第n个检查项目,xk表示已检查项目第k个指标,xkmax表示所有病历中项目n的第k个指标的最大值,xkmin表示所有病历中项目n的第k个指标的最小值,m为指标个数,0≤Dijn≤m。
在上述的基于病历数据库的虚拟名医中,优选地,所述医学影像相似度计算模块包括:
图像预处理子模块,用于对医学影像进行预处理;
ROI分割子模块,用于采用GMM算法从预处理后的医学影像中分割出感兴趣区域;
特征提取子模块,用于提取感兴趣区域的面积A、周长C以及最小外接矩形的面积A2,并提取整幅图像的总面积Area;
图形描述子构造子模块,用于利用所述整幅图像的总面积Area、以及所述感兴趣区域的面积A、周长C和最小外接矩形的面积A2构造感兴趣区域的图形描述子αi,i=1,2,3,4,5,其中,
α 1 = A A 2 , α 2 = C 2 A , α 3 = A A r e a
α4,α5是感兴趣区域的边界特征,通过获取感兴趣区域的边界像素点,求取其重心及边界上每一个点到重心的距离,然后对这组距离值计算其平均值和方差,分别作为α4,α5的值;以及
相似度计算子模块,通过计算两个医学影像中感兴趣区域的图形描述子之间的欧氏距离,再取倒数后作为两个医学影像的相似度。
在上述的基于病历数据库的虚拟名医中,优选地,在所述ROI分割子模块中,采用GMM算法从预处理后的医学影像中分割出感兴趣区域的方法包括:
通过高斯混合模型计算医学影像中每个像素点灰度的加权概率密度,与加权概率密度的经验区间比较区分出正常点和异常点,将正常点和异常点的灰度值置为两个不同的固定值从而得到该医学影像的二值图像;
用矩形窗扫描所述二值图像,找出包含异常点最多的区域;以及
用区域增长算法处理所述的包含异常点最多的区域,作为该医学影像中的感兴趣区域。
本发明分别针对患者自述、医生诊疗经验和医学影像三部分数据进行相似度计算,综合这三种相似度得到电子病历的综合相似度,这种全面的相似度衡量策略能够有效提高虚拟名医的可靠性,检索到最相似的病历为医生或者其它用户诊断疾病和制定治疗计划提供参考。
附图说明
图1为一些实施例虚拟名医的流程图;
图2为一些实施例中医学影像相似度计算模块的流程图;
图3为一些实施例中图像预处理结果;
图4为一些实施例中ROI定位结果。
具体实施方式
下面结合附图和实施例对本发明进一步说明。这些更详细的描述旨在帮助理解本发明,而不应被用于限制本发明。根据本发明公开的内容,本领域技术人员明白,可以不需要一些或者所有这些特定细节即可实施本发明。而在其它情况下,为了避免将发明创造淡化,未详细描述众所周知的操作过程。
图1示出了一些实施例虚拟名医的流程,该虚拟名医是基于病历数据库实现的,所述病历数据库记载了已诊疗患者的患者自述、检查结果、医学影像以及诊疗方案。参照图1,所述虚拟名医包括:病历数据录入装置S100,自诉相似度计算模块S200,诊断经验相似度计算模块S300,医学影像相似度计算模块S400,综合相似度计算模块S500,诊疗方案生成模块(图中未示出)。
病历数据录入装置S100用于录入待诊疗患者(也称作新患者)的患者自述、检查结果以及医学影像。
自诉相似度计算模块S200用于计算待诊疗患者与病历数据库记载的已诊疗患者针对患者自诉的相似度指标。患者自诉是纯文本形式的数据,患者自诉中有很多临床表现是衡量患者自诉相似度的关键词,同时临床表现出现的频率很高,而且对于含义相同的术语,不同的医生可能会有不同的表达方式,因此有必要建立关键词的同义词表,用关键词计算相似度时包括用关键词及其同义词计算相似度,这样就能实现在衡量相似度时把同义词组作为相似的。为了计算此类数据的相似度,以肺癌病种为例,首先需要依据语义分析技术为肺癌病种建立同义词表,覆盖肺癌病种常见的专业术语和通俗表达形式。根据同义词表,利用目前已相对成熟的文本检索技术可以直接获得患者自诉间的相似度。目前,计算文本相似度的技术已较为成熟,虚拟名医是依托于互联网存在的,通过调用MySQL命令即可获得针对患者自诉的相似度指标S1
诊断经验相似度计算模块S300,用于计算待诊疗患者与病历数据库记载的已诊疗患者针对检查结果的相似度指标。对于医生诊断经验的相似度衡量依据如下:在诊断过程中,医生综合考虑患者的各项检查结果(或者称作指标),根据自身经验和医疗常规对不同的信息予以不同的重视程度,同时结合患者自述对患者的病情予以初步的诊断。一些实施例中,在计算医生诊断经验的相似度时,将患者的各个检查项目结果(即各项检查结果)纳入衡量范围,以海明距离衡量单个检查项目结果的相似度(即单项相似度),同时利用层次分析法获得各项指标对于诊断结果的影响权重,通过单项相似度乘以对应的影响权重然后求和,即可求得医生诊断经验的相似度指标。
在一些更具体的实施例中,诊断经验相似度计算模块S300包括以下子模块:层次模型构造子模块,权重计算子模块,单项相似度计算子模块,多项综合相似度计算子模块。
层次模型构造子模块用于以待诊疗患者(新患者)的已检查的项目为准则、病历数据库中记载的已诊疗患者的病历为待选方案建立目标层-准则层-方案层三层结构的层次模型。
权重计算子模块用于计算准则层相对于目标层的权重,其权重计算方法包括:用各个已检查的项目与疾病的关联度指数构造准则层相对于目标层的判断矩阵,将判断矩阵的各行向量进行几何平均,然后进行归一化处理得到准则层相对于目标层的权重。举例来说,假设新患者已做了E1,E2,E3,E4,E5,E6,这些检查即是层次模型的准则层。首先构造出准则层相对于目标层的判断矩阵,判断矩阵中的每个元素指代的是每一项检查结果的相对重要性,由经验医生给出,举例如下:
则判断矩阵为:
A = 1 e 12 e 13 e 14 e 15 e 16 e 21 1 e 23 e 24 e 25 e 26 e 31 e 32 1 e 34 e 35 e 36 e 41 e 42 e 43 1 e 45 e 46 e 51 e 52 e 53 e 54 1 e 56 e 61 e 62 e 63 e 64 e 65 1
通常eij与eji呈倒数关系。
接下来,利用判断矩阵确定各准则相对于目标的权重系数,具体的,将判断矩阵的各行向量进行几何平均,然后进行归一化处理得到目标层的权重。对于上述例子,将上述判断矩阵A各行向量进行几何平均,由
W i = Π j = 1 n e i j n , i = 1 , 2 , ... , n
此处n=6,可得,
W = W 1 W 2 W 3 W 4 W 5 W 6
对W向量归一化,由
w i = w i Σ i = 1 n w i , i = 1 , 2 , ... , n , n - 6
得到
w = w 1 w 2 w 3 w 4 w 5 w 6 .
为了获得更好效果,进一步地,还包括:计算判断矩阵的最大特征根,利用最大特征值计算一致性指标,检验判断矩阵的一致性,获得具有良好一致性的权重。具体的,根据
λ m a x = 1 n Σ i = 1 n ( A w ) i w i
计算判断矩阵的最大特征根λmax;由
C I = λ m a x - n n - 1
计算一致性指标CI,与平均随机一致性指标RI计算得到判断矩阵的一致性比率CR=CI/RI,若CR小于0.1,说明判断矩阵具有满意的一致性,不需要调整,权重系数w可用。
单项相似度计算子模块用于计算待诊疗患者与病历数据库记载的已诊疗患者针对单个检查结果的相似度。在获得每项检查的权重系数之后,需要确定新患者的每一项检查与其他患者(病历数据库记载的已诊疗患者)的同一检查的相似度。一些实施例中采用距离系数来判定针对单个检查结果的相似度。距离系数主要包括绝对距离(即海明距离)和欧氏距离,相比而言,绝对距离更能反映两序列之间的值相似程度,所以一些较佳实施例中采用基于海明距离的方法衡量单项相似度,如下所述
Ad i j n = Σ k = 1 m | x k i - x k j |
其中n为患者所接受的第n项检查,m为此项检查项目下可量化的诊断指标数量。由于在比较病历的相似程度上,每个用于比较的指标意义不同,量纲不同,为了去除量纲的影响,一些更佳实施例中还对海明距离进行了改进,使用相对海明距离:
D i j n = Σ k = 1 m | x k i - x k j | | x k max - x k m i n |
具体的,单项相似度Sijn计算如下:
S i j n = 1 - 1 m D i j n = 1 - 1 m Σ k = 1 m | x k i - x k j | | x k m a x - x k m i n |
其中,i和j表示进行比较的两个病历,n代表第n个检查项目,xk表示已检查项目第k个指标,xkmax表示所有病历中项目n的第k个指标的最大值,xkmin表示所有病历中项目n的第k个指标的最小值,m为指标个数,0≤Dijn≤m,可知0≤Sijn≤1。对于上述例子,对每一检查项目计算其单个相似度得相似度向量:
Sij=[Sij1Sij2Sij3Sij4Sij5Sij6]。
多项综合相似度计算子模块用于将相对同一个已诊疗患者的各个单项相似度与权重对应相乘获取诊断经验相似度。具体地,通过
S2=Sij*w
即可计算出医生诊断经验的相似度指标S2
医学影像相似度计算模块S400用于计算待诊疗患者与病历数据库记载的已诊疗患者针对医学影像的相似度指标。以肺癌CT为例,首先定位肺癌肿瘤的位置,然后利用区域增长法获取肿瘤区域,提取肿瘤区域的几何特征组成特征向量,通过计算特征向量间的欧氏距离即可作为图像相似度指标。
图2示出了一些实施例中医学影像相似度计算模块S400的流程。参照图2,一些实施例中的医学影像相似度计算模块S400包括:图像预处理子模块S410,ROI分割子模块S420,特征提取子模块S430,图形描述子构造子模块S440,相似度计算子模块S450。
图像预处理子模块S410用于对医学影像进行预处理。以肺癌CT为例,图像中背景的灰度值较低,因此我们可以通过大津阈值法分割人体部位,然后对分割产生的二值图像进行腐蚀处理,从而得到胸腔外壁的大致轮廓。此外,在某些断层CT图像中含有CT设备的局部零件的成像,这些部位的成像存在于CT图像的边缘,因此可以直接将CT图像的边缘区域灰度值置零。经过以上处理,利用图像的水平和垂直方向上的灰度累计便可以获得与胸腔外壁相切的矩形从而可以去除胸腔外壁以外的区域。预处理结果如图3所示,图3中的子图a为肺癌CT原始图,子图b为经分割和腐蚀处理后的结果,子图c为去除胸腔外壁以外的区域后的结果。
ROI分割子模块S420用于采用GMM算法从预处理后的医学影像中分割出感兴趣区域(ROI)。ROI分割环节首先使用了GMM算法定位肿瘤。以肺癌CT为例,将肺癌CT图像中的正常区域看做背景,异常区域,即肿瘤区域当作前景。GMM的目标就是区分图像的背景和前景。相比于异常区域,正常区域的图像特征更为稳定,因此统计正常区域的灰度值分布规律就相对更容易而且其分布规律的适用性也更高。使用n幅来自不同正常个体的相近解剖层的肺部CT图像作为训练样本,并对所有样本进行预处理。训练出的高斯混合模型则是正常肺部CT图像灰度值的分布模型。以此模型区分肺癌CT图像中正常区域和异常区域。
在一些更具体的实施例中,采用GMM算法从预处理后的医学影像中分割出感兴趣区域的方法包括:通过高斯混合模型计算医学影像中每个像素点灰度的加权概率密度,与加权概率密度的经验区间比较区分出正常点和异常点,将正常点和异常点的灰度值置为两个不同的固定值从而得到该医学影像的二值图像;用矩形窗扫描所述二值图像,找出包含异常点最多的区域;以及用区域增长算法处理所述的包含异常点最多的区域,作为该医学影像中的感兴趣区域。举例来说,以I1,I2,...,In表示n幅经过预处理的正常肺部CT图像。In是预处理后的矩阵。pn(x,y)是第n幅图像(x,y)点的像素值。我们将pn(x,y),(n=1,2,3...)作为一个独立的点集,每一个点集都对应一个独立的高斯混合模型,此模型便是这个点集的概率分布密度函数。假设这个高斯混合模型函数如下式所示:
P ( p n ( x , y ) ) = Σ i = 1 K α i g ( p n ( x , y ) , μ i , σ i )
g ( p n ( x , y ) , μ i , σ i ) = 1 2 π * σ i e - ( p n ( x , y ) - μ i ) 2 2 σ i 2
其中,g(pn(x,y),μi,σi)是第个高斯分布在pn(x,y)上的概率密度,αi是这个高斯分布的权重。P(pn(x,y))是pn(x,y)在这个混合高斯分布中的加权概率密度。其中,公式里的参数及其相应的限制条件如下:
α 1 , α 2 , ... , α K ; Σ i = 1 K α i = 1 , α i > 0
μ1,μ2,...,μK
σ1,σ2,...,σK
对于每一个点集的混合高斯模型来说,需要确定的参数有3×K个。这里采用ExpectationMaximizationAlgorithm确定这些参数。在实验中,K=[2,4]时,肿瘤区域定位的准确性最高。以正常肺部CT图像为训练集所建立的高斯混合模型能够很好的拟合肺部CT图像正常区域中每一个像素点灰度的概率分布密度。如果某一部位存在肿瘤,那么此部位的灰度值与相应部位在正常情况下的灰度值之间必定存在差异,从而导致由高斯混合模型得出的加权概率密度是一个异常值。因此,只需判断某一点的加权概率密度是否异常即可确定它是否是异常点。为了判别某一点是否是异常点,实例中通过多次实验确定了一个加权概率密度的经验区间(0.6,2.5),如果某一个像素点的加权概率密度位于此区间内,则判定其为异常点,同时将此点的灰度值置为一;反之,将此像素点的灰度值置零。通过以上处理,可以得到一幅二值图像。为了去除边缘效应和噪声影响,依次对二值图像做边缘区域处理和腐蚀处理。此时,二值图像中还会存在一些离散的非零点,为了提高肿瘤区域定位的准确性,进一步采用一个16×16的矩形窗扫描二值图像,图像中落入矩形窗内的非零点(异常点)个数最多的区域则为肿瘤区域。然后利用区域增长算法就能够分割出完整的肿瘤。图4示出了处理过程的各种状态,图4中的子图a为处理前的状态,子图b为处理过程中生成的二值图像,子图c为得到的包含异常点最多的区域,子图d为区域增长后得到的感兴趣区域(ROI)。
分割出ROI之后,通过特征提取子模块S430提取感兴趣区域的面积A、周长C以及最小外接矩形的面积A2,并提取整幅图像的总面积Area。
图形描述子构造子模块S440用于利用所述整幅图像的总面积Area、以及所述感兴趣区域的面积A、周长C和最小外接矩形的面积A2构造感兴趣区域的图形描述子αi,i=1,2,3,4,5,其中,
α 1 = A A 2 , α 2 = C 2 A , α 3 = A A r e a
α4,α5是感兴趣区域的边界特征,通过获取感兴趣区域的边界像素点,求取其重心及边界上每一个点到重心的距离,然后对这组距离值计算其平均值和方差,分别作为α4,α5的值。
然后,在相似度计算子模块S450中,通过计算两个医学影像中感兴趣区域的图形描述子之间的欧氏距离,再取倒数后作为两个医学影像的相似度指标S3
综合相似度计算模块S500用于将针对患者自诉、检查结果和医学影像的三个相似度指标S1、S2、S3,以及基于专家打分的患者自诉、检查结果和医学影像三者的临床判断重要性指标(即权重)W1、W2、W3相融合,计算待诊疗患者与病历数据库记载的已诊疗患者的综合相似度。更具体地说,基于专家打分的患者自诉、检查结果和医学影像三者的临床判断重要性指标(即权重)W1、W2、W3,可以由若干(如10-20)个行业内专家根据患者自述、诊断经验、医学影像对于临床判断的重要性进行打分,并综合考虑专家的权威性后获得,三者之间满足W1+W2+W3=1。然后,将三个相似度指标S1、S2、S3与三个权重W1、W2、W3对应相乘,得到改进后的相似度S1’、S2’、S3’。在获得三个改进后的相似度指标S1’、S2’、S3’后,将它们作为相应电子病历的特征向量,通过衡量特征向量间的欧氏距离,值越小这说明这两份电子病历相似度越高。每份电子病历对应一个患者,因此可以得到待诊疗患者与病历数据库记载的已诊疗患者的综合相似度。
在诊疗方案生成模块中,通过从病历数据库选出与待诊疗患者综合相似度最高的已诊疗患者的病历并输出其诊疗方案,为医生或者其它用户诊断疾病和制定治疗计划提供参考。
上述虚拟名医综合考虑了病历中的患者自诉、医生的诊断经验和医学影像以及经验丰富的专家意见,通过衡量三种数据各自的相似度及其对于临床诊断重要性来综合考察完整病历间的相似度。这种相似度衡量方式不仅较全面利用了电子病历中的数据,还考虑了行业内权威人士的意见,同时将医生诊断疾病的模式移植到网络平台,完成了虚拟医生的功能。

Claims (7)

1.一种基于病历数据库的虚拟名医,其特征在于,所述病历数据库记载了已诊疗患者的患者自述、检查结果、医学影像以及诊疗方案,所述虚拟名医包括:
病历数据录入装置,用于录入待诊疗患者的患者自述、检查结果以及医学影像;
自诉相似度计算模块,用于计算待诊疗患者与病历数据库记载的已诊疗患者针对患者自诉的相似度指标;
诊断经验相似度计算模块,用于计算待诊疗患者与病历数据库记载的已诊疗患者针对检查结果的相似度指标;
医学影像相似度计算模块,用于计算待诊疗患者与病历数据库记载的已诊疗患者针对医学影像的相似度指标;
综合相似度计算模块,用于将针对患者自诉、检查结果和医学影像的三个相似度指标,以及基于专家打分的患者自诉、检查结果和医学影像三者的临床判断重要性指标相融合,计算待诊疗患者与病历数据库记载的已诊疗患者的综合相似度;以及
诊疗方案生成模块,用于从病历数据库选出综合相似度最高的已诊疗患者的病历并输出其诊疗方案。
2.根据权利要求1所述的基于病历数据库的虚拟名医,其特征在于,所述自诉相似度计算模块为文本相似度计算模块,自诉相似度计算模块设置有关键词的同义词表,用关键词计算相似度包括用关键词及其同义词计算相似度。
3.根据权利要求1所述的基于病历数据库的虚拟名医,其特征在于,所述诊断经验相似度计算模块包括:
层次模型构造子模块,用于以待诊疗患者的已检查的项目为准则、病历数据库中记载的已诊疗患者的病历为待选方案建立目标层-准则层-方案层三层结构的层次模型;
权重计算子模块,用于计算准则层相对于目标层的权重,其权重计算方法包括:用各个已检查的项目与疾病的关联度指数构造准则层相对于目标层的判断矩阵,将判断矩阵的各行向量进行几何平均,然后进行归一化处理得到准则层相对于目标层的权重;
单项相似度计算子模块,用于计算待诊疗患者与病历数据库记载的已诊疗患者针对单个检查结果的相似度;以及
多项综合相似度计算子模块,用于将相对同一个已诊疗患者的各个单项相似度与权重对应相乘获取诊断经验相似度。
4.根据权利要求3所述的基于病历数据库的虚拟名医,其特征在于,在所述单项相似度计算子模块中,采用距离系数来判定针对单个检查结果的相似度。
5.根据权利要求4所述的基于病历数据库的虚拟名医,其特征在于,在所述单项相似度计算子模块中,所述距离系数为相对海明距离Dijn,单项相似度Sijn计算如下:
S i j n = 1 - 1 m D i j n = 1 - 1 m Σ k = 1 m | x k i - x k j | | x k m a x - x k m i n |
其中,i和j表示进行比较的两个病历,n代表第n个检查项目,xk表示已检查项目第k个指标,xkmax表示所有病历中项目n的第k个指标的最大值,xkmin表示所有病历中项目n的第k个指标的最小值,m为指标个数,0≤Dijn≤m。
6.根据权利要求1所述的基于病历数据库的虚拟名医,其特征在于,所述医学影像相似度计算模块包括:
图像预处理子模块,用于对医学影像进行预处理;
ROI分割子模块,用于采用GMM算法从预处理后的医学影像中分割出感兴趣区域;
特征提取子模块,用于提取感兴趣区域的面积A、周长C以及最小外接矩形的面积A2,并提取整幅图像的总面积Area;
图形描述子构造子模块,用于利用所述整幅图像的总面积Area、以及所述感兴趣区域的面积A、周长C和最小外接矩形的面积A2构造感兴趣区域的图形描述子αi,i=1,2,3,4,5,其中,
α 1 = A A 2 , α 2 = C 2 A , α 3 = A A r e a
α4,α5是感兴趣区域的边界特征,通过获取感兴趣区域的边界像素点,求取其重心及边界上每一个点到重心的距离,然后对这组距离值计算其平均值和方差,分别作为α4,α5的值;以及
相似度计算子模块,通过计算两个医学影像中感兴趣区域的图形描述子之间的欧氏距离,再取倒数后作为两个医学影像的相似度。
7.根据权利要求6所述的基于病历数据库的虚拟名医,其特征在于,在所述ROI分割子模块中,采用GMM算法从预处理后的医学影像中分割出感兴趣区域的方法包括:
通过高斯混合模型计算医学影像中每个像素点灰度的加权概率密度,与加权概率密度的经验区间比较区分出正常点和异常点,将正常点和异常点的灰度值置为两个不同的固定值从而得到该医学影像的二值图像;
用矩形窗扫描所述二值图像,找出包含异常点最多的区域;以及
用区域增长算法处理所述的包含异常点最多的区域,作为该医学影像中的感兴趣区域。
CN201510665261.XA 2015-10-15 2015-10-15 基于病历数据库的虚拟名医系统 Active CN105184103B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510665261.XA CN105184103B (zh) 2015-10-15 2015-10-15 基于病历数据库的虚拟名医系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510665261.XA CN105184103B (zh) 2015-10-15 2015-10-15 基于病历数据库的虚拟名医系统

Publications (2)

Publication Number Publication Date
CN105184103A true CN105184103A (zh) 2015-12-23
CN105184103B CN105184103B (zh) 2019-01-22

Family

ID=54906180

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510665261.XA Active CN105184103B (zh) 2015-10-15 2015-10-15 基于病历数据库的虚拟名医系统

Country Status (1)

Country Link
CN (1) CN105184103B (zh)

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740612A (zh) * 2016-01-27 2016-07-06 北京国医精诚科技有限公司 基于中医临床医案的疾病诊疗方法和系统
CN106227850A (zh) * 2016-07-28 2016-12-14 苏维娜 一种基于移动终端的医学检验监控控制系统及控制方法
CN106845118A (zh) * 2017-01-25 2017-06-13 济南德健信息技术有限公司 一种基于电子病历共享文档的辅诊用药系统及方法
CN107330289A (zh) * 2017-07-10 2017-11-07 叮当(深圳)健康机器人科技有限公司 一种症状信息分析方法及装置
CN107656952A (zh) * 2016-12-30 2018-02-02 青岛中科慧康科技有限公司 平行智能病例推荐模型的建模方法
CN107680660A (zh) * 2016-07-27 2018-02-09 百度在线网络技术(北京)有限公司 推荐医生的方法和装置
CN109002442A (zh) * 2017-06-06 2018-12-14 株式会社日立制作所 一种基于医生相关属性检索诊断病例的装置及方法
CN109119132A (zh) * 2018-08-03 2019-01-01 国家卫生计生委科学技术研究所 基于病历特征匹配单基因病名称的方法及系统
CN109346188A (zh) * 2018-10-19 2019-02-15 刘瑞红 一种医学统计数据处理方法
CN110111887A (zh) * 2019-05-15 2019-08-09 清华大学 临床辅助决策方法及装置
CN110265104A (zh) * 2019-05-08 2019-09-20 长沙市中心医院 诊断报告符合度检测方法、装置、计算机设备和存储介质
CN110517789A (zh) * 2019-08-30 2019-11-29 深圳市汇健医疗工程有限公司 多种影像设备的数字化复合手术室
CN110752027A (zh) * 2019-10-21 2020-02-04 卓尔智联(武汉)研究院有限公司 电子病历数据推送方法、装置、计算机设备和存储介质
WO2020063718A1 (zh) * 2018-09-26 2020-04-02 华为技术有限公司 点云编解码方法和编解码器
CN111145888A (zh) * 2019-12-30 2020-05-12 智业软件股份有限公司 一种基于层次分析法的门诊智能导诊方法
CN111180026A (zh) * 2019-12-23 2020-05-19 卫宁健康科技集团股份有限公司 专科诊疗视图系统及方法
WO2020118535A1 (zh) * 2018-12-11 2020-06-18 广东医动科技有限公司 一种b超智能辅助采集方法及系统
CN111640480A (zh) * 2020-05-21 2020-09-08 上海联影智能医疗科技有限公司 医学报告生成方法、计算机设备和存储介质
CN111696667A (zh) * 2020-06-11 2020-09-22 吾征智能技术(北京)有限公司 一种常见妇科疾病预测模型构建方法和预测系统
CN111785386A (zh) * 2020-06-30 2020-10-16 安徽科大讯飞医疗信息技术有限公司 时间区间段的划分方法、相关设备及可读存储介质
CN111858560A (zh) * 2020-07-24 2020-10-30 厦门至恒融兴信息技术有限公司 基于数据仓库的金融数据自动化测试与监控系统
CN112966787A (zh) * 2021-04-16 2021-06-15 平安科技(深圳)有限公司 相似患者的识别方法、装置、计算机设备和存储介质
CN113064960A (zh) * 2020-01-02 2021-07-02 广州创金谷科技有限公司 一种精确搜索与患者病情相似病例的方法
CN117609434A (zh) * 2024-01-23 2024-02-27 中科领讯(北京)科技有限公司 一种肺炎相似病例检索方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324853A (zh) * 2013-06-25 2013-09-25 上海交通大学 基于医学图像特征的相似度计算系统及方法
CN104881463A (zh) * 2015-05-22 2015-09-02 清华大学深圳研究生院 基于结构化病历数据库的参考病历检索方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103324853A (zh) * 2013-06-25 2013-09-25 上海交通大学 基于医学图像特征的相似度计算系统及方法
CN104881463A (zh) * 2015-05-22 2015-09-02 清华大学深圳研究生院 基于结构化病历数据库的参考病历检索方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
ZHEN TIAN ET AL.: "Automatic detection of abnormal regions using Guassian mixture model", 《ICIC EXPRESS LETTERS》 *
赵川源等: "基于多光谱图像和数据挖掘的多特征杂草识别方法", 《农业工程学报》 *
黄金杰等: "基于高斯混合模型和Renyi熵的图像分割方法", 《计算机应用研究》 *

Cited By (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105740612A (zh) * 2016-01-27 2016-07-06 北京国医精诚科技有限公司 基于中医临床医案的疾病诊疗方法和系统
CN105740612B (zh) * 2016-01-27 2019-07-05 北京国医精诚科技有限公司 基于中医临床医案的疾病诊疗系统
CN107680660A (zh) * 2016-07-27 2018-02-09 百度在线网络技术(北京)有限公司 推荐医生的方法和装置
CN106227850A (zh) * 2016-07-28 2016-12-14 苏维娜 一种基于移动终端的医学检验监控控制系统及控制方法
CN107656952B (zh) * 2016-12-30 2019-10-11 青岛中科慧康科技有限公司 平行智能病例推荐模型的建模方法
CN107656952A (zh) * 2016-12-30 2018-02-02 青岛中科慧康科技有限公司 平行智能病例推荐模型的建模方法
CN106845118A (zh) * 2017-01-25 2017-06-13 济南德健信息技术有限公司 一种基于电子病历共享文档的辅诊用药系统及方法
CN109002442A (zh) * 2017-06-06 2018-12-14 株式会社日立制作所 一种基于医生相关属性检索诊断病例的装置及方法
CN109002442B (zh) * 2017-06-06 2023-04-25 株式会社日立制作所 一种基于医生相关属性检索诊断病例的装置及方法
CN107330289A (zh) * 2017-07-10 2017-11-07 叮当(深圳)健康机器人科技有限公司 一种症状信息分析方法及装置
CN109119132A (zh) * 2018-08-03 2019-01-01 国家卫生计生委科学技术研究所 基于病历特征匹配单基因病名称的方法及系统
WO2020063718A1 (zh) * 2018-09-26 2020-04-02 华为技术有限公司 点云编解码方法和编解码器
CN110958455A (zh) * 2018-09-26 2020-04-03 华为技术有限公司 点云编解码方法和编解码器
CN109346188A (zh) * 2018-10-19 2019-02-15 刘瑞红 一种医学统计数据处理方法
WO2020118535A1 (zh) * 2018-12-11 2020-06-18 广东医动科技有限公司 一种b超智能辅助采集方法及系统
CN110265104A (zh) * 2019-05-08 2019-09-20 长沙市中心医院 诊断报告符合度检测方法、装置、计算机设备和存储介质
CN110111887A (zh) * 2019-05-15 2019-08-09 清华大学 临床辅助决策方法及装置
CN110517789A (zh) * 2019-08-30 2019-11-29 深圳市汇健医疗工程有限公司 多种影像设备的数字化复合手术室
CN110517789B (zh) * 2019-08-30 2023-06-16 深圳市汇健医疗工程有限公司 多种影像设备的数字化复合手术室
CN110752027A (zh) * 2019-10-21 2020-02-04 卓尔智联(武汉)研究院有限公司 电子病历数据推送方法、装置、计算机设备和存储介质
CN110752027B (zh) * 2019-10-21 2023-05-23 卓尔智联(武汉)研究院有限公司 电子病历数据推送方法、装置、计算机设备和存储介质
CN111180026A (zh) * 2019-12-23 2020-05-19 卫宁健康科技集团股份有限公司 专科诊疗视图系统及方法
CN111145888A (zh) * 2019-12-30 2020-05-12 智业软件股份有限公司 一种基于层次分析法的门诊智能导诊方法
CN111145888B (zh) * 2019-12-30 2022-05-31 智业软件股份有限公司 一种基于层次分析法的门诊智能导诊方法
CN113064960A (zh) * 2020-01-02 2021-07-02 广州创金谷科技有限公司 一种精确搜索与患者病情相似病例的方法
CN111640480B (zh) * 2020-05-21 2023-09-26 上海联影智能医疗科技有限公司 医学报告生成方法、计算机设备和存储介质
CN111640480A (zh) * 2020-05-21 2020-09-08 上海联影智能医疗科技有限公司 医学报告生成方法、计算机设备和存储介质
CN111696667A (zh) * 2020-06-11 2020-09-22 吾征智能技术(北京)有限公司 一种常见妇科疾病预测模型构建方法和预测系统
CN111785386A (zh) * 2020-06-30 2020-10-16 安徽科大讯飞医疗信息技术有限公司 时间区间段的划分方法、相关设备及可读存储介质
CN111785386B (zh) * 2020-06-30 2024-04-05 讯飞医疗科技股份有限公司 时间区间段的划分方法、相关设备及可读存储介质
CN111858560A (zh) * 2020-07-24 2020-10-30 厦门至恒融兴信息技术有限公司 基于数据仓库的金融数据自动化测试与监控系统
CN111858560B (zh) * 2020-07-24 2023-11-21 厦门至恒融兴信息技术有限公司 基于数据仓库的金融数据自动化测试与监控系统
CN112966787A (zh) * 2021-04-16 2021-06-15 平安科技(深圳)有限公司 相似患者的识别方法、装置、计算机设备和存储介质
WO2022217715A1 (zh) * 2021-04-16 2022-10-20 平安科技(深圳)有限公司 相似患者的识别方法、装置、计算机设备和存储介质
CN112966787B (zh) * 2021-04-16 2023-11-14 平安科技(深圳)有限公司 相似患者的识别方法、装置、计算机设备和存储介质
CN117609434A (zh) * 2024-01-23 2024-02-27 中科领讯(北京)科技有限公司 一种肺炎相似病例检索方法及系统
CN117609434B (zh) * 2024-01-23 2024-03-29 中科领讯(北京)科技有限公司 一种肺炎相似病例检索方法及系统

Also Published As

Publication number Publication date
CN105184103B (zh) 2019-01-22

Similar Documents

Publication Publication Date Title
CN105184103A (zh) 基于病历数据库的虚拟名医
Wu et al. Prediction of fatty liver disease using machine learning algorithms
Xue et al. Transfer learning radiomics based on multimodal ultrasound imaging for staging liver fibrosis
Soltaninejad et al. Automated brain tumour detection and segmentation using superpixel-based extremely randomized trees in FLAIR MRI
Desai et al. Skm-tea: A dataset for accelerated mri reconstruction with dense image labels for quantitative clinical evaluation
Putra et al. Enhanced skin condition prediction through machine learning using dynamic training and testing augmentation
Huo et al. Fully automatic liver attenuation estimation combing CNN segmentation and morphological operations
Liu et al. Deep convolutional neural network-aided detection of portal hypertension in patients with cirrhosis
Attanasio et al. Artificial intelligence, radiomics and other horizons in body composition assessment
Brugnara et al. Automated volumetric assessment with artificial neural networks might enable a more accurate assessment of disease burden in patients with multiple sclerosis
Hussain et al. Deep learning-based diagnosis of disc degenerative diseases using MRI: a comprehensive review
Wang et al. Selecting proper combination of mpMRI sequences for prostate cancer classification using multi-input convolutional neuronal network
Bento et al. Automatic identification of atherosclerosis subjects in a heterogeneous MR brain imaging data set
CN113971657A (zh) 用于医学成像中的异常评估的基于噪声标签的机器学习
Zavala Bojorquez et al. Automatic classification of tissues on pelvic MRI based on relaxation times and support vector machine
de Carvalho et al. Bayesian nonparametric inference for the covariate-adjusted ROC curve
Pálsson et al. Prediction of mgmt methylation status of glioblastoma using radiomics and latent space shape features
Sarica et al. New MS lesion segmentation with deep residual attention gate U-Net utilizing 2D slices of 3D MR images
Warner et al. Supervised segmentation of polycystic kidneys: a new application for stereology data
Liu et al. Quantification of body‐torso‐wide tissue composition on low‐dose CT images via automatic anatomy recognition
Mody et al. Improving error detection in deep learning based radiotherapy autocontouring using bayesian uncertainty
Cairone et al. Robustness of radiomics features to varying segmentation algorithms in magnetic resonance images
Ciuşdel et al. Towards deep learning based estimation of fracture risk in osteoporosis patients
Chacón et al. Computational assessment of stomach tumor volume from multi-slice computerized tomography images in presence of type 2 cancer
Asaturyan et al. Improving the accuracy of fatty liver index to reflect liver fat content with predictive regression modelling

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 518055 Guangdong city of Shenzhen province Nanshan District Xili of Tsinghua

Patentee after: Shenzhen International Graduate School of Tsinghua University

Address before: 518055 Guangdong city of Shenzhen province Nanshan District Xili of Tsinghua

Patentee before: GRADUATE SCHOOL AT SHENZHEN, TSINGHUA University

CP01 Change in the name or title of a patent holder