CN109002449B - 一种基于疾病相关属性检索诊断病例的装置及方法 - Google Patents

一种基于疾病相关属性检索诊断病例的装置及方法 Download PDF

Info

Publication number
CN109002449B
CN109002449B CN201710425078.1A CN201710425078A CN109002449B CN 109002449 B CN109002449 B CN 109002449B CN 201710425078 A CN201710425078 A CN 201710425078A CN 109002449 B CN109002449 B CN 109002449B
Authority
CN
China
Prior art keywords
case
matrix
diagnostic
diagnosis
diagnostic case
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710425078.1A
Other languages
English (en)
Other versions
CN109002449A (zh
Inventor
俞松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to CN201710425078.1A priority Critical patent/CN109002449B/zh
Publication of CN109002449A publication Critical patent/CN109002449A/zh
Application granted granted Critical
Publication of CN109002449B publication Critical patent/CN109002449B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种基于疾病相关属性检索诊断病例的装置及方法,该装置包括关键字输入部(11)、诊断病例检索部(12)、第一矩阵建立部(13)、关系集合建立部(14)、第二矩阵建立部(15)、关联度计算部(16)、以及诊断病例推荐部(17)。根据本发明的装置及方法,即使用户仅使用自己知道的与疾病相关的关键字进行检索,也能够在获得最佳的诊断病例。并且,本发明根据每个诊断病例与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度来推荐诊断病例,能够向用户推荐更加可靠的诊断病例,使用户能够更加全面地了解与所输入关键字有关的疾病。

Description

一种基于疾病相关属性检索诊断病例的装置及方法
技术领域
本发明涉及一种基于疾病相关属性检索诊断病例的装置及方法。
背景技术
专利文献1(中国专利201310162934.0)公开了一种内容推荐方法及内容推荐装置,属于互联网技术领域。所述方法包括:对用户浏览的页面进行分析,提取主题关键词;从预设主题库中获取所述主题关键词对应的网址列表;根据所述网址列表中的网址对应的网页的内容向所述用户推荐所述主题关键词相关的内容。专利文献1通过内容推荐装置进行相关主题的内容推荐,可以在各种网站范围内进行推荐,相对于现有技术中由网站在该网站范围内进行相关主题的内容推荐而言,能够扩大推荐范围,增强推荐效果,提高推荐效率。采用专利文献1的技术方案,用户可以获得内容推荐装置推荐的各个网站的推荐的相关主题的内容,使用非常方便。
专利文献1的内容推荐方法的执行主体为内容推荐装置,该内容推荐装置具体位于浏览器的后台。具体的实现时,可以由浏览器的客户端抓取用户的浏览的页面,并发送给后端的内容推荐装置,由内容推荐装置对用户浏览的页面进行分析,提取其中的主题关键词。从一个用户浏览的页面中可以提取一个主题关键词,也可以提供多个主题关键词。专利文献1中的预设主题库是内容推荐装置根据长期分析经验预先建立的。其中预设主题库中包括多个主题关键词,且每个主题关键词对应一个网址列表。在该网址列表中可以包括多个网址,每个网址对应的网页内容中都是该主题词对应的内容。且这些网址列表中的网址使内容推荐装置面向全互联网进行统计获取的,而并不是针对某一特殊网站获取的,因此这些网址列表中的包括的网址范围较广。专利文献1即是根据这些网址列表中的网址对应的网页的内容来向用户推荐主题关键词相关的内容。
然而,在用户想要检索诊断病例时,用户只能使用自己知道的与疾病相关的关键字,也不一定知道与该疾病关系最为密切的关键字,因此,如果采用专利文献1的技术方案,可能需要花费大量的时间对检索结果进行筛选才能获得满意的检索结果,或是尽管花费了大量时间对检索结果进行筛选,也不能获得满意的检索结果。
发明内容
发明要解决的问题
本发明正是为了解决这样的问题而完成的,其目的在于,提供一种能够根据疾病相关属性来检索诊断病例的装置及方法。
解决问题的技术手段
本发明所涉及的基于疾病相关属性检索诊断病例的装置,包括:关键字输入部,其用于输入与疾病相关的关键字;诊断病例检索部,其使用所述关键字,对诊断病例共享库进行检索;第一矩阵建立部,其建立第一矩阵,所述第一矩阵为诊断病例-诊断病例共享库属性的二维矩阵,所述第一矩阵建立部通过以下方式建立所述第一矩阵:将所述诊断病例共享库中所有疾病描述的属性,即诊断病例共享库属性作为矩阵的列名,将通过所述诊断病例检索部检索出来的诊断病例ID以及所述关键字的集合Id作为行名,且将所述关键字的集合Id作为第一行,当所述第一矩阵某行所表示的所述诊断病例ID或所述关键字的集合Id具有所述第一矩阵某列所表示的所述诊断病例共享库属性时,将所述第一矩阵的该行列的值标记为1,否则标记为0;关系集合建立部,其根据所述第一矩阵,建立关系集合,所述关系集合为诊断病例共享库属性-诊断病例的关系集合,所述关系集合建立部通过以下方式建立所述关系集合:每个诊断病例共享库属性的所述关系集合包含所有在所述第一矩阵中该诊断病例共享库属性所对应的列标记为1的所述诊断病例ID或所述关键字的集合Id;第二矩阵建立部,其根据所述关系集合,建立第二矩阵,所述第二矩阵为诊断病例-诊断病例的二维矩阵,所述第二矩阵建立部通过以下方式建立所述第二矩阵:将所述诊断病例ID以及所述关键字的集合Id作为行名以及列名,且将所述关键字的集合Id作为第一行以及第一列,将每个诊断病例共享库属性的所述关系集合中的不同所述诊断病例ID的两两组合的个数,或是所述诊断病例ID与所述关键字的集合Id的组合的个数作为相应的行列的值,并且在所述第二矩阵中将行与列代表相同所述诊断病例ID或者均为所述关键字的集合Id的值标记为0;关联度计算部,其根据所述第二矩阵以及所述关系集合,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度;以及诊断病例推荐部,其根据所述关联度,对所述诊断病例ID进行排序,并按照排列顺序推荐所述诊断病例ID。
另外,本发明所涉及的基于疾病相关属性检索诊断病例的方法,包括:关键字输入步骤,输入与疾病相关的关键字;诊断病例检索步骤,使用所述关键字,对诊断病例共享库进行检索;第一矩阵建立步骤,建立第一矩阵,所述第一矩阵为诊断病例-诊断病例共享库属性的二维矩阵,在所述第一矩阵建立步骤中,通过以下方式建立所述第一矩阵:将所述诊断病例共享库中所有疾病描述的属性,即诊断病例共享库属性作为矩阵的列名,将通过所述诊断病例检索步骤检索出来的诊断病例ID以及所述关键字的集合Id作为行名,且将所述关键字的集合Id作为第一行,当所述第一矩阵某行所表示的所述诊断病例ID或所述关键字的集合Id具有所述第一矩阵某列所表示的所述诊断病例共享库属性时,将所述第一矩阵的该行列的值标记为1,否则标记为0;关系集合建立步骤,根据所述第一矩阵,建立关系集合,所述关系集合为诊断病例共享库属性-诊断病例的关系集合,在所述关系集合建立步骤中,通过以下方式建立所述关系集合:每个诊断病例共享库属性的所述关系集合包含所有在所述第一矩阵中该诊断病例共享库属性所对应的列标记为1的所述诊断病例ID或所述关键字的集合Id;第二矩阵建立步骤,根据所述关系集合,建立第二矩阵,所述第二矩阵为诊断病例-诊断病例的二维矩阵,在所述第二矩阵建立步骤中,通过以下方式建立所述第二矩阵:将所述诊断病例ID以及所述关键字的集合Id作为行名以及列名,且将所述关键字的集合Id作为第一行以及第一列,将每个诊断病例共享库属性的所述关系集合中的不同所述诊断病例ID的两两组合的个数,或是所述诊断病例ID与所述关键字的集合Id的组合的个数作为相应的行列的值,并且在所述第二矩阵中将行与列代表相同所述诊断病例ID或者均为所述关键字的集合Id的值标记为0;关联度计算步骤,根据所述第二矩阵以及所述关系集合,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度;以及诊断病例推荐步骤,根据所述关联度,对所述诊断病例ID进行排序,并按照排列顺序推荐所述诊断病例ID。
发明的效果
根据本发明的装置及方法,即使用户仅使用自己知道的与疾病相关的关键字进行检索,也能够在获得最佳的诊断病例。
另外,本发明根据每个诊断病例与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度来推荐诊断病例,能够向用户推荐更加可靠的诊断病例,使用户能够更加全面地了解与所输入关键字有关的疾病。
附图说明
图1为表示本发明实施方式所涉及的装置的构成图。
图2为表示本发明实施方式所涉及的装置执行诊断病例的检索及推荐的流程图。
图3为表示本发明实施方式所涉及的装置执行检索过程的流程图。
具体实施方式
以下,参照附图,对本发明的具体实施方式进行说明。
图1为表示本发明实施方式所涉及的装置的构成图,图2为表示本发明实施方式所涉及的装置执行诊断病例的检索及推荐的流程图。
如图1所示,本发明的装置1包括:关键字输入部11、诊断病例检索部12、第一矩阵建立部13、关系集合建立部14、第二矩阵建立部15、关联度计算部16、以及诊断病例推荐部17。
关键字输入部11用于输入与疾病相关的关键字(图2中的步骤S1),可以使用键盘等常用的输入设备。
诊断病例检索部12使用所述关键字,对诊断病例共享库进行检索(图2中的步骤S2)。在诊断病例共享库中,每个诊断病例关于疾病的描述部分包括:疾病的症状、疾病的名称等,本领域人员均可以使用该诊断病例共享库进行检索。通常情况下,将诊断病例中关于疾病描述的疾病描述部分经过分词而获得诊断病例的多个属性,再将所有诊断病例的多个属性合并,并剔除重复的属性,就形成了诊断病例共享库的属性。
第一矩阵建立部13建立第一矩阵,所述第一矩阵为诊断病例-诊断病例共享库属性的二维矩阵(图2中的步骤S3)。
具体来说,将所述诊断病例共享库中所有疾病描述的属性,即诊断病例共享库属性作为矩阵的列名,记为:
X1,X2,X3…Xi(i=N,N为正整数)
将通过所述诊断病例检索部检索出来的诊断病例ID以及所述关键字的集合Id作为行名,且将所述关键字的集合Id作为第一行,记为:
Id,ID1,ID2,ID3…IDj(j=N,N为正整数)
当所述第一矩阵的某行所表示的所述诊断病例ID或所述关键字的集合Id具有所述第一矩阵的某列所表示的所述诊断病例共享库属性时,将所述第一矩阵的该行列的值标记为1,否则标记为0,如此获得了如下所示的第一矩阵:
Figure BDA0001314678760000051
关系集合建立部14根据所述第一矩阵,建立关系集合,所述关系集合为诊断病例共享库属性-诊断病例的关系集合(图2中的步骤S4)。
具体来说,每个诊断病例共享库属性的所述关系集合包含所有在所述第一矩阵中该诊断病例共享库属性所对应的列标记为1的所述诊断病例ID或所述关键字的集合Id,即:
X1:{Id,ID1ID2…}
X2:{Id…IDj}
X3:{ID1…IDj}
X4:{ID1,ID2…}
Figure BDA0001314678760000052
第二矩阵建立部15根据所述关系集合,建立第二矩阵,所述第二矩阵为诊断病例-诊断病例的二维矩阵(图2中的步骤S5)。
具体来说,将所述诊断病例ID以及所述关键字的集合Id作为行名以及列名,且将所述关键字的集合Id作为第一行以及第一列,将每个诊断病例共享库属性的所述关系集合中的不同所述诊断病例ID的两两组合的个数,或是所述诊断病例ID与所述关键字的集合Id的组合的个数作为相应的行列的值,并且在所述第二矩阵中将行与列代表相同所述诊断病例ID或者均为所述关键字的集合Id的值标记为0,如此获得了如下所示的第二矩阵:
Figure BDA0001314678760000053
在此,需要说明的是,例如,第ID2行第ID3列的值与第ID3行第ID2列的值由于都表示在所述关系集合中,ID2与ID3的组合的个数,因此为相同的值。
关联度计算部16,其根据所述第二矩阵以及所述关系集合,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度(图2中的步骤S6)。
在本实施方式中,可以使用下述式一,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度D(IDj,Xa)
Figure BDA0001314678760000062
在式一中,j为正整数,j=1,2,3…,Xa为诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性,IDa为在所述关系集合中,属性Xa的集合中的诊断病例,
Figure BDA0001314678760000063
为在所述第二矩阵中第IDj行与第IDa列的诊断病例的相似度,其中,
Figure BDA0001314678760000064
通过下述式二进行计算,
Figure BDA0001314678760000061
Cu,v为在所述第二矩阵中第u行与第v列的诊断病例的相似度,Zuv为所述第二矩阵中第u行第v列的值,P为第u行的总的个数,P’为第v列的总的个数,K和K’为正整数,Zuk为所述第二矩阵中第u行第K列的值,ZK,v为所述第二矩阵中第K'行第v列的值。
诊断病例推荐部17根据所述关联度,对所述诊断病例ID进行排序,并按照排列顺序推荐所述诊断病例ID(图2中的步骤S7)。
在本实施方式中,也可以采用如下方式推荐所述诊断病例ID。即,将所述诊断病例共享库属性的个数减去所述关键字的个数而获得的值设为M,M为大于或等于1的正整数,将所述关联度从大到小进行排序,选取排在前面的
Figure BDA0001314678760000065
个所述关联度进行求和,其中,
Figure BDA0001314678760000066
Z为非零自然数,
之后,按照求和而获得的值从大到小,对所有诊断病例ID进行排列,并按照该排列顺利进行推荐。如此,能够更加可靠地推荐诊断病例。
另外,在本实施方式中,也可以通过图3所示方式对诊断病例共享库进行检索。
图3为表示本发明实施方式所涉及的装置执行检索过程的流程图。
如图3所示,在步骤S201中读取关键字,随后判断所输入的关键字的个数N是否为1(图3中的步骤S202)。
在N=1的情况下(图3的步骤S202中为“是”),使用该关键字进行检索,检索出所有包含所述关键字的诊断病例(图3中的步骤S203),并将检索结果加入结果集(图3中的步骤S204)。
在N≥2的情况下(图3的步骤S202中为“否”),检索出所有至少包含N-1个所述关键字的诊断病例。即,首先将N个关键字中的一个关键字剔除,使用剩下的N-1个关键字进行检索(图3中的步骤S205),并将检索结果加入结果集(图3中的步骤S206)。然后判断N个关键字中是否还存在未被剔除过的关键字(图3中的步骤S207),在还存在未被剔除过的关键字时(图3的步骤S207中为“是”),返回步骤S205。显然,在再次剔除关键字时,所剔除的关键字与之前剔除的所有关键字均不同。直至所有的关键字都被剔除一次后,即在不存在未被剔除过的关键字时(图3的步骤S207中为“否”),使用N个关键字进行检索(图3中的步骤S208),并将检索结果加入结果集(图3中的步骤S209)。
另外,在每一次检索之后,将检索结果加入结果集时,剔除重复的结果,以保证在结果集中没有重复的诊断病例。
如此,能够更加全面地检索诊断病例共享库。
实施例一
假设:用户输入单个关键字“咳嗽”进行检索时,检索结果数不为0。诊断病例共享库的属性为:
{发烧、咳嗽、胃疼、胸闷、咳痰、下肢浮肿、气喘、鼻塞}
输入关键字“咳嗽”到诊断病例共享库,得到检索结果集。检索结果集中共包括五个诊断病例,诊断病例ID依次为ID1,ID2,ID3,ID4,ID5
诊断病例关于疾病描述的属性依次为:
ID1:{发烧、咳嗽、鼻塞}
ID2:{发烧、咳嗽、咳痰}
ID3:{胃疼、咳嗽}
ID4:{鼻塞、咳嗽}
ID5:{发烧、咳嗽、咳痰、鼻塞}
建立诊断病例-诊断病例共享库属性的二维矩阵,将诊断病例共享库的所有属性作为矩阵的列的名称,即列的名称:为发烧、咳嗽、胃疼、胸闷、咳痰、下肢浮肿、气喘、鼻塞。
将所述关键字的集合记为Id,作为矩阵的第一行,将检索结果诊断病例ID作为其他行,所述矩阵的行即为Id,ID1,ID2,ID3,ID4,ID5
当诊断病例ID或所述关键字的集合Id有列中所列举属性时,将相应行列的值标记为1,否则标为0,即获得如下所述的诊断病例-诊断病例共享库属性的二维矩阵:
Figure BDA0001314678760000081
随后,建立诊断病例共享库属性-诊断病例的关系集合,即
发烧:{ID1,ID2,ID5}
咳嗽:{Id,ID1,ID2,ID3,ID4,ID5}
胃疼:{ID3}
胸闷:{}
咳痰:{ID2,ID5}
下肢浮肿:{}
气喘:{}
鼻塞:{ID1,ID4,ID5}
随后,建立诊断病例-诊断病例的二维矩阵,即
Figure BDA0001314678760000082
随后,利用式一与式二,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度,即,
Figure BDA0001314678760000091
其他可以同样按此计算。
病例共享经验记录ID1
Figure BDA0001314678760000092
Figure BDA0001314678760000093
D(ID1,胸闷)=0
Figure BDA0001314678760000094
D(ID1,下肢浮肿)=0
D(ID1,气喘)=0
Figure BDA0001314678760000095
病例共享经验记录ID2
Figure BDA0001314678760000096
Figure BDA0001314678760000097
D(ID2,胸闷)=0
Figure BDA0001314678760000098
D(ID2,下肢浮肿)=0
D(ID2,气喘)=0
Figure BDA0001314678760000099
病例共享经验记录ID3
Figure BDA00013146787600000910
D(ID3,胃疼)=C(ID3,ID3)=0
D(ID3,胸闷)=0
Figure BDA00013146787600000911
D(ID3,下肢浮肿)=0
D(ID3,气喘)=0
Figure BDA0001314678760000101
病例共享经验记录ID4
Figure BDA0001314678760000102
Figure BDA0001314678760000103
D(ID4,胸闷)=0
Figure BDA0001314678760000104
D(ID4,下肢浮肿)=0
D(ID4,气喘)=0
Figure BDA0001314678760000105
病例共享经验记录ID5
Figure BDA0001314678760000106
Figure BDA0001314678760000107
D(ID5,胸闷)=0
Figure BDA0001314678760000108
D(ID5,下肢浮肿)=0
D(ID5,气喘)=0
Figure BDA0001314678760000109
除去输入关键字“咳嗽”,诊断病例共享库属性还有“发烧”、“胃疼”、“胸闷”、“咳痰”、“下肢浮肿”、“气喘”和“鼻塞”共7个。
即M=7,对于式三,
Figure BDA00013146787600001010
由此,将之前计算获得的每一个诊断病例与所述诊断病例共享库属性(不包含“咳嗽”)的7个关联度进行排序,取排在前4位的关联度,即
诊断病例ID1
D(ID1,发烧)、D(ID1,胃疼)、D(ID1,咳痰)、D(ID1,鼻塞)
诊断病例ID2
D(ID2,发烧)、D(ID2,胃疼)、D(ID2,咳痰)、D(ID2,鼻塞)
诊断病例ID3
D(ID3,发烧)、D(ID3,咳痰)、D(ID3,鼻塞)
诊断病例ID4
D(ID4,发烧)、D(ID4,胃疼)、D(ID4,咳痰)、D(ID4,鼻塞)
诊断病例ID5
D(ID5,发烧)、D(ID5,胃疼)、D(ID5,咳痰)、D(ID5,鼻塞)
对每一个诊断病例的上述关联度进行求和,即
诊断病例ID1
SID1=D(ID1,发烧)+D(ID1,胃疼)+D(ID1,咳痰)+D(ID1,鼻塞)
诊断病例ID2
SID2=D(ID2,发烧)+D(ID2,胃疼)+D(ID2,咳痰)+D(ID2,鼻塞)
诊断病例ID3
SID3=D(ID3,发烧)+D(ID3,咳痰)+D(ID3,鼻塞)
诊断病例ID4
SID4=D(ID4,发烧)+D(ID4,胃疼)+D(ID4,咳痰)+D(ID4,鼻塞)
诊断病例ID5
SID5=D(ID5,发烧)+D(ID5,胃疼)+D(ID5,咳痰)+D(ID5,鼻塞)
对以上诊断病例的求和值进行比较,可知:
SID4>SID1>SID2>SID3>SID5
则按照ID4、ID1、ID2、ID3、ID5的顺序推荐诊断病例,并且ID4为最推荐的诊断病例。
实施例二
假设:用户输入三个关键字“心悸”、“呼吸困难”、“胸闷”进行检索,检索结果数不为0。
由于关键字的个数不为1(为3),因此,为了能够更加全面地检索,执行图3所示的流程图。
即,首先,剔除{心悸、呼吸困难、胸闷}中的一个关键字“心悸”,然后使用剩下的关键字{呼吸困难、胸闷}进行检索,检索出包含关键字“呼吸困难”和“胸闷”的所有诊断病例,并将检索结果加入到结果集中。随后,判定{心悸、呼吸困难、胸闷}中还有未被剔除过的关键字{呼吸困难、胸闷},因此,剔除{心悸、呼吸困难、胸闷}中的一个关键字“呼吸困难”,然后使用剩下的关键字{心悸、胸闷}进行检索,检索出包含关键字“心悸”和“胸闷”的所有诊断病例,并将检索结果加入到结果集中。随后,判定{心悸、呼吸困难、胸闷}中还有未被剔除过的关键字{胸闷},因此,剔除{心悸、呼吸困难、胸闷}中的一个关键字“胸闷”,然后使用剩下的关键字{心悸、呼吸困难}进行检索,检索出包含关键字“心悸”和“呼吸困难”的所有诊断病例,并将检索结果加入到结果集中。随后,判定关键字{心悸、呼吸困难、胸闷}没有未被剔除过的关键字,因此,使用关键字{心悸、呼吸困难、胸闷}进行检索,检索出包含关键字“心悸”、“呼吸困难”和“胸闷”的所有诊断病例,并将检索结果加入到结果集中。
假定诊断病例共享库的属性为:
{水肿、心悸、气喘、呼吸困难、胸闷、咳嗽、胃疼、腹胀}
输入关键字{心悸、呼吸困难、胸闷}到诊断病例共享库,得到检索结果。检索结果中共包括五个诊断病例,依次为ID1,ID2,ID3,ID4,ID5
五个诊断病例中关于疾病描述的属性依次为:
ID1:{心悸、呼吸困难、胸闷、咳嗽、水肿}
ID2:{心悸、呼吸困难、胸闷、咳嗽}
ID3:{心悸、呼吸困难、胃疼、腹胀}
ID4:{呼吸困难、胸闷、咳嗽、水肿}
ID5:{心悸、胸闷、咳嗽、水肿、气喘}
建立诊断病例-诊断病例共享库属性的二维矩阵,将诊断病例共享库的所有属性作为矩阵的列的名称,即列的名称:水肿、心悸、气喘、呼吸困难、胸闷、咳嗽、胃疼、腹胀。
将所述关键字的集合记为Id,作为矩阵的第一行,将检索结果诊断病例ID作为其他行,所述矩阵的行即为Id,ID1,ID2,ID3,ID4,ID5
当诊断病例ID或者所述关键字的集合Id有列中所列举属性时,将相应行列的值标记为1,否则标为0,即获得如下所述的诊断病例-诊断病例共享库属性的二维矩阵:
Figure BDA0001314678760000131
随后,建立诊断病例共享库属性-诊断病例的关系集合,即
水肿:{ID1,ID4,ID5}
心悸:{Id,ID1,ID2,ID3,ID5}
气喘:{ID5}
呼吸困难:{Id,ID1,ID2,ID3,ID4}
胸闷:{Id,ID1,ID2,ID4,ID5}
咳嗽:{ID1,ID2,ID4,ID5}
胃疼:{ID3}
腹胀:{ID3}
随后,建立诊断病例-诊断病例的二维矩阵,即
Figure BDA0001314678760000132
随后,利用式一与式二,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度,例如计算ID1与所述关键字属性“发烧”的关联度:
Figure BDA0001314678760000133
其他可以同样按此计算。
诊断病例ID1
Figure BDA0001314678760000141
Figure BDA0001314678760000142
Figure BDA0001314678760000143
Figure BDA0001314678760000144
Figure BDA0001314678760000145
诊断病例ID2
Figure BDA0001314678760000146
Figure BDA0001314678760000147
Figure BDA0001314678760000148
Figure BDA0001314678760000149
Figure BDA00013146787600001410
诊断病例ID3
Figure BDA00013146787600001411
Figure BDA00013146787600001412
Figure BDA00013146787600001413
D(ID3,胃疼)=C(ID3,ID3)=0
D(ID3,腹胀)=C(ID3,ID3)=0
诊断病例ID4
Figure BDA00013146787600001414
Figure BDA00013146787600001415
Figure BDA00013146787600001416
Figure BDA00013146787600001417
Figure BDA00013146787600001418
诊断病例ID5
Figure BDA0001314678760000151
D(ID5,气喘)=C(ID5,ID5)=0
Figure BDA0001314678760000152
Figure BDA0001314678760000153
Figure BDA0001314678760000154
除去输入关键字“心悸”、“呼吸困难”、“胸闷”,诊断病例共享库属性还有“水肿”、“气喘”、“咳嗽”、“胃疼”和“腹胀”共5个。
即M=5,对于式三,
Figure BDA0001314678760000155
由此,将之前计算获得的每一个诊断病例与所述诊断病例共享库属性(不包含“心悸”、“呼吸困难”和“胸闷”关键字属性)的5个关联度进行排序,取排在前3位的关联度,即
诊断病例ID1
D(ID1,水肿)、D(ID1,气喘)、D(ID1,咳嗽)
诊断病例ID2
D(ID2,水肿)、D(ID2,气喘)、D(ID2,咳嗽)
诊断病例ID3
D(ID3,水肿)、D(ID3,气喘)、D(ID3,咳嗽)
诊断病例ID4
D(ID4,水肿)、D(ID4,气喘)、D(ID4,咳嗽)
诊断病例ID5
D(ID5,水肿)、D(ID5,咳嗽)、D(ID5,胃疼)
对每一个诊断病例的上述关联度进行求和,即
诊断病例ID1
SID1=D(ID1,水肿)+D(ID1,气喘)+D(ID1,咳嗽)
诊断病例ID2
SID2=D(ID2,水肿)+D(ID2,气喘)+D(ID2,咳嗽)
诊断病例ID3
SID3=D(ID3,水肿)+D(ID3,气喘)+D(ID3,咳嗽)
诊断病例ID4
SID4=D(ID4,水肿)+D(ID4,气喘)+D(ID4,咳嗽)
诊断病例ID5
SID5=D(ID5,水肿)+D(ID5,咳嗽)+D(ID5,胃疼)
对以上诊断病例的求和值进行比较,可知:
SID1>SID2>SID4>SID5>SID3
则按照ID1、ID2、ID4、ID5、ID3的顺序推荐诊断病例,并且ID1为最推荐的诊断病例。
符号说明
1装置,11关键字输入部,12诊断病例检索部,13第一矩阵建立部,14关系集合建立部,15第二矩阵建立部,16关联度计算部,17诊断病例推荐部。

Claims (8)

1.一种基于疾病相关属性检索诊断病例的装置,其特征在于,
所述装置从用户检索出的检索结果中向用户推荐诊断病例,包括:
关键字输入部,其用于输入与疾病相关的关键字;
诊断病例检索部,其使用所述关键字,对诊断病例共享库进行检索;
第一矩阵建立部,其建立第一矩阵,所述第一矩阵为诊断病例-诊断病例共享库属性的二维矩阵,所述第一矩阵建立部通过以下方式建立所述第一矩阵:将所述诊断病例共享库中所有疾病描述的属性,即诊断病例共享库属性作为矩阵的列名,将通过所述诊断病例检索部检索出来的诊断病例ID以及所述关键字的集合Id作为行名,且将所述关键字的集合Id作为第一行,当所述第一矩阵的某行所表示的所述诊断病例ID或所述关键字的集合Id具有所述第一矩阵的某列所表示的所述诊断病例共享库属性时,将所述第一矩阵的该行列的值标记为1,否则标记为0;
关系集合建立部,其根据所述第一矩阵,建立关系集合,所述关系集合为诊断病例共享库属性-诊断病例的关系集合,所述关系集合建立部通过以下方式建立所述关系集合:每个诊断病例共享库属性的所述关系集合包含所有在所述第一矩阵中该诊断病例共享库属性所对应的列标记为1的所述诊断病例ID或所述关键字的集合Id;
第二矩阵建立部,其根据所述关系集合,建立第二矩阵,所述第二矩阵为诊断病例-诊断病例的二维矩阵,所述第二矩阵建立部通过以下方式建立所述第二矩阵:将所述诊断病例ID以及所述关键字的集合Id作为行名以及列名,且将所述关键字的集合Id作为第一行以及第一列,将每个诊断病例共享库属性的所述关系集合中的不同所述诊断病例ID的两两组合的个数,或是所述诊断病例ID与所述关键字的集合Id的组合的个数作为相应的行列的值,并且在所述第二矩阵中将行与列代表相同所述诊断病例ID或者均代表所述关键字的集合Id的值标记为0;
关联度计算部,其根据所述第二矩阵以及所述关系集合,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度;以及
诊断病例推荐部,其根据所述关联度,对所述诊断病例ID进行排序,并按照排列顺序推荐所述诊断病例ID。
2.如权利要求1所述的装置,其特征在于,
所述诊断病例检索部通过以下方式对所述诊断病例共享库进行检索:
将所述关键字的个数设为N,N为大于或等于1的正整数,
当所述关键字为一个,即N=1时,检索出所有包含所述关键字的诊断病例;
当所述关键字为多个,即N≥2时,检索出所有至少包含N-1个所述关键字的诊断病例。
3.如权利要求1或2所述的装置,其特征在于,
所述关联度计算部通过以下方式计算所述关联度:
诊断病例IDj与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度D(IDj,Xa)为
Figure FDA0004052381380000021
j为正整数,j=1,2,3…,Xa为诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性,IDa为在所述关系集合中,属性Xa的集合中的诊断病例,
Figure FDA0004052381380000022
为在所述第二矩阵中第IDj行与第IDa列的诊断病例的相似度,其中,
Figure FDA0004052381380000023
通过以下公式进行计算,
Figure FDA0004052381380000024
Cu,v为在所述第二矩阵中第u行与第v列的诊断病例的相似度,Zuv为所述第二矩阵中第u行第v列的值,P为第u行的总的个数,P’为第v列的总的个数,K和K’为正整数,Zuk为所述第二矩阵中第u行第K列的值,ZK′v为所述第二矩阵中第K'行第v列的值。
4.如权利要求3所述的装置,其特征在于,
所述诊断病例推荐部通过以下方式推荐所述诊断病例ID:
将所述诊断病例共享库属性的个数减去关键字的个数而获得的值设为M,M为大于或等于1的正整数,将所述关联度从大到小进行排序,选取排在前面的
Figure FDA0004052381380000025
个所述关联度进行求和,其中,
Figure FDA0004052381380000026
Z为非零自然数,
之后,按照求和而获得的值从大到小,对所有诊断病例ID进行排列,按照该排列顺利进行推荐。
5.一种基于疾病相关属性检索诊断病例的方法,其特征在于,
所述方法从用户检索出的检索结果中向用户推荐诊断病例,包括:
关键字输入步骤,输入与疾病相关的关键字;
诊断病例检索步骤,使用所述关键字,对诊断病例共享库进行检索;
第一矩阵建立步骤,建立第一矩阵,所述第一矩阵为诊断病例-诊断病例共享库属性的二维矩阵,在所述第一矩阵建立步骤中,通过以下方式建立所述第一矩阵:将所述诊断病例共享库中所有疾病描述的属性,即诊断病例共享库属性作为矩阵的列名,将通过所述诊断病例检索步骤检索出来的诊断病例ID以及所述关键字的集合Id作为行名,且将所述关键字的集合Id作为第一行,当所述第一矩阵的某行所表示的所述诊断病例ID或所述关键字的集合Id具有所述第一矩阵的某列所表示的所述诊断病例共享库属性时,将所述第一矩阵的该行列的值标记为1,否则标记为0;
关系集合建立步骤,根据所述第一矩阵,建立关系集合,所述关系集合为诊断病例共享库属性-诊断病例的关系集合,在所述关系集合建立步骤中,通过以下方式建立所述关系集合:每个诊断病例共享库属性的所述关系集合包含所有在所述第一矩阵中该诊断病例共享库属性所对应的列标记为1的所述诊断病例ID或所述关键字的集合Id;
第二矩阵建立步骤,根据所述关系集合,建立第二矩阵,所述第二矩阵为诊断病例-诊断病例的二维矩阵,在所述第二矩阵建立步骤中,通过以下方式建立所述第二矩阵:将所述诊断病例ID以及所述关键字的集合Id作为行名以及列名,且将所述关键字的集合Id作为第一行以及第一列,将每个诊断病例共享库属性的所述关系集合中的不同所述诊断病例ID的两两组合的个数,或是所述诊断病例ID与所述关键字的集合Id的组合的个数作为相应的行列的值,并且在所述第二矩阵中将行与列代表相同所述诊断病例ID或者均代表所述关键字的集合Id的值标记为0;
关联度计算步骤,根据所述第二矩阵以及所述关系集合,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度;以及
诊断病例推荐步骤,根据所述关联度,对所述诊断病例ID进行排序,并按照排列顺序推荐所述诊断病例ID。
6.如权利要求5所述的方法,其特征在于,
在所述诊断病例检索步骤中,通过以下方式对所述诊断病例共享库进行检索:
将所述关键字的个数设为N,N为大于或等于1的正整数,
当所述关键字为一个,即N=1时,检索出所有包含所述关键字的诊断病例;
当所述关键字为多个,即N≥2时,检索出所有至少包含N-1个所述关键字的诊断病例。
7.如权利要求5或6所述的方法,其特征在于,
在所述关联度计算步骤中,通过以下方式计算所述关联度:
每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性Xa的关联度D(IDj,Xa)为
Figure FDA0004052381380000041
j为正整数,j=1,2,3…,Xa为诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性,IDa为在所述关系集合中,属性Xa的集合中的诊断病例,
Figure FDA0004052381380000042
为在所述第二矩阵中第IDj行与第IDa列的诊断病例的相似度,其中,
Figure FDA0004052381380000043
通过以下公式进行计算,
Figure FDA0004052381380000044
Cu,v为在所述第二矩阵中第u行与第v列的诊断病例的相似度,Zuv为所述第二矩阵中第u行第v列的值,P为第u行的总的个数,P’为第v列的总的个数,K和K’为正整数,Zuk为所述第二矩阵中第u行第K列的值,ZK′v为所述第二矩阵中第K'行第v列的值。
8.如权利要求7所述的方法,其特征在于,
在所述诊断病例推荐步骤中,通过以下方式推荐所述诊断病例ID:
将所述诊断病例共享库属性的个数减去关键字而获得的个数的值设为M,M为大于或等于1的正整数,将所述关联度从大到小进行排序,选取排在前面的
Figure FDA0004052381380000045
个所述关联度进行求和,其中,
Figure FDA0004052381380000046
Z为非零自然数,
之后,按照求和而获得的值从大到小,对所有诊断病例ID进行排列,并按照该排列顺利进行推荐。
CN201710425078.1A 2017-06-06 2017-06-06 一种基于疾病相关属性检索诊断病例的装置及方法 Active CN109002449B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710425078.1A CN109002449B (zh) 2017-06-06 2017-06-06 一种基于疾病相关属性检索诊断病例的装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710425078.1A CN109002449B (zh) 2017-06-06 2017-06-06 一种基于疾病相关属性检索诊断病例的装置及方法

Publications (2)

Publication Number Publication Date
CN109002449A CN109002449A (zh) 2018-12-14
CN109002449B true CN109002449B (zh) 2023-04-07

Family

ID=64572857

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710425078.1A Active CN109002449B (zh) 2017-06-06 2017-06-06 一种基于疾病相关属性检索诊断病例的装置及方法

Country Status (1)

Country Link
CN (1) CN109002449B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111599482A (zh) * 2020-05-14 2020-08-28 青岛海信医疗设备股份有限公司 电子病例推荐方法和服务器

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116707A (zh) * 2013-03-04 2013-05-22 北京工业大学 一种基于案例推理的心脏病智能诊断方法
CN104915561A (zh) * 2015-06-11 2015-09-16 万达信息股份有限公司 疾病特征智能匹配方法
CN106227880A (zh) * 2016-08-01 2016-12-14 挂号网(杭州)科技有限公司 医生搜索推荐的实现方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102985924A (zh) * 2011-02-14 2013-03-20 松下电器产业株式会社 相似病例检索装置以及相似病例检索方法
CN104572675B (zh) * 2013-10-16 2018-03-30 中国人民解放军南京军区南京总医院 一种相似病历检索的系统及方法
CN106776606A (zh) * 2015-11-20 2017-05-31 株式会社日立制作所 基于电子病历数据库的检索装置和检索方法
CN105893597B (zh) * 2016-04-20 2022-05-31 上海家好科技有限公司 一种相似病历检索方法及系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103116707A (zh) * 2013-03-04 2013-05-22 北京工业大学 一种基于案例推理的心脏病智能诊断方法
CN104915561A (zh) * 2015-06-11 2015-09-16 万达信息股份有限公司 疾病特征智能匹配方法
CN106227880A (zh) * 2016-08-01 2016-12-14 挂号网(杭州)科技有限公司 医生搜索推荐的实现方法

Also Published As

Publication number Publication date
CN109002449A (zh) 2018-12-14

Similar Documents

Publication Publication Date Title
US9600533B2 (en) Matching and recommending relevant videos and media to individual search engine results
US9558263B2 (en) Identifying and displaying relationships between candidate answers
CN103678576B (zh) 基于动态语义分析的全文检索系统
US8527506B2 (en) Media discovery and playlist generation
US7987191B2 (en) System and method for generating a relationship network
KR101361182B1 (ko) 태그를 분석하여 관련 문서를 찾기 위한 시스템 및 방법
US20080215565A1 (en) Searching heterogeneous interrelated entities
US20120191745A1 (en) Synthesized Suggestions for Web-Search Queries
CN104484380A (zh) 个性化搜索方法及装置
WO2008055120A2 (en) System and method for summarizing search results
CN111091883B (zh) 一种医疗文本处理方法、装置、存储介质及设备
Quattrone et al. Effective retrieval of resources in folksonomies using a new tag similarity measure
Sarwar et al. Term relevance feedback for contextual named entity retrieval
CN109002449B (zh) 一种基于疾病相关属性检索诊断病例的装置及方法
CN113127736A (zh) 一种基于搜索历史记录的分类推荐方法及装置
Canale et al. From teaching books to educational videos and vice versa: a cross-media content retrieval experience
CN109002442B (zh) 一种基于医生相关属性检索诊断病例的装置及方法
JP2005128961A (ja) データベース検索装置、データベース検索方法およびプログラム
Ali et al. Entity attribute ranking using learning to rank.
JP5411802B2 (ja) 代表語抽出装置、代表語抽出方法および代表語抽出プログラム
Kern et al. Model selection strategies for author disambiguation
JP2009003731A (ja) 特許検索システム
JP2017049836A (ja) 検索支援装置、検索支援プログラムおよび記憶媒体
Sheth et al. IMPACT SCORE ESTIMATION WITH PRIVACY PRESERVATION IN INFORMATION RETRIEVAL.
Yavlinsky Behold: a content based image search engine for the World Wide Web

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant