CN109002449B - 一种基于疾病相关属性检索诊断病例的装置及方法 - Google Patents
一种基于疾病相关属性检索诊断病例的装置及方法 Download PDFInfo
- Publication number
- CN109002449B CN109002449B CN201710425078.1A CN201710425078A CN109002449B CN 109002449 B CN109002449 B CN 109002449B CN 201710425078 A CN201710425078 A CN 201710425078A CN 109002449 B CN109002449 B CN 109002449B
- Authority
- CN
- China
- Prior art keywords
- case
- matrix
- diagnostic
- diagnosis
- diagnostic case
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003745 diagnosis Methods 0.000 title claims abstract description 112
- 201000010099 disease Diseases 0.000 title claims abstract description 32
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 title claims abstract description 21
- 239000011159 matrix material Substances 0.000 claims abstract description 125
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000012163 sequencing technique Methods 0.000 claims 1
- 206010011224 Cough Diseases 0.000 description 34
- 208000000059 Dyspnea Diseases 0.000 description 25
- 206010013975 Dyspnoeas Diseases 0.000 description 25
- 208000006673 asthma Diseases 0.000 description 23
- 206010000087 Abdominal pain upper Diseases 0.000 description 22
- 206010008479 Chest Pain Diseases 0.000 description 22
- 206010030113 Oedema Diseases 0.000 description 21
- 206010033557 Palpitations Diseases 0.000 description 20
- 206010037660 Pyrexia Diseases 0.000 description 18
- 206010028748 Nasal obstruction Diseases 0.000 description 17
- 206010036790 Productive cough Diseases 0.000 description 16
- 210000003141 lower extremity Anatomy 0.000 description 9
- 206010000060 Abdominal distension Diseases 0.000 description 6
- 208000024794 sputum Diseases 0.000 description 5
- 210000003802 sputum Anatomy 0.000 description 5
- 206010008469 Chest discomfort Diseases 0.000 description 3
- 206010040007 Sense of oppression Diseases 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供了一种基于疾病相关属性检索诊断病例的装置及方法,该装置包括关键字输入部(11)、诊断病例检索部(12)、第一矩阵建立部(13)、关系集合建立部(14)、第二矩阵建立部(15)、关联度计算部(16)、以及诊断病例推荐部(17)。根据本发明的装置及方法,即使用户仅使用自己知道的与疾病相关的关键字进行检索,也能够在获得最佳的诊断病例。并且,本发明根据每个诊断病例与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度来推荐诊断病例,能够向用户推荐更加可靠的诊断病例,使用户能够更加全面地了解与所输入关键字有关的疾病。
Description
技术领域
本发明涉及一种基于疾病相关属性检索诊断病例的装置及方法。
背景技术
专利文献1(中国专利201310162934.0)公开了一种内容推荐方法及内容推荐装置,属于互联网技术领域。所述方法包括:对用户浏览的页面进行分析,提取主题关键词;从预设主题库中获取所述主题关键词对应的网址列表;根据所述网址列表中的网址对应的网页的内容向所述用户推荐所述主题关键词相关的内容。专利文献1通过内容推荐装置进行相关主题的内容推荐,可以在各种网站范围内进行推荐,相对于现有技术中由网站在该网站范围内进行相关主题的内容推荐而言,能够扩大推荐范围,增强推荐效果,提高推荐效率。采用专利文献1的技术方案,用户可以获得内容推荐装置推荐的各个网站的推荐的相关主题的内容,使用非常方便。
专利文献1的内容推荐方法的执行主体为内容推荐装置,该内容推荐装置具体位于浏览器的后台。具体的实现时,可以由浏览器的客户端抓取用户的浏览的页面,并发送给后端的内容推荐装置,由内容推荐装置对用户浏览的页面进行分析,提取其中的主题关键词。从一个用户浏览的页面中可以提取一个主题关键词,也可以提供多个主题关键词。专利文献1中的预设主题库是内容推荐装置根据长期分析经验预先建立的。其中预设主题库中包括多个主题关键词,且每个主题关键词对应一个网址列表。在该网址列表中可以包括多个网址,每个网址对应的网页内容中都是该主题词对应的内容。且这些网址列表中的网址使内容推荐装置面向全互联网进行统计获取的,而并不是针对某一特殊网站获取的,因此这些网址列表中的包括的网址范围较广。专利文献1即是根据这些网址列表中的网址对应的网页的内容来向用户推荐主题关键词相关的内容。
然而,在用户想要检索诊断病例时,用户只能使用自己知道的与疾病相关的关键字,也不一定知道与该疾病关系最为密切的关键字,因此,如果采用专利文献1的技术方案,可能需要花费大量的时间对检索结果进行筛选才能获得满意的检索结果,或是尽管花费了大量时间对检索结果进行筛选,也不能获得满意的检索结果。
发明内容
发明要解决的问题
本发明正是为了解决这样的问题而完成的,其目的在于,提供一种能够根据疾病相关属性来检索诊断病例的装置及方法。
解决问题的技术手段
本发明所涉及的基于疾病相关属性检索诊断病例的装置,包括:关键字输入部,其用于输入与疾病相关的关键字;诊断病例检索部,其使用所述关键字,对诊断病例共享库进行检索;第一矩阵建立部,其建立第一矩阵,所述第一矩阵为诊断病例-诊断病例共享库属性的二维矩阵,所述第一矩阵建立部通过以下方式建立所述第一矩阵:将所述诊断病例共享库中所有疾病描述的属性,即诊断病例共享库属性作为矩阵的列名,将通过所述诊断病例检索部检索出来的诊断病例ID以及所述关键字的集合Id作为行名,且将所述关键字的集合Id作为第一行,当所述第一矩阵某行所表示的所述诊断病例ID或所述关键字的集合Id具有所述第一矩阵某列所表示的所述诊断病例共享库属性时,将所述第一矩阵的该行列的值标记为1,否则标记为0;关系集合建立部,其根据所述第一矩阵,建立关系集合,所述关系集合为诊断病例共享库属性-诊断病例的关系集合,所述关系集合建立部通过以下方式建立所述关系集合:每个诊断病例共享库属性的所述关系集合包含所有在所述第一矩阵中该诊断病例共享库属性所对应的列标记为1的所述诊断病例ID或所述关键字的集合Id;第二矩阵建立部,其根据所述关系集合,建立第二矩阵,所述第二矩阵为诊断病例-诊断病例的二维矩阵,所述第二矩阵建立部通过以下方式建立所述第二矩阵:将所述诊断病例ID以及所述关键字的集合Id作为行名以及列名,且将所述关键字的集合Id作为第一行以及第一列,将每个诊断病例共享库属性的所述关系集合中的不同所述诊断病例ID的两两组合的个数,或是所述诊断病例ID与所述关键字的集合Id的组合的个数作为相应的行列的值,并且在所述第二矩阵中将行与列代表相同所述诊断病例ID或者均为所述关键字的集合Id的值标记为0;关联度计算部,其根据所述第二矩阵以及所述关系集合,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度;以及诊断病例推荐部,其根据所述关联度,对所述诊断病例ID进行排序,并按照排列顺序推荐所述诊断病例ID。
另外,本发明所涉及的基于疾病相关属性检索诊断病例的方法,包括:关键字输入步骤,输入与疾病相关的关键字;诊断病例检索步骤,使用所述关键字,对诊断病例共享库进行检索;第一矩阵建立步骤,建立第一矩阵,所述第一矩阵为诊断病例-诊断病例共享库属性的二维矩阵,在所述第一矩阵建立步骤中,通过以下方式建立所述第一矩阵:将所述诊断病例共享库中所有疾病描述的属性,即诊断病例共享库属性作为矩阵的列名,将通过所述诊断病例检索步骤检索出来的诊断病例ID以及所述关键字的集合Id作为行名,且将所述关键字的集合Id作为第一行,当所述第一矩阵某行所表示的所述诊断病例ID或所述关键字的集合Id具有所述第一矩阵某列所表示的所述诊断病例共享库属性时,将所述第一矩阵的该行列的值标记为1,否则标记为0;关系集合建立步骤,根据所述第一矩阵,建立关系集合,所述关系集合为诊断病例共享库属性-诊断病例的关系集合,在所述关系集合建立步骤中,通过以下方式建立所述关系集合:每个诊断病例共享库属性的所述关系集合包含所有在所述第一矩阵中该诊断病例共享库属性所对应的列标记为1的所述诊断病例ID或所述关键字的集合Id;第二矩阵建立步骤,根据所述关系集合,建立第二矩阵,所述第二矩阵为诊断病例-诊断病例的二维矩阵,在所述第二矩阵建立步骤中,通过以下方式建立所述第二矩阵:将所述诊断病例ID以及所述关键字的集合Id作为行名以及列名,且将所述关键字的集合Id作为第一行以及第一列,将每个诊断病例共享库属性的所述关系集合中的不同所述诊断病例ID的两两组合的个数,或是所述诊断病例ID与所述关键字的集合Id的组合的个数作为相应的行列的值,并且在所述第二矩阵中将行与列代表相同所述诊断病例ID或者均为所述关键字的集合Id的值标记为0;关联度计算步骤,根据所述第二矩阵以及所述关系集合,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度;以及诊断病例推荐步骤,根据所述关联度,对所述诊断病例ID进行排序,并按照排列顺序推荐所述诊断病例ID。
发明的效果
根据本发明的装置及方法,即使用户仅使用自己知道的与疾病相关的关键字进行检索,也能够在获得最佳的诊断病例。
另外,本发明根据每个诊断病例与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度来推荐诊断病例,能够向用户推荐更加可靠的诊断病例,使用户能够更加全面地了解与所输入关键字有关的疾病。
附图说明
图1为表示本发明实施方式所涉及的装置的构成图。
图2为表示本发明实施方式所涉及的装置执行诊断病例的检索及推荐的流程图。
图3为表示本发明实施方式所涉及的装置执行检索过程的流程图。
具体实施方式
以下,参照附图,对本发明的具体实施方式进行说明。
图1为表示本发明实施方式所涉及的装置的构成图,图2为表示本发明实施方式所涉及的装置执行诊断病例的检索及推荐的流程图。
如图1所示,本发明的装置1包括:关键字输入部11、诊断病例检索部12、第一矩阵建立部13、关系集合建立部14、第二矩阵建立部15、关联度计算部16、以及诊断病例推荐部17。
关键字输入部11用于输入与疾病相关的关键字(图2中的步骤S1),可以使用键盘等常用的输入设备。
诊断病例检索部12使用所述关键字,对诊断病例共享库进行检索(图2中的步骤S2)。在诊断病例共享库中,每个诊断病例关于疾病的描述部分包括:疾病的症状、疾病的名称等,本领域人员均可以使用该诊断病例共享库进行检索。通常情况下,将诊断病例中关于疾病描述的疾病描述部分经过分词而获得诊断病例的多个属性,再将所有诊断病例的多个属性合并,并剔除重复的属性,就形成了诊断病例共享库的属性。
第一矩阵建立部13建立第一矩阵,所述第一矩阵为诊断病例-诊断病例共享库属性的二维矩阵(图2中的步骤S3)。
具体来说,将所述诊断病例共享库中所有疾病描述的属性,即诊断病例共享库属性作为矩阵的列名,记为:
X1,X2,X3…Xi(i=N,N为正整数)
将通过所述诊断病例检索部检索出来的诊断病例ID以及所述关键字的集合Id作为行名,且将所述关键字的集合Id作为第一行,记为:
Id,ID1,ID2,ID3…IDj(j=N,N为正整数)
当所述第一矩阵的某行所表示的所述诊断病例ID或所述关键字的集合Id具有所述第一矩阵的某列所表示的所述诊断病例共享库属性时,将所述第一矩阵的该行列的值标记为1,否则标记为0,如此获得了如下所示的第一矩阵:
关系集合建立部14根据所述第一矩阵,建立关系集合,所述关系集合为诊断病例共享库属性-诊断病例的关系集合(图2中的步骤S4)。
具体来说,每个诊断病例共享库属性的所述关系集合包含所有在所述第一矩阵中该诊断病例共享库属性所对应的列标记为1的所述诊断病例ID或所述关键字的集合Id,即:
X1:{Id,ID1ID2…}
X2:{Id…IDj}
X3:{ID1…IDj}
X4:{ID1,ID2…}
…
第二矩阵建立部15根据所述关系集合,建立第二矩阵,所述第二矩阵为诊断病例-诊断病例的二维矩阵(图2中的步骤S5)。
具体来说,将所述诊断病例ID以及所述关键字的集合Id作为行名以及列名,且将所述关键字的集合Id作为第一行以及第一列,将每个诊断病例共享库属性的所述关系集合中的不同所述诊断病例ID的两两组合的个数,或是所述诊断病例ID与所述关键字的集合Id的组合的个数作为相应的行列的值,并且在所述第二矩阵中将行与列代表相同所述诊断病例ID或者均为所述关键字的集合Id的值标记为0,如此获得了如下所示的第二矩阵:
在此,需要说明的是,例如,第ID2行第ID3列的值与第ID3行第ID2列的值由于都表示在所述关系集合中,ID2与ID3的组合的个数,因此为相同的值。
关联度计算部16,其根据所述第二矩阵以及所述关系集合,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度(图2中的步骤S6)。
在本实施方式中,可以使用下述式一,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度D(IDj,Xa)
在式一中,j为正整数,j=1,2,3…,Xa为诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性,IDa为在所述关系集合中,属性Xa的集合中的诊断病例,为在所述第二矩阵中第IDj行与第IDa列的诊断病例的相似度,其中,通过下述式二进行计算,
Cu,v为在所述第二矩阵中第u行与第v列的诊断病例的相似度,Zuv为所述第二矩阵中第u行第v列的值,P为第u行的总的个数,P’为第v列的总的个数,K和K’为正整数,Zuk为所述第二矩阵中第u行第K列的值,ZK,v为所述第二矩阵中第K'行第v列的值。
诊断病例推荐部17根据所述关联度,对所述诊断病例ID进行排序,并按照排列顺序推荐所述诊断病例ID(图2中的步骤S7)。
在本实施方式中,也可以采用如下方式推荐所述诊断病例ID。即,将所述诊断病例共享库属性的个数减去所述关键字的个数而获得的值设为M,M为大于或等于1的正整数,将所述关联度从大到小进行排序,选取排在前面的个所述关联度进行求和,其中,
Z为非零自然数,
之后,按照求和而获得的值从大到小,对所有诊断病例ID进行排列,并按照该排列顺利进行推荐。如此,能够更加可靠地推荐诊断病例。
另外,在本实施方式中,也可以通过图3所示方式对诊断病例共享库进行检索。
图3为表示本发明实施方式所涉及的装置执行检索过程的流程图。
如图3所示,在步骤S201中读取关键字,随后判断所输入的关键字的个数N是否为1(图3中的步骤S202)。
在N=1的情况下(图3的步骤S202中为“是”),使用该关键字进行检索,检索出所有包含所述关键字的诊断病例(图3中的步骤S203),并将检索结果加入结果集(图3中的步骤S204)。
在N≥2的情况下(图3的步骤S202中为“否”),检索出所有至少包含N-1个所述关键字的诊断病例。即,首先将N个关键字中的一个关键字剔除,使用剩下的N-1个关键字进行检索(图3中的步骤S205),并将检索结果加入结果集(图3中的步骤S206)。然后判断N个关键字中是否还存在未被剔除过的关键字(图3中的步骤S207),在还存在未被剔除过的关键字时(图3的步骤S207中为“是”),返回步骤S205。显然,在再次剔除关键字时,所剔除的关键字与之前剔除的所有关键字均不同。直至所有的关键字都被剔除一次后,即在不存在未被剔除过的关键字时(图3的步骤S207中为“否”),使用N个关键字进行检索(图3中的步骤S208),并将检索结果加入结果集(图3中的步骤S209)。
另外,在每一次检索之后,将检索结果加入结果集时,剔除重复的结果,以保证在结果集中没有重复的诊断病例。
如此,能够更加全面地检索诊断病例共享库。
实施例一
假设:用户输入单个关键字“咳嗽”进行检索时,检索结果数不为0。诊断病例共享库的属性为:
{发烧、咳嗽、胃疼、胸闷、咳痰、下肢浮肿、气喘、鼻塞}
输入关键字“咳嗽”到诊断病例共享库,得到检索结果集。检索结果集中共包括五个诊断病例,诊断病例ID依次为ID1,ID2,ID3,ID4,ID5。
诊断病例关于疾病描述的属性依次为:
ID1:{发烧、咳嗽、鼻塞}
ID2:{发烧、咳嗽、咳痰}
ID3:{胃疼、咳嗽}
ID4:{鼻塞、咳嗽}
ID5:{发烧、咳嗽、咳痰、鼻塞}
建立诊断病例-诊断病例共享库属性的二维矩阵,将诊断病例共享库的所有属性作为矩阵的列的名称,即列的名称:为发烧、咳嗽、胃疼、胸闷、咳痰、下肢浮肿、气喘、鼻塞。
将所述关键字的集合记为Id,作为矩阵的第一行,将检索结果诊断病例ID作为其他行,所述矩阵的行即为Id,ID1,ID2,ID3,ID4,ID5。
当诊断病例ID或所述关键字的集合Id有列中所列举属性时,将相应行列的值标记为1,否则标为0,即获得如下所述的诊断病例-诊断病例共享库属性的二维矩阵:
随后,建立诊断病例共享库属性-诊断病例的关系集合,即
发烧:{ID1,ID2,ID5}
咳嗽:{Id,ID1,ID2,ID3,ID4,ID5}
胃疼:{ID3}
胸闷:{}
咳痰:{ID2,ID5}
下肢浮肿:{}
气喘:{}
鼻塞:{ID1,ID4,ID5}
随后,建立诊断病例-诊断病例的二维矩阵,即
随后,利用式一与式二,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度,即,
病例共享经验记录ID1:
D(ID1,胸闷)=0
D(ID1,下肢浮肿)=0
D(ID1,气喘)=0
病例共享经验记录ID2:
D(ID2,胸闷)=0
D(ID2,下肢浮肿)=0
D(ID2,气喘)=0
病例共享经验记录ID3:
D(ID3,胃疼)=C(ID3,ID3)=0
D(ID3,胸闷)=0
D(ID3,下肢浮肿)=0
D(ID3,气喘)=0
病例共享经验记录ID4:
D(ID4,胸闷)=0
D(ID4,下肢浮肿)=0
D(ID4,气喘)=0
病例共享经验记录ID5:
D(ID5,胸闷)=0
D(ID5,下肢浮肿)=0
D(ID5,气喘)=0
除去输入关键字“咳嗽”,诊断病例共享库属性还有“发烧”、“胃疼”、“胸闷”、“咳痰”、“下肢浮肿”、“气喘”和“鼻塞”共7个。
由此,将之前计算获得的每一个诊断病例与所述诊断病例共享库属性(不包含“咳嗽”)的7个关联度进行排序,取排在前4位的关联度,即
诊断病例ID1:
D(ID1,发烧)、D(ID1,胃疼)、D(ID1,咳痰)、D(ID1,鼻塞)
诊断病例ID2:
D(ID2,发烧)、D(ID2,胃疼)、D(ID2,咳痰)、D(ID2,鼻塞)
诊断病例ID3:
D(ID3,发烧)、D(ID3,咳痰)、D(ID3,鼻塞)
诊断病例ID4:
D(ID4,发烧)、D(ID4,胃疼)、D(ID4,咳痰)、D(ID4,鼻塞)
诊断病例ID5
D(ID5,发烧)、D(ID5,胃疼)、D(ID5,咳痰)、D(ID5,鼻塞)
对每一个诊断病例的上述关联度进行求和,即
诊断病例ID1:
SID1=D(ID1,发烧)+D(ID1,胃疼)+D(ID1,咳痰)+D(ID1,鼻塞)
诊断病例ID2:
SID2=D(ID2,发烧)+D(ID2,胃疼)+D(ID2,咳痰)+D(ID2,鼻塞)
诊断病例ID3:
SID3=D(ID3,发烧)+D(ID3,咳痰)+D(ID3,鼻塞)
诊断病例ID4:
SID4=D(ID4,发烧)+D(ID4,胃疼)+D(ID4,咳痰)+D(ID4,鼻塞)
诊断病例ID5:
SID5=D(ID5,发烧)+D(ID5,胃疼)+D(ID5,咳痰)+D(ID5,鼻塞)
对以上诊断病例的求和值进行比较,可知:
SID4>SID1>SID2>SID3>SID5
则按照ID4、ID1、ID2、ID3、ID5的顺序推荐诊断病例,并且ID4为最推荐的诊断病例。
实施例二
假设:用户输入三个关键字“心悸”、“呼吸困难”、“胸闷”进行检索,检索结果数不为0。
由于关键字的个数不为1(为3),因此,为了能够更加全面地检索,执行图3所示的流程图。
即,首先,剔除{心悸、呼吸困难、胸闷}中的一个关键字“心悸”,然后使用剩下的关键字{呼吸困难、胸闷}进行检索,检索出包含关键字“呼吸困难”和“胸闷”的所有诊断病例,并将检索结果加入到结果集中。随后,判定{心悸、呼吸困难、胸闷}中还有未被剔除过的关键字{呼吸困难、胸闷},因此,剔除{心悸、呼吸困难、胸闷}中的一个关键字“呼吸困难”,然后使用剩下的关键字{心悸、胸闷}进行检索,检索出包含关键字“心悸”和“胸闷”的所有诊断病例,并将检索结果加入到结果集中。随后,判定{心悸、呼吸困难、胸闷}中还有未被剔除过的关键字{胸闷},因此,剔除{心悸、呼吸困难、胸闷}中的一个关键字“胸闷”,然后使用剩下的关键字{心悸、呼吸困难}进行检索,检索出包含关键字“心悸”和“呼吸困难”的所有诊断病例,并将检索结果加入到结果集中。随后,判定关键字{心悸、呼吸困难、胸闷}没有未被剔除过的关键字,因此,使用关键字{心悸、呼吸困难、胸闷}进行检索,检索出包含关键字“心悸”、“呼吸困难”和“胸闷”的所有诊断病例,并将检索结果加入到结果集中。
假定诊断病例共享库的属性为:
{水肿、心悸、气喘、呼吸困难、胸闷、咳嗽、胃疼、腹胀}
输入关键字{心悸、呼吸困难、胸闷}到诊断病例共享库,得到检索结果。检索结果中共包括五个诊断病例,依次为ID1,ID2,ID3,ID4,ID5。
五个诊断病例中关于疾病描述的属性依次为:
ID1:{心悸、呼吸困难、胸闷、咳嗽、水肿}
ID2:{心悸、呼吸困难、胸闷、咳嗽}
ID3:{心悸、呼吸困难、胃疼、腹胀}
ID4:{呼吸困难、胸闷、咳嗽、水肿}
ID5:{心悸、胸闷、咳嗽、水肿、气喘}
建立诊断病例-诊断病例共享库属性的二维矩阵,将诊断病例共享库的所有属性作为矩阵的列的名称,即列的名称:水肿、心悸、气喘、呼吸困难、胸闷、咳嗽、胃疼、腹胀。
将所述关键字的集合记为Id,作为矩阵的第一行,将检索结果诊断病例ID作为其他行,所述矩阵的行即为Id,ID1,ID2,ID3,ID4,ID5。
当诊断病例ID或者所述关键字的集合Id有列中所列举属性时,将相应行列的值标记为1,否则标为0,即获得如下所述的诊断病例-诊断病例共享库属性的二维矩阵:
随后,建立诊断病例共享库属性-诊断病例的关系集合,即
水肿:{ID1,ID4,ID5}
心悸:{Id,ID1,ID2,ID3,ID5}
气喘:{ID5}
呼吸困难:{Id,ID1,ID2,ID3,ID4}
胸闷:{Id,ID1,ID2,ID4,ID5}
咳嗽:{ID1,ID2,ID4,ID5}
胃疼:{ID3}
腹胀:{ID3}
随后,建立诊断病例-诊断病例的二维矩阵,即
随后,利用式一与式二,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度,例如计算ID1与所述关键字属性“发烧”的关联度:
诊断病例ID1:
诊断病例ID2:
诊断病例ID3:
D(ID3,胃疼)=C(ID3,ID3)=0
D(ID3,腹胀)=C(ID3,ID3)=0
诊断病例ID4:
诊断病例ID5:
D(ID5,气喘)=C(ID5,ID5)=0
除去输入关键字“心悸”、“呼吸困难”、“胸闷”,诊断病例共享库属性还有“水肿”、“气喘”、“咳嗽”、“胃疼”和“腹胀”共5个。
由此,将之前计算获得的每一个诊断病例与所述诊断病例共享库属性(不包含“心悸”、“呼吸困难”和“胸闷”关键字属性)的5个关联度进行排序,取排在前3位的关联度,即
诊断病例ID1:
D(ID1,水肿)、D(ID1,气喘)、D(ID1,咳嗽)
诊断病例ID2:
D(ID2,水肿)、D(ID2,气喘)、D(ID2,咳嗽)
诊断病例ID3:
D(ID3,水肿)、D(ID3,气喘)、D(ID3,咳嗽)
诊断病例ID4:
D(ID4,水肿)、D(ID4,气喘)、D(ID4,咳嗽)
诊断病例ID5:
D(ID5,水肿)、D(ID5,咳嗽)、D(ID5,胃疼)
对每一个诊断病例的上述关联度进行求和,即
诊断病例ID1:
SID1=D(ID1,水肿)+D(ID1,气喘)+D(ID1,咳嗽)
诊断病例ID2:
SID2=D(ID2,水肿)+D(ID2,气喘)+D(ID2,咳嗽)
诊断病例ID3:
SID3=D(ID3,水肿)+D(ID3,气喘)+D(ID3,咳嗽)
诊断病例ID4:
SID4=D(ID4,水肿)+D(ID4,气喘)+D(ID4,咳嗽)
诊断病例ID5:
SID5=D(ID5,水肿)+D(ID5,咳嗽)+D(ID5,胃疼)
对以上诊断病例的求和值进行比较,可知:
SID1>SID2>SID4>SID5>SID3
则按照ID1、ID2、ID4、ID5、ID3的顺序推荐诊断病例,并且ID1为最推荐的诊断病例。
符号说明
1装置,11关键字输入部,12诊断病例检索部,13第一矩阵建立部,14关系集合建立部,15第二矩阵建立部,16关联度计算部,17诊断病例推荐部。
Claims (8)
1.一种基于疾病相关属性检索诊断病例的装置,其特征在于,
所述装置从用户检索出的检索结果中向用户推荐诊断病例,包括:
关键字输入部,其用于输入与疾病相关的关键字;
诊断病例检索部,其使用所述关键字,对诊断病例共享库进行检索;
第一矩阵建立部,其建立第一矩阵,所述第一矩阵为诊断病例-诊断病例共享库属性的二维矩阵,所述第一矩阵建立部通过以下方式建立所述第一矩阵:将所述诊断病例共享库中所有疾病描述的属性,即诊断病例共享库属性作为矩阵的列名,将通过所述诊断病例检索部检索出来的诊断病例ID以及所述关键字的集合Id作为行名,且将所述关键字的集合Id作为第一行,当所述第一矩阵的某行所表示的所述诊断病例ID或所述关键字的集合Id具有所述第一矩阵的某列所表示的所述诊断病例共享库属性时,将所述第一矩阵的该行列的值标记为1,否则标记为0;
关系集合建立部,其根据所述第一矩阵,建立关系集合,所述关系集合为诊断病例共享库属性-诊断病例的关系集合,所述关系集合建立部通过以下方式建立所述关系集合:每个诊断病例共享库属性的所述关系集合包含所有在所述第一矩阵中该诊断病例共享库属性所对应的列标记为1的所述诊断病例ID或所述关键字的集合Id;
第二矩阵建立部,其根据所述关系集合,建立第二矩阵,所述第二矩阵为诊断病例-诊断病例的二维矩阵,所述第二矩阵建立部通过以下方式建立所述第二矩阵:将所述诊断病例ID以及所述关键字的集合Id作为行名以及列名,且将所述关键字的集合Id作为第一行以及第一列,将每个诊断病例共享库属性的所述关系集合中的不同所述诊断病例ID的两两组合的个数,或是所述诊断病例ID与所述关键字的集合Id的组合的个数作为相应的行列的值,并且在所述第二矩阵中将行与列代表相同所述诊断病例ID或者均代表所述关键字的集合Id的值标记为0;
关联度计算部,其根据所述第二矩阵以及所述关系集合,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度;以及
诊断病例推荐部,其根据所述关联度,对所述诊断病例ID进行排序,并按照排列顺序推荐所述诊断病例ID。
2.如权利要求1所述的装置,其特征在于,
所述诊断病例检索部通过以下方式对所述诊断病例共享库进行检索:
将所述关键字的个数设为N,N为大于或等于1的正整数,
当所述关键字为一个,即N=1时,检索出所有包含所述关键字的诊断病例;
当所述关键字为多个,即N≥2时,检索出所有至少包含N-1个所述关键字的诊断病例。
3.如权利要求1或2所述的装置,其特征在于,
所述关联度计算部通过以下方式计算所述关联度:
诊断病例IDj与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度D(IDj,Xa)为
j为正整数,j=1,2,3…,Xa为诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性,IDa为在所述关系集合中,属性Xa的集合中的诊断病例,为在所述第二矩阵中第IDj行与第IDa列的诊断病例的相似度,其中,通过以下公式进行计算,
Cu,v为在所述第二矩阵中第u行与第v列的诊断病例的相似度,Zuv为所述第二矩阵中第u行第v列的值,P为第u行的总的个数,P’为第v列的总的个数,K和K’为正整数,Zuk为所述第二矩阵中第u行第K列的值,ZK′v为所述第二矩阵中第K'行第v列的值。
5.一种基于疾病相关属性检索诊断病例的方法,其特征在于,
所述方法从用户检索出的检索结果中向用户推荐诊断病例,包括:
关键字输入步骤,输入与疾病相关的关键字;
诊断病例检索步骤,使用所述关键字,对诊断病例共享库进行检索;
第一矩阵建立步骤,建立第一矩阵,所述第一矩阵为诊断病例-诊断病例共享库属性的二维矩阵,在所述第一矩阵建立步骤中,通过以下方式建立所述第一矩阵:将所述诊断病例共享库中所有疾病描述的属性,即诊断病例共享库属性作为矩阵的列名,将通过所述诊断病例检索步骤检索出来的诊断病例ID以及所述关键字的集合Id作为行名,且将所述关键字的集合Id作为第一行,当所述第一矩阵的某行所表示的所述诊断病例ID或所述关键字的集合Id具有所述第一矩阵的某列所表示的所述诊断病例共享库属性时,将所述第一矩阵的该行列的值标记为1,否则标记为0;
关系集合建立步骤,根据所述第一矩阵,建立关系集合,所述关系集合为诊断病例共享库属性-诊断病例的关系集合,在所述关系集合建立步骤中,通过以下方式建立所述关系集合:每个诊断病例共享库属性的所述关系集合包含所有在所述第一矩阵中该诊断病例共享库属性所对应的列标记为1的所述诊断病例ID或所述关键字的集合Id;
第二矩阵建立步骤,根据所述关系集合,建立第二矩阵,所述第二矩阵为诊断病例-诊断病例的二维矩阵,在所述第二矩阵建立步骤中,通过以下方式建立所述第二矩阵:将所述诊断病例ID以及所述关键字的集合Id作为行名以及列名,且将所述关键字的集合Id作为第一行以及第一列,将每个诊断病例共享库属性的所述关系集合中的不同所述诊断病例ID的两两组合的个数,或是所述诊断病例ID与所述关键字的集合Id的组合的个数作为相应的行列的值,并且在所述第二矩阵中将行与列代表相同所述诊断病例ID或者均代表所述关键字的集合Id的值标记为0;
关联度计算步骤,根据所述第二矩阵以及所述关系集合,计算每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性的关联度;以及
诊断病例推荐步骤,根据所述关联度,对所述诊断病例ID进行排序,并按照排列顺序推荐所述诊断病例ID。
6.如权利要求5所述的方法,其特征在于,
在所述诊断病例检索步骤中,通过以下方式对所述诊断病例共享库进行检索:
将所述关键字的个数设为N,N为大于或等于1的正整数,
当所述关键字为一个,即N=1时,检索出所有包含所述关键字的诊断病例;
当所述关键字为多个,即N≥2时,检索出所有至少包含N-1个所述关键字的诊断病例。
7.如权利要求5或6所述的方法,其特征在于,
在所述关联度计算步骤中,通过以下方式计算所述关联度:
每个诊断病例ID与诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性Xa的关联度D(IDj,Xa)为
j为正整数,j=1,2,3…,Xa为诊断病例共享库属性中的所述关键字以外的所述诊断病例共享库属性,IDa为在所述关系集合中,属性Xa的集合中的诊断病例,为在所述第二矩阵中第IDj行与第IDa列的诊断病例的相似度,其中,通过以下公式进行计算,
Cu,v为在所述第二矩阵中第u行与第v列的诊断病例的相似度,Zuv为所述第二矩阵中第u行第v列的值,P为第u行的总的个数,P’为第v列的总的个数,K和K’为正整数,Zuk为所述第二矩阵中第u行第K列的值,ZK′v为所述第二矩阵中第K'行第v列的值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710425078.1A CN109002449B (zh) | 2017-06-06 | 2017-06-06 | 一种基于疾病相关属性检索诊断病例的装置及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710425078.1A CN109002449B (zh) | 2017-06-06 | 2017-06-06 | 一种基于疾病相关属性检索诊断病例的装置及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109002449A CN109002449A (zh) | 2018-12-14 |
CN109002449B true CN109002449B (zh) | 2023-04-07 |
Family
ID=64572857
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710425078.1A Active CN109002449B (zh) | 2017-06-06 | 2017-06-06 | 一种基于疾病相关属性检索诊断病例的装置及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109002449B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111599482A (zh) * | 2020-05-14 | 2020-08-28 | 青岛海信医疗设备股份有限公司 | 电子病例推荐方法和服务器 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116707A (zh) * | 2013-03-04 | 2013-05-22 | 北京工业大学 | 一种基于案例推理的心脏病智能诊断方法 |
CN104915561A (zh) * | 2015-06-11 | 2015-09-16 | 万达信息股份有限公司 | 疾病特征智能匹配方法 |
CN106227880A (zh) * | 2016-08-01 | 2016-12-14 | 挂号网(杭州)科技有限公司 | 医生搜索推荐的实现方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102985924A (zh) * | 2011-02-14 | 2013-03-20 | 松下电器产业株式会社 | 相似病例检索装置以及相似病例检索方法 |
CN104572675B (zh) * | 2013-10-16 | 2018-03-30 | 中国人民解放军南京军区南京总医院 | 一种相似病历检索的系统及方法 |
CN106776606A (zh) * | 2015-11-20 | 2017-05-31 | 株式会社日立制作所 | 基于电子病历数据库的检索装置和检索方法 |
CN105893597B (zh) * | 2016-04-20 | 2022-05-31 | 上海家好科技有限公司 | 一种相似病历检索方法及系统 |
-
2017
- 2017-06-06 CN CN201710425078.1A patent/CN109002449B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116707A (zh) * | 2013-03-04 | 2013-05-22 | 北京工业大学 | 一种基于案例推理的心脏病智能诊断方法 |
CN104915561A (zh) * | 2015-06-11 | 2015-09-16 | 万达信息股份有限公司 | 疾病特征智能匹配方法 |
CN106227880A (zh) * | 2016-08-01 | 2016-12-14 | 挂号网(杭州)科技有限公司 | 医生搜索推荐的实现方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109002449A (zh) | 2018-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9600533B2 (en) | Matching and recommending relevant videos and media to individual search engine results | |
US9558263B2 (en) | Identifying and displaying relationships between candidate answers | |
CN103678576B (zh) | 基于动态语义分析的全文检索系统 | |
US8527506B2 (en) | Media discovery and playlist generation | |
US7987191B2 (en) | System and method for generating a relationship network | |
KR101361182B1 (ko) | 태그를 분석하여 관련 문서를 찾기 위한 시스템 및 방법 | |
US20080215565A1 (en) | Searching heterogeneous interrelated entities | |
US20120191745A1 (en) | Synthesized Suggestions for Web-Search Queries | |
CN104484380A (zh) | 个性化搜索方法及装置 | |
WO2008055120A2 (en) | System and method for summarizing search results | |
CN111091883B (zh) | 一种医疗文本处理方法、装置、存储介质及设备 | |
Quattrone et al. | Effective retrieval of resources in folksonomies using a new tag similarity measure | |
Sarwar et al. | Term relevance feedback for contextual named entity retrieval | |
CN109002449B (zh) | 一种基于疾病相关属性检索诊断病例的装置及方法 | |
CN113127736A (zh) | 一种基于搜索历史记录的分类推荐方法及装置 | |
Canale et al. | From teaching books to educational videos and vice versa: a cross-media content retrieval experience | |
CN109002442B (zh) | 一种基于医生相关属性检索诊断病例的装置及方法 | |
JP2005128961A (ja) | データベース検索装置、データベース検索方法およびプログラム | |
Ali et al. | Entity attribute ranking using learning to rank. | |
JP5411802B2 (ja) | 代表語抽出装置、代表語抽出方法および代表語抽出プログラム | |
Kern et al. | Model selection strategies for author disambiguation | |
JP2009003731A (ja) | 特許検索システム | |
JP2017049836A (ja) | 検索支援装置、検索支援プログラムおよび記憶媒体 | |
Sheth et al. | IMPACT SCORE ESTIMATION WITH PRIVACY PRESERVATION IN INFORMATION RETRIEVAL. | |
Yavlinsky | Behold: a content based image search engine for the World Wide Web |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |