相似病历查找方法及系统
技术领域
本发明涉及医疗信息化技术领域,更具体地,涉及一种相似病历查找方法及系统。
背景技术
随着医疗服务信息化的发展,患者的病历也逐渐电子化,可以对电子病历进行数据挖掘,进一步开发病历的价值。在临床一线,当医生为病人看病时,从其他病历中检索出相似病历作为诊断和治疗的参考,很有实用意义。
现有技术中,查找相似病历的方法主要有两种,第一种是利用NLP对病历文本的更精确解析,力求找到更相似的病历,即强调文本层面相似。第二种是在年龄、既往病史等层面先检索出相似患者,之后利用NLP查找出相似患者的相似病历,相比第一种,其特色在于多考虑了一些信息。
前述现有的相似病历查找方法过于单一,特别是对于有漫长病程、需多次就诊的慢性病,检索出来的病历相似度不够准确,临床参考价值不高。
发明内容
本发明实施例提供一种克服上述问题或者至少部分地解决上述问题的相似病历查找。
第一方面,本发明实施例提供一种相似病历查找方法,包括:基于目标患者的当前病历,确定所述目标患者的目标病历序列,其中,所述目标病历序列用于表征所述目标患者患当前诊断名的疾病的病程;基于所述当前病历的当前诊断名,确定其他患者的候选病历,所述候选病历为其他患者的具有所述当前诊断名的任一病历;基于所述候选病历,确定候选病历序列,其中,所述候选病历序列用于表征其他患者患所述当前诊断名的疾病的病程;基于所述目标病历序列和所述候选病历序列,确定所述当前病历的相似病历。
在一些实施例中,所述基于所述目标病历序列和所述候选病历序列,确定所述当前病历的相似病历,包括:将所述候选病历序列中的各个子序列与所述目标病历序列进行时序匹配,获得时序相似子序列,其中每个所述候选病历序列至多具有一个所述时序相似子序列;将所述时序相似子序列与所述目标病历序列进行病程匹配,获得病程接近病历集;从所述病程接近病历集中,确定所述当前病历的相似病历。
在一些实施例中,所述目标病历序列和所述候选病历序列均按各自的病历时间排列;所述将所述候选病历序列中的各个子序列与所述目标病历序列进行时序匹配,获得时序相似子序列,包括:基于所述目标病历序列,确定对应的目标病历时间序列,基于所述候选病历序列,确定对应的候选病历时间序列;确定所述候选病历时间序列的任一子序列与所述目标病历时间序列的时序偏差度;基于各个所述任一子序列的时序偏差度,确定每个所述候选病历时间序列的候选时序相似子序列;将所述候选时序相似子序列的时序偏差度与预设的偏差度阈值比较,确定所述时序相似子序列。
在一些实施例中,所述时序偏差度基于所述任一子序列与所述目标病历时间序列之间的元素数量差以及元素之间的时间差确定。
在一些实施例中,所述将所述时序相似子序列与所述目标病历序列进行病程匹配,获得病程接近病历集,包括:确定各个所述时序相似子序列与所述目标病历序列的病程接近度;基于各个所述时序相似子序列对应的所述病程接近度与预设的接近度阈值的比较,确定所述病程接近病历集。
在一些实施例中,获取所述时序相似子序列以及所述目标病历序列的就诊周期特征、症状交替特征和症状出现次序特征;基于所述就诊周期特征、所述症状交替特征和所述症状出现次序特征,确定所述病程接近度。
在一些实施例中,所述基于目标患者的当前病历,确定所述目标患者的目标病历序列,包括:基于所述当前诊断名,获取所述目标患者的目标历史病历,所述目标历史病历具有所述当前诊断名或所述当前诊断名的上位诊断名;基于所述当前病历和所述目标历史病历,确定所述目标病历序列;所述基于所述候选病历,确定候选病历序列,包括:基于所述当前诊断名,获取所述候选病历对应患者的具有所述当前诊断名或所述当前诊断名的上位诊断名的其他病历;基于所述候选病历和所述其他病历,确定对应患者的所述候选病历序列。
第二方面,本发明实施例提供一种相似病历查找系统,包括:目标病历序列获取单元,用于基于目标患者的当前病历,确定所述目标患者的目标病历序列,其中,所述目标病历序列用于表征所述目标患者患当前诊断名的疾病的病程;候选病历获取单元,用于基于所述当前病历的当前诊断名,确定其他患者的候选病历,所述候选病历为其他患者的具有所述当前诊断名的任一病历;候选病历序列获取单元,用于基于所述候选病历,确定候选病历序列,其中,所述候选病历序列用于表征其他患者患所述当前诊断名的疾病的病程;相似病历获取单元,用于基于所述目标病历序列和所述候选病历序列,确定所述当前病历的相似病历。
第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面中任一种可能的实现方案所提供的相似病历查找方法的步骤。
第四方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现第一方面中任一种可能的实现方案所提供的相似病历查找方法的步骤。
本发明实施例提供的相似病历查找方法、相似病历查找系统、电子设备以及非暂态计算机可读存储介质,通过引入序列的思想,将患者整体发病情况串联起来,构建目标病历序列和候选病历序列,基于目标病历序列和所述候选病历序列来确定当前病历的相似病历,能够使得查找出来的相似病历与当前病历的病程非常接近,匹配精准,临床参考价值高。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的相似病历查找方法的流程图;
图2为本发明实施例的相似病历查找方法中确定相似病历的方法的流程图;
图3为本发明实施例的相似病历查找方法中获得时序相似子序列的方法的流程图;
图4为本发明实施例的相似病历查找方法中获得病程接近病历集的流程图;
图5为本发明实施例的相似病历查找系统的结构示意图;
图6为本发明实施例的电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
下面结合图1-图4描述本发明实施例的相似病历查找方法。
如图1所示,本发明实施例的相似病历查找方法包括步骤S100-S400。
步骤S100:基于目标患者的当前病历,确定目标患者的目标病历序列,其中,目标病历序列用于表征目标患者患当前诊断名的疾病的病程。
可以理解的是,病历用于医护人员记载病人的病情数据,每份病历至少由患者标识、诊断名以及病历内容构成,目标患者在就医时,呈现在医务人员面前的是目标患者的当前病历。目标病历序列由目标患者的多份诊断名和当前诊断名对应的病历组合而成,用于表征目标患者患当前诊断名的疾病的病程,其中病程表示患者所患疾病的发展过程。
将目标患者的当前病历记作:{Patient0,Diagnose0,Med0,last},其中,Patient0表示目标患者,Diagnose0表示当前诊断名,Med0,last表示当前病历内容,将Med0,last的下标设置为last是因为当前患者在此次就诊之前可能已有多份病历的诊断名与当前诊断名一致,从而使得当前病历是最后一份。
在此基础上,从目标患者在当前就诊之前的所有病历中,找出那些诊断名和当前诊断名一样的病历,与当前病历一起,按照时间先后顺序排列,组合成目标病历序列,根据上述表述规则,将目标病历序列记作:
{Patient0,Diagnose0,SEQ<Med0,1,Med0,2,...,Med0,last>},
其中Med0,n表示目标患者的第n次病历内容。
例如:张三因身体不适到医院就诊,医生诊断其为支气管炎,则其当前病历记作:{张三,支气管炎,当前病历内容},将其病历序列记作:
{张三,支气管炎,SEQ<第1次病历内容,第2次病历内容,...,当前病历内容>}。
步骤S200:基于当前病历的当前诊断名,确定其他患者的候选病历,候选病历为其他患者的具有当前诊断名的任一病历。
可以理解的是,从病历数据库中的其他患者病历中,查找到那些诊断名与当前病历的当前诊断名相同的病历,将这些病历作为候选病历。
步骤S300:基于候选病历,确定候选病历序列,其中,候选病历序列用于表征其他患者患当前诊断名的疾病的病程。
可以理解的是,候选病历序列由其他患者的多个诊断名和当前诊断名对应的病历组合而成,用于表征其他患者患当前诊断名的疾病的病程。按照类似做法,将同一患者的候选病历按照时间先后顺序排列构成候选病历序列,将候选病历序列记作:
{Patientk,Diagnose0,SEQ<Medk,1,Medk,2,...,Medk,LAST>},
其中,Patientk表示某位其他患者,Medk,n表示某位其他患者的第n次病历内容。
例如:在病历数据库中找到支气管炎患者,发现李四和王五均为支气管炎患者,将其诊断名为支气管炎的所有病历调取出来。
相应地,李四的病历序列记作:
{李四,支气管炎,SEQ<第1次病历内容,第2次病历内容,...,第n次病历内容>};
王五的病历序列记作:
{王五,支气管炎,SEQ<第1次病历内容,第2次病历内容,...,第n次病历内容>}。
步骤S400:基于目标病历序列和候选病历序列,确定当前病历的相似病历。
需要说明的是,通过候选病历序列和目标病历序列的比较,来得出当前病历的相似病历。在这种比较方式中,并非只利用当前病历这种单独一份病历来查找相似病历,而是以序列为比较的基础,这是因为以周期漫长的慢性病为例的许多疾病,其病情严重度、病情复杂度、发病机理等很难通过单份病历反映,但整个病历序列就包含了这方面丰富信息。从病历数据库中查找出与患者就医的当前病历相似的病历,来作为诊断和治疗的参考。
值得一提的是,现有技术中查找相似病历的方法主要有两种:
第一种是利用NLP对病历文本的更精确解析,力求找到更相似的病历,即强调文本层面相似。然而这种方法只局限于文本层面,丢失了很多深层次的信息,只是一种肤浅、表面的相似。
第二种是在年龄、既往病史等层面先检索出相似患者,之后利用NLP查找出相似患者的相似病历,相比第一种,其特色在于多考虑了一些信息,针对急性病,该方法已很有效,而针对慢性病,该方法只考虑这些信息是不够的,两份病历不仅要患者和文本相似,还需要病程相似,才有临床参考价值。
前述现有的相似病历查找方法过于单一,特别是对于有漫长病程、需多次就诊的慢性病,检索出来的病历相似度不够准确,临床参考价值不高。发明实施例提供的相似病历查找方法引入序列的思想,通过病历的时序排列来精准地表达出疾病的病程规律,能够清晰地反映病人的发病机理,这种采用病历序列作为参考信息基本单位的方式能够克服现有技术参考信息单一刻板的缺陷。
在采用序列作为基本单位的思路下,将患者整体发病情况串联起来,构建目标病历序列和候选病历序列,基于目标病历序列和所述候选病历序列来确定当前病历的相似病历,能够使得查找出来的相似病历与当前病历的病程非常接近,匹配精准,临床参考价值高。
在一些实施例中,上述步骤S100:基于目标患者的当前病历,确定目标患者的目标病历序列,包括:基于当前诊断名,获取目标患者的目标历史病历,目标历史病历具有当前诊断名或当前诊断名的上位诊断名;基于当前病历和目标历史病历,确定目标病历序列;
可以理解的是,考虑实际诊断过程中诊断粒度有粗有细的情况,在确定目标患者的目标病历序列时,根据疾病的诊断粒度粗细情况,将历史病历中诊断名为当前诊断名或当前诊断名的上位诊断名的病历均纳入病历序列当中。
需要说明的是,这里所说诊断名A是诊断名B的“上位”,是指B可以视为A的某一种具体诊断的疾病类型。比如,“喘息性支气管炎”当然是“支气管炎”的某一个具体种类。
上述步骤S200:基于当前病历的当前诊断名,确定其他患者的候选病历,候选病历为其他患者的具有当前诊断名的任一病历。
可以理解的是,从病历数据库中的其他患者病历中,查找到那些诊断名与当前病历的当前诊断名相同的病历,将这些病历作为候选病历,便于进一步构建与目标病历序列对应的候选病历序列。
上述步骤S300:基于候选病历,确定候选病历序列,包括:基于当前诊断名,获取候选病历对应患者的具有当前诊断名或当前诊断名的上位诊断名的其他病历;基于候选病历和其他病历,确定对应患者的候选病历序列。
可以理解的是,考虑实际诊断过程中诊断粒度有粗有细的情况,在确定其他患者的候选病历序列时,根据疾病的诊断粒度粗细情况,将历史病历中诊断名为当前诊断名或当前诊断名的上位诊断名的病历均纳入病历序列当中。
例如:某患者的按时间先后的病历序列,可节选表示为:
<支气管炎,支气管炎,支气管炎,喘息性支气管炎,喘息性支气管炎>,
该患者当前诊断名为喘息性支气管炎,而支气管炎是喘息性支气管炎的上位诊断,由于医学诊断有一个过程,发生在前的支气管炎的病历也应当纳入考虑,因此将该患者支气管炎的历史病历加入到病历序列当中。
本发明实施例通过将目标患者和其他的历史病历中,诊断名为当前诊断名或当前诊断名的上位诊断名的病历均纳入病历序列当中,再进行序列匹配确定相似病历,能够实现候选病历基数更多,匹配到的相似病历与当前病历的病情更加贴合,具有更高的参考价值。
在一些实施例中,如图2所示,上述步骤S400、基于目标病历序列和候选病历序列,确定当前病历的相似病历,包括步骤S410-S430。
步骤S410:将候选病历序列中的各个子序列与目标病历序列进行时序匹配,获得时序相似子序列,其中每个候选病历序列至多具有一个时序相似子序列。
可以理解的是,以慢性病为例的许多疾病是一个医学过程,目标患者Patient0正处在这一医学过程某个时点上,在大多数情况下,患者不会无缘无故去医院看病,就诊时间是疾病在体内发展这一医学过程的重要体现,因此需要提取候选序列的子序列:
SEQ<Medk,1,Medk,2,...,Medk,TARGET>,
其中,Medk,n表示某位其他患者的第n次病历内容,TARGET为时序相似子序列包含的元素个数。
对候选病历序列的子序列,按照其中元素的时间顺序,与目标病历序列进行匹配,得出时序相似子序列,使得时序相似子序列的末份病历与当前病历在病程上最接近。
步骤S420:将时序相似子序列与目标病历序列进行病程匹配,获得病程接近病历集。
需要说明的是,在已经获得时序相似子序列的基础上,进一步根据与目标病历序列的病程接近的程度来缩小相似病历的范围,病程接近的程度是将时序相似子序列与目标病历序列进行病程匹配计算出来的,根据病程接近的程度来确定病程接近病历集。
步骤S430:从病程接近病历集中,确定当前病历的相似病历。
需要说明的是,在步骤S420已经获得病程接近病历集基础上,基于症状等维度计算病程接近病历集中任一病历与当前病历的相似度,根据相似度的数值大小来得到相似病历。例如,确定相似度的方法可以是,比较两份病历的症状词的余弦相似度来作为相似度,本实施例不作具体限制。
本发明实施例通过先进行时序匹配,时序操作方便简单,计算量小,在时序匹配结束后再进行病程匹配,最后基于症状等维度得到相似病历,参考信息范围更广,匹配过程更精确,获得到的相似病历能给目标患者的疾病治疗更高的参考价值。
在一些实施例中,目标病历序列和候选病历序列均按各自的病历时间排列,如图3所示,步骤S410:将候选病历序列中的各个子序列与目标病历序列进行时序匹配,获得时序相似子序列,其中每个候选病历序列至多具有一个时序相似子序列,包括步骤S411-S414。
步骤S411:基于目标病历序列,确定对应的目标病历时间序列,基于候选病历序列,确定对应的候选病历时间序列。
可以理解的是,将目标病历序列的首个病历置为第0天即d0,后续每个病历按与首个病历的日期差值来标号,形成目标病历时间序列。与此同时,将候选病历序列的首个病历置为第0天即d0,后续每个病历按与首个病历的日期差值来标号,形成候选病历时间序列。
步骤S412:确定候选病历时间序列的任一子序列与目标病历时间序列的时序偏差度。
可以理解的是,候选病历的子序列是将候选病历时间序列中的某一份病历作为其末份病历,将在这份病历前的所有病历,与这份病历一起按照时间顺序排列形成的。每一份候选病历时间序列可以得到多个子序列,将这些子序列中的每一个都与目标病历时间序列进行时序偏差度比较。
可选的,时序偏差度基于任一子序列与目标病历时间序列之间的元素数量差以及元素之间的时间差确定。
可以理解的是,对于某位患者Patientk,选用任一子序列的所有元素来与目标病历时间序列中的元素做匹配,从而得到任一子序列的时序偏差度,其任一子序列的时序偏差度记作:
时序偏差度=|元素数量差|+∑每对匹配的元素|时间差|,
其中,元素数量差是指,参与匹配的两个序列元素个数的差值;时间差是指,两个序列匹配后,匹配的每一对元素的时间差值。该公式对元素数量差和时间差均取其绝对值。
需要说明的是,这种元素匹配是按照元素顺序从前往后的,不可跳跃过任何一份病历。这是因为:每份病历都代表着疾病在体内的发展,每份病历都具有实际意义。在进行元素匹配时允许“一对多”和“多对一”,但禁止“交叉”,元素匹配的“一对多”“多对一”是指,序列元素3同时匹配另一序列的元素6、元素7、元素8;“交叉”是指不按照元素顺序从前往后匹配,即序列元素3匹配另一序列的元素8,序列元素4匹配另一序列的元素5。这是因为“交叉”显然违背了疾病发展是一个过程的基本思想。
步骤S413:基于各个任一子序列的时序偏差度,确定每个候选病历时间序列的候选时序相似子序列。
可以理解的是,步骤S412中计算出了各个任一子序列的时序偏差度,目的就是为了根据时序偏差度的大小,来确定每个候选病历时间序列的候选时序相似子序列。
步骤S414:将候选时序相似子序列的时序偏差度与预设的偏差度阈值比较,确定时序相似子序列。
可以理解的是,事先预设一个偏差度阈值,将上述计算出的各个任一子序列的时序偏差度与偏差度阈值进行比较,将那些时序偏差度小于或等于偏差度阈值的时序子序列作为时序相似子序列。
例如:在疾病诊断为当前诊断名Diagnose0时,目标患者Patient0的病历时间序列为<d0,d2,d10,d16,d23>,某位其他患者Patientk的病历时间序列为<d0,d2,d10,d15,d16,d22,d26,d33,d42>。此时应选取Patientk的前6个病历构成子序列,即TARGET=6为最佳匹配策略。此时两个时间序列的对应关系是:d0匹配d0;d2匹配d2;d10匹配d10;d16匹配d15和d16;d23匹配d22。
在该对应关系下,∑每对匹配的元素|时间差|为2、元素个数差为1,时序偏差度达到最小。而假设采用硬匹配,即精确一一对应,即d16对应d15、d23对应d16,显然偏差较大,而其余动态方案例如d23再额外对应一个d26,相比上述最佳匹配策略,显然也有更大偏差。
本发明实施例通过基于时间顺序构建候选病历时间序列,将其子序列与目标病历序列进行病程匹配计算出偏差度,从而确定时序相似子序列,能够实现匹配过程更符合医学规律,查找到的相似病历与当前病历相似度更高。
在一些实施例中,如图4所示,上述步骤420:将时序相似子序列与目标病历序列进行病程匹配,获得病程接近病历集,包括步骤S421-S422。
步骤S421:确定各个时序相似子序列与目标病历序列的病程接近度。
可以理解的是,在已经获得时序相似子序列的基础上,进一步根据与目标病历序列的病程接近度来缩小相似病历的范围。
可选的,获取时序相似子序列以及目标病历序列的就诊周期特征、症状交替特征和症状出现次序特征;基于就诊周期特征、症状交替特征和症状出现次序特征,确定病程接近度。
可以理解的是,时序相似子序列与目标病历序列的病程接近度的病程接近度,可由下述公式衡量:
sim病程接近度=δ*sim就诊周期特征+θ*sim症状交替特征+μ*sim症状出现次序特征,
其中,δ、θ、μ为根据一定业务规则设定的各项的权重。
需要说明的是,sim就诊周期特征、sim症状交替特征以及sim症状出现次序特征均为具有临床参考意义的数值特征,具体展开论述:
sim就诊周期特征的医学涵义是:病人不会无缘无故去就诊,一定有内在原因,可能是执行医生评估“病情严重度”后的医嘱,也可能是自己感觉不舒服,时间间隔分布往往是病情驱动的,就诊周期特征可以表征病情。例如,同样被诊断为高血压,轻度的患者可能每季度复查一次,重度的患者可能半个月就要复查一次,一般来说,在其它条件都相同时,就诊周期越短,病情越严重。
这种就诊周期特征与上述步骤S412中计算得出的时序偏差度表达的意义相似,因此可以采用该时序偏差度的相反数来表示就诊周期特征,记作:sim就诊周期特征=-时序偏差度。
sim症状交替特征的医学涵义是:症状交替特征可反映病情的复杂程度,因为,对于同一疾病,其在某些患者身上表现复杂,部分症状交替出现或消失,例如疾病在药物剂量加重时消失,一旦药物剂量减轻就恢复;而在另一些患者身上则表现平稳。不同患者的症状交替特征不相同,具有临床意义。
将sim症状交替特征表示为:
其中,S0∩k表示目标病历序列与时序相似子序列共同包含的症状词集合;N表示S0∩k的元素个数;last表示目标病历序列中元素的个数;TARGET表示时序相似子序列中元素的个数;alter(s,Patient0)表示目标病历序列症状s发生交替的频次;alter(s,Patientk)表示时序相似子序列症状s发生交替的频次。
需要说明的是,“症状s发生交替”是指,在序列的相邻两次病历中,症状s的状态发生变化,“症状s的状态”是指,s在该病历中是否出现且为阳性,若是,则为“出现”,否则为“未出现”,症状为“阳性”是指,该症状不是否定含义,例如,病历内容为“患者咳嗽、无发热”,症状词咳嗽即为阳性、症状词发热为阴性。
sim症状出现次序特征的医学涵义是:症状出现次序在某种意义上反映的发病机理。例如,目标患者Patient0被诊断为糖尿病,某患者先出现高血压相关症状,后出现糖尿病相关症状,是I型糖尿病;另一患者先有糖尿病相关症状后有高血压相关症状,是II型糖尿病。
将sim症状出现次序特征表示为:
其中,S0∩k表示目标病历序列与时序相似子序列共同包含的症状词集合;N表示S0∩k的元素个数;order(si,sj,Patient0)是指,在目标患者Patient0的目标病历序列里,记si首次出现是在第ni个病历中、sj首次出现是在第nj个病历中,则:
值得一提的是,上述公式中“si<sj”的大小比较,可采用任意比较方法,例如拼音比较。
步骤S422:基于各个时序相似子序列对应的病程接近度与预设的接近度阈值的比较,确定病程接近病历集。
可以理解的是,预设一个接近度阈值,将各个时序相似子序列对应的病程接近度与这个接近度阈值进行比较,当其sim病程接近度≥threshold病程接近度时,认定为达标,将达标的时序相似子序列的最后一个病历组成病程接近病历集。
本发明实施例在计算病程之前,已经通过时序匹配淘汰了许多匹配程度不高的病历,这种先进行简单的时序匹配运算,再进行病程接近度运算的处理顺序,使得算力分配均匀合理,节省运算时间。进一步以病程为核心参考信息,通过基于就诊周期特征、症状交替特征和症状出现次序特征所确定的病程接近度确定相似病历能够实现参考信息更多元,查找过程更精准,得到的相似病历与当前病历情况更符合。下面对本发明实施例提供的相似病历查找系统进行描述,下文描述的相似病历查找系统与上文描述的相似病历查找方法可相互对应参照。
如图5所示,该相似病历查找系统包括目标病历序列获取单元510、候选病历获取单元520、候选病历序列获取单元530以及相似病历获取单元540。
目标病历序列获取单元510,用于基于目标患者的当前病历,确定所述目标患者的目标病历序列,其中,所述目标病历序列用于表征所述目标患者患当前诊断名的疾病的病程。
候选病历获取单元520,用于基于所述当前病历的当前诊断名,确定其他患者的候选病历,所述候选病历为其他患者的具有所述当前诊断名的任一病历。
候选病历序列获取单元530,用于基于所述候选病历,确定候选病历序列,其中,所述候选病历序列用于表征其他患者患所述当前诊断名的疾病的病程。
相似病历获取单元540,用于基于所述目标病历序列和所述候选病历序列,确定所述当前病历的相似病历。
本发明实施例提供的相似病历查找系统用于执行上述相似病历查找方法,其具体的实施方式与方法的实施方式一致,此处不再赘述。
本发明实施例提供的相似病历查找系统通过目标病历序列510获取单元获取目标病历序列,候选病历获取单元530获取候选病历序列,相似病历获取单元540基于目标病历序列和所述候选病历序列来确定当前病历的相似病历,能够使得查找出来的相似病历与当前病历的病程非常接近,匹配精准,临床参考价值高。
图6示例了一种电子设备的实体结构示意图,如图6所示,该电子设备可以包括:处理器(processor)610、通信接口(Communications Interface)620、存储器(memory)630和通信总线640,其中,处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信。处理器610可以调用存储器630中的逻辑指令,以执行相似病历查找方法,该方法包括:基于目标患者的当前病历,确定目标患者的目标病历序列,其中,目标病历序列用于表征目标患者患当前诊断名的疾病的病程;基于当前病历的当前诊断名,确定其他患者的候选病历,候选病历为其他患者的具有当前诊断名的任一病历;基于候选病历,确定候选病历序列,其中,候选病历序列用于表征其他患者患当前诊断名的疾病的病程;基于目标病历序列和候选病历序列,确定当前病历的相似病历。
需要说明的是,本实施例中的电子设备在具体实现时可以为服务器,也可以为PC机,还可以为其他设备,只要其结构中包括如图6所示的处理器610、通信接口620、存储器630和通信总线640,其中处理器610,通信接口620,存储器630通过通信总线640完成相互间的通信,且处理器610可以调用存储器630中的逻辑指令以执行上述方法即可。本实施例不对电子设备的具体实现形式进行限定。
此外,上述的存储器630中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
进一步地,本发明实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的相似病历查找方法,该方法包括:基于目标患者的当前病历,确定目标患者的目标病历序列,其中,目标病历序列用于表征目标患者患当前诊断名的疾病的病程;基于当前病历的当前诊断名,确定其他患者的候选病历,候选病历为其他患者的具有当前诊断名的任一病历;基于候选病历,确定候选病历序列,其中,候选病历序列用于表征其他患者患当前诊断名的疾病的病程;基于目标病历序列和候选病历序列,确定当前病历的相似病历。
另一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的相似病历查找方法,该方法包括:基于目标患者的当前病历,确定目标患者的目标病历序列,其中,目标病历序列用于表征目标患者患当前诊断名的疾病的病程;基于当前病历的当前诊断名,确定其他患者的候选病历,候选病历为其他患者的具有当前诊断名的任一病历;基于候选病历,确定候选病历序列,其中,候选病历序列用于表征其他患者患当前诊断名的疾病的病程;基于目标病历序列和候选病历序列,确定当前病历的相似病历。
以上所描述的系统或装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。