具体实施方式
本申请实施例技术方案适用于识别相互之间能够提供医疗救治参考的相似患者的应用场景。采用本申请实施例技术方案,能够对不同患者的相关信息进行全面的对比,从而确定不同患者之间是否具有医学特征上的相似性。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
参见图1所示,本申请实施例提出的患者对比方法,包括:
S101、分别获取第一患者与第二患者的基本信息和就诊信息。
其中,上述的基本信息,主要包括医学上的基本信息,例如性别、年龄、家族遗传史等。
上述的就诊信息,至少包括患目标疾病时的就诊医院信息。该目标疾病,是第一患者和第二患者均患有或曾经患有的相同疾病。该目标疾病,并不限于是某一种疾病,其可以是第一患者与第二患者均患有或曾经患有的任意的一种或多种相同疾病。
当该目标疾病表示多种疾病时,本申请实施例分别获取第一患者与第二患者患每一种目标疾病时的就诊信息。
第一患者与第二患者患目标疾病时的就诊医院信息,至少包括第一患者与第二患者患目标疾病时,就诊的医院的等级、前往就诊的不同医院的数量等。
其中,上述的治疗医院的等级,按照常规的医院等级划分,例如一级丙等、一级乙等、一级甲等、二级丙等、二级乙等、二级甲等、三级丙等、三级乙等、三级甲等、特级等。
上述的第一患者与第二患者的基本信息和就诊信息,可以通过一定时间段内的第一患者与第二患者的病历而确定。
按照上述方法从第一患者和第二患者的历史病历中筛选出患目标疾病时的同一次发病治疗过程的病历序列,然后通过识别该病历序列中的医院信息,可以确定第一患者患目标疾病时的就诊医院信息,以及第二患者患目标疾病时的就诊医院信息。
基于上述处理,如果第一患者与第二患者在这一年内曾患过相同疾病,则可以分别确定第一患者与第二患者的基本信息,以及第一患者与第二患者患该相同疾病时的就诊医院信息。
S102、至少根据所述第一患者与所述第二患者的基本信息和就诊信息,识别所述第一患者和所述第二患者是否为相似患者。
第一患者与第二患者的就诊信息,分别表示了第一患者与第二患者在患相同的疾病时,所就诊的医院的信息,其中包含了患者就诊医院等级、就诊过程中的转诊情况等。
示例性的,将第一患者与第二患者在患相同疾病时的就诊医院信息,按照就诊时间先后顺序进行排序,可以确定第一患者与第二患者在患相同疾病时的治疗周期的长短,在治疗周期内先后就诊的医院的等级,或者在不同等级的医院间转诊的情况等。
可以理解,通过患者治疗周期的长短、就诊时的医院的等级,以及在不同等级的医院间的转诊情况,能够反映患者的患病严重程度、就诊习惯等特点。
通过将第一患者与第二患者的基本信息与就诊信息进行对比,可以判断第一患者与第二患者是否为医学上的相似患者。可以理解,如果第一患者与第二患者的基本信息相似,而且当第一患者与第二患者患相同的目标疾病时的就诊信息相似,例如就诊的医院等级、就诊周期、转诊情况等相似,则可以说明,第一患者与第二患者是相似患者,至少当患有目标疾病时,第一患者与第二患者是相似患者。
上述的“相似”,可以通过判断相似度是否超过设定的相似度阈值来确定。
作为示例性的实现方式,本申请实施例根据第一患者与第二患者的基本信息和就诊信息,分别确定第一患者与第二患者的基本信息相似度和就诊信息相似度。
然后,根据第一患者与第二患者的基本信息相似度和就诊信息相似度,判断第一患者和第二患者是否为相似患者。
例如,假设第一患者用A表示,第二患者用B表示,将第一患者A的基本信息构建成向量,得到第一患者A的基本信息向量,将第二患者B的基本信息构建成向量,得到第二患者B的基本信息向量。计算第一患者A的基本信息向量与第二患者B的基本信息向量的余弦相似度,可以得到第一患者A与第二患者B的基本信息相似度Sim基本信息(A,B)。
对于第一患者A患目标疾病时的就诊医院信息,以及第二患者B患目标疾病时的就诊医院信息,分别按照实现先后顺序进行排序得到每次发病过程的就诊医院序列。通过比较第一患者A的就诊医院序列与第二患者B的就诊医院序列的相似度,可以得到第一患者A和第二患者B患目标疾病时的就诊信息的相似度Sim就诊信息(A,B)。当第一患者A和第二患者B患多种相同疾病时,第一患者A与第二患者B患目标疾病时的就诊信息的相似度,通过将第一患者A与第二患者B患每种相同疾病时的就诊信息相似度进行加权求和得到。
当分别确定第一患者A和第二患者B的基本信息相似度和就诊信息相似度后,将第一患者A和第二患者B的基本信息相似度和就诊信息相似度进行加权求和,即可得到第一患者A与第二患者B的相似度。
当第一患者A与第二患者B的相似度不小于预设的患者相似度阈值时,确定第一患者A与第二患者B为相似患者,否则确定第一患者A与第二患者B不是相似患者。
通过上述介绍可见,本申请实施例将第一患者与第二患者的基本信息,以及第一患者与第二患者患目标疾病时的就诊医院信息,共同用于判断第一患者与第二患者是否为相似患者。
通过对比第一患者与第二患者的基本信息以及患目标疾病时的就诊医院信息,能够判断第一患者与第二患者的基本信息是否相似,以及判断第一患者与第二患者在患相同的疾病时的治疗过程是否相似,两方面相结合,能够确定第一患者与第二患者是否为医学上的相似患者,尤其是可以确定第一患者与第二患者是否为针对目标疾病的相似患者。
上述的患者对比处理过程参考了患者的基本信息以及患者患病时的就诊信息,实现了全面对比患者的医学相关信息,从而能够保证对比的全面性,以及保证相似患者识别的准确性。
作为可选的实现方式,本申请实施例提出的患者对比方法,在分别获取第一患者与第二患者的基本信息和就诊信息的同时,还分别获取第一患者与第二患者的身体健康状况信息。
上述的身体健康状况信息,是指能够表示患者在设定的历史时间段内的身体健康状况的信息。
示例性的,可以通过患者在设定的历史时间段内的患病记录、体检记录等信息,确定患者的身体健康状况。也可以通过调查问卷的方式,获取患者的身体健康状况信息。
在患者的身体健康状况信息中,可以只包含某些身体部位或器官的健康状况信息,也可以包含患者所有身体部位的健康状况信息。
在分别获取第一患者与第二患者的身体健康状况信息的情况下,当识别第一患者与第二患者是否为相似患者时,具体是根据第一患者与第二患者的基本信息、身体健康状况信息和就诊信息,识别第一患者和第二患者是否为针对所述目标疾病的相似患者。
示例性的,首先,根据第一患者与第二患者的基本信息、身体健康状况信息和就诊信息,分别确定第一患者与第二患者的基本信息相似度、身体健康状况相似度和就诊信息相似度。
具体的,分别将第一患者A与第二患者B的基本信息、身体健康状况信息和就诊信息进行对应比较,可以分别确定第一患者A与第二患者B的基本信息相似度Sim基本信息(A,B)、身体健康状况相似度Sim身体健康状况(A,B)和就诊信息相似度Sim就诊信息(A,B)。
然后,根据第一患者与第二患者的基本信息相似度、身体健康状况相似度和就诊信息相似度,判断第一患者和第二患者是否为相似患者。
示例性的,将第一患者A与第二患者B的基本信息相似度Sim基本信息(A,B)、身体健康状况相似度Sim身体健康状况(A,B)和就诊信息相似度Sim就诊信息(A,B)进行加权求和处理,得到第一患者A与第二患者B的相似度Sim(A,B):
Sim(A,B)=αSim基本信息(A,B)+βSim身体健康状况(A,B)+γSim就诊信息(A,B)
作为一种示例性的实现方式,上述的分别获取第一患者与第二患者的身体健康状况信息,可以通过汇总第一患者和第二患者的身体机能异常情况,分别获取第一患者与第二患者的身体健康状况信息。
示例性的,上述的身体机能异常,具体是指身体某些器官或部位发生病患的情况。本申请实施例利用患者的身体机能异常情况,来表示患者身体健康状况信息。
可选的,上述的第一患者和第二患者的身体机能异常情况,可以通过问卷调查,或者通过汇总第一患者与第二患者的一定历史时间段内的体检记录、病历记录等相关信息的方式获取。
作为另一种可选的实现方式,本申请实施例通过汇总第一患者和第二患者的身体机能异常情况,分别确定所述第一患者与所述第二患者的身体健康状况信息时,其具体处理内容包括:
首先,将各个科室名称进行排列得到科室名称序列。
在本申请实施例中,上述的各个科室名称,是指三级甲等医院所划分设置的所有科室的名称,各个科室之间没有业务重叠。
本申请实施例将上述的各个科室名称按照拼音顺序进行排列,得到科室名称序列。假设共有M个科室,则该科室名称序列为M维的序列。
然后,根据第一患者和第二患者在所述科室名称序列中的每个科室名称对应的科室就诊的次数,确定所述第一患者的就诊科室分布向量,以及所述第二患者的就诊科室分布向量。
具体的,对应于上述的科室名称序列中的每个科室名称,分别统计第一患者与第二患者在设定的历史时间段内,在该科室名称对应的科室就诊的次数,由此可以分别得到第一患者与第二患者在设定的历史时间段内,在每个科室就诊的次数。
例如,第一患者A在每个科室deptj就诊的次数为medicalnumA,j,第二患者B在每个科室deptj就诊的次数为medicalnumB,j,其中,j=1,2,...,M。
在此基础上,分别计算第一患者与第二患者在每个科室就诊的频率,该频率由在每个科室就诊的次数,与在所有科室就诊的总次数的比值表示。
即,第一患者A在每个科室就诊的频率为第二患者B在每个科室就诊的频率为/>
上述的第一患者与第二患者在设定的历史时间段内,在每个科室就诊的次数,可以通过统计第一患者与第二患者在设定的历史时间段内,在每个科室就诊的病历的数量来确定。
利用第一患者A在上述的科室名称序列中的每个科室名称对应的科室就诊的频率ratioA,j,构建第一患者A的就诊科室分布向量以及,利用第二患者B在上述的科室名称序列中的每个科室名称对应的科室就诊的频率ratioB,j,构建第二患者B的就诊科室分布向量/>
可以理解,患者去医院的某些科室就诊的情况,能够反映患者的某些身体器官或部位发生病患的情况,这些情况能够用于反映患者的身体健康状况。因此,本申请实施例利用上述的就诊科室分布向量,表示患者的身体健康状况,也就是将经过上述处理得到的第一患者的就诊科室分布向量,作为第一患者的身体健康状况信息的向量表示,将经过上述处理得到的第二患者的就诊科室分布向量,作为第二患者的身体健康状况信息的向量表示。
基于上述处理,当计算第一患者与第二患者的身体健康状况相似度时,直接计算第一患者的就诊科室分布向量与第二患者的就诊科室分布向量的相似度即可。
例如,第一患者A与第二患者B的身体健康状况相似度为:
另一方面,在本申请实施例所提出的患者对比方法中,当根据第一患者与第二患者的就诊信息,确定第一患者与第二患者的就诊信息相似度时,具体通过如下步骤SS10~SS11实现:
SS10、根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息,分别确定所述第一患者与所述第二患者患目标疾病时的病情严重程度。
通常情况下,当患者患目标疾病时,如果整个发病治疗过程中,始终在同一家医院救治,直至康复出院,或者,该患者只在较低等级的医院就诊,或者就诊的医院数量较少,则可以说明该患者的病情较稳定,医治比较容易,也就可以说明该患者的病情不太严重;相反,如果患者患目标疾病时,就诊的医院数量较多,或者发生过转诊情况,尤其是发生过向更高级别的医院转诊的情况,或者是该患者在多家高等级的医院转诊救治,则可以说明该患者医治难度较大,该患者的病情较严重。
由此可见,通过患者在患目标疾病时的发病治疗过程中就诊的医院的信息,可以确定患者在该发病治疗过程中的救治过程,从而可以反映患者的病情严重程度。
例如,可以通过第一患者与第二患者患目标疾病时的发病治疗过程中就诊的医院数量、医院等级等,来推测第一患者与第二患者患目标疾病的严重程度。
作为优选的实现方式,本申请实施例通过第一患者与第二患者患目标疾病时的发病治疗过程中的就诊医院信息,确定第一患者与第二患者在发病治疗过程中的转诊情况,然后根据第一患者与第二患者的转诊情况,判断第一患者与第二患者患目标疾病时的病情严重程度。
当患者就诊过程中发生过由低等级医院向高等级医院转诊的情况时,认为患者的病情更严重;当第一患者与第二患者均发生过转诊时,就诊的医院等级越高,则病情更严重;同等级的医院中就诊医院数量越多,则患者的病情越严重。
按照上述规则,可以根据第一患者与第二患者患目标疾病时的就诊医院信息,确定第一患者与第二患者患目标疾病时的病情严重程度。
SS11、至少根据所述第一患者与所述第二患者患目标疾病时的病情严重程度相似度,确定所述第一患者与所述第二患者的就诊信息相似度。
具体的,通过计算第一患者与第二患者患目标疾病时的病情严重程度的差值,即可确定两者的病情严重程度相似度。同时,第一患者与第二患者的病情严重程度相似度,即可作为第一患者与第二患者的就诊信息相似度。
示例性的,假设第一患者A患目标疾病d时的病情严重程度为Serious(d,A),第二患者B患目标疾病d时的病情严重程度为Serious(d,B),则第一患者A与第二患者B患目标疾病d时的病情严重程度相似度为:
Sim病情严重程度(d,A,B)=1-|Serious(d,A)-Serious(d,B)|
则第一患者A与第二患者B患目标疾病时的就诊信息相似度为:
Sim就诊信息(d,A,B)=Sim病情严重程度(d,A,B)
作为一种示例性的实现方式,上述的步骤SS10、根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息,分别确定所述第一患者与所述第二患者患目标疾病时的病情严重程度的具体处理内容,可参见如下步骤SS20~SS21:
SS20、根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息,分别确定所述第一患者与所述第二患者患目标疾病时的就诊医院的等级,和就诊的不同医院的数量。
具体的,根据第一患者与第二患者患目标疾病时各个病程的病历上记录的医院信息,可以分别确定第一患者与第二患者患目标疾病时,各个病程的就诊医院的等级、和各个等级的就诊医院数量。例如,第一患者在患目标疾病时的病程m中,在2家二级甲等医院,以及2家三级甲等医院就诊;第二患者在患目标疾病时的病程m中,只在3家二级乙等医院就诊等。
上述的病程,是指患者发病治疗的过程,一个病程,表示一次发病治疗的过程。
上述的第一患者与第二患者患目标疾病时的就诊医院信息,需要根据第一患者与第二患者在患目标疾病时的各次发病治疗过程中的病历序列而确定。
示例性的,分别将第一患者与第二患者的设定历史时间段内的所有病历按照时间先后顺序进行排序,该序列中的对应目标疾病的病历构成的子序列如果满足如下条件,则认为是患目标疾病时的同一次发病治疗过程的病历序列:
(a)任意两份病历的诊断名称相同,或者虽然诊断名称不同,但是病历中的症状词高度相似;
(b)任意相邻的两份病历之间的时间间隔不超过预设的时长阈值;
(c)不存在另一个病历序列是当前病历序列的超集,即不存在另一个病历序列包含当前病历序列的所有病历并且还有其他病历。
按照上述规则,可以确定第一患者与第二患者在患目标疾病的各个病程的就诊医院信息。
SS21、根据所述第一患者与所述第二患者患目标疾病时的就诊医院的等级,和就诊的不同医院的数量,分别确定所述第一患者患目标疾病时的病情严重程度,以及所述第二患者患目标疾病时的病情严重程度。
如前文所述,患者患目标疾病进行治疗时,就诊的医院的等级的高低、就诊的不同医院的数量的多少,可以直接反应患者病情的严重程度。
作为优选的实现方式,本申请实施例对第一患者A和第二患者B在患目标疾病d的各个病程m内是否发生向上级医院转诊的情况,来确定第一患者A与第二患者B患目标疾病d时的病情严重程度。
可以合理推测,患者在同一次发病的治疗过程中,如果向上级医院转诊,通常不是无缘无故发生的。基于我国现行医保报销制度,从报销医疗费角度而言,患者不会随意向上级医院转诊,因为这可能导致报销比例降低甚至无法报销。
因此,患者向上级医院转诊,极有可能是患者自发的向上级医院转诊,从医疗费报销等自身利益考量,此时很可能是患者认为自身病情较重或对当前治疗方案极不满意。无论如何,在同一次发病的治疗过程中,患者如果有向上级医院转诊行为,可以合理推测当前级别医院无法治疗该患者,因此可以推断患者病情较严重。因此,根据患者就诊过程中是否发生向上级医院转诊行为,可以合理推断患者病情严重程度。
示例性的,如果第一患者A和/或第二患者B患目标疾病d进行治疗时发生向上级医院转诊的情况,则根据第一患者A和/或第二患者B就诊的最高医院等级,以及就诊的最高等级的不同医院数量,确定第一患者A和/或第二患者B患目标疾病d时的病情严重程度。
例如,假设第一患者A在患目标疾病d的某一次发病过程中,比如在病程m中,发生过向上级医院转诊的行为,则第一患者A在患目标疾病d的病程m中的病情严重程度为:
其中,ifelse(存在向上转诊,score向上转诊(m),NULL)表示如果存在向上级医院转诊行为,则第一患者A在患目标疾病d的病程m中的病情严重程度为score向上转诊(m),否则为空。
score向上转诊(m)=σ×病程m中最高医院等级+τ×病程m中最高医院等级的不同医院数量其中,σ和τ为运算系数,其取值可以根据经验或需求而灵活设定。
同理,假设第二患者B在患目标疾病d的某一次发病过程中,发生过上上级医院转诊的行为,则也可以通过上述方式计算确定第二患者B在患目标疾病d的病程m中的病情严重程度为:
在此基础上,第一患者A和第二患者B在患目标疾病d时的病情严重程度,可以用第一患者A和第二患者B在患目标疾病d的各个病情严重程度非空的病程的病情严重程度的平均值来表示,即:
第一患者A患目标疾病d时的病情严重程度:
Serious(d,A)=average(非NULL的Serious(d,A,m))
第二患者B患目标疾病d时的病情严重程度:
Serious(d,B)=average(非NULL的Serious(d,B,m))
另一方面,如果第一患者A和/或第二患者B患目标疾病进行治疗时未发生向上级医院转诊的情况,则根据第一患者A和/或第二患者B就诊的医院级别,以及就诊的不同医院的数量,确定第一患者A和/或第二患者B患目标疾病时的病情严重程度。
具体的,如果第一患者A或者第二患者B在患目标疾病d时,在所有病程的就诊过程中,均没有发生过向上级医院转诊的情况,则可以利用第一患者A或第二患者B所有病程就诊的医院等级的平均值,来表示第一患者A或第二患者B的病情严重程度,或者,也可以通过第一患者A或第二患者B在患目标疾病d时的就诊医院数量、就诊时长等进行拟合计算,将计算结果作为第一患者A或第二患者B患目标疾病d时的病情严重程度。
进一步的,本申请实施例还提出,上述的就诊信息中,还包括患目标疾病时的就诊病历信息。
示例性的,该就诊病历信息,即为患者患目标疾病后进行治疗过程中,在各医院就诊时产生的病历。
基于上述的就诊病历信息,当根据第一患者与第二患者的就诊信息,确定第一患者与第二患者的就诊相似度时,除了确定第一患者与第二患者患目标疾病时的病情严重程度外,还根据第一患者与第二患者患目标疾病时的就诊医院信息和就诊病历信息,分别确定第一患者与第二患者患目标疾病时的发病特征。
上述的发病特征,是指表示病情演化过程或病情发展状况的特征。示例性的,第一患者与第二患者患目标疾病时的发病特征,可以用第一患者与第二患者患目标疾病后的治疗时间长短、治疗期内是否出现反复、治疗过程是否以康复期收尾等信息表示。
本申请实施例通过对第一患者A与第二患者B患目标疾病d时的病历信息进行汇总,从中识别第一患者A患目标疾病d时的发病特征,以及第二患者B患目标疾病d时的发病特征。
示例性的,本申请实施例以康复期频繁程度,以及周期性重发情况,作为患者患目标疾病d的发病特征。
其中,康复期频繁程度,是指患者患目标疾病d进行治疗的各个病程中,存在康复期的病程的占比。上述的周期性重发情况,是指患者患目标疾病d后,是否发生周期性重发现象的情况。
根据第一患者A与第二患者B患目标疾病d时的就诊病历信息,分别确定第一患者A与第二患者B患目标疾病d时的康复期频繁程度。
具体的,通过第一患者A与第二患者B患目标疾病d时的就诊病历,可以确定第一患者A与第二患者B患目标疾病d的各个病程是否包含康复期,进而可以确定包含康复期的病程的数量,以及可以确定患目标疾病d时的康复期频繁程度。
上述的康复期的识别,可以示例性的通过病历记载,以及治疗用药、治疗项目等来识别治疗是否属于康复治疗,从而确定患者治疗阶段是否处于康复期。
同时,根据第一患者A与第二患者B患目标疾病d时的就诊医院信息,分别确定第一患者A与第二患者B患目标疾病d时的周期性重发情况。
示例性的,如果第一患者A或第二患者B在患目标疾病d时,在任意多个(通常取3个以上)病程中去医院就诊的情况相似或相同,例如就诊医院相同,则可以认为这多个病程是目标疾病d周期性重发的病程,也就是第一患者A或第二患者B在患目标疾病d时,存在周期性重发的情况。
本申请将患目标疾病时的康复期频繁程度和周期性重发情况,共同作为患者患目标疾病时的发病特征。
即,将第一患者A患目标疾病d时的康复期频繁程度和周期性重发情况,作为第一患者A患目标疾病d时的发病特征;将第二患者B患目标疾病d时的康复期频繁程度和周期性重发情况,作为第一患者B患目标疾病d时的发病特征。
进而,当确定第一患者与第二患者的就诊信息相似度时,至少根据第一患者A与第二患者B患目标疾病时的病情严重程度相似度,以及发病特征相似度,确定第一患者A与第二患者B的就诊信息相似度。
示例性的,第一患者A与第二患者B的发病特征相似度为:
Sim发病特征(d,A,B)=θ×Sim康复期频繁程度(d,A,B)+μ×Sim周期性重发情况(d,A,B)
其中,
Sim康复期频繁程度(d,A,B)=1-|ConvalescenceRatio(d,A)-ConvalescenceRatio(d,B)|
ConvalescenceRatio(d,A)与ConvalescenceRatio(d,B)分别表示第一患者A和第二患者B患目标疾病d时的康复期频繁程度。
Sim周期性重发情况(d,A,B)=ifelse(A与B在d上均有或均无周期性重发,1,0)
即,如果第一患者A和第二患者B在患目标疾病d时,均有周期性重发情况或者均没有周期性重发情况,则两者的周期性重发情况的相似度为1,否则为0。
上述的病情严重程度相似度Sim病情严重程度(d,A,B),可以参照上述实施例而确定。
此时,第一患者A与第二患者B患目标疾病d时的就诊信息相似度为:
其中,和δ为系数。
作为一种可选的实现方式,上述的根据第一患者A与第二患者B患目标疾病时的就诊病历信息,分别确定第一患者A与第二患者B患目标疾病时的康复期频繁程度,具体可以通过如下步骤SS30~SS31实现:
SS30、根据所述第一患者与所述第二患者患目标疾病时的每个病程的就诊病历信息,分别确定所述第一患者与所述第二患者患目标疾病时的每个病程是否存在康复期。
在临床上,康复期通常是指,患者在较高等级的医院治疗后,在较低等级医院做长期的维持性治疗,此时,在较低等级医院的长期维持性治疗,即为康复期。
可以理解,在一个病程内,可以通过该病程内的就诊病历,确定是否存在如上述的长期维持性治疗,即可判断在该病程内是否存在康复期。
按照上述方案,本申请实施例根据第一患者A与第二患者B患目标疾病d时的每个病程的就诊病历信息,分别确定第一患者A与第二患者B患目标疾病d时的每个病程是否存在康复期。
示例性的,如果第一患者A和第二患者B患目标疾病d时的某一个病程中的病历满足如下条件,则认为在该病程存在康复期:
(a)该病程末尾m个病历来自于同一等级医院;
(b)该病程末尾m个病历之前紧邻着一个或多个来自更高等级医院的病历;
(c)上述m占该病程总病历数量的比例超过预设阈值。
按照上述规则,可以分别判断第一患者A和第二患者B患目标疾病d的每个病程中,是否包含康复期。
SS31、根据所述第一患者与所述第二患者患目标疾病时的存在康复期的病程的数量,以及总的病程数量,分别确定所述第一患者与所述第二患者患目标疾病时的康复期频繁程度。
患者患目标疾病d时的存在康复期的病程的数量,在所有病程中所占的比例,即为患者患目标疾病d时的康复期频繁程度。
例如,第一患者A患目标疾病d的全体病程中的单个病程用i表示,则病程i∈A患疾病d的全体病程。
那么,第一患者A患目标疾病d时的康复期频繁程度ConvalescenceRatio(d,A)为:
其中,∑病程i∈A患疾病d的全体病程ifelse(i存在康复期,1,0)表示将存在康复期的病程累加,其值等于存在康复期的病程数量;∑病程i∈A患疾病d的全体病程1表示将患目标疾病d的病程累加,其值等于患目标疾病d的全体病程的数量。
同理,第二患者B患目标疾病d时的康复期频繁程度ConvalescenceRatio(d,B),也可以参照上述方式计算得到。
作为一种可算的实现方式,上述的根据第一患者A与第二患者B患目标疾病时的就诊医院信息,分别确定第一患者A与第二患者B患目标疾病时的周期性重发情况,具体可以通过如下步骤SS40~SS41实现:
SS40、根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息,分别确定所述第一患者与所述第二患者在患目标疾病时的每个病程内的就诊医院序列。
示例性的,本申请实施例将不同的医院等级,分别用数字表示,例如一级丙等、乙等、甲等分别表示为1、2、3,二级丙等、乙等、甲等分别表示为4、5、6,三级丙等、乙等、甲等以及特等分别表示为7、8、9、10。
则将患者患目标疾病d时的每个病程内就诊的医院按照时间先后顺序进行排列,即可得到在该病程内的就诊医院序列。
例如,假设某患者患目标疾病d的某个病程中,先到一级乙等医院就诊四次,之后又到三级丙等医院就诊两次,则该患者在该病程内的就诊医院序列为[2,2,2,2,7,7]。
按照上述处理,通过对第一患者A和第二患者B患目标疾病d的各个病程的就诊医院信息进行汇总、排序,即可分别确定第一患者A和第二患者B患目标疾病d的各个病程的就诊医院序列。
SS41、根据所述第一患者与所述第二患者在患目标疾病时的每个病程内的就诊医院序列,分别确定所述第一患者与所述第二患者患目标疾病时是否存在周期性重发情况。
示例性的,本申请实施例设定,在患者患目标疾病d的全部病程中,如果存在至少N个病程各自“可鉴别”,并且彼此的就诊医院序列高度相似,则认为该患者在患目标疾病d时存在周期性重发的情况。
其中,上述的“可鉴别”,是指病程内的病历数量大于设定的病历数量阈值,并且在病程内存在不同级别医院的病历。
上述的N,取3以上的数值,以避免2个病程偶然相似的情况,被认为是周期性重发情况。
按照上述规则,从第一患者A患目标疾病d时的各个病程的就诊医院序列中,筛选“可鉴别”并且就诊医院序列相似的病程,如果筛选出的病程数量至少有N个,则确认第一患者A患目标疾病d时存在周期性重发情况。
同理,可以判断第二患者B患目标疾病d时是否存在周期性重发情况。
其中,上述的就诊医院序列的相似度的计算,可以通过常用的序列相似度算法,例如Dynamic-Time-Warping(动态时间调整)等实现。
更进一步的,本申请实施例提出,在根据第一患者与第二患者的就诊信息,确定第一患者与第二患者的就诊信息相似度时,除了确定第一患者与第二患者患目标疾病时的病情严重程度,以及分别确定第一患者与第二患者患目标疾病时的发病特征之外,还包括:
根据第一患者与第二患者患目标疾病时的就诊医院信息,分别确定第一患者与第二患者患目标疾病时的就诊习惯。
示例性的,本申请实施例从是否对特定级别、特定医院有较强偏好的角度出发,来确定患者的就诊习惯。
从业务涵义上说,针对同一疾病,例如“感冒”,某些患者习惯于在社区医院就诊、另一些患者则习惯于到三级医院就诊,这是对特定级别的偏好。同时,某些患者总是在某一家医院就诊,可能是出于离家较近等原因;某些患者则经常更换不同医院,可能是出于对诊疗水平不放心等考虑,这是对特定医院的偏好。
患者患病就诊时对医院级别的偏好,以及对单个医院的偏好,反映了患者的患病时的就诊习惯。
本申请实施例根据第一患者A和第二患者B患目标疾病d时的就诊医院信息,分别确定第一患者A与第二患者B患目标疾病d时的就诊习惯。
本申请实施例按照如下公式计算第一患者A患目标疾病d时对医院级别的偏好:
prefer(d,A)=ifelse(在H级医院病历最多且H级医院病历占比≥Threshold级别偏好,H,null)
上述公式的含义是,如果A患目标疾病d的各个病程中,在H级医院就诊的病历数量最多,并且在H级医院就诊的病历数量占比不小于预设的级别偏好阈值,则确定A患目标疾病d时,偏好去H级医院就诊;否则,判断结果为空,即患者对于H等级的医院没有偏好。
其中,上述公式中的H,为不同医院等级的数字表示。例如一级丙等、乙等、甲等分别表示为1、2、3,二级丙等、乙等、甲等分别表示为4、5、6,三级丙等、乙等、甲等以及特等分别表示为7、8、9、10。
按照上述公式,可以计算确定第一患者A在患目标疾病d时对医院级别的偏好。同理,可以计算确定第二患者B在患目标疾病d时对医院级别的偏好。
本申请实施例按照如下公式,确定第一患者A患目标疾病d时,是否对某个医院有偏好:
contentrate(d,A)=ifelse(最常就诊医院的病历占比≥Threshold单医院偏好,TRUE,FALSE)
上述公式的含义是,如果第一患者A患目标疾病d的各个病程中,在就诊次数最多的医院就诊的病历的占比不小于预设的单医院偏好判断阈值,则认为第一患者A患目标疾病d时,对于某个医院有偏好;否则认为第一患者A患目标疾病时,对任意医院均没有偏好。
同理,按照上述处理,可以确定第二患者B在患目标疾病d时,是否对某个医院有偏好。
根据第一患者A与第二患者B在患目标疾病d时的医院等级偏好,以及是否对某个医院有偏好,即可分别确定第一患者A和第二患者B患目标疾病d时的就诊习惯。
基于上述的第一患者A与第二患者B患目标疾病d时的病情严重程度、发病特征以及就诊习惯,当确定第一患者A与第二患者B的就诊信息相似度时,具体包括:
根据第一患者A与第二患者B患目标疾病d的病情严重程度相似度Sim病情严重程度(d,A,B)、发病特征相似度Sim发病特征(d,A,B),以及就诊习惯相似度Sim就诊习惯(d,A,B),确定所述第二患者与所述第二患者的就诊相似度。
其中,上述的病情严重程度相似度Sim病情严重程度(d,A,B),以及上述的发病特征相似度Sim发病特征(d,A,B),均可以参照上述实施例介绍而获取。
上述的就诊习惯相似度Sim就诊习惯(d,A,B),可以按照如下公式确定:
其中,
则,第一患者A与第二患者B患目标疾病d时的就诊信息相似度为:
需要说明的是,上述的Sim就诊习惯(d,A,B),只是表示第一患者A与第二患者B患目标疾病d时的就诊信息相似度,而在实际情况中,第一患者A和第二患者B可能并不是只共同患过一种疾病,本申请实施例则意在泛化地考察第一患者A和第二患者B在患相同疾病时的就诊信息相似度,因此,参照上述计算第一患者A与第二患者B患目标疾病d时的就诊信息相似度,本申请实施例对于第一患者A和第二患者B患每一种相同疾病时的就诊信息相似度进行加权求和,作为第一患者A和第二患者B患相同疾病时的就诊信息相似度。
示例性的,
其中,Sim就诊信息(d,A,B)可参照上述实施例介绍得到;
weight(d)表示第一患者A和第二患者B患疾病d的就诊信息相似度的权重,
其中,Serious(d,p)表示患者p患疾病d的病情严重程度,其取值可参照上述实施例中的Serious(d,A)的计算方法确定。
参照上述各实施例的介绍,当第一患者A与第二患者B的基本信息相似度、身体健康状况相似度以及就诊信息相似度分别确定时,第一患者A与第二患者B的相似度Sim(A,B)为:
Sim(A,B)=αSim基本信息(A,B)+βSim身体健康状况(A,B)+γSim就诊信息(A,B)
示例性的,本申请实施例预先设置患者相似度阈值Threshold患者相似度,当Sim(A,B)≥Threshold患者相似度时,认为第一患者A和第二患者B为相似患者;否则认为第一患者A与第二患者B不是相似患者。
可以理解,本申请实施例从患者的基本信息、身体健康状况、患相同疾病时的病情严重程度、发病特征以及就诊习惯等多方面,对患者进行综合对比,从而判断患者是否相似。该处理过程实现了患者相关医学信息的全面对比,使得相似患者的识别更全面、更准确。应用本申请实施例技术方案,能够在从海量的患者数据中,筛选出严格相似的患者,从而利于实现高效的数据分析和应用。
与上述的患者对比方法相对应的,本申请另一实施例还提出一种患者对比装置,参见图2所示,该装置包括:
信息获取单元100,用于分别获取第一患者与第二患者的基本信息和就诊信息,其中,所述就诊信息,至少包括患目标疾病时的就诊医院信息;
对比处理单元110,用于至少根据所述第一患者与所述第二患者的基本信息和就诊信息,识别所述第一患者和所述第二患者是否为相似患者。
上述的患者对比装置,将第一患者与第二患者的基本信息,以及第一患者与第二患者患目标疾病时的就诊医院信息,共同用于判断第一患者与第二患者是否为相似患者。
通过对比第一患者与第二患者的基本信息以及患目标疾病时的就诊医院信息,能够判断第一患者与第二患者的基本信息是否相似,以及判断第一患者与第二患者在患相同的疾病时的治疗过程是否相似,两方面相结合,能够确定第一患者与第二患者是否为医学上的相似患者,尤其是可以确定第一患者与第二患者是否为针对目标疾病的相似患者。
上述的患者对比处理过程参考了患者的基本信息以及患者患病时的就诊信息,实现了全面对比患者的医学相关信息,从而能够保证对比的全面性,以及保证相似患者识别的准确性。
作为可选的实现方式,所述至少根据所述第一患者与所述第二患者的基本信息和就诊信息,识别所述第一患者和所述第二患者是否为相似患者,包括:
至少根据所述第一患者与所述第二患者的基本信息和就诊信息,分别确定所述第一患者与所述第二患者的基本信息相似度和就诊信息相似度;
至少根据所述第一患者与所述第二患者的基本信息相似度和就诊信息相似度,判断所述第一患者和所述第二患者是否为相似患者。
作为可选的实现方式,所述信息获取单元100还用于:
分别获取第一患者与第二患者的身体健康状况信息;
所述至少根据所述第一患者与所述第二患者的基本信息和就诊信息,识别所述第一患者和所述第二患者是否为针对所述目标疾病的相似患者,包括:
根据所述第一患者与所述第二患者的基本信息、身体健康状况信息和就诊信息,识别所述第一患者和所述第二患者是否为针对所述目标疾病的相似患者。
作为可选的实现方式,所述分别获取第一患者与第二患者的身体健康状况信息,包括:
通过汇总第一患者和第二患者的身体机能异常情况,分别确定所述第一患者与所述第二患者的身体健康状况信息。
作为可选的实现方式,所述通过汇总第一患者和第二患者的身体机能异常情况,分别确定所述第一患者与所述第二患者的身体健康状况信息,包括:
将各个科室名称进行排列得到科室名称序列;
根据第一患者和第二患者在所述科室名称序列中的每个科室名称对应的科室就诊的次数,确定所述第一患者的就诊科室分布向量,以及所述第二患者的就诊科室分布向量;
其中,所述就诊科室分布向量表示身体健康状况信息。
作为可选的实现方式,所述根据所述第一患者与所述第二患者的基本信息、身体健康状况信息和就诊信息,识别所述第一患者和所述第二患者是否为相似患者,包括:
根据所述第一患者与所述第二患者的基本信息、身体健康状况信息和就诊信息,分别确定所述第一患者与所述第二患者的基本信息相似度、身体健康状况相似度和就诊信息相似度;
根据所述第一患者与所述第二患者的基本信息相似度、身体健康状况相似度和就诊信息相似度,判断所述第一患者和所述第二患者是否为相似患者。
作为可选的实现方式,根据所述第一患者与所述第二患者的就诊信息,确定所述第一患者与所述第二患者的就诊信息相似度,包括:
根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息,分别确定所述第一患者与所述第二患者患目标疾病时的病情严重程度;
至少根据所述第一患者与所述第二患者患目标疾病时的病情严重程度相似度,确定所述第一患者与所述第二患者的就诊信息相似度。
作为可选的实现方式,所述根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息,分别确定所述第一患者与所述第二患者患目标疾病时的病情严重程度,包括:
根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息,分别确定所述第一患者与所述第二患者患目标疾病时的就诊医院的等级,和就诊的不同医院的数量;
根据所述第一患者与所述第二患者患目标疾病时的就诊医院的等级,和就诊的不同医院的数量,分别确定所述第一患者患目标疾病时的病情严重程度,以及所述第二患者患目标疾病时的病情严重程度。
作为可选的实现方式,根据所述第一患者与所述第二患者患目标疾病时的就诊医院的等级,和就诊的不同医院的数量,分别确定所述第一患者患目标疾病时的病情严重程度,以及所述第二患者患目标疾病时的病情严重程度,包括:
如果所述第一患者和/或所述第二患者患目标疾病进行治疗时发生向上级医院转诊的情况,则根据所述第一患者和/或所述第二患者就诊的最高医院等级,以及就诊的最高等级的不同医院数量,确定所述第一患者和/或所述第二患者患目标疾病时的病情严重程度;
如果所述第一患者和/或所述第二患者患目标疾病进行治疗时未发生向上级医院转诊的情况,则根据所述第一患者和/或所述第二患者就诊的医院等级,以及就诊的不同医院的数量,确定所述第一患者和/或所述第二患者患目标疾病时的病情严重程度。
作为可选的实现方式,所述就诊信息还包括患目标疾病时的就诊病历信息;
所述根据所述第一患者与所述第二患者的就诊信息,确定所述第一患者与所述第二患者的就诊信息相似度,还包括:
根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息和就诊病历信息,分别确定所述第一患者与所述第二患者患目标疾病时的发病特征;
所述至少根据所述第一患者与所述第二患者患目标疾病时的病情严重程度相似度,确定所述第一患者与所述第二患者的就诊信息相似度,包括:
至少根据所述第一患者与所述第二患者患目标疾病时的病情严重程度相似度,以及发病特征相似度,确定所述第一患者与所述第二患者的就诊信息相似度。
作为可选的实现方式,所述根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息和就诊病历信息,分别确定所述第一患者与所述第二患者患目标疾病时的发病特征,包括:
根据所述第一患者与所述第二患者患目标疾病时的就诊病历信息,分别确定所述第一患者与所述第二患者患目标疾病时的康复期频繁程度;其中,所述康复期频繁程度以各个病程中的、存在康复期的病程的占比表示;
根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息,分别确定所述第一患者与所述第二患者患目标疾病时的周期性重发情况;
根据所述第一患者与所述第二患者患目标疾病时的康复期频繁程度和周期性重发情况,分别确定所述第一患者与所述第二患者患目标疾病时的发病特征。
作为可选的实现方式,所述根据所述第一患者与所述第二患者患目标疾病时的就诊病历信息,分别确定所述第一患者与所述第二患者患目标疾病时的康复期频繁程度,包括:
根据所述第一患者与所述第二患者患目标疾病时的每个病程的就诊病历信息,分别确定所述第一患者与所述第二患者患目标疾病时的每个病程是否存在康复期;
根据所述第一患者与所述第二患者患目标疾病时的存在康复期的病程的数量,以及总的病程数量,分别确定所述第一患者与所述第二患者患目标疾病时的康复期频繁程度。
作为可选的实现方式,根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息,分别确定所述第一患者与所述第二患者患目标疾病时的周期性重发情况,包括:
根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息,分别确定所述第一患者与所述第二患者在患目标疾病时的每个病程内的就诊医院序列;
根据所述第一患者与所述第二患者在患目标疾病时的每个病程内的就诊医院序列,分别确定所述第一患者与所述第二患者患目标疾病时是否存在周期性重发情况。
作为可选的实现方式,所述根据所述第一患者与所述第二患者的就诊信息,确定所述第一患者与所述第二患者的就诊信息相似度,还包括:
根据所述第一患者与所述第二患者患目标疾病时的就诊医院信息,分别确定所述第一患者与所述第二患者患目标疾病时的就诊习惯;
所述至少根据所述第一患者与所述第二患者患目标疾病时的病情严重程度相似度,以及发病特征相似度,确定所述第一患者与所述第二患者的就诊信息相似度,包括:
根据所述第一患者与所述第二患者患目标疾病的病情严重程度相似度、发病特征相似度,以及就诊习惯相似度,确定所述第二患者与所述第二患者的就诊信息相似度。
具体的,上述的患者对比装置的各个单元的具体工作内容,请参见上述方法实施例中的相应内容,此处不再赘述。
本申请另一实施例还提出一种患者对比设备,参见图3所示,该设备包括:
存储器200和处理器210;
其中,所述存储器200与所述处理器210连接,用于存储程序;
所述处理器210,用于通过运行所述存储器200中存储的程序,实现上述任一实施例公开的患者对比方法。
具体的,上述目标检测结果的评测设备还可以包括:总线、通信接口220、输入设备230和输出设备240。
处理器210、存储器200、通信接口220、输入设备230和输出设备240通过总线相互连接。其中:
总线可包括一通路,在计算机系统各个部件之间传送信息。
处理器210可以是通用处理器,例如通用中央处理器(CPU)、微处理器等,也可以是特定应用集成电路(application-specific integrated circuit,ASIC),或一个或多个用于控制本发明方案程序执行的集成电路。还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。
处理器210可包括主处理器,还可包括基带芯片、调制解调器等。
存储器200中保存有执行本发明技术方案的程序,还可以保存有操作系统和其他关键业务。具体地,程序可以包括程序代码,程序代码包括计算机操作指令。更具体的,存储器200可以包括只读存储器(read-only memory,ROM)、可存储静态信息和指令的其他类型的静态存储设备、随机存取存储器(random access memory,RAM)、可存储信息和指令的其他类型的动态存储设备、磁盘存储器、flash等等。
输入设备230可包括接收用户输入的数据和信息的装置,例如键盘、鼠标、摄像头、扫描仪、光笔、语音输入装置、触摸屏、计步器或重力感应器等。
输出设备240可包括允许输出信息给用户的装置,例如显示屏、打印机、扬声器等。
通信接口220可包括使用任何收发器一类的装置,以便与其他设备或通信网络通信,如以太网,无线接入网(RAN),无线局域网(WLAN)等。
处理器2102执行存储器200中所存放的程序,以及调用其他设备,可用于实现本申请实施例所提供的患者对比方法的各个步骤。
本申请另一实施例还提供了一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时,实现上述任一实施例提供的患者对比方法的各个步骤。
上述的患者对比设备的各个部分的具体工作内容,以及上述的存储介质中的计算机程序被处理器运行时的具体处理内容,均可参见本申请上述方法实施例的内容,此处不再重复。
对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本申请各实施例方法中的步骤可以根据实际需要进行顺序调整、合并和删减,各实施例中记载的技术特征可以进行替换或者组合。
本申请各实施例中装置及终端中的模块和子模块可以根据实际需要进行合并、划分和删减。
本申请所提供的几个实施例中,应该理解到,所揭露的终端,装置和方法,可以通过其它的方式实现。例如,以上所描述的终端实施例仅仅是示意性的,例如,模块或子模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个子模块或模块可以结合或者可以集成到另一个模块,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块或子模块可以是或者也可以不是物理上分开的,作为模块或子模块的部件可以是或者也可以不是物理模块或子模块,即可以位于一个地方,或者也可以分布到多个网络模块或子模块上。可以根据实际的需要选择其中的部分或者全部模块或子模块来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能模块或子模块可以集成在一个处理模块中,也可以是各个模块或子模块单独物理存在,也可以两个或两个以上模块或子模块集成在一个模块中。上述集成的模块或子模块既可以采用硬件的形式实现,也可以采用软件功能模块或子模块的形式实现。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件单元,或者二者的结合来实施。软件单元可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其它实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。