CN112966787B - 相似患者的识别方法、装置、计算机设备和存储介质 - Google Patents
相似患者的识别方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN112966787B CN112966787B CN202110412544.9A CN202110412544A CN112966787B CN 112966787 B CN112966787 B CN 112966787B CN 202110412544 A CN202110412544 A CN 202110412544A CN 112966787 B CN112966787 B CN 112966787B
- Authority
- CN
- China
- Prior art keywords
- patient
- similarity
- vector
- basic information
- vectors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 239000013598 vector Substances 0.000 claims abstract description 421
- 230000004927 fusion Effects 0.000 claims abstract description 76
- 238000012545 processing Methods 0.000 claims abstract description 34
- 230000006399 behavior Effects 0.000 claims description 138
- 238000004364 calculation method Methods 0.000 claims description 91
- 238000012216 screening Methods 0.000 claims description 28
- 238000013136 deep learning model Methods 0.000 claims description 14
- 238000012163 sequencing technique Methods 0.000 claims description 14
- 238000012549 training Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 10
- 238000007499 fusion processing Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 26
- 230000006870 function Effects 0.000 description 9
- 238000007726 management method Methods 0.000 description 7
- 230000009471 action Effects 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000012544 monitoring process Methods 0.000 description 4
- 230000006978 adaptation Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000012550 audit Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000011976 chest X-ray Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000013475 authorization Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003862 health status Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Epidemiology (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及数字医疗领域,提供一种相似患者的识别方法、装置、计算机设备和存储介质,方法包括:获取患者基本信息,生成患者基本信息向量;计算指定患者基本信息向量与其他患者基本信息向量的第一相似度;获取患者行为信息,生成患者行为向量;计算指定患者行为向量与其他患者行为向量的第二相似度;对同一个患者的患者基本信息向量与患者行为向量进行融合处理,得到融合向量;计算指定融合向量与其他融合向量的第三相似度;计算指定患者与其他患者的综合相似度;基于综合相似度,从其他患者中筛选指定患者的相似患者。本申请能准确实现对患者的相似患者的识别处理。本申请还可以应用于区块链领域,上述综合相似度等数据可以存储于区块链上。
Description
技术领域
本申请涉及数字医疗技术领域,具体涉及一种相似患者的识别方法、装置、计算机设备和存储介质。
背景技术
如今,人工智能技术与医疗健康领域的融合不断加深。随着人工智能技术的逐渐成熟,人工智能的应用场景越发丰富,人工智能技术也逐渐成为影响医疗行业发展,提升医疗服务水平的重要因素。其中,基于医疗大数据分析的疾病诊疗是重要的应用场景之一。
在对当前患者进行疾病诊疗的过程中,如果能够获取到与当前患者相关的其他相似患者的诊疗数据,将有助于医生快速把握当前患者的病情并及时制定相应的治疗方案,从而实现更加高效的医疗救治。此时,如何准确地识别出与当前患者相关的其他相似患者,成为了实现更加高效的医疗救治的关键问题。
发明内容
本申请的主要目的为提供一种相似患者的识别方法、装置、计算机设备和存储介质,旨在解决现有的如何准确地识别出与当前患者相关的其他相似患者的技术问题。
本申请提出一种相似患者的识别方法,所述方法包括步骤:
获取所有患者的患者基本信息,并分别生成与各个所述患者基本信息对应的患者基本信息向量,其中,所述所有患者的人数数量大于2;
基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;其中,所述指定患者基本信息向量为所有所述患者基本信息向量中的任意一个向量,所述指定患者基本信息向量对应指定患者,所述其他患者基本信息向量为所有所述患者基本信息向量中除所述指定患者基本信息向量外的向量;
获取所述所有患者的患者行为信息,并分别生成与各个所述患者行为信息对应的患者行为向量;
基于预设的第二计算公式分别计算指定患者行为向量与其他患者行为向量之间的第二相似度;其中,所述指定患者行为向量对应所述指定患者,所述其他患者行为向量为所有所述患者行为向量中除所述指定患者行为向量外的向量;
对同一个患者的患者基本信息向量与患者行为向量进行融合处理,得到对应的融合向量;
基于预设的第三计算公式分别计算指定融合向量与其他融合向量之间的第三相似度;其中,所述指定融合向量对应所述指定患者,所述其他融合向量为所有所述融合向量中除所述指定融合向量外的向量;
基于所述第一相似度、第二相似度与所述第三相似度,调用预设的第四计算公式分别计算所述指定患者与其他患者之间的综合相似度;其中,所述其他患者为所述所有患者中除所述指定患者外的患者;
基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者。
可选地,所述基于所述第一相似度、第二相似度与所述第三相似度,调用预设的第四计算公式分别计算所述指定患者与其他患者之间的综合相似度的步骤,包括:
获取与各相似度分别对应的重要性系数;其中,所述相似度包括所述第一相似度、第二相似度与所述第三相似度;
基于所述重要性系数,生成与各所述相似度分别对应的权重值;
基于所述权重值,调用所述第四计算公式对各所述相似度进行加权求和处理,得到对应的第一求和值;
将所述第一求和值作为所述综合相似度。
可选地,所述基于所述重要性系数,生成与各所述相似度分别对应的权重值的步骤,包括:
对所有所述重要性系数进行求和处理,得到对应的第二求和值;其中,所述重要性系数包括与所述第一相似度对应的第一重要性系数、与所述第二相似度对应的第二重要性系数、与所述第三相似度对应的第三重要性系数;
计算第一重要性系数与所述第二求和值的第一商值,将所述第一商值作为与所述第一相似度对应的第一权重值;以及,
计算第二重要性系数与所述第二求和值的第二商值,将所述第二商值作为与所述第二相似度对应的第二权重值;以及,
计算第三重要性系数与所述第二求和值的第三商值,将所述第三商值作为与所述第三相似度对应的第三权重值。
可选地,所述基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度的步骤,包括:
基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;
其中,similarity表示所述第一相似度,A表示所述指定患者基本信息向量,B表示所述其他患者基本信息向量,Ai表示所述指定患者基本信息向量的第i个分向量,Bi表示所述其他患者基本信息向量的第i个分向量,n表示分向量的数量。
可选地,所述基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者的步骤,包括:
将所有所述综合相似度按照从大到小的顺序进行排序,得到对应的排序结果;
从所述排序结果中排在首位的综合相似度开始,依次筛选出指定数量的目标综合相似度;
获取与所述目标综合相似度对应的目标患者;
将所述目标患者作为与所述指定患者对应的所述相似患者。
可选地,所述获取所有患者的患者基本信息,并分别生成与各个所述患者基本信息对应的患者基本信息向量的步骤,包括:
获取所述患者基本信息;
将所述患者基本信息输入至预设的患者基本信息学习模型内;其中,所述患者基本信息学习模型为基于预先采集的样本数据对深度学习模型进行训练后生成的;
接收所述患者基本信息学习模型对所述患者基本信息进行向量表示处理后生成的输出向量数据;
将所述输出向量数据作为所述患者基本信息向量。
可选地,所述基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者的步骤之后,包括:
基于所述相似患者,生成与所述指定患者对应的相似患者识别报告;其中,所述相似患者识别报告的内容至少包括所述指定患者与所述相似患者;
获取当前时间,并判断所述当前时间是否处于预设时间范围内;
若所述当前时间处于预设时间范围内,则获取预设的邮件登录信息,以及获取与指定用户对应的指定邮件地址;
根据所述邮件登录信息登录至对应的邮件服务器;
通过所述邮件服务器将所述相似患者识别报告发送至所述指定邮件地址。
本申请还提供一种相似患者的识别装置,包括:
第一获取模块,用于获取所有患者的患者基本信息,并分别生成与各个所述患者基本信息对应的患者基本信息向量;其中,所述所有患者的人数数量大于2;
第一计算模块,用于基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;其中,所述指定患者基本信息向量为所有所述患者基本信息向量中的任意一个向量,所述指定患者基本信息向量对应指定患者,所述其他患者基本信息向量为所有所述患者基本信息向量中除所述指定患者基本信息向量外的向量;
第二获取模块,用于获取所述所有患者的患者行为信息,并分别生成与各个所述患者行为信息对应的患者行为向量;
第二计算模块,用于基于预设的第二计算公式分别计算指定患者行为向量与其他患者行为向量之间的第二相似度;其中,所述指定患者行为向量对应所述指定患者,所述其他患者行为向量为所有所述患者行为向量中除所述指定患者行为向量外的向量;
处理模块,用于对同一个患者的患者基本信息向量与患者行为向量进行融合处理,得到对应的融合向量;
第三计算模块,用于基于预设的第三计算公式分别计算指定融合向量与其他融合向量之间的第三相似度;其中,所述指定融合向量对应所述指定患者,所述其他融合向量为所有所述融合向量中除所述指定融合向量外的向量;
第四计算模块,用于基于所述第一相似度、第二相似度与所述第三相似度,调用预设的第四计算公式分别计算所述指定患者与其他患者之间的综合相似度;其中,所述其他患者为所述所有患者中除所述指定患者外的患者;
筛选模块,用于基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本申请中提供的相似患者的识别方法、装置、计算机设备和存储介质,具有以下有益效果:
本申请中提供的相似患者的识别方法、装置、计算机设备和存储介质,获取所有患者的患者基本信息,并分别生成与各个所述患者基本信息对应的患者基本信息向量;基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;获取所述所有患者的患者行为信息,并分别生成与各个所述患者行为信息对应的患者行为向量;基于预设的第二计算公式分别计算指定患者行为向量与其他患者行为向量之间的第二相似度;对同一个患者的患者基本信息向量与患者行为向量进行融合处理,得到对应的融合向量;基于预设的第三计算公式分别计算指定融合向量与其他融合向量之间的第三相似度;基于所述第一相似度、第二相似度与所述第三相似度,调用预设的第四计算公式分别计算所述指定患者与其他患者之间的综合相似度;基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者。本方案可应用于智慧医疗领域中,从而推动智慧城市的建设。本申请首先基于获取的患者基本信息与患者行为信息分别生成相应的患者基本信息向量与患者行为向量,再从患者基本信息向量、患者行为向量以及两者的融合向量所对应的三个维度分别计算患者之间的三种相似度,最后对三种相似度进行综合相似度计算进行相似患者识别以识别出与每一个患者分别对应的相似患者,有效地实现了对于与患者相关的相似患者的识别处理。且上述的相似患者识别处理过程参考了患者基本信息对应的患者基本信息向量、患者行为信息对应的患者行为向量,以及患者基本信息与患者行为信息共同对应的融合向量,并基于三种维度的相似度进行综合相似度计算分析以生成最终的相似患者,有效地保证了患者之间对比的全面性,以及保证了相似患者识别的准确性。
附图说明
图1是本申请一实施例的相似患者的识别方法的流程示意图;
图2是本申请一实施例的相似患者的识别装置的结构示意图;
图3是本申请一实施例的计算机设备的结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用于解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本方案可应用于智慧城市中的数字医疗领域,从而推动智慧城市的建设。
参照图1,本申请一实施例的相似患者的识别方法,包括:
S1:获取所有患者的患者基本信息,并分别生成与各个所述患者基本信息对应的患者基本信息向量,其中,所述所有患者的人数数量大于2;
S2:基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;其中,所述指定患者基本信息向量为所有所述患者基本信息向量中的任意一个向量,所述指定患者基本信息向量对应指定患者,所述其他患者基本信息向量为所有所述患者基本信息向量中除所述指定患者基本信息向量外的向量;
S3:获取所述所有患者的患者行为信息,并分别生成与各个所述患者行为信息对应的患者行为向量;
S4:基于预设的第二计算公式分别计算指定患者行为向量与其他患者行为向量之间的第二相似度;其中,所述指定患者行为向量对应所述指定患者,所述其他患者行为向量为所有所述患者行为向量中除所述指定患者行为向量外的向量;
S5:对同一个患者的患者基本信息向量与患者行为向量进行融合处理,得到对应的融合向量;
S6:基于预设的第三计算公式分别计算指定融合向量与其他融合向量之间的第三相似度;其中,所述指定融合向量对应所述指定患者,所述其他融合向量为所有所述融合向量中除所述指定融合向量外的向量;
S7:基于所述第一相似度、第二相似度与所述第三相似度,调用预设的第四计算公式分别计算所述指定患者与其他患者之间的综合相似度;其中,所述其他患者为所述所有患者中除所述指定患者外的患者;
S8:基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者。
如上述步骤S1至S8所述,本方法实施例的执行主体为一种相似患者的识别装置。在实际应用中,上述相似患者的识别装置可以通过虚拟装置,例如软件代码实现,也可以通过写入或集成有相关执行代码的实体装置实现,且可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。本实施例中的相似患者的识别装置,能够基于所有患者的患者基本信息与患者行为信息进行相似度计算处理,并基于计算结果有效地实现对于与指定患者相关的相似患者的识别处理。具体地,首先获取所有患者的患者基本信息,并分别生成与各个上述患者基本信息对应的患者基本信息向量;其中,上述所有患者的人数数量大于2。另外,可基于预训练生成的患者基本信息学习模型对患者基本信息进行向量表示处理以生成对应的患者行为向量。然后基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;其中,上述指定患者基本信息向量为所有上述患者基本信息向量中的任意一个向量,上述指定患者基本信息向量对应指定患者,上述其他患者基本信息向量为所有上述患者基本信息向量中除上述指定患者基本信息向量外的向量。另外,对于计算基本信息向量之间的第一相似度的计算公式不作特别限定,具体的,上述第一计算公式可为:similarity表示上述第一相似度,A表示上述指定患者基本信息向量,B表示上述其他患者基本信息向量,Ai表示上述指定患者基本信息向量的第i个分向量,Bi表示上述其他患者基本信息向量的第i个分向量,n表示分向量的数量;或者,上述第一计算公式还可为:similarity表示上述第一相似度,M表示上述指定患者基本信息向量,N表示上述其他患者基本信息向量,Mk表示上述指定患者基本信息向量的第k个分向量,Nk表示上述其他患者基本信息向量的第k个分向量,p表示分向量的数量。
之后获取上述所有患者的患者行为信息,并分别生成与各个上述患者行为信息对应的患者行为向量。其中,可基于预训练生成的患者行为学习模型对患者行为信息进行向量表示处理以生成对应的患者行为向量。具体的,先从指定患者的收费项明细信息中获取收费项目作为指定患者的指定患者行为信息,患者的每一项收费项目都可作为患者的行为,例如在患者的收费项明细信息中有“胸部X光”,表明该患者做了胸部X光这项检查;再以multi-hotencoding的形式构建与该指定患者行为信息对应的指定患者行为特征,该行为特征的维度为所有收费项目的个数,每一个维度代表一个收费项目,维度的值为1表示患者有这个收费项目,维度的值为0表示患者没有这个收费项目;之后将指定患者行为特征输入至预设的患者行为学习模型内,以通过该患者行为学习模型对输入的指定患者行为信息进行向量表示处理以生成对应的指定患者行为向量。另外,上述患者行为学习模型为基于预先采集的训练样本数据对深度学习模型进行训练后生成的。具体的,预先构建一个有三层全连接隐藏层的自动编码器(autoencoder with fully connected hidden layers)结构的第一深度学习模型,再以multi-hotencoding的形式对采集的样本训练数据中的行为信息构建对应的行为特征,并以该行为特征作为该第二深度学习模型的输入数据,以训练样本数据中的行为向量作为该第一深度学习模型的输出数据,通过无监督学习方式对该第一深度学习模型进行训练以得到上述患者行为学习模型。
然后基于预设的第二计算公式分别计算指定患者行为向量与其他患者行为向量之间的第二相似度;其中,上述指定患者行为向量对应上述指定患者,上述其他患者行为向量为所有上述患者行为向量中除上述指定患者行为向量外的向量。其中,上述用于分别计算指定患者行为向量与其他患者行为向量之间的第二相似度的第二计算公式具体可参照上述用于分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度的第一计算公式,在此不再赘述。在得到了上述患者基本信息向量与患者行为向量后,对同一个患者的患者基本信息向量与患者行为向量进行融合处理,得到对应的融合向量。其中,在对患者进行相似患者的识别处理过程中,除了对患者的基本信息和行为信息分别进行考虑,还可进一步考虑患者基本信息和行为信息之间的相互作用,以进一步提高相似患者的识别处理的处理准确性。另外,上述融合处理是指对同一个患者的患者基本信息向量与患者行为向量以相加的方式进行融合。
然后基于预设的第三计算公式分别计算指定融合向量与其他融合向量之间的第三相似度;其中,上述指定融合向量对应上述指定患者,上述其他融合向量为所有上述融合向量中除上述指定融合向量外的向量。另外,用于分别计算指定融合向量与其他融合向量之间的第三相似度的第三计算公式,具体可参照上述用于分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度的第一计算公式,在此不再赘述。后续基于上述第一相似度、第二相似度与上述第三相似度,调用预设的第四计算公式分别计算上述指定患者与其他患者之间的综合相似度;其中,上述其他患者为上述所有患者中除上述指定患者外的患者。其中,可先获取与各相似度分别对应的权重值,再调用上述第四计算公式对各上述相似度进行加权求和处理得到综合相似度。上述第四计算公式具体可为:z=a*W1+b*W2+c*W3,z为上述综合相似度,a表示与第一相似度对应的第一权重值,W1表示第一相似度,b表示与第二相似度对应的第二权重值,W2表示第二相似度,c表示与第三相似度对应的第三权重值,W3表示第三相似度。最后基于上述综合相似度,从上述其他患者中筛选出与上述指定患者对应的相似患者。其中,可将综合相似度按照数值从大到小的顺序进行排列,并取综合相似度排名前列所对应的目标患者作为指定患者的相似患者。
本实施例首先基于获取的患者基本信息与患者行为信息分别生成相应的患者基本信息向量与患者行为向量,再从患者基本信息向量、患者行为向量以及两者的融合向量所对应的三个维度分别计算患者之间的三种相似度,最后对三种相似度进行综合相似度计算进行相似患者识别以识别出与每一个患者分别对应的相似患者,有效地实现了对于与患者相关的相似患者的识别处理。且上述的相似患者识别处理过程参考了患者基本信息对应的患者基本信息向量、患者行为信息对应的患者行为向量,以及患者基本信息与患者行为信息共同对应的融合向量,并基于三种维度的相似度进行综合相似度计算分析以生成最终的相似患者,有效地保证了患者之间对比的全面性,以及保证了相似患者识别的准确性。
进一步地,本申请一实施例中,上述步骤S7,包括:
S700:获取与各相似度分别对应的重要性系数;其中,所述相似度包括所述第一相似度、第二相似度与所述第三相似度;
S701:基于所述重要性系数,生成与各所述相似度分别对应的权重值;
S702:基于所述权重值,调用所述第四计算公式对各所述相似度进行加权求和处理,得到对应的第一求和值;
S703:将所述第一求和值作为所述综合相似度。
如上述步骤S700至S703所述,上述基于上述第一相似度、第二相似度与上述第三相似度,调用预设的第四计算公式分别计算上述指定患者与其他患者之间的综合相似度的步骤,具体可包括:首先获取与各相似度分别对应的重要性系数;其中,上述相似度包括上述第一相似度、第二相似度与上述第三相似度。另外,上述重要性系数包括与上述第一相似度对应的第一重要性系数、与上述第二相似度对应的第二重要性系数、与上述第三相似度对应的第三重要性系数。且上述重要性系数可为表示各相似度的重要性程度的数值,对于重要性系数的取值不作具体限定,可根据实际的使用需求进行设置。举例地,第一重要性系数为30,第二重要性系数为30,第三重要性系数为40。然后基于上述重要性系数,生成与各上述相似度分别对应的权重值。其中,可基于每一个重要性系数与所有重要性系数的和值之间的商值来生成上述权重值。另外,与第一相似度对应的权重值为第一权重值,与第二相似度对应的权重值为第二权重值,与第三相似度对应的权重值为第三权重值。之后基于上述权重值,调用上述第四计算公式对各上述相似度进行加权求和处理,得到对应的第一求和值。其中,上述第四计算公式具体可为:z=a*W1+b*W2+c*W3,z为第一求和值,对应上述综合相似度,a表示第一权重值,W1表示第一相似度,b表示第二权重值,W2表示第二相似度,c表示第三权重值,W3表示第三相似度。最后在得到了上述第一求和值时,将上述第一求和值作为上述综合相似度。本实施例通过先基于各相似度分别对应的重要性系数来生成与每一个相似度对应的权重值,使得后续能基于得到的权重值,调用预设的第四计算公式对各相似度进行加权求和处理来快速地求出综合相似度,进而基于该综合相似度,从上述其他患者中筛选出与上述指定患者对应的相似患者,以有效地完成对于与指定患者相关的相似患者的识别处理,实现准确地识别出与指定患者相关的相似患者。
进一步地,本申请一实施例中,上述步骤S701,包括:
S7010:对所有所述重要性系数进行求和处理,得到对应的第二求和值;其中,所述重要性系数包括与所述第一相似度对应的第一重要性系数、与所述第二相似度对应的第二重要性系数、与所述第三相似度对应的第三重要性系数;
S7011:计算第一重要性系数与所述第二求和值的第一商值,将所述第一商值作为与所述第一相似度对应的第一权重值;以及,
S7012:计算第二重要性系数与所述第二求和值的第二商值,将所述第二商值作为与所述第二相似度对应的第二权重值;以及,
S7013:计算第三重要性系数与所述第二求和值的第三商值,将所述第三商值作为与所述第三相似度对应的第三权重值。
如上述步骤S7010至S7013所述,上述基于上述重要性系数,生成与各上述相似度分别对应的权重值的步骤,具体可包括:首先对所有上述重要性系数进行求和处理,得到对应的第二求和值;其中,上述重要性系数包括与上述第一相似度对应的第一重要性系数、与上述第二相似度对应的第二重要性系数、与上述第三相似度对应的第三重要性系数。然后计算第一重要性系数与上述第二求和值的第一商值,将上述第一商值作为与上述第一相似度对应的第一权重值。以及计算第二重要性系数与上述第二求和值的第二商值,将上述第二商值作为与上述第二相似度对应的第二权重值。以及计算第三重要性系数与上述第二求和值的第三商值,将上述第三商值作为与上述第三相似度对应的第三权重值。举例地,当第一重要性系数为30,第二重要性系数为30,第三重要性系数为40时,则可计算得出第二求和值为:30+30+40=100,第一权重值为30/100=0.3,第二权重值为30/100=0.3,第三权重值为40/100=0.4。本实施例通过先计算出所有相似度的重要性系数的和值,再基于每一个重要性系数与该和值的商值来计算得出与每一个相似度对应的权重值,使得后续能基于得到的权重值,调用预设的第四计算公式对各相似度进行加权求和处理来快速地求出综合相似度,进而基于该综合相似度,从上述其他患者中筛选出与上述指定患者对应的相似患者,以有效地完成对于与指定患者相关的相似患者的识别处理,实现准确地识别出与指定患者相关的相似患者。
进一步地,本申请一实施例中,上述步骤S2,包括:
S200:基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;
其中,similarity表示所述第一相似度,A表示所述指定患者基本信息向量,B表示所述其他患者基本信息向量,Ai表示所述指定患者基本信息向量的第i个分向量,Bi表示所述其他患者基本信息向量的第i个分向量,n表示分向量的数量。
如上述步骤S200所述,上述基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度的步骤,具体可包括:基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;其中,similarity表示上述第一相似度,A表示上述指定患者基本信息向量,B表示上述其他患者基本信息向量,Ai表示上述指定患者基本信息向量的第i个分向量,Bi表示上述其他患者基本信息向量的第i个分向量,n表示分向量的数量。本实施例通过基于第一计算公式可以快速地计算出指定患者基本信息向量与其他患者基本信息向量之间的第一相似度,有助于后续能够基于该第一相似度来计算上述指定患者与其他患者之间的综合相似度,进而使得能够基于上述综合相似度从上述其他患者中筛选出与上述指定患者对应的相似患者,以有效地完成对于与指定患者相关的相似患者的识别处理,实现准确地识别出与指定患者相关的相似患者。
进一步地,本申请一实施例中,上述步骤S8,包括:
S800:将所有所述综合相似度按照从大到小的顺序进行排序,得到对应的排序结果;
S801:从所述排序结果中排在首位的综合相似度开始,依次筛选出指定数量的目标综合相似度;
S802:获取与所述目标综合相似度对应的目标患者;
S803:将所述目标患者作为与所述指定患者对应的所述相似患者。
如上述步骤S800至S803所述,上述基于上述综合相似度,从上述其他患者中筛选出与上述指定患者对应的相似患者的步骤,具体可包括:首先将所有上述综合相似度按照从大到小的顺序进行排序,得到对应的排序结果。然后从上述排序结果中排在首位的综合相似度开始,依次筛选出指定数量的目标综合相似度。其中,对于上述指定数量的数值不作具体限定,可根据实际使用需求进行设置,例如可设置为4。之后获取与上述目标综合相似度对应的目标患者。最后在得到了上述目标患者时,将上述目标患者作为与上述指定患者对应的上述相似患者。举例地,当上述指定数量为4时,假设将所有综合相似度进行排序后得到的排序结果为:综合相似度1、综合相似度2、综合相似度3、综合相似度4、综合相似度5、综合相似度6、……,则可将上述综合相似度1、综合相似度2、综合相似度3、综合相似度4作为上述目标综合相似度,并将上述综合相似度1-4分别对应的目标患者作为上述相似患者。本实施例通过将与综合相似度最大所对应的指定数量的综合相似度作为上述目标综合相似度,再将目标综合相似度所对应的目标患者作为上述相似患者,以有效地完成对于与指定患者相关的相似患者的识别处理,实现准确地识别出与指定患者相关的相似患者。并且有利于后续基于该相似患者生成与指定患者对应的相似患者识别报告并输出,以便相关用户能够基于该相似患者识别报告来清楚方便地了解到本次的相似患者的识别结果情况。
进一步地,本申请一实施例中,上述步骤S1,包括:
S100:获取所述患者基本信息;
S101:将所述患者基本信息输入至预设的患者基本信息学习模型内;其中,所述患者基本信息学习模型为基于预先采集的样本数据对深度学习模型进行训练后生成的;
S102:接收所述患者基本信息学习模型对所述患者基本信息进行向量表示处理后生成的输出向量数据;
S103:将所述输出向量数据作为所述患者基本信息向量。
如上述步骤S100至S103所述,上述获取所有患者的患者基本信息,并分别生成与各个上述患者基本信息对应的患者基本信息向量的步骤,具体可包括:首先获取上述患者基本信息。然后将上述患者基本信息输入至预设的患者基本信息学习模型内;其中,上述患者基本信息学习模型为基于预先采集的样本数据对深度学习模型进行训练后生成的。具体的,预先构建一个有三层全连接隐藏层的自动编码器结构的第二深度学习模型,以样本数据中的样本患者的基本信息,例如年龄、性别、身高、体重等特征作为该第二深度学习模型的输入数据,以样本数据中的样本患者的基本信息向量作为该第二深度学习模型的输出数据,通过无监督学习方式对该第二深度学习模型进行训练以得到上述患者基本信息学习模型。之后接收上述患者基本信息学习模型对上述患者基本信息进行向量表示处理后生成的输出向量数据。最后在得到了上述输出向量数据后,将上述输出向量数据作为上述患者基本信息向量。本实施例通过将获取得到的患者基本信息输入至预训练生成患者基本信息学习模型,从而可以快速便捷地得到患者基本信息学习模型输出的与患者基本信息对应的患者基本信息向量,使得后续能够基于该患者基本信息向量来快速的计算出指定患者基本信息向量与其他患者基本信息向量之间的第一相似度,并有助于基于该第一相似度来计算上述指定患者与其他患者之间的综合相似度,进而使得能够基于上述综合相似度从上述其他患者中筛选出与上述指定患者对应的相似患者,以有效地完成对于与指定患者相关的相似患者的识别处理,实现准确地识别出与指定患者相关的相似患者。
进一步地,本申请一实施例中,上述步骤S8之后,包括:
S810:基于所述相似患者,生成与所述指定患者对应的相似患者识别报告;其中,所述相似患者识别报告的内容至少包括所述指定患者与所述相似患者;
S811:获取当前时间,并判断所述当前时间是否处于预设时间范围内;
S812:若所述当前时间处于预设时间范围内,则获取预设的邮件登录信息,以及获取与指定用户对应的指定邮件地址;
S813:根据所述邮件登录信息登录至对应的邮件服务器;
S814:通过所述邮件服务器将所述相似患者识别报告发送至所述指定邮件地址。
如上述步骤S810至S814所述,在执行了上述基于上述综合相似度,从上述其他患者中筛选出与上述指定患者对应的相似患者的步骤之后,还可包括基于该相似患者生成与上述指定患者相应的相似患者识别报告并发送至相关用户的过程。具体地,首先基于上述相似患者,生成与上述指定患者对应的相似患者识别报告。其中,上述相似患者识别报告内至少包含有上述指定患者及上述相似患者。另外,可预先创建一个报告模板,再将上述指定患者及上述相似患者填入该报告模板内以生成上述相似患者识别报告。然后获取当前时间,并判断上述当前时间是否处于预设时间范围内。其中,上述预设时间范围指代的是工作时间段所处的时间范围,对于该预设时间范围的具体数值不作限定,可根据实际需求进行选取,例如可设为9:00-21:00。如果上述当前时间处于预设时间范围内,则获取预设的邮件登录信息,以及获取与指定用户对应的指定邮件地址。之后根据上述邮件登录信息登录至对应的邮件服务器。最后通过上述邮件服务器将与上述相似患者识别报告发送至上述指定邮件地址。本实施例在与上述指定患者对应的相似患者识别报告后,通过使用邮件服务器将该相似患者识别报告发送至指定邮件地址,以使得相关用户能够及时了解到本次患者识别处理的最终识别结果,从而后续能够及时采取相应的处理措施,为相关用户提供了一定的便利性。另外,只有在当前时间处于预设时间范围内才会发送该相似患者识别报告至指定邮件地址,从而能够避免在休息时间段对指定用户造成不良干扰,有效的提高了邮件发送的智能性。
本申请实施例中的相似患者的识别方法还可以应用于区块链领域,如将上述综合相似度等数据存储于区块链上。通过使用区块链来对上述综合相似度进行存储和管理,能够有效地保证上述综合相似度的安全性与不可篡改性。
上述区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
参照图2,本申请一实施例中还提供了一种相似患者的识别装置,包括:
第一获取模块1,用于获取所有患者的患者基本信息,并分别生成与各个所述患者基本信息对应的患者基本信息向量;其中,所述所有患者的人数数量大于2;
第一计算模块2,用于基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;其中,所述指定患者基本信息向量为所有所述患者基本信息向量中的任意一个向量,所述指定患者基本信息向量对应指定患者,所述其他患者基本信息向量为所有所述患者基本信息向量中除所述指定患者基本信息向量外的向量;
第二获取模块3,用于获取所述所有患者的患者行为信息,并分别生成与各个所述患者行为信息对应的患者行为向量;
第二计算模块4,用于基于预设的第二计算公式分别计算指定患者行为向量与其他患者行为向量之间的第二相似度;其中,所述指定患者行为向量对应所述指定患者,所述其他患者行为向量为所有所述患者行为向量中除所述指定患者行为向量外的向量;
处理模块5,用于对同一个患者的患者基本信息向量与患者行为向量进行融合处理,得到对应的融合向量;
第三计算模块6,用于基于预设的第三计算公式分别计算指定融合向量与其他融合向量之间的第三相似度;其中,所述指定融合向量对应所述指定患者,所述其他融合向量为所有所述融合向量中除所述指定融合向量外的向量;
第四计算模块7,用于基于所述第一相似度、第二相似度与所述第三相似度,调用预设的第四计算公式分别计算所述指定患者与其他患者之间的综合相似度;其中,所述其他患者为所述所有患者中除所述指定患者外的患者;
筛选模块8,用于基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者。
本实施例中,上述相似患者的识别装置中的第一获取模块1、第一计算模块2、第二获取模块3、第二计算模块4、处理模块5、第三计算模块6、第四计算模块7与筛选模块8的功能和作用的实现过程具体详见上述相似患者的识别方法中对应步骤S1至S8的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第四计算模块7,包括:
第一获取单元,用于获取与各相似度分别对应的重要性系数;其中,所述相似度包括所述第一相似度、第二相似度与所述第三相似度;
生成单元,用于基于所述重要性系数,生成与各所述相似度分别对应的权重值;
处理单元,用于基于所述权重值,调用所述第四计算公式对各所述相似度进行加权求和处理,得到对应的第一求和值;
第一确定单元,用于将所述第一求和值作为所述综合相似度。
本实施例中,上述相似患者的识别装置中的第一获取单元、生成单元、处理单元与第一确定单元的功能和作用的实现过程具体详见上述相似患者的识别方法中对应步骤S700至S703的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述生成单元,包括:
求和子单元,用于对所有所述重要性系数进行求和处理,得到对应的第二求和值;其中,所述重要性系数包括与所述第一相似度对应的第一重要性系数、与所述第二相似度对应的第二重要性系数、与所述第三相似度对应的第三重要性系数;
第一计算子单元,用于计算第一重要性系数与所述第二求和值的第一商值,将所述第一商值作为与所述第一相似度对应的第一权重值;以及,
第二计算子单元,用于计算第二重要性系数与所述第二求和值的第二商值,将所述第二商值作为与所述第二相似度对应的第二权重值;以及,
第三计算子单元,用于计算第三重要性系数与所述第二求和值的第三商值,将所述第三商值作为与所述第三相似度对应的第三权重值。
本实施例中,上述相似患者的识别装置中的求和子单元、第一计算子单元、第二计算子单元与第三计算子单元的功能和作用的实现过程具体详见上述相似患者的识别方法中对应步骤S7010至S7013的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第一计算模块2,包括:
计算单元,用于基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;
其中,similarity表示所述第一相似度,A表示所述指定患者基本信息向量,B表示所述其他患者基本信息向量,Ai表示所述指定患者基本信息向量的第i个分向量,Bi表示所述其他患者基本信息向量的第i个分向量,n表示分向量的数量。
本实施例中,上述相似患者的识别装置中的计算单元的功能和作用的实现过程具体详见上述相似患者的识别方法中对应步骤S200的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述筛选模块8,包括:
排序单元,用于将所有所述综合相似度按照从大到小的顺序进行排序,得到对应的排序结果;
筛选单元,用于从所述排序结果中排在首位的综合相似度开始,依次筛选出指定数量的目标综合相似度;
第二获取单元,用于获取与所述目标综合相似度对应的目标患者;
第二确定单元,用于将所述目标患者作为与所述指定患者对应的所述相似患者。
本实施例中,上述相似患者的识别装置中的排序单元、筛选单元、第二获取单元与第二确定单元的功能和作用的实现过程具体详见上述相似患者的识别方法中对应步骤S800至S803的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述第一获取模块1,包括:
第三获取单元,用于获取所述患者基本信息;
输入单元,用于将所述患者基本信息输入至预设的患者基本信息学习模型内;其中,所述患者基本信息学习模型为基于预先采集的样本数据对深度学习模型进行训练后生成的;
接收单元,用于接收所述患者基本信息学习模型对所述患者基本信息进行向量表示处理后生成的输出向量数据;
第三确定单元,用于将所述输出向量数据作为所述患者基本信息向量。
本实施例中,上述相似患者的识别装置中的第三获取单元、输入单元、接收单元与第三确定单元的功能和作用的实现过程具体详见上述相似患者的识别方法中对应步骤S100至S103的实现过程,在此不再赘述。
进一步地,本申请一实施例中,上述相似患者的识别装置,包括:
生成模块,用于基于所述相似患者,生成与所述指定患者对应的相似患者识别报告;其中,所述相似患者识别报告的内容至少包括所述指定患者与所述相似患者;
判断模块,用于获取当前时间,并判断所述当前时间是否处于预设时间范围内;
第三获取模块,用于若所述当前时间处于预设时间范围内,则获取预设的邮件登录信息,以及获取与指定用户对应的指定邮件地址;
登录模块,用于根据所述邮件登录信息登录至对应的邮件服务器;
发送模块,用于通过所述邮件服务器将所述相似患者识别报告发送至所述指定邮件地址。
本实施例中,上述相似患者的识别装置中的生成模块、判断模块、第三获取模块、登录模块与发送模块的功能和作用的实现过程具体详见上述相似患者的识别方法中对应步骤S810至S814的实现过程,在此不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、输入装置和数据库。其中,该计算机设备设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存储器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储患者基本信息向量、第一相似度、患者行为向量、第二相似度、融合向量、第三相似度、综合相似度以及相似患者。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的显示屏是计算机中必不可少的一种图文输出设备,用于将数字信号转换为光信号,使文字与图形在显示屏的屏幕上显示出来。该计算机设备的输入装置是计算机与用户或其他设备之间进行信息交换的主要装置,用于把数据、指令及某些标志信息等输送到计算机中去。该计算机程序被处理器执行时以实现一种相似患者的识别方法。
上述处理器执行上述相似患者的识别方法的步骤:
获取所有患者的患者基本信息,并分别生成与各个所述患者基本信息对应的患者基本信息向量,其中,所述所有患者的人数数量大于2;
基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;其中,所述指定患者基本信息向量为所有所述患者基本信息向量中的任意一个向量,所述指定患者基本信息向量对应指定患者,所述其他患者基本信息向量为所有所述患者基本信息向量中除所述指定患者基本信息向量外的向量;
获取所述所有患者的患者行为信息,并分别生成与各个所述患者行为信息对应的患者行为向量;
基于预设的第二计算公式分别计算指定患者行为向量与其他患者行为向量之间的第二相似度;其中,所述指定患者行为向量对应所述指定患者,所述其他患者行为向量为所有所述患者行为向量中除所述指定患者行为向量外的向量;
对同一个患者的患者基本信息向量与患者行为向量进行融合处理,得到对应的融合向量;
基于预设的第三计算公式分别计算指定融合向量与其他融合向量之间的第三相似度;其中,所述指定融合向量对应所述指定患者,所述其他融合向量为所有所述融合向量中除所述指定融合向量外的向量;
基于所述第一相似度、第二相似度与所述第三相似度,调用预设的第四计算公式分别计算所述指定患者与其他患者之间的综合相似度;其中,所述其他患者为所述所有患者中除所述指定患者外的患者;
基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的装置、计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种相似患者的识别方法,具体为:
获取所有患者的患者基本信息,并分别生成与各个所述患者基本信息对应的患者基本信息向量,其中,所述所有患者的人数数量大于2;
基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;其中,所述指定患者基本信息向量为所有所述患者基本信息向量中的任意一个向量,所述指定患者基本信息向量对应指定患者,所述其他患者基本信息向量为所有所述患者基本信息向量中除所述指定患者基本信息向量外的向量;
获取所述所有患者的患者行为信息,并分别生成与各个所述患者行为信息对应的患者行为向量;
基于预设的第二计算公式分别计算指定患者行为向量与其他患者行为向量之间的第二相似度;其中,所述指定患者行为向量对应所述指定患者,所述其他患者行为向量为所有所述患者行为向量中除所述指定患者行为向量外的向量;
对同一个患者的患者基本信息向量与患者行为向量进行融合处理,得到对应的融合向量;
基于预设的第三计算公式分别计算指定融合向量与其他融合向量之间的第三相似度;其中,所述指定融合向量对应所述指定患者,所述其他融合向量为所有所述融合向量中除所述指定融合向量外的向量;
基于所述第一相似度、第二相似度与所述第三相似度,调用预设的第四计算公式分别计算所述指定患者与其他患者之间的综合相似度;其中,所述其他患者为所述所有患者中除所述指定患者外的患者;
基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (9)
1.一种相似患者的识别方法,其特征在于,包括:
获取所有患者的患者基本信息,并分别生成与各个所述患者基本信息对应的患者基本信息向量,其中,所述所有患者的人数数量大于2;
基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;其中,所述指定患者基本信息向量为所有所述患者基本信息向量中的任意一个向量,所述指定患者基本信息向量对应指定患者,所述其他患者基本信息向量为所有所述患者基本信息向量中除所述指定患者基本信息向量外的向量;
获取所述所有患者的患者行为信息,并分别生成与各个所述患者行为信息对应的患者行为向量;
基于预设的第二计算公式分别计算指定患者行为向量与其他患者行为向量之间的第二相似度;其中,所述指定患者行为向量对应所述指定患者,所述其他患者行为向量为所有所述患者行为向量中除所述指定患者行为向量外的向量;
对同一个患者的患者基本信息向量与患者行为向量进行融合处理,得到对应的融合向量;
基于预设的第三计算公式分别计算指定融合向量与其他融合向量之间的第三相似度;其中,所述指定融合向量对应所述指定患者,所述其他融合向量为所有所述融合向量中除所述指定融合向量外的向量;
基于所述第一相似度、第二相似度与所述第三相似度,调用预设的第四计算公式分别计算所述指定患者与其他患者之间的综合相似度;其中,所述其他患者为所述所有患者中除所述指定患者外的患者;
基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者;
所述基于所述第一相似度、第二相似度与所述第三相似度,调用预设的第四计算公式分别计算所述指定患者与其他患者之间的综合相似度的步骤,包括:
获取与各相似度分别对应的重要性系数;其中,所述相似度包括所述第一相似度、第二相似度与所述第三相似度;
基于所述重要性系数,生成与各所述相似度分别对应的权重值;
基于所述权重值,调用所述第四计算公式对各所述相似度进行加权求和处理,得到对应的第一求和值;
将所述第一求和值作为所述综合相似度;
其中,基于每一个重要性系数与所有重要性系数的和值之间的商值来生成上述权重值;第四计算公式具体可为:z=a*W1+b*W2+c*W3,z为第一求和值,对应上述综合相似度,a表示第一权重值,W1表示第一相似度,b表示第二权重值,W2表示第二相似度,c表示第三权重值,W3表示第三相似度。
2.根据权利要求1所述的相似患者的识别方法,其特征在于,所述基于所述重要性系数,生成与各所述相似度分别对应的权重值的步骤,包括:
对所有所述重要性系数进行求和处理,得到对应的第二求和值;其中,所述重要性系数包括与所述第一相似度对应的第一重要性系数、与所述第二相似度对应的第二重要性系数、与所述第三相似度对应的第三重要性系数;
计算第一重要性系数与所述第二求和值的第一商值,将所述第一商值作为与所述第一相似度对应的第一权重值;以及,
计算第二重要性系数与所述第二求和值的第二商值,将所述第二商值作为与所述第二相似度对应的第二权重值;以及,
计算第三重要性系数与所述第二求和值的第三商值,将所述第三商值作为与所述第三相似度对应的第三权重值。
3.根据权利要求1所述的相似患者的识别方法,其特征在于,所述基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度的步骤,包括:
基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;
其中,similarity表示所述第一相似度,A表示所述指定患者基本信息向量,B表示所述其他患者基本信息向量,Ai表示所述指定患者基本信息向量的第i个分向量,Bi表示所述其他患者基本信息向量的第i个分向量,n表示分向量的数量。
4.根据权利要求1所述的相似患者的识别方法,其特征在于,所述基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者的步骤,包括:
将所有所述综合相似度按照从大到小的顺序进行排序,得到对应的排序结果;
从所述排序结果中排在首位的综合相似度开始,依次筛选出指定数量的目标综合相似度;
获取与所述目标综合相似度对应的目标患者;
将所述目标患者作为与所述指定患者对应的所述相似患者。
5.根据权利要求1所述的相似患者的识别方法,其特征在于,所述获取所有患者的患者基本信息,并分别生成与各个所述患者基本信息对应的患者基本信息向量的步骤,包括:
获取所述患者基本信息;
将所述患者基本信息输入至预设的患者基本信息学习模型内;其中,所述患者基本信息学习模型为基于预先采集的样本数据对深度学习模型进行训练后生成的;
接收所述患者基本信息学习模型对所述患者基本信息进行向量表示处理后生成的输出向量数据;
将所述输出向量数据作为所述患者基本信息向量。
6.根据权利要求1所述的相似患者的识别方法,其特征在于,所述基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者的步骤之后,包括:
基于所述相似患者,生成与所述指定患者对应的相似患者识别报告;其中,所述相似患者识别报告的内容至少包括所述指定患者与所述相似患者;
获取当前时间,并判断所述当前时间是否处于预设时间范围内;
若所述当前时间处于预设时间范围内,则获取预设的邮件登录信息,以及获取与指定用户对应的指定邮件地址;
根据所述邮件登录信息登录至对应的邮件服务器;
通过所述邮件服务器将所述相似患者识别报告发送至所述指定邮件地址。
7.一种相似患者的识别装置,其特征在于,包括:
第一获取模块,用于获取所有患者的患者基本信息,并分别生成与各个所述患者基本信息对应的患者基本信息向量;其中,所述所有患者的人数数量大于2;
第一计算模块,用于基于预设的第一计算公式分别计算指定患者基本信息向量与其他患者基本信息向量之间的第一相似度;其中,所述指定患者基本信息向量为所有所述患者基本信息向量中的任意一个向量,所述指定患者基本信息向量对应指定患者,所述其他患者基本信息向量为所有所述患者基本信息向量中除所述指定患者基本信息向量外的向量;
第二获取模块,用于获取所述所有患者的患者行为信息,并分别生成与各个所述患者行为信息对应的患者行为向量;
第二计算模块,用于基于预设的第二计算公式分别计算指定患者行为向量与其他患者行为向量之间的第二相似度;其中,所述指定患者行为向量对应所述指定患者,所述其他患者行为向量为所有所述患者行为向量中除所述指定患者行为向量外的向量;
处理模块,用于对同一个患者的患者基本信息向量与患者行为向量进行融合处理,得到对应的融合向量;
第三计算模块,用于基于预设的第三计算公式分别计算指定融合向量与其他融合向量之间的第三相似度;其中,所述指定融合向量对应所述指定患者,所述其他融合向量为所有所述融合向量中除所述指定融合向量外的向量;
第四计算模块,用于基于所述第一相似度、第二相似度与所述第三相似度,调用预设的第四计算公式分别计算所述指定患者与其他患者之间的综合相似度;其中,所述其他患者为所述所有患者中除所述指定患者外的患者;
筛选模块,用于基于所述综合相似度,从所述其他患者中筛选出与所述指定患者对应的相似患者;
第四计算模块,包括:
第一获取单元,用于获取与各相似度分别对应的重要性系数;其中,所述相似度包括所述第一相似度、第二相似度与所述第三相似度;
生成单元,用于基于所述重要性系数,生成与各所述相似度分别对应的权重值;
处理单元,用于基于所述权重值,调用所述第四计算公式对各所述相似度进行加权求和处理,得到对应的第一求和值;
第一确定单元,用于将所述第一求和值作为所述综合相似度;
其中,基于每一个重要性系数与所有重要性系数的和值之间的商值来生成上述权重值;第四计算公式具体可为:z=a*W1+b*W2+c*W3,z为第一求和值,对应上述综合相似度,a表示第一权重值,W1表示第一相似度,b表示第二权重值,W2表示第二相似度,c表示第三权重值,W3表示第三相似度。
8.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110412544.9A CN112966787B (zh) | 2021-04-16 | 2021-04-16 | 相似患者的识别方法、装置、计算机设备和存储介质 |
PCT/CN2021/097551 WO2022217715A1 (zh) | 2021-04-16 | 2021-05-31 | 相似患者的识别方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110412544.9A CN112966787B (zh) | 2021-04-16 | 2021-04-16 | 相似患者的识别方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112966787A CN112966787A (zh) | 2021-06-15 |
CN112966787B true CN112966787B (zh) | 2023-11-14 |
Family
ID=76280586
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110412544.9A Active CN112966787B (zh) | 2021-04-16 | 2021-04-16 | 相似患者的识别方法、装置、计算机设备和存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112966787B (zh) |
WO (1) | WO2022217715A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113707255B (zh) * | 2021-08-31 | 2023-09-26 | 平安科技(深圳)有限公司 | 基于相似患者的健康指导方法、装置、计算机设备及介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105184103A (zh) * | 2015-10-15 | 2015-12-23 | 清华大学深圳研究生院 | 基于病历数据库的虚拟名医 |
CN109919780A (zh) * | 2019-01-23 | 2019-06-21 | 平安科技(深圳)有限公司 | 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质 |
CN111402070A (zh) * | 2020-03-23 | 2020-07-10 | 平安医疗健康管理股份有限公司 | 医疗信息识别方法、装置、计算机设备及存储介质 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101799806A (zh) * | 2009-02-06 | 2010-08-11 | 沈阳工大普日软件技术有限公司 | 基于多信息融合的胸部数字化x线图像检索系统 |
US8593277B2 (en) * | 2011-03-17 | 2013-11-26 | Kaarya, LLC. | System and method for proximity detection |
-
2021
- 2021-04-16 CN CN202110412544.9A patent/CN112966787B/zh active Active
- 2021-05-31 WO PCT/CN2021/097551 patent/WO2022217715A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105184103A (zh) * | 2015-10-15 | 2015-12-23 | 清华大学深圳研究生院 | 基于病历数据库的虚拟名医 |
CN109919780A (zh) * | 2019-01-23 | 2019-06-21 | 平安科技(深圳)有限公司 | 基于图计算技术的理赔反欺诈方法、装置、设备及存储介质 |
CN111402070A (zh) * | 2020-03-23 | 2020-07-10 | 平安医疗健康管理股份有限公司 | 医疗信息识别方法、装置、计算机设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2022217715A1 (zh) | 2022-10-20 |
CN112966787A (zh) | 2021-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110459324B (zh) | 基于长短期记忆模型的疾病预测方法、装置和计算机设备 | |
CN112329865B (zh) | 基于自编码器的数据异常识别方法、装置和计算机设备 | |
WO2021179630A1 (zh) | 一种并发症风险预测系统、方法、装置、设备及介质 | |
CN110688478B (zh) | 一种答案排序方法、装置及存储介质 | |
CN113688221B (zh) | 基于模型的话术推荐方法、装置、计算机设备和存储介质 | |
CN110111885B (zh) | 属性预测方法、装置、计算机设备及计算机可读存储介质 | |
CN112464117A (zh) | 请求处理方法、装置、计算机设备和存储介质 | |
CN112287068B (zh) | 基于人工智能的问诊对话数据处理方法及装置 | |
CN117238458B (zh) | 基于云计算的重症护理跨机构协同平台系统 | |
CN113011895B (zh) | 关联账户样本筛选方法、装置和设备及计算机存储介质 | |
CN112908473A (zh) | 基于模型的数据处理方法、装置、计算机设备和存储介质 | |
CN112036749A (zh) | 基于医疗数据识别风险用户的方法、装置和计算机设备 | |
CN111506710B (zh) | 基于谣言预测模型的信息发送方法、装置和计算机设备 | |
CN112329629A (zh) | 在线培训的评价方法、装置、计算机设备和存储介质 | |
CN113889262A (zh) | 基于模型的数据预测方法、装置、计算机设备和存储介质 | |
CN112966787B (zh) | 相似患者的识别方法、装置、计算机设备和存储介质 | |
CN113656588B (zh) | 基于知识图谱的数据对码方法、装置、设备和存储介质 | |
CN113051372B (zh) | 材料数据的处理方法、装置、计算机设备和存储介质 | |
CN113761375A (zh) | 基于神经网络的消息推荐方法、装置、设备及存储介质 | |
CN116777646A (zh) | 基于人工智能的风险识别方法、装置、设备及存储介质 | |
CN112364136B (zh) | 关键词生成方法、装置、设备及存储介质 | |
CN115130545A (zh) | 数据处理方法、电子设备、程序产品及介质 | |
CN114547053A (zh) | 基于系统的数据处理方法、装置、计算机设备和存储介质 | |
CN113838579A (zh) | 一种医疗数据的异常检测方法、装置、设备及存储介质 | |
CN112035543A (zh) | 药品用量数据的异常识别方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |