CN112233740A - 患者身份识别方法、装置、设备和介质 - Google Patents
患者身份识别方法、装置、设备和介质 Download PDFInfo
- Publication number
- CN112233740A CN112233740A CN202011039231.5A CN202011039231A CN112233740A CN 112233740 A CN112233740 A CN 112233740A CN 202011039231 A CN202011039231 A CN 202011039231A CN 112233740 A CN112233740 A CN 112233740A
- Authority
- CN
- China
- Prior art keywords
- patient
- target
- label
- historical
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 239000013610 patient sample Substances 0.000 claims abstract description 68
- 239000000523 sample Substances 0.000 claims abstract description 67
- 238000007781 pre-processing Methods 0.000 claims abstract description 17
- 230000001186 cumulative effect Effects 0.000 claims description 20
- 238000012545 processing Methods 0.000 claims description 16
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012937 correction Methods 0.000 claims description 8
- 238000004364 calculation method Methods 0.000 claims description 7
- 238000001514 detection method Methods 0.000 description 9
- 238000011156 evaluation Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000013480 data collection Methods 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 239000008280 blood Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 238000004140 cleaning Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000007689 inspection Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000007815 allergy Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000474 nursing effect Effects 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H10/00—ICT specially adapted for the handling or processing of patient-related medical or healthcare data
- G16H10/60—ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/70—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
Abstract
本发明公开了一种患者身份识别方法,该方法包括:获取至少一个历史患者的患者样本数据,对患者样本数据进行数据预处理,获取预处理后的目标样本数据。获取归类标准,根据归类标准对每个历史患者的目标样本数据进行标签归类。根据模型相似度系数及模型权重系数计算目标患者的目标标签累计值。获取至少一个历史患者的历史标签累计值,将目标标签累计值与每个历史标签累计值进行相似度匹配,获取每个历史患者与目标患者的相似度匹配值,将相似度匹配值最高的历史患者作为目标患者的同一身份患者。本患者身份识别方法通过计算得到相似度匹配值实现准确判断与目标对应的同一身份患者。此外,还提出了患者身份识别装置、设备和存储介质。
Description
技术领域
本发明涉及身份识别技术领域,尤其是涉及患者身份识别方法、装置、设备和介质。
背景技术
随着医学检验技术的不断进步和发展,医检信息已越来越多地为疾病的发现、护理、诊断、治疗、病情监测及预后判断等不同阶段提供信息支撑。但是要充分发挥医检信息的实用意义,必须在确保医检信息的准确性。
在现有的医学检测领域,常由于记录信息遗漏或登记失误等原因造成医检信息不完善,例如省、市、姓名、性别、年龄、民族、身份证、电话等特征信息出现缺少。而医检信息的不完善,将直接导致无法准确判断医检信息所属的受检人员。而在无法正确预判医检信息唯一性的前提下,医检信息将存在误用的可能。对于此,现有的方法只能通过人工核查患者临床诊断和检测信息来判断身份所属,而这存在周期慢长且程序繁杂的问题。
发明内容
基于此,有必要针对上述问题,提供操作简单且准确判断患者身份的患者身份识别方法、装置、设备和介质。
一种患者身份识别的方法,所述方法包括:
获取至少一个历史患者的患者样本数据,根据所述患者样本数据建立患者样本数据库,对所述患者样本数据进行数据预处理,获取预处理后的目标样本数据;
获取归类标准,根据所述归类标准对每个所述历史患者的所述目标样本数据进行标签归类;
获取目标患者的模型相似度系数及模型权重系数,根据所述模型相似度系数及所述模型权重系数计算所述目标患者的目标标签累计值;
获取所述至少一个历史患者的历史标签累计值,将所述目标标签累计值与每个所述历史标签累计值进行相似度匹配,获取每个所述历史患者与所述目标患者的相似度匹配值,将所述相似度匹配值最高的历史患者作为所述目标患者的同一身份患者。
在其中一个实施例中,所述获取归类标准,根据所述归类标准对每个所述历史患者的所述目标样本数据进行标签归类,包括:
获取特征归类标准,以所述特征归类标准对每个所述历史患者的所述目标样本数据进行一级分类,获取一级分类后的画像特征大类;
获取标签归类标准,以所述标签归类标准对每个所述历史患者的所述画像特征大类进行二级分类,获取二级分类后的画像标签小类。
在其中一个实施例中,所述获取目标患者的模型相似度系数及模型权重系数,根据所述模型相似度系数及所述模型权重系数计算所述目标患者的目标标签累计值,包括:
获取所述目标患者携带的每个目标标签的目标标签权重及目标标签系数,根据所述目标标签权重及所述目标标签系数计算每个所述目标标签的所述模型相似度系数;
获取每个所述目标标签对应的所述模型权重系数,计算每个所述目标标签的所述模型相似度系数及所述模型权重系数的乘积,将所述乘积进行累加,将累加后的值作为所述目标标签累计值。
在其中一个实施例中,所述获取所述至少一个历史患者的历史标签累计值,包括:
获取每个所述历史患者携带的匹配标签的匹配标签权重及匹配标签系数,根据所述匹配标签权重及所述匹配标签系数计算每个所述匹配标签的匹配相似度系数;
获取每个所述匹配标签对应的匹配权重系数,计算每个所述匹配标签的所述匹配相似度系数及所述匹配权重系数的乘积,将所述乘积进行累加,将累加后的值作为所述历史标签累计值。
在其中一个实施例中,所述将所述目标标签累计值与每个所述历史标签累计值进行相似度匹配,获取每个所述历史患者与所述目标患者的相似度匹配值,包括:
计算所述目标标签累计值与每个所述历史标签累计值的相似度比值,将所述相似度比值作为每个所述历史患者与所述目标患者的相似度匹配值。
在其中一个实施例中,在所述将所述相似度匹配值最高的历史患者作为所述目标患者的同一身份患者之后,还包括:
根据所述相似度匹配值计算所述目标患者的相似度偏差值;
根据所述相似度偏差值对所述模型相似度系数及所述模型权重系数进行系数修正,以使得所述相似度偏差值小于偏差值阈值。
在其中一个实施例中,所述对所述患者样本数据进行数据预处理,获取预处理后的目标样本数据,包括:
对所述患者样本数据的进行命名规范处理,获取命名规范处理后的规范样本数据;
对所述规范样本数据中的无效数据和/或非规范数据进行清除处理,获取清除处理后的所述目标样本数据。
一种患者身份识别装置,所述装置包括:
数据处理模块,用于获取至少一个历史患者的患者样本数据,根据所述患者样本数据建立患者样本数据库,对所述患者样本数据进行数据预处理,获取预处理后的目标样本数据;
标签分类模块,用于获取归类标准,根据所述归类标准对每个所述历史患者的所述目标样本数据进行标签归类;
相似度计算模块,用于获取目标患者的模型相似度系数及模型权重系数,根据所述模型相似度系数及所述模型权重系数计算所述目标患者的目标标签累计值;
匹配模块,用于获取所述至少一个历史患者的历史标签累计值,将所述目标标签累计值与每个所述历史标签累计值进行相似度匹配,获取每个所述历史患者与所述目标患者的相似度匹配值,将所述相似度匹配值最高的历史患者作为所述目标患者的同一身份患者。
一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
获取至少一个历史患者的患者样本数据,根据所述患者样本数据建立患者样本数据库,对所述患者样本数据进行数据预处理,获取预处理后的目标样本数据;
获取归类标准,根据所述归类标准对每个所述历史患者的所述目标样本数据进行标签归类;
获取目标患者的模型相似度系数及模型权重系数,根据所述模型相似度系数及所述模型权重系数计算所述目标患者的目标标签累计值;
获取所述至少一个历史患者的历史标签累计值,将所述目标标签累计值与每个所述历史标签累计值进行相似度匹配,获取每个所述历史患者与所述目标患者的相似度匹配值,将所述相似度匹配值最高的历史患者作为所述目标患者的同一身份患者。
一种患者身份识别设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取至少一个历史患者的患者样本数据,根据所述患者样本数据建立患者样本数据库,对所述患者样本数据进行数据预处理,获取预处理后的目标样本数据;
获取归类标准,根据所述归类标准对每个所述历史患者的所述目标样本数据进行标签归类;
获取目标患者的模型相似度系数及模型权重系数,根据所述模型相似度系数及所述模型权重系数计算所述目标患者的目标标签累计值;
获取所述至少一个历史患者的历史标签累计值,将所述目标标签累计值与每个所述历史标签累计值进行相似度匹配,获取每个所述历史患者与所述目标患者的相似度匹配值,将所述相似度匹配值最高的历史患者作为所述目标患者的同一身份患者。
本发明提供了患者身份识别方法、装置、设备和介质,通过在收集患者样本数据后对患者样本数据进行数据预处理,确保了数据的准确性。而通过对目标样本数据进行标签归类,使得对同一身份患者的评估更为细化及准确。最后通过比较目标标签累计值与历史标签累计值,以计算每个历史患者与目标患者的计算相似度匹配值,从而在本患者身份识别方法中是以每一个标签为最小的相似评价标准,通过计算得到的相似度匹配值能准确判断与目标对应的同一身份患者。本发明非常适合用于患者身份的识别及判断。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
其中:
图1为一个实施例中患者身份识别方法的流程示意图;
图2为一个实施例中以不同医学数据系统作为数据源的示意图;
图3为一个实施例中患者身份识别装置的结构示意图;
图4为一个实施例中患者身份识别设备的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,图1为一个实施例中患者身份识别方法的流程示意图,本实施例中患者身份识别方法提供的步骤包括:
步骤102,获取至少一个历史患者的患者样本数据,根据患者样本数据建立患者样本数据库,对患者样本数据进行数据预处理,获取预处理后的目标样本数据。
其中,患者样本数据为每个历史患者在不同医学数据系统中的历史记录数据。患者样本数据库为对患者样本数据进行整理分类后形成的数据集合。
在一个实施例中,如图2所示,通过对接不同的医学数据系统来作为数据源,其中医学数据系统可以包括医院检测系统、医院临床系统及检测机构数据系统等。从不同医学数据系统中调取每个历史患者的患者样本数据,包括表型数据、个人信息、健康档案、体检报告、医院信息、检测信息等数据作为数据库的数据基础,从而确保了数据的充分性。进一步的,设计并定义患者样本数据库中个人信息、临床信息及检测信息等患者样本数据的数据标准结构,通过数据清洗、过滤、转换及融合等步骤使得患者样本数据成为预处理后的目标样本数据。
在一个具体实施例中,预先设定命名规范,包括命名字数规范,命名范围规范等规范。逐一将患者样本数据与命名规范进行比对,对部分符合命名规范的样本数据进行强制转换,对完全不符合命名规范的样本数据进行错误标记,从而完成对患者样本数据的进行命名规范处理,获取命名规范处理后的规范样本数据。进一步的,对规范样本数据中存在错误标记的非规范数据,和/或因重复、数据丢失、损坏等原因形成的无效数据进行数据清理,仅保留规范样本数据中的有效数据,即目标样本数据。
本实施例中,由于不同的医院或检测机构所采用的医学数据系统不尽相同,因此记录于不同医学数据系统下的患者样本数据在格式、详细度等方面都存在着差异。通过对来自于不同医学数据系统的患者样本数据进行数据预处理,可使得数据具备相同的记录标准,方便后续进行身份判别。
步骤104,获取归类标准,根据归类标准对每个历史患者的目标样本数据进行标签归类。
其中,归类标准是指用于对目标样本数据进行进一步细化的标准,归类标准依据可将目标样本数据划分为不同的数据维度。
在一个具体实施例中,对目标样本数据进行二级分类。首先获取特征归类标准,具体包括个人基础特征、医院特征、地域特征及历史检测类型特征等不同特征归类标准,以这些特征归类标准对每个历史患者的目标样本数据进行一级分类,从而实现对目标样本数据的粗分类。该特征归类标准可以反映不同医学数据系统对数据收集的整体情况,从而可以找到数据收集过程中存在的问题,并针对该问题进行相应性的完善。例如可以根据医院特征的数量来判断某一个或多个医院是否存在数据收集不规范的情况,从而做出相应的完善提醒。进一步的,获取一级分类后的画像特征大类和标签归类标准,以标签归类标准对每个历史患者的画像特征大类进行二级分类,获取二级分类后的画像标签小类。具体的,标签归类标准是对特征归类标准的进一步细化,具体包括患者国籍、姓名、性别、年龄、血型、职业、用药吏、过敏吏、计划免疫、妇幼保健、省、市、县、乡镇、送检医院及送检科室等基于患者基本信息的标签归类标准;还包括患者病历、健康档、检测条码及检测项目等基于特定疾病的标签归类标准。
本实施例通过对目标样本数据进行标签归类,可使得后续步骤中对同一身份患者的评估更为细化及准确。
步骤106,获取目标患者的模型相似度系数及模型权重系数,根据模型相似度系数及模型权重系数计算目标患者的目标标签累计值。
其中,模型相似度系数是指目标患者携带的每个目标标签的相似度大小。模型权重系数是根据每个计算模型的重要程度预先设定的。目标标签累计值是指目标患者携带的目标标签的累计相似度。
在一个具体实施例中,模型相似度系数由目标标签权重及目标标签系数决定。其中,目标标签权重反应目标患者携带的每个目标标签对同一身份患者判断的重要程度;目标标签系数是根据标签出现的频率、标签收集难度等因素预先设定的。获取目标患者携带的每个目标标签的目标标签权重及目标标签系数,计算每个目标标签的目标标签权重及目标标签系数的乘积,该乘积为每个目标标签的模型相似度系数。获取每个目标标签对应的模型权重系数,计算每个目标标签的模型相似度系数及模型权重系数的乘积,将该乘积进行累加,将累加后的值作为目标标签累计值。
示例性的,仅对计算目标标签累计值进行简单举例,假定患者样本数据库中对目标样本数据进行标签归类后得到的标签小类包括姓名、性别、身份证、年龄、电话及血型。而每个标签小类对应的标签权重为0.8、1、1、0.8、0.4、0.5;每个标签小类对应的标签系数为0.6、0.8、0.8、0.6、0.3、0.7;每个标签小类对应的模型权重系数为0.512、1、0.8、0.512、0.128、0.316。现需计算目标患者H的目标标签累计值,而检测到该目标患者H携带的目标标签包括姓名、性别、身份证、年龄及电话。因此对应的目标标签权重为0.8、1、1、0.8、0.4。对应的目标标签系数为0.6、0.8、0.8、0.6、0.3。对应的目标患者的模型权重系数为0.512、1、0.8、0.512、0.128。可见,对应的模型相似度系数分别为0.4096(0.512×0.8)、1(1×1)、0.8(0.8×1)、0.4096(0.512×0.8)及0.0512(0.128×0.4)。进一步的,计算目标标签累计值H1=0.6×0.4096+0.8×1+0.8×0.8+0.6×0.4096+0.3×0.0512=1.94715。
步骤108,获取至少一个历史患者的历史标签累计值,将目标标签累计值与每个历史标签累计值进行相似度匹配,获取每个历史患者与目标患者的相似度匹配值,将相似度匹配值最高的历史患者作为目标患者的同一身份患者。
其中,历史标签累计值反应每个历史患者携带的匹配标签的累计相似度。
在一个具体实施例中,与目标标签累计值的计算类似,计算每个匹配标签的匹配相似度系数及匹配权重系数的乘积,将乘积进行累加,而累加后的值即作为历史标签累计值。其中,匹配相似度系数是指每个历史患者携带的可匹配的匹配标签的相似度大小;匹配权重系数是根据每个计算模型的重要程度预先设定的。更具体的,匹配相似度系数具体是由匹配标签权重及匹配标签系数计算得到。匹配标签权重反应历史患者携带的每个匹配标签对同一身份患者判断的重要程度,匹配标签系数是预设定系数。
示例性的,仅对计算历史标签累计值进行简单举例,假定患者样本数据库中记录的历史患者包括:A患者、B患者、C患者及D患者。而A患者的匹配标签包括姓名、性别及身份证;B患者的匹配标签包括姓名及电话;C患者的匹配标签包括性别、年龄及电话;D患者的匹配标签包括电话。由此可知:
A患者的历史标签累计值A1=0.6×0.512×0.8+0.8×1×1+0.8×0.8×1=1.9315
B患者的历史标签累计值B1=0.6×0.512×0.8+0.3×0.128×0.4=0.26112
C患者的历史标签累计值C1=0.8×1×1+0.6×0.512×0.8+0.3×0.128×0.4=1.06112
D患者的历史标签累计值D1=0.3×0.128×0.4=0.01536
进一步的,计算目标标签累计值与每个历史标签累计值的相似度比值,将相似度比值作为每个历史患者与目标患者的相似度匹配值。计算得到A患者的相似度匹配值为0.99196。B患者的相似度匹配值为0.1341。C患者的相似度匹配值为0.54496。D患者的相似度匹配值为0.00788。由此可知,A患者与目标患者为同一身份患者。
更进一步的,在本实施例中,在确定目标患者的同一身份患者后还可对模型相似度系数及模型权重系数进行系数修正。具体的,首先根据相似度匹配值计算目标患者的相似度偏差值,也就是与1的差值。再根据相似度偏差值对模型相似度系数及模型权重系数进行系数修正,例如适当性的按比例增大或按等数值增大模型相似度系数和/或模型权重系数,直至相似度偏差值小于偏差值阈值。
上述患者身份识别方法,通过在收集患者样本数据后对患者样本数据进行数据预处理,确保了数据的准确性。而通过对目标样本数据进行标签归类,使得对同一身份患者的评估更为细化及准确。最后通过比较目标标签累计值与历史标签累计值,以计算每个历史患者与目标患者的计算相似度匹配值,从而在本患者身份识别方法中是以每一个标签为最小的相似评价标准,通过计算得到的相似度匹配值能准确判断与目标对应的同一身份患者。本发明非常适合用于患者身份的识别及判断。
在一个实施例中,如图3所示,提出了一种患者身份识别装置,该装置包括:
数据处理模块302,用于获取至少一个历史患者的患者样本数据,根据患者样本数据建立患者样本数据库,对患者样本数据进行数据预处理,获取预处理后的目标样本数据;
标签分类模块304,用于获取归类标准,根据归类标准对每个历史患者的目标样本数据进行标签归类;
相似度计算模块306,用于获取目标患者的模型相似度系数及模型权重系数,根据模型相似度系数及模型权重系数计算目标患者的目标标签累计值;
匹配模块308,用于获取至少一个历史患者的历史标签累计值,将目标标签累计值与每个历史标签累计值进行相似度匹配,获取每个历史患者与目标患者的相似度匹配值,将相似度匹配值最高的历史患者作为目标患者的同一身份患者。
上述患者身份识别装置,通过在收集患者样本数据后对患者样本数据进行数据预处理,确保了数据的准确性。而通过对目标样本数据进行标签归类,使得对同一身份患者的评估更为细化及准确。最后通过比较目标标签累计值与历史标签累计值,以计算每个历史患者与目标患者的计算相似度匹配值,从而在本患者身份识别方法中以每一个标签为最小的相似评价标准,通过计算得到的相似度匹配值准确判断与目标对应的同一身份患者。
在一个实施例中,标签分类模块304,还具体用于:获取特征归类标准,以特征归类标准对每个历史患者的目标样本数据进行一级分类,获取一级分类后的画像特征大类;获取标签归类标准,以标签归类标准对每个历史患者的画像特征大类进行二级分类,获取二级分类后的画像标签小类。
在一个实施例中,相似度计算模块306,还具体用于:获取目标患者携带的每个目标标签的目标标签权重及目标标签系数,根据目标标签权重及目标标签系数计算每个目标标签的模型相似度系数;获取每个目标标签对应的模型权重系数,计算每个目标标签的模型相似度系数及模型权重系数的乘积,将乘积进行累加,将累加后的值作为目标标签累计值。
在一个实施例中,匹配模块308,还具体用于:获取每个历史患者携带的匹配标签的匹配标签权重及匹配标签系数,根据匹配标签权重及匹配标签系数计算每个匹配标签的匹配相似度系数;获取每个匹配标签对应的匹配权重系数,计算每个匹配标签的匹配相似度系数及匹配权重系数的乘积,将乘积进行累加,将累加后的值作为历史标签累计值。
在一个实施例中,匹配模块308,还具体用于:计算目标标签累计值与每个历史标签累计值的相似度比值,将相似度比值作为每个历史患者与目标患者的相似度匹配值。
在一个实施例中,患者身份识别还包括:修正模块,用于根据相似度匹配值计算目标患者的相似度偏差值;根据相似度偏差值对模型相似度系数及模型权重系数进行系数修正,以使得相似度偏差值小于偏差值阈值。
在一个实施例中,数据处理模块302,还具体用于:对患者样本数据的进行命名规范处理,获取命名规范处理后的规范样本数据;对规范样本数据中的无效数据和/或非规范数据进行清除处理,获取清除处理后的目标样本数据。
图4示出了一个实施例中患者身份识别设备的内部结构图。如图4所示,该患者身份识别设备包括通过系统总线连接的处理器、存储器和网络接口。其中,存储器包括非易失性存储介质和内存储器。该患者身份识别设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现患者身份识别方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行患者身份识别方法。本领域技术人员可以理解,图4中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的患者身份识别设备的限定,具体的患者身份识别设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
一种患者身份识别设备,包括存储器、处理器以及存储在该存储器中并可在该处理器上执行的计算机程序,该处理器执行该计算机程序时实现如下步骤:获取至少一个历史患者的患者样本数据,根据患者样本数据建立患者样本数据库,对患者样本数据进行数据预处理,获取预处理后的目标样本数据;获取归类标准,根据归类标准对每个历史患者的目标样本数据进行标签归类;获取目标患者的模型相似度系数及模型权重系数,根据模型相似度系数及模型权重系数计算目标患者的目标标签累计值;获取至少一个历史患者的历史标签累计值,将目标标签累计值与每个历史标签累计值进行相似度匹配,获取每个历史患者与目标患者的相似度匹配值,将相似度匹配值最高的历史患者作为目标患者的同一身份患者。
在一个实施例中,获取归类标准,根据归类标准对每个历史患者的目标样本数据进行标签归类,包括:获取特征归类标准,以特征归类标准对每个历史患者的目标样本数据进行一级分类,获取一级分类后的画像特征大类;获取标签归类标准,以标签归类标准对每个历史患者的画像特征大类进行二级分类,获取二级分类后的画像标签小类。
在一个实施例中,获取目标患者的模型相似度系数及模型权重系数,根据模型相似度系数及模型权重系数计算目标患者的目标标签累计值,包括:获取目标患者携带的每个目标标签的目标标签权重及目标标签系数,根据目标标签权重及目标标签系数计算每个目标标签的模型相似度系数;获取每个目标标签对应的模型权重系数,计算每个目标标签的模型相似度系数及模型权重系数的乘积,将乘积进行累加,将累加后的值作为目标标签累计值。
在一个实施例中,获取至少一个历史患者的历史标签累计值,包括:获取每个历史患者携带的匹配标签的匹配标签权重及匹配标签系数,根据匹配标签权重及匹配标签系数计算每个匹配标签的匹配相似度系数;获取每个匹配标签对应的匹配权重系数,计算每个匹配标签的匹配相似度系数及匹配权重系数的乘积,将乘积进行累加,将累加后的值作为历史标签累计值。
在一个实施例中,将目标标签累计值与每个历史标签累计值进行相似度匹配,获取每个历史患者与目标患者的相似度匹配值,包括:计算目标标签累计值与每个历史标签累计值的相似度比值,将相似度比值作为每个历史患者与目标患者的相似度匹配值。
在一个实施例中,在将相似度匹配值最高的历史患者作为目标患者的同一身份患者之后,还包括:根据相似度匹配值计算目标患者的相似度偏差值;根据相似度偏差值对模型相似度系数及模型权重系数进行系数修正,以使得相似度偏差值小于偏差值阈值。
在一个实施例中,对患者样本数据进行数据预处理,获取预处理后的目标样本数据,包括:对患者样本数据的进行命名规范处理,获取命名规范处理后的规范样本数据;对规范样本数据中的无效数据和/或非规范数据进行清除处理,获取清除处理后的目标样本数据。
一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现如下步骤:获取至少一个历史患者的患者样本数据,根据患者样本数据建立患者样本数据库,对患者样本数据进行数据预处理,获取预处理后的目标样本数据;获取归类标准,根据归类标准对每个历史患者的目标样本数据进行标签归类;获取目标患者的模型相似度系数及模型权重系数,根据模型相似度系数及模型权重系数计算目标患者的目标标签累计值;获取至少一个历史患者的历史标签累计值,将目标标签累计值与每个历史标签累计值进行相似度匹配,获取每个历史患者与目标患者的相似度匹配值,将相似度匹配值最高的历史患者作为目标患者的同一身份患者。
在一个实施例中,获取归类标准,根据归类标准对每个历史患者的目标样本数据进行标签归类,包括:获取特征归类标准,以特征归类标准对每个历史患者的目标样本数据进行一级分类,获取一级分类后的画像特征大类;获取标签归类标准,以标签归类标准对每个历史患者的画像特征大类进行二级分类,获取二级分类后的画像标签小类。
在一个实施例中,获取目标患者的模型相似度系数及模型权重系数,根据模型相似度系数及模型权重系数计算目标患者的目标标签累计值,包括:获取目标患者携带的每个目标标签的目标标签权重及目标标签系数,根据目标标签权重及目标标签系数计算每个目标标签的模型相似度系数;获取每个目标标签对应的模型权重系数,计算每个目标标签的模型相似度系数及模型权重系数的乘积,将乘积进行累加,将累加后的值作为目标标签累计值。
在一个实施例中,获取至少一个历史患者的历史标签累计值,包括:获取每个历史患者携带的匹配标签的匹配标签权重及匹配标签系数,根据匹配标签权重及匹配标签系数计算每个匹配标签的匹配相似度系数;获取每个匹配标签对应的匹配权重系数,计算每个匹配标签的匹配相似度系数及匹配权重系数的乘积,将乘积进行累加,将累加后的值作为历史标签累计值。
在一个实施例中,将目标标签累计值与每个历史标签累计值进行相似度匹配,获取每个历史患者与目标患者的相似度匹配值,包括:计算目标标签累计值与每个历史标签累计值的相似度比值,将相似度比值作为每个历史患者与目标患者的相似度匹配值。
在一个实施例中,在将相似度匹配值最高的历史患者作为目标患者的同一身份患者之后,还包括:根据相似度匹配值计算目标患者的相似度偏差值;根据相似度偏差值对模型相似度系数及模型权重系数进行系数修正,以使得相似度偏差值小于偏差值阈值。
在一个实施例中,对患者样本数据进行数据预处理,获取预处理后的目标样本数据,包括:对患者样本数据的进行命名规范处理,获取命名规范处理后的规范样本数据;对规范样本数据中的无效数据和/或非规范数据进行清除处理,获取清除处理后的目标样本数据。
需要说明的是,上述患者身份识别方法、装置、设备及计算机可读存储介质属于一个总的发明构思,患者身份识别方法、装置、设备及计算机可读存储介质实施例中的内容可相互适用。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,该程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种患者身份识别的方法,其特征在于,所述方法包括:
获取至少一个历史患者的患者样本数据,根据所述患者样本数据建立患者样本数据库,对所述患者样本数据进行数据预处理,获取预处理后的目标样本数据;
获取归类标准,根据所述归类标准对每个所述历史患者的所述目标样本数据进行标签归类;
获取目标患者的模型相似度系数及模型权重系数,根据所述模型相似度系数及所述模型权重系数计算所述目标患者的目标标签累计值;
获取所述至少一个历史患者的历史标签累计值,将所述目标标签累计值与每个所述历史标签累计值进行相似度匹配,获取每个所述历史患者与所述目标患者的相似度匹配值,将所述相似度匹配值最高的历史患者作为所述目标患者的同一身份患者。
2.根据权利要求1所述的方法,其特征在于,所述获取归类标准,根据所述归类标准对每个所述历史患者的所述目标样本数据进行标签归类,包括:
获取特征归类标准,以所述特征归类标准对每个所述历史患者的所述目标样本数据进行一级分类,获取一级分类后的画像特征大类;
获取标签归类标准,以所述标签归类标准对每个所述历史患者的所述画像特征大类进行二级分类,获取二级分类后的画像标签小类。
3.根据权利要求1所述的方法,其特征在于,所述获取目标患者的模型相似度系数及模型权重系数,根据所述模型相似度系数及所述模型权重系数计算所述目标患者的目标标签累计值,包括:
获取所述目标患者携带的每个目标标签的目标标签权重及目标标签系数,根据所述目标标签权重及所述目标标签系数计算每个所述目标标签的所述模型相似度系数;
获取每个所述目标标签对应的所述模型权重系数,计算每个所述目标标签的所述模型相似度系数及所述模型权重系数的乘积,将所述乘积进行累加,将累加后的值作为所述目标标签累计值。
4.根据权利要求1所述的方法,其特征在于,所述获取所述至少一个历史患者的历史标签累计值,包括:
获取每个所述历史患者携带的匹配标签的匹配标签权重及匹配标签系数,根据所述匹配标签权重及所述匹配标签系数计算每个所述匹配标签的匹配相似度系数;
获取每个所述匹配标签对应的匹配权重系数,计算每个所述匹配标签的所述匹配相似度系数及所述匹配权重系数的乘积,将所述乘积进行累加,将累加后的值作为所述历史标签累计值。
5.根据权利要求1所述的方法,其特征在于,所述将所述目标标签累计值与每个所述历史标签累计值进行相似度匹配,获取每个所述历史患者与所述目标患者的相似度匹配值,包括:
计算所述目标标签累计值与每个所述历史标签累计值的相似度比值,将所述相似度比值作为每个所述历史患者与所述目标患者的相似度匹配值。
6.根据权利要求1所述的方法,其特征在于,在所述将所述相似度匹配值最高的历史患者作为所述目标患者的同一身份患者之后,还包括:
根据所述相似度匹配值计算所述目标患者的相似度偏差值;
根据所述相似度偏差值对所述模型相似度系数及所述模型权重系数进行系数修正,以使得所述相似度偏差值小于偏差值阈值。
7.根据权利要求1所述的方法,其特征在于,所述对所述患者样本数据进行数据预处理,获取预处理后的目标样本数据,包括:
对所述患者样本数据的进行命名规范处理,获取命名规范处理后的规范样本数据;
对所述规范样本数据中的无效数据和/或非规范数据进行清除处理,获取清除处理后的所述目标样本数据。
8.一种患者身份识别装置,其特征在于,所述装置包括:
数据处理模块,用于获取至少一个历史患者的患者样本数据,根据所述患者样本数据建立患者样本数据库,对所述患者样本数据进行数据预处理,获取预处理后的目标样本数据;
标签分类模块,用于获取归类标准,根据所述归类标准对每个所述历史患者的所述目标样本数据进行标签归类;
相似度计算模块,用于获取目标患者的模型相似度系数及模型权重系数,根据所述模型相似度系数及所述模型权重系数计算所述目标患者的目标标签累计值;
匹配模块,用于获取所述至少一个历史患者的历史标签累计值,将所述目标标签累计值与每个所述历史标签累计值进行相似度匹配,获取每个所述历史患者与所述目标患者的相似度匹配值,将所述相似度匹配值最高的历史患者作为所述目标患者的同一身份患者。
9.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
10.一种患者身份识别设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011039231.5A CN112233740B (zh) | 2020-09-28 | 2020-09-28 | 患者身份识别方法、装置、设备和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011039231.5A CN112233740B (zh) | 2020-09-28 | 2020-09-28 | 患者身份识别方法、装置、设备和介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112233740A true CN112233740A (zh) | 2021-01-15 |
CN112233740B CN112233740B (zh) | 2024-03-29 |
Family
ID=74120254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011039231.5A Active CN112233740B (zh) | 2020-09-28 | 2020-09-28 | 患者身份识别方法、装置、设备和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112233740B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116072303A (zh) * | 2023-04-03 | 2023-05-05 | 南京吾爱网络技术有限公司 | 一种医院信息科用医疗信息卡数据识别系统和方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999017218A1 (en) * | 1997-10-01 | 1999-04-08 | Cloninger Timothy N | A container for preventing errors in the dispensing of pharmaceuticals to patients in a health care environment |
EP2287760A1 (en) * | 2004-02-19 | 2011-02-23 | Neoteric Technology, Limited | Method for managing the remote electronic issue of blood units |
WO2017041651A1 (zh) * | 2015-09-09 | 2017-03-16 | 阿里巴巴集团控股有限公司 | 一种用户数据分类的方法和设备 |
CN109215754A (zh) * | 2018-09-10 | 2019-01-15 | 平安科技(深圳)有限公司 | 病历数据处理方法、装置、计算机设备和存储介质 |
CN109948729A (zh) * | 2019-03-28 | 2019-06-28 | 北京三快在线科技有限公司 | 司机身份识别方法及装置、电子设备 |
WO2019232891A1 (zh) * | 2018-06-06 | 2019-12-12 | 平安科技(深圳)有限公司 | 用户画像获取方法、装置、计算机设备以及存储介质 |
CN110609935A (zh) * | 2019-08-29 | 2019-12-24 | 湖南草花互动网络科技有限公司 | 用户身份标签生成方法、装置、计算机设备和存储介质 |
WO2020019451A1 (zh) * | 2018-07-27 | 2020-01-30 | 平安科技(深圳)有限公司 | 人脸识别方法、装置、计算机设备及存储介质 |
CN111192025A (zh) * | 2019-12-31 | 2020-05-22 | 广东德诚科教有限公司 | 职业信息匹配方法、装置、计算机设备和存储介质 |
-
2020
- 2020-09-28 CN CN202011039231.5A patent/CN112233740B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO1999017218A1 (en) * | 1997-10-01 | 1999-04-08 | Cloninger Timothy N | A container for preventing errors in the dispensing of pharmaceuticals to patients in a health care environment |
EP2287760A1 (en) * | 2004-02-19 | 2011-02-23 | Neoteric Technology, Limited | Method for managing the remote electronic issue of blood units |
WO2017041651A1 (zh) * | 2015-09-09 | 2017-03-16 | 阿里巴巴集团控股有限公司 | 一种用户数据分类的方法和设备 |
WO2019232891A1 (zh) * | 2018-06-06 | 2019-12-12 | 平安科技(深圳)有限公司 | 用户画像获取方法、装置、计算机设备以及存储介质 |
WO2020019451A1 (zh) * | 2018-07-27 | 2020-01-30 | 平安科技(深圳)有限公司 | 人脸识别方法、装置、计算机设备及存储介质 |
CN109215754A (zh) * | 2018-09-10 | 2019-01-15 | 平安科技(深圳)有限公司 | 病历数据处理方法、装置、计算机设备和存储介质 |
CN109948729A (zh) * | 2019-03-28 | 2019-06-28 | 北京三快在线科技有限公司 | 司机身份识别方法及装置、电子设备 |
CN110609935A (zh) * | 2019-08-29 | 2019-12-24 | 湖南草花互动网络科技有限公司 | 用户身份标签生成方法、装置、计算机设备和存储介质 |
CN111192025A (zh) * | 2019-12-31 | 2020-05-22 | 广东德诚科教有限公司 | 职业信息匹配方法、装置、计算机设备和存储介质 |
Non-Patent Citations (4)
Title |
---|
ZHAO, DS,等: "An Improved User Identification Method Across Social Networks Via Tagging Behaviors", 2018 IEEE 30TH INTERNATIONAL CONFERENCE ON TOOLS WITH ARTIFICIAL INTELLIGENCE (ICTAI), pages 616 - 622 * |
姚华彦,等: "基于大数据的患者画像标签体系构建方法及应用研究", 中国卫生信息管理杂志, no. 06, pages 667 - 671 * |
常盛: "新媒体环境下基于用户画像的智慧图书馆建设", 科技与创新, no. 18, pages 138 - 139 * |
杨菁,等: "一种基于KNN算法的客户身份识别方法", 电力大数据, vol. 22, no. 04, pages 67 - 73 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116072303A (zh) * | 2023-04-03 | 2023-05-05 | 南京吾爱网络技术有限公司 | 一种医院信息科用医疗信息卡数据识别系统和方法 |
CN116072303B (zh) * | 2023-04-03 | 2023-06-02 | 南京吾爱网络技术有限公司 | 一种医院信息科用医疗信息卡数据识别系统和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112233740B (zh) | 2024-03-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11295446B2 (en) | Method and system for computer-aided triage | |
CN110880361B (zh) | 一种个性化精准用药推荐方法及装置 | |
CN106919793B (zh) | 一种医疗大数据的数据标准化处理方法及装置 | |
CN110910976A (zh) | 病历检测方法、装置、设备和存储介质 | |
CN108288499B (zh) | 一种自动分诊方法及装置 | |
CN110706786B (zh) | 非接触式心理参数智能分析与评测系统 | |
CN110570916A (zh) | 就诊辅助方法、系统、装置及存储介质 | |
CN108899063B (zh) | 体检数据处理方法、装置、计算机设备和存储介质 | |
CN112562860A (zh) | 分类模型的训练方法及装置、冠心病辅助筛查方法及装置 | |
CN112908443A (zh) | 医疗诊断结果的校验方法及装置、电子设备、存储介质 | |
CN112233740A (zh) | 患者身份识别方法、装置、设备和介质 | |
CN112802598A (zh) | 基于语音诊疗数据的实时辅助诊疗方法及系统 | |
CN108630287B (zh) | 数据整合方法 | |
CN108831560B (zh) | 一种确定医疗数据属性数据的方法和装置 | |
CN116469505A (zh) | 数据处理方法、装置、计算机设备及可读存储介质 | |
CN112116976A (zh) | 药品信息的处理方法、装置及计算机可读存储介质 | |
CN108847281A (zh) | 体检数据的处理方法、装置及电子设备 | |
CN115101193A (zh) | 一种症状推荐方法、设备及计算机可读存储介质 | |
CN114748055A (zh) | 三维卷积模型、脑龄识别方法、装置、计算机设备及介质 | |
CN111667922A (zh) | 一种临床诊疗数据录入系统和方法 | |
CN112017784A (zh) | 一种基于多模态数据的冠心病风险预测方法及相关设备 | |
CN117524464B (zh) | 一种基于大数据的计算手术后目标血红蛋白的方法及系统 | |
KR20190111284A (ko) | 건강검진 결과 스캔 및 분석방법 | |
US20100312732A1 (en) | Methods and systems for response detection and efficacy | |
CN116487049B (zh) | 基于决策分析的非计划重返事件处理系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB02 | Change of applicant information |
Address after: 510700 No. 10, helix 3 Road, International Biological Island, Huangpu District, Guangzhou City, Guangdong Province Applicant after: GUANGZHOU KINGMED CENTER FOR CLINICAL LABORATORY Applicant after: GUANGZHOU KINGMED DIAGNOSTICS GROUP Co.,Ltd. Address before: 510330 Guangdong Guangzhou Haizhuqu District Xingang East Road 2429, 3rd floor. Applicant before: GUANGZHOU KINGMED CENTER FOR CLINICAL LABORATORY Applicant before: GUANGZHOU KINGMED DIAGNOSTICS GROUP Co.,Ltd. |
|
CB02 | Change of applicant information | ||
GR01 | Patent grant | ||
GR01 | Patent grant |