CN115269613B - 一种患者主索引构建方法、系统、设备及存储介质 - Google Patents

一种患者主索引构建方法、系统、设备及存储介质 Download PDF

Info

Publication number
CN115269613B
CN115269613B CN202211180934.9A CN202211180934A CN115269613B CN 115269613 B CN115269613 B CN 115269613B CN 202211180934 A CN202211180934 A CN 202211180934A CN 115269613 B CN115269613 B CN 115269613B
Authority
CN
China
Prior art keywords
patient
patient information
attribute
similarity
attributes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211180934.9A
Other languages
English (en)
Other versions
CN115269613A (zh
Inventor
王涌军
岳小波
王宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Huhui Software Co ltd
Original Assignee
Sichuan Huhui Software Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Huhui Software Co ltd filed Critical Sichuan Huhui Software Co ltd
Priority to CN202211180934.9A priority Critical patent/CN115269613B/zh
Publication of CN115269613A publication Critical patent/CN115269613A/zh
Application granted granted Critical
Publication of CN115269613B publication Critical patent/CN115269613B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Theoretical Computer Science (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种患者主索引构建方法、系统、设备及存储介质,所述方法包括:获取多个医疗信息系统中的所有患者信息,每条患者信息均包括多条相关属性;设置其中一条相关属性为标识属性;基于标识属性,对所述患者信息进行初步合并,得到初步合并结果;获取分析模型,采用分析模型对所有患者信息中的多条相关属性进行分析,获取每条相关属性的相似阈值;基于每条所述相关属性的相似阈值,获取所述初步合并结果中各个相关属性的相似总分值;获取相似总分值阈值,基于相似总分值阈值和相似总分值,对初步合并结果再次进行合并;基于合并后的患者信息,构建患者主索引;达到了合并患者在医疗系统内的信息,解决了患者信息混乱的效果。

Description

一种患者主索引构建方法、系统、设备及存储介质
技术领域
本发明涉及计算机技术领域,具体而言,涉及一种患者主索引构建方法、系统、设备及存储介质。
背景技术
在高度信息化的当代,信息化建设深入到各行各业中,在较为追求效率的医疗方面,采用信息化设备提高工作效率尤为重要;在医疗行业的信息化管理中,一般是采用诊疗卡的方式,病人在进入医院时,医院提供一张诊疗卡供病人使用,在就医的过程中,病人所有的相关信息均可以通过诊疗卡获取,提高信息化条件下的工作效率。
但是在实际的使用中,病人每到一次医院,或者在不同的医院就诊,都会获得一张就诊卡,每张就诊卡都会收录病人的信息,这会导致病人在不同地域、不同就诊过程或不同医院的医疗信息混乱,在查询病人的病历、就诊历史和用药史时过程复杂,导致医疗过程的效率降低;产生冗余、多态、无主次、无关联、不匹配、紊乱等信息孤岛现象。
发明内容
本发明的目的在于提供一种患者主索引构建方法、系统、设备及存储介质,其目的在于合并患者在医疗系统内的信息,解决患者信息混乱的问题。
本发明的实施例通过以下技术方案实现:
第一方面
本申请实施例提供一种患者主索引构建方法,所述方法包括:
获取多个医疗信息系统中的所有患者信息,每条所述患者信息均包括多条相关属性;
设置其中一条相关属性为标识属性;
基于所述标识属性,对所述患者信息进行初步合并,得到初步合并结果;
获取分析模型,采用所述分析模型对所有所述患者信息中的多条所述相关属性进行分析,获取每条所述相关属性的相似阈值;
基于每条所述相关属性的相似阈值,获取所述初步合并结果中各个相关属性的相似总分值;
获取相似总分值阈值,基于所述相似总分值阈值和所述相似总分值,对初步合并结果再次进行合并;
基于合并后的患者信息,构建患者主索引。
可选地,所述获取分析模型,采用所述分析模型对所有所述患者信息中的多条所述相关属性进行分析,获取每条所述相关属性的相似阈值,包括:
获取KNN算法模型;
在所有所述患者信息中获取训练集;
采用所述训练集对所述KNN算法模型进行训练,得到分析模型;
将所有所述患者信息输入分析模型,分别获取每条所述相关属性的相似阈值。
可选地,所述相关属性包括姓名、性别、证件类型、证件号码、地址、联系电话和病历数据,设置所述证件号码为标识属性。
可选地,所述基于所述标识属性,对所述患者信息进行初步合并,得到初步合并结果,包括:
A,选取其中一条患者信息,遍历其它所述患者信息,在遍历时将其它所述患者信息的标识属性与选取的患者信息中的标识属性进行对比,得到标识属性对比结果;
B,获取标识属性对比阈值,将所述标识属性对比结果超过标识属性对比阈值的两条患者信息进行初步合并;
重复步骤A-B,直至所有患者信息均完成初步合并。
可选地,所述基于每条所述相关属性的相似阈值,获取所述初步合并结果中各个相关属性的相似总分值,包括:
基于初步合并后的患者信息,获取通过标识属性进行初步合并的多条患者属性中各条相关属性的相似值;
基于所述相似阈值和所述相似值,获取初步合并后多条患者属性中每条所述相关属性的相似分值;
设置每条所述相关属性的相似权重;
基于所述相似权重和每条所述相关属性的相似分值,获取所述初步合并结果中各个相关属性的相似总分值。
可选地,对初步合并结果再次进行合并时,所述相关属性中的姓名、性别、证件类型、证件号码、地址和联系电话均保留。
可选地,所述方法还包括:
获取每个所述患者主索引中包含的所有所述患者信息对应的病历数据;
获取所有所述患者信息对应的所述病历数据的时间顺序;
基于所述时间顺序,对所述病历数据进行合并;
判断所述病历数据中是否存在时间重合部分;
若存在,则进行标记;
基于所述标记,对合并后的所述病历数据进行修正。
第二方面
本申请实施例提供一种患者主索引构建系统,所述系统包括患者信息获取模块、标识属性模块、初次合并模块、相似阈值获取模块、相似总分获取模块、再次合并模块和主索引模块;其中,
患者信息获取模块,用于获取多个医疗信息系统中的所有患者信息,每条所述患者信息均包括多条相关属性;
标识属性模块,用于设置其中一条相关属性为标识属性;
初次合并模块,基于所述标识属性,对所述患者信息进行初步合并,得到初步合并结果;
相似阈值获取模块,用于获取分析模型,采用所述分析模型对所有所述患者信息中的多条所述相关属性进行分析,获取每条所述相关属性的相似阈值;
相似总分获取模块,用于基于每条所述相关属性的相似阈值,获取所述初步合并结果中各个相关属性的相似总分值;
再次合并模块,用于获取相似总分值阈值,基于所述相似总分值阈值和所述相似总分值,对初步合并结果再次进行合并;
主索引模块,用于基于合并后的患者信息,构建患者主索引。
第三方面
本申请实施例提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行实施例第一方面所述的一种患者主索引构建方法。
第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如实施例第一方面所述的一种患者主索引构建方法。
本发明实施例的技术方案至少具有如下优点和有益效果:对多个医疗信息系统中的所有患者信息进行合并时,首先通过标识属性进行初步合并,初步合并后得到的初步合并结果能够在一定程度上反应两条患者信息之间的相似程度,但是初步合成结果可能会存在错误,所以通过设置相似阈值对其它的相关属性进行判断,对初步合成结果再次进行合并,合并后的患者信息就具有较高的相似度,通过合并后的患者信息构建得到的主索引可靠性更高,达到合并患者在医疗系统内的信息,解决了患者信息混乱的效果。
附图说明
图1为本发明其中一个实施例提供的一种患者主索引构建方法的流程示意图;
图2为本发明其中一个实施例提供的一种患者主索引构建系统的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。
实施例1
本实施例提供一种患者主索引构建方法,参照图1,所述方法包括下述步骤:
S1,获取多个医疗信息系统中的所有患者信息,每条所述患者信息均包括多条相关属性;
在本实施例中,所述相关属性包括姓名、性别、证件类型、证件号码、地址、联系电话和病历数据。
S2,设置其中一条相关属性为标识属性;
设置所述证件号码为标识属性;在诊疗卡信息中,证件类型一般为居民身份证,而证件号码作为居民身份证的号码,其具有唯一性,所以采用证件号码作为标识属性最佳。
S3,基于所述标识属性,对所述患者信息进行初步合并,得到初步合并结果;
在其中一个实施例中,假设在多个医疗信息系统获得的患者信息包含:“张三、李四、王五、刘六、孙七、张仨、刘流”等七个患者,其中,他们的证件号码脱敏后如下所示:
“张三,512xxxxxxx03051113”、“李四,521xxxxxxx12021104”、“王五,310xxxxxxx05035521”、“刘六,511xxxxxxx04302243”、“孙七,522xxxxxxx05130112”、“张仨,512xxxxxxx03051113”、“刘流,511xxxxxxx04302243”。
参照上述患者信息系,因为有一些医院的诊疗系统需要医生手动输入,导致医生输入错误,出现了一些错误,而这些错误导致了患者信息错乱,在对其进行合并时,会产生冗余、多态、无主次、无关联、不匹配、紊乱等信息孤岛现象。
进行初步合并,主要是为了将产生重合的患者信息进行合并,对获得的所有患者信息进行初步处理。
在进行初步合并,得到初步合并结果时,采用下述步骤:
A,选取其中一条患者信息,遍历其它所述患者信息,在遍历时将其它所述患者信息的标识属性与选取的患者信息中的标识属性进行对比,得到标识属性对比结果;
B,获取标识属性对比阈值,将所述标识属性对比结果超过标识属性对比阈值的两条患者信息进行初步合并;
在对标识属性进行对比,得到对比结果时,采用编辑距离算法(EditDistance)来计算,可得到两个不同字符串之间的相似程度,即两条患者信息中标识属性之间的相似程度,计算得到的标识属性对比结果就能够反应两条患者信息中标识属性的相似程度。
比如,选取“张三,512xxxxxxx03051113”这一条患者信息,然后再对其它的患者信息进行遍历时,通过编辑距离算法计算,可得到“张仨,512xxxxxxx03051113”的标识属性对比结果为0,即将“张三”对应的标识属性中“512xxxxxxx03051113”这个字符串转换为“张仨”的标识属性的字符串的操作步骤为0步。
则通过编辑距离算法得到的对比结果能够判断“张仨”这条患者信息与选取的“张三,512xxxxxxx03051113”标识属性相似程度较高。
而在本实施例中,标识属性对比阈值用于对标识属性对比结果进行判断,若标识属性对比结果超过标识属性对比阈值,则可判断这两条患者属性具有较高的相似度。
在设置标识属性对比阈值时,考虑到可能存在标识属性输入错误的情况,而本实施例中选取的标识属性为证件号码,证件号码一般为18位,所以在本实施例中标识属性对比阈值可设置为3;即在标识属性的字符串中允许出现3个错误值。
重复上述步骤A-B,直至所有患者信息均完成初步合并。
通过不断的选取其中一条患者信息中,然后再遍历所有患者信息与其进行标识属性的对比,能够完成初步合并,初步合并后的患者信息具有一定的相似度,但还不能够判断其属于同一位患者。
S4,获取分析模型,采用所述分析模型对所有所述患者信息中的多条所述相关属性进行分析,获取每条所述相关属性的相似阈值;
获取KNN算法模型;
在实施例中,选用KNN算法模型作为分析模型,KNN是一种非参的、惰性的算法模型。其中,非参的指KNN算法模型不会对数据做出任何的假设,也就是说KNN算法建立的模型结构是根据数据来决定的,这也比较符合现实的情况,毕竟在现实中的情况往往与理论上的假设是不相符的。
通过采用KNN算法模型对本实施例中涉及的患者信息进行分析判断,其结果更加准确。
惰性是指不需要先对数据进行大量训练,就能得到一个适用于本实施例的分析模型;其成本更小。
在所有所述患者信息中获取训练集;
因为KNN算法模型不需要大量训练,所以可直接采用患者信息作为训练集对其进行训练。
采用所述训练集对所述KNN算法模型进行训练,得到分析模型;
在训练时,如,在获取多条所述相关属性中证件号码的相似阈值时,取100条患者信息作为训练集,通过训练,可得到证件号码的相似阈值在1.1-3之间;则可选定3作为证件号码的相似阈值。
将所有所述患者信息输入分析模型,分别获取每条所述相关属性的相似阈值。
通过获取到每条相关属性的相似阈值,就能够在初步合并得到的结果的基础上,再次对患者信息进行合并,得到的结果更加精确。
S5,基于每条所述相关属性的相似阈值,获取所述初步合并结果中各个相关属性的相似总分值;
基于初步合并后的患者信息,获取通过标识属性进行初步合并的多条患者属性中各条相关属性的相似值;
在本实施例中,各条相关属性的相似值也通过编辑距离算法进行计算,其计算过程与计算标识属性对比结果的过程一致;通过对多条相关属性的字符串进行计算,得到的相似值就能够反应多条相关属性之间的相似程度。
基于所述相似阈值和所述相似值,获取所述初步合并后多条患者属性中每条所述相关属性的相似分值;
相似分值需要通过相似值与相似阈值之间的大小关系进行获取;如,相似阈值为3,计算得到的相似值为1,1小于3,且小于程度较大,则说明相似值为1的这条相关属性与初步合成结果中选取的那一条患者信息中对应的相关属性相似程度较大,则其相似分值可评为80分;若计算得到的相似值为4,则说明这条相关属性与初步合成结果中选取的那一条患者信息中对应的相关属性相似程度较小,则其相似分值可评为30分,属于在合并过程中不具备参考价值的相关属性。
设置每条所述相关属性的相似权重;
在设置相似权重时,需要考虑每条相关属性的重要程度进行设置,如:工作人员在输入证件号码时,相比于其他的相关属性,其出现错误的情况较低,若证件号码具有的相似分值较高,则通过判断证件号码证明两条患者信息属于同一个患者的可能性相较与通过其他相关属性判断的可靠性也更高,所以证件号码这条相关属性占据的相似权重也应该设置得更高。
在其中一个实施例中,七条相关属性的相似权重设置为:姓名:0.25、性别:0.05、证件类型:0.1、证件号码:0.35、地址:0.05、联系电话:0.1、病历数据:0.1;在设置时,更偏向于将给其中不易产生变化的相关属性更高的权重,则得到相似总分值更加合理,合并结果更为准确。
基于所述相似权重和每条所述相关属性的相似分值,获取所述初步合并结果中各个相关属性的相似总分值。
S6,获取相似总分值阈值,基于所述相似总分值阈值和所述相似总分值,对初步合并结果再次进行合并;
且在对初步合并结果再次进行合并时,所述相关属性中的姓名、性别、证件类型、证件号码、地址和联系电话均保留;因为在合并过程中,无法判断多条患者信息中,哪一条相关属性是正确的,为了保证信息的完整性,需要保留相关属性中的所有信息。
S7,基于合并后的患者信息,构建患者主索引。
在构建患者主索引时,为每条所述患者信息分配唯一ID;
并将合并后的患者信息与所述唯一ID绑定。
则通过唯一ID,就能够准确的在信息系统中找到对应患者,从而解决解决冗余、多态、无主次、无关联、不匹配、紊乱等信息孤岛现象,提高医疗质量,强化信息化建设,实现医院内外系统互联互通。
在合并完成后,获取每个所述患者主索引中包含的所有所述患者信息对应的病历数据;
因为病历数据是用于记录患者的历史医疗记录的,所以其具有一定的唯一性,即使患者其他的相关信息可能因为输入多次会产生一定的错误,但是病历数据也不易在时间维度上产生重合,所以需要采用下述步骤对病历数据进行处理。
获取所有所述患者信息对应的所述病历数据的时间顺序;
基于所述时间顺序,对所述病历数据进行合并;
在记录病历数据时,病历产生的时间是较为重要的信息,所以通过多条患者信息中包含的病历数据中的时间来对患者的病历数据进行合并,得到结果能够反馈患者在所有医院的就诊情况和用药情况。
判断所述病历数据中是否存在时间重合部分;
若存在,则进行标记;
基于所述标记,对合并后的所述病历数据进行修正。
在病历数据合并后,若是产生时间重合部分,则对其进行标记,在后期由医生或者工作人员对比多条患者信息中的时间重合问题,对合并后的病历数据进行修正,以保证其完整性和有效性。
在本实施例中,对多个医疗信息系统中的所有患者信息进行合并时,首先通过标识属性进行初步合并,初步合并后得到的初步合并结果能够在一定程度上反应两条患者信息之间的相似程度,但是初步合成结果可能会存在错误,所以通过设置相似阈值对其它的相关属性进行判断,对初步合成结果再次进行合并,合并后的患者信息就具有较高的相似度,通过合并后的患者信息构建得到的主索引可靠性更高,达到了合并患者在医疗系统内的信息,解决了患者信息混乱的效果。
实施例2
本实施例提供一种患者主索引构建系统,参照图2,所述系统包括患者信息获取模块、标识属性模块、初次合并模块、相似阈值获取模块、相似总分获取模块、再次合并模块和主索引模块;其中,
患者信息获取模块,用于获取多个医疗信息系统中的所有患者信息,每条所述患者信息均包括多条相关属性;
标识属性模块,用于设置其中一条相关属性为标识属性;
初次合并模块,基于所述标识属性,对所述患者信息进行初步合并,得到初步合并结果;
相似阈值获取模块,用于获取分析模型,采用所述分析模型对所有所述患者信息中的多条所述相关属性进行分析,获取每条所述相关属性的相似阈值;
相似总分获取模块,用于基于每条所述相关属性的相似阈值,获取所述初步合并结果中各个相关属性的相似总分值;
再次合并模块,用于获取相似总分值阈值,基于所述相似总分值阈值和所述相似总分值,对初步合并结果再次进行合并;
主索引模块,用于基于合并后的患者信息,构建患者主索引。
实施例3
本实施例提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如实施例1中任一项所述的一种患者主索引构建方法。
实施例4
本实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如实施例1中任一项所述的一种患者主索引构建方法。
以上仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种患者主索引构建方法,其特征在于,所述方法包括:
获取多个医疗信息系统中的所有患者信息,每条所述患者信息均包括多条相关属性;
设置其中一条相关属性为标识属性;
基于所述标识属性,对所述患者信息进行初步合并,得到初步合并结果;
获取分析模型,采用所述分析模型对所有所述患者信息中的多条所述相关属性进行分析,获取每条所述相关属性的相似阈值;
基于每条所述相关属性的相似阈值,获取所述初步合并结果中各个相关属性的相似总分值;具体为,基于初步合并后的患者信息,获取通过标识属性进行初步合并的多条患者属性中各条相关属性的相似值;基于所述相似阈值和所述相似值,获取初步合并后多条患者属性中每条所述相关属性的相似分值;设置每条所述相关属性的相似权重;基于所述相似权重和每条所述相关属性的相似分值,获取所述初步合并结果中各个相关属性的相似总分值;
获取相似总分值阈值,基于所述相似总分值阈值和所述相似总分值,对初步合并结果再次进行合并;
基于合并后的患者信息,构建患者主索引。
2.根据权利要求1所述的一种患者主索引构建方法,其特征在于:所述获取分析模型,采用所述分析模型对所有所述患者信息中的多条所述相关属性进行分析,获取每条所述相关属性的相似阈值,包括:
获取KNN算法模型;
在所有所述患者信息中获取训练集;
采用所述训练集对所述KNN算法模型进行训练,得到分析模型;
将所有所述患者信息输入分析模型,分别获取每条所述相关属性的相似阈值。
3.根据权利要求1所述的一种患者主索引构建方法,其特征在于:所述相关属性包括姓名、性别、证件类型、证件号码、地址、联系电话和病历数据,设置所述证件号码为标识属性。
4.根据权利要求3所述的一种患者主索引构建方法,其特征在于:所述基于所述标识属性,对所述患者信息进行初步合并,得到初步合并结果,包括:
A,选取其中一条患者信息,遍历其它所述患者信息,在遍历时将其它所述患者信息的标识属性与选取的患者信息中的标识属性进行对比,得到标识属性对比结果;
B,获取标识属性对比阈值,将所述标识属性对比结果超过标识属性对比阈值的两条患者信息进行初步合并;
重复步骤A-B,直至所有患者信息均完成初步合并。
5.根据权利要求3所述的一种患者主索引构建方法,其特征在于:对初步合并结果再次进行合并时,所述相关属性中的姓名、性别、证件类型、证件号码、地址和联系电话均保留。
6.根据权利要求4所述的一种患者主索引构建方法,其特征在于:所述方法还包括:
获取每个所述患者主索引中包含的所有所述患者信息对应的病历数据;
获取所有所述患者信息对应的所述病历数据的时间顺序;
基于所述时间顺序,对所述病历数据进行合并;
判断所述病历数据中是否存在时间重合部分;
若存在,则进行标记;
基于所述标记,对合并后的所述病历数据进行修正。
7.一种患者主索引构建系统,其特征在于:所述系统包括患者信息获取模块、标识属性模块、初次合并模块、相似阈值获取模块、相似总分获取模块、再次合并模块和主索引模块;其中,
患者信息获取模块,用于获取多个医疗信息系统中的所有患者信息,每条所述患者信息均包括多条相关属性;
标识属性模块,用于设置其中一条相关属性为标识属性;
初次合并模块,基于所述标识属性,对所述患者信息进行初步合并,得到初步合并结果;
相似阈值获取模块,用于获取分析模型,采用所述分析模型对所有所述患者信息中的多条所述相关属性进行分析,获取每条所述相关属性的相似阈值;
相似总分获取模块,用于基于每条所述相关属性的相似阈值,获取所述初步合并结果中各个相关属性的相似总分值;
再次合并模块,用于获取相似总分值阈值,基于所述相似总分值阈值和所述相似总分值,对初步合并结果再次进行合并;
主索引模块,用于基于合并后的患者信息,构建患者主索引。
8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的一种患者主索引构建方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6中任一项所述的一种患者主索引构建方法。
CN202211180934.9A 2022-09-27 2022-09-27 一种患者主索引构建方法、系统、设备及存储介质 Active CN115269613B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211180934.9A CN115269613B (zh) 2022-09-27 2022-09-27 一种患者主索引构建方法、系统、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211180934.9A CN115269613B (zh) 2022-09-27 2022-09-27 一种患者主索引构建方法、系统、设备及存储介质

Publications (2)

Publication Number Publication Date
CN115269613A CN115269613A (zh) 2022-11-01
CN115269613B true CN115269613B (zh) 2023-01-13

Family

ID=83757449

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211180934.9A Active CN115269613B (zh) 2022-09-27 2022-09-27 一种患者主索引构建方法、系统、设备及存储介质

Country Status (1)

Country Link
CN (1) CN115269613B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115424735B (zh) * 2022-11-07 2023-01-31 四川互慧软件有限公司 一种电子病历数据交叉互引用方法、系统、设备及介质
CN116386801B (zh) * 2023-06-06 2023-08-11 四川互慧软件有限公司 基于聚类算法构建患者身份标识的方法、装置及电子设备
CN116631561B (zh) * 2023-07-21 2023-09-19 四川互慧软件有限公司 基于特征划分的患者身份信息匹配方法、装置及电子设备
CN116825265A (zh) * 2023-08-29 2023-09-29 先临三维科技股份有限公司 就诊记录处理方法、装置、电子设备及存储介质
CN117851411B (zh) * 2024-03-05 2024-05-10 北方健康医疗大数据科技有限公司 患者主索引生成方法及系统

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295182A (zh) * 2016-08-10 2017-01-04 依据数据(湖南)科技有限公司 一种基于患者生物信息的身份识别方法
CN107193919A (zh) * 2017-05-15 2017-09-22 清华大学深圳研究生院 一种电子病历的检索方法及系统
CN112863672A (zh) * 2021-03-09 2021-05-28 中电健康云科技有限公司 一种基于pso算法优化的患者身份匹配方法
CN113111063A (zh) * 2021-03-31 2021-07-13 中电健康云科技有限公司 一种应用于多数据源的医疗患者主索引发现方法
CN113628707A (zh) * 2021-08-06 2021-11-09 首都医科大学附属北京儿童医院 一种患者病历数据的处理方法、装置、设备和存储介质
CN113742348A (zh) * 2021-09-07 2021-12-03 上海柯林布瑞信息技术有限公司 Cdr系统中的患者数据匹配方法、主索引建立方法及装置
CN113921103A (zh) * 2021-11-08 2022-01-11 卫宁健康科技集团股份有限公司 鉴别诊断病种敏感性测量方法、装置、电子设备及介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7941442B2 (en) * 2007-04-18 2011-05-10 Microsoft Corporation Object similarity search in high-dimensional vector spaces
CN102163226B (zh) * 2011-04-12 2013-03-13 浙江大学 基于映射-化简和分词及邻接排序去重方法
US9336495B2 (en) * 2012-10-28 2016-05-10 Nec Corporation Query generation and time difference features for supervised semantic indexing
CN107608980A (zh) * 2016-07-11 2018-01-19 中国电信股份有限公司 基于dpi大数据分析的信息推送方法和系统
CN109841281B (zh) * 2017-11-29 2023-09-29 郑州大学第一附属医院 基于共表达相似性搭建肺腺癌早期诊断模型
CN111949759A (zh) * 2019-05-16 2020-11-17 北大医疗信息技术有限公司 病历文本相似度的检索方法、系统及计算机设备
CN110600092A (zh) * 2019-08-13 2019-12-20 万达信息股份有限公司 一种应用于医疗领域的人员主索引的生成方法和系统
WO2021070472A1 (ja) * 2019-10-11 2021-04-15 ソニー株式会社 情報処理装置、情報処理システム及び情報処理方法
CN111414393B (zh) * 2020-03-26 2021-02-23 湖南科创信息技术股份有限公司 一种基于医学知识图谱的语义相似病例检索方法及设备
CN111694993B (zh) * 2020-06-11 2023-05-02 北京金山云网络技术有限公司 一种创建数据索引的方法、装置、电子设备及介质
CN111899885A (zh) * 2020-06-28 2020-11-06 万达信息股份有限公司 一种分布式人员事件索引实现方法和系统
CN111785341A (zh) * 2020-06-30 2020-10-16 平安国际智慧城市科技股份有限公司 基于相似性的患者主索引数据合并方法及装置
CN112765162B (zh) * 2020-12-31 2021-11-23 医渡云(北京)技术有限公司 基于多源数据的唯一身份标识的确定方法、装置、介质及设备
CN113934895A (zh) * 2021-09-29 2022-01-14 浪潮云信息技术股份公司 一种辅助建立患者主索引的方法
CN114121204A (zh) * 2021-12-09 2022-03-01 上海森亿医疗科技有限公司 基于患者主索引的患者记录匹配方法、存储介质及设备
CN114490642A (zh) * 2021-12-31 2022-05-13 上海柯林布瑞信息技术有限公司 患者主索引生成方法、装置和介质

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106295182A (zh) * 2016-08-10 2017-01-04 依据数据(湖南)科技有限公司 一种基于患者生物信息的身份识别方法
CN107193919A (zh) * 2017-05-15 2017-09-22 清华大学深圳研究生院 一种电子病历的检索方法及系统
CN112863672A (zh) * 2021-03-09 2021-05-28 中电健康云科技有限公司 一种基于pso算法优化的患者身份匹配方法
CN113111063A (zh) * 2021-03-31 2021-07-13 中电健康云科技有限公司 一种应用于多数据源的医疗患者主索引发现方法
CN113628707A (zh) * 2021-08-06 2021-11-09 首都医科大学附属北京儿童医院 一种患者病历数据的处理方法、装置、设备和存储介质
CN113742348A (zh) * 2021-09-07 2021-12-03 上海柯林布瑞信息技术有限公司 Cdr系统中的患者数据匹配方法、主索引建立方法及装置
CN113921103A (zh) * 2021-11-08 2022-01-11 卫宁健康科技集团股份有限公司 鉴别诊断病种敏感性测量方法、装置、电子设备及介质

Also Published As

Publication number Publication date
CN115269613A (zh) 2022-11-01

Similar Documents

Publication Publication Date Title
CN115269613B (zh) 一种患者主索引构建方法、系统、设备及存储介质
CN102930128B (zh) 医用报告制成支援系统、医用报告制成装置以及医用图像观察装置
CN109741826B (zh) 麻醉评估决策树构建方法及设备
US11842794B2 (en) Variant calling in single molecule sequencing using a convolutional neural network
CN106447475A (zh) 一种自动批量对账方法及系统
CN113742348B (zh) Cdr系统中的患者数据匹配方法、主索引建立方法及装置
CN113934895A (zh) 一种辅助建立患者主索引的方法
CN107767924A (zh) 原始数据核对方法、装置、电子设备及存储介质
CN112420187A (zh) 一种基于迁移联邦学习的医疗疾病分析方法
CN111833984B (zh) 基于机器学习的药品质控分析方法、装置、设备及介质
WO2021159814A1 (zh) 文本数据的错误检测方法、装置、终端设备及存储介质
CN112690802B (zh) 一种检测心电信号的方法、装置、终端及存储介质
CN111679968A (zh) 接口调用异常的检测方法、装置、计算机设备及存储介质
CN111160329A (zh) 一种根因分析的方法及装置
US20110264377A1 (en) Method and system for analysing data sequences
CN111835808B (zh) 数据存储方法及装置、数据读取方法及装置、存储介质
CN108846292A (zh) 脱敏处理方法及装置
CN112801767A (zh) 一种针对新增渠道的账务数据处理方法及装置
CN112213579A (zh) 道岔转辙机故障识别方法及装置
CN115588492A (zh) 一种基于人工智能的导诊方法及系统
US11830594B2 (en) Method and apparatus for template based treatment outcome generation
CN115205032A (zh) 征信查询方法、装置、设备及存储介质
CN113760367A (zh) 一种数据处理方法、装置、电子设备以及存储介质
CN109063097B (zh) 基于区块链的数据对比及共识方法
US20150066384A1 (en) System and method for aligning genome sequence

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant