CN112786130B - 一种获取病历主诊断信息的方法、装置、存储介质和设备 - Google Patents

一种获取病历主诊断信息的方法、装置、存储介质和设备 Download PDF

Info

Publication number
CN112786130B
CN112786130B CN202011627458.1A CN202011627458A CN112786130B CN 112786130 B CN112786130 B CN 112786130B CN 202011627458 A CN202011627458 A CN 202011627458A CN 112786130 B CN112786130 B CN 112786130B
Authority
CN
China
Prior art keywords
diagnostic information
field
fields
specific field
specific
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011627458.1A
Other languages
English (en)
Other versions
CN112786130A (zh
Inventor
王燕
李林峰
刘婷婷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yidu Cloud Beijing Technology Co Ltd
Original Assignee
Yidu Cloud Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yidu Cloud Beijing Technology Co Ltd filed Critical Yidu Cloud Beijing Technology Co Ltd
Priority to CN202011627458.1A priority Critical patent/CN112786130B/zh
Publication of CN112786130A publication Critical patent/CN112786130A/zh
Application granted granted Critical
Publication of CN112786130B publication Critical patent/CN112786130B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medical Informatics (AREA)
  • Epidemiology (AREA)
  • Primary Health Care (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Toxicology (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开一种获取病历主诊断信息的方法,该方法应用于一医疗系统,该医疗系统包括多种业务类型,针对特定用户,产生至少一种业务类型的业务数据,该方法包括:获取所述特定用户的所有业务类型的业务数据,所述业务数据包括具有第一特定字段的第一业务数据和不具有所述第一特定字段的第二业务数据,所述第一特定字段用于记录所述特定用户在相应业务类型下的第一诊断信息;从所有第一诊断信息中筛选出主诊断信息;将所述主诊断信息与具有第二特定字段的所述第二业务数据中记录的第二诊断信息进行比对,确定比对结果一致时,将所述主诊断信息作为所述特定用户的诊断信息。

Description

一种获取病历主诊断信息的方法、装置、存储介质和设备
技术领域
本发明涉及数据处理技术,尤其涉及一种获取病历主诊断信息的方法、装置、存储介质和设备。
背景技术
在医疗领域,一份患者病历中包括多个字段,每个字段用于记录相应的患者信息,例如,诊断结论字段用于记录病患当次就诊诊断出的主要疾病的信息,简称为诊断信息,诊断信息中包括疾病类型字段、诊断时间字段、诊断顺位字段等。这些病历的内容对于医疗领域的科研分析有一定的价值。但是有些字段在系统中存在大量无值、无效值的情况,导致该份病历的诊断信息无法确定,有些病历中存在多个诊断信息无法确定主诊断信息,从而使该份病历无法用于科研分析,研究者就需要获取更多病历或者手动对电子病历进行修复,而针对某些疾病可能无法获取到更多的病历,从而影响科研效果,手动修复也会带来大量的额外人工工作量,难以提升科研效率。
发明内容
本发明提供一种获取病历主诊断信息的方法、装置、存储介质和设备,以至少解决现有技术中存在的以上技术问题。
本发明第一方面提供一种获取病历主诊断信息的方法,该方法应用于一医疗系统,该医疗系统包括多种业务类型,针对特定用户,产生至少一种业务类型的业务数据,该方法包括:
获取所述特定用户的所有业务类型的业务数据,所述业务数据包括具有第一特定字段的第一业务数据和不具有所述第一特定字段的第二业务数据,所述第一特定字段用于记录所述特定用户在相应业务类型下的第一诊断信息;
从所有第一诊断信息中筛选出主诊断信息;
将所述主诊断信息与具有第二特定字段的所述第二业务数据中记录的第二诊断信息进行比对,确定比对结果一致时,将所述主诊断信息作为所述特定用户的诊断信息。
其中,所述获取所述特定用户的所有业务类型的业务数据,包括:
根据所述特定用户的基本信息,计算出所述特定用户的唯一标识号;所述基本信息至少包括:姓名、性别和身份证号;
根据所述唯一标识号查询所述医疗系统中所有业务类型的业务数据,获取具有相同唯一标识号的业务数据,作为所述特定用户的业务数据。
其中,所述从所有第一诊断信息中筛选出主诊断信息,包括:
针对任意一个第一特定字段:
确定第一特定字段的质量、第一特定字段的优先级和第一特定字段记录的第一诊断信息的一致性;
根据所述第一特定字段的质量、第一特定字段的优先级和第一特定字段记录的第一诊断信息的一致性,计算第一特定字段的分值;
将所有第一特定字段中分值最高的作为主特定字段;
将主特定字段记录的第一诊断信息作为主诊断信息。
其中,所述确定第一特定字段的质量,包括:
统计第一特定字段记录的第一诊断信息中包含的有效字段的数量;
统计第一特定字段记录的第一诊断信息中文本的重复率;
统计第一特定字段记录的第一诊断信息中所有字段的数据量;
统计第一特定字段记录的第一诊断信息中所有字段中标准字段的数量;
根据所述有效字段的数量、所述文本的重复率、所述所有字段的数据量和所述标准字段的数量,计算所述第一特定字段的质量。
其中,所述确定第一特定字段的优先级,包括:
所述第一特定字段记录的第一诊断信息中包括诊断顺位字段,根据所述诊断顺位字段的值确定第一特定字段的优先级。
其中,所述确定第一特定字段记录的第一诊断信息的一致性,包括:
从所述第一特定字段记录的第一诊断信息中获取疾病类型字段;
从所述第二业务数据中获取所述特定用户的第一症状字段、第一用药字段、第一手术字段和第一异常检查字段;
根据所述疾病类型字段到所述医疗系统的数据库中查找与所述疾病类型字段关联的第二症状字段、第二用药字段、第二手术字段和第二异常检查字段;
将所述第一诊断信息中记录的所有第一症状字段与所述查找到的所有第二症状字段进行比对,确定相同症状字段的数量;
将所述第一诊断信息中记录的所有第一用药字段与所述查找到的所有第二用药字段进行比对,确定相同用药字段的数量;
将所述第一诊断信息中记录的所有第一手术字段与所述查找到的所有第二手术字段进行比对,确定相同手术字段的数量;
将所述第一诊断信息中记录的所有第一异常检验字段与所述查找到的所有第二异常检验字段进行比对,确定相同异常检验字段的数量;
根据所述相同症状字段的数量、相同用药字段的数量、相同手术字段的数量和相同异常检验字段的数量,计算所述第一特定字段记录的第一诊断信息的一致性。
其中,将所述主诊断信息与具有第二特定字段的所述第二业务数据中记录的第二诊断信息进行比对,包括:
将所述主诊断信息中的疾病类型字段对应的ICD编码和所述第二诊断信息中的疾病类型字段的ICD编码进行比对。
本发明另一方面提供了一种获取主诊断信息的装置,该装置应用于一医疗系统,该医疗系统包括多种业务类型,针对特定用户,产生至少一种业务类型的业务数据,该装置包括:
获取模块,用于获取所述特定用户的所有业务类型的业务数据,所述业务数据包括具有第一特定字段的第一业务数据和不具有所述第一特定字段的第二业务数据,所述第一特定字段用于记录所述特定用户在相应业务类型下的第一诊断信息;
筛选模块,用于从所有第一诊断信息中筛选出主诊断信息;
比对模块,用于将所述主诊断信息与具有第二特定字段的所述第二业务数据中记录的第二诊断信息进行比对,确定比对结果一致时,将所述主诊断信息作为所述特定用户的诊断信息。
本发明第三方面提供一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现以上任一所述的诊断信息的筛选方法。
本发明第四方面提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现以上任一所述的诊断信息的筛选方法。
在上述的方案中,将用户所有的业务数据合并起来作为一份电子病历,基于电子病历中的所有业务数据,确定出正确的主诊断信息,从而使该份电子病历中所有业务数据的有效性得到了提升,避免了诊断信息缺失导致的电子病历失效的情况。
附图说明
图1示出了本发明一实施例提供的诊断信息的筛选方法的流程示意图;
图2示出了本发明另一实施例提供的特定字段的分值计算过程示意图;
图3示出本发明一实施例提供的诊断信息的筛选装置的结构示意图。
具体实施方式
为使本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而非全部实施例。基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如图1所示,本发明实施例提供了一种获取病历主诊断信息的方法,该方法应用于一医疗系统,该医疗系统包括多种业务类型,针对特定用户,产生至少一种业务类型的业务数据,该方法包括:
步骤101,获取所述特定用户的所有业务类型的业务数据,所述业务数据包括具有第一特定字段的第一业务数据和不具有所述第一特定字段的第二业务数据,所述第一特定字段用于记录所述特定用户在相应业务类型下的第一诊断信息。
通常,医疗系统的数据可分为多种业务类型,例如:入院、出院、转科、手术、门诊等等,有些业务类型针对用户产生的一份业务数据中会包含用于描述诊断信息的特定字段,该特定字段的名称在该医疗系统中统一命名。例如,特定字段的名称为诊断结论,包含诊断结论字段的业务类型有入院、出院、门诊等等。为了描述方便,本发明示例中,将诊断结论字段称为第一特定字段,将包含第一特定字段的业务数据称为第一业务数据,当然,第一特定字段的名称在不同的系统中可能对应不同的名称,例如,可以为诊断名称等,将第一特定字段记录的诊断信息称为第一诊断信息。
而一些业务类型产生的业务数据不包含该第一特定字段,例如,手术、用药、异常检查、症状等。但是,这些类型的业务数据中可能也会记录诊断信息,例如手术类型的业务数据中可能包括手术结论字段,该字段中可能会包含诊断信息,再例如异常检查类型的业务数据中可能包括检查结果字段,该字段也可能会包含诊断信息。为了描述方便,本发明示例中,将获取的用户的所有业务数据中不包含第一特定字段的称为第二业务数据,第二业务数据中有些包含了第二特定字段(手术结论字段、检查结果字段等可能会记录有诊断信息的字段),将第二特定字段记录的诊断信息称为第二诊断信息。
需要指出的是,在一个医疗系统中,所有类型的第一业务数据中通过第一特定字段记录的第一诊断信息中包含了固定的多个字段,例如疾病类型字段、诊断顺位字段、诊断时间字段等。
在获取特定用户的所有业务类型的业务数据时:
可以根据所述特定用户的基本信息,计算出该特定用户的唯一标识号,例如可以采用哈希算法;这里,用户的基本信息至少包括:姓名、性别和身份证号。
根据用户的唯一标识号查询医疗系统中所有业务类型的业务数据,获取具有相同唯一标识号的业务数据,作为该特定用户的业务数据。
在一个示例中,在产生用户的业务数据时,即可根据用户的基本信息计算出该用户的唯一标识号,在保存该业务数据时,将该业务数据与该唯一标识号进行关联,那么,在查找时,可直接根据特定的用户的唯一标识号,到数据库中查找相同的唯一标识号,获取其关联的业务数据。
在另一个示例中,在查找时,可以实时的根据用户的基本信息计算业务数据对应的唯一标识号,与特定用户的唯一标识号进行比较,一致时,获取该业务数据。
在获取了特定用户的所有业务数据之后,将这些业务数据汇总,生成一张电子病历,该电子病历中包含多个业务类型的第一业务数据和多个类型的第二业务数据。
步骤102,从所有第一诊断信息中筛选出主诊断信息。
根据用户的唯一标识号获取到了多种业务类型的第一业务数据,每种第一业务数据都包含了第一特定字段,那么需要从中筛选出主特定字段,将主特定字段记录的第一诊断信息做主诊断信息。
需要指出的是,在一个业务类型的第一业务数据中,其第一特定字段可能记录了多条第一诊断信息,例如,入院表的用户A的第一业务数据中的诊断结论字段记录了3条第一诊断信息;出院表用户A的第一业务数据中的诊断结论字段中记录了1条第一诊断信息。
那么首先,需要针对一个第一特定字段记录了多条第一诊断信息的情况,需要从多条第一诊断信息中筛选出一条作为该第一特定字段的第一诊断信息,具体的:可将每条第一诊断信息视为一个第一特定字段,计算每个第一特定字段的分值,选出分值最高的作为该第一业务数据唯一的第一特定字段。
当每个类型的第一业务数据均具有一条第一诊断信息时,针对每个类型的第一业务数据的第一特定字段计算其分值,选出分值最高的作为主特定字段,将主特定字段的第一诊断信息作为主诊断信息。
这里,针对每个第一特定字段的分值计算过程均如图2所示:
步骤201,确定三个计算因子:1、第一特定字段的质量Q;2、第一特定字段的优先级L;3、第一特定字段记录的第一诊断信息的一致性C;
步骤202,根据上述三个因子,计算该第一特定字段的分值:
Score=α×Q+β×L+γ×C,其中,α、β、γ为各因子的权重。
上述三个计算因子的确定过程如下:
1、第一特定字段的质量Q:
统计第一特定字段记录的第一诊断信息中包含的有效字段的数量(也可以称之为有效性):第一诊断信息中包含了固定的多个字段(例如,疾病类型字段、诊断顺位字段、诊断时间字段等等),有些字段无值、有些字段的值是乱码、有些字段信息不全无法识别出其准确含义,这些都是无效字段,能够识别出字段准确含义的都是有效字段;
统计第一特定字段记录的第一诊断信息中文本的重复率:第一诊断信息的多个字段的值、即文本的重复率,例如,第一诊断信息中多次出现“胃癌”,多次出现“中期”等内容,这里可以采用文本重复率的计算方式进行计算。
统计第一特定字段记录的第一诊断信息中所有字段的数据量:这里的数据量也可称为字段长度(字节数),所有字段的长度的总和即为诊断信息的内容长度;
统计第一特定字段记录的第一诊断信息中标准字段的数量(也可称之为标准程度):其中,数据库中可记录有用于描述诊断信息的所有标准字段,那么,第一诊断信息中的字段和数据库中记录的标准字段进行比对,字段的值一致的即为标准字段,例如,第一诊断信息中疾病类型字段的值为胃癌,数据库中疾病类型字段关联多个值:胃癌、肺癌、肺结核等等,经过比对,第一诊断信息中疾病类型字段(胃癌)为标准字段。
基于上述有效字段的数量、文本的重复率、所有字段的数据量和标准字段的数量,计算第一特定字段的质量Q,本发明示例中对于计算方法不做限制。
2、第一特定字段的优先级L:
第一诊断信息中包括诊断顺位字段,根据所述诊断顺位字段的值确定第一特定字段的优先级,例如,诊断顺位为1,则优先级L为最高(可用1来表示);诊断顺位为2,则优先级L为次高(可用2来表示),诊断顺位为3至N中任一,则优先级L为最低(可用3来表示)。
3、第一特定字段记录的第一诊断信息的一致性C
第一诊断信息的一致性就是要看该特定用户的电子病历中,第二业务数据中记录的症状字段、手术字段、用药字段、异常检查字段等,是否与数据库中记录的同一疾病类型的症状字段、手术字段、用药字段、异常检查字段等一致。过程如下:
首先,从第一诊断信息中提取疾病类型字段;从第二业务数据中获取特定用户的第一症状字段、第一用药字段、第一手术字段和第一异常检查字段;
其次,根据所述疾病类型字段到所述医疗系统的数据库中查找与所述疾病类型字段关联的第二症状字段、第二用药字段、第二手术字段和第二异常检查字段;
其次,确认以下四个计算因子:
将所述第一诊断信息中记录的所有第一症状字段与所述查找到的所有第二症状字段进行比对,确定相同症状字段的数量(用S表示);
将所述第一诊断信息中记录的所有第一用药字段与所述查找到的所有第二用药字段进行比对,确定相同用药字段的数量(用D表示);
将所述第一诊断信息中记录的所有第一手术字段与所述查找到的所有第二手术字段进行比对,确定相同手术字段的数量(用O表示);
将所述第一诊断信息中记录的所有第一异常检验字段与所述查找到的所有第二异常检验字段进行比对,确定相同异常检验字段的数量(用LR表示);
根据上述四个计算因子,计算第一特定字段的一致性,一致性C可以用如下的公式表示:
C=W0×S+W1×D+W2×O+W3×LR。其中,W0、W1、W2、W3为各因子的权重。
步骤103,将所述主诊断信息与具有第二特定字段的所述第二业务数据中记录的第二诊断信息进行比对,确定比对结果一致时,将所述主诊断信息作为所述特定用户的诊断信息。
在具有第二特定字段的第二业务数据中搜索疾病类型字段,即在第二特定字段记录的第二诊断信息中搜索疾病类型字段,疾病类型字段的值可以为疾病类型对应的ICD编码;
将主诊断信息中的疾病类型字段对应的ICD编码和第二诊断信息中的疾病类型字段的ICD编码进行比对,ICD编码通常为一个4位编码,基于该4位编码,如果两个ICD编码的第1位和第2位均相同,则确定比对结果一致;如果两个ICD编码的第1位不同,或者,两个ICD编码的第1位相同且第2位不同,则确定比对结果不一致。
确定比对结果一致时,将主诊断信息作为所述特定用户的诊断信息。
确定了特定用户的诊断信息之后,在一个示例中,还可以对诊断信息进行标准化处理,主要是对疾病类型字段的内容进行处理,例如,先对诊断信息中的文本进行归一化处理,将归一化处理后的结果,按照国际疾病分类(international Classification ofdiseases,ICD)进行编码,如此,即使该病例中存在多个无效字段的情形,或者存在多个诊断信息的情形,通过上述的处理也能够对自动的确定该病例的诊断信息,将该病例用于该类疾病的科研工作。
在上述的方案中,将用户所有的业务数据合并起来作为一份电子病历,基于电子病历中的所有业务数据,即使部分字段缺失,或者存在多条诊断信息,均可以计算出正确的诊断信息,从而使该份电子病历中所有业务数据的有效性得到了提升。
下面通过一个具体的示例来说明本发明上述从病历中获取主诊断信息的过程:
假设一个医疗系统有10种业务类型,记为业务类型1-10,用户A在就医时,在每种业务类型下都产生了业务数据,记为业务数据1-10。
1、获取用户A的业务数据
根据用户A的姓名、性别和身份证号,计算出用户A的唯一标识号,根据该标识号能够获取到业务数据1-10,将这些业务数据汇总起来,生成一份电子病历;假设该电子病历中只有业务数据1/2/3中具有“诊断结论”字段、即第一特定字段,记录了第一诊断信息,则业务数据1/2/3为第一业务数据,剩余的为第二业务数据,其中,业务数据5中具有第二特定字段(检查结论字段)记录了第二诊断信息。
2、筛选主诊断信息
业务数据1中的“诊断结论”字段中记录了3条诊断信息(可以视为其具有三个“诊断结论”字段):
诊断1包括如下字段:疾病类型-胃癌,诊断顺位-1,诊断时间2020-1-20;
诊断2包括如下字段:疾病类型-高血压,诊断顺位-2,诊断时间-无;
诊断3包括如下字段:疾病类型-肺结核,诊断顺位-无,诊断时间-无;
业务数据2中的“诊断结论”字段中记录了1条诊断信息,包括如下字段:疾病类型-胃癌,诊断顺位-无,诊断时间-无;
业务数据3中的“诊断结论”字段中1条诊断信息,包括如下字段:疾病类型-乱码,诊断顺位-无,诊断时间-无。
首先,从每种业务类型中确定一个第一特定字段,对于业务类型1,从三个“诊断结论”字段中筛选出一个分值最高的作为业务类型1的第一特定字段,那么针对诊断1、诊断2和诊断3,分别进行计算,以诊断1为例:
计算诊断1的质量Q:诊断1中有效字段数量为3个;
计算诊断1的优先级L:诊断1中诊断顺位为1,则诊断1的优先级为1;
计算诊断1的诊断信息的一致性C:诊断1中疾病类型字段为胃癌,则从数据库中查找所有和胃癌关联的症状字段、用药字段、异常检查字段和手术字段;从第二业务数据中提取用户A的症状字段、用药字段、异常检查字段和手术字段,与查找到的字段进行匹配,最终确定出:4个相同的症状字段(S)为恶心、呕吐、发烧和腹泻,5个相同的用药字段(D)为药品1、药品2、药品3、药品4和药品5、3个相同的异常检查字段(LR)为检查1、检查2和检查3,1个相同的手术字段(O)为手术1。
根据上述S(4)、D(5)、O(1)、LR(3)计算出一致性C;
根据Q、L和C计算出诊断1的分值。
同上述的过程相同,计算出诊断2和诊断3的分值,假设诊断1的分值最高,则将诊断1作为业务类型1的第一特定字段;
同理,计算出业务数据2中“诊断结论”记录的诊断信息的分值和业务数据3中“诊断结论”记录的诊断信息的分值,假设业务数据1中记录的诊断信息(即诊断1记录的诊断信息)的分值最高,则将诊断1记录的诊断信息作为用户A的主诊断信息。
3、对诊断1记录的诊断信息进行验证
在业务数据5的检查结论字段中搜索疾病类型字段;
可以根据疾病类型字段的值查找对应的ICD编码,将主诊断信息中的疾病类型字段对应的ICD编码和检查结论字段中的疾病类型字段的ICD编码进行比对,例如,C16.5(胃小弯)和C16.6(胃大弯)中前3位编码均相同,则可认为比对结果一致;再例如,C16.5(胃小弯)和C15.9(食管)中,前2位编码相同,第3位编码不同,可以认为比对结果不一致;如果第1编码相同、第2位编码不同,则比对结果不一致;如果第1编码不相同,则比对结果不一致。
如图3所示,本发明一实施例提供了一种获取主诊断信息的装置结构示意图,包括:
获取模块10,用于获取所述特定用户的所有业务类型的业务数据,所述业务数据包括具有第一特定字段的第一业务数据和不具有所述第一特定字段的第二业务数据,所述第一特定字段用于记录所述特定用户在相应业务类型下的第一诊断信息;
筛选模块20,用于从所有第一诊断信息中筛选出主诊断信息;
比对模块30,用于将所述主诊断信息与具有第二特定字段的所述第二业务数据中记录的第二诊断信息进行比对,确定比对结果一致时,将所述主诊断信息作为所述特定用户的诊断信息。
其中,所述获取模块10,还用于根据所述特定用户的基本信息,计算出所述特定用户的唯一标识号;所述基本信息至少包括:姓名、性别和身份证号;根据所述唯一标识号查询所述医疗系统中所有业务类型的业务数据,获取具有相同唯一标识号的业务数据,作为所述特定用户的业务数据。
所述从所有第一诊断信息中筛选出主诊断信息时,所述筛选模块20,还用于针对任意一个第一特定字段:
确定第一特定字段的质量、第一特定字段的优先级和第一特定字段记录的第一诊断信息的一致性;
根据所述第一特定字段的质量、第一特定字段的优先级和第一特定字段记录的第一诊断信息的一致性,计算第一特定字段的分值;
将所有第一特定字段中分值最高的作为主特定字段;
将主特定字段记录的第一诊断信息作为主诊断信息。
所述确定第一特定字段的质量时,所述筛选模块20,还用于统计第一特定字段记录的第一诊断信息中包含的有效字段的数量;
统计第一特定字段记录的第一诊断信息中文本的重复率;
统计第一特定字段记录的第一诊断信息中所有字段的数据量;
统计第一特定字段记录的第一诊断信息中所有字段中标准字段的数量;
根据所述有效字段的数量、所述文本的重复率、所述所有字段的数据量和所述标准字段的数量,计算所述第一特定字段的质量。
所述确定第一特定字段的优先级时,所述筛选模块20,根据诊断顺位字段的值确定第一特定字段的优先级,所述第一特定字段记录的第一诊断信息中包括诊断顺位字段。
所述确定第一特定字段记录的第一诊断信息的一致性时,所述筛选模块,还用于:
从所述第一特定字段记录的第一诊断信息中获取疾病类型字段;
从所述第二业务数据中获取所述特定用户的第一症状字段、第一用药字段、第一手术字段和第一异常检查字段;
根据所述疾病类型字段到所述医疗系统的数据库中查找与所述疾病类型字段关联的第二症状字段、第二用药字段、第二手术字段和第二异常检查字段;
将所述第一诊断信息中记录的所有第一症状字段与所述查找到的所有第二症状字段进行比对,确定相同症状字段的数量;
将所述第一诊断信息中记录的所有第一用药字段与所述查找到的所有第二用药字段进行比对,确定相同用药字段的数量;
将所述第一诊断信息中记录的所有第一手术字段与所述查找到的所有第二手术字段进行比对,确定相同手术字段的数量;
将所述第一诊断信息中记录的所有第一异常检验字段与所述查找到的所有第二异常检验字段进行比对,确定相同异常检验字段的数量;
根据所述相同症状字段的数量、相同用药字段的数量、相同手术字段的数量和相同异常检验字段的数量,计算所述第一特定字段记录的第一诊断信息的一致性。
所述比对模块30,还用于将所述主诊断信息中的疾病类型字段对应的ICD编码和所述第二诊断信息中的疾病类型字段的ICD编码进行比对,确定比对结构是否一致。
此外,本发明一实施例还提供一种设备,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现上述的诊断信息的筛选方法。
本发明另一实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的诊断信息的筛选方法。
所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种获取病历主诊断信息的方法,其特征在于,该方法应用于一医疗系统,该医疗系统包括多种业务类型,针对特定用户,产生至少一种业务类型的业务数据,该方法包括:
获取所述特定用户的所有业务类型的业务数据,所述业务数据包括具有第一特定字段的第一业务数据和不具有所述第一特定字段的第二业务数据,所述第一特定字段用于记录所述特定用户在相应业务类型下的第一诊断信息;
若所述业务类型对应的第一特定字段记录了多条第一诊断信息,则根据第一特定字段的质量、第一特定字段的优先级和第一特定字段记录的第一诊断信息的一致性,计算第一特定字段的分值,所述第一特定字段的质量根据有效字段的数量、文本的重复率、所有字段的数据量和标准字段的数量确定;
从所述多条第一诊断信息中筛选出分值最高的第一诊断信息作为所述业务类型对应的第一特定字段的第一诊断信息;
从所有第一诊断信息中筛选出主诊断信息;
将所述主诊断信息与具有第二特定字段的所述第二业务数据中记录的第二诊断信息进行比对,确定比对结果一致时,将所述主诊断信息作为所述特定用户的诊断信息。
2.根据权利要求1所述的方法,其特征在于,所述获取所述特定用户的所有业务类型的业务数据,包括:
根据所述特定用户的基本信息,计算出所述特定用户的唯一标识号;所述基本信息至少包括:姓名、性别和身份证号;
根据所述唯一标识号查询所述医疗系统中所有业务类型的业务数据,获取具有相同唯一标识号的业务数据,作为所述特定用户的业务数据。
3.根据权利要求1所述的方法,其特征在于,所述从所有第一诊断信息中筛选出主诊断信息,包括:
针对任意一个第一特定字段:
确定第一特定字段的质量、第一特定字段的优先级和第一特定字段记录的第一诊断信息的一致性;
根据所述第一特定字段的质量、第一特定字段的优先级和第一特定字段记录的第一诊断信息的一致性,计算第一特定字段的分值;
将所有第一特定字段中分值最高的作为主特定字段;
将主特定字段记录的第一诊断信息作为主诊断信息。
4.根据权利要求3所述的方法,其特征在于,所述确定第一特定字段的质量,包括:
统计第一特定字段记录的第一诊断信息中包含的有效字段的数量;
统计第一特定字段记录的第一诊断信息中文本的重复率;
统计第一特定字段记录的第一诊断信息中所有字段的数据量;
统计第一特定字段记录的第一诊断信息中所有字段中标准字段的数量;
根据所述有效字段的数量、所述文本的重复率、所述所有字段的数据量和所述标准字段的数量,计算所述第一特定字段的质量。
5.根据权利要求3所述的方法,其特征在于,所述确定第一特定字段的优先级,包括:
所述第一特定字段记录的第一诊断信息中包括诊断顺位字段,根据所述诊断顺位字段的值确定第一特定字段的优先级。
6.根据权利要求3所述的方法,其特征在于,所述确定第一特定字段记录的第一诊断信息的一致性,包括:
从所述第一特定字段记录的第一诊断信息中获取疾病类型字段;
从所述第二业务数据中获取所述特定用户的第一症状字段、第一用药字段、第一手术字段和第一异常检查字段;
根据所述疾病类型字段到所述医疗系统的数据库中查找与所述疾病类型字段关联的第二症状字段、第二用药字段、第二手术字段和第二异常检查字段;
将所述第一诊断信息中记录的所有第一症状字段与所述查找到的所有第二症状字段进行比对,确定相同症状字段的数量;
将所述第一诊断信息中记录的所有第一用药字段与所述查找到的所有第二用药字段进行比对,确定相同用药字段的数量;
将所述第一诊断信息中记录的所有第一手术字段与所述查找到的所有第二手术字段进行比对,确定相同手术字段的数量;
将所述第一诊断信息中记录的所有第一异常检验字段与所述查找到的所有第二异常检验字段进行比对,确定相同异常检验字段的数量;
根据所述相同症状字段的数量、相同用药字段的数量、相同手术字段的数量和相同异常检验字段的数量,计算所述第一特定字段记录的第一诊断信息的一致性。
7.根据权利要求1所述的方法,其特征在于,将所述主诊断信息与具有第二特定字段的所述第二业务数据中记录的第二诊断信息进行比对,包括:
将所述主诊断信息中的疾病类型字段对应的ICD编码和所述第二诊断信息中的疾病类型字段的ICD编码进行比对。
8.一种病历主诊断信息的获取装置,其特征在于,该装置应用于一医疗系统,该医疗系统包括多种业务类型,针对特定用户,产生至少一种业务类型的业务数据,该装置包括:
获取模块,用于获取所述特定用户的所有业务类型的业务数据,所述业务数据包括具有第一特定字段的第一业务数据和不具有所述第一特定字段的第二业务数据,所述第一特定字段用于记录所述特定用户在相应业务类型下的第一诊断信息;
判断模块,用于若所述业务类型对应的第一特定字段记录了多条第一诊断信息,则根据第一特定字段的质量、第一特定字段的优先级和第一特定字段记录的第一诊断信息的一致性,计算第一特定字段的分值,所述第一特定字段的质量根据有效字段的数量、文本的重复率、所有字段的数据量和标准字段的数量确定;
筛选模块,用于从所述多条第一诊断信息中筛选出分值最高的第一诊断信息作为所述业务类型对应的第一特定字段的第一诊断信息;
筛选模块,还用于从所有第一诊断信息中筛选出主诊断信息;
比对模块,用于将所述主诊断信息与具有第二特定字段的所述第二业务数据中记录的第二诊断信息进行比对,确定比对结果一致时,将所述主诊断信息作为所述特定用户的诊断信息。
9.一种设备,其特征在于,所述设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7 中任一所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-7 中任一所述的方法。
CN202011627458.1A 2020-12-31 2020-12-31 一种获取病历主诊断信息的方法、装置、存储介质和设备 Active CN112786130B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011627458.1A CN112786130B (zh) 2020-12-31 2020-12-31 一种获取病历主诊断信息的方法、装置、存储介质和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011627458.1A CN112786130B (zh) 2020-12-31 2020-12-31 一种获取病历主诊断信息的方法、装置、存储介质和设备

Publications (2)

Publication Number Publication Date
CN112786130A CN112786130A (zh) 2021-05-11
CN112786130B true CN112786130B (zh) 2022-12-09

Family

ID=75754576

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011627458.1A Active CN112786130B (zh) 2020-12-31 2020-12-31 一种获取病历主诊断信息的方法、装置、存储介质和设备

Country Status (1)

Country Link
CN (1) CN112786130B (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107731269A (zh) * 2017-10-25 2018-02-23 山东众阳软件有限公司 基于原始诊断数据和病历文件数据的疾病编码方法及系统
CN108269607A (zh) * 2016-12-29 2018-07-10 北京康爱营养科技股份有限公司 肿瘤患者营养筛查方法及系统
CN109522302A (zh) * 2018-11-09 2019-03-26 南京医渡云医学技术有限公司 医疗数据处理方法、装置、电子设备及计算机可读介质
CN110827941A (zh) * 2019-11-06 2020-02-21 山东众阳健康科技集团有限公司 电子病历信息校正方法及系统
CN111241806A (zh) * 2019-12-23 2020-06-05 望海康信(北京)科技股份公司 电子病历和病案首页诊断一致性校验方法及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20200043579A1 (en) * 2018-08-06 2020-02-06 David McEwing Diagnositic and treatmetnt tool and method for electronic recording and indexing patient encounters for allowing instant search of patient history

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108269607A (zh) * 2016-12-29 2018-07-10 北京康爱营养科技股份有限公司 肿瘤患者营养筛查方法及系统
CN107731269A (zh) * 2017-10-25 2018-02-23 山东众阳软件有限公司 基于原始诊断数据和病历文件数据的疾病编码方法及系统
CN109522302A (zh) * 2018-11-09 2019-03-26 南京医渡云医学技术有限公司 医疗数据处理方法、装置、电子设备及计算机可读介质
CN110827941A (zh) * 2019-11-06 2020-02-21 山东众阳健康科技集团有限公司 电子病历信息校正方法及系统
CN111241806A (zh) * 2019-12-23 2020-06-05 望海康信(北京)科技股份公司 电子病历和病案首页诊断一致性校验方法及系统

Also Published As

Publication number Publication date
CN112786130A (zh) 2021-05-11

Similar Documents

Publication Publication Date Title
US10818397B2 (en) Clinical content analytics engine
CN110910976A (zh) 病历检测方法、装置、设备和存储介质
CN109920506B (zh) 医疗统计报告生成方法、装置、设备及存储介质
CN112397159B (zh) 临床试验报告自动录入方法及装置、电子设备、存储介质
CN109545317A (zh) 基于住院预测模型判定住院行为的方法及相关产品
WO2018224937A1 (en) Medical coding quality control
US20180210925A1 (en) Reliability measurement in data analysis of altered data sets
CN111177356B (zh) 一种酸碱指标医疗大数据分析方法及系统
CN114141377A (zh) 一种建立诊断规则库的方法、诊断信息审核的方法及设备
CN114155949A (zh) 一种病案首页的审核方法、装置及设备
CN112560400A (zh) 医学数据的处理方法、装置及存储介质
CN109102845B (zh) 医疗单据审核方法、装置、计算机设备和存储介质
CN109545319B (zh) 基于知识关系分析的处方告警方法及终端设备
CN113823414B (zh) 主诊断与主手术匹配检测方法、装置、计算设备和存储介质
WO2020082804A1 (zh) 一种医疗数据分类存储方法和装置
CN114141340A (zh) 一种在医疗过程中进行合理控费的方法、装置及设备
CN112786130B (zh) 一种获取病历主诊断信息的方法、装置、存储介质和设备
CN113626488B (zh) 数据处理方法、装置、电子设备及存储介质
CN115759040A (zh) 一种电子病历解析方法、装置、设备和存储介质
CN115762704A (zh) 一种处方审核方法、装置、设备和存储介质
CN114155968A (zh) 一种建立映射关系的方法、手术操作的审核方法及设备
CN115631823A (zh) 相似病例推荐方法及系统
CN114783557A (zh) 肿瘤患者数据的处理方法和装置、存储介质及处理器
CN113921103A (zh) 鉴别诊断病种敏感性测量方法、装置、电子设备及介质
CN113077857A (zh) 一种医疗数据的关联方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant