CN111161817B - 医疗数据标准化处理方法、装置、介质及电子设备 - Google Patents

医疗数据标准化处理方法、装置、介质及电子设备 Download PDF

Info

Publication number
CN111161817B
CN111161817B CN201911418483.6A CN201911418483A CN111161817B CN 111161817 B CN111161817 B CN 111161817B CN 201911418483 A CN201911418483 A CN 201911418483A CN 111161817 B CN111161817 B CN 111161817B
Authority
CN
China
Prior art keywords
medical data
standardized
medical
normalization
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911418483.6A
Other languages
English (en)
Other versions
CN111161817A (zh
Inventor
向杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yidu Cloud Beijing Technology Co Ltd
Original Assignee
Yidu Cloud Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yidu Cloud Beijing Technology Co Ltd filed Critical Yidu Cloud Beijing Technology Co Ltd
Priority to CN201911418483.6A priority Critical patent/CN111161817B/zh
Publication of CN111161817A publication Critical patent/CN111161817A/zh
Application granted granted Critical
Publication of CN111161817B publication Critical patent/CN111161817B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Epidemiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Measuring And Recording Apparatus For Diagnosis (AREA)

Abstract

本发明提供了一种医疗数据标准化处理方法,包括:获取医疗数据;对所述医疗数据中的特定字段进行标准化处理,得到医疗数据中特定字段的标准化结果,基于医疗数据中特定字段的标准化结果和医疗数据中特定字段生成第一医疗数据,第一医疗数据中包含所述医疗数据中的特定字段和医疗数据中特定字段的标准化结果,根据第一医疗数据确定标准化比率和/或标准化准确率,根据标准化比率和/或标准化准确率对所述第一医疗数据进行评估以此方式至少可以在一定程度上解决了相关技术中存在的缺陷,从而实现对医疗数据中特定字段进行标准化处理,即实现全量标准化,进而基于全量标准化结果进行准召率分析,以便于基于全量的准召率进行评估。

Description

医疗数据标准化处理方法、装置、介质及电子设备
技术领域
本发明涉及数据处理的技术领域,具体而言,涉及一种医疗数据标准化处理方法、装置、介质及电子设备。
背景技术
随着医疗信息化的发展,医院信息系统的多样,信息系统中的医疗数据在各个不同场景被医师进行使用,由于医师的背景、习惯等不一致,特别是对于部分需要主观描述的医疗数据的填写,会造成针对同一实际结果不同方式的描写。比如患者的初步诊断一个医师可能书写为“胃癌”,另一个医师可能书写为“胃恶性肿瘤”,或者再有医师可能书写为“胃窦(幽门窦)恶性肿瘤(胃角)”。针对这类情况,通常的方法是对医疗数据进行标准化处理,目前关于医疗专业术语标准化(比如疾病诊断)可以包括两种方法:第一种是提供外部接口服务的方式,按需求进行标准化;第二种是医院将原始数据提供给第三方,让第三方根据使用者的需求进行标准化处理。
但是发明人在实现本发明的构思时发现相关技术存在以下问题:提供外部服务接口的方式,会因为不同医院不同医师的习惯造成接口比较难进行本地化处理,其标准化的准召率很难进行保证,且使用外部接口的方式,很难有全量的准召率评估。医院提供原始数据让第三方进行标准化的方式存在数据从内部到外部的安全风险,也只能提供局部的数据进行标准化处理。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本发明实施例的目的在于提供一种医疗数据标准化处理方法、装置、介质及电子设备,进而至少可以在一定程度上解决了相关技术中存在的缺陷,从而实现对医疗数据中特定字段进行标准化处理,即实现全量标准化,进而基于全量标准化结果进行准召率分析,以便于基于全量的准召率进行评估。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明实施例的第一方面,提供了一种医疗数据标准化处理方法,包括:获取医疗数据;对所述医疗数据中的特定字段进行标准化处理,得到所述医疗数据中特定字段的标准化结果;基于所述医疗数据中特定字段的标准化结果和所述医疗数据中特定字段生成第一医疗数据,所述第一医疗数据中包含所述医疗数据中的特定字段和所述医疗数据中特定字段的标准化结果;根据所述第一医疗数据确定标准化比率和/或标准化准确率;根据所述标准化比率和/或所述标准化准确率确定所述第一医疗数据的评估分数,根据所述第一医疗数据的评估分数确定针对所述医疗数据的标准化处理是否达标。
在本发明的一些实施例中,所述标准化结果包括第一标准化结果和第二标准化结果,该方法还包括:根据所述第一医疗数据确定所述第一医疗数据中第一标准化结果的数量,以及确定所述第一医疗数据中第二标准化结果的数量;根据所述第一医疗数据中第一标准化结果的数量和所述第一医疗数据中第二标准化结果的数量将所述第一医疗数据划分为标准化的医疗数据和未标准化的医疗数据;响应于用户操作,发送所述标准化的医疗数据和所述未标准化的医疗数据。
在本发明的一些实施例中,该方法还包括:通过第一检索词从第一医疗数据中检索出与其相关的医疗数据,其中,所述第一检索词包括所述医疗数据中的医疗术语和所述标准化结果中的医疗术语;发送与所述第一检索词相关的医疗数据。
在本发明的一些实施例中,该方法还包括:根据所述第一医疗数据中部分字段的标准化结果确定与所述部分字段的标准化结果对应的疾病名称;基于所述第一医疗数据中的部分字段、所述第一医疗数据中部分字段的标准化结果、以及与所述部分字段的标准化结果对应的疾病名称生成第二医疗数据。
在本发明的一些实施例中,该方法还包括:通过第二检索词从第二医疗数据中检索出与其相关的医疗数据,其中,所述第二检索词包括所述第一医疗数据的部分字段中的医疗术语、所述第一医疗数据的部分字段的标准化结果中的医疗术语、以及与所述部分字段的标准化结果对应的疾病名称;发送与所述第二检索词相关的医疗数据。
在本发明的一些实施例中,该方法还包括:基于与所述第二检索词相关的医疗数据生成与其对应的桑基图,其中,与所述第二检索词相关的医疗数据中的标准化结果为多层级的标准化结果;发送所述桑基图,以使得在终端上展示所述桑基图。
在本发明的一些实施例中,该方法还包括:基于与所述第一检索词相关的医疗数据生成与其对应的词云图,其中,与所述第一检索词相关的医疗数据中的标准化结果为非多层级的标准化结果;发送所述词云图,以使得在终端上展示所述词云图。
根据本发明实施例的第二方面,提供了一种医疗数据标准化处理装置,包括:获取模块,用于获取医疗数据;标准化处理模块,用于对所述医疗数据中的特定字段进行标准化处理,得到所述医疗数据中特定字段的标准化结果;第一生成模块,基于所述医疗数据中特定字段的标准化结果和所述医疗数据中特定字段生成第一医疗数据,所述第一医疗数据中包含所述医疗数据中的特定字段和所述医疗数据中特定字段的标准化结果;第一确定模块,用于根据所述第一医疗数据确定标准化比率和/或标准化准确率;评估模块,用于根据所述标准化比率和/或所述标准化准确率确定所述第一医疗数据的评估分数,根据所述第一医疗数据的评估分数确定针对所述医疗数据的标准化处理是否达标。
在本发明的一些实施例中,所述标准化结果包括第一标准化结果和第二标准化结果,该装置还包括:第二确定模块,用于根据所述第一医疗数据确定所述第一医疗数据中第一标准化结果的数量,以及确定所述第一医疗数据中第二标准化结果的数量;划分模块,用于根据所述第一医疗数据中第一标准化结果的数量和所述第一医疗数据中第二标准化结果的数量将所述第一医疗数据划分为标准化的医疗数据和未标准化的医疗数据;第一发送模块,响应于用户操作,发送所述标准化的医疗数据和所述未标准化的医疗数据。
在本发明的一些实施例中,该装置还包括:第一检索模块,用于通过第一检索词从第一医疗数据中检索出与其相关的医疗数据,其中,所述第一检索词包括所述医疗数据中的医疗术语和所述标准化结果中的医疗术语;第二发送模块,用于发送与所述第一检索词相关的医疗数据。
在本发明的一些实施例中,该装置还包括:第三确定模块,用于根据所述第一医疗数据中部分字段的标准化结果确定与所述部分字段的标准化结果对应的疾病名称;第二生成模块,基于所述第一医疗数据中的部分字段、所述第一医疗数据中部分字段的标准化结果、以及与所述部分字段的标准化结果对应的疾病名称生成第二医疗数据。
在本发明的一些实施例中,该装置还包括:第二检索模块,用于通过第二检索词从第二医疗数据中检索出与其相关的医疗数据,其中,所述第二检索词包括所述第一医疗数据的部分字段中的医疗术语、所述第一医疗数据的部分字段的标准化结果中的医疗术语、以及与所述部分字段的标准化结果对应的疾病名称;第三发送模块,用于发送与所述第二检索词相关的医疗数据。
在本发明的一些实施例中,该装置还包括:第三生成模块,基于与所述第二检索词相关的医疗数据生成与其对应的桑基图,其中,与所述第二检索词相关的医疗数据中的标准化结果为多层级的标准化结果;第四发送模块,用于发送所述桑基图,以使得在终端上展示所述桑基图。
在本发明的一些实施例中,该装置还包括:第四生成模块,基于与所述第一检索词相关的医疗数据生成与其对应的词云图,其中,与所述第一检索词相关的医疗数据中的标准化结果为非多层级的标准化结果;第五发送模块,用于发送所述词云图,以使得在终端上展示所述词云图。
根据本发明实施例的第三方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中第一方面所述的医疗数据标准化处理方法。
根据本发明实施例的第四方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中第一方面所述的医疗数据标准化处理方法。
本发明实施例提供的技术方案可以包括以下有益效果:
在本发明的一些实施例所提供的技术方案中,获取医疗数据;对所述医疗数据中的特定字段进行标准化处理,得到医疗数据中特定字段的标准化结果,基于医疗数据中特定字段的标准化结果和医疗数据中特定字段生成第一医疗数据,第一医疗数据中包含所述医疗数据中的特定字段和医疗数据中特定字段的标准化结果,根据第一医疗数据确定标准化比率和/或标准化准确率,根据标准化比率和/或标准化准确率对所述第一医疗数据进行评估,以此方式至少可以在一定程度上解决了相关技术中存在的缺陷,从而实现对医疗数据中特定字段进行标准化处理,即实现全量标准化,进而基于全量标准化结果进行准召率分析,以便于基于全量的准召率进行评估。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本发明。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示出了可以应用本发明实施例的医疗数据标准化处理方法或医疗数据标准化处理装置的示例性系统架构的示意图;
图2示意性示出了根据本发明的实施例的医疗数据标准化处理方法的流程图;
图3示意性示出了根据本发明的另一个实施例的医疗数据标准化处理方法的流程图;
图4示意性示出了根据本发明的另一个实施例的医疗数据标准化处理方法的流程图;
图5示意性示出了根据本发明的另一个实施例的医疗数据标准化处理方法的流程图;
图6示意性示出了根据本发明的另一个实施例的医疗数据标准化处理方法的流程图;
图7A示意性示出了根据本发明的实施例的生成桑基图的流程图;
图7B示意性示出了根据本发明的实施例的桑基图的示意图;
图8A示意性示出了根据本发明的实施例的生成词云图的流程图;
图8B示意性示出了根据本发明的实施例的词云图的示意图;
图9示意性示出了根据本发明的实施例的医疗数据标准化处理装置的方框图;
图10示意性示出了根据本发明的另一个实施例的医疗数据标准化处理装置的方框图;
图11示意性示出了根据本发明的另一个实施例的医疗数据标准化处理装置的方框图;
图12示意性示出了根据本发明的另一个实施例的医疗数据标准化处理装置的方框图;
图13示意性示出了根据本发明的另一个实施例的医疗数据标准化处理装置的方框图;
图14示意性示出了根据本发明的另一个实施例的医疗数据标准化处理装置的方框图;
图15示意性示出了根据本发明的另一个实施例的医疗数据标准化处理装置的方框图;
图16示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本发明将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本发明的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本发明的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本发明的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了可以应用本发明实施例的医疗数据标准化处理方法或医疗数据标准化处理装置的示例性系统架构的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一种或多种,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器。例如用户利用终端设备103(也可以是终端设备101或102)向服务器105上传了获取医疗数据,服务器105对所述医疗数据中的特定字段进行标准化处理,得到所述医疗数据中特定字段的标准化结果,基于所述医疗数据中特定字段的标准化结果和所述医疗数据中特定字段生成第一医疗数据,所述第一医疗数据中包含所述医疗数据中的特定字段和所述医疗数据中特定字段的标准化结果,根据所述第一医疗数据确定标准化比率和/或标准化准确率,根据所述标准化比率和/或所述标准化准确率确定所述第一医疗数据的评估分数,根据所述第一医疗数据的评估分数确定针对所述医疗数据的标准化处理是否达标,以此方式至少可以在一定程度上解决了相关技术中存在的缺陷,从而实现对医疗数据中特定字段进行标准化处理,即实现全量标准化,进而基于全量标准化结果进行准召率分析,以便于基于全量的准召率进行评估。
在一些实施例中,本发明实施例所提供的医疗数据标准化处理方法一般由服务器105执行,相应地,医疗数据标准化处理装置一般设置于服务器105中。在另一些实施例中,某些终端可以具有与服务器相似的功能从而执行本方法。因此,本发明实施例所提供的医疗数据标准化处理方法不限定在服务器端执行。
图2示意性示出了根据本发明的实施例的医疗数据标准化处理方法的流程图。
如图2所示,医疗数据标准化处理方法可以包括步骤S210~步骤S250。
在步骤S210中,获取医疗数据。
在步骤S220中,对所述医疗数据中的特定字段进行标准化处理,得到所述医疗数据中特定字段的标准化结果。
在步骤S230中,基于所述医疗数据中特定字段的标准化结果和所述医疗数据中特定字段生成第一医疗数据,所述第一医疗数据中包含所述医疗数据中的特定字段和所述医疗数据中特定字段的标准化结果。
在步骤S240中,根据所述第一医疗数据确定标准化比率和/或标准化准确率。
在步骤S250中,根据所述标准化比率和/或所述标准化准确率确定所述第一医疗数据的评估分数,根据所述第一医疗数据的评估分数确定针对所述医疗数据的标准化处理是否达标。
该方法可以获取医疗数据,对所述医疗数据中的特定字段进行标准化处理,得到医疗数据中特定字段的标准化结果,基于医疗数据中特定字段的标准化结果和医疗数据中特定字段生成第一医疗数据,第一医疗数据中包含所述医疗数据中的特定字段和医疗数据中特定字段的标准化结果,这样可以将标准化结果内置于医疗数据中,以便于后续的检索和展示,然后根据第一医疗数据确定标准化比率和/或标准化准确率,根据标准化比率和/或标准化准确率对所述第一医疗数据进行评估,以此方式至少可以在一定程度上解决了相关技术中存在的缺陷,从而实现对医疗数据中特定字段进行标准化处理,即实现全量标准化,进而基于全量标准化结果进行准召率分析,以便于基于全量的准召率进行评估。
在本发明的一个实施例中,上述医疗数据可以是医院信息系统中的数据,例如,上述医疗数据可以是医院各个科室中的医疗数据,其中,各个科室的医疗数据可以存储在自己科室的信息系统。
在本发明的一个实施例中,医疗数据中的特定字段中的内容可以是各个科室中产生的数据。例如,特定字段可以是各个科室中患者的诊断信息、手术信息、医药信息、检查信息、检验信息等等。
在本发明的一个实施例中,对上述医疗数据中的特定字段进行标准化处理,得到该医疗数据中特定字段的标准化结果。例如,通过ICD-10对上述医疗数据中的特定字段进行标准化处理,得到该医疗数据中特定字段的标准化结果,这样可以实现对该医疗数据进行全量标准化处理,在一定程度上可以解决相关技术中只能提供局部的数据进行标准化处理的缺陷。其中,国际疾病分类(International Classification of Diseases,ICD)是WHO制定的国际统一的疾病分类方法,它根据疾病的病因、病理、临床表现和解剖位置等特性,将疾病分门别类,使其成为一个有序的组合,并用编码的方法来表示的系统。全世界通用的是第10次修订本《疾病和有关健康问题的国际统计分类》,仍保留了ICD的简称,并被统称为ICD-10。
在本发明的一个实施例中,基于上述医疗数据中特定字段的标准化结果和上述医疗数据中特定字段生成第一医疗数据。其中,第一医疗数据中包含上述医疗数据中的特定字段和上述医疗数据中特定字段的标准化结果。例如,在对医疗数据中特定字段进行标准化处理之后,可以基于特定字段的标准化结果生成一列数据,并将该列数据置于医疗数据中,该列数据中包括特定字段的标准化结果,且标准化结果与医疗数据中的字段相对应。上述第一医疗数据具体如表1所示:
其中,原始诊断中的数据可以是上述医疗数据中的特定字段的字段值,对原始诊断中的特定字段进行标准化处理后,得到特定字段的标准化结果,即ICD名称中的数据。例如,对“脑梗塞”进行标准化处理后,得到的标准化结果为“脑梗死”,“脑梗死”的ICD编码为I63.902。上述基于特定字段的标准化结果生成的一列数据可以是表中ICD名称中的数据,并且与原始诊断中的特定字段的字段值一一对应。Count中的数据可以指医疗术语在医疗数据中的词频,例如,“脑梗塞”在原始诊断中的词频为31572。
在本发明的一个实施例中,从相关技术中的接口服务方式或者线下处理的方式改变为内容在数据底层的方案,直接在原始数据层中,针对需要进行标准化的字段单独增加标准化数据内容列,比如在含有疾病诊断的表中其诊断字段外单独增加一列对于疾病诊断标准化结果的列数据,让标准化数据从接口方式变成“原生”的方式,在后续的具体场景使用和统计分析等方面大大提升了整体效率。
在本发明的一个实施例中,根据上述第一医疗数据确定标准化比率和/或标准化准确率,并根据所述标准化比率和/或所述标准化准确率确定所述第一医疗数据的评估分数,根据所述第一医疗数据的评估分数确定针对所述医疗数据的标准化处理是否达标。例如,通过上述将标准化结果内置于原始数据中的方案,可以做到针对全量数据进行准召率(准召率指标准化比率和/或标准化准确率)的分析,比如上述举例的疾病诊断的原始数据其对应的标准化数据情况进行分析,首先能够分析整体的标准化比率,用所有有标准化结果的数据除以全量的原始数据即是其标准化比率。然后可以通过全量数据的标准化结果进行抽样的方式来确定标准化准确率,这样可以完整的评估该标准化体系的准召率,使得准召率的结果从相关技术中的黑盒变成了可视化的评估结果,这样有助于响应于用户操作可以对该评估结果进行可视化展示,以便于用户直观的观察到本次对上述医疗数据的标准化处理是否达标。
在本发明的一个实施例中,根据所述标准化比率和/或所述标准化准确率确定所述第一医疗数据的评估分数。例如,当标准化比率大于等于80%和/或标准化准确率大于等于80%时,所述第一医疗数据的评估分数为8~10分,针对所述医疗数据的标准化处理视为达标,相反,如果标准化比率小于80%和/或标准化准确率小于80%时,所述第一医疗数据的评估分数为1~7分,针对所述医疗数据的标准化处理视为没有达标。在本实例中的80%、8~10、以及1~7都是示意性的,具体可以根据实际情况进行调整。
在本发明的一个实施例中,上述标准化结果包括第一标准化结果和第二标准化结果。其中,第一标准化结果可以指通过ICD-10匹配到医疗数据中医疗术语的标准化术语,即第一标准化结果可以是与医疗数据中字段相对应的标准化术语。第二标准化结果可以指通过ICD-10匹配不到医疗数据中医疗术语的标准化术语,即第二标准化结果可以是预设的0,0表示在对医疗数据中的医疗术语进行标准化处理时,没有匹配到与其对应的标准化术语。
图3示意性示出了根据本发明的另一个实施例的医疗数据标准化处理方法的流程图。
如图3所示,上述方法还包括步骤S310~步骤S330。
在步骤S310中,根据所述第一医疗数据确定所述第一医疗数据中第一标准化结果的数量,以及确定所述第一医疗数据中第二标准化结果的数量。
在步骤S320中,根据所述第一医疗数据中第一标准化结果的数量和所述第一医疗数据中第二标准化结果的数量将所述第一医疗数据划分为标准化的医疗数据和未标准化的医疗数据。
在步骤S330中,响应于用户操作,发送所述标准化的医疗数据和所述未标准化的医疗数据。
该方法可以根据第一医疗数据中第一标准化结果的数量和第一医疗数据中第二标准化结果的数量将第一医疗数据划分为标准化的医疗数据和未标准化的医疗数据,响应于用户操作,发送标准化的医疗数据和未标准化的医疗数据,这样便于在终端上展示标准化的医疗数据和未标准化的医疗数据,在这种情况下,用户可以直观的看到哪些医疗数据可以匹配到标准化术语,哪些医疗数据匹配不到标准化术语,用户可以根据该结果向服务器反馈意见。
在本发明的一个实施例中,根据第一医疗数据确定第一医疗数据中第一标准化结果的数量,以及确定第一医疗数据中第二标准化结果的数量。其中,第一标准化结果可以指通过ICD-10匹配到医疗数据中医疗术语的标准化术语,即第一标准化结果可以是与医疗数据中字段相对应的标准化术语。第二标准化结果可以指通过ICD-10匹配不到医疗数据中医疗术语的标准化术语,即第二标准化结果可以是预设的0,0表示在对医疗数据中的医疗术语进行标准化处理时,没有匹配到与其对应的标准化术语。在本实例中,第一标准化结果的数量可以指基于医疗数据中医疗术语匹配到标准化术语的个数。第二标准化结果的数量可以指基于医疗数据中医疗术语匹配不到标准化术语的个数。例如,医疗数据中包含10000个医疗术语,根据第一标准结果和第二标准化结果可以得到出在10000个医疗术语中有8000个医疗数据可以匹配到对其对应的标准化术语,有2000个医疗术语没有匹配到与其对应的标准化术语,即第一标准化结果的数量为8000,第二标准化结果的数量为2000。
图4示意性示出了根据本发明的另一个实施例的医疗数据标准化处理方法的流程图。
如图4所示,上述方法还包括步骤S410和步骤S420。
在步骤S410中,通过第一检索词从第一医疗数据中检索出与其相关的医疗数据,其中,所述第一检索词包括所述医疗数据中的医疗术语和所述标准化结果中的医疗术语。
在步骤S420中,发送与所述第一检索词相关的医疗数据。
该方法可以接收用户输入的第一检索词,该第一检索词可以包括医疗数据中的医疗术语和标准化结果中的医疗术语,此时可以通过第一检索词从第一医疗数据中检索出与其相关的医疗数据,然后发送与该第一检索词相关的医疗数据,这样方便的搜索和探索,并供用户查看其需要使用的数据在该标准化方案后的结果情况,是否满足所需要的场景,能够将数据是否能够使用在进行数据分析之前就能知晓,极大的提升了效率。
参考上述表1,上述第一检索词可以是原始诊断中的医疗数据,也可以是ICD名称中的医疗数据,即第一检索词可以包括医疗数据中的医疗术语和标准化结果中的医疗术语。因此,在本实施例中可以实现基于医疗数据中的医疗术语和标准化结果中的医疗术语都可以从上述第一医疗数据中检索出与其对应的数据。
图5示意性示出了根据本发明的另一个实施例的医疗数据标准化处理方法的流程图。
如图5所示,上述方法还包括步骤S510和步骤S520。
在步骤S510中,根据所述第一医疗数据中部分字段的标准化结果确定与所述部分字段的标准化结果对应的疾病名称。
在步骤S520中,基于所述第一医疗数据中的部分字段、所述第一医疗数据中部分字段的标准化结果、以及与所述部分字段的标准化结果对应的疾病名称生成第二医疗数据。
该方法可以根据第一医疗数据中部分字段的标准化结果确定与部分字段的标准化结果对应的疾病名称,然后基于第一医疗数据中的部分字段、所述第一医疗数据中部分字段的标准化结果、以及与所述部分字段的标准化结果对应的疾病名称生成第二医疗数据,这样以便于后续支持根据用户输入的多维度的检索词也能从该第二医疗数据中确定出与其相关的数据,从而提升用户体验。
在本发明的一个实施例中,根据第一医疗数据中部分字段的标准化结果确定与所述部分字段的标准化结果对应的疾病名称。其中,部分字段的标准化结果可以是多层级的标准化结果,例如,部分字段的标准化结果为“冠状动脉粥样硬化性心脏病”,基于“冠状动脉粥样硬化性心脏病”可以确定出与其对应的疾病名称“慢性缺血性心脏病”。再例如,部分字段的标准化结果为“2型糖尿病”,基于“2型糖尿病”可以确定出与其对应的疾病名称“非胰岛素依赖型糖尿病”。
在本发明的一个实施例中,上述第二医疗数据具体可以如下表2所示:
其中,ICD_3_name为疾病名称,ICD_3_code为疾病名称的代码。原始诊断中的字段可以指上述部分字段,ICD名称中的数据可以指上述部分字段的标准化结果,ICD_3_name中的数据可以是基于ICD名称中的数据确定的。Count中的数据可以指医疗术语在医疗数据中的词频,例如,“脑梗塞”在原始诊断中的词频为31572。
图6示意性示出了根据本发明的另一个实施例的医疗数据标准化处理方法的流程图。
如图6所示,上述方法还包括步骤S610和步骤S620。
在步骤S610中,通过第二检索词从第二医疗数据中检索出与其相关的医疗数据,其中,所述第二检索词包括所述第一医疗数据的部分字段中的医疗术语、所述第一医疗数据的部分字段的标准化结果中的医疗术语、以及与所述部分字段的标准化结果对应的疾病名称。
在步骤S620中,发送与所述第二检索词相关的医疗数据。
该方法可以支持多维度的搜索方式,具体地接收用户输入的第二检索词,该第二检索词可以是第一医疗数据的部分字段中的医疗术语、所述第一医疗数据的部分字段的标准化结果中的医疗术语、或与所述部分字段的标准化结果对应的疾病名称,然后通过第二检索词从第二医疗数据中检索出与其相关的医疗数据,并发送与第二检索词相关的医疗数据。例如,第二检索词为“胃恶性肿瘤”疾病名称,通过该第二检索词可以将该疾病名称下的所有标准词全部搜索出来,比如“胃窦恶性肿瘤”、“胃底恶性肿瘤”、“胃体恶性肿瘤”,而其中“胃体恶性肿瘤”是原始词“胃体恶性肿瘤(胃壁)”、“胃窦胃体恶性肿瘤”、“胃体恶性肿瘤”等的标准化结果。这样可以通过搜索“胃恶性肿瘤”能够将原始词为“胃体恶性肿瘤(胃壁)”等原始词全部进行搜索结果呈现。
图7A示意性示出了根据本发明的实施例的生成桑基图的流程图。
如图7A所示,上述方法还包括步骤S710和步骤S720。
在步骤S710中,基于与所述第二检索词相关的医疗数据生成与其对应的桑基图,其中,与所述第二检索词相关的医疗数据中的标准化结果为多层级的标准化结果。
在步骤S720中,发送所述桑基图,以使得在终端上展示所述桑基图。
该方法可以基于与所述第二检索词相关的医疗数据生成与其对应的桑基图,此时可以根据用户请求发送该桑基图,以使得在终端上展示所述桑基图,有助于用户快速的了解与该第二检索词相关的医疗数据的标准化情况。
在本发明的一个实施例中,上述桑基图可以被配置为:第一层级为“疾病名称”维度,第二层级为“标准词”维度,“第三层”为原始词维度。每一层级之间均是能量守恒,其中能够将其数据量也在桑基图中进行展示。能按照原始词的数量多少,或者标准词的多少进行综合排序显示,具体参考图7B。例如,针对于“疾病诊断”场景,可以从“桑基图”的浏览方式看到标准化和原始数据按照疾病本身的维度进行展示,并且可提供按照不同疾病进行搜索展示。
在本发明的一个实施例中,响应于用户对上述桑基图进行操作,并返回与其对应的数据。例如,用户点击标准化字段,响应于该操作,并返回对应的标准化的医疗术语。当然,用户还可以对桑基图的其他控件进行操作,例如,原值字段、疾病分类、胃恶性肿瘤等等。
图8A示意性示出了根据本发明的实施例的生成词云图的流程图。
如图8A所示,上述方法还包括步骤S810和步骤S820。
在步骤S810中,基于与所述第一检索词相关的医疗数据生成与其对应的词云图,其中,与所述第一检索词相关的医疗数据中的标准化结果为非多层级的标准化结果。
在步骤S820中,发送所述词云图,以使得在终端上展示所述词云图。
该方法可以基于与所述第一检索词相关的医疗数据生成与其对应的桑基图,此时可以根据用户请求发送该词云图,以使得在终端上展示所述词云图,有助于用户快速的了解与该第一检索词相关的医疗数据的标准化情况。
本发明的一个实施例中,对于非多层级的标准化结果,比如检验、检查、药品等内容,原始词和标准词之间的关系进行了词云图的方式进行了展示,其中词频的大小与该词在云图中的大小和位置有一定的关系,具体参考图8B。例如,针对于手术、检验、检查、用药等场景,可以从“词云图”的浏览方式看到标准词和原始词的分布关系,并且提供按照不同的名称进行搜索展示。
在本发明的一个实施例中,响应于用户对上述词云图进行操作,并返回与其对应的数据。例如,用户点击手术名称,响应于该操作,并返回对应的手术名称分类。当然,用户还可以对词云图的其他控件进行操作,例如,肝动脉造影、肝动脉栓塞化疗术等等。
上述方法在应用方面,能够把标准化的过程和结果通过“桑基图”、“词云图”和不同业务不同列表单的方式进行,不光能够进行原始词的搜索,还能进行按照标准词进行反向搜索,看标准化到该标准词中的原始词分布,能够提高医师在实际使用过程中的效率,拓展更多的场景。
图9示意性示出了根据本发明的实施例的医疗数据标准化处理装置的方框图。
如图9所示,医疗数据标准化处理装置900包括获取模块901、标准化处理模块902、第一生成模块903、第一确定模块904和评估模块905。
具体地,获取模块901,用于获取医疗数据。
标准化处理模块902,用于对所述医疗数据中的特定字段进行标准化处理,得到所述医疗数据中特定字段的标准化结果。
第一生成模块903,基于所述医疗数据中特定字段的标准化结果和所述医疗数据中特定字段生成第一医疗数据,所述第一医疗数据中包含所述医疗数据中的特定字段和所述医疗数据中特定字段的标准化结果。
第一确定模块904,用于根据所述第一医疗数据确定标准化比率和/或标准化准确率。
评估模块905,用于根据所述标准化比率和/或所述标准化准确率确定所述第一医疗数据的评估分数,根据所述第一医疗数据的评估分数确定针对所述医疗数据的标准化处理是否达标。
该医疗数据标准化处理装置900可以获取医疗数据,对所述医疗数据中的特定字段进行标准化处理,得到医疗数据中特定字段的标准化结果,基于医疗数据中特定字段的标准化结果和医疗数据中特定字段生成第一医疗数据,第一医疗数据中包含所述医疗数据中的特定字段和医疗数据中特定字段的标准化结果,这样可以将标准化结果内置于医疗数据中,以便于后续的检索和展示,然后根据第一医疗数据确定标准化比率和/或标准化准确率,根据标准化比率和/或标准化准确率对所述第一医疗数据进行评估,以此方式至少可以在一定程度上解决了相关技术中存在的缺陷,从而实现对医疗数据中特定字段进行标准化处理,即实现全量标准化,进而基于全量标准化结果进行准召率分析,以便于基于全量的准召率进行评估。
根据本发明的实施例,该医疗数据标准化处理装置900可以用于实现图2实施例描述的医疗数据标准化处理方法。
图10示意性示出了根据本发明的另一个实施例的医疗数据标准化处理装置的方框图。
如图10所示,上述医疗数据标准化处理装置900还包括第二确定模块906、划分模块907和第一发送模块908。
具体地,第二确定模块906,用于根据所述第一医疗数据确定所述第一医疗数据中第一标准化结果的数量,以及确定所述第一医疗数据中第二标准化结果的数量。
划分模块907,用于根据所述第一医疗数据中第一标准化结果的数量和所述第一医疗数据中第二标准化结果的数量将所述第一医疗数据划分为标准化的医疗数据和未标准化的医疗数据。
第一发送模块908,响应于用户操作,发送所述标准化的医疗数据和所述未标准化的医疗数据。
该医疗数据标准化处理装置900可以根据第一医疗数据中第一标准化结果的数量和第一医疗数据中第二标准化结果的数量将第一医疗数据划分为标准化的医疗数据和未标准化的医疗数据,响应于用户操作,发送标准化的医疗数据和未标准化的医疗数据,这样便于在终端上展示标准化的医疗数据和未标准化的医疗数据,在这种情况下,用户可以直观的看到哪些医疗数据可以匹配到标准化术语,哪些医疗数据匹配不到标准化术语,用户可以根据该结果向服务器反馈意见。
根据本发明的实施例,该医疗数据标准化处理装置900可以用于实现图3实施例描述的医疗数据标准化处理方法。
图11示意性示出了根据本发明的另一个实施例的医疗数据标准化处理装置的方框图。
如图11所示,上述医疗数据标准化处理装置900还包括第一检索模块909和第二发送模块910。
具体地,第一检索模块909,用于通过第一检索词从第一医疗数据中检索出与其相关的医疗数据,其中,所述第一检索词包括所述医疗数据中的医疗术语和所述标准化结果中的医疗术语。
第二发送模块910,用于发送与所述第一检索词相关的医疗数据。
该医疗数据标准化处理装置900可以接收用户输入的第一检索词,该第一检索词可以包括医疗数据中的医疗术语和标准化结果中的医疗术语,此时可以通过第一检索词从第一医疗数据中检索出与其相关的医疗数据,然后发送与该第一检索词相关的医疗数据,这样方便的搜索和探索,并供用户查看其需要使用的数据在该标准化方案后的结果情况,是否满足所需要的场景,能够将数据是否能够使用在进行数据分析之前就能知晓,极大的提升了效率。
根据本发明的实施例,该医疗数据标准化处理装置900可以用于实现图4实施例描述的医疗数据标准化处理方法。
图12示意性示出了根据本发明的另一个实施例的医疗数据标准化处理装置的方框图。
如图12所示,上述医疗数据标准化处理装置900还包括第三确定模块911和第二生成模块912。
具体地,第三确定模块911,用于根据所述第一医疗数据中部分字段的标准化结果确定与所述部分字段的标准化结果对应的疾病名称。
第二生成模块912,基于所述第一医疗数据中的部分字段、所述第一医疗数据中部分字段的标准化结果、以及与所述部分字段的标准化结果对应的疾病名称生成第二医疗数据。
该医疗数据标准化处理装置900可以根据第一医疗数据中部分字段的标准化结果确定与部分字段的标准化结果对应的疾病名称,然后基于第一医疗数据中的部分字段、所述第一医疗数据中部分字段的标准化结果、以及与所述部分字段的标准化结果对应的疾病名称生成第二医疗数据,这样以便于后续支持根据用户输入的多维度的检索词也能从该第二医疗数据中确定出与其相关的数据,从而提升用户体验。
根据本发明的实施例,该医疗数据标准化处理装置900可以用于实现图5实施例描述的医疗数据标准化处理方法。
图13示意性示出了根据本发明的另一个实施例的医疗数据标准化处理装置的方框图。
如图13所示,上述医疗数据标准化处理装置900还包括第二检索模块913和第三发送模块914。
具体地,第二检索模块913,用于通过第二检索词从第二医疗数据中检索出与其相关的医疗数据,其中,所述第二检索词包括所述第一医疗数据的部分字段中的医疗术语、所述第一医疗数据的部分字段的标准化结果中的医疗术语、以及与所述部分字段的标准化结果对应的疾病名称。
第三发送模块914,用于发送与所述第二检索词相关的医疗数据。
该医疗数据标准化处理装置900可以支持多维度的搜索方式,具体地接收用户输入的第二检索词,该第二检索词可以是第一医疗数据的部分字段中的医疗术语、所述第一医疗数据的部分字段的标准化结果中的医疗术语、或与所述部分字段的标准化结果对应的疾病名称,然后通过第二检索词从第二医疗数据中检索出与其相关的医疗数据,并发送与第二检索词相关的医疗数据。例如,第二检索词为“胃恶性肿瘤”疾病名称,通过该第二检索词可以将该疾病名称下的所有标准词全部搜索出来,比如“胃窦恶性肿瘤”、“胃底恶性肿瘤”、“胃体恶性肿瘤”,而其中“胃体恶性肿瘤”是原始词“胃体恶性肿瘤(胃壁)”、“胃窦胃体恶性肿瘤”、“胃体恶性肿瘤”等的标准化结果。这样可以通过搜索“胃恶性肿瘤”能够将原始词为“胃体恶性肿瘤(胃壁)”等原始词全部进行搜索结果呈现。
根据本发明的实施例,该医疗数据标准化处理装置900可以用于实现图6实施例描述的医疗数据标准化处理方法。
图14示意性示出了根据本发明的另一个实施例的医疗数据标准化处理装置的方框图。
如图14所示,上述医疗数据标准化处理装置900还包括第三生成模块915和第四发送模块916。
具体地,第三生成模块915,基于与所述第二检索词相关的医疗数据生成与其对应的桑基图,其中,与所述第二检索词相关的医疗数据中的标准化结果为多层级的标准化结果。
第四发送模块916,用于发送所述桑基图,以使得在终端上展示所述桑基图。
该医疗数据标准化处理装置900可以基于与所述第二检索词相关的医疗数据生成与其对应的桑基图,此时可以根据用户请求发送该桑基图,以使得在终端上展示所述桑基图,有助于用户快速的了解与该第二检索词相关的医疗数据的标准化情况。
根据本发明的实施例,该医疗数据标准化处理装置900可以用于实现图7A实施例描述的医疗数据标准化处理方法。
图15示意性示出了根据本发明的另一个实施例的医疗数据标准化处理装置的方框图。
如图15所示,上述医疗数据标准化处理装置900还包括第四生成模块917和第五发送模块918。
具体地,第四生成模块917,基于与所述第一检索词相关的医疗数据生成与其对应的词云图,其中,与所述第一检索词相关的医疗数据中的标准化结果为非多层级的标准化结果。
第五发送模块918,用于发送所述词云图,以使得在终端上展示所述词云图。
该医疗数据标准化处理装置900可以基于与所述第一检索词相关的医疗数据生成与其对应的桑基图,此时可以根据用户请求发送该词云图,以使得在终端上展示所述词云图,有助于用户快速的了解与该第一检索词相关的医疗数据的标准化情况。
根据本发明的实施例,该医疗数据标准化处理装置900可以用于实现图8A实施例描述的医疗数据标准化处理方法。
由于本发明的示例实施例的医疗数据标准化处理装置的各个模块可以用于实现上述2~图8A描述的医疗数据标准化处理方法的示例实施例的步骤,因此对于本发明装置实施例中未披露的细节,请参照本发明上述的医疗数据标准化处理方法的实施例。
可以理解的是,获取模块901、标准化处理模块902、第一生成模块903、第一确定模块904、评估模块905、第二确定模块906、划分模块907、第一发送模块908、第一检索模块909、第二发送模块910、第三确定模块911、第二生成模块912、第二检索模块913、第三发送模块914、第三生成模块915、第四发送模块916、第四生成模块917、以及第五发送模块918可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本发明的实施例,获取模块901、标准化处理模块902、第一生成模块903、第一确定模块904、评估模块905、第二确定模块906、划分模块907、第一发送模块908、第一检索模块909、第二发送模块910、第三确定模块911、第二生成模块912、第二检索模块913、第三发送模块914、第三生成模块915、第四发送模块916、第四生成模块917、以及第五发送模块918中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上系统、基板上的系统、封装上的系统、专用集成电路(ASIC),或可以以对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式的适当组合来实现。或者,获取模块901、标准化处理模块902、第一生成模块903、第一确定模块904、评估模块905、第二确定模块906、划分模块907、第一发送模块908、第一检索模块909、第二发送模块910、第三确定模块911、第二生成模块912、第二检索模块913、第三发送模块914、第三生成模块915、第四发送模块916、第四生成模块917、以及第五发送模块918中的至少一个可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。
下面参考图16,其示出了适于用来实现本发明实施例的电子设备的计算机系统1000的结构示意图。图16示出的电子设备的计算机系统1000仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图16所示,计算机系统1000包括中央处理单元(CPU)1001,其可以根据存储在只读存储器(ROM)1002中的程序或者从存储部分1008加载到随机访问存储器(RAM)1003中的程序而执行各种适当的动作和处理。在RAM 1003中,还存储有系统操作所需的各种程序和数据。CPU 1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。
以下部件连接至I/O接口1005:包括键盘、鼠标等的输入部分1006;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1007;包括硬盘等的存储部分1008;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1009。通信部分1009经由诸如因特网的网络执行通信处理。驱动器1010也根据需要连接至I/O接口1005。可拆卸介质1011,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1010上,以便于从其上读出的计算机程序根据需要被安装入存储部分1008。
特别地,根据本发明的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1009从网络上被下载和安装,和/或从可拆卸介质1011被安装。在该计算机程序被中央处理单元(CPU)1001执行时,执行本申请的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的特定方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的特定方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如上述实施例中所述的医疗数据标准化处理方法。
例如,所述的电子设备可以实现如图2中所示的:在步骤S210中,获取医疗数据。在步骤S220中,对所述医疗数据中的特定字段进行标准化处理,得到所述医疗数据中特定字段的标准化结果。在步骤S230中,基于所述医疗数据中特定字段的标准化结果和所述医疗数据中特定字段生成第一医疗数据,所述第一医疗数据中包含所述医疗数据中的特定字段和所述医疗数据中特定字段的标准化结果。在步骤S240中,根据所述第一医疗数据确定标准化比率和/或标准化准确率。在步骤S250中,根据所述标准化比率和/或所述标准化准确率确定所述第一医疗数据的评估分数,根据所述第一医疗数据的评估分数确定针对所述医疗数据的标准化处理是否达标。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本发明实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本发明实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本申请旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
应当理解的是,本发明并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明的范围仅由所附的权利要求来限制。

Claims (10)

1.一种医疗数据标准化处理方法,其特征在于,包括:
获取医疗数据;
对所述医疗数据中的特定字段进行标准化处理,得到所述医疗数据中特定字段的标准化结果,其中,所述医疗数据中特定字段包括诊断信息、手术信息、医药信息、检查信息、检验信息;
基于所述医疗数据中特定字段的标准化结果和所述医疗数据中特定字段生成第一医疗数据,所述第一医疗数据中包含所述医疗数据中的特定字段和所述医疗数据中特定字段的标准化结果;
根据所述第一医疗数据确定标准化比率和/或标准化准确率,其中,所述标准化比率为所有有标准化结果的所述医疗数据中特定字段除以全量的所述医疗数据中特定字段;所述标准化准确率为对全量的所述医疗数据中特定字段的标准化结果进行抽样确定出的;
根据所述标准化比率和/或所述标准化准确率确定所述第一医疗数据的评估分数,根据所述第一医疗数据的评估分数确定针对所述医疗数据的标准化处理是否达标;
其中,所述医疗数据中特定字段的标准化结果置于所述医疗数据中,且所述医疗数据中特定字段的标准化结果与所述医疗数据中的特定字段相对应。
2.根据权利要求1所述的方法,其特征在于,所述标准化结果包括第一标准化结果和第二标准化结果,该方法还包括:
根据所述第一医疗数据确定所述第一医疗数据中第一标准化结果的数量,以及确定所述第一医疗数据中第二标准化结果的数量;
根据所述第一医疗数据中第一标准化结果的数量和所述第一医疗数据中第二标准化结果的数量将所述第一医疗数据划分为标准化的医疗数据和未标准化的医疗数据;
响应于用户操作,发送所述标准化的医疗数据和所述未标准化的医疗数据。
3.根据权利要求1所述的方法,其特征在于,该方法还包括:
通过第一检索词从第一医疗数据中检索出与其相关的医疗数据,其中,所述第一检索词包括所述医疗数据中的医疗术语和所述标准化结果中的医疗术语;
发送与所述第一检索词相关的医疗数据。
4.根据权利要求1所述的方法,其特征在于,该方法还包括:
根据所述第一医疗数据中部分字段的标准化结果确定与所述部分字段的标准化结果对应的疾病名称;
基于所述第一医疗数据中的部分字段、所述第一医疗数据中部分字段的标准化结果、以及与所述部分字段的标准化结果对应的疾病名称生成第二医疗数据。
5.根据权利要求4所述的方法,其特征在于,该方法还包括:
通过第二检索词从第二医疗数据中检索出与其相关的医疗数据,其中,所述第二检索词包括所述第一医疗数据的部分字段中的医疗术语、所述第一医疗数据的部分字段的标准化结果中的医疗术语、以及与所述部分字段的标准化结果对应的疾病名称;
发送与所述第二检索词相关的医疗数据。
6.根据权利要求5所述的方法,其特征在于,该方法还包括:
基于与所述第二检索词相关的医疗数据生成与其对应的桑基图,其中,与所述第二检索词相关的医疗数据中的标准化结果为多层级的标准化结果;
发送所述桑基图,以使得在终端上展示所述桑基图。
7.根据权利要求3所述的方法,其特征在于,该方法还包括:
基于与所述第一检索词相关的医疗数据生成与其对应的词云图,其中,与所述第一检索词相关的医疗数据中的标准化结果为非多层级的标准化结果;
发送所述词云图,以使得在终端上展示所述词云图。
8.一种医疗数据标准化处理装置,其特征在于,包括:
获取模块,用于获取医疗数据;
标准化处理模块,用于对所述医疗数据中的特定字段进行标准化处理,得到所述医疗数据中特定字段的标准化结果,其中,所述医疗数据中特定字段包括诊断信息、手术信息、医药信息、检查信息、检验信息;
第一生成模块,基于所述医疗数据中特定字段的标准化结果和所述医疗数据中特定字段生成第一医疗数据,所述第一医疗数据中包含所述医疗数据中的特定字段和所述医疗数据中特定字段的标准化结果;
第一确定模块,用于根据所述第一医疗数据确定标准化比率和/或标准化准确率,其中,所述标准化比率为所有有标准化结果的所述医疗数据中特定字段除以全量的所述医疗数据中特定字段;所述标准化准确率为对全量的所述医疗数据中特定字段的标准化结果进行抽样确定出的;
评估模块,用于根据所述标准化比率和/或所述标准化准确率确定所述第一医疗数据的评估分数,根据所述第一医疗数据的评估分数确定针对所述医疗数据的标准化处理是否达标;
其中,所述医疗数据中特定字段的标准化结果置于所述医疗数据中,且所述医疗数据中特定字段的标准化结果与所述医疗数据中的特定字段相对应。
9.一种电子设备,包括:
一个或多个处理器;以及
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现根据权利要求1~7中任意一项所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现根据权利要求1~7中任意一项所述的方法。
CN201911418483.6A 2019-12-31 2019-12-31 医疗数据标准化处理方法、装置、介质及电子设备 Active CN111161817B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911418483.6A CN111161817B (zh) 2019-12-31 2019-12-31 医疗数据标准化处理方法、装置、介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911418483.6A CN111161817B (zh) 2019-12-31 2019-12-31 医疗数据标准化处理方法、装置、介质及电子设备

Publications (2)

Publication Number Publication Date
CN111161817A CN111161817A (zh) 2020-05-15
CN111161817B true CN111161817B (zh) 2023-09-19

Family

ID=70560479

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911418483.6A Active CN111161817B (zh) 2019-12-31 2019-12-31 医疗数据标准化处理方法、装置、介质及电子设备

Country Status (1)

Country Link
CN (1) CN111161817B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112800763B (zh) * 2021-04-14 2021-08-06 北京金山云网络技术有限公司 数据处理方法、医学文本数据处理方法、装置及电子设备

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003305010A (ja) * 2002-04-16 2003-10-28 Hitachi High-Technologies Corp 感染症監視方法及び監視システム
JP2005165513A (ja) * 2003-12-01 2005-06-23 Olympus Corp 病院情報システム
CN102054032A (zh) * 2010-12-22 2011-05-11 广州市慧通计算机有限公司 一种医疗数据信息处理方法及其系统
CN104361221A (zh) * 2014-10-31 2015-02-18 沈阳锐易特软件技术有限公司 基于异构系统数据映射模板的医疗数据采集系统及方法
CN106933806A (zh) * 2017-03-15 2017-07-07 北京大数医达科技有限公司 医疗同义词的确定方法和装置
CN107577826A (zh) * 2017-10-25 2018-01-12 山东众阳软件有限公司 基于原始诊断数据的疾病分类编码方法及系统
CN107704601A (zh) * 2017-10-13 2018-02-16 中国人民解放军第三军医大学第附属医院 大数据检索方法与系统、计算机存储介质及电子设备
CN107784057A (zh) * 2017-03-03 2018-03-09 平安医疗健康管理股份有限公司 医疗数据匹配方法和装置
CN109446340A (zh) * 2018-10-17 2019-03-08 长沙瀚云信息科技有限公司 一种医学标准术语本体管理系统及方法、设备和存储介质
CN109493934A (zh) * 2018-11-09 2019-03-19 医渡云(北京)技术有限公司 数据处理方法、装置及介质
CN109558461A (zh) * 2018-10-23 2019-04-02 平安医疗健康管理股份有限公司 一种医疗数据分类存储方法和装置
CN109582955A (zh) * 2018-11-14 2019-04-05 金色熊猫有限公司 医疗术语的标准化方法、装置及介质
CN109582661A (zh) * 2018-11-23 2019-04-05 金色熊猫有限公司 数据结构化评估方法、装置、存储介质及电子设备
CN109584975A (zh) * 2018-11-21 2019-04-05 金色熊猫有限公司 医疗数据标准化处理方法及装置
CN110289058A (zh) * 2019-06-06 2019-09-27 北京市天元网络技术股份有限公司 一种电子病历规范化匹配方法以及装置
KR20190129317A (ko) * 2018-05-10 2019-11-20 애트민(주) 표준화된 의료정보 변환방법 및 그 제공장치

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20140278525A1 (en) * 2013-03-13 2014-09-18 Mckesson Financial Holdings Method and apparatus for providing improved searching of medical records
US20150161331A1 (en) * 2013-12-04 2015-06-11 Mark Oleynik Computational medical treatment plan method and system with mass medical analysis

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003305010A (ja) * 2002-04-16 2003-10-28 Hitachi High-Technologies Corp 感染症監視方法及び監視システム
JP2005165513A (ja) * 2003-12-01 2005-06-23 Olympus Corp 病院情報システム
CN102054032A (zh) * 2010-12-22 2011-05-11 广州市慧通计算机有限公司 一种医疗数据信息处理方法及其系统
CN104361221A (zh) * 2014-10-31 2015-02-18 沈阳锐易特软件技术有限公司 基于异构系统数据映射模板的医疗数据采集系统及方法
CN107784057A (zh) * 2017-03-03 2018-03-09 平安医疗健康管理股份有限公司 医疗数据匹配方法和装置
CN106933806A (zh) * 2017-03-15 2017-07-07 北京大数医达科技有限公司 医疗同义词的确定方法和装置
CN107704601A (zh) * 2017-10-13 2018-02-16 中国人民解放军第三军医大学第附属医院 大数据检索方法与系统、计算机存储介质及电子设备
CN107577826A (zh) * 2017-10-25 2018-01-12 山东众阳软件有限公司 基于原始诊断数据的疾病分类编码方法及系统
KR20190129317A (ko) * 2018-05-10 2019-11-20 애트민(주) 표준화된 의료정보 변환방법 및 그 제공장치
CN109446340A (zh) * 2018-10-17 2019-03-08 长沙瀚云信息科技有限公司 一种医学标准术语本体管理系统及方法、设备和存储介质
CN109558461A (zh) * 2018-10-23 2019-04-02 平安医疗健康管理股份有限公司 一种医疗数据分类存储方法和装置
CN109493934A (zh) * 2018-11-09 2019-03-19 医渡云(北京)技术有限公司 数据处理方法、装置及介质
CN109582955A (zh) * 2018-11-14 2019-04-05 金色熊猫有限公司 医疗术语的标准化方法、装置及介质
CN109584975A (zh) * 2018-11-21 2019-04-05 金色熊猫有限公司 医疗数据标准化处理方法及装置
CN109582661A (zh) * 2018-11-23 2019-04-05 金色熊猫有限公司 数据结构化评估方法、装置、存储介质及电子设备
CN110289058A (zh) * 2019-06-06 2019-09-27 北京市天元网络技术股份有限公司 一种电子病历规范化匹配方法以及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于多评价标准融合的医疗数据特征选择算法;崔宇佳等;《复旦学报(自然科学版)》;20190415;第58卷(第2期);第250-255页,第268页 *
基于最大熵原理的医疗文本信息结构化;李俊杰;《临床医学工程》;20101015;第17卷(第10期);第119-121页 *
面向标准化数据整合的医学通用数据模型探析;王安然;吴思竹;钱庆;;中华医学图书情报杂志(第11期);8-18 *

Also Published As

Publication number Publication date
CN111161817A (zh) 2020-05-15

Similar Documents

Publication Publication Date Title
US20090259487A1 (en) Patient Data Mining
EP3376958B1 (en) Water equivalent diameter determination from scout images
US11403786B2 (en) Method and system for generating medical image based on textual data in medical report
US20190156937A1 (en) Priority alerts based on medical information
CN111985197A (zh) 一种基于医疗信息的模板生成方法
CN113782195A (zh) 一种体检套餐定制方法和装置
US20200203005A1 (en) Image viewer
US10282516B2 (en) Medical imaging reference retrieval
CN111161817B (zh) 医疗数据标准化处理方法、装置、介质及电子设备
Vrotsou et al. Variables associated with COVID-19 severity: an observational study of non-paediatric confirmed cases from the general population of the Basque Country, Spain
CN114255837A (zh) 数据查询方法、装置、计算机可读存储介质及电子设备
CN111128329B (zh) 个性化健康摘要的动态生成方法、装置、介质及电子设备
CN113838548A (zh) 病例信息处理方法、装置及医疗信息系统
WO2022151947A1 (zh) 病理信息监控方法、装置、电子设备和计算机可读介质
US20200043167A1 (en) Auto comparison layout based on image similarity
CN111048165A (zh) 试验样本的确定方法及装置、计算机介质和电子设备
CN111145907A (zh) 体检数据处理方法、装置、介质及电子设备
CN113053531B (zh) 医疗数据处理方法、装置、计算机可读存储介质及设备
Allyse et al. Dr. Pangloss's clinic: prenatal whole genome sequencing and a return to reality
US20220181005A1 (en) Utilizing multi-layer caching systems for storing and delivering images
CN111739598A (zh) 数据处理方法、装置、介质及电子设备
CN113220896A (zh) 多来源知识图谱生成方法、装置、终端设备
CN109558398B (zh) 基于大数据的数据清洗方法及相关装置
US20210056696A1 (en) Intelligent automatic selection of a prior comparison study
CN111128330A (zh) 电子病例报告表自动录入方法、装置以及相关设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant