CN111125311A - 检验信息归一处理的方法、装置、存储介质及电子设备 - Google Patents

检验信息归一处理的方法、装置、存储介质及电子设备 Download PDF

Info

Publication number
CN111125311A
CN111125311A CN201911349424.8A CN201911349424A CN111125311A CN 111125311 A CN111125311 A CN 111125311A CN 201911349424 A CN201911349424 A CN 201911349424A CN 111125311 A CN111125311 A CN 111125311A
Authority
CN
China
Prior art keywords
inspection
information
name
normalization value
normalization
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911349424.8A
Other languages
English (en)
Other versions
CN111125311B (zh
Inventor
侯晓龙
张黎
赵阳
康波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yidu Cloud Beijing Technology Co Ltd
Original Assignee
Yidu Cloud Beijing Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yidu Cloud Beijing Technology Co Ltd filed Critical Yidu Cloud Beijing Technology Co Ltd
Priority to CN201911349424.8A priority Critical patent/CN111125311B/zh
Publication of CN111125311A publication Critical patent/CN111125311A/zh
Application granted granted Critical
Publication of CN111125311B publication Critical patent/CN111125311B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开的实施例提供了一种检验信息归一处理的方法、装置、计算机可读介质及电子设备。该方法包括:获取结构化后的多个检验项目字段;利用多个检验项目字段进行第一联合归一,确定第一检验信息归一值;获取多个检验项目的组合名称;按照优先级顺序对多个检验项目字段、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值。一方面,实现了自动确定第一检验信息归一值以及第二检验信息的归一值,提升了检验信息处理效率;另一方面,利用本公开实施例提供的方案,可以实现基于多个检验项目字段的归一处理,减少处理结果不自洽现象,提高了数据的可用性以及准确性。从而可以保证依赖该归一值的大数据系统的准确性。

Description

检验信息归一处理的方法、装置、存储介质及电子设备
技术领域
本公开涉及计算机技术以及信息处理技术领域,具体而言,涉及一种检验信息归一处理的方法、装置、存储介质及电子设备。
背景技术
在电子信息化的今天,各医疗机构每天都会产生众多医疗数据,这其中就包含海量的检验数据。而由于医院间系统差异、检验使用仪器的不同、医生个人习惯不同等原因,各种医疗名词说法众多,如同一个检验项目名称在数据库中存在多种写法,且新的写法不断出现,且无法穷举,这就为上层应用造成了障碍。为了解决这一问题,就需要将各种相同含义不同表述的方式进行统一,而这种将原始词映射到标准词表的过程就是归一。
假设有这样一项任务:统计某医院做过“白细胞计数”这项检验的人数,原始的检验项目名称为“白细胞#”,经过归一后的归一值为“白细胞计数(WBC#)”。为了实现统计,只能结合医生经验,将一些常见的写法如“白细胞计数”、“WBC#”等捞出来,再进行统计。这种人工统计的方法,不仅降低了统计效率,而且,对统计人员的要求较高,极大的增加了统计的难度。
相关技术中提出一种信息统计方法,将表示同一含义的词映射为一个标准词后再做后期的统计等工作。即对项目名称的原始值进行归一,以及对标本的原始值进行归一。例如,有这样一条检验数据,其项目名称为“脂血指数”,标本为“尿”,套餐为“血常规”,按照相关技术中的方法,其项目名称、标本的归一值应分别为:“脂血指数”、“尿液”。
但是,医疗文本中的有些数据信息不完全,只看自身的文本是无法断定其准确含义的,造成数据判断错误或者无法进行归一,而且,医疗文本中会存在一些错误的数据,一对一地归一会出现一些不自洽的结果。如上文所举的例子,在血常规的套餐下,做了脂血指数的检查,此时标本应该为静脉血,而按照之前的归一结果,会归成尿液,这显然错误。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开实施例提供一种检验信息处理的方法、装置、计算机可读介质及电子设备,进而至少在一定程度上提升检验信息处理效率,提高数据的可用性以及准确性。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的一个方面,提供了一种检验信息归一处理的方法,其中,包括:获取检验信息结构化后的多个检验项目字段;利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值;获取多个检验项目的组合名称;按照优先级顺序对所述检验信息、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值。
在本公开的一些示例性实施例中,利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值,包括:调用检验类目表,从所述检验类目表中召回包含所述多个检验项目字段中的检验主体的检验类目名称;从召回的检验类目名称中过滤掉不包含所述多个检验项目字段中检验主体以外的其他字段的检验类目名称;计算所述多个检验项目字段与过滤后的检验类目名称的相似度,以确定第一检验信息归一值。
在本公开的一些示例性实施例中,计算所述多个检验项目字段与过滤后的检验类目名称的相似度,以确定第一检验信息归一值,包括:提取过滤后的检验类目名称的多个检验项目字段;基于检验项目字段的权重获取过滤后的检验类目名称的多个检验项目字段与结构化后的多个检验项目字段的相似度;基于所述相似度从过滤后的检验类目名称的多个检验项目字段中确定第一检查信息归一值。
在本公开的一些示例性实施例中,获取检验信息结构化后的多个检验项目字段,包括:基于预设的多个维度,对检验信息进行结构化,以获取结构化后的多个检验项目字段。
在本公开的一些示例性实施例中,获取检验信息结构化后的多个检验项目字段之后,所述方法还包括:判断所述多个检验项目字段是否存在于黑名单列表;若判断结果为否,利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值;若判断结果为是,将所述多个检验项目字段与所述组合名称提取的维度信息进行组合,获取组合维度;调用组合维度类目表,获取所述组合维度对应的检验类目为第一检验信息归一值。
在本公开的一些示例性实施例中,按照优先级顺序对所述检验信息、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值,包括:调用类目标本表,所述类目标本表中包括第一检验信息归一值与限定标本的映射关系;从所述类目标本表中查找到所述第一检验信息归一值对应的限定标本;按照优先级顺序对所述所述检验信息、所述限定标本以及所述组合名称进行第二联合归一,确定第二检验信息归一值。
在本公开的一些示例性实施例中,所述检验信息包括:初始项目名称、检验标本、以及单位;所述初始项目名称中包括项目标本;所述组合名称中包括组合标本;按照优先级顺序对所述所述检验信息、所述限定标本以及所述组合名称进行第二联合归一,确定第二检验信息归一值,包括:预设置所述项目标本、所述组合标本、所述限定标本以及所述检验标本的优先级顺序;按照优先级由高到低的顺序从所述项目标本、所述组合标本、所述限定标本以及所述检验标本确定第二检验信息归一值。
根据本公开实施例的一个方面,提供了一种检验信息归一处理的装置,包括:第一获取模块,配置为获取结构化后的多个检验项目字段;第一确定模块,配置为利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值;第二获取模块,配置为获取多个检验项目的组合名称;第二确定模块,配置为按照优先级顺序对所述检验信息、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值。
在本公开的一些示例性实施例中,第一确定模块,配置为调用检验类目表,从所述检验类目表中召回包含所述多个检验项目字段中的检验主体的检验类目名称;从召回的检验类目名称中过滤掉不包含所述多个检验项目字段中检验主体以外的其他字段的检验类目名称;计算所述多个检验项目字段与过滤后的检验类目名称的相似度,以确定第一检验信息归一值。
在本公开的一些示例性实施例中,所述第一确定模块,配置为提取过滤后的检验类目名称的多个检验项目字段;基于检验项目字段的权重获取过滤后的检验类目名称的多个检验项目字段与结构化后的多个检验项目字段的相似度;基于所述相似度从过滤后的检验类目名称的多个检验项目字段中确定第一检查信息归一值。
在本公开的一些示例性实施例中,第一获取模块,配置为基于预设的多个维度,对检验信息进行结构化,以获取结构化后的多个检验项目字段。
在本公开的一些示例性实施例中,所述装置还包括:判断模块,配置为判断所述多个检验项目字段是否存在于黑名单列表;所述第一确定模块,配置为在所述判断模块判断结果为否时,利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值;组合模块,配置为在所述判断结果为是时,将所述多个检验项目字段与所述组合名称提取的维度信息进行组合,获取组合维度;第三确定模块,配置为调用组合维度类目表,获取所述组合维度对应的检验类目为第一检验信息归一值。
在本公开的一些示例性实施例中,所述第二确定模块,配置为调用类目标本表,所述类目标本表中包括第一检验信息归一值与限定标本的映射关系;从所述类目标本表中查找到所述第一检验信息归一值对应的限定标本;按照优先级顺序对所述所述检验信息、所述限定标本以及所述组合名称进行第二联合归一,确定第二检验信息归一值。
在本公开的一些示例性实施例中,所述检验信息包括:初始项目名称、检验标本、以及单位;所述初始项目名称中包括项目标本;所述组合名称中包括组合标本;所述第二确定模块,配置为预设置所述项目标本、所述组合标本、所述限定标本以及所述检验标本的优先级顺序;按照优先级由高到低的顺序从所述项目标本、所述组合标本、所述限定标本以及所述检验标本确定第二检验信息归一值。
根据本公开实施例的一个方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上述实施例中所述的检验信息处理的方法。
根据本公开实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的检验信息处理的方法。
在本公开的一些实施例所提供的技术方案中,获取结构化后的多个检验项目字段;利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值;获取多个检验项目的组合名称;按照优先级顺序对所述多个检验项目字段、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值。一方面,实现了自动确定第一检验信息归一值以及第二检验信息的归一值,提升了检验信息处理效率;另一方面,利用本公开实施例提供的方案,可以实现基于多个检验项目字段的归一处理,减少处理结果不自洽现象,提高了数据的可用性以及准确性。从而可以保证依赖该归一值的大数据系统的准确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
在附图中:
图1示出了可以应用本公开实施例的检验信息归一处理的方法或装置的示例性系统架构100的示意图;
图2示意性示出了根据本公开的一个实施例的检验信息归一处理的方法的流程图;
图3示意性示出了根据本公开的一个实施例的确定第一检验信息归一值的方法的流程图;
图4示意性示出了根据本公开的另一个实施例的确定第一检验信息归一值的方法的流程图;
图5示意性示出了根据本公开的一实施例的检验信息归一处理的装置的框图;
图6示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
图1示出了可以应用本公开实施例的检验信息归一处理的方法或装置的示例性系统架构100的示意图。
如图1所示,系统架构100可以包括终端设备101、102、103中的一种或多种,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103可以是具有显示屏的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器。例如终端设备103(也可以是终端设备101或102)向服务器105发送信息处理的请求,服务器105可以基于该请求获取结构化后的多个检验项目字段;利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值;获取多个检验项目的组合名称;按照优先级顺序对所述检验信息、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值,进而基于第一检验信息归一值以及第二检验信息归一值对检验信息进行处理,并将处理结果发送至终端103,终端103可以显示该处理结果。
图2示意性示出了根据本公开的一个实施例的检验信息归一处理的方法的流程图。本公开实施例所提供的方法可以由任意具备计算处理能力的电子设备处理,例如上述图1实施例中的服务器105和/或终端设备102、103,在下面的实施例中,以服务器105为执行主体为例进行举例说明,但本公开并不限定于此。
如图2所示,本公开实施例提供的检验信息归一处理的方法可以包括以下步骤。
在步骤S210中,获取检验信息结构化后的多个检验项目字段。
本公开实施例中,在对医院的检验信息进行归一处理的应用场景中,服务器上设置有数据库,数据库中存储有检验信息,服务器可以在接收到终端的检验信息处理请求时,调用数据库,从数据库中提取检验信息,并对检验信息进行结构化,以获取结构化的多个检验项目字段。
需要说明的是,该请求中可以携带需处理的检验信息的标识,服务器可以基于标识查找到数据库中的检验信息。但本发明并不限于此,例如,服务器也可以周期性的自动对数据库中的未处理的检验信息进行处理,或者服务器在接收到终端发送的统计请求时,对数据库中未处理的检验信息进行处理后执行统计处理。
本公开实施例中,检验信息可以包括但不限于:初始项目名称、检验标本以及单位。例如,初始项目名称、检验标本、单位分别为:“白细胞”、“尿”、“10^9/L”。
本公开实施例中,在获取到检验信息后,可以首先基于预设置的多个维度,对检验信息进行结构化,结构化的每个维度为结构化后的每个检验项目字段。例如,预设置的维度可以包括:检验主体、主体类型以及检查方式等。例如,检验信息为:初始项目名称、检验标本、单位分别为:“白细胞”、“尿”、“10^9/L”,对该检验信息进行结构化,提取的多个检验项目字段可以是:检验主体—白细胞,检查方式—计算(通过单位:“10^9/L”得到具体的检查方式是计数)。又例如,检验信息为:初始项目名称、检验标本、单位分别为:“血清乳酸脱氢酶同工酶LDH-1”、“尿”、“NULL”,对该检验信息进行结构化,提取的多个检验项目字段可以是:检验主体—乳酸脱氢酶同工酶,主体类型—1型。
需要指出的是,对检验信息结构化获取的多个检验项目字段可以包括原始项目名称、检验标本以及单位对应的字段。
需要说明的是,在预设置多个维度时,可以为各维度设置权重,以便后续计算相似度。
在步骤S220中,利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值。
需要指出的是,数据库中还存储有检验类目表,检验类目表中记录有检验类目名称,该检验类目表中的各个名称可以作为标准名称(归一化的名称)为上层应用所使用。
本公开实施例中,服务器在获取到多个检验项目字段后,从数据库中调用检验类目表,然后基于该多个检验项目字段与检验类目表中的检验类目的相似度,对多个检验项目字段进行第一联合归一,确定第一检验信息归一值。
本公开实施例中,在计算该多个检验项目字段与检验类目表中的检验类目的相似度之前,可以在调用检验类目表后,从检验类目表中召回包含该多个检验项目字段中的检验主体的检验类目名称,并从召回的检验类目名称中过滤掉不包含所述多个检验项目字段中检验主体以外的其他字段的检验类目名称,计算所述多个检验项目字段与过滤后的检验类目名称的相似度,以确定第一检验信息归一值。
本公开实施例中,在计算多个检验项目字段与过滤后的检验类目名称的相似度时,可以将检验类目表中的各个检验类目名称也按照预设置的维度信息进行结构化,以提取的检验类目名称的多个检验项目字段,并通过设置的各维度的权重,计算出过滤后的检验类目名称的多个检验项目字段与结构化后的多个检验项目字段的相似度。
本公开实施例中,计算多个检验项目字段与过滤后的检验类目名称的相似度后,基于相似度对各个检验类目名称进行排序,从超过相似度阈值内查找到相似度最大的检验类目名称,该检验类目名称为第一检验信息归一值。
例如,获取的结构化的多个检验项目字段为:检验主体—白细胞,检查方式—计数(通过单位:“10^9/L”得到具体的检查方式是计数)。假设检验类目表中存在:白细胞计数(WBC#)以及CD45+白细胞计数,其中,白细胞计数(WBC#)提取的检验项目字段为:检验主体—白细胞,检查方式—计数,CD45+白细胞计数提取的:检验主体—白细胞,检查类型—CD45+,检查方式—计数,假设检验主体、检查类型、检查方式三个维度的权重分别为3.0,2.0,1.0,此时白细胞计数(WBC#)以及CD45+白细胞计数与结构化的多检验项目字段的相似度分别为0.9、0.6,假设阈值为0.5,最终选择相似度更高的白细胞计数(WBC#)作为第一检验信息归一值。
需要指出的是,该第一检验信息归一值实际为检验类目的标准名称。
在步骤S230中,获取多个检验项目的组合名称。
本公开实施例中,数据库中还可以存储有多个检验项目的组合名称,该组合名称中可以包括多条检验信息,例如,该组合信息可以是某检查的套餐信息,该套餐中包括多条检验信息。
需要说明的是,可以在从数据库中获取检验信息时,同时获取到该检验信息对应的多个检验项目的组合名称。
在步骤S240中,按照优先级顺序对所述检验信息、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值。
需要说明的是,数据库中还可以存储有类目标本表,该类目标本表记录有第一检验信息归一值以及限定标本的映射关系。需要注意的是,并不是所有的第一检验信息归一值均存在有映射关系的限定标本。
本公开实施例中,在确定第一检验信息归一值后,可以调用数据库中的类目标本表,查找到该第一检验信息归一值对应的限定标本。
例如,类目标本表中记录有:乳酸脱氢酶同工酶1(LDH1)—静脉血,当确定第一检验信息归一值为:乳酸脱氢酶同工酶1(LDH1),可以确定限定标本为:静脉血。
本公开实施例中,检验信息包括:初始项目名称、检验标本、以及单位;所述初始项目名称中包括项目标本;所述组合名称中包括组合标本,基于第一检验信息归一值可以确定限定标本。在确定第二检验信息归一值时,可以设置上述四个标本:项目标本、组合标本、限定标本以及检验标本的优先级顺序,进而基于优先级顺序对上述四个标本信息进行第二联合归一,确定第二检验信息归一值。
本公开实施例中,预设置优先级顺序从高到低依次为:限定标本、项目标本、组合标本以及检验标本。按照优先级由高到低的顺序从所述项目标本、所述组合标本、所述限定标本以及所述检验标本确定第二检验信息归一值。
需要指出的是,若选择的某标本中包括多个标本信息或者不存在标本信息,则将该标本置空,按照优先级的顺序,选择下一级别标本为第二检验信息归一值。
本公开实施例中,第二检验信息归一值实际为检验标本的标准名称。
例如,检验信息的初始项目名称、检验标本、单位分别为:“白细胞”、“尿”、“10^9/L”,组合信息名称为“尿液分析+粪便常规”。其项目标本为(),检验标本为(尿),组合信息标本为(),而目标第一检验信息归一值名称:白细胞计数(WBC#)不存在对应的限定标本,则限定标本为(),按照优先级从高到低的顺序进行排序:限定标本()>项目标本()>组合信息标本()>检验标本(尿),因此确定该检验信息的目标标本第二检验信息归一值信息为“尿”。其来源为检验标本。若该示例中组合名称为“血常规”,则组合标本为:(静脉血)。优先级从高到低的顺序进行排序为:限定标本()>项目标本()>组合信息(静脉血)>检验标本(尿),因此,确定该检验信息的第二检验信息归一值为“静脉血”,来源为组合标本。
又例如,检验信息的初始项目名称、检验标本、单位分别为:“血清乳酸脱氢酶同工酶LDH-1”、“尿”、“NULL”,组合名称为“尿液分析+粪便常规”。其第一检验信息归一值:乳酸脱氢酶同工酶1(LDH1)对应的限定标本为(静脉血),而限定标本的优先级最高,则确定该检验信息的第二检验信息归一值为:“静脉血”,来源为限定标本。
需要说明的是,可以基于本公开实施例提供的上述检验信息归一处理的方法,对未处理的检验信息进行处理,服务器可以将处理结果发送至终端显示。另外,服务器也可以基于处理结果,对某段时间内的检验信息进行统计处理,例如,统计某医院做过“白细胞计数(WBC#)”这项检验的人数,并将统计结果发送至终端显示。还需要注意的是,服务器也可以基于处理结果,将检验信息存储至对应的数据库。例如,当服务器获取到一批未处理的检验信息后,利用本发明实施例中提供的上述检验信息归一处理的方法,得到每个检验信息的第一检验信息归一值以及第二检验信息归一值后,将每个检验信息按照其第一检验信息归一值存储至该第一检验信息归一值的数据库,以及该第二检验信息归一值存储至该第二检验信息归一值的数据库,从而实现按照第一检验信息归一值以及第二检验信息归一值进行数据存储,以便于后续进行数据统计分析。
本公开实施方式提供的检验信息归一处理的方法,获取结构化后的多个检验项目字段;利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值;获取多个检验项目的组合名称;按照优先级顺序对所述多个检验项目字段、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值。一方面,实现了自动确定第一检验信息归一值以及第二检验信息的归一值,提升了检验信息处理效率;另一方面,利用本公开实施例提供的方案,可以实现基于多个检验项目字段的归一处理,减少处理结果不自洽现象,提高了数据的可用性以及准确性。从而可以保证依赖该归一值的大数据系统的准确性。
图3示意性示出了根据本公开的一个实施例的确定第一检验信息归一值的方法的流程图,本公开实施例所提供的方法可以由任意具备计算处理能力的电子设备处理,例如上述图1实施例中的服务器105和/或终端设备102、103,在下面的实施例中,以服务器105为执行主体为例进行举例说明,但本公开并不限定于此。
如图3所示,本公开实施例提供的确定第一检验信息归一值方法可以包括以下步骤。
在步骤S310中,调用检验类目表,从所述检验类目表中召回包含所述多个检验项目字段中的检验主体的检验类目名称。
本公开实施例中,在获取到结构化的多个检验项目字段后,从数据库中调用检验类目表,对检验类目表中包括该多个检验项目字段中的检验主体的检验类目名称召回。
如表1为本公开实施例提供的部分检验类目表(检验类目名称以词对的形式展示):
白细胞数目:白细胞计数(WBC#)
白细胞(高倍视野):白细胞(镜检)
CD45+白细胞计数:CD45+淋巴细胞计数
红细胞数:红细胞计数(RBC#)
表1
假设检验信息的初始项目名称、检验标本、单位分别为:“白细胞”、“尿”、“10^9/L”,按照预设置的维度结构化的多个检验项目字段为:检验主体—白细胞,检查方式—计数,从表1中召回包括检验主体—白细胞的检验类目名称如表2所示:
白细胞数目:白细胞计数(WBC#)
白细胞(高倍视野):白细胞(镜检)
CD45+白细胞计数:CD45+淋巴细胞计数
表2
如表2所示,由于“红细胞数:红细胞计数(RBC#)”不存在“白细胞”,因此没有召回该检验类目名称。
在步骤S320中,从召回的检验类目名称中过滤掉不包含该多个检验项目字段中检验主体以外的其他字段的检验类目名称。
本公开实施例中,在召回的检验类目名称的名单中,可以基于除检验主体字段外的其他字段进行过滤。
例如,上述示例中,多个检验项目字段为:检验主体—白细胞,检查方式—计数,则可以基于计数这种检查方式进一步的对表2中的检验类目名称进行过滤,过滤后的检验类目名称如表3所示:
白细胞数目:白细胞计数(WBC#)
CD45+白细胞计数:CD45+淋巴细胞计数
表3
如表3所示,由于“白细胞(高倍视野):白细胞(镜检)”中不存在“计数”,因此被过滤掉。
在步骤S330中,计算上述多个检验项目字段与过滤后的检验类目名称的相似度,确定第一检验信息归一值。
本公开实施例中,在计算检验信息结构化的多个检验项目字段与过滤后的检验类目表中的各个检验类目名称的相似度时,可以对过滤后的检验类目名称按照预设置的维度结构化,提取过滤后的检验类目名称的多个检验项目字段,基于每个检验项目字段(维度)的权重获取过滤后的检验类目名称的多个检验项目字段与结构化后的多个检验项目字段的相似度,基于相似度从所述过滤后的检验类目名称中确定所述检查信息的第一检验信息归一值。
在计算检验类目名称的多个检验项目字段与结构化后的多个检验项目字段的相似度,可以按照预设置的维度信息对检验类目表中的各个检验类目名称进行结构化,以提取检验类目名称的多个检验项目字段,并通过设置的各检验项目字段(各维度)的权重,计算出检验类目名称与检查检验信息结构化的多个检验项目字段信息的各检验项目字段(各维度)信息的相似度,然后基于相似度进行排序,从超过相似度阈值内查找到相似度最大的检验类目名称,将该检验类目名称作为目标名称作为第一检验信息归一值。
本公开实施例中,调用检验类目表,从所述检验类目表中召回包含所述多个检验项目字段中的检验主体的检验类目名称;从召回的检验类目名称中过滤掉不包含该多个检验项目字段中检验主体以外的其他字段的检验类目名称;计算多个检验项目字段与过滤后的检验类目名称的相似度,确定第一检验信息归一值。通过对检验类目表中的检验类目名称的召回、过滤操作,大大缩减了相似度计算的数据量,提升检验信息归一处理效率。
图4示意性示出了根据本公开的另一个实施例的确定第一检验信息归一值的方法的流程图,本公开实施例所提供的方法可以由任意具备计算处理能力的电子设备处理,例如上述图1实施例中的服务器105和/或终端设备102、103,在下面的实施例中,以服务器105为执行主体为例进行举例说明,但本公开并不限定于此。
如图4所示,本公开实施例提供的确定第一检验信息归一值的方法可以包括以下步骤:
在步骤S410中,获取检验信息结构化后的多个检验项目字段。
在步骤S420中,判断多个检验项目字段是否存在于黑名单列表。
本公开实施例中,在获取检验信息结构化的多个检验项目字段后,判断该多个检验项目字段是否存在于预设置的黑名单列表中。需要指出的是,多个检验项目字段中至少有一个字段存在于预设置的黑名单列表,该多个检验项目字段存在于该黑名单列表。
本公开实施例中,数据库中还可以存储有预设置的黑名单列表,该黑名单列表中记录有信息错误、信息缺失或具有多个含义的检验项目字段(例如,检验主体)。
例如,“PA”具有多个含义,既可能是“前白蛋白”的意思,又可能是“丙酮酸”的意思,因此记录在黑名单列表中,“人鼻病毒”可以用于多个方面的检验,存在信息缺失的问题,因此也记录在黑名单列表中。
若判断结果为否,执行S430;若判断结果为是,执行S440。
在步骤S430中,利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值。
需要说明的是,该步骤请参见S220,在获取到第一检验信息归一值后,可以继续按照S230-S240中的方法确定第二检验信息归一值。
在步骤S440中,从组合名称中提取维度信息。
本公开实施例中,可以按照预设置的维度对组合名称进行维度提取,以提取的组合名称的维度信息。
例如,组合名称为“肝功能”,按照预设置的维度对组合名称进行结构化,提取到维度信息为“肝功”。
需要说明的是,一个组合名称中可以提取出多个维度信息。例如,组合名称为“基因、咽拭子”,按照预设置的维度对组合名称进行维度提取,提取到维度信息分别为“基因”、“咽拭子”。
需要指出的是,提取组合名称的维度信息的方法可以不同于对检验信息结构化的方法,例如,也可以对组合名称进行分词,得到的各个分词为组合名称的维度信息。
在步骤S450中,将所述多个检验项目字段与所述组合名称提取的维度信息进行组合,获取组合维度。
本公开实施例中,在获取到组合名称的维度信息后,将检验信息提取的多个检验项目字段与组合名称提取的维度信息中的各个维度进行组合,获取组合维度。
需要指出的是,可以将检验信息结构化的多个检验项目字段中的检验主体这个字段与组合名称提取的各个维度进行组合,得到组合维度。
例如,检验信息的初始项目名称、检验标本、单位分别为:“PA”、“血浆”、“NULL”,多个检验项目字段可以是:检验主体—PA,判断出“PA”存在于黑名单中,其组合名称为“肝功能”,从其组合名称中提取维度信息为“肝功”,将检验信息的检验主体这个字段与组合名称的维度信息进行组合得到的组合维度可以是:“PA、肝功”或“肝功、PA”。
又例如,检验信息的初始项目名称、检验标本、单位分别为:“人鼻病毒”、“咽拭子”、“NULL”,多个检验项目字段可以是:检验主体—人鼻病毒,而判断出“人鼻病毒”存在于黑名单中,其组合名称为“基因、咽拭子”从其组合名称中提取维度信息为“基因”、“咽拭子”,将检验信息的检验主体这个维度与组合名称的维度信息进行组合得到的组合维度可以有两组:
(1)“人鼻病毒、基因”或“基因、人鼻病毒”。
(2)“人鼻病毒、咽拭子”或“咽拭子、人鼻病毒”。
在步骤S460中,调用组合维度类目表,获取所述组合维度对应的检验类目为第一检验信息归一值。
本公开实施例中,数据库中还可以记录有组合维度类目表,组合维度类目表记录有组合维度与检验类目名称(标准名称、归一化的名称)的映射关系。
组合维度 检验类目名称
PA、肝功/肝功、PA 前白蛋白(PA)
人鼻病毒、基因/基因、人鼻病毒 人鼻病毒RNA(HRV-RNA)
表4
如表4所示,并不是所有的组合维度都会存在对应的检验类目名称,例如,上述示例中的“人鼻病毒、咽拭子”或“咽拭子、人鼻病毒”的组合维度,在组合维度类目表中并不存在,因此,可以基于组合维度类目表进一步的对多个检验项目字段以及组合名称中提取的维度信息进行修正,以确保错误的组合信息不存在对应的检验类目名称。
本公开实施例中,利用黑名单对多个检验项目字段进行比对,将信息错误、信息缺失或具有多个含义的检验项目字段与组合名称联合,共同确定第一检验信息归一值名称,解决了信息错误、信息缺失或具有多个含义的检验信息无法确定第一检验信息归一值的问题以及结果不自洽的问题,降低了对检验信息的要求,提升了检验信息的处理范围。
以下介绍本公开的装置实施例,可以用于执行本公开上述的检验信息处理的方法。对于本公开装置实施例中未披露的细节,请参照本公开上述的自动定位判断依据的方法的实施例。
图5示意性示出了根据本公开的一实施例的检验信息归一处理的装置的框图。
参照图5所示,根据本公开的一个实施例的检验信息归一处理的装置500,可以包括:第一获取模块510、第一确定模块520、第二获取模块530以及第二确定模块540。
第一获取模块510可以为获取结构化后的多个检验项目字段。
第一确定模块520可以配置为利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值。
第二获取模块530可以配置为获取多个检验项目的组合名称。
第二确定模块540可以配置为按照优先级顺序对所述检验信息、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值。
本公开实施方式提供的检验信息归一处理的方法,获取结构化后的多个检验项目字段;利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值;获取多个检验项目的组合名称;按照优先级顺序对所述多个检验项目字段、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值。一方面,实现了自动确定第一检验信息归一值以及第二检验信息的归一值,提升了检验信息处理效率;另一方面,利用本公开实施例提供的方案,可以实现基于多个检验项目字段的归一处理,减少处理结果不自洽现象,提高了数据的可用性以及准确性。从而可以保证依赖该归一值的大数据系统的准确性。
图6示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。需要说明的是,图6示出的电子设备的计算机系统600仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统操作所需的各种程序和数据。CPU601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本公开的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的模块和/或单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的模块和/或单元也可以设置在处理器中。其中,这些模块和/或单元的名称在某种情况下并不构成对该模块和/或单元本身的限定。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如下述实施例中所述的方法。例如,所述的电子设备可以实现如图2或图3或图4所示的各个步骤。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种检验信息归一处理的方法,其特征在于,包括:
获取检验信息结构化后的多个检验项目字段;
利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值;
获取多个检验项目的组合名称;
按照优先级顺序对所述检验信息、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值。
2.如权利要求1所述的方法,其特征在于,利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值,包括:
调用检验类目表,从所述检验类目表中召回包含所述多个检验项目字段中的检验主体的检验类目名称;
从召回的检验类目名称中过滤掉不包含所述多个检验项目字段中检验主体以外的其他字段的检验类目名称;
计算所述多个检验项目字段与过滤后的检验类目名称的相似度,以确定第一检验信息归一值。
3.如权利要求2所述的方法,其特征在于,计算所述多个检验项目字段与过滤后的检验类目名称的相似度,以确定第一检验信息归一值,包括:
提取过滤后的检验类目名称的多个检验项目字段;
基于检验项目字段的权重获取过滤后的检验类目名称的多个检验项目字段与结构化后的多个检验项目字段的相似度;
基于所述相似度从过滤后的检验类目名称的多个检验项目字段中确定第一检查信息归一值。
4.如权利要求1所述的方法,其特征在于,获取检验信息结构化后的多个检验项目字段,包括:
基于预设的多个维度,对检验信息进行结构化,以获取结构化后的多个检验项目字段。
5.如权利要求1所述的方法,其特征在于,获取检验信息结构化后的多个检验项目字段之后,所述方法还包括:
判断所述多个检验项目字段是否存在于黑名单列表;
若判断结果为否,利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值;
若判断结果为是,将所述多个检验项目字段与所述组合名称提取的维度信息进行组合,获取组合维度;
调用组合维度类目表,获取所述组合维度对应的检验类目为第一检验信息归一值。
6.如权利要求1所述的方法,其特征在于,按照优先级顺序对所述检验信息、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值,包括:
调用类目标本表,所述类目标本表中包括第一检验信息归一值与限定标本的映射关系;
从所述类目标本表中查找到所述第一检验信息归一值对应的限定标本;
按照优先级顺序对所述所述检验信息、所述限定标本以及所述组合名称进行第二联合归一,确定第二检验信息归一值。
7.如权利要求6所述的方法,其特征在于,所述检验信息包括:初始项目名称、检验标本、以及单位;所述初始项目名称中包括项目标本;所述组合名称中包括组合标本;
按照优先级顺序对所述所述检验信息、所述限定标本以及所述组合名称进行第二联合归一,确定第二检验信息归一值,包括:
预设置所述项目标本、所述组合标本、所述限定标本以及所述检验标本的优先级顺序;
按照优先级由高到低的顺序从所述项目标本、所述组合标本、所述限定标本以及所述检验标本确定第二检验信息归一值。
8.一种检验信息归一处理的装置,其特征在于,包括:
第一获取模块,配置为获取结构化后的多个检验项目字段;
第一确定模块,配置为利用所述多个检验项目字段进行第一联合归一,确定第一检验信息归一值;
第二获取模块,配置为获取多个检验项目的组合名称;
第二确定模块,配置为按照优先级顺序对所述检验信息、所述第一检验信息归一值以及所述组合名称进行第二联合归一,确定第二检验信息归一值。
9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
10.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一项所述的方法。
CN201911349424.8A 2019-12-24 2019-12-24 检验信息归一处理的方法、装置、存储介质及电子设备 Active CN111125311B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911349424.8A CN111125311B (zh) 2019-12-24 2019-12-24 检验信息归一处理的方法、装置、存储介质及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911349424.8A CN111125311B (zh) 2019-12-24 2019-12-24 检验信息归一处理的方法、装置、存储介质及电子设备

Publications (2)

Publication Number Publication Date
CN111125311A true CN111125311A (zh) 2020-05-08
CN111125311B CN111125311B (zh) 2023-06-06

Family

ID=70500080

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911349424.8A Active CN111125311B (zh) 2019-12-24 2019-12-24 检验信息归一处理的方法、装置、存储介质及电子设备

Country Status (1)

Country Link
CN (1) CN111125311B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737533A (zh) * 2020-06-19 2020-10-02 东软集团股份有限公司 一种检验项目的处理方法、装置、存储介质及设备
CN112434511A (zh) * 2020-12-15 2021-03-02 杭州依图医疗技术有限公司 医学数据的处理方法、装置及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030036087A1 (en) * 2001-08-16 2003-02-20 Affymetrix, Inc. A Corporation Organized Under The Laws Of Delaware Method, system, and computer software for the presentation and storage of analysis results
US20050192792A1 (en) * 2004-02-27 2005-09-01 Dictaphone Corporation System and method for normalization of a string of words
US20060106756A1 (en) * 2004-09-30 2006-05-18 Zimmerer Peter K Normalization of a multi-dimensional set object
CN105138829A (zh) * 2015-08-13 2015-12-09 易保互联医疗信息科技(北京)有限公司 一种中文诊疗信息的自然语言处理方法及系统
CN108091372A (zh) * 2016-11-21 2018-05-29 医渡云(北京)技术有限公司 医疗字段映射校验方法及装置
CN109522552A (zh) * 2018-11-09 2019-03-26 天津开心生活科技有限公司 一种医疗信息的归一化方法、装置、介质及电子设备
WO2019070634A1 (en) * 2017-10-06 2019-04-11 The Trustees Of Columbia University In The City Of New York GENOMIC DIAGNOSTIC PREDICTIONS BASED ON ELECTRONIC HEALTH RECORD DATA
CN109670177A (zh) * 2018-12-20 2019-04-23 翼健(上海)信息科技有限公司 一种基于lstm实现医学语义归一化的控制方法及控制装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030036087A1 (en) * 2001-08-16 2003-02-20 Affymetrix, Inc. A Corporation Organized Under The Laws Of Delaware Method, system, and computer software for the presentation and storage of analysis results
US20050192792A1 (en) * 2004-02-27 2005-09-01 Dictaphone Corporation System and method for normalization of a string of words
US20060106756A1 (en) * 2004-09-30 2006-05-18 Zimmerer Peter K Normalization of a multi-dimensional set object
CN105138829A (zh) * 2015-08-13 2015-12-09 易保互联医疗信息科技(北京)有限公司 一种中文诊疗信息的自然语言处理方法及系统
CN108091372A (zh) * 2016-11-21 2018-05-29 医渡云(北京)技术有限公司 医疗字段映射校验方法及装置
WO2019070634A1 (en) * 2017-10-06 2019-04-11 The Trustees Of Columbia University In The City Of New York GENOMIC DIAGNOSTIC PREDICTIONS BASED ON ELECTRONIC HEALTH RECORD DATA
US20210375407A1 (en) * 2017-10-06 2021-12-02 The Trustees Of Columbia University In The City Of New York Diagnostic genomic predictions based on electronic health record data
CN109522552A (zh) * 2018-11-09 2019-03-26 天津开心生活科技有限公司 一种医疗信息的归一化方法、装置、介质及电子设备
CN109670177A (zh) * 2018-12-20 2019-04-23 翼健(上海)信息科技有限公司 一种基于lstm实现医学语义归一化的控制方法及控制装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
田驰远;陈德华;王梅;乐嘉锦;: "基于依存句法分析的病理报告结构化处理方法", 计算机研究与发展, no. 12 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111737533A (zh) * 2020-06-19 2020-10-02 东软集团股份有限公司 一种检验项目的处理方法、装置、存储介质及设备
CN111737533B (zh) * 2020-06-19 2024-02-09 东软集团股份有限公司 一种检验项目的处理方法、装置、存储介质及设备
CN112434511A (zh) * 2020-12-15 2021-03-02 杭州依图医疗技术有限公司 医学数据的处理方法、装置及存储介质

Also Published As

Publication number Publication date
CN111125311B (zh) 2023-06-06

Similar Documents

Publication Publication Date Title
Wong et al. Pediatric sepsis biomarker risk model-II: Redefining the pediatric sepsis biomarker risk model with septic shock phenotype
Aldridge et al. Accuracy of probabilistic linkage using the enhanced matching system for public health and epidemiological studies
CN108595657B (zh) His系统的数据表分类映射方法和装置
CN112562807B (zh) 医疗数据分析方法、装置、设备、存储介质和程序产品
CN110737689B (zh) 数据标准符合性检测方法、装置、系统及存储介质
CN110263155B (zh) 数据分类方法、数据分类模型的训练方法及系统
CN113535773B (zh) 数据库优化方法、数据库优化装置、电子设备和存储介质
CN111125311B (zh) 检验信息归一处理的方法、装置、存储介质及电子设备
Georgescu et al. Algorithmic identification of discrepancies between published ratios and their reported confidence intervals and P-values
CN113987086A (zh) 数据处理方法、数据处理装置、电子设备以及存储介质
Willis Rigorous statistical methods for rigorous microbiome science
CN112131296B (zh) 一种数据探查方法、装置、电子设备和存储介质
CN113094415B (zh) 数据抽取方法、装置、计算机可读介质及电子设备
CN112163127B (zh) 关系图谱构建方法、装置、电子设备及存储介质
CN111523309A (zh) 药品信息归一化的方法、装置、存储介质及电子设备
CN112270486A (zh) 数据质量评估方法、装置、电子设备及可读介质
CN111126034A (zh) 医学变量关系的处理方法及装置、计算机介质和电子设备
CN113053531B (zh) 医疗数据处理方法、装置、计算机可读存储介质及设备
CN113138974B (zh) 数据库合规检测的方法和装置
CN112307050B (zh) 一种重复关联计算的识别方法、装置及计算机系统
CN114942905A (zh) 一种迁移数据验证方法、装置、设备和存储介质
CN110931136B (zh) 事件的搜索方法及装置、计算机介质和电子设备
CN109885504B (zh) 推荐系统的测试方法、装置、介质及电子设备
Shi et al. The development of autoverification system of lymphocyte subset assays on the flow cytometry platform
CN111427874A (zh) 医疗数据生产的质控方法、装置以及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant