CN113808740A - 一种数据处理方法、装置、电子设备以及存储介质 - Google Patents
一种数据处理方法、装置、电子设备以及存储介质 Download PDFInfo
- Publication number
- CN113808740A CN113808740A CN202111118317.1A CN202111118317A CN113808740A CN 113808740 A CN113808740 A CN 113808740A CN 202111118317 A CN202111118317 A CN 202111118317A CN 113808740 A CN113808740 A CN 113808740A
- Authority
- CN
- China
- Prior art keywords
- matrix
- data
- rule base
- value
- icd
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 14
- 239000011159 matrix material Substances 0.000 claims abstract description 459
- 238000000034 method Methods 0.000 claims abstract description 32
- 238000003745 diagnosis Methods 0.000 claims description 51
- 238000012545 processing Methods 0.000 claims description 26
- 201000010099 disease Diseases 0.000 claims description 21
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 21
- 238000004590 computer program Methods 0.000 claims description 12
- 230000015654 memory Effects 0.000 claims description 12
- 238000001356 surgical procedure Methods 0.000 claims description 6
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000007721 medicinal effect Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Medical Informatics (AREA)
- Computational Mathematics (AREA)
- Public Health (AREA)
- Mathematical Analysis (AREA)
- Computing Systems (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Algebra (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本申请实施例公开了一种数据处理方法、装置、电子设备以及存储介质,涉及人工智能及数字医疗技术领域。该方法可以包括:获取待分组的包括多个ICD编码的病案,将每个ICD编码在第一零矩阵所对应的位置的数值更新为ICD编码的重要程度值,得到第一矩阵;获取第二矩阵,第二矩阵包括每个行数据对应不同的ICD编码,第二矩阵包括的每个列数据对应不同的第一规则库;根据第一矩阵与第二矩阵生成第一目标矩阵;确定第一目标矩阵中的最大值所在的第一列数据所对应的目标第一规则库以对病案进行分组。通过本方法实施例有助于提升对病案进行分组处理的效率。本申请实施例还可以应用于区块链领域,如可以将包括从区块链中获取第二矩阵。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种数据处理方法、装置、电子设备以及存储介质。
背景技术
疾病诊断相关分组(DRGS)为根据诊断信息、手术操作信息对病案按照临床特征相近原则进行归类分组的一种方法。目前,确定病案的所在的DRGS组别时,通常是将每个用于确定病案所在组别的规则库中所包含的至少一个ICD编码,与病案所包含的国际疾病分类ICD编码进行匹配,以根据与该病案匹配的规则库确定病案的所在的DRGS组别。发明人在实践过程中发现,采用这种方法确定病案的所在的DRGS组别,需要利用病案包含的ICD编码进行多次匹配,对病案进行分组处理的效率较低。
发明内容
本申请实施例提供了一种数据处理方法、装置、电子设备以及存储介质,有助于提升对病案进行分组处理的效率。
一方面,本申请实施例公开了一种数据处理方法,所述方法包括:
获取待分组的病案,所述病案包括多个国际疾病分类ICD编码;
确定每个所述ICD编码对应的重要程度值;
将每个所述ICD编码在第一零矩阵所对应的位置的数值更新为所述ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵,所述第一零矩阵中的每个列数据对应不同的ICD编码;
获取第二矩阵,所述第二矩阵包括M个行数据和N个列数据;所述第二矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第二矩阵包括的N个列数据中每个列数据对应不同的第一规则库;所述第二矩阵中的第一位置对应的取值是根据所述第一位置对应的第一规则库中是否包括所述第一位置对应的ICD编码确定的,所述第一位置的取值为所述第二矩阵中任一位置的取值;
根据所述第一矩阵与所述第二矩阵生成第一目标矩阵;
确定所述第一目标矩阵中的最大值所在的第一列数据,并根据所述第一列数据所对应的目标第一规则库对所述病案进行分组。
另一方面,本申请实施例公开了一种数据处理装置,所述装置包括:
获取单元,用于获取待分组的病案,所述病案包括多个国际疾病分类ICD编码;
处理单元,用于确定每个所述ICD编码对应的重要程度值;
所述处理单元,还用于将每个所述ICD编码在第一零矩阵所对应的位置的数值更新为所述ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵,所述第一零矩阵中的每个列数据对应不同的ICD编码;
所述获取单元,还用于获取第二矩阵,所述第二矩阵包括M个行数据和N个列数据;所述第二矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第二矩阵包括的N个列数据中每个列数据对应不同的第一规则库;所述第二矩阵中的第一位置对应的取值是根据所述第一位置对应的第一规则库中是否包括所述第一位置对应的ICD编码确定的,所述第一位置的取值为所述第二矩阵中任一位置的取值;
所述处理单元,还用于根据所述第一矩阵与所述第二矩阵生成第一目标矩阵;
所述处理单元,还用于确定所述第一目标矩阵中的最大值所在的第一列数据,并根据所述第一列数据所对应的目标第一规则库对所述病案进行分组。
又一方面,本申请实施例提供了一种电子设备,电子设备包括处理器、存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于执行如下步骤:
获取待分组的病案,所述病案包括多个国际疾病分类ICD编码;
确定每个所述ICD编码对应的重要程度值;
将每个所述ICD编码在第一零矩阵所对应的位置的数值更新为所述ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵,所述第一零矩阵中的每个列数据对应不同的ICD编码;
获取第二矩阵,所述第二矩阵包括M个行数据和N个列数据;所述第二矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第二矩阵包括的N个列数据中每个列数据对应不同的第一规则库;所述第二矩阵中的第一位置对应的取值是根据所述第一位置对应的第一规则库中是否包括所述第一位置对应的ICD编码确定的,所述第一位置的取值为所述第二矩阵中任一位置的取值;
根据所述第一矩阵与所述第二矩阵生成第一目标矩阵;
确定所述第一目标矩阵中的最大值所在的第一列数据,并根据所述第一列数据所对应的目标第一规则库对所述病案进行分组。
又一方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序指令,计算机程序指令被处理器执行时,用于执行如下步骤:
获取待分组的病案,所述病案包括多个国际疾病分类ICD编码;
确定每个所述ICD编码对应的重要程度值;
将每个所述ICD编码在第一零矩阵所对应的位置的数值更新为所述ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵,所述第一零矩阵中的每个列数据对应不同的ICD编码;
获取第二矩阵,所述第二矩阵包括M个行数据和N个列数据;所述第二矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第二矩阵包括的N个列数据中每个列数据对应不同的第一规则库;所述第二矩阵中的第一位置对应的取值是根据所述第一位置对应的第一规则库中是否包括所述第一位置对应的ICD编码确定的,所述第一位置的取值为所述第二矩阵中任一位置的取值;
根据所述第一矩阵与所述第二矩阵生成第一目标矩阵;
确定所述第一目标矩阵中的最大值所在的第一列数据,并根据所述第一列数据所对应的目标第一规则库对所述病案进行分组。
又一方面,本申请实施例公开了一种计算机程序产品或计算机程序,所述计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行上述数据处理方法。
采用本申请实施例可以获取待分组的包括多个国际疾病分类ICD编码的病案,将每个ICD编码在第一零矩阵所对应的位置的数值更新为ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵,进而获取第二矩阵,第二矩阵包括每个行数据对应不同的ICD编码,第二矩阵包括的每个列数据对应不同的第一规则库;根据第一矩阵与第二矩阵生成第一目标矩阵;确定第一目标矩阵中的最大值所在的第一列数据,并根据第一列数据所对应的目标第一规则库对病案进行分组。由此可以通过针对病案的ICD编码的矩阵和针对各个规则库的ICD编码的矩阵生成目标矩阵,以根据目标矩阵的快速确定病案所在的组别,有助于提升对病案进行分组处理的效率。
附图说明
为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种数据处理方法的流程示意图;
图2是本申请实施例提供的一种第一零矩阵的效果示意图;
图3是本申请实施例提供的一种第二矩阵的效果示意图;
图4是本申请实施例提供的一种生成第一目标矩阵的流程示意图;
图5是本申请实施例提供的一种数据处理方法的效果示意图;
图6是本申请实施例提供的一种数据处理装置的结构示意图;
图7是本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请提供一种数据处理方案,能够获取待分组的包括多个目标国际疾病分类ICD编码的病案,在确定每个ICD编码对应的重要程度值后,将每个ICD编码在第一零矩阵所对应的位置的数值更新为ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵,进而获取第二矩阵,根据第一矩阵与第二矩阵生成第一目标矩阵,并根据第一目标矩阵中的最大值所在的第一列数据所对应的目标第一规则库对病案进行分组。由此可以通过针对病案的ICD编码的矩阵和针对各个规则库的ICD编码的矩阵生成目标矩阵,进而对病案进行分组,避免了针对病案的ICD编码循环多次与各个规则库的ICD编码的进行匹配,有助于提升对病案进行分组处理的效率。
本申请的技术方案可运用在电子设备中,该电子设备可以是终端,也可以是服务器,或者也可以是用于进行验证的其他设备,本申请不做限定。可选的。服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端可以是智能手机、平板电脑、笔记本电脑、台式计算机等,但并不局限于此。
在一种可能的实施方式中,本申请实施例可以应用于数据处理平台,该数据处理平台可以为是医疗平台。例如,需要进行处理的数据是可以是病案数据,进而通过病案包括的多个ICD编码确定病案所属的DRGS组别。
基于上述的描述,本申请实施例提出一种数据处理方法。请参见图1,图1是本申请实施例提供的一种数据处理方法的流程示意图。该方法可以由上述所提及的电子设备执行。该方法可以包括以下步骤。
S101、获取待分组的病案。
其中,该待分组的病案可以为需要确定所在组别的病案。病案可以为医务人员对病患疾病的发生、发展、转归,进行检查、诊断、治疗等医疗活动过程的记录,如病案中可以记录病患的至少一个诊断信息以及至少一个手术操作信息,该诊断信息可以为病患被诊断的疾病的信息,该手术操作信息可以为针对病患所进行的手术操作的信息。
该病案可以包括多个ICD编码。该多个ICD编码可以为待分组的病案中所包括的至少一个诊断信息以及至少一个手术操作信息分别对应的ICD编码。ICD编码可以为根据诊断信息从针对各个疾病诊断的分类及编码确定的诊断信息对应的ICD编码,也可以为根据手术操作信息从针对各个手术操作分类及编码确定的手术操作信息对应的ICD编码。例如,该ICD编码可以包括根据诊断信息从《医疗保障疾病诊断分类及代码(ICD-10)》中确定的诊断信息对应的ICD编码,以及包括根据手术操作信息从《医疗保障手术操作分类与编码(ICD-9-CM-3)》中确定的手术操作信息对应的ICD编码。
可选的,该病案还可以包括病案标识,如该病案标识可以为病案的病案编码。可选的,该病案还可以包括病患的身份信息等,此处不做限制。
S102、确定每个ICD编码对应的重要程度值。
其中,该重要程度值可以反映病案中包括的多个ICD编码在分组过程中的重要性。可以理解的是,ICD编码对应的重要程度值越大,则在在分组过程中的重要性越大,ICD编码对应的重要程度值越小,则在在分组过程中的重要性越小。
在一种可能的实施方式中,病案包括的多个ICD编码中包括位置至少一个诊断信息中每个诊断信息对应的ICD编码和位置至少一个手术操作信息中每个手术操作信息对应的ICD编码,则确定每个ICD编码对应的重要程度值,可以具体包括以下步骤:根据至少一个诊断信息在病案中的排列顺序确定每个诊断信息对应的重要程度值,以及根据至少一个手术操作信息在病案中的排列顺序确定每个手术操作信息对应的重要程度值;将每个诊断信息对应的重要程度值确定为诊断信息对应的ICD编码的重要程度值;将每个手术操作信息对应的重要程度值确定为手术操作信息对应的ICD编码的重要程度值。
该排列顺序可以指示各诊断信息或手术操作信息在病案中具有的重要程度的顺序。例如,该至少一个诊断信息在病案中的排列顺序可以分为第一顺序、第二顺序、第三顺序等等等多个顺序,也可以分为主要顺序和次要顺序。该至少一个手术操作信息在病案中的排列顺序分为第一顺序、第二顺序、第三顺序等等等多个顺序,也可以分为主要顺序和次要顺序。可以理解的,排列顺序越靠前表示该诊断信息或手术操作信息的优先级越高,越重要。针对诊断信息的不同排列顺序对应不同的重要程度值,针对手术操作信息的不同排列顺序也具有不同的重要程度值,排列顺序越靠前,则对应的重要程度值越高。
例如,病案中包括诊断信息A,诊断信息B,手术操作信息A和手术操作信息B,并且,诊断信息A在病案中的排列顺序为主要顺序,诊断信息B在病案中的排列顺序为次要顺序,手术操作信息A在病案中的排列顺序为主要顺序,手术操作信息B在病案中的排列顺序为次要顺序。若诊断信息A对应的重要程度值为10,诊断信息B对应的重要程度值为5,手术操作信息A对应的重要程度值为10,手术操作信息B对应的重要程度值为5,则可以得到诊断信息A对应的ICD编码的重要程度值为10,诊断信息B对应的ICD编码的重要程度值为5,手术操作信息A对应的ICD编码的重要程度值为10,手术操作信息B对应的重要程度值为5,由此可以得到病案中的多个ICD编码中每个ICD编码对应的重要程度值。
在一种可能的实施方式中,本申请实施例还可以根据病案的特征信息确定病案中每个诊断信息的排列顺序的重要程度值以及每个手术操作信息的排列顺序的重要程度值。例如,可以根据病案的特征信息从多个候选规则中确定该病案对应的目标规则,每个候选规则可以指示针对每个排列顺序的诊断信息和手术操作信息的重要程度值;进而可以根据目标规则所指示的针对每个排列顺序的诊断信息和手术操作信息的重要程度值确定出上述病案中每个诊断信息的排列顺序的重要程度值以及每个手术操作信息的排列顺序的重要程度值。病案的特征信息可以为该病案所具有的用于确定目标规则的信息,例如,该病案的特征信息可以为是是指该病案所属的地区。每个候选规则还可以具有该候选规则的适用范围信息,该适用范围可以指示该候选规则所适用的病案的特征信息。例如,由于地区政策不同,则在进行分组时可以有不同的规则,则候选规则的适用范围信息可以指示该候选规则适用于哪些地区的病案。那么从多个候选规则中确定出适用于病案的目标规则,可以为基于病案的特征信息与每个候选规则的适用范围进行匹配,若候选规则的适用范围所指示适用的病案的特征信息包括该病案的特征信息,则确定该候选规则为目标规则。
S103、将每个ICD编码在第一零矩阵所对应的位置的数值更新为ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵。
其中,该第一零矩阵可以为包括1个行数据和M个列数据的零矩阵,零矩阵为矩阵中各个数值均为0的矩阵。该第一零矩阵包括的1个行数据可以对应该待分组的病案;该第一零矩阵包括的M个列数据中每个列数据对应不同的ICD编码。确定病案中的每个ICD编码可以在第一零矩阵中所对应的位置可以为确定病案中的每个ICD编码在该第一零矩阵中所在的列,则根据所在的列和行即可得到ICD编码的位置。
该第一矩阵可以为针对病案以及病案包含的ICD编码的矩阵。该第一矩阵也可以为包括1个行数据和M个列数据的矩阵。该第一矩阵包括的1个行数据可以对应该待分组的病案;该第一矩阵包括的M个列数据中每个列数据对应不同的ICD编码。
此处示例性地对第一矩阵的获取过程进行阐述,请参见图2,图2是本申请实施例提供的一种第一零矩阵的效果示意图。如图2中的201所示为第一零矩阵,该第一零矩阵的有1个行数据和5个列数据,该1个行数据对应目标病案,该5个列数据从左至右依次对应的ICD编码分别为对应编码1、编码2、编码3、编码4和编码5。目标病案中可以包括3个ICD编码,该3个ICD编码分别为编码1、编码2和编码5,则可以得到编码1对应的位置为第1行第1列,编码2对应的位置可以为第1行第2列,ICD编码5对应的位置可以为第1行第5列。若ICD编码中的编码1对应的重要程度值为10,编码2对应的重要程度值为5,编码5对应的重要程度值为5,则利用ICD编码的重要程度值替换第一零矩阵中的数值后,可以得到如图2中的202所示的矩阵,202所示的矩阵即为第一矩阵。
在一种可能的实施方式中,该第一零矩阵和第一矩阵包括的M个列数据中每个列数据对应的ICD编码,可以为由多个规则库构建的规则库集合包括的ICD编码,该多个规则库包括多个第一规则库以及多个第二规则库。M的取值为规则库集合包括的ICD编码的数量。
该规则库可以为包含至少一个ICD编码的库,该规则库集合可以为由多个规则库组成的集合,每个规则库中包含的ICD编码均不相同。规则库集合包括的ICD编码可以为规则库集合中各个规则库所包含的至少一个ICD编码的集合。例如,规则库a包含ICD编码1和ICD编码2,规则库b包含ICD编码3和ICD编码4,则由规则库a和规则库b构成的规则库集合包括的ICD编码为ICD编码1、ICD编码2、ICD编码3和ICD编码4,规则库集合包含的ICD编码的数量为4,即M的取值为4。
该第一规则库可以为包含至少一个疾病诊断对应的ICD编码的库,该第二规则库可以为包含至少一个手术操作对应的ICD编码的库。例如,该第一规则库可以为至少一个从《医疗保障疾病诊断分类及代码(ICD-10)》中确定的ICD编码的库,该第二规则库可以为至少一个从《医疗保障手术操作分类与编码(ICD-9-CM-3)》中确定的ICD编码的库。在一些场景中,该第一规则库可以为主要诊断大类(Major Diagnostic Category,MDC)规则库,该第二规则库可以为基干诊断相关分组(Adjacent Diagnosis Related Groups,ADRG)规则库。
在一种可能的实施方式中,针对每个第一规则库均具有对应的组别,并且每个第一规则库具有与该第一规则库关联的至少一个第二规则库。每个第一规则库关联的至少一个第二规则库均具有对应的组别。可以理解的是,每个第一规则库关联的至少一个第二规则库均具有对应的组别,相当于针对每个第一规则库均具有对应的组别下具有更细致的划分的组别。其中,每个第一规则库具有的与该第一规则库关联的第二规则库的数量可以相同也可以不同,此处不做限制。
S104、获取第二矩阵。
其中,该第二矩阵包括M个行数据和N个列数据,第二矩阵包括的M个行数据中每个行数据对应不同的ICD编码,第二矩阵包括的N个列数据中每个列数据对应不同的第一规则库;第二矩阵中的第一位置对应的取值是根据第一位置对应的第一规则库中是否包括第一位置对应的ICD编码确定的,第一位置的取值为第二矩阵中任一位置的取值。第二矩阵包括的M个行数据中每个行数据对应的ICD编码,为规则库集合中的ICD编码。
可选的,若第一位置对应的第一规则库中包括第一位置对应的ICD编码,则确定所述第一位置的数值为目标数值,若第一位置对应的第一规则库中不包括第一位置对应的ICD编码,则确定所述第一位置的数值为零。该目标数值可以为大于零的任意值,如该目标数值可以为1。
例如,请参见图3,图3是本申请实施例提供的一种第二矩阵的效果示意图。该第二矩阵包括5个行数据和3个列数据。该第二矩阵中的5个行数据从上至下依次对应ICD编码分别为编码1、编码2、编码3、编码4和编码5,该第二矩阵中的3个列数据从左至右依次对应规则库a、规则库b、规则库c。规则库a包括的ICD编码为编码2,规则库b包括的ICD编码为编码1和编码5,规则库c包括的ICD编码为编码3和编码4。则第二矩阵中每个规则库包含的各个ICD编码对应的位置的数值为目标数值,此处目标数值可以为1。
在一种可能的实施方式中,第一矩阵的第k列的数值对应的ICD编码与第二矩阵的第k行的数值对应的ICD编码相同,k为1至M之间的任一个数。例如,第一矩阵的第1列的数值对应的ICD编码与第二矩阵的第1行的数值对应的ICD编码相同,第一矩阵的第2列的数值对应的ICD编码与第二矩阵的第2行的数值对应的ICD编码相同,以此类推,此处不做赘述。
在一种可能的实施方式中,获取第二矩阵,可以包括以下步骤:构建第二零矩阵,第二零矩阵包括M个行数据和N个列数据;第二零矩阵包括的M个行数据中每个行数据对应不同的ICD编码,第二零矩阵包括的N个列数据中每个列数据对应不同的第一规则库;确定第二零矩阵中的第j个列数据对应的第一规则库,第j个列数据为第二零矩阵包括的N个列数据中的任一列数据;当第j个列数据对应的第一规则库包括第j个列数据的第i行的数值对应的ICD编码时,将第i行的数值更新为目标数值,得到更新后的矩阵作为第二矩阵,第i行的数值为M行的数值中的任一行的数值。
其中,该第二零矩阵包括M个行数据和N个列数据,第二零矩阵包括的M个行数据中每个行数据对应不同的ICD编码,第二零矩阵包括的N个列数据中每个列数据对应不同的第一规则库。j可以为从1至N的任一正整数,i可以为从1至M的任一正整数,由此可以理解的是,需要确定针对第二零矩阵中任一位置对应的第一规则库是否包含该第一位置对应的ICD编码,若包含,则将第一位置对应的数值更新为目标数值。
在一种实现场景中,可以确定第二零矩阵中的第1个列数据对应的第一规则库,确定第1个列数据对应的第一规则库包括的ICD编码所在的行,并将第1列以及ICD编码所在的行对应的数值更新为目标数值;然后确定第二零矩阵中的第2个列数据对应的第一规则库;确定第2个列数据对应的第一规则库包括的ICD编码所在的行,并将第2列以及ICD编码所在的行对应的数值更新为目标数值,以此类推,此处不做赘述,进而可以在检测到第二零矩阵中的每个列数据对应的行均更新完毕后,将更新后的矩阵作为第二矩阵。可选的,在确定第二矩阵后,可以将该第二矩阵存储至区块链中,进而可以从区块链中获取第二矩阵。
S105、根据第一矩阵与第二矩阵生成第一目标矩阵。
其中,针对第一矩阵与第二矩阵生成第一目标矩阵可以为对第一矩阵与第二矩阵进行矩阵乘法运算,进而得到第一目标矩阵。
该第一目标矩阵的行数据的数量与第一矩阵的行数据的数量相同,列数据的数量与第二矩阵的列数据的数量相同。由于第一矩阵有1行M列,第二矩阵有M行N列,则该第一目标矩阵具有1行N列。第一目标矩阵的1个行数据对应该待分组的病案,第一目标矩阵中的N个列数据中的每个列数据对应不同的第一规则库。
可以理解的是,该第一目标矩阵中的第r列的数值对应的第一规则库与第二矩阵的第r列的数值的对应的第一规则库相同,r为1至N之间的任一个数。例如,第一目标矩阵的第1列的数值对应的第一规则库与第二矩阵的第1列的数值对应的第一规则库相同,第一目标矩阵的第2列的数值对应的第一规则库与第二矩阵的第2列的数值对应的第一规则库相同,以此类推,此处不做赘述。
例如,请参见图4,图4是本申请实施例提供的一种生成第一目标矩阵的流程示意图。图4中的401所示为一个第一矩阵,402所示为一个第2矩阵,第一矩阵中第1行1列的数值与第二矩阵中第1列第1行的数值相乘,第一矩阵中第1行2列的数值与第二矩阵中第1列第2行的数值相乘,以此类推,直至对第一矩阵中第1行的所有列的数值与第二矩阵中第1列的所有行的数值均分别相乘,将该分别相乘得到的结果相加即可得到第一目标矩阵的第1行第1列的数值,同理可以将第一矩阵中第1行的所有列的数值与第二矩阵中第2列的所有行的数值均分别相乘,将该分别相乘得到的结果相加即可作为第一目标矩阵的第1行第2列的数值,以此类推,直至得到第1行第N列的数值,即得到第一目标矩阵,如图4中的403所示。
S106、确定第一目标矩阵中的最大值所在的第一列数据,并根据第一列数据所对应的目标第一规则库对病案进行分组。
其中,该第一列数据可以为第一目标矩阵中的最大值所在的列数据。该目标第一规则库可以为第一列数据所对应的第一规则库。例如,一个第一目标矩阵为(5,15,0),则该第一目标矩阵中的最大值所在的第一列数据为第2列的数值,则第2列的数值对应的第一规则库即为目标第一规则库。
在一种可能的实施方式中,若第一目标矩阵中的最大值具有多个,即第一列数据具有多个,则可以将病案中排列顺序最靠前的诊断信息对应的ICD编码所在的第一列数据对应的第一规则库确定为目标第一规则库。
在一种可能的实施方式中,若在对病案进行分组时,仅需要依照病案的诊断信息进行分组,即仅需要依照第一规则库所包含的ICD编码(如第一规则库中包含至少一个疾病诊断对应的ICD编码)对病案进行分组,则可以在得到目标第一规则库后,将该目标第一规则库所对应的组别确定该病案所在的组别,如该目标第一规则库为MDC_a规则库,则该病案所属的组别即为MDC_a组。
在一种可能的实施方式中,若在对病案进行分组时,不仅需要依照病案的诊断信息进行分组,还需要依照病案的手术操作信息进行分组,即同时考虑病案的诊断信息和手术操作信息进行分组,则根据第一列数据所对应的目标第一规则库对病案进行分组,还可以包括以下步骤:获取第三矩阵,第三矩阵包括M个行数据和P个列数据;第二矩阵包括的M个行数据中每个行数据对应不同的ICD编码,第三矩阵包括的P个列数据中每个列数据对应不同的第二规则库,第二规则库为与目标第一规则库关联的规则库;第三矩阵中的第二位置对应的取值是根据第二位置对应的第二规则库中是否包括第二位置对应的ICD编码确定的,第二位置的取值为第三矩阵中任一位置的取值;根据第一矩阵与第三矩阵生成第二目标矩阵;确定第二目标矩阵中的最大值所在的第二列数据,并根据第二列数据所对应的目标第二规则库;根据目标第一规则库以及目标第二规则库确定病案所在的组别。具体步骤可以参照图5所示实施例的相关描述,此处不做赘述。
采用本申请实施例可以获取待分组的包括多个国际疾病分类ICD编码的病案,将每个ICD编码在第一零矩阵所对应的位置的数值更新为ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵,进而获取第二矩阵,第二矩阵包括每个行数据对应不同的ICD编码,第二矩阵包括的每个列数据对应不同的第一规则库;根据第一矩阵与第二矩阵生成第一目标矩阵;确定第一目标矩阵中的最大值所在的第一列数据,并根据第一列数据所对应的目标第一规则库对病案进行分组。由此可以通过针对病案的ICD编码的矩阵和针对各个规则库的ICD编码的矩阵生成目标矩阵,以根据目标矩阵的快速确定病案所在的组别,有助于提升对病案进行分组处理的效率。
请参见图5,图5是本申请实施例提供的一种数据处理方法的效果示意图。该方法可以由上述电子设备执行。该方法可以包括以下步骤。
S501、获取待分组的病案。
S502、确定每个ICD编码对应的重要程度值。
S503、将每个ICD编码在第一零矩阵所对应的位置的数值更新为ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵。
S504、获取第二矩阵。
S505、根据第一矩阵与第二矩阵生成第一目标矩阵;
S506、确定第一目标矩阵中的最大值所在的第一列数据,并确定第一列数据所对应的目标第一规则库。
步骤S501-S506可以参照步骤S101-S106的相关描述,此处不做赘述。
S507、获取第三矩阵。
其中,第三矩阵包括M个行数据和P个列数据。第三矩阵包括的M个行数据中每个行数据对应不同的ICD编码,第三矩阵包括的P个列数据中每个列数据对应不同的第二规则库,第二规则库为与目标第一规则库关联的规则库;第三矩阵中的第二位置对应的取值是根据第二位置对应的第二规则库中是否包括第二位置对应的ICD编码确定的,第二位置的取值为第三矩阵中任一位置的取值。第三矩阵包括的M个行数据中每个行数据对应的ICD编码,为规则库集合中的ICD编码。
可选的,若第二位置对应的第二规则库中包括第二位置对应的ICD编码,则确定第二位置的数值为目标数值,若第二位置对应的第一规则库中不包括第二位置对应的ICD编码,则确定所述第二位置的数值为零。该目标数值可以为大于零的任意值,如该目标数值可以为1。
在一种可能的实施方式中,该第三矩阵的获取方式与第二矩阵的获取方式相似,区别在于第三矩阵的每个列数据分别对应不同的第二规则库,而第二矩阵的每个列数据分别对应不同的第一规则库。那么,获取第三矩阵可以包括以下步骤:构建第三零矩阵,第三零矩阵包括M个行数据和P个列数据;第三零矩阵包括的M个行数据中每个行数据对应不同的ICD编码,第三零矩阵包括的P个列数据中每个列数据对应不同的第一规则库;确定第三零矩阵中的第s个列数据对应的第一规则库,第s个列数据为第三零矩阵包括的N个列数据中的任一列数据;当第s个列数据对应的第一规则库包括第s个列数据的第d行的数值对应的ICD编码时,将第d行的数值更新为目标数值,得到更新后的矩阵作为第三矩阵,第d行的数值为M行的数值中的任一行的数值。其中,P和K的数值可以相同,也可以不同,P的数值取决于与目标第一规则库相关的第二规则库的数量。针对第三矩阵的具体获取方式可以参照S504的相关描述,此处不做赘述。
在一种可能的实施方式中,第一矩阵的第h列的数值对应的ICD编码与第三矩阵的第h行的数值对应的ICD编码相同,h为1至M之间的任一个数。例如,第一矩阵的第1列的数值对应的ICD编码与第三矩阵的第1行的数值对应的ICD编码相同,第一矩阵的第2列的数值对应的ICD编码与第三矩阵的第2行的数值对应的ICD编码相同,以此类推,此处不做赘述。
S508、根据第一矩阵与第三矩阵生成第二目标矩阵。
其中,针对第一矩阵与三矩阵生成第二目标矩阵可以为对第一矩阵与第三矩阵进行矩阵乘法运算,进而得到第二目标矩阵。
该第二目标矩阵的行数据的数量与第一矩阵的行数据的数量相同,列数据的数量与第三矩阵的列数据的数量相同。由于第一矩阵有1行M列,第三矩阵有M行P列,则该第二目标矩阵具有1行P列。第二目标矩阵的1个行数据对应该待分组的病案,第二目标矩阵中的P个列数据中的每个列数据对应不同的第二规则库。
可以理解的是,该第二目标矩阵中的第t列的数值对应的第一规则库与第二矩阵的第t列的数值的对应的第一规则库相同,t为1至N之间的任一个数。例如,第二目标矩阵的第1列的数值对应的第一规则库与第二矩阵的第1行的数值对应的第一规则库相同,第二目标矩阵的第2列的数值对应的第一规则库与第二矩阵的第2行的数值对应的第一规则库相同,以此类推,此处不做赘述。
S509、确定第二目标矩阵中的最大值所在的第二列数据,并根据第二列数据所对应的目标第二规则库。
其中,该第二列数据可以为第二目标矩阵中的最大值所在的列数据。该目标第二规则库可以为第二列数据所对应的第一规则库。例如,一个第二目标矩阵为(0,20,30,10),则该第二目标矩阵中的最大值所在的第二列数据为第3列的数值,则第3列的数值对应的第二规则库即为目标第二规则库。
在一种可能的实施方式中,若第二目标矩阵中的最大值具有多个,即第二列数据具有多个,则可以将病案中排列顺序最靠前的手术操作信息对应的ICD编码所在的第二列数据对应的第二规则库确定为目标第二规则库。
S510、根据目标第一规则库以及目标第二规则库确定病案所在的组别。
其中,根据目标第一规则库以及目标第二规则库确定病案所在的组别,可以为将目标第一规则库所对应的组别下,目标第二规则库对应的组别确定为病案所在的组别,相当于在针对目标第一规则库所对应的组别下通过目标第二规则进行了更细致的分组,由此可以实现针对病案的诊断信息和手术操作信息进行分组,得到基于诊断信息和手术操作信息进行分组后病案所在的DRGS分组。
在一种可能的实施方式中,在根据目标第一规则库以及目标第二规则库确定病案所在的组别之后,还可以根据病案的其他特征对病案进行更详细的分组。例如,根据病案包含的并发症类型对病案所在的分组进行更详细的划分,如并发症类型可以包括有并发症类型或无并发症类型;又如,根据该病案包含的住院时间对病案所在的分组进行更详细的划分,如病案时间可以为长、中、短集中类型;又如,根据该病案包含的死亡状态(是否死亡)对病案所在的分组进行更详细的划分,该死亡状态可以为死亡或未死亡。或者还可以根据其他的特征对病案进行划分,此处不做限制。由此可以得到基于更多的特征进行分组后病案所在的DRGS分组。
在一种可能的实施方式中,本申请是实施例还可以基于多个待分组的病案进行批量处理。具体的,可以基于该多个待分组的病案得到每个病案中包含的每个ICD编码对应的重要程度值,对每个病案中每个ICD编码在第一零矩阵所对应的位置的数值更新为ICD编码的重要程度值,得到更新后的矩阵以作为针对每个病案的第一矩阵,进而根据每个病案对应的第一矩阵构成针对多个病案的病案群体矩阵;获取第二矩阵,并根据病案群体矩阵与第二矩阵生成第一目标矩阵,以确定第一目标矩阵中每行中的最大值所在的第一列数据,并根据每行中的第一列数据所对应的目标第一规则库确定每行对应的病案所在的分组。
其中,根据每个病案对应的第一矩阵构成针对多个病案的病案群体矩阵,可以为将每个病案对应第一矩阵作为病案群体矩阵中的每一行的数据,若待分组的病案数量为W,则病案群体矩阵有W个行数据和M个列数据,病案群体矩阵的W个行数据中的每个行数据对应不同的病案。进而得到的第一目标矩阵中具有W个行数据,且第一目标矩阵中W个行数据中每个行数据对应的病案与病案群体矩阵中每一行对应的病案相同。
采用本申请实施例可以获取待分组的包括多个国际疾病分类ICD编码的病案,将每个ICD编码在第一零矩阵所对应的位置的数值更新为ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵,进而获取第二矩阵,第二矩阵包括每个行数据对应不同的ICD编码,第二矩阵包括的每个列数据对应不同的第一规则库;根据第一矩阵与第二矩阵生成第一目标矩阵;确定第一目标矩阵中的最大值所在的第一列数据,并确定第一列数据所对应的目标第一规则库,进而再基于第三矩阵和第一句矩阵生成第二目标矩阵,以确定病案的目标第二规则库,仅为根据目标第一规则库和目标第二规则库确定病案所在的分组。由此可以通过针对病案的ICD编码的矩阵和针对各个规则库的ICD编码的矩阵生成目标矩阵,以根据目标矩阵的快速确定病案所在的组别,有助于提升对病案进行分组处理的效率。
请参见图6,图6是本申请实施例提供的一种数据处理装置的结构示意图。可选的,该数据处理装置可以设置于上述电子设备中。如图6所示,本实施例中所描述的数据处理装置可以包括:
获取单元601,用于获取待分组的病案,所述病案包括多个国际疾病分类ICD编码;
处理单元602,用于确定每个所述ICD编码对应的重要程度值;
所述处理单元602,还用于将每个所述ICD编码在第一零矩阵所对应的位置的数值更新为所述ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵,所述第一零矩阵中的每个列数据对应不同的ICD编码;
所述获取单元601,还用于获取第二矩阵,所述第二矩阵包括M个行数据和N个列数据;所述第二矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第二矩阵包括的N个列数据中每个列数据对应不同的第一规则库;所述第二矩阵中的第一位置对应的取值是根据所述第一位置对应的第一规则库中是否包括所述第一位置对应的ICD编码确定的,所述第一位置的取值为所述第二矩阵中任一位置的取值;
所述处理单元602,还用于根据所述第一矩阵与所述第二矩阵生成第一目标矩阵;
所述处理单元602,还用于确定所述第一目标矩阵中的最大值所在的第一列数据,并根据所述第一列数据所对应的目标第一规则库对所述病案进行分组。
在一种实现方式中,所述第一矩阵的第k列的数值对应的ICD编码与所述第二矩阵的第k行的数值对应的ICD编码相同,k为1至M之间的任一个数。
在一种实现方式中,所述处理单元602,具体用于:
构建第二零矩阵,所述第二零矩阵包括M个行数据和N个列数据;所述第二零矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第二零矩阵包括的N个列数据中每个列数据对应不同的第一规则库;
确定所述第二零矩阵中的第j个列数据对应的第一规则库,第j个列数据为所述第二零矩阵包括的N个列数据中的任一列数据;
当所述第j个列数据对应的第一规则库包括所述第j个列数据的第i行的数值对应的ICD编码时,将所述第i行的数值更新为目标数值,得到所述更新后的矩阵作为第二矩阵,所述第i行的数值为M行的数值中的任一行的数值。
在一种实现方式中,所述处理单元602,具体用于:
获取第三矩阵,所述第三矩阵包括M个行数据和P个列数据;所述第三矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第三矩阵包括的P个列数据中每个列数据对应不同的第二规则库,所述第二规则库为与所述目标第一规则库关联的规则库;所述第三矩阵中的第二位置对应的取值是根据所述第二位置对应的第二规则库中是否包括所述第二位置对应的ICD编码确定的,所述第二位置的取值为所述第三矩阵中任一位置的取值;
根据所述第一矩阵与所述第三矩阵生成第二目标矩阵;
确定所述第二目标矩阵中的最大值所在的第二列数据,并根据所述第二列数据所对应的目标第二规则库;
根据所述目标第一规则库以及所述目标第二规则库确定所述病案所在的组别。
在一种实现方式中,所述第一矩阵的第h列的数值对应的ICD编码与所述第三矩阵的第h行的数值对应的ICD编码相同,h为1至M之间的任一个数。
在一种实现方式中,所述第一矩阵包括的M个列数据中每个列数据对应的ICD编码,为由多个规则库构建的规则库集合包括的ICD编码,所述多个规则库包括多个所述第一规则库以及多个所述第二规则库;M的取值为规则库集合包括的ICD编码的数量;
所述第二矩阵包括的M个行数据中每个行数据对应的ICD编码,为所述规则库集合中的ICD编码;
所述第三矩阵包括的M个行数据中每个行数据对应的ICD编码,为所述规则库集合中的ICD编码。
在一种实现方式中,所述病案还包括至少一个诊断信息和至少一个手术操作信息,所述多个ICD编码中包括所述至少一个诊断信息中每个诊断信息对应的ICD编码和所述至少一个手术操作信息中每个手术操作信息对应的ICD编码;所述处理单元602,具体用于:
根据所述至少一个诊断信息在所述病案中的排列顺序确定每个所述诊断信息对应的重要程度值,以及根据所述至少一个手术操作信息在所述病案中的排列顺序确定所述每个手术操作信息对应的重要程度值;
将所述每个诊断信息对应的重要程度值确定为所述诊断信息对应的ICD编码的重要程度值;
将所述每个手术操作信息对应的重要程度值确定为所述手术操作信息对应的ICD编码的重要程度值。
请参见图7,图7是本申请实施例提供的一种电子设备的结构示意图。本实施例中所描述的电子设备,包括:处理器701、存储器702。可选的,该电子设备还可包括网络接口703或供电模块等结构。上述处理器701、存储器702以及网络接口703之间可以交互数据。
上述处理器701可以是中央处理单元(Central Processing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
上述网络接口703可以包括输入设备和/或输出设备,例如该输入设备是可以是控制面板、麦克风、接收器等,输出设备可以是显示屏、发送器等,此处不一一列举。例如,在申请实施例中,该网络接口可包括接收器和发送器。
上述存储器702可以包括只读存储器和随机存取存储器,并向处理器701提供程序指令和数据。存储器702的一部分还可以包括非易失性随机存取存储器。其中,所述处理器701调用所述程序指令时用于执行:
获取待分组的病案,所述病案包括多个国际疾病分类ICD编码;
确定每个所述ICD编码对应的重要程度值;
将每个所述ICD编码在第一零矩阵所对应的位置的数值更新为所述ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵,所述第一零矩阵中的每个列数据对应不同的ICD编码;
获取第二矩阵,所述第二矩阵包括M个行数据和N个列数据;所述第二矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第二矩阵包括的N个列数据中每个列数据对应不同的第一规则库;所述第二矩阵中的第一位置对应的取值是根据所述第一位置对应的第一规则库中是否包括所述第一位置对应的ICD编码确定的,所述第一位置的取值为所述第二矩阵中任一位置的取值;
根据所述第一矩阵与所述第二矩阵生成第一目标矩阵;
确定所述第一目标矩阵中的最大值所在的第一列数据,并根据所述第一列数据所对应的目标第一规则库对所述病案进行分组。
在一种实现方式中,所述第一矩阵的第k列的数值对应的ICD编码与所述第二矩阵的第k行的数值对应的ICD编码相同,k为1至M之间的任一个数。
在一种实现方式中,所述处理器701,具体用于:
构建第二零矩阵,所述第二零矩阵包括M个行数据和N个列数据;所述第二零矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第二零矩阵包括的N个列数据中每个列数据对应不同的第一规则库;
确定所述第二零矩阵中的第j个列数据对应的第一规则库,第j个列数据为所述第二零矩阵包括的N个列数据中的任一列数据;
当所述第j个列数据对应的第一规则库包括所述第j个列数据的第i行的数值对应的ICD编码时,将所述第i行的数值更新为目标数值,得到所述更新后的矩阵作为第二矩阵,所述第i行的数值为M行的数值中的任一行的数值。
在一种实现方式中,所述处理器701,具体用于:
获取第三矩阵,所述第三矩阵包括M个行数据和P个列数据;所述第三矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第三矩阵包括的P个列数据中每个列数据对应不同的第二规则库,所述第二规则库为与所述目标第一规则库关联的规则库;所述第三矩阵中的第二位置对应的取值是根据所述第二位置对应的第二规则库中是否包括所述第二位置对应的ICD编码确定的,所述第二位置的取值为所述第三矩阵中任一位置的取值;
根据所述第一矩阵与所述第三矩阵生成第二目标矩阵;
确定所述第二目标矩阵中的最大值所在的第二列数据,并根据所述第二列数据所对应的目标第二规则库;
根据所述目标第一规则库以及所述目标第二规则库确定所述病案所在的组别。
在一种实现方式中,所述第一矩阵的第h列的数值对应的ICD编码与所述第三矩阵的第h行的数值对应的ICD编码相同,h为1至M之间的任一个数。
在一种实现方式中,所述第一矩阵包括的M个列数据中每个列数据对应的ICD编码,为由多个规则库构建的规则库集合包括的ICD编码,所述多个规则库包括多个所述第一规则库以及多个所述第二规则库;M的取值为规则库集合包括的ICD编码的数量;
所述第二矩阵包括的M个行数据中每个行数据对应的ICD编码,为所述规则库集合中的ICD编码;
所述第三矩阵包括的M个行数据中每个行数据对应的ICD编码,为所述规则库集合中的ICD编码。
在一种实现方式中,所述病案还包括至少一个诊断信息和至少一个手术操作信息,所述多个ICD编码中包括所述至少一个诊断信息中每个诊断信息对应的ICD编码和所述至少一个手术操作信息中每个手术操作信息对应的ICD编码;所述处理器701,具体用于:
根据所述至少一个诊断信息在所述病案中的排列顺序确定每个所述诊断信息对应的重要程度值,以及根据所述至少一个手术操作信息在所述病案中的排列顺序确定所述每个手术操作信息对应的重要程度值;
将所述每个诊断信息对应的重要程度值确定为所述诊断信息对应的ICD编码的重要程度值;
将所述每个手术操作信息对应的重要程度值确定为所述手术操作信息对应的ICD编码的重要程度值。
可选的,该程序指令被处理器执行时还可实现上述实施例中方法的其他步骤,这里不再赘述。
本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述方法,比如执行上述电子设备执行的方法,此处不赘述。
可选的,本申请涉及的存储介质如计算机可读存储介质可以是非易失性的,也可以是易失性的。
可选的,该计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。其中,本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
需要说明的是,对于前述的各个方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某一些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(Random AccessMemory,RAM)、磁盘或光盘等。
本申请实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各方法的实施例中所执行的步骤。例如,该计算机设备可以为终端,或者可以为服务器。
以上对本申请实施例所提供的一种数据处理方法、装置、电子设备及存储介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种数据处理方法,其特征在于,包括:
获取待分组的病案,所述病案包括多个国际疾病分类ICD编码;
确定每个所述ICD编码对应的重要程度值;
将每个所述ICD编码在第一零矩阵所对应的位置的数值更新为所述ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵,所述第一零矩阵中的每个列数据对应不同的ICD编码;
获取第二矩阵,所述第二矩阵包括M个行数据和N个列数据;所述第二矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第二矩阵包括的N个列数据中每个列数据对应不同的第一规则库;所述第二矩阵中的第一位置对应的取值是根据所述第一位置对应的第一规则库中是否包括所述第一位置对应的ICD编码确定的,所述第一位置的取值为所述第二矩阵中任一位置的取值;
根据所述第一矩阵与所述第二矩阵生成第一目标矩阵;
确定所述第一目标矩阵中的最大值所在的第一列数据,并根据所述第一列数据所对应的目标第一规则库对所述病案进行分组。
2.根据权利要求1所述方法,其特征在于,所述第一矩阵的第k列的数值对应的ICD编码与所述第二矩阵的第k行的数值对应的ICD编码相同,k为1至M之间的任一个数。
3.根据权利要求1所述方法,其特征在于,所述获取第二矩阵,包括:
构建第二零矩阵,所述第二零矩阵包括M个行数据和N个列数据;所述第二零矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第二零矩阵包括的N个列数据中每个列数据对应不同的第一规则库;
确定所述第二零矩阵中的第j个列数据对应的第一规则库,第j个列数据为所述第二零矩阵包括的N个列数据中的任一列数据;
当所述第j个列数据对应的第一规则库包括所述第j个列数据的第i行的数值对应的ICD编码时,将所述第i行的数值更新为目标数值,得到所述更新后的矩阵作为第二矩阵,所述第i行的数值为M行的数值中的任一行的数值。
4.根据权利要求1所述方法,其特征在于,所述根据所述第一列数据所对应的目标第一规则库对所述病案进行分组,包括:
获取第三矩阵,所述第三矩阵包括M个行数据和P个列数据;所述第三矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第三矩阵包括的P个列数据中每个列数据对应不同的第二规则库,所述第二规则库为与所述目标第一规则库关联的规则库;所述第三矩阵中的第二位置对应的取值是根据所述第二位置对应的第二规则库中是否包括所述第二位置对应的ICD编码确定的,所述第二位置的取值为所述第三矩阵中任一位置的取值;
根据所述第一矩阵与所述第三矩阵生成第二目标矩阵;
确定所述第二目标矩阵中的最大值所在的第二列数据,并根据所述第二列数据所对应的目标第二规则库;
根据所述目标第一规则库以及所述目标第二规则库确定所述病案所在的组别。
5.根据权利要求4所述方法,其特征在于,所述第一矩阵的第h列的数值对应的ICD编码与所述第三矩阵的第h行的数值对应的ICD编码相同,h为1至M之间的任一个数。
6.根据权利要求1-5任一项所述的方法,其特征在于,
所述第一矩阵包括的M个列数据中每个列数据对应的ICD编码,为由多个规则库构建的规则库集合包括的ICD编码,所述多个规则库包括多个所述第一规则库以及多个所述第二规则库;M的取值为规则库集合包括的ICD编码的数量;
所述第二矩阵包括的M个行数据中每个行数据对应的ICD编码,为所述规则库集合中的ICD编码;
所述第三矩阵包括的M个行数据中每个行数据对应的ICD编码,为所述规则库集合中的ICD编码。
7.根据权利要求1所述方法,其特征在于,所述病案还包括至少一个诊断信息和至少一个手术操作信息,所述多个ICD编码中包括所述至少一个诊断信息中每个诊断信息对应的ICD编码和所述至少一个手术操作信息中每个手术操作信息对应的ICD编码;
所述确定每个所述ICD编码对应的重要程度值,包括:
根据所述至少一个诊断信息在所述病案中的排列顺序确定每个所述诊断信息对应的重要程度值,以及根据所述至少一个手术操作信息在所述病案中的排列顺序确定所述每个手术操作信息对应的重要程度值;
将所述每个诊断信息对应的重要程度值确定为所述诊断信息对应的ICD编码的重要程度值;
将所述每个手术操作信息对应的重要程度值确定为所述手术操作信息对应的ICD编码的重要程度值。
8.一种数据处理装置,其特征在于,包括:
获取单元,用于获取待分组的病案,所述病案包括多个国际疾病分类ICD编码;
处理单元,用于确定每个所述ICD编码对应的重要程度值;
所述处理单元,还用于将每个所述ICD编码在第一零矩阵所对应的位置的数值更新为所述ICD编码的重要程度值,得到更新后的矩阵以作为第一矩阵,所述第一零矩阵中的每个列数据对应不同的ICD编码;
所述获取单元,还用于获取第二矩阵,所述第二矩阵包括M个行数据和N个列数据;所述第二矩阵包括的M个行数据中每个行数据对应不同的ICD编码,所述第二矩阵包括的N个列数据中每个列数据对应不同的第一规则库;所述第二矩阵中的第一位置对应的取值是根据所述第一位置对应的第一规则库中是否包括所述第一位置对应的ICD编码确定的,所述第一位置的取值为所述第二矩阵中任一位置的取值;
所述处理单元,还用于根据所述第一矩阵与所述第二矩阵生成第一目标矩阵;
所述处理单元,还用于确定所述第一目标矩阵中的最大值所在的第一列数据,并根据所述第一列数据所对应的目标第一规则库对所述病案进行分组。
9.一种电子设备,其特征在于,包括处理器、存储器,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111118317.1A CN113808740A (zh) | 2021-09-23 | 2021-09-23 | 一种数据处理方法、装置、电子设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111118317.1A CN113808740A (zh) | 2021-09-23 | 2021-09-23 | 一种数据处理方法、装置、电子设备以及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113808740A true CN113808740A (zh) | 2021-12-17 |
Family
ID=78896490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111118317.1A Pending CN113808740A (zh) | 2021-09-23 | 2021-09-23 | 一种数据处理方法、装置、电子设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113808740A (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109741816A (zh) * | 2018-12-28 | 2019-05-10 | 福建亿能达信息技术股份有限公司 | 一种医疗服务价值评价方法、电子设备及存储介质 |
CN109801693A (zh) * | 2018-12-14 | 2019-05-24 | 平安医疗健康管理股份有限公司 | 病案分组方法及装置、终端和计算机可读存储介质 |
CN111785382A (zh) * | 2020-06-28 | 2020-10-16 | 平安医疗健康管理股份有限公司 | DRGs分组的入组判定方法、装置及计算机设备 |
CN111951972A (zh) * | 2020-08-12 | 2020-11-17 | 望海康信(北京)科技股份公司 | 病案分组方法、装置、计算机设备及存储介质 |
CN112466420A (zh) * | 2020-11-26 | 2021-03-09 | 泰康保险集团股份有限公司 | 分组方法、装置、电子设备及存储介质 |
-
2021
- 2021-09-23 CN CN202111118317.1A patent/CN113808740A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109801693A (zh) * | 2018-12-14 | 2019-05-24 | 平安医疗健康管理股份有限公司 | 病案分组方法及装置、终端和计算机可读存储介质 |
CN109741816A (zh) * | 2018-12-28 | 2019-05-10 | 福建亿能达信息技术股份有限公司 | 一种医疗服务价值评价方法、电子设备及存储介质 |
CN111785382A (zh) * | 2020-06-28 | 2020-10-16 | 平安医疗健康管理股份有限公司 | DRGs分组的入组判定方法、装置及计算机设备 |
CN111951972A (zh) * | 2020-08-12 | 2020-11-17 | 望海康信(北京)科技股份公司 | 病案分组方法、装置、计算机设备及存储介质 |
CN112466420A (zh) * | 2020-11-26 | 2021-03-09 | 泰康保险集团股份有限公司 | 分组方法、装置、电子设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
薛递洋 等: "北京市剖宫产分娩诊断相关组分组研究", 《中国病案》, vol. 10, no. 10, pages 4 - 7 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11922308B2 (en) | Generating neighborhood convolutions within a large network | |
CN109598628B (zh) | 医保欺诈行为的识别方法、装置、设备及可读存储介质 | |
CN110033162B (zh) | 一种核保和问答规则生成方法、装置及设备 | |
WO2021179630A1 (zh) | 一种并发症风险预测系统、方法、装置、设备及介质 | |
CN110009513A (zh) | 针对相互保险的理赔方法、装置、设备及可读存储介质 | |
Palubeckis et al. | Maximally diverse grouping: an iterated tabu search approach | |
CN110362829A (zh) | 结构化病历数据的质量评估方法、装置及设备 | |
US20140278490A1 (en) | System and Method For Grouping Medical Codes For Clinical Predictive Analytics | |
CN111783830A (zh) | 基于oct的视网膜分类方法、装置、计算机设备及存储介质 | |
WO2020234515A1 (en) | Compatible anonymization of data sets of different sources | |
CN114741384A (zh) | 一种患者信息处理方法及其装置、计算机可读存储介质 | |
CN113724849A (zh) | 基于人工智能的医疗资源配置方法、装置、设备及介质 | |
CN113254673A (zh) | 一种基于知识图谱的数据管理方法、系统、设备和介质 | |
CN113808740A (zh) | 一种数据处理方法、装置、电子设备以及存储介质 | |
CN109767819B (zh) | 病历的分组方法、装置、存储介质和电子设备 | |
CN113448876B (zh) | 一种业务测试方法、装置、计算机设备及存储介质 | |
CN113760367B (zh) | 一种数据处理方法、装置、电子设备以及存储介质 | |
EP2771864A2 (en) | Identifying people likely to respond accurately to survey questions | |
CN112016979B (zh) | 用户分群方法、装置、设备和计算机可读存储介质 | |
CN111584050B (zh) | 黄疸分诊信息的处理方法、装置、计算机设备和存储介质 | |
CN112035361B (zh) | 医疗诊断模型的测试方法、装置、计算机设备和存储介质 | |
CN110458508A (zh) | 单据信息的处理方法、处理装置及相关产品 | |
US20210027892A1 (en) | System and method for outputting groups of vectorized temporal records | |
Mason | Quasi‐conscious multivariate systems | |
CN109360662A (zh) | 诊疗审核规则更新方法、装置、计算机设备和存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |