CN110767320A

CN110767320A - 数据处理方法、装置、电子设备及可读存储介质

Info

Publication number: CN110767320A
Application number: CN201911052684.9A
Authority: CN
Inventors: 刘本农; 李文婷
Original assignee: Beijing Neusoft Wang Hai Technology Co Ltd
Current assignee: Beijing Neusoft Wang Hai Technology Co Ltd
Priority date: 2019-10-31
Filing date: 2019-10-31
Publication date: 2020-02-07
Anticipated expiration: 2039-10-31
Also published as: CN110767320B

Abstract

本申请实施例提供了一种数据处理方法、装置、电子设备及可读存储介质，包括：获取对应于同一疾病的原始用药数据；确定各原始用药数据的ATC编码，并基于各原始用药数据的ATC编码对原始用药数据进行合并处理，得到合并后的用药数据。在本申请实施例中，在对对应于某一疾病的用药数据进行处理时，由于可以基于ATC编码对获取到的原始用药数据进行合并处理，因此得到的合并后的用药数据相比现有技术中采用纯统计学进行处理后得到的用药数据，用药数据的各维度之间具备医学解释能力，具有统一性和可比性。

Description

数据处理方法、装置、电子设备及可读存储介质

技术领域

本申请涉及医疗数据技术领域，具体而言，本发明涉及一种数据处理方法、装置、电子设备及可读存储介质。

背景技术

在实际生活中，病人的病情不同，在进行治疗时所需要的药物也是不同的，在治疗一些疾病时往往可能会涉及到大量不同的药物。为了获知哪些药品可以治疗哪些疾病，通常需要对大量的用药信息进行建模分析，而为了降低药品建模的分析维度，提升模型分析效率，通常可以对建模时所采用的用药信息进行降维处理。目前的主要降维模式都是基于统计学机器学习的降维方案，如PCA(Principal Component Analysis，主成分分析)降维、K-means(k均值)聚类降维等。

但是，现有的降维方案缺乏医学解释能力，仅具有统计学意义，而在医学环境下，建立模型的数据往往需要有清晰的医学意义，才能较好的辅助到实际应用场景，而基于纯统计学所得到的降维结果没有统一性和可比性，在不同场景下所得到的降维结果，各维度之间互相没有关联。

发明内容

本申请的目的旨在至少能解决上述的技术缺陷之一。

第一方面，本申请实施例提供了一种数据处理方法，该方法包括：

获取对应于同一疾病的原始用药数据；

确定各原始用药数据的ATC(Anatomical Therapeutic Chemical，解剖学治疗学及化学分类系统)编码，并基于各原始用药数据的ATC编码对原始用药数据进行合并处理，得到合并后的用药数据。

第一方面可选的实施例中，原始用药数据包括药品名称和下列用药附加信息中的至少一项：

用药数量、用药费用。

第一方面可选的实施例中，确定各原始用药数据的ATC编码，并基于各原始用药数据的ATC编码对原始用药数据进行合并处理，得到合并后的用药数据，包括：

确定各原始用药数据中药品名称的ATC编码，并将各原始用药数据中的药品名称替换为药品名称的ATC编码，得到替换后的用药数据；

将替换后的用药数据中具有相同ATC编码的各用药数据的相应的用药附加信息进行第一合并处理，得到合并后的用药数据。

第一方面可选的实施例中，若用药附加信息包括用药数量和用药费用，将替换后的用药数据中具有相同ATC编码的各用药数据的相应的用药附加信息进行第一合并处理，得到合并后的用药数据，包括：

将替换后的用药数据中具有相同ATC编码的各用药数据的相应的用药附加信息进行第一合并处理，得到第一合并处理结果；

对于第一合并处理结果中的每个用药数据，将每个用药数据的用药数量和用药费用进行第二合并处理，得到合并后的用药数据。

第一方面可选的实施例中，得到合并后的用药数据之后，还包括：

对于合并后的用药数据中所包括的每个ATC编码，进行对应于疾病的卡方检验处理，得到ATC编码对应于疾病的概率值；

基于每个ATC编码对应于疾病的概率值和筛选规则，对合并后的用药数据进行筛选，得到筛选后的用药数据；

将筛选后的用药数据中所包括的ATC编码对应的药物作为对应于疾病的目标用药。

第一方面可选的实施例中，第一合并处理和第二合并处理包括求和处理或加权处理中的至少一项。

第一方面可选的实施例中，ATC编码为药理学编码。

第二方面，本申请实施例提供了一种数据处理装置，该装置包括：

用药数据获取模块，用于获取对应于同一疾病的原始用药数据；

合并处理模块，用于确定各原始用药数据的ATC编码，并基于各原始用药数据的ATC编码对原始用药数据进行合并处理，得到合并后的用药数据。

第二方面可选的实施例中，原始用药数据包括药品名称和下列用药附加信息中的至少一项：

用药数量、用药费用。

第二方面可选的实施例中，合并处理模块在确定各原始用药数据的ATC编码，并基于各原始用药数据的ATC编码对原始用药数据进行合并处理，得到合并后的用药数据时，具体用于：

第二方面可选的实施例中，若用药附加信息包括用药数量和用药费用，合并处理模块在将替换后的用药数据中具有相同ATC编码的各用药数据的相应的用药附加信息进行第一合并处理，得到合并后的用药数据时，具体用于：

第二方面可选的实施例中，该装置还包括目标用药确定装置，具体用于：

在得到合并后的用药数据之后，对于合并后的用药数据中所包括的每个ATC编码，进行对应于疾病的卡方检验处理，得到ATC编码对应于疾病的概率值；

第二方面可选的实施例中，第一合并处理和第二合并处理包括求和处理或加权处理中的至少一项。

第二方面可选的实施例中，ATC编码为药理学编码。

第三方面，本申请实施例提供了一种电子设备，该电子设备包括：

处理器以及存储器，该储器配置用于存储机器可读指令，该指令在由该处理器执行时，使得该处理器执行第一方面中的任一项方法。

第四方面，本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质上用于存储计算机指令，当计算机指令在计算机上运行时，使得计算机可以执行实现第一方面中的任一项方法

本申请实施例提供的技术方案带来的有益效果是：

在本申请实施例中，在对对应于某一疾病的用药数据进行处理时，由于可以基于ATC编码对获取到的原始用药数据进行合并处理，因此，不仅可以降低了数据处理量，并且得到的合并后的用药数据相比现有技术中采用纯统计学进行处理后得到的用药数据，用药数据的各维度之间具备医学解释能力，具有统一性和可比性。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对本申请实施例描述中所需要使用的附图作简单地介绍。

图1为本申请实施例提供的一种数据处理方法的流程示意图；

图2为本申请实施例提供的一种数据处理装置的结构示意图；

图3为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

下面详细描述本申请的实施例，实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本申请，而不能解释为对本发明的限制。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“”和“该”也可包括复数形式。应该进一步理解的是，本申请的说明书中使用的措辞“包括”是指存在特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解，当我们称元件被“连接”或“耦接”到另一元件时，它可以直接连接或耦接到其他元件，或者也可以存在中间元件。此外，这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。

为使本申请的目的、技术方案和优点更加清楚，下面将结合附图对本申请实施方式作进一步地详细描述。

首先对本申请涉及的几个名词进行介绍和解释：

ATC编码：是世界卫生组织对药品的官方分类系统，ATC编码共有7位，其中第1、4、5位为字母，第2、3、6、7位为数字。ATC系统将药物分为5个级别，分别对应为解剖学、治疗学、药理学、化学和化合物。

卡方检验：指的是统计样本的实际观测值与理论推断值之间的偏离程度，实际观测值与理论推断值之间的偏离程度决定卡方值的大小，如果卡方值越大，二者偏差程度越大，反之，二者偏差越小；若两个值完全相等时，卡方值就为0，表明理论值完全符合实际观测值。

在实际生活中，病人的病情不同，在进行治疗时所需要的药物也是不同的，在治疗一些疾病时往往可能会涉及到大量不同的药物。为了获知哪些药品可以治疗哪些疾病，通常需要对大量的用药信息进行建模分析，而为了降低药品建模的分析维度，提升模型分析效率，通常可以对建模时所采用的用药信息进行降维处理。目前的主要降维模式都是基于统计学机器学习的降维方案，如PCA降维、K聚类降维等。比如PCA降维，主要是讲原有数据通过统计计算，转换到互相不相干的垂直新维度上。而K聚类主要是把空间距离较近的维度都合并到一起。

但是，现有降维方案缺乏医学解释能力，仅具有统计学意义。而在医学环境下，模型往往需要有清晰的医学意义，才能较好的辅助到实际应用场景，纯统计学的方法难以纳入应用和配合医生以及相关医务人员的工作。其次，在样本较小或者因为医院用药习惯的不同，用药数据极容易受到环境的干扰，其结果往往在不同环境下会出现极大不同，最终得到的降维结果各维度之间没有统一性和可比性，互相之间没有关联，无法做很好的对比和研究。

本申请实施例提供的一种数据处理方法、装置、电子设备及可读存储介质，旨在解决上述中部分或全部问题。

下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图，对本申请的实施例进行描述。

本申请实施例提供了一种数据处理方法，如图1所示，该方法包括：

步骤S101，获取对应于同一疾病的原始用药数据。

其中，原始用药数据指的是在实际生活中，不同的医护人员治疗某一疾病时的用药数据。其中，获取该原始用药数据的来源以及数量本申请实施例不做限定，如对于某一种疾病，可以从某一地区中的各医院的数据库中获取全部或部分关于治疗该疾病的用药数据，也是是仅从一个医院的数据库中获取全部或部分关于治疗该疾病的用药数据。

此外，为了更好的说明本申请实施例中的方案，在下文中将原始用药数据所对应的同一疾病称之为目标疾病。

步骤S102，确定各原始用药数据的ATC编码，并基于各原始用药数据的ATC编码对原始用药数据进行合并处理，得到合并后的用药数据。

在实际应用中，为了用药数据的管理需要，获取到的原始用药数据中可能会存在一些对并不重要的信息，即无效信息，若直接对获取到的原始用药数据进行分析，由于存在一些无效信息，此时可能会造成数据的处理量增加，降低数据的处理效率。此外，由于获取的原始用药数据为对应于同一疾病的用药数据，因此获取到的原始数据中可能会存在相同或者相似的药物，若直接对获取到的原始用药数据进行分析，此时由于存在相同或者相似的药物，也可能会造成数据的处理量增加，降低数据的处理效率。因此，本申请实施例在获取到同一疾病的原始用药数据后，可以确定各原始用药数据的ATC编码，然后基于确定的ATC编码对获取到的原始用药数据进行合并处理，得到合并后的用药数据，此时得到用药数据为被消除了部分无效信息和/或被消除了存在相同或相似药物的用药数据。

在本申请实施例中，在对对应于某一疾病的用药数据进行处理时，由于可以基于ATC编码对获取到的原始用药数据进行合并处理，此时得到的合并后的用药数据相比现有技术中采用纯统计学进行处理后得到的用药数据，用药数据的各维度之间具备医学解释能力，具有统一性和可比性。

在本申请实施例中，原始用药数据包括药品名称和下列用药附加信息中的至少一项：

用药数量、用药费用。

在实际应用中，获取对应于某一疾病的用药数据通常是从医院的数据中获取，而医院在将用药数据存储至数据库中通常是将药品名称与用药附加信息关联存储，因此在获取原始用药数据时，不仅可以获取到具体的药品名称，还可以获取到与该药品名称关联的用药附加信息，如该药品的用药数量、用药费用等。

在本申请实施例中，确定各原始用药数据的ATC编码，并基于各原始用药数据的ATC编码对原始用药数据进行合并处理，得到合并后的用药数据，包括：

在实际应用中，由于各原始用药数据中包括药品名称，因此可以根据药品名称所对应的药品特性确定各原始用药数据中药品名称的ATC编码，然后可以将各原始用药数据与所包括的药品名称的ATC编码关联，即将各原始用药数据中的药品名称替换为药品名称的ATC编码，此时得到的替换后的用药数据中仅包括ATC编码和对应的用药附加信息，不再包括药品名称。

在本申请实施例中，ATC编码为药理学编码。

在实际应用中，ATC编码共包括5个层级，分别对应于为解剖学、治疗学、药理学、化学和化合物。在确定各药品名称时可以根据需要确定将ATC编码确定为哪一层级的编码，在本申请实施例中，可将ATC编码确定为药理学编码。

在一示例中，假如原始用药数据包括用药数据1、用药数据2和用药数据3，用药数据1中包括药品名称A以及和药品名称A的用药附加信息，用药数据2中包括药品名称B以及和药品名称B的用药附加信息。其中，确定药品名称A的ATC编码为A11D，药品名称B的ATC编码为H12E，药品名称C的ATC编码为J34G。此时，对于用药数据1：将药品名称A的ATC编码(A11D)替换药品名称A，即替换后的用药数据1中包括A11D以及和A11D的用药附加信息；对于用药数据2：将药品名称B的ATC编码(H12E)替换药品名称B，即替换后的用药数据2中包括H12E以及和H12E的用药附加信息；对于用药数据3：将药品名称B的ATC编码(J34G)替换药品名称C，即替换后的用药数据3中包括J34G以及和J34G的用药附加信息。

进一步的，若替换后的用药数据中具有相同ATC编码的用药数据，此时，可以将替换后的用药数据中具有相同ATC编码的各用药数据的相应的用药附加信息进行第一合并处理，得到合并后的用药数据。其中，将具有相同ATC编码的各用药数据的相应的用药附加信息进行第一合并处理指的是，将具有相同ATC编码的各用药数据中相同的用药附加信息进行第一合并处理。比如，具有相同ATC编码的各用药数据中均包括用药数量和用药费用，则可以将各用药数据中的用药数量和用药数量进行第一合并处理，以及将各用药数据中的用药费用和用药费用进行第一合并处理。

需要说明是：若替换后的用药数据中不仅包括具有相同ATC编码的各用药数据，还包括单一的ATC编码的用药数据，此时得到的合并后的用药数据中不仅包括进行第一合并处理后的用药数据，还包括单一的ATC编码的用药数据。

其中，第一合并处理的具体处理方式可以根据需要确定，在本申请实施例中第一合并处理包括求和处理或加权处理中的至少一项。

在一示例中，假如替换后的用药数据包括用药数据1、用药数据2和用药数据3，用药数据1中包括A11D、用药数量为2以及用药费用为40，药，用药数据2中包括A11D、用药数量为5以及用药费用为100，用药数据3中包括J34G、用药数量为3以及用药费用为150，第一合并处理为求和处理。此时，可以将用药数据1和用药数据2中的用药数量相加(2+5＝7)，以及将用药费用相加(40+100＝140)，得到处理后的用药数据，其包括A11D、用药数量为7以及用药费用为140，此时处理后的用药数据(即A11D、用药数量为7以及用药费用为140)以及用药数据3(即J34G、用药数量为3以及用药费用为150)为合并后的用药数据。

在本申请实施例中，在对原始用药数据进行合并处理时，可以对具有相同ACT编码的原始用药数据进行合并处理，可以有效地去除存在相同或相似的用药的用药数据，进一步的降低了数据处理量，提高了效率。

在本申请实施例中，若用药附加信息包括用药数量和用药费用，将替换后的用药数据中具有相同ATC编码的各用药数据的相应的用药附加信息进行第一合并处理，得到合并后的用药数据，包括：

在实际应用中，若用药附加信息包括用药数量和用药费用，为了可以进一步的去除用药数据中的无效信息，在将替换后的用药数据中具有相同ATC编码的各用药数据的相应的用药附加信息进行第一合并处理，得到第一合并处理结果后，对于第一合并处理结果中的每个用药数据，将每个用药数据的用药数量和用药费用进行第二合并处理，得到合并后的用药数据。

其中，具体第二合并处理的具体处理方式可以根据需要确定，在本申请实施例中第二合并处理包括求和处理或加权处理中的至少一项。在实际应用中，若第二合并处理包括加权处理，每种附加信息的权重可以根据实际需求配置，本申请实施例不做限定。

在一示例中，假如第一合并处理结果中包括用药数据A(ACT编码为A11D、用药数量为7以及用药费用为140)，用药数据B(ACT编码为J34G、用药数量为4以及用药费用为160)，第二合并处理为加权处理，用药数量和用药费用的权重均为0.5。则可以将用药数据A中的用药数量和用药费用加权处理(7*0.5+140*0.5＝73.5)，得到第二合并处理后的用药数据A，其包括A11D及用药附加信息73.5；将用药数据B中的用药数量和用药费用加权处理(4*0.5+160*0.5＝82)，得到第二合并处理后的用药数据B，其包括J34G和的用药附加信息82，然后将第二合并处理后的用药数据A和第二合并处理后的用药数据B作为合并后的用药数据。

在本申请实施例中，得到合并后的用药数据之后，还包括：

在实际应用中，对于合并后的用药数据中所包括的每个ATC编码，可以进行ATC编码对于目标疾病的卡方检验处理。其中，进行ATC编码对于目标疾病的卡方检验处理的方式本申请实施例不做限定。

作为一种可选的实施例方式，对于合并后的用药数据中的任意一个ATC编码，可以确定哪些药物的ATC编码为该ATC编码，对于为该ATC编码的每个药物分别进行对应于目标疾病的卡方检验处理，得到每个药品对应于目标疾病的概率值(其中，概率值越大，说明该药物对于目标疾病的影响越大，反之。则说明该药物对于目标疾病的影响越小)；然后将到每个药物对应于目标疾病的概率值进行融合处理(该融合处理可以包括加权处理、求和处理和归一化等处理方式)，将得到的概率值作为该ATC编码对应于目标疾病的概率值。其中，在确定哪些药物的ATC编码为该ATC编码后，可以不对所有的药物均分别进行对于目标疾病的卡方检验处理，可以仅选取部分药物作为样本药物进行对于目标疾病的卡方检验处理。其中，具体选取哪些药物的作为样本药物，本申请实施例不限定，如可以选取用于治疗目标疾病较多的药物作为样本药物。

相应的，在确定每个ATC编码对应于疾病的概率值之后，可以基于每个ATC编码对应于目标疾病的概率值和筛选规则，对合并后的用药数据进行筛选，得到筛选后的用药数据。其中，筛选规则的具体内容本申请实施例不做限定，如可以配置为当合并后的用药数据中所包括的ATC编码对应于目标疾病的概率值大于阈值时，将该合并后的用药数据保留，保留下的用药数据即为筛选后的用药数据。

进一步，可以确定筛选后的用药数据中所包括的ATC编码所对应的药物，然后将该ATC编码对应的药物作为对应于目标疾病的目标用药。

在一示例中，假如合并后的用药数据包括用药数据A、用药数据B和用药数据C，且用药数据A中的ATC编码对应于目标疾病的概率值为0.2，用药数据B中的ATC编码对应于目标疾病的概率值为0.8，用药数据C对应于目标疾病的概率值为0.6，筛选规则的具体内容为当合并后的用药数据中所包括的ATC编码对应目标疾病的概率值大于阈值(0.5)时，将该合并后的用药数据保留。此时，由于用药数据B中的ATC编码对应于目标疾病的概率值和用药数据C中的ATC编码对应于目标疾病的概率值均大于阈值0.5(即满足筛选规则)，则用药数据B和用药数据C为筛选后的用药数据。进一步的，可以确定哪些药物的ATC编码为用药数据B中的ATC编码，以及哪些药物的ATC编码为用药数据C中的ATC编码，并将所确定的药物作为对应于目标疾病的目标用药。

在本申请示例中，由于还可以对合并后的用药数据中所包括的每个ATC编码进行对应于目标疾病的卡方检验处理，并且基于每个ATC编码对应于目标疾病的概率值和筛选规则，确定出对于目标疾病的目标用药，也就是说，在确定出对于目标疾病的目标用药后，即可以获知治疗目标疾病的药品大致为哪些药物。

本申请实施例提供了一种数据处理装置，如图2所示，该数据处理装置60可以包括：用药数据获取模块601以及合并处理模块602，其中：

本申请可选的实施例中，原始用药数据包括药品名称和下列用药附加信息中的至少一项：

用药数量、用药费用。

本申请可选的实施例中，合并处理模块602在确定各原始用药数据的ATC编码，并基于各原始用药数据的ATC编码对原始用药数据进行合并处理，得到合并后的用药数据时，具体用于：

本申请可选的实施例中，若用药附加信息包括用药数量和用药费用，合并处理模块602在将替换后的用药数据中具有相同ATC编码的各用药数据的相应的用药附加信息进行第一合并处理，得到合并后的用药数据时，具体用于：

本申请可选的实施例中，该装置60还包括目标用药确定装置603，具体用于：

在得到合并后的用药数据之后对于合并后的用药数据中所包括的每个ATC编码，进行对应于疾病的卡方检验处理，得到ATC编码对应于疾病的概率值；

本申请可选的实施例中，第一合并处理和第二合并处理包括求和处理或加权处理中的至少一项。

本申请可选的实施例中，ATC编码为药理学编码。

本实施例的数据处理装置可执行本申请实施例提供的一种数据处理方法，其实现原理相类似，此处不再赘述。

本申请实施例提供了一种电子设备，如图3所示，图3所示的电子设备2000包括：处理器2001和存储器2003。其中，处理器2001和存储器2003相连，如通过总线2002相连。可选地，电子设备2000还可以包括收发器2004。需要说明的是，实际应用中收发器2004不限于一个，该电子设备2000的结构并不构成对本申请实施例的限定。

其中，处理器2001应用于本申请实施例中，用于实现图2所示的各模块的功能。

处理器2001可以是CPU，通用处理器，DSP，ASIC，FPGA或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器2001也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等。

总线2002可包括一通路，在上述组件之间传送信息。总线2002可以是PCI总线或EISA总线等。总线2002可以分为地址总线、数据总线、控制总线等。为便于表示，图3中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器2003可以是ROM或可存储静态信息和指令的其他类型的静态存储设备，RAM或者可存储信息和指令的其他类型的动态存储设备，也可以是EEPROM、CD-ROM或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。

存储器2003用于存储执行本申请方案的应用程序代码，并由处理器2001来控制执行。处理器2001用于执行存储器2003中存储的应用程序代码，以实现图2所示实施例提供的数据处理装置的动作。

本申请实施例提供了一种电子设备，本申请实施例中的电子设备包括：处理器；以及存储器，存储器配置用于存储机器可读指令，该指令在由该处理器执行时，使得该处理器执行数据处理方法。

与现有技术相比可实现：在本申请实施例中，在对对应于某一疾病的用药数据进行处理时，由于可以基于ATC编码对获取到的原始用药数据进行合并处理，此时得到的合并后的用药数据相比现有技术中采用纯统计学进行处理后得到的用药数据，用药数据的各维度之间具备医学解释能力，具有统一性和可比性。

本申请实施例提供了一种计算机可读存储介质，该计算机可读存储介质上用于存储计算机指令，当计算机指令在计算机上运行时，使得计算机可以执行实现数据处理方法。与现有技术相比，在本申请实施例中，在对对应于某一疾病的用药数据进行处理时，由于可以基于ATC编码对获取到的原始用药数据进行合并处理，此时得到的合并后的用药数据相比现有技术中采用纯统计学进行处理后得到的用药数据，用药数据的各维度之间具备医学解释能力，具有统一性和可比性。

本申请中的一种计算机可读存储介质所涉及的名词及实现原理具体可以参照本申请实施例中的一种数据处理方法，在此不再赘述。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上仅是本发明的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本发明的保护范围。

Claims

1.一种数据处理方法，其特征在于，包括：

获取对应于同一疾病的原始用药数据；

确定各原始用药数据的解剖学治疗学及化学分类系统ATC编码，并基于各原始用药数据的ATC编码对所述原始用药数据进行合并处理，得到合并后的用药数据。

2.根据权利要求1所述的方法，其特征在于，所述原始用药数据包括药品名称和下列用药附加信息中的至少一项：

用药数量、用药费用。

3.根据权利要求2所述的方法，其特征在于，所述确定各原始用药数据的ATC编码，并基于各原始用药数据的ATC编码对所述原始用药数据进行合并处理，得到合并后的用药数据，包括：

4.根据权利要3所述的方法，其特征在于，若所述用药附加信息包括用药数量和用药费用，所述将替换后的用药数据中具有相同ATC编码的各用药数据的相应的用药附加信息进行第一合并处理，得到合并后的用药数据，包括：

对于所述第一合并处理结果中的每个用药数据，将每个用药数据的用药数量和用药费用进行第二合并处理，得到合并后的用药数据。

5.根据权利要求1至4任一项所述的方法，其特征在于，所述得到合并后的用药数据之后，还包括：

对于所述合并后的用药数据中所包括的每个ATC编码，进行对应于所述疾病的卡方检验处理，得到ATC编码对应于所述疾病的概率值；

基于每个ATC编码对应于所述疾病的概率值和筛选规则，对所述合并后的用药数据进行筛选，得到筛选后的用药数据；

将所述筛选后的用药数据中所包括的ATC编码对应的药物作为对应于所述疾病的目标用药。

6.根据权利要求4或5任一项所述的方法，其特征在于，所述第一合并处理和所述第二合并处理包括求和处理或加权处理中的至少一项。

7.根据权利要求1至6中任一项所述的方法，其特征在于，所述ATC编码为药理学编码。

8.一种数据处理装置，其特征在于，包括：

合并处理模块，用于确定各原始用药数据的ATC编码，并基于各原始用药数据的ATC编码对所述原始用药数据进行合并处理，得到合并后的用药数据。

9.一种电子设备，其特征在于，包括：

处理器以及存储器，所述存储器配置用于存储机器可读指令，所述指令在由所述处理器执行时，使得所述处理器执行权利要求1-7任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储计算机指令，当所述计算机指令在计算机上运行时，使得计算机可以执行上述权利要求1至7中任一项所述的方法。