CN115938599A

CN115938599A - 一种数据查询方法、装置、电子设备及存储介质

Info

Publication number: CN115938599A
Application number: CN202211567642.0A
Authority: CN
Inventors: 陆伟斌
Original assignee: Lianren Healthcare Big Data Technology Co Ltd
Current assignee: Lianren Healthcare Big Data Technology Co Ltd
Priority date: 2022-12-07
Filing date: 2022-12-07
Publication date: 2023-04-07

Abstract

本发明实施例公开了一种数据查询方法、装置、电子设备及存储介质。该方法包括：接收用于对原始医疗数据库中的用户数据进行查询的查询指令，对查询指令进行标签化处理以得到与查询指令对应的查询标签；在预先构建的预处理数据库的各关联标签集合中，确定出与查询标签相匹配的目标标签集合，以及与目标标签集合对应的目标用户标识；其中，预处理数据库中包括预先确定的与用户数据对应的至少一个关联标签集合，以及与关联标签集合对应的用户标识；关联标签集合由用户数据进行标签化处理以及关联性分析处理后，得到的具有相互关联关系的数据标签组成；在原始医疗数据库中确定出与目标用户标识对应的用户数据，作为与查询指令对应的目标用户数据。

Description

一种数据查询方法、装置、电子设备及存储介质

技术领域

本发明实施例涉及数据处理技术领域，尤其涉及一种数据查询方法、装置、电子设备及存储介质。

背景技术

随着医疗领域的信息化建设，医疗数据库中存储的用户相关医疗数据越来越多，对用户数据的查询效率产生挑战。目前，在基于用户标识进行精准查询时，可快速定位到用户数据，但是在进行模糊查询、匹配查询或者关联查询等非精准查询时，通常在查询网页的输入框中通过多个查询条件，从而基于查询条件在医疗数据库中进行逐个匹配查询，最终在海量的医疗数据中定位到与查询条件对应的用户数据。

可见，在实现本发明的过程中，发现现有技术至少存在以下技术问题：由于医疗数据库中存储的数据量大，通常为千万到亿级别的数据量，因此查询效率低，医疗数据库查询压力大，导致出现查询页面卡顿等情况，降低了查询过程的用户体验感。

发明内容

本发明实施例提供了一种数据查询方法、装置、电子设备及存储介质，以实现高效、便捷地完成数据查询操作、提高用户体验感的目的。

根据本发明的一方面，提供了一种数据查询方法，包括：

接收用于对原始医疗数据库中的用户数据进行查询的查询指令，对所述查询指令进行标签化处理以得到与所述查询指令对应的查询标签；

在预先构建的预处理数据库的各关联标签集合中，确定出与所述查询标签相匹配的目标标签集合，以及与所述目标标签集合对应的目标用户标识；

其中，所述预处理数据库中包括预先确定的与所述用户数据对应的至少一个关联标签集合，以及与所述关联标签集合对应的用户标识；所述关联标签集合由所述用户数据进行标签化处理以及关联性分析处理后，得到的具有相互关联关系的数据标签组成；

在所述原始医疗数据库中确定出与所述目标用户标识对应的用户数据，作为与所述查询指令对应的目标用户数据。

根据本发明的另一方面，提供了一种数据查询装置，该装置包括：

查询指令接收模块，接收用于对原始医疗数据库中的用户数据进行查询的查询指令，对所述查询指令进行标签化处理以得到与所述查询指令对应的查询标签；

目标标签集合确定模块，用于在预先构建的预处理数据库的各关联标签集合中，确定出与所述查询标签相匹配的目标标签集合，以及与所述目标标签集合对应的目标用户标识；

目标用户数据确定模块，用于在所述原始医疗数据库中确定出与所述目标用户标识对应的用户数据，作为与所述查询指令对应的目标用户数据。

根据本发明的另一方面，提供了一种电子设备，所述电子设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例所述的数据查询方法。

根据本发明的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本发明任一实施例所述的数据查询方法。

本发明实施例的技术方案，接收用于对原始医疗数据库中的用户数据进行查询的查询指令，对查询指令进行标签化处理以得到与查询指令对应的查询标签；通过在预先构建的预处理数据库的各关联标签集合中，确定出与查询标签相匹配的目标标签集合，以及与目标标签集合对应的目标用户标识，从而通过目标用户标识快速、高效地在原始医疗数据库中确定出目标用户数据；其中，预处理数据库中包括预先确定的与用户数据对应的至少一个关联标签集合，以及与关联标签集合对应的用户标识；关联标签集合由用户数据进行标签化处理以及关联性分析处理后，得到的具有相互关联关系的数据标签组成。本实施例的技术方案解决了现有技术中查询效率低、查询压力大的问题，避免出现查询页面卡顿的情况；实现了高效、便捷地完成数据查询操作、提高用户体验感的效果。

应当理解，本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征，也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是根据本发明实施例提供的一种数据查询方法的流程图；

图2是根据本发明实施例提供的另一种数据查询方法的流程图；

图3是根据本发明实施例提供的一种数据查询装置的结构示意图；

图4是实现本发明实施例的数据查询方法的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分的实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本发明保护的范围。

需要说明的是，本发明的说明书和权利要求书及上述附图中的术语“目标”、“原始”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“等”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

图1是根据本发明实施例提供的一种数据查询方法的流程图。本实施例可适用于对医疗数据库中各用户对应的医疗数据进行查询的情况，该方法可以由数据查询装置来执行，该数据查询装置可以采用硬件和/或软件的形式实现。

如图1所示，本实施例的方法具体可包括：

S110、接收用于对原始医疗数据库中的用户数据进行查询的查询指令，对查询指令进行标签化处理以得到与查询指令对应的查询标签。

其中，原始医疗数据库为用于存储各用户的全部医疗数据的数据库，用户数据为原始医疗数据库中存储的医疗数据，每条用户数据对应一个唯一的用户标识，如用户标识为Yl0001对应的用户数据包括：用户姓名为A、A的症状数据、A的就诊历史数据等。查询指令为用于对原始医疗数据库中的用户数据进行非精准查询的指令，示例性的，非精准查询可包括通过输入至少一个查询条件，完成的模糊查询、匹配查询和关联查询中的至少一项。

在本实施例中，当接收到查询指令后，可对查询指令进行标签化处理。示例性的，可通过自然语言处理算法对查询指令进行指令识别，并确定出与查询指令对应的查询标签。或者，还可通过预先存储的指令与标签之间的对应关系，确定出当前接收到的查询指令对应的查询标签。本领域技术人员可根据实际应用情况，确定对查询指令进行标签化处理的方式，对此本发明实施例不作限定。

S120、在预先构建的预处理数据库的各关联标签集合中，确定出与查询标签相匹配的目标标签集合，以及与目标标签集合对应的目标用户标识。

其中，预处理数据库中包括预先确定的与用户数据对应的至少一个关联标签集合，以及与关联标签集合对应的用户标识；关联标签集合由用户数据进行标签化处理以及关联性分析处理后，得到的具有相互关联关系的数据标签组成。

需要说明的是，本实施例中可预先对用户数据进行标签化处理以及关联性分析，从而确定出具有相互关联关系的数据标签；针对每个相互关联关系，由具有该相互关联关系的各数据标签组成对应的关联标签集合，并将关联标签集合存储至预先构建的预处理数据库中。示例性的，对用户数据进行标签化处理后，得到标签A1、标签A2、标签A3、标签A4、标签A5，以及各标签与用户数据的用户标识之间的对应关系，对各标签进行关联性分析后，确定出标签A1、标签A2、标签A3存在相互关联关系，标签A4、标签A5存在相互关联关系，则可分别组成关联标签集合A{标签A1，标签A2，标签A3}和关联标签集合B{标签A4，标签A5}，并且可确定出各关联标签集合对应的用户标识。将关联标签集合A、关联标签集合B、关联标签集合A对应的用户标识和关联标签集合B对应的用户标识，均存储至预先构建的预处理数据库中，每个关联标签集合可对应至少一个用户标识。

在具体实施中，可将确定出的查询标签与预处理数据库中的各关联标签集合进行匹配操作。具体的，可基于短文本-长文本语义匹配算法，在各关联标签结合中确定给出与查询标签对应的目标标签集合。并且，基于预处理数据库中存储的与关联标签集合对应的用户标识，确定出与目标标签集合对应的目标用户标识。

S130、在原始医疗数据库中确定出与目标用户标识对应的用户数据，作为与查询指令对应的目标用户数据。

具体的，用户标识可为各用户的用户ID(Identity document，身份标识号)，为用户数据的唯一标识。例如，可将用户就诊卡的卡号确定为用户标识。在本实施例中，可在原始医疗数据库中，确定出与目标用户标识唯一对应的用户数据，作为与查询指令对应的目标用户数据。

图2是根据本发明实施例提供的另一种数据查询方法的流程图。可选的，在接收用于对原始医疗数据库中的用户数据进行查询的查询指令之前，还包括：对原始医疗数据库中的用户数据进行标签化处理，确定出与用户数据对应的至少两个数据标签，以及各数据标签对应的用户标识；基于关联分析算法，对数据标签进行关联性分析处理，生成满足预设关联条件的关联标签集合；在各数据标签对应的用户标识中，确定出与关联标签集合对应的用户标识，并将关联标签集合和关联标签集合对应的用户标识，存储至预处理数据库中。其中，与上述各实施例相同或相应的术语的解释在此不再赘述。如图2所示，该方法包括：

S210、对原始医疗数据库中的用户数据进行标签化处理，确定出与用户数据对应的至少两个数据标签，以及各数据标签对应的用户标识。

需要说明的是，原始医疗数据库中的用户数据可如表1所示：

表1

可见，用户数据可在记录存储时可分为L1、L2、……、Ln个类型进行表述，其中，n为正整数。在对原始医疗数据库中的用户数据进行标签化处理时，可针对每个类型的用户数据，分别进行标签化处理，从而得到各类型的用户数据对应的数据标签。例如，对L4类型的用户病史数据“曾经做过B手术”和“先天性C病”，进行标签化处理。

需要说明的是，用户数据包括至少一个医疗描述类型对应的描述类型数据，也可包括非医疗描述类型的非描述类型数据。示例性的，如L4对应的病史类型、L5对应的症状类型可作为医疗描述类型，则“曾经做过B手术”和“先天性C病”为描述类型数据；而L1对应的姓名、L2对应的性别和L3对应的年龄等用户基本信息数据，可作为非医疗描述类型的非描述类型数据。

本领域技术人员也可根据实际应用情况，选取医疗描述类型对应的描述类型数据，进行标签化处理，以便于得到合理、准确地数据标签；如L4对应的病史类型、L5对应的症状等类型，进行标签化处理；而对于非医疗描述类型的非描述类型数据，则可无需进行标签化处理操作。示例性的，医疗描述类型包括健康状况类型，则对健康状况类型进行标签化处理操作后，可得到的数据标签包括：健康、亚健康、疾病的前驱状态和疾病状态中的至少一种。

在具体实施中，用户数据包括至少一个医疗描述类型对应的描述类型数据；对原始医疗数据库中的用户数据进行标签化处理，确定出与用户数据对应的至少两个数据标签，包括：针对每个医疗描述类型的描述类型数据，基于自然语言处理算法对描述类型数据进行数据分类处理，以得到各数据分类对应的分类词；针对每个数据分类对应的分类词，分别确定出出现频率大于预设频率的目标分类词，将目标分类词确定为医疗描述类型对应的数据标签。

具体的，对于描述类型数据，可采用自然语言处理算法对描述类型数据进行数据分类处理，以得到各数据分类对应的分类词。例如，对于病史类型可得到C1和C2两种数据分类，C1数据分类对应分类词C11、C12、C13；C2数据分类对应分类词C21、C22。

进一步的，针对每个数据类型对应的分类词，确定各分类词在描述类型数据中的出现频率，即可用该分类词在描述类型数据中的出现次数，除以描述类型数据中的总词语数量。并将出现频率大于预设频率的分类词，确定为该数据类型对应的目标分类词，将目标分类词确定为医疗描述类型对应的数据标签。例如，C11、C12、C13、C21、C22中，C11、C12、C22的出现频率大于预设频率，则可将C11、C12、C22确定为医疗描述类型对应的数据标签。本领域技术人员可根据实际应用情况，确定预设频率的数值，对此本发明实施例不作限定。需要说明的是，目标分类词的数量越多，数据标签的维度越多，则说明该描述类型数据的标签化程度越高。

本实施例通过自然语言处理算法数据进行分类处理，并确定出现频率大于预设频率的分类词作为目标分类词，提高了数据分类的准确性；并且在确保标签化效果不受影响的同时，仅对描述类型数据进行分类，减少了数据处理的工作量，有利于提高标签化处理的效率。

S220、基于关联分析算法，对数据标签进行关联性分析处理，生成满足预设关联条件的关联标签集合。

本实施例中，可基于FP-Gowth(Frequent Pattern)关联分析算法对各数据标签进行关联性分析处理；确定出数据标签之间存在的相互关联关系，将具有相互关联关系的数据标签，均作为关联标签，并将关联标签组成在一个集合中，以生成关联标签集合。

可选的，基于关联分析算法，对数据标签进行关联性分析处理，生成满足预设关联条件的关联标签集合的具体实现方式，包括：基于关联分析算法对数据标签进行关联性分析处理，确定出数据标签之间存在的相互关联关系，以及相互关联关系对应的第一关联程度；基于第一关联程度，确定出满足预设关联条件的相互关联关系作为目标关联关系，针对每个目标关联关系，确定与目标关联关系对应的各关联标签，由各关联标签组成关联标签集合；其中，预设关联条件为第一关联程度大于第一预设关联程度阈值。

具体的，通过FP-Gowth(Frequent Pattern)关联分析算法确定出数据标签之间存在的相互关联关系的同时，可确定出各相互关联关系对应的第一关联程度，以反映出各相互关联关系的紧密程度。可将第一关联程度大于第一预设关联程度阈值的相互关联关系，确定为目标关联关系，由目标关联关系对应的关联标签组成关联标签集合。

本实施例中，对于第一关联程度大于第一预设关联程度阈值的相互关联关系来说，相互关联关系之间的紧密性更强，通过将第一关联程度大于第一预设关联程度阈值的目标关联关系对应的关联标签，组成关联标签集合，从而在确定目标标签集合时，能够确保查询结果的准确性；同时，减少了查询工作量。

S230、在各数据标签对应的用户标识中，确定出与关联标签集合对应的用户标识，并将关联标签集合和关联标签集合对应的用户标识，存储至预处理数据库中。

本实施例中，在各数据标签对应的用户标识中，确定出关联标签对应的用户标识，基于关联标签与关联标签集合之间的对应关系，可确定出关联标签集合对应的用户标识。具体的，由各关联标签对应的各用户标识，组成关联标签集合对应的用户标识。可将关联标签集合和关联标签集合对应的用户标识，存储至预先构建的预处理数据库中。进一步的，对应不同的关联标签，可生成对应的关联标签标识；基于各关联标签标识，构成与关联标签集合对应的关联标签标识集合。在存储至预处理数据库时，可直接将关联标签标识集合与关联标签集合对应的用户标识存储至预处理数据库中，从而减少对预处理数据库的空间占用量。

示例性的，预处理数据库可为非关系型数据库或关系型数据库。

在具体实施中，预处理数据库包括非关系型数据库，将关联标签集合和关联标签集合对应的用户标识，存储至预处理数据库中，包括：将关联标签集合和关联标签集合对应的用户标识，存储至非关系型数据库中。由于非关系型数据库具有加速查询速度的效果，则可将关联标签集合和关联标签集合对应的用户标识采用key-value的存储模式，存储至非关系型数据库中，以提高在基于查询指令确定目标用户数据时的查询效率。

S240、接收用于对原始医疗数据库中的用户数据进行查询的查询指令，对查询指令进行标签化处理以得到与查询指令对应的查询标签。

S250、在预先构建的预处理数据库的各关联标签集合中，确定出与查询标签相匹配的目标标签集合，以及与目标标签集合对应的目标用户标识。

在本实施例中，在预先构建的预处理数据库的各关联标签集合中，确定出与查询标签相匹配的目标标签集合的实现方式包括：确定查询标签对应的第二关联程度，确定第二关联程度是否大于第二预设关联程度阈值；若大于第二预设关联程度阈值，则在预处理数据库的各关联标签集合中，确定出与查询标签相匹配的目标标签集合。其中，第二预设关联程度阈值可与第一预设关联程度阈值相同，例如，可设定第一预设关联程度阈值、第二预设关联程度阈值为50％。

由于若查询标签之间的关联程度较低，则影响确定出的目标标签集合的准确性，为提高查询效率和准确性，可基于关联程度较高的查询标签，在预处理数据库中确定出对应的目标标签集合。具体的，可基于关联分析算法确定出查询指令对应的查询标签之间的第二关联程度，若第二关联程度大于第二预设关联程度阈值，则说明查询标签之间的关联程度较高，则可在预处理数据库中，确定与查询标签相匹配的目标标签集合。

进一步的，还包括：若小于或等于第二预设关联程度阈值，则访问原始医疗数据库，以对原始医疗数据库中存储的用户数据进行查询，确定出与查询指令对应的目标用户数据。

若第二关联程度小于或等于第二预设关联程度阈值，则说明查询标签之间的关联程度较低，为避免影响确定出的目标标签集合的准确性，则无需在预处理数据库中确定目标标签集合，可直接基于查询指令，对原始医疗数据库中的存储的用户数据进行查询，直接在原始医疗数据库中确定出目标用户数据。本实施例中，对于关联程度较低的查询标签对应的查询指令，可直接在原始医疗时刻库中进行数据查询，从而提高查询准确性。

S260、在原始医疗数据库中确定出与目标用户标识对应的用户数据，作为与查询指令对应的目标用户数据。

本实施例中，通过预先构建包含关联标签集合和用户标识的预处理数据库，以基于预处理数据库可确定处于查询指令对应的目标用户标识，基于目标用户标识可完成在原始医疗数据库中的精准查询，有利于提高查询效率的同时，确保查询准确度。

图3是根据本发明实施例提供的一种数据查询装置的结构示意图，该装置用于执行上述任意实施例所提供的数据查询方法。该装置与上述各实施例的数据查询方法属于同一个发明构思，在数据查询装置的实施例中未详尽描述的细节内容，可以参考上述数据查询方法的实施例。如图3所示，该装置包括：

查询指令接收模块10，接收用于对原始医疗数据库中的用户数据进行查询的查询指令，对查询指令进行标签化处理以得到与查询指令对应的查询标签；

目标标签集合确定模块11，用于在预先构建的预处理数据库的各关联标签集合中，确定出与查询标签相匹配的目标标签集合，以及与目标标签集合对应的目标用户标识；

其中，预处理数据库中包括预先确定的与用户数据对应的至少一个关联标签集合，以及与关联标签集合对应的用户标识；关联标签集合由用户数据进行标签化处理以及关联性分析处理后，得到的具有相互关联关系的数据标签组成；

目标用户数据确定模块12，用于在原始医疗数据库中确定出与目标用户标识对应的用户数据，作为与查询指令对应的目标用户数据。

在本发明实施例中任一可选技术方案的基础上，可选的，还包括：

数据标签确定模块，用于在接收用于对原始医疗数据库中的用户数据进行查询的查询指令之前，对原始医疗数据库中的用户数据进行标签化处理，确定出与用户数据对应的至少两个数据标签，以及各数据标签对应的用户标识；

关联标签集合生成模块，用于基于关联分析算法，对数据标签进行关联性分析处理，生成满足预设关联条件的关联标签集合；

用户标识存储模块，用于在各数据标签对应的用户标识中，确定出与关联标签集合对应的用户标识，并将关联标签集合和关联标签集合对应的用户标识，存储至预处理数据库中。

在本发明实施例中任一可选技术方案的基础上，可选的，用户数据包括至少一个医疗描述类型对应的描述类型数据；

数据标签确定模块，包括：

分类词确定单元，用于针对每个医疗描述类型的描述类型数据，基于自然语言处理算法对描述类型数据进行数据分类处理，以得到各数据分类对应的分类词；

数据标签确定单元，用于针对每个数据分类对应的分类词，分别确定出出现频率大于预设频率的目标分类词，将目标分类词确定为医疗描述类型对应的数据标签。

在本发明实施例中任一可选技术方案的基础上，可选的，关联标签集合生成模块包括：

第一关联程度确定单元，用于基于关联分析算法对数据标签进行关联性分析处理，确定出数据标签之间存在的相互关联关系，以及相互关联关系对应的第一关联程度；

目标关联关系确定单元，用于基于第一关联程度，确定出满足预设关联条件的相互关联关系作为目标关联关系，针对每个目标关联关系，确定与目标关联关系对应的各关联标签，由各关联标签组成关联标签集合；

其中，预设关联条件为第一关联程度大于第一预设关联程度阈值。

在本发明实施例中任一可选技术方案的基础上，可选的，预处理数据库包括非关系型数据库，用户标识存储模块，包括：

用户标识存储单元，用于将关联标签集合和关联标签集合对应的用户标识，存储至非关系型数据库中。

在本发明实施例中任一可选技术方案的基础上，可选的，目标标签集合确定模块11，包括：

第二关联程度确定单元，用于确定查询标签对应的第二关联程度，确定第二关联程度是否大于第二预设关联程度阈值；

目标标签集合确定单元，用于若大于第二预设关联程度阈值，则在预处理数据库的各关联标签集合中，确定出与查询标签相匹配的目标标签集合。

在本发明实施例中任一可选技术方案的基础上，可选的，该装置还包括：

原始医疗数据库访问模块，用于若小于或等于第二预设关联程度阈值，则访问原始医疗数据库，以对原始医疗数据库中存储的用户数据进行查询，确定出与查询指令对应的目标用户数据。

值得注意的是，上述数据查询装置的实施例中，所包括的各个单元和模块只是按照功能逻辑进行划分的，但并不局限于上述的划分，只要能够实现相应的功能即可；另外，各功能单元的具体名称也只是为了便于相互区分，并不用于限制本发明的保护范围。

图4是实现本发明实施例的数据查询方法的电子设备的结构示意图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本发明的实现。

如图4所示，电子设备20包括至少一个处理器21，以及与至少一个处理器21通信连接的存储器，如只读存储器(ROM)22、随机访问存储器(RAM)23等，其中，存储器存储有可被至少一个处理器执行的计算机程序，处理器21可以根据存储在只读存储器(ROM)22中的计算机程序或者从存储单元28加载到随机访问存储器(RAM)23中的计算机程序，来执行各种适当的动作和处理。在RAM23中，还可存储电子设备20操作所需的各种程序和数据。处理器21、ROM22以及RAM23通过总线24彼此相连。输入/输出(I/O)接口25也连接至总线24。

电子设备20中的多个部件连接至I/O接口25，包括：输入单元26，例如键盘、鼠标等；输出单元27，例如各种类型的显示器、扬声器等；存储单元28，例如磁盘、光盘等；以及通信单元29，例如网卡、调制解调器、无线通信收发机等。通信单元29允许电子设备20通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

处理器21可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器21的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器21执行上文所描述的各个方法和处理，例如数据查询方法。

在一些实施例中，数据查询方法可被实现为计算机程序，其被有形地包含于计算机可读存储介质，例如存储单元28。在一些实施例中，计算机程序的部分或者全部可以经由ROM22和/或通信单元29而被载入和/或安装到电子设备20上。当计算机程序加载到RAM23并由处理器21执行时，可以执行上文描述的数据查询方法的一个或多个步骤。备选地，在其他实施例中，处理器21可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行数据查询方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器，使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本发明的上下文中，计算机可读存储介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。备选地，计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在电子设备上实施此处描述的系统和技术，该电子设备具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、区块链网络和互联网。

计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务中，存在的管理难度大，业务扩展性弱的缺陷。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本发明的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种数据查询方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，在所述接收用于对原始医疗数据库中的用户数据进行查询的查询指令之前，还包括：

对所述原始医疗数据库中的用户数据进行标签化处理，确定出与所述用户数据对应的至少两个数据标签，以及各所述数据标签对应的用户标识；

基于关联分析算法，对所述数据标签进行关联性分析处理，生成满足预设关联条件的所述关联标签集合；

在各所述数据标签对应的用户标识中，确定出与所述关联标签集合对应的用户标识，并将所述关联标签集合和所述关联标签集合对应的用户标识，存储至所述预处理数据库中。

3.根据权利要求2所述的方法，其特征在于，所述用户数据包括至少一个医疗描述类型对应的描述类型数据；

所述对所述原始医疗数据库中的用户数据进行标签化处理，确定出与所述用户数据对应的至少两个数据标签，包括：

针对每个所述医疗描述类型的所述描述类型数据，基于自然语言处理算法对所述描述类型数据进行数据分类处理，以得到各数据分类对应的分类词；

针对每个所述数据分类对应的分类词，分别确定出出现频率大于预设频率的目标分类词，将所述目标分类词确定为所述医疗描述类型对应的数据标签。

4.根据权利要求2所述的方法，其特征在于，所述基于关联分析算法，对所述数据标签进行关联性分析处理，生成满足预设关联条件的所述关联标签集合，包括：

基于关联分析算法对所述数据标签进行关联性分析处理，确定出所述数据标签之间存在的相互关联关系，以及所述相互关联关系对应的第一关联程度；

基于所述第一关联程度，确定出满足预设关联条件的相互关联关系作为目标关联关系，针对每个所述目标关联关系，确定与所述目标关联关系对应的各关联标签，由各所述关联标签组成所述关联标签集合；

其中，所述预设关联条件为所述第一关联程度大于第一预设关联程度阈值。

5.根据权利要求4所述的方法，其特征在于，所述预处理数据库包括非关系型数据库，所述将所述关联标签集合和所述关联标签集合对应的用户标识，存储至所述预处理数据库中，包括：

将所述关联标签集合和所述关联标签集合对应的用户标识，存储至所述非关系型数据库中。

6.根据权利要求1所述的方法，其特征在于，所述在预先构建的预处理数据库的各关联标签集合中，确定出与所述查询标签相匹配的目标标签集合，包括：

确定所述查询标签对应的第二关联程度，确定所述第二关联程度是否大于第二预设关联程度阈值；

若大于所述第二预设关联程度阈值，则在所述预处理数据库的各关联标签集合中，确定出与所述查询标签相匹配的目标标签集合。

7.根据权利要求6所述的方法，其特征在于，还包括：

若小于或等于所述第二预设关联程度阈值，则访问所述原始医疗数据库，以对所述原始医疗数据库中存储的用户数据进行查询，确定出与所述查询指令对应的目标用户数据。

8.一种数据查询装置，其特征在于，包括：

9.一种电子设备，其特征在于，所述电子设备包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项所述的数据查询方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的数据查询方法。