CN103455641A

CN103455641A - 交叉多次检索的系统和方法

Info

Publication number: CN103455641A
Application number: CN2013104559782A
Authority: CN
Inventors: 龚健; 张应才; 李登高
Original assignee: Founder International Co Ltd; Founder International Beijing Co Ltd
Current assignee: Peking University Medical Information Technology Co ltd
Priority date: 2013-09-29
Filing date: 2013-09-29
Publication date: 2013-12-18
Anticipated expiration: 2033-09-29
Also published as: CN103455641B

Abstract

本发明提供了一种交叉多次检索的系统和方法，该系统包括分布式存储管理器和检索分离器，其中，分布式存储管理器用于记录数据存储节点的信息；检索分离器包括：语句拆分单元，用于根据已记录的数据存储节点的信息，将接收到的检索条件语句拆分为对应于一个或多个数据存储节点的语句组；语句发送单元，用于将语句组中的每条语句发送至对应的数据存储节点；节点结果接收单元，用于接收对应于每条语句的节点检索结果数据；检索结果生成单元，用于根据所有的节点检索结果数据，生成检索结果数据。通过本发明的技术方案，可以简化数据查询语句的复杂度，尤其在云计算技术中，更容易在按照内容分布式存储的环境下实现多节点的数据联合查询。

Description

交叉多次检索的系统和方法

技术领域

本发明涉及数据检索技术领域，具体而言，涉及一种交叉多次检索的系统和一种交叉多次检索的方法。

背景技术

云存储是在云计算(cloud computing)概念上延伸和发展出来的一个新的概念，是指通过集群应用、网格技术或分布式文件系统等功能，将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作，共同对外提供数据存储和业务访问功能的一个系统。云存储往往通过按照数据内容进行分类，将数据存放到不同的数据存储节点上。但是当应用中，则需要从这些不同的数据节点中取回数据，这就需要数据查询合并处理，现有技术通过数据缓存对数据进行合并处理。但是在具体的应用实际中，数据存储节点存储的数据存在相同内容，数据查询在这种情况下就不是简单的合并处理了，还需要去重等多重操作，这样导致数据合并的运算量急剧大。

特别是针对区域医疗信息化中的应用，在中心医院、普通医院、社区卫生服务站等数据存储节点，存放同一患者的数据。在实际应用中，需要通过查询，获取该患者在所有数据存储节点的症疗数据。这就涉及到数据查询合并，由于数据是按照内容分发规则分发到各个数据存储节点。

因此，需要一种新的检索技术，可以简化数据查询语句的复杂度，尤其在云计算技术中，更容易在按照内容分布式存储的环境下实现多节点的数据联合查询。

发明内容

本发明正是基于上述问题，提出了一种新的检索技术，可以简化数据查询语句的复杂度，尤其在云计算技术中，更容易在按照内容分布式存储的环境下实现多节点的数据联合查询。

有鉴于此，本发明提出了一种交叉多次检索的系统，包括分布式存储管理器和检索分离器，其中，所述分布式存储管理器用于记录数据存储节点的信息；所述检索分离器包括：语句拆分单元，用于根据已记录的数据存储节点的信息，将接收到的所述检索条件语句拆分为对应于一个或多个所述数据存储节点的语句组；语句发送单元，用于将所述语句组中的每条语句发送至对应的数据存储节点；节点结果接收单元，用于接收对应于每条语句的节点检索结果数据；检索结果生成单元，用于根据所有的所述节点检索结果数据，生成对应于所述检索条件语句的检索结果数据。

在该技术方案中，通过将检索条件语句拆分成更为简单的语句，从而降低了检索条件语句的语法复杂度，有利于降低系统的计算负荷。同时，通过将拆分得到的语句发送至对应的存储节点，以分别获取对应的节点检索结果数据，再组合为最终的检索结果数据，从而解决了对于按照内容分布式存储的环境下的多节点的数据联合查询。

在上述技术方案中，优选地，所述数据存储节点的信息包括地址和数据分类。

其中，对于数据分类的方式，可以根据实际需求而进行具体的定义，比如一种具体的实施方式为：按照业务域进行分类，从而在复杂的组合查询中，仍然能够确保较高的命中广度。

在上述技术方案中，优选地，还包括：临时数据库，用于存储所有的所述节点检索结果数据；以及所述检索结果生成单元包括：合并处理子单元，用于对存储至所述临时数据库中的数据进行合并处理，以生成对应于所述检索条件语句的检索结果数据。

在该技术方案中，通过建立临时数据库，便于实施对来自各个节点的节点检索结果数据进行合并处理，从而去除重复、错误数据，使最终生成的检索结果数据更加准确合理。

在上述技术方案中，优选地，所述检索分离器还包括：接收判断单元，用于判断所述临时数据库是否接收到所有的所述节点检索结果数据；以及所述检索结果生成单元还包括：标记子单元，用于在所述接收判断单元的判断结果为否的情况下，为需要进行合并处理的数据设置相应的标记位，以由所述合并处理子单元在所述判断结果为是的情况下，按照所述标记位进行相应的处理。

在该技术方案中，在尚未接收到的所有节点的节点检索结果数据之前，由于仍存在数据的交互，若直接对已接收到的数据进行处理，则可能导致数据出错等问题，因此，只是先对需要处理的数据进行标记，待接收到所有数据之后，再按照标记位进行相应的处理，从而有利于数据的安全处理，避免数据出错。

在上述技术方案中，优选地，所述检索分离器还包括：状态检测单元，用于监测当前的数据检索状态；权限控制单元，用于控制所述系统仅当完成对所述检索条件语句的检索操作时，才允许向外部提供相应的检索结果数据。

在该技术方案中，通过对数据检索状态的监控，从而避免在数据处理过程中就向外部开放数据权限，防止对数据检索和处理过程造成干扰，确保数据的准确性。

根据本发明的又一方面，还提出了一种交叉多次检索的方法，包括：步骤202，根据已记录的数据存储节点的信息，将接收到的所述检索条件语句拆分为对应于一个或多个所述数据存储节点的语句组；步骤204，将所述语句组中的每条语句发送至对应的数据存储节点，以得到对应的节点检索结果数据；步骤206，根据所有的所述节点检索结果数据，生成对应于所述检索条件语句的检索结果数据。

在上述技术方案中，优选地，所述步骤202包括：所述数据存储节点的信息包括地址和数据分类。

在上述技术方案中，优选地，所述步骤206还包括：将所有的所述节点检索结果数据存储至临时数据库；对存储至所述临时数据库中的数据进行合并处理，以生成对应于所述检索条件语句的检索结果数据。

在上述技术方案中，优选地，所述步骤206还包括：若所述临时数据库尚未接收到所有的所述节点检索结果数据，则为需要进行合并处理的数据设置相应的标记位，并当所述临时数据库接收到所有的所述节点检索结果数据时，按照所述标记位进行相应的处理。

在上述技术方案中，优选地，还包括：监测当前的数据检索状态；其中，仅当完成对所述检索条件语句的检索操作时，才允许向外部提供相应的检索结果数据。

通过以上技术方案，可以简化数据查询语句的复杂度，尤其在云计算技术中，更容易在按照内容分布式存储的环境下实现多节点的数据联合查询。

附图说明

图1示出了根据本发明的实施例的交叉多次检索的系统的示意框图；

图2示出了根据本发明的实施例的交叉多次检索的方法的示意流程图；

图3示出了根据本发明的实施例的执行交叉多次检索的具体流程示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

图1示出了根据本发明的实施例的交叉多次检索的系统的示意框图。

如图1所示，根据本发明的实施例的交叉多次检索的系统100，包括分布式存储管理器102和检索分离器104，其中，所述分布式存储管理器102用于记录数据存储节点的信息；所述检索分离器104包括：语句拆分单元1041，用于根据已记录的数据存储节点的信息，将接收到的所述检索条件语句拆分为对应于一个或多个所述数据存储节点的语句组；语句发送单元1042，用于将所述语句组中的每条语句发送至对应的数据存储节点；节点结果接收单元1043，用于接收对应于每条语句的节点检索结果数据；检索结果生成单元1044，用于根据所有的所述节点检索结果数据，生成对应于所述检索条件语句的检索结果数据。

在上述技术方案中，优选地，还包括：临时数据库106，用于存储所有的所述节点检索结果数据；以及所述检索结果生成单元1044包括：合并处理子单元1044A，用于对存储至所述临时数据库106中的数据进行合并处理，以生成对应于所述检索条件语句的检索结果数据。

在该技术方案中，通过建立临时数据库106，便于实施对来自各个节点的节点检索结果数据进行合并处理，从而去除重复、错误数据，使最终生成的检索结果数据更加准确合理。

在上述技术方案中，优选地，所述检索分离器104还包括：接收判断单元1045，用于判断所述临时数据库106是否接收到所有的所述节点检索结果数据；以及所述检索结果生成单元1044还包括：标记子单元1044B，用于在所述接收判断单元1045的判断结果为否的情况下，为需要进行合并处理的数据设置相应的标记位，以由所述合并处理子单元1044A在所述判断结果为是的情况下，按照所述标记位进行相应的处理。

在上述技术方案中，优选地，所述检索分离器104还包括：状态检测单元1046，用于监测当前的数据检索状态；权限控制单元1047，用于控制所述系统100仅当完成对所述检索条件语句的检索操作时，才允许向外部提供相应的检索结果数据。

图2示出了根据本发明的实施例的交叉多次检索的方法的流程示意图。

如图2所示，根据本发明的实施例的交叉多次检索的方法，包括：步骤202，根据已记录的数据存储节点的信息，将接收到的所述检索条件语句拆分为对应于一个或多个所述数据存储节点的语句组；步骤204，将所述语句组中的每条语句发送至对应的数据存储节点，以得到对应的节点检索结果数据；步骤206，根据所有的所述节点检索结果数据，生成对应于所述检索条件语句的检索结果数据。

如图3所示，根据本发明的实施例的执行交叉多次检索的具体流程包括：

步骤302，当接收到外部输入的检索条件语句之后，基于本发明的检索系统开始检索事务并初始化。

步骤304，将检索条件语句拆分为多个。具体地，由于运用于内容分布式存储的环境下，因而通过对检索条件语句进行拆分，有利于降低语句的复杂度，从而分别从各个数据存储节点进行检索，以获取对应的节点检索结果数据。

步骤306，将得到的所有节点的节点检索结果数据进行合并，得到对应于最初的检索条件语句的检索结果。具体地，可以通过建立临时数据库来接收每个数据节点的节点检索结果数据，并在该临时数据库中完成对所有节点检索结果数据的合并处理。其中，对于合并处理过程中需要进行删除、修改等处理的数据，暂时通过修改其标记位进行标识，而不真正进行处理。

步骤308，监测临时数据库中的数据处理情况，若接收到所有数据节点的节点检索结果数据，则进入步骤310，否则返回步骤306。

步骤310，判断检索事务终止。

步骤312，根据数据的标记位，对数据进行相应的处理。同时，开放系统对外输出数据的接口，提供对本次检索结果的查询等操作。

以上结合附图详细说明了本发明的技术方案，本发明提供了一种交叉多次检索的系统和一种交叉多次检索的方法，可以简化数据查询语句的复杂度，尤其在云计算技术中，更容易在按照内容分布式存储的环境下实现多节点的数据联合查询。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种交叉多次检索的系统，其特征在于，包括分布式存储管理器和检索分离器，其中，

所述分布式存储管理器用于记录数据存储节点的信息；

所述检索分离器包括：

语句拆分单元，用于根据已记录的数据存储节点的信息，将接收到的所述检索条件语句拆分为对应于一个或多个所述数据存储节点的语句组；

语句发送单元，用于将所述语句组中的每条语句发送至对应的数据存储节点；

节点结果接收单元，用于接收对应于每条语句的节点检索结果数据；

检索结果生成单元，用于根据所有的所述节点检索结果数据，生成对应于所述检索条件语句的检索结果数据。

2.根据权利要求1所述的交叉多次检索的系统，其特征在于，所述数据存储节点的信息包括地址和数据分类。

3.根据权利要求1所述的交叉多次检索的系统，其特征在于，还包括：

临时数据库，用于存储所有的所述节点检索结果数据；以及

所述检索结果生成单元包括：

合并处理子单元，用于对存储至所述临时数据库中的数据进行合并处理，以生成对应于所述检索条件语句的检索结果数据。

4.根据权利要求3所述的交叉多次检索的系统，其特征在于，所述检索分离器还包括：

接收判断单元，用于判断所述临时数据库是否接收到所有的所述节点检索结果数据；以及

所述检索结果生成单元还包括：

标记子单元，用于在所述接收判断单元的判断结果为否的情况下，为需要进行合并处理的数据设置相应的标记位，以由所述合并处理子单元在所述判断结果为是的情况下，按照所述标记位进行相应的处理。

5.根据权利要求1至4中任一项所述的交叉多次检索的系统，其特征在于，所述检索分离器还包括：

状态检测单元，用于监测当前的数据检索状态；

权限控制单元，用于控制所述系统仅当完成对所述检索条件语句的检索操作时，才允许向外部提供相应的检索结果数据。

6.一种交叉多次检索的方法，其特征在于，包括：

步骤202，根据已记录的数据存储节点的信息，将接收到的所述检索条件语句拆分为对应于一个或多个所述数据存储节点的语句组；

步骤204，将所述语句组中的每条语句发送至对应的数据存储节点，以得到对应的节点检索结果数据；

步骤206，根据所有的所述节点检索结果数据，生成对应于所述检索条件语句的检索结果数据。

7.根据权利要求6所述的交叉多次检索的方法，其特征在于，所述步骤202包括：

所述数据存储节点的信息包括地址和数据分类。

8.根据权利要求6所述的交叉多次检索的方法，其特征在于，所述步骤206还包括：

将所有的所述节点检索结果数据存储至临时数据库；

对存储至所述临时数据库中的数据进行合并处理，以生成对应于所述检索条件语句的检索结果数据。

9.根据权利要求8所述的交叉多次检索的方法，其特征在于，所述步骤206还包括：

若所述临时数据库尚未接收到所有的所述节点检索结果数据，则为需要进行合并处理的数据设置相应的标记位，并当所述临时数据库接收到所有的所述节点检索结果数据时，按照所述标记位进行相应的处理。

10.根据权利要求6至9中任一项所述的交叉多次检索的方法，其特征在于，还包括：

监测当前的数据检索状态；

其中，仅当完成对所述检索条件语句的检索操作时，才允许向外部提供相应的检索结果数据。