CN103455641A - 交叉多次检索的系统和方法 - Google Patents

交叉多次检索的系统和方法 Download PDF

Info

Publication number
CN103455641A
CN103455641A CN2013104559782A CN201310455978A CN103455641A CN 103455641 A CN103455641 A CN 103455641A CN 2013104559782 A CN2013104559782 A CN 2013104559782A CN 201310455978 A CN201310455978 A CN 201310455978A CN 103455641 A CN103455641 A CN 103455641A
Authority
CN
China
Prior art keywords
data
retrieval
result
node
statement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2013104559782A
Other languages
English (en)
Other versions
CN103455641B (zh
Inventor
龚健
张应才
李登高
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Peking University Medical Information Technology Co ltd
Original Assignee
Founder International Co Ltd
Founder International Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Founder International Co Ltd, Founder International Beijing Co Ltd filed Critical Founder International Co Ltd
Priority to CN201310455978.2A priority Critical patent/CN103455641B/zh
Publication of CN103455641A publication Critical patent/CN103455641A/zh
Application granted granted Critical
Publication of CN103455641B publication Critical patent/CN103455641B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种交叉多次检索的系统和方法,该系统包括分布式存储管理器和检索分离器,其中,分布式存储管理器用于记录数据存储节点的信息;检索分离器包括:语句拆分单元,用于根据已记录的数据存储节点的信息,将接收到的检索条件语句拆分为对应于一个或多个数据存储节点的语句组;语句发送单元,用于将语句组中的每条语句发送至对应的数据存储节点;节点结果接收单元,用于接收对应于每条语句的节点检索结果数据;检索结果生成单元,用于根据所有的节点检索结果数据,生成检索结果数据。通过本发明的技术方案,可以简化数据查询语句的复杂度,尤其在云计算技术中,更容易在按照内容分布式存储的环境下实现多节点的数据联合查询。

Description

交叉多次检索的系统和方法
技术领域
本发明涉及数据检索技术领域,具体而言,涉及一种交叉多次检索的系统和一种交叉多次检索的方法。
背景技术
云存储是在云计算(cloud computing)概念上延伸和发展出来的一个新的概念,是指通过集群应用、网格技术或分布式文件系统等功能,将网络中大量各种不同类型的存储设备通过应用软件集合起来协同工作,共同对外提供数据存储和业务访问功能的一个系统。云存储往往通过按照数据内容进行分类,将数据存放到不同的数据存储节点上。但是当应用中,则需要从这些不同的数据节点中取回数据,这就需要数据查询合并处理,现有技术通过数据缓存对数据进行合并处理。但是在具体的应用实际中,数据存储节点存储的数据存在相同内容,数据查询在这种情况下就不是简单的合并处理了,还需要去重等多重操作,这样导致数据合并的运算量急剧大。
特别是针对区域医疗信息化中的应用,在中心医院、普通医院、社区卫生服务站等数据存储节点,存放同一患者的数据。在实际应用中,需要通过查询,获取该患者在所有数据存储节点的症疗数据。这就涉及到数据查询合并,由于数据是按照内容分发规则分发到各个数据存储节点。
因此,需要一种新的检索技术,可以简化数据查询语句的复杂度,尤其在云计算技术中,更容易在按照内容分布式存储的环境下实现多节点的数据联合查询。
发明内容
本发明正是基于上述问题,提出了一种新的检索技术,可以简化数据查询语句的复杂度,尤其在云计算技术中,更容易在按照内容分布式存储的环境下实现多节点的数据联合查询。
有鉴于此,本发明提出了一种交叉多次检索的系统,包括分布式存储管理器和检索分离器,其中,所述分布式存储管理器用于记录数据存储节点的信息;所述检索分离器包括:语句拆分单元,用于根据已记录的数据存储节点的信息,将接收到的所述检索条件语句拆分为对应于一个或多个所述数据存储节点的语句组;语句发送单元,用于将所述语句组中的每条语句发送至对应的数据存储节点;节点结果接收单元,用于接收对应于每条语句的节点检索结果数据;检索结果生成单元,用于根据所有的所述节点检索结果数据,生成对应于所述检索条件语句的检索结果数据。
在该技术方案中,通过将检索条件语句拆分成更为简单的语句,从而降低了检索条件语句的语法复杂度,有利于降低系统的计算负荷。同时,通过将拆分得到的语句发送至对应的存储节点,以分别获取对应的节点检索结果数据,再组合为最终的检索结果数据,从而解决了对于按照内容分布式存储的环境下的多节点的数据联合查询。
在上述技术方案中,优选地,所述数据存储节点的信息包括地址和数据分类。
其中,对于数据分类的方式,可以根据实际需求而进行具体的定义,比如一种具体的实施方式为:按照业务域进行分类,从而在复杂的组合查询中,仍然能够确保较高的命中广度。
在上述技术方案中,优选地,还包括:临时数据库,用于存储所有的所述节点检索结果数据;以及所述检索结果生成单元包括:合并处理子单元,用于对存储至所述临时数据库中的数据进行合并处理,以生成对应于所述检索条件语句的检索结果数据。
在该技术方案中,通过建立临时数据库,便于实施对来自各个节点的节点检索结果数据进行合并处理,从而去除重复、错误数据,使最终生成的检索结果数据更加准确合理。
在上述技术方案中,优选地,所述检索分离器还包括:接收判断单元,用于判断所述临时数据库是否接收到所有的所述节点检索结果数据;以及所述检索结果生成单元还包括:标记子单元,用于在所述接收判断单元的判断结果为否的情况下,为需要进行合并处理的数据设置相应的标记位,以由所述合并处理子单元在所述判断结果为是的情况下,按照所述标记位进行相应的处理。
在该技术方案中,在尚未接收到的所有节点的节点检索结果数据之前,由于仍存在数据的交互,若直接对已接收到的数据进行处理,则可能导致数据出错等问题,因此,只是先对需要处理的数据进行标记,待接收到所有数据之后,再按照标记位进行相应的处理,从而有利于数据的安全处理,避免数据出错。
在上述技术方案中,优选地,所述检索分离器还包括:状态检测单元,用于监测当前的数据检索状态;权限控制单元,用于控制所述系统仅当完成对所述检索条件语句的检索操作时,才允许向外部提供相应的检索结果数据。
在该技术方案中,通过对数据检索状态的监控,从而避免在数据处理过程中就向外部开放数据权限,防止对数据检索和处理过程造成干扰,确保数据的准确性。
根据本发明的又一方面,还提出了一种交叉多次检索的方法,包括:步骤202,根据已记录的数据存储节点的信息,将接收到的所述检索条件语句拆分为对应于一个或多个所述数据存储节点的语句组;步骤204,将所述语句组中的每条语句发送至对应的数据存储节点,以得到对应的节点检索结果数据;步骤206,根据所有的所述节点检索结果数据,生成对应于所述检索条件语句的检索结果数据。
在该技术方案中,通过将检索条件语句拆分成更为简单的语句,从而降低了检索条件语句的语法复杂度,有利于降低系统的计算负荷。同时,通过将拆分得到的语句发送至对应的存储节点,以分别获取对应的节点检索结果数据,再组合为最终的检索结果数据,从而解决了对于按照内容分布式存储的环境下的多节点的数据联合查询。
在上述技术方案中,优选地,所述步骤202包括:所述数据存储节点的信息包括地址和数据分类。
其中,对于数据分类的方式,可以根据实际需求而进行具体的定义,比如一种具体的实施方式为:按照业务域进行分类,从而在复杂的组合查询中,仍然能够确保较高的命中广度。
在上述技术方案中,优选地,所述步骤206还包括:将所有的所述节点检索结果数据存储至临时数据库;对存储至所述临时数据库中的数据进行合并处理,以生成对应于所述检索条件语句的检索结果数据。
在该技术方案中,通过建立临时数据库,便于实施对来自各个节点的节点检索结果数据进行合并处理,从而去除重复、错误数据,使最终生成的检索结果数据更加准确合理。
在上述技术方案中,优选地,所述步骤206还包括:若所述临时数据库尚未接收到所有的所述节点检索结果数据,则为需要进行合并处理的数据设置相应的标记位,并当所述临时数据库接收到所有的所述节点检索结果数据时,按照所述标记位进行相应的处理。
在该技术方案中,在尚未接收到的所有节点的节点检索结果数据之前,由于仍存在数据的交互,若直接对已接收到的数据进行处理,则可能导致数据出错等问题,因此,只是先对需要处理的数据进行标记,待接收到所有数据之后,再按照标记位进行相应的处理,从而有利于数据的安全处理,避免数据出错。
在上述技术方案中,优选地,还包括:监测当前的数据检索状态;其中,仅当完成对所述检索条件语句的检索操作时,才允许向外部提供相应的检索结果数据。
在该技术方案中,通过对数据检索状态的监控,从而避免在数据处理过程中就向外部开放数据权限,防止对数据检索和处理过程造成干扰,确保数据的准确性。
通过以上技术方案,可以简化数据查询语句的复杂度,尤其在云计算技术中,更容易在按照内容分布式存储的环境下实现多节点的数据联合查询。
附图说明
图1示出了根据本发明的实施例的交叉多次检索的系统的示意框图;
图2示出了根据本发明的实施例的交叉多次检索的方法的示意流程图;
图3示出了根据本发明的实施例的执行交叉多次检索的具体流程示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了根据本发明的实施例的交叉多次检索的系统的示意框图。
如图1所示,根据本发明的实施例的交叉多次检索的系统100,包括分布式存储管理器102和检索分离器104,其中,所述分布式存储管理器102用于记录数据存储节点的信息;所述检索分离器104包括:语句拆分单元1041,用于根据已记录的数据存储节点的信息,将接收到的所述检索条件语句拆分为对应于一个或多个所述数据存储节点的语句组;语句发送单元1042,用于将所述语句组中的每条语句发送至对应的数据存储节点;节点结果接收单元1043,用于接收对应于每条语句的节点检索结果数据;检索结果生成单元1044,用于根据所有的所述节点检索结果数据,生成对应于所述检索条件语句的检索结果数据。
在该技术方案中,通过将检索条件语句拆分成更为简单的语句,从而降低了检索条件语句的语法复杂度,有利于降低系统的计算负荷。同时,通过将拆分得到的语句发送至对应的存储节点,以分别获取对应的节点检索结果数据,再组合为最终的检索结果数据,从而解决了对于按照内容分布式存储的环境下的多节点的数据联合查询。
在上述技术方案中,优选地,所述数据存储节点的信息包括地址和数据分类。
其中,对于数据分类的方式,可以根据实际需求而进行具体的定义,比如一种具体的实施方式为:按照业务域进行分类,从而在复杂的组合查询中,仍然能够确保较高的命中广度。
在上述技术方案中,优选地,还包括:临时数据库106,用于存储所有的所述节点检索结果数据;以及所述检索结果生成单元1044包括:合并处理子单元1044A,用于对存储至所述临时数据库106中的数据进行合并处理,以生成对应于所述检索条件语句的检索结果数据。
在该技术方案中,通过建立临时数据库106,便于实施对来自各个节点的节点检索结果数据进行合并处理,从而去除重复、错误数据,使最终生成的检索结果数据更加准确合理。
在上述技术方案中,优选地,所述检索分离器104还包括:接收判断单元1045,用于判断所述临时数据库106是否接收到所有的所述节点检索结果数据;以及所述检索结果生成单元1044还包括:标记子单元1044B,用于在所述接收判断单元1045的判断结果为否的情况下,为需要进行合并处理的数据设置相应的标记位,以由所述合并处理子单元1044A在所述判断结果为是的情况下,按照所述标记位进行相应的处理。
在该技术方案中,在尚未接收到的所有节点的节点检索结果数据之前,由于仍存在数据的交互,若直接对已接收到的数据进行处理,则可能导致数据出错等问题,因此,只是先对需要处理的数据进行标记,待接收到所有数据之后,再按照标记位进行相应的处理,从而有利于数据的安全处理,避免数据出错。
在上述技术方案中,优选地,所述检索分离器104还包括:状态检测单元1046,用于监测当前的数据检索状态;权限控制单元1047,用于控制所述系统100仅当完成对所述检索条件语句的检索操作时,才允许向外部提供相应的检索结果数据。
在该技术方案中,通过对数据检索状态的监控,从而避免在数据处理过程中就向外部开放数据权限,防止对数据检索和处理过程造成干扰,确保数据的准确性。
图2示出了根据本发明的实施例的交叉多次检索的方法的流程示意图。
如图2所示,根据本发明的实施例的交叉多次检索的方法,包括:步骤202,根据已记录的数据存储节点的信息,将接收到的所述检索条件语句拆分为对应于一个或多个所述数据存储节点的语句组;步骤204,将所述语句组中的每条语句发送至对应的数据存储节点,以得到对应的节点检索结果数据;步骤206,根据所有的所述节点检索结果数据,生成对应于所述检索条件语句的检索结果数据。
在该技术方案中,通过将检索条件语句拆分成更为简单的语句,从而降低了检索条件语句的语法复杂度,有利于降低系统的计算负荷。同时,通过将拆分得到的语句发送至对应的存储节点,以分别获取对应的节点检索结果数据,再组合为最终的检索结果数据,从而解决了对于按照内容分布式存储的环境下的多节点的数据联合查询。
在上述技术方案中,优选地,所述步骤202包括:所述数据存储节点的信息包括地址和数据分类。
其中,对于数据分类的方式,可以根据实际需求而进行具体的定义,比如一种具体的实施方式为:按照业务域进行分类,从而在复杂的组合查询中,仍然能够确保较高的命中广度。
在上述技术方案中,优选地,所述步骤206还包括:将所有的所述节点检索结果数据存储至临时数据库;对存储至所述临时数据库中的数据进行合并处理,以生成对应于所述检索条件语句的检索结果数据。
在该技术方案中,通过建立临时数据库,便于实施对来自各个节点的节点检索结果数据进行合并处理,从而去除重复、错误数据,使最终生成的检索结果数据更加准确合理。
在上述技术方案中,优选地,所述步骤206还包括:若所述临时数据库尚未接收到所有的所述节点检索结果数据,则为需要进行合并处理的数据设置相应的标记位,并当所述临时数据库接收到所有的所述节点检索结果数据时,按照所述标记位进行相应的处理。
在该技术方案中,在尚未接收到的所有节点的节点检索结果数据之前,由于仍存在数据的交互,若直接对已接收到的数据进行处理,则可能导致数据出错等问题,因此,只是先对需要处理的数据进行标记,待接收到所有数据之后,再按照标记位进行相应的处理,从而有利于数据的安全处理,避免数据出错。
在上述技术方案中,优选地,还包括:监测当前的数据检索状态;其中,仅当完成对所述检索条件语句的检索操作时,才允许向外部提供相应的检索结果数据。
在该技术方案中,通过对数据检索状态的监控,从而避免在数据处理过程中就向外部开放数据权限,防止对数据检索和处理过程造成干扰,确保数据的准确性。
图3示出了根据本发明的实施例的执行交叉多次检索的具体流程示意图。
如图3所示,根据本发明的实施例的执行交叉多次检索的具体流程包括:
步骤302,当接收到外部输入的检索条件语句之后,基于本发明的检索系统开始检索事务并初始化。
步骤304,将检索条件语句拆分为多个。具体地,由于运用于内容分布式存储的环境下,因而通过对检索条件语句进行拆分,有利于降低语句的复杂度,从而分别从各个数据存储节点进行检索,以获取对应的节点检索结果数据。
步骤306,将得到的所有节点的节点检索结果数据进行合并,得到对应于最初的检索条件语句的检索结果。具体地,可以通过建立临时数据库来接收每个数据节点的节点检索结果数据,并在该临时数据库中完成对所有节点检索结果数据的合并处理。其中,对于合并处理过程中需要进行删除、修改等处理的数据,暂时通过修改其标记位进行标识,而不真正进行处理。
步骤308,监测临时数据库中的数据处理情况,若接收到所有数据节点的节点检索结果数据,则进入步骤310,否则返回步骤306。
步骤310,判断检索事务终止。
步骤312,根据数据的标记位,对数据进行相应的处理。同时,开放系统对外输出数据的接口,提供对本次检索结果的查询等操作。
以上结合附图详细说明了本发明的技术方案,本发明提供了一种交叉多次检索的系统和一种交叉多次检索的方法,可以简化数据查询语句的复杂度,尤其在云计算技术中,更容易在按照内容分布式存储的环境下实现多节点的数据联合查询。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种交叉多次检索的系统,其特征在于,包括分布式存储管理器和检索分离器,其中,
所述分布式存储管理器用于记录数据存储节点的信息;
所述检索分离器包括:
语句拆分单元,用于根据已记录的数据存储节点的信息,将接收到的所述检索条件语句拆分为对应于一个或多个所述数据存储节点的语句组;
语句发送单元,用于将所述语句组中的每条语句发送至对应的数据存储节点;
节点结果接收单元,用于接收对应于每条语句的节点检索结果数据;
检索结果生成单元,用于根据所有的所述节点检索结果数据,生成对应于所述检索条件语句的检索结果数据。
2.根据权利要求1所述的交叉多次检索的系统,其特征在于,所述数据存储节点的信息包括地址和数据分类。
3.根据权利要求1所述的交叉多次检索的系统,其特征在于,还包括:
临时数据库,用于存储所有的所述节点检索结果数据;以及
所述检索结果生成单元包括:
合并处理子单元,用于对存储至所述临时数据库中的数据进行合并处理,以生成对应于所述检索条件语句的检索结果数据。
4.根据权利要求3所述的交叉多次检索的系统,其特征在于,所述检索分离器还包括:
接收判断单元,用于判断所述临时数据库是否接收到所有的所述节点检索结果数据;以及
所述检索结果生成单元还包括:
标记子单元,用于在所述接收判断单元的判断结果为否的情况下,为需要进行合并处理的数据设置相应的标记位,以由所述合并处理子单元在所述判断结果为是的情况下,按照所述标记位进行相应的处理。
5.根据权利要求1至4中任一项所述的交叉多次检索的系统,其特征在于,所述检索分离器还包括:
状态检测单元,用于监测当前的数据检索状态;
权限控制单元,用于控制所述系统仅当完成对所述检索条件语句的检索操作时,才允许向外部提供相应的检索结果数据。
6.一种交叉多次检索的方法,其特征在于,包括:
步骤202,根据已记录的数据存储节点的信息,将接收到的所述检索条件语句拆分为对应于一个或多个所述数据存储节点的语句组;
步骤204,将所述语句组中的每条语句发送至对应的数据存储节点,以得到对应的节点检索结果数据;
步骤206,根据所有的所述节点检索结果数据,生成对应于所述检索条件语句的检索结果数据。
7.根据权利要求6所述的交叉多次检索的方法,其特征在于,所述步骤202包括:
所述数据存储节点的信息包括地址和数据分类。
8.根据权利要求6所述的交叉多次检索的方法,其特征在于,所述步骤206还包括:
将所有的所述节点检索结果数据存储至临时数据库;
对存储至所述临时数据库中的数据进行合并处理,以生成对应于所述检索条件语句的检索结果数据。
9.根据权利要求8所述的交叉多次检索的方法,其特征在于,所述步骤206还包括:
若所述临时数据库尚未接收到所有的所述节点检索结果数据,则为需要进行合并处理的数据设置相应的标记位,并当所述临时数据库接收到所有的所述节点检索结果数据时,按照所述标记位进行相应的处理。
10.根据权利要求6至9中任一项所述的交叉多次检索的方法,其特征在于,还包括:
监测当前的数据检索状态;
其中,仅当完成对所述检索条件语句的检索操作时,才允许向外部提供相应的检索结果数据。
CN201310455978.2A 2013-09-29 2013-09-29 交叉多次检索的系统和方法 Active CN103455641B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310455978.2A CN103455641B (zh) 2013-09-29 2013-09-29 交叉多次检索的系统和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310455978.2A CN103455641B (zh) 2013-09-29 2013-09-29 交叉多次检索的系统和方法

Publications (2)

Publication Number Publication Date
CN103455641A true CN103455641A (zh) 2013-12-18
CN103455641B CN103455641B (zh) 2017-02-22

Family

ID=49738004

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310455978.2A Active CN103455641B (zh) 2013-09-29 2013-09-29 交叉多次检索的系统和方法

Country Status (1)

Country Link
CN (1) CN103455641B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930407A (zh) * 2016-04-18 2016-09-07 北京思特奇信息技术股份有限公司 一种分布式数据库跨库关联查询方法及系统
CN109117426A (zh) * 2017-06-23 2019-01-01 中兴通讯股份有限公司 分布式数据库查询方法、装置、设备及存储介质

Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6081805A (en) * 1997-09-10 2000-06-27 Netscape Communications Corporation Pass-through architecture via hash techniques to remove duplicate query results
US6615209B1 (en) * 2000-02-22 2003-09-02 Google, Inc. Detecting query-specific duplicate documents
US6658423B1 (en) * 2001-01-24 2003-12-02 Google, Inc. Detecting duplicate and near-duplicate files
CN1790322A (zh) * 2004-12-17 2006-06-21 国际商业机器公司 从多个格式不同的物理表创建逻辑表的方法和系统
US7155427B1 (en) * 2002-10-30 2006-12-26 Oracle International Corporation Configurable search tool for finding and scoring non-exact matches in a relational database
US20070011142A1 (en) * 2005-07-06 2007-01-11 Juergen Sattler Method and apparatus for non-redundant search results
US20080222063A1 (en) * 2007-03-06 2008-09-11 Oracle International Corporation Extensible mechanism for detecting duplicate search items
US20090144244A1 (en) * 2007-12-04 2009-06-04 Yahoo! Inc. Time based ordering of provided mobile content
US7657515B1 (en) * 2007-03-30 2010-02-02 Alexa Internet High efficiency document search
CN101894143A (zh) * 2010-06-28 2010-11-24 北京用友政务软件有限公司 一种联邦检索及检索结果集成展现方法及系统
CN101916280A (zh) * 2010-08-17 2010-12-15 上海云数信息科技有限公司 并行计算系统及按查询内容进行负载均衡的方法
US20110004608A1 (en) * 2009-07-02 2011-01-06 Microsoft Corporation Combining and re-ranking search results from multiple sources
CN102708121A (zh) * 2011-02-18 2012-10-03 微软公司 异构源上的动态分布式查询执行
US20130091103A1 (en) * 2011-10-10 2013-04-11 Salesforce.Com, Inc. Systems and methods for real-time de-duplication
US20130124474A1 (en) * 2011-11-15 2013-05-16 Arlen Anderson Data clustering, segmentation, and parallelization
CN103186563A (zh) * 2011-12-28 2013-07-03 腾讯科技(深圳)有限公司 一种数据检索方法及系统

Patent Citations (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6081805A (en) * 1997-09-10 2000-06-27 Netscape Communications Corporation Pass-through architecture via hash techniques to remove duplicate query results
US6615209B1 (en) * 2000-02-22 2003-09-02 Google, Inc. Detecting query-specific duplicate documents
US6658423B1 (en) * 2001-01-24 2003-12-02 Google, Inc. Detecting duplicate and near-duplicate files
US7155427B1 (en) * 2002-10-30 2006-12-26 Oracle International Corporation Configurable search tool for finding and scoring non-exact matches in a relational database
CN1790322A (zh) * 2004-12-17 2006-06-21 国际商业机器公司 从多个格式不同的物理表创建逻辑表的方法和系统
US20070011142A1 (en) * 2005-07-06 2007-01-11 Juergen Sattler Method and apparatus for non-redundant search results
US20080222063A1 (en) * 2007-03-06 2008-09-11 Oracle International Corporation Extensible mechanism for detecting duplicate search items
US7657515B1 (en) * 2007-03-30 2010-02-02 Alexa Internet High efficiency document search
US20090144244A1 (en) * 2007-12-04 2009-06-04 Yahoo! Inc. Time based ordering of provided mobile content
US20120150868A1 (en) * 2007-12-04 2012-06-14 Yahoo! Inc. Time based ordering of provided mobile content
US20110004608A1 (en) * 2009-07-02 2011-01-06 Microsoft Corporation Combining and re-ranking search results from multiple sources
CN101894143A (zh) * 2010-06-28 2010-11-24 北京用友政务软件有限公司 一种联邦检索及检索结果集成展现方法及系统
CN101916280A (zh) * 2010-08-17 2010-12-15 上海云数信息科技有限公司 并行计算系统及按查询内容进行负载均衡的方法
CN102708121A (zh) * 2011-02-18 2012-10-03 微软公司 异构源上的动态分布式查询执行
US20130091103A1 (en) * 2011-10-10 2013-04-11 Salesforce.Com, Inc. Systems and methods for real-time de-duplication
US20130124474A1 (en) * 2011-11-15 2013-05-16 Arlen Anderson Data clustering, segmentation, and parallelization
CN103186563A (zh) * 2011-12-28 2013-07-03 腾讯科技(深圳)有限公司 一种数据检索方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴广印: "分布式检索系统架构及核心技术研究", 《情报学报》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105930407A (zh) * 2016-04-18 2016-09-07 北京思特奇信息技术股份有限公司 一种分布式数据库跨库关联查询方法及系统
CN105930407B (zh) * 2016-04-18 2019-05-17 北京思特奇信息技术股份有限公司 一种分布式数据库跨库关联查询方法及系统
CN109117426A (zh) * 2017-06-23 2019-01-01 中兴通讯股份有限公司 分布式数据库查询方法、装置、设备及存储介质
CN109117426B (zh) * 2017-06-23 2023-06-09 金篆信科有限责任公司 分布式数据库查询方法、装置、设备及存储介质

Also Published As

Publication number Publication date
CN103455641B (zh) 2017-02-22

Similar Documents

Publication Publication Date Title
US10817195B2 (en) Key-value based message oriented middleware
US9787706B1 (en) Modular architecture for analysis database
US8290994B2 (en) Obtaining file system view in block-level data storage systems
CN100470522C (zh) 访问内容可寻址存储系统的虚拟库中的内容的方法和装置
CN1531303B (zh) 协议无关的客户端高速缓存系统和方法
CN103312624B (zh) 一种消息队列服务系统和方法
CN104160397B (zh) 位置独立文件
US20180096017A1 (en) Method and computing device for minimizing accesses to data storage in conjunction with maintaining a b-tree
CN103890729A (zh) 共享资源的协同管理
US8478803B2 (en) Management of logical statements in a distributed database environment
CN104881466A (zh) 数据分片的处理以及垃圾文件的删除方法和装置
CN105677904B (zh) 基于分布式文件系统的小文件存储方法及装置
CN109408689A (zh) 数据获取方法、装置、系统及电子设备
CN109656886B (zh) 基于键值对的文件系统实现方法、装置、设备和存储介质
CN106951179A (zh) 一种数据迁移方法及装置
CN109213604A (zh) 一种数据源的管理方法和装置
CN110737680A (zh) 缓存数据管理方法、装置、存储介质及电子设备
CN109117426A (zh) 分布式数据库查询方法、装置、设备及存储介质
CN107783728A (zh) 数据存储方法、装置和设备
CN103455641A (zh) 交叉多次检索的系统和方法
CN102129454A (zh) 一种基于云存储的百科数据处理方法及系统
US10628460B2 (en) Delegating resembling data of an organization to a linked device
CN106991116A (zh) 数据库执行计划的优化方法和装置
US20120054185A1 (en) Managing Information
CN107967273A (zh) 数据获取方法、数据节点及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: PKU HEALTHCARE IT CO., LTD.

Free format text: FORMER OWNER: FOUNDER INTERNATIONAL CO., LTD.

Effective date: 20150203

Free format text: FORMER OWNER: FOUNDER INTERNATIONAL (BEIJING) CO., LTD.

Effective date: 20150203

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 215123 SUZHOU, JIANGSU PROVINCE TO: 100080 HAIDIAN, BEIJING

TA01 Transfer of patent application right

Effective date of registration: 20150203

Address after: 100080, No. 19, No. 52 West Fourth Ring Road, Beijing, Haidian District

Applicant after: Peking University Medical Information Technology Co.,Ltd.

Address before: Suzhou City, Jiangsu Province, Suzhou Industrial Park 215123 Xinghu Street No. 328 Creative Industry Park founder International Building

Applicant before: FOUNDER INTERNATIONAL Co.,Ltd.

Applicant before: Founder International Co.,Ltd. (Beijing)

C14 Grant of patent or utility model
GR01 Patent grant
PP01 Preservation of patent right

Effective date of registration: 20240202

Granted publication date: 20170222

PP01 Preservation of patent right