CN104516979A - 一种基于二次检索的数据查询方法及系统 - Google Patents

一种基于二次检索的数据查询方法及系统 Download PDF

Info

Publication number
CN104516979A
CN104516979A CN201410852530.9A CN201410852530A CN104516979A CN 104516979 A CN104516979 A CN 104516979A CN 201410852530 A CN201410852530 A CN 201410852530A CN 104516979 A CN104516979 A CN 104516979A
Authority
CN
China
Prior art keywords
index
data
server
retrieval
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410852530.9A
Other languages
English (en)
Other versions
CN104516979B (zh
Inventor
唐家伟
彭满山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Ruian Technology Co Ltd
Original Assignee
Beijing Ruian Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Ruian Technology Co Ltd filed Critical Beijing Ruian Technology Co Ltd
Priority to CN201410852530.9A priority Critical patent/CN104516979B/zh
Publication of CN104516979A publication Critical patent/CN104516979A/zh
Application granted granted Critical
Publication of CN104516979B publication Critical patent/CN104516979B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24552Database cache management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F16/9574Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching

Abstract

本发明公开了一种基于二次检索的数据查询方法及系统,本发明为:1)创建一索引模板,当一用户登录客户端进行第一次检索时,为该用户的本次登录生成一批次号,并该批次号和该第一次检索结果保存到中间库服务器中;2)索引服务器根据该索引模板从该第一次检索结果中提取所有可作为查询条件的数据项及拆分规则,创建该批次号的索引;3)当该用户进行二次检索时,从该批次号的索引中读取所有包含该用户所输入二次查询条件的索引数据,然后根据该索引数据从所述中间库服务器中获取检索结果。本发明可以动态重构二次检索查询条件,并通过中间库缓存一次查询结果,这样减少了二次查询时的总数据量,大大的提高了二次检索数据的效率。

Description

一种基于二次检索的数据查询方法及系统
技术领域
本发明涉及互联网搜索领域,尤其涉及一种基于搜索中二次检索的数据查询方法及系统。
技术背景
随着Internet的快速增长,人们对海量数据的挖掘和运用,预示着新一波生产力和消费者盈余浪潮的到来,大数据开始引起人们的关注,其数据量远远超越现在企业IT架构和基础设施的承载能力,实时性要求也将大大超越现在的计算能力,如何从大数据中检索出有价值的数据,为国家治理、企业决策乃至个人生活服务提供帮助成为人们的议题。
人们越来越多的依赖于搜索引擎来获取有价值的数据,通过关键字搜索,可以返回大量的结果数据,但是其中大部分数据不是用户需求的范围内,为了检索更为贴切用户需求的数据,需要二次检索,就是在一次检索结果的基础上,通过特定的条件进行筛选,缩小范围,获取更为满足用户需求的结果信息。在传统的搜索中,我们会面临2个问题,一是,数据总量过大,搜索速度慢,且频繁搜索影响服务器性能,二是查询条件比较固定,无法灵活配置。
发明内容
本发明解决的技术问题:本发明的目的是提供一种基于二次检索的数据查询方法,一种可以动态加载二次检索条件,实现二次检索条件灵活性。采用的方式:在第一次搜索数据,在返回结果数据的同时,我们通过solr创建索引,并将返回的数据以BSON的格式临时存放到MongDb数据库中,并通过索引匹配出可以作为查询条件的数据项,并生产批次号保存到中间库,在进行二次搜索的时候,我们可以通过查询批次号检索查询数据项,动态生成二次搜索的条件,实现二次查询条件的灵活配置,且在二次搜索时,通过solr创建的索引直接去中间库中(MongoDB)检索对应的批次数据,这样大大的减少了二次查询数据总量,提高检索效率,并降低对业务数据库性能影响。
为实现上述目的,本发明的解决方案是:
一种基于二次检索的数据查询方法,其步骤为:
1)创建一索引模板,当一用户登录客户端进行第一次检索时,为该用户的本次登录生成一批次号,并该批次号和该第一次检索结果保存到中间库服务器中;
2)索引服务器根据该索引模板从该第一次检索结果中提取所有可作为查询条件的数据项及拆分规则,创建该批次号的索引;
3)当该用户进行二次检索时,从该批次号的索引中读取所有包含该用户所输入二次查询条件的索引数据,然后根据该索引数据从所述中间库服务器中获取检索结果。
进一步的,所述中间库服务器为MongDb数据库;将该第一次检索结果以BSON的格式存放到所述MongDb数据库中。
进一步的,所述索引服务器为solr服务器;所述第一次检索结果按照索引中的拆分规则以键值对保存到中间库服务器中。
进一步的,所述索引数据采用键值对形式保存,其中键RowKey=查询条件+<分隔符>+DATAID,DATAID为键值数据的唯一标识;键值为第一次检索结果。
进一步的,所述键值数据的唯一标识DATAID的信息包括:时间,客户端编号,地址和流水号。
进一步的,所述客户端根据所述二次查询条件,从该批次的索引中读取所有包含该查询条件的键RowKey,然后通过所读取的键RowKey获取DATAID集合,然后通过DATAID集合从所述中间库服务器中得到检索结果。
一种基于二次检索的数据查询系统,其特征在于,包括通过网络连接的客户端、应用支撑服务器、中间件服务器、索引服务器和中间库服务器;其中,
所述客户端,用于提供人机交互界面,接收查询条件的录入;
所述应用支撑服务器,用于提供一次检索业务查询接口,封装二次检索查询条件,并提供二次检索的访问中间库服务器的通用接口;
所述中间件服务器,用于封装一次检索查询数据库的通用接口,控制索引的创建并将一次查询的结果集导入到中间库服务器,且通过索引文件匹配出可以作为二次查询的索引数据,生产批次号,保存到中间库服务器中,封装访问中间库服务器的查询接口;
所述索引服务器:根据该索引模板index.xml从该第一次检索结果中提取所有可作为查询条件的数据项及拆分规则,创建该批次号的索引;
所述中间库服务器,用于保存一次检索的结果集数据,并提供索引查询接口。
进一步的,所述中间库服务器为MongDb数据库,所述索引服务器为solr服务器;该第一次检索结果以BSON的格式存放到所述MongDb数据库中。
进一步的,所述索引数据采用键值对形式保存,其中键RowKey=查询条件+<分隔符>+DATAID,DATAID为键值数据的唯一标识;键值为第一次检索结果;所述键值数据的唯一标识DATAID的信息包括:时间,客户端编号,地址和流水号。
进一步的,所述客户端根据所述二次查询条件,从该批次的索引中读取所有包含该查询条件的键RowKey,然后通过所读取的键RowKey获取DATAID集合,然后通过DATAID集合从所述中间库服务器中得到检索结果。
本发明基于二次检索的技术,其系统架构如图2所示,它包括:
a.客户端:即浏览器客户端。用户通过客户端友好的人机交互界面实现对一次、二次搜索条件的录入。
b.应用支撑服务器:提供一次检索业务查询接口,封装二次检索查询条件,并提供二次检索的访问中间库服务器的通用接口。
c.中间件服务器:封装一次检索查询数据库的通用接口,控制Solr索引的创建并将一次查询的结果集导入到中间库,且通过索引文件匹配出可以作为二次查询的数据项,生产批次号,保存到中间库中,封装访问中间库的查询接口。
d.索引服务器:通过Solr来创建索引,通过http请求,向搜索引擎服务器提交一定格式的XML文件,生成索引,通过Http Get操作提出查找请求,并得到XML格式的返回结果,且实现结果的高亮显示。
e.中间库服务器:保存一次检索的结果集数据,并提供索引查询接口。
本发明的二次检索方法包括以下步骤:
a.客户端向Web服务器发一次检索请求,Web服务器响应客户端请求,并向应用支撑服务器发起查询请求;
b.应用支撑服务器响应Web请求,通过中间件向业务库发起查询请求,检索查询数据,将查询结果返回给应用支撑服务器,应用支撑服务器再将结果信息反馈给Web服务器,同时通过Solr服务器创建索引文件,将查询到的结果保存到中间库中;
c.客户端在进行二次检索时,通过Ajax异步请求向web服务器请求加载二次查询条件,web服务器通过中间件调用solr索引,通过批次号读取查询数据项,并请求查询数据项模板,通过解析查询模板,生成查询条件,并加载到web页面(在加载二次检索条件,先调用查询模板,检查是否有操作类型的数据项,然后则检测模板中设定的操作类型是否在一次检索时有结果数据返回,如果有则加载为二次检索条件值。如:一次检索条件包含操作类型10种,而一次检索的结果数据列表只包含其中3种,那么在加载二次检索条件操作类型时,只会动态生成3种);
d.输入二次检索查询,发送二次检索请求,web服务向应用支撑服务器发起二次检索请求,应用支撑调用中间件二次查询接口;
e.中间件响应二次检索,通过solr服务器的索引文件及查询批次号请求中间库服务器,中间件直接向中间库发起查询请求,请求二次检索数据,然后以高亮的方式展示在web页面(二次检索不在请求业务库,而是直接请求中间库)。
与现有技术相比,本发明的优点和积极效果:
由于本发明中提出了使用Solr创建索引,使用MongDb作为中间库存储数据的模式,它提供了一种高效、灵活的缓存功能,垂直搜索功能、高亮显示搜素结果,通过索引复制提供可用性,可以动态重构二次检索查询条件,并通过中间库缓存一次查询结果,这样减少了二次查询时的总数据量,大大的提高了二次检索数据的效率。
附图说明
图1二次检索业务流程图;
图2二次检索网络拓扑图示意图。
具体实施方式
图1是二次检索的流程示意图。其中包括客户端、WEB服务器、应用支撑、中间件、中间库、Solr服务器及业务数据库,本发明实现了大数据量的二次快速检索功能。
其二次检索的业务流程,具体如下:
(1)Web服务器在请求一次查询时,通过查询业务数据库,返回检查结果集展示到页面,同时通过solr服务器创建索引文件(solr服务器读取索引模板index.xml,提取所有可作为查询条件的数据项及拆分规则,并检测数据项是否在一次查询范围内,如果是则创建索引,索引中包含可作为查询条件的字段及字段拆分规则,例如:以IP作为查询条件,索引中会记录IP标示位,并以IP地址创建索引,其中包含一个RowKey=IP+<分隔符>+DATAID,唯一标识(DATAID)生成规则:前面10位是时间精确到秒,设备ID 3位,城市ID 6位,流水号6位,一台设备上全部协议共用一个流水号,DATAID在集群内唯一,以DATAID创建索引时,RowKey=MD5(DATAID[0,2]+DATAID)),然后将一次检索的结果集按照索引中的拆分规则以键值对保存到中间库mongdb中(键:RowKey值:BSON格式数据)。
(2)客户端在进行二次检索时,通过Ajax异步请求向web服务器请求加载二次查询条件,web服务器通过中间件调用solr索引,通过批次号从索引文件中读取可作为二次查询的数据项标示,并请求查询数据项模板,组装成查询条件集合,以Json格式形式返回,通过解析Json数据,将二次检索查询条件异步加载到web页面。
(3)客户端执行二次检索时,WEB服务器接收处理请求,通过应用支撑封装传递查询请求条件到中间件服务器,中间件通过接口读取索引文件,并通过二次查询接口直接向中间库发起查询请求;如:当以IP地址进行二次查询时,通过批次号从索引中读取所有包含IP的RowKey,通过RowKey获取DATAID集合,然后通过DATAID集合请求中间库,检索结果数据。
(4)中间库服务器接收并响应中间件的查询请求,从中间库中检索数据符合查询请求的数据并以Json格式返回,最后通过Solr索引中记录的条件标示,将查询条件值及结果列表以高亮的方式展示在WEB页面。
另外,该系统采用一种非关系型数据库Mong0DB(NoSql)作为中间库缓存数据,其灵活的存储方式,对大数据量、高并发、弱事务的互联网应用应对自如,其内置水平扩展机制提供了从百万到十亿级别的数据处理能力;在查询速度方面,通过中间库服务器缓存一次检索结果数据,大大降低二次检索的数据总量,最大限度的提高了二次检索的效率,使检索结果更符合需求。在性能方面,使二次检索直接访问中间库,降低对业务数据库的频繁操作,大大降低业务库的性能损耗。
本发明对中间件、中间库、应用支撑和web服务器的要求是:中间件、中间库、应用支撑服务器需要通过千兆路由连接,应用支撑与web服务器通过专网或内网连接,中间件服务器内存建议:32G以上,中间库使用分布式文件系统部署,单个存储TB级以上。

Claims (10)

1.一种基于二次检索的数据查询方法,其步骤为:
1)创建一索引模板,当一用户登录客户端进行第一次检索时,为该用户的本次登录生成一批次号,并该批次号和该第一次检索结果保存到中间库服务器中;
2)索引服务器根据该索引模板从该第一次检索结果中提取所有可作为查询条件的数据项及拆分规则,创建该批次号的索引;
3)当该用户进行二次检索时,从该批次号的索引中读取所有包含该用户所输入二次查询条件的索引数据,然后根据该索引数据从所述中间库服务器中获取检索结果。
2.如权利要求1所述的方法,其特征在于,所述中间库服务器为MongDb数据库;将该第一次检索结果以BSON的格式存放到所述MongDb数据库中。
3.如权利要求1或2所述的方法,其特征在于,所述索引服务器为solr服务器;所述第一次检索结果按照索引中的拆分规则以键值对保存到中间库服务器中。
4.如权利要求3所述的方法,其特征在于,所述索引数据采用键值对形式保存,其中键RowKey=查询条件+<分隔符>+DATAID,DATAID为键值数据的唯一标识;键值为第一次检索结果。
5.如权利要求4所述的方法,其特征在于,所述键值数据的唯一标识DATAID的信息包括:时间,客户端编号,地址和流水号。
6.如权利要求4所述的方法,其特征在于,所述客户端根据所述二次查询条件,从该批次的索引中读取所有包含该查询条件的键RowKey,然后通过所读取的键RowKey获取DATAID集合,然后通过DATAID集合从所述中间库服务器中得到检索结果。
7.一种基于二次检索的数据查询系统,其特征在于,包括通过网络连接的客户端、应用支撑服务器、中间件服务器、索引服务器和中间库服务器;其中,
所述客户端,用于提供人机交互界面,接收查询条件的录入;
所述应用支撑服务器,用于提供一次检索业务查询接口,封装二次检索查询条件,并提供二次检索的访问中间库服务器的通用接口;
所述中间件服务器,用于封装一次检索查询数据库的通用接口,控制索引的创建并将一次查询的结果集导入到中间库服务器,且通过索引文件匹配出可以作为二次查询的索引数据,生产批次号,保存到中间库服务器中,封装访问中间库服务器的查询接口;
所述索引服务器:根据该索引模板index.xml从该第一次检索结果中提取所有可作为查询条件的数据项及拆分规则,创建该批次号的索引;
所述中间库服务器,用于保存一次检索的结果集数据,并提供索引查询接口。
8.如权利要求7所述的系统,其特征在于,所述中间库服务器为MongDb数据库,所述索引服务器为solr服务器;该第一次检索结果以BSON的格式存放到所述MongDb数据库中。
9.如权利要求7或8所述的系统,其特征在于,所述索引数据采用键值对形式保存,其中键RowKey=查询条件+<分隔符>+DATAID,DATAID为键值数据的唯一标识;键值为第一次检索结果;所述键值数据的唯一标识DATAID的信息包括:时间,客户端编号,地址和流水号。
10.如权利要求9所述的系统,其特征在于,所述客户端根据所述二次查询条件,从该批次的索引中读取所有包含该查询条件的键RowKey,然后通过所读取的键RowKey获取DATAID集合,然后通过DATAID集合从所述中间库服务器中得到检索结果。
CN201410852530.9A 2014-12-31 2014-12-31 一种基于二次检索的数据查询方法及系统 Active CN104516979B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410852530.9A CN104516979B (zh) 2014-12-31 2014-12-31 一种基于二次检索的数据查询方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410852530.9A CN104516979B (zh) 2014-12-31 2014-12-31 一种基于二次检索的数据查询方法及系统

Publications (2)

Publication Number Publication Date
CN104516979A true CN104516979A (zh) 2015-04-15
CN104516979B CN104516979B (zh) 2018-10-02

Family

ID=52792278

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410852530.9A Active CN104516979B (zh) 2014-12-31 2014-12-31 一种基于二次检索的数据查询方法及系统

Country Status (1)

Country Link
CN (1) CN104516979B (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105160510A (zh) * 2015-08-25 2015-12-16 金蝶软件(中国)有限公司 自动匹配物料即时库存中物料的方法和装置
CN106815246A (zh) * 2015-11-30 2017-06-09 北京国双科技有限公司 非关系型数据库中的文档存储方法及装置
CN107103032A (zh) * 2017-03-21 2017-08-29 中国科学院计算机网络信息中心 一种分布式环境下避免全局排序的海量数据分页查询方法
CN107229699A (zh) * 2017-05-24 2017-10-03 四川长虹电器股份有限公司 提升移动端用户搜索体验的系统及方法
CN107463570A (zh) * 2016-06-02 2017-12-12 索意互动(北京)信息技术有限公司 一种文献检索/分析方法和装置
CN107562923A (zh) * 2017-09-13 2018-01-09 桂林电子科技大学 基于船载导航雷达和光电平台的船只目标观测方法及系统
CN108153874A (zh) * 2017-12-26 2018-06-12 福建星瑞格软件有限公司 一种大数据高耗时查询结果集的快速分页方法
CN108334634A (zh) * 2018-02-27 2018-07-27 北京中关村科金技术有限公司 一种提取数据信息的方法、装置、设备及存储介质
CN110232106A (zh) * 2019-04-26 2019-09-13 安徽四创电子股份有限公司 一种基于MongoDB和Solr的海量数据存储及快速检索方法
CN110727835A (zh) * 2019-10-17 2020-01-24 浙江中智达科技有限公司 数据查询方法、装置及系统
CN110795449A (zh) * 2019-09-10 2020-02-14 紫光云技术有限公司 基于bs架构的环保舆情系统
CN110895538A (zh) * 2018-09-13 2020-03-20 深圳市蓝灯鱼智能科技有限公司 数据检索方法、装置、存储介质和处理器
US10726004B2 (en) 2017-03-09 2020-07-28 Walmart Apollo, Llc Enterprise integration processing for mainframe COBOL programs
TWI752672B (zh) * 2019-10-23 2022-01-11 湯志斌 收斂式資訊併標籤檢索方法
US20230114912A1 (en) * 2021-10-08 2023-04-13 Open Text Holdings, Inc. System and method for efficient multi-stage querying of archived data
US11734349B2 (en) 2019-10-23 2023-08-22 Chih-Pin TANG Convergence information-tags retrieval method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101546309A (zh) * 2008-03-26 2009-09-30 国际商业机器公司 对计算机网络中的资源内容构建索引的方法和设备
CN104239377A (zh) * 2013-11-12 2014-12-24 新华瑞德(北京)网络科技有限公司 跨平台的数据检索方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101546309A (zh) * 2008-03-26 2009-09-30 国际商业机器公司 对计算机网络中的资源内容构建索引的方法和设备
CN104239377A (zh) * 2013-11-12 2014-12-24 新华瑞德(北京)网络科技有限公司 跨平台的数据检索方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
吴代文: "基于Lucene二次全文检索系统的设计与实现", 《微型电脑应用》 *
宋宝贵等: "基于Web资源二次查询的信息检索策略研究", 《计算机应用与软件》 *
王正刚等: "黄页搜索引擎二次检索的实现技术", 《计算机应用与软件》 *

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105160510A (zh) * 2015-08-25 2015-12-16 金蝶软件(中国)有限公司 自动匹配物料即时库存中物料的方法和装置
CN105160510B (zh) * 2015-08-25 2019-04-05 金蝶软件(中国)有限公司 自动匹配物料即时库存中物料的方法和装置
CN106815246A (zh) * 2015-11-30 2017-06-09 北京国双科技有限公司 非关系型数据库中的文档存储方法及装置
CN107463570A (zh) * 2016-06-02 2017-12-12 索意互动(北京)信息技术有限公司 一种文献检索/分析方法和装置
CN107463570B (zh) * 2016-06-02 2020-10-13 索意互动(北京)信息技术有限公司 一种文献检索/分析方法和装置
US10726004B2 (en) 2017-03-09 2020-07-28 Walmart Apollo, Llc Enterprise integration processing for mainframe COBOL programs
CN107103032B (zh) * 2017-03-21 2020-02-28 中国科学院计算机网络信息中心 一种分布式环境下避免全局排序的海量数据分页查询方法
CN107103032A (zh) * 2017-03-21 2017-08-29 中国科学院计算机网络信息中心 一种分布式环境下避免全局排序的海量数据分页查询方法
CN107229699A (zh) * 2017-05-24 2017-10-03 四川长虹电器股份有限公司 提升移动端用户搜索体验的系统及方法
CN107229699B (zh) * 2017-05-24 2020-06-30 四川长虹电器股份有限公司 提升移动端用户搜索体验的系统及方法
CN107562923A (zh) * 2017-09-13 2018-01-09 桂林电子科技大学 基于船载导航雷达和光电平台的船只目标观测方法及系统
CN108153874A (zh) * 2017-12-26 2018-06-12 福建星瑞格软件有限公司 一种大数据高耗时查询结果集的快速分页方法
CN108334634A (zh) * 2018-02-27 2018-07-27 北京中关村科金技术有限公司 一种提取数据信息的方法、装置、设备及存储介质
CN110895538A (zh) * 2018-09-13 2020-03-20 深圳市蓝灯鱼智能科技有限公司 数据检索方法、装置、存储介质和处理器
CN110232106A (zh) * 2019-04-26 2019-09-13 安徽四创电子股份有限公司 一种基于MongoDB和Solr的海量数据存储及快速检索方法
CN110795449A (zh) * 2019-09-10 2020-02-14 紫光云技术有限公司 基于bs架构的环保舆情系统
CN110727835A (zh) * 2019-10-17 2020-01-24 浙江中智达科技有限公司 数据查询方法、装置及系统
CN110727835B (zh) * 2019-10-17 2021-03-12 浙江中智达科技有限公司 数据查询方法、装置及系统
TWI752672B (zh) * 2019-10-23 2022-01-11 湯志斌 收斂式資訊併標籤檢索方法
US11734349B2 (en) 2019-10-23 2023-08-22 Chih-Pin TANG Convergence information-tags retrieval method
US20230114912A1 (en) * 2021-10-08 2023-04-13 Open Text Holdings, Inc. System and method for efficient multi-stage querying of archived data

Also Published As

Publication number Publication date
CN104516979B (zh) 2018-10-02

Similar Documents

Publication Publication Date Title
CN104516979A (zh) 一种基于二次检索的数据查询方法及系统
CN107247808B (zh) 一种分布式NewSQL数据库系统及图片数据查询方法
Das et al. Big data analytics: A framework for unstructured data analysis
CN104424199A (zh) 搜索方法和装置
Lee et al. SQL-to-NoSQL schema denormalization and migration: a study on content management systems
CN104536959A (zh) 一种Hadoop存取海量小文件的优化方法
CN103646073A (zh) 一种基于HBase表的条件查询优化方法
CN103106249A (zh) 一种基于Cassandra的数据并行处理系统
US20160117393A1 (en) Combinatorial Business Intelligence
CN103984745A (zh) 分布式视频垂直搜索方法及系统
US20210357461A1 (en) Method, apparatus and storage medium for searching blockchain data
CN104598631A (zh) 分布式数据处理平台
CN106294695A (zh) 一种面向实时大数据搜索引擎的实现方法
Siddiqui et al. Pseudo-cache-based IoT small files management framework in HDFS cluster
CN111046041B (zh) 数据处理方法和装置、存储介质及处理器
CN104794190A (zh) 一种大数据有效存储的方法和装置
US11789946B2 (en) Answer facts from structured content
CN103353901A (zh) 基于Hadoop分布式文件系统的表数据的有序管理方法以及系统
CN104778229A (zh) 基于Hadoop的电信业务小文件存储系统及方法
CN104021125A (zh) 一种搜索引擎排序的方法、系统以及一种搜索引擎
CN104750855A (zh) 一种大数据存储优化方法和装置
CN105007314A (zh) 面向海量读者阅读数据的大数据处理系统
CN105183809A (zh) 一种云平台数据查询方法
CN109271449A (zh) 一种基于文件的分布式存储查询系统及查询方法
CN104424325A (zh) 数据查询方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Data Query Method and System Based on Secondary Retrieval

Effective date of registration: 20230807

Granted publication date: 20181002

Pledgee: Bank of China Limited Beijing Xicheng Branch

Pledgor: RUN TECHNOLOGIES Co.,Ltd. BEIJING

Registration number: Y2023980051158