CN109885642A - 面向全文检索的分级存储方法及装置 - Google Patents

面向全文检索的分级存储方法及装置 Download PDF

Info

Publication number
CN109885642A
CN109885642A CN201910119254.8A CN201910119254A CN109885642A CN 109885642 A CN109885642 A CN 109885642A CN 201910119254 A CN201910119254 A CN 201910119254A CN 109885642 A CN109885642 A CN 109885642A
Authority
CN
China
Prior art keywords
elasticsearch
index
full
plug
text search
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910119254.8A
Other languages
English (en)
Other versions
CN109885642B (zh
Inventor
刘欣然
张鸿
惠榛
吕雁飞
马秉楠
李斌斌
王振宇
黄航
王树鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
National Computer Network and Information Security Management Center
Original Assignee
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by National Computer Network and Information Security Management Center filed Critical National Computer Network and Information Security Management Center
Priority to CN201910119254.8A priority Critical patent/CN109885642B/zh
Publication of CN109885642A publication Critical patent/CN109885642A/zh
Application granted granted Critical
Publication of CN109885642B publication Critical patent/CN109885642B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种面向全文检索的分级存储方法及装置,所述方法包括:获取SQL语句,创建全文检索表,并将所述全文检索表持久化到Zookeeper中;配置ElasticSearch集群中一部分节点使用SSD盘,另一部分节点使用SATA盘,并在每个节点上安装自定义的ElasticSearch插件;数据加载工具通过ElasticSearch集群的调用接口API将文档数据加载到ElasticSearch集群中,通过所述ElasticSearch插件对请求进行过滤,并使用预先存储的全文检索表中的元数据进行索引创建;通过所述ElasticSearch插件运行监听策略,监听Zookeeper中表的元数据信息的变化,并应用分级存储策略,执行定时回滚策略,将回滚任务下发给ElasticSearch集群。

Description

面向全文检索的分级存储方法及装置
技术领域
本发明涉及大数据处理NOSQL领域,尤其涉及一种面向全文检索的分级存储方法及装置。
背景技术
随着互联网技术的不断发展和信息化程度的不断提高,数据量迅速增长,支持海量数据存储及应用也随之蓬勃发展。其中,在面向文档检索的领域,开源项目Elasticsearch获得了广泛的关注与应用。Elasticsearch是一个开源的高扩展的分布式全文检索引擎,它可以近乎实时的存储、检索数据;本身扩展性很好,可以扩展到上百台服务器,处理PB级别的数据。在互联网,企业应用中,倒排检索应用范围非常广,如日志监控,网页搜索,热点搜索,实体特征标签检索,这些需求对应到全文检索引擎ElasticSearch就是由各类索引提供服务,因硬件性能有限,当数据量级,索引个数较大时,通常产生搜索性能下降的结果。因此,对硬件资源的合理利用是业务需要重点考虑的问题。
在很多业务场景,可能存在类似如下需求:
1)近期数据检索频率较高,旧数据检索频率低;
2)A类业务数据检索频率高,B类业务检索频率低;
对于类似的需求,一般可以采取的措施如数据双写,近期数据写入单独集群,定期迁移到旧数据集群;或者将业务拆分成多个集群,对性能要求高的业务使用更多的资源,更高速的资源;以此达到更快的检索速度。由此带来了新的问题如资源利用率低,资源浪费,需要额外的人工维护,使用不便等。
发明内容
本发明实施例提供一种面向全文检索的分级存储方法及装置,用以解决现有技术中的上述问题。
本发明实施例提供一种面向全文检索的分级存储方法,包括:
获取用户按照规定的语法输入创建或者修改全文检索相关的SQL语句,创建全文检索表,所述全文检索表中包含有分级存储策略的元数据,并将所述全文检索表持久化到Zookeeper中;
配置ElasticSearch集群中一部分节点使用SSD盘,另一部分节点使用SATA盘,并在每个节点上安装自定义的ElasticSearch插件;
数据加载工具通过ElasticSearch集群的调用接口API将文档数据加载到ElasticSearch集群中,通过所述ElasticSearch插件对请求进行过滤,并使用预先存储的全文检索表中的元数据进行索引创建;
通过所述ElasticSearch插件运行监听策略,监听Zookeeper中表的元数据信息的变化,并应用分级存储策略,执行定时回滚策略,将回滚任务下发给ElasticSearch集群。
优选地,获取用户按照规定的语法输入创建或者修改全文检索相关的SQL语句,创建全文检索表,所述全文检索表中包含有分级存储策略的元数据,并将所述全文检索表持久化到Zookeeper中具体包括:
在SQL CLI中设置或者修改分级存储策略,并将分级存储策略的元数据持久化到Zookeeper中。
优选地,数据加载工具通过ElasticSearch集群的调用接口API将文档数据加载到ElasticSearch集群中,通过所述ElasticSearch插件对请求进行过滤,并使用全文检索表中的元数据来进行索引创建具体包括:
步骤1,通过所述ElasticSearch插件拦截加载程序的请求,对于入数据不做任何处理,拦截创建索引的请求;
步骤2,通过所述ElasticSearch插件对是否创建索引的请求进行判断,如果判断为是,执行步骤3,否则,不创建索引;
步骤3,通过所述ElasticSearch插件启动对元数据进行监听的服务;
步骤4,通过所述ElasticSearch插件判断创建该索引所对应的表是否有分级存储策略;如果创建该索引所对应的表有分级存储策略,那么在创建索引的请求中加上指定的标签,继续执行请求过程;如果没有,则确定新索引不存在分级存储策略。
优选地,通过所述ElasticSearch插件执行定时回滚策略,将回滚任务下发给ElasticSearch集群具体包括:
步骤1,通过所述ElasticSearch插件启动服务,对Zookeeper进行元数据的监听;
步骤2,通过所述服务获取Zookeeper中的表,遍历各个表,读取分级存储策略;
步骤3,在获取的数据表列表中选择一张表,判断该表是否是周期型存储表,如果判断为是,则确定该表是周期型存储表,获取该表的各个日期的分区索引,判断是否满足分级策略,对不符合分级策略的日期分区进行迁移,遍历完成后,服务进入睡眠时间,等待下一次执行。
优选地,所述方法进一步包括:
将索引的标签设置为数个机架,将索引分配到相应的数个机架中。
本发明实施例还提供一种面向全文检索的分级存储装置,包括:
SQL CLI模块,用于为用户提供检索SQL语句和创建全文检索表;
数据库,用于存放全文检索表的元数据,其中,所述元数据包括分级存储策略;
数据加载模块,用于通过使用ElasticSearch API进行文档数据加载;
定制Elasticsearch集群,用于进行全文数据存储和检索,其中,所述定制的Elasticsearch集群整体上有SSD和SATA两种资源,少数节点直接使用SSD资源,SSD资源用于存储近期的或者检索频率高的数据,所有节点安装有自定义的ElasticSearch插件,通过该ElasticSearch插件进行监听策略、拦截建索引、应用策略、定时回滚。
优选地,SQL CLI模块具体用于:
设置或者修改分级存储策略,并将分级存储策略的元数据持久化到Zookeeper中。
优选地,所述ElasticSearch插件具体用于:
拦截加载程序的请求,对于入数据不做任何处理,拦截创建索引的请求;
对是否创建索引的请求进行判断,如果判断为是,启动对元数据进行监听的服务,否则,不创建索引;
判断创建该索引所对应的表是否有分级存储策略;如果创建该索引所对应的表有分级存储策略,那么在创建索引的请求中加上指定的标签,继续执行请求过程;如果没有,则确定新索引不存在分级存储策略。
优选地,所述ElasticSearch插件具体用于:
启动服务,对Zookeeper进行元数据的监听;
通过所述服务获取Zookeeper中的表,遍历各个表,读取分级存储策略;
在获取的数据表列表中选择一张表,判断该表是否是周期型存储表,如果判断为是,则确定该表是周期型存储表,获取该表的各个日期的分区索引,判断是否满足分级策略,对不符合分级策略的日期分区进行迁移,遍历完成后,服务进入睡眠时间,等待下一次执行。
优选地,所述ElasticSearch插件进一步用于:
将索引的标签设置为数个机架,将索引分配到相应的数个机架中。
采用本发明实施例,可以有效的对ElasticSearch全文检索集群进行索引存储的管理与分级存储控制,达到优化检索性能,提升综合查询速度的效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1是本发明实施例中ElasticSearch分级存储实现框架示意图;
图2是本发明实施例中分级策略元数据的设置和监听流程图;
图3是本发明实施例中创建索引时分级策略的作用流程图;
图4是本发明实施例中周期型的分级策略定时自动回滚流程图。
具体实施方式
本发明实施例提供一种针对全文检索场景的磁盘分级存储的方法与具体实现。包括分级存储策略的格式定义与元数据存储,加载引擎的自动计算分区与按分级策略映射的方法,分级存储的控制实现方法。所谓分级存储是指同一集群中对不同数据使用不同性能的存储资源如SATA磁盘,SSD磁盘。对于一个大集群,我们可以根据不同数据的检索频率和性能需求制定存储策略,放到不同的磁盘存储,同时实现了自动管理,自动迁移,使集群资源得到合理的利用,具有广泛的应用场景。随着信息化水平的不断提高,大数据应用越来越广泛。分布式全文检索引擎ElasticSearch在很多搜索场景存在广泛使用,其处理效率直接影响了业务应用与用户体验。本发明的目的就是提供一种面向ElasticSearch全文检索的分级存储方法与实现,对用户提供透明简单的使用方式,能自动化控制索引的存储策略与管理,提升elasticsearch集群的综合检索性能。使用本方法可以有效的对ElasticSearch全文检索集群进行索引存储的管理与分级存储控制,达到优化检索性能,提升综合查询速度的效果。
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明核心点是存在不同性能的存储资源(如SSD,SATA磁盘)的ElasticSearch集群中,为不同的索引制定自动化的分级存储管理策略。
为实现上述目的,本发明的第一部分,首先给出了总体框架图,对涉及的主要组件一一说明。图1给出了分级存储实现框架的示意图。该架构的组件依次为:为用户提供检索SQL语句和创建全文检索表的用户SQL CLI、存放全文检索表元数据(包含分级存储策略等)的库、通过使用ElasticSearch API进行文档数据加载的工具、用于进行全文数据存储和检索的定制Elasticsearch集群。定制的Elasticsearch集群整体上有SSD和SATA两种资源,少数节点直接使用SSD资源,用于存储近期的或者检索频率高的数据,同时所有节点都安装了开发的自定义的ElasticSearch插件。该自定义插件包括了监听策略、拦截建索引、应用策略、定时回滚等基本功能。通过上述的组件实现了ElasticSearch的索引的自动化存储与分级管理。
在这一实现实例中,具体架构如下:
用户按照规定的语法输入创建或者修改全文检索相关的SQL语句,其中包含了分级存储策略的元数据信息,如果SQL语句正确,结果将会持久化到数据库中。在ElasticSearch集群中部分节点使用SSD盘,部分使用SATA盘,每个节点都安装有自定义的ElasticSearch插件。数据加载工具使用ElasticSearch API将文档数据加载到集群中,该加载工具会使用全文检索表中的元数据来进行索引创建,请求会被插件过滤。该插件会运行监听策略,监听Zookeeper中表的元数据的变化,并应用策略。同时能执行定时回滚策略,将回滚任务下发给集群。
本发明的第二部分,给出了分级策略元数据的设置和监听流程。该部分需要使用规定的全文检索的语法,定义表的元数据,其中包含了分级存储管理策略。如果语法正确,该表将会被持久化,用于后续的分级存储策略的执行。
图2给出了分级策略元数据的设置与监听流程。
在这一实现实例中,具体步骤如下:
步骤201:在SQL CLI中设置或者修改分级策略。
步骤202:将涉及到分级策略的元数据持久化到Zookeeper中。
步骤203:Elasticsearch节点上的自定义插件会监听Zookeeper,获取分级策略。
本发明的第三部分,给出了创建索引时分级策略的作用。分级策略实际上是使用标签功能进行分级存储。集群中不同的资源可以使用不同的划分,适应不同的业务场景,以达到高效使用资源的目的,例如可以根据机架、磁盘类型、机器性能、内存大小等来进行划分。创建索引时将索引分配到指定的资源上便于后续进行自动化管理,保证该索引能正常加载数据,检索期间能使用到最优的资源。这个部分是比较重要的,是元数据在实际数据之上的体现,热数据将会存储在这些索引中,以适应不同的业务场景。
图3给出了创建索引时分级策略的作用流程。
在这一实现实例中,具体步骤如下:
步骤301:加载程序的请求被插件拦截到,对于入数据则不做任何处理,拦截创建索引的请求。
步骤302:插件内部对创建索引的请求进行判断
步骤303:插件内部启动对元数据进行监听的服务
步骤304:判断创建该索引所对应的表是否有分级存储策略
步骤305:如果创建该索引所对应的表有分级存储策略,那么在创建索引的请求中加上指定的标签
步骤306:步骤302判断为否,即不创建索引,步骤304判断为否,即新索引不存在分级存储策略,或者步骤305完成,即对指定索引添加完标签后,继续执行请求过程。
本发明的第四部分,给出了周期型的分级策略定时自动回滚流程。例如对于某业务,大部分查询都只会使用最近7天的数据,那么这7天的数据就可以使用SSD盘节点存储,7天之前的数据就会存入SATA盘节点。每过一天,就会有数据过期,系统会定时地将过期数据移动到SATA盘节点存储,这就是周期型的定时自动回滚。部分会定时地扫描各个表,读取其中的元数据。对于其中属于周期型的存储表,会获取属于该表的所有索引,对于这些索引来说,如果不满足该表的分级策略,那么就会将该数据归纳为冷数据,存放到分级策略中规定该存放冷数据的地方,通常这些地方的磁盘性能会略低。这样能够保证较旧或者查询频率低的数据使用性能较低的资源,将性能高的资源提供给热数据使用。这个部分是非常重要的,通过定期执行存储策略来将某些数据转储,合理地利用了集群的资源。同时,不同的业务也可以分配不同的存储资源,便于管理。
图4给出了周期型的分级策略定时自动回滚流程。
在这一实现实例中,具体步骤如下:
步骤401:插件启动服务,对Zookeeper进行元数据的监听。
步骤402:服务获取表,遍历各个表,读取分级存储策略。
步骤403:在获取的数据表列表中选择一张表,判断该表是否是周期型存储表。
步骤404:若403判断为是,即该表是周期型存储表,获取该表的各个日期的分区索引,判断是否满足分级策略。
步骤405:对不符合分级策略的日期分区进行迁移
步骤406:遍历完成后,服务进入睡眠时间,等待下一次执行。
本发明的第五部分,给出了使用标签进行分级存储管理的基本原理介绍。标签实际上是不同资源的划分方式。例如,同一个集群里面,可能有不同的机器属于不同的机架,在海量数据的检索中,IO是一个不可忽视的瓶颈,通常跨机架访问会影响查询性能。所以将一个机架内的所有节点都统一划分成一个标签就很有必要了。这样,我们能将索引的标签设置为数个机架,这样,这些索引将会被分配到这数个机架中,减少检索时的网络开销。
综上所述,本发明实施例提出了一种自动化进行索引分级管理实现方案,该方案能够合理地利用集群的计算资源和IO资源等,优化资源分配;实现冷热数据分离,便于数据的管理;自动化进行索引管理,能够适应不同的业务场景,有效提高了索引管理效率,具有很强的实用性。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种面向全文检索的分级存储方法,其特征在于,包括:
获取用户按照规定的语法输入创建或者修改全文检索相关的SQL语句,创建全文检索表,所述全文检索表中包含有分级存储策略的元数据,并将所述全文检索表持久化到Zookeeper中;
配置ElasticSearch集群中一部分节点使用SSD盘,另一部分节点使用SATA盘,并在每个节点上安装自定义的ElasticSearch插件;
数据加载工具通过ElasticSearch集群的调用接口API将文档数据加载到ElasticSearch集群中,通过所述ElasticSearch插件对请求进行过滤,并使用预先存储的全文检索表中的元数据进行索引创建;
通过所述ElasticSearch插件运行监听策略,监听Zookeeper中表的元数据信息的变化,并应用分级存储策略,执行定时回滚策略,将回滚任务下发给ElasticSearch集群。
2.如权利要求1所述的方法,其特征在于,获取用户按照规定的语法输入创建或者修改全文检索相关的SQL语句,创建全文检索表,所述全文检索表中包含有分级存储策略的元数据,并将所述全文检索表持久化到Zookeeper中具体包括:
在SQL CLI中设置或者修改分级存储策略,并将分级存储策略的元数据持久化到Zookeeper中。
3.如权利要求1所述的方法,其特征在于,数据加载工具通过ElasticSearch集群的调用接口API将文档数据加载到ElasticSearch集群中,通过所述ElasticSearch插件对请求进行过滤,并使用全文检索表中的元数据来进行索引创建具体包括:
步骤1,通过所述ElasticSearch插件拦截加载程序的请求,对于入数据不做任何处理,拦截创建索引的请求;
步骤2,通过所述ElasticSearch插件对是否创建索引的请求进行判断,如果判断为是,执行步骤3,否则,不创建索引;
步骤3,通过所述ElasticSearch插件启动对元数据进行监听的服务;
步骤4,通过所述ElasticSearch插件判断创建该索引所对应的表是否有分级存储策略;如果创建该索引所对应的表有分级存储策略,那么在创建索引的请求中加上指定的标签,继续执行请求过程;如果没有,则确定新索引不存在分级存储策略。
4.如权利要求1所述的方法,其特征在于,通过所述ElasticSearch插件执行定时回滚策略,将回滚任务下发给ElasticSearch集群具体包括:
步骤1,通过所述ElasticSearch插件启动服务,对Zookeeper进行元数据的监听;
步骤2,通过所述服务获取Zookeeper中的表,遍历各个表,读取分级存储策略;
步骤3,在获取的数据表列表中选择一张表,判断该表是否是周期型存储表,如果判断为是,则确定该表是周期型存储表,获取该表的各个日期的分区索引,判断是否满足分级策略,对不符合分级策略的日期分区进行迁移,遍历完成后,服务进入睡眠时间,等待下一次执行。
5.如权利要求3所述的方法,其特征在于,所述方法进一步包括:
将索引的标签设置为数个机架,将索引分配到相应的数个机架中。
6.一种面向全文检索的分级存储装置,其特征在于,包括:
SQL CLI模块,用于为用户提供检索SQL语句和创建全文检索表;
数据库,用于存放全文检索表的元数据,其中,所述元数据包括分级存储策略;
数据加载模块,用于通过使用ElasticSearch API进行文档数据加载;
定制Elasticsearch集群,用于进行全文数据存储和检索,其中,所述定制的Elasticsearch集群整体上有SSD和SATA两种资源,少数节点直接使用SSD资源,SSD资源用于存储近期的或者检索频率高的数据,所有节点安装有自定义的ElasticSearch插件,通过该ElasticSearch插件进行监听策略、拦截建索引、应用策略、定时回滚。
7.如权利要求6所述的装置,其特征在于,SQL CLI模块具体用于:
设置或者修改分级存储策略,并将分级存储策略的元数据持久化到Zookeeper中。
8.如权利要求6所述的装置,其特征在于,所述ElasticSearch插件具体用于:
拦截加载程序的请求,对于入数据不做任何处理,拦截创建索引的请求;
对是否创建索引的请求进行判断,如果判断为是,启动对元数据进行监听的服务,否则,不创建索引;
判断创建该索引所对应的表是否有分级存储策略;如果创建该索引所对应的表有分级存储策略,那么在创建索引的请求中加上指定的标签,继续执行请求过程;如果没有,则确定新索引不存在分级存储策略。
9.如权利要求6所述的装置,其特征在于,所述ElasticSearch插件具体用于:
启动服务,对Zookeeper进行元数据的监听;
通过所述服务获取Zookeeper中的表,遍历各个表,读取分级存储策略;
在获取的数据表列表中选择一张表,判断该表是否是周期型存储表,如果判断为是,则确定该表是周期型存储表,获取该表的各个日期的分区索引,判断是否满足分级策略,对不符合分级策略的日期分区进行迁移,遍历完成后,服务进入睡眠时间,等待下一次执行。
10.如权利要求8所述的装置,其特征在于,所述ElasticSearch插件进一步用于:
将索引的标签设置为数个机架,将索引分配到相应的数个机架中。
CN201910119254.8A 2019-02-18 2019-02-18 面向全文检索的分级存储方法及装置 Expired - Fee Related CN109885642B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910119254.8A CN109885642B (zh) 2019-02-18 2019-02-18 面向全文检索的分级存储方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910119254.8A CN109885642B (zh) 2019-02-18 2019-02-18 面向全文检索的分级存储方法及装置

Publications (2)

Publication Number Publication Date
CN109885642A true CN109885642A (zh) 2019-06-14
CN109885642B CN109885642B (zh) 2021-11-02

Family

ID=66928183

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910119254.8A Expired - Fee Related CN109885642B (zh) 2019-02-18 2019-02-18 面向全文检索的分级存储方法及装置

Country Status (1)

Country Link
CN (1) CN109885642B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046130A (zh) * 2019-11-08 2020-04-21 杭州安恒信息技术股份有限公司 结合ElasticSearch和FSM的关联检索方法
CN113835616A (zh) * 2020-06-23 2021-12-24 华为技术有限公司 应用的数据管理方法、系统和计算机设备
CN115495634A (zh) * 2022-11-17 2022-12-20 北京滴普科技有限公司 一种基于Elasticsearch插件的变化数据捕获方法及系统
CN115934794A (zh) * 2022-11-30 2023-04-07 二十一世纪空间技术应用股份有限公司 一种海量多源异构遥感空间数据查询的弹性管理方法

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105991478A (zh) * 2015-02-05 2016-10-05 阿里巴巴集团控股有限公司 服务器资源分配方法及其系统
CN106649882A (zh) * 2017-01-10 2017-05-10 浪潮通信信息系统有限公司 一种应用于电信领域的空间数据管理中间件及其实现方法
US20170251003A1 (en) * 2016-02-29 2017-08-31 Palo Alto Networks, Inc. Automatically determining whether malware samples are similar
CN107169083A (zh) * 2017-05-11 2017-09-15 聚龙融创科技有限公司 公安卡口海量车辆数据存储与检索方法及装置、电子设备
EP3327991A1 (en) * 2016-11-29 2018-05-30 Alcatel Lucent Storage of coverage-related information of a telecommunication network
CN108197296A (zh) * 2018-01-23 2018-06-22 马上消费金融股份有限公司 基于Elasticsearch索引的数据存储方法
CN108363553A (zh) * 2018-01-31 2018-08-03 北京兰云科技有限公司 一种数据处理方法、装置及系统
CN108509437A (zh) * 2017-02-24 2018-09-07 南京烽火星空通信发展有限公司 一种ElasticSearch查询加速方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105991478A (zh) * 2015-02-05 2016-10-05 阿里巴巴集团控股有限公司 服务器资源分配方法及其系统
US20170251003A1 (en) * 2016-02-29 2017-08-31 Palo Alto Networks, Inc. Automatically determining whether malware samples are similar
EP3327991A1 (en) * 2016-11-29 2018-05-30 Alcatel Lucent Storage of coverage-related information of a telecommunication network
CN106649882A (zh) * 2017-01-10 2017-05-10 浪潮通信信息系统有限公司 一种应用于电信领域的空间数据管理中间件及其实现方法
CN108509437A (zh) * 2017-02-24 2018-09-07 南京烽火星空通信发展有限公司 一种ElasticSearch查询加速方法
CN107169083A (zh) * 2017-05-11 2017-09-15 聚龙融创科技有限公司 公安卡口海量车辆数据存储与检索方法及装置、电子设备
CN108197296A (zh) * 2018-01-23 2018-06-22 马上消费金融股份有限公司 基于Elasticsearch索引的数据存储方法
CN108363553A (zh) * 2018-01-31 2018-08-03 北京兰云科技有限公司 一种数据处理方法、装置及系统

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111046130A (zh) * 2019-11-08 2020-04-21 杭州安恒信息技术股份有限公司 结合ElasticSearch和FSM的关联检索方法
CN111046130B (zh) * 2019-11-08 2023-05-23 杭州安恒信息技术股份有限公司 结合ElasticSearch和FSM的关联检索方法
CN113835616A (zh) * 2020-06-23 2021-12-24 华为技术有限公司 应用的数据管理方法、系统和计算机设备
CN115495634A (zh) * 2022-11-17 2022-12-20 北京滴普科技有限公司 一种基于Elasticsearch插件的变化数据捕获方法及系统
CN115934794A (zh) * 2022-11-30 2023-04-07 二十一世纪空间技术应用股份有限公司 一种海量多源异构遥感空间数据查询的弹性管理方法

Also Published As

Publication number Publication date
CN109885642B (zh) 2021-11-02

Similar Documents

Publication Publication Date Title
US10248671B2 (en) Dynamic migration script management
US20220405284A1 (en) Geo-scale analytics with bandwidth and regulatory constraints
US11163746B2 (en) Reclustering of database tables based on peaks and widths
Marcu et al. Spark versus flink: Understanding performance in big data analytics frameworks
CN109885642A (zh) 面向全文检索的分级存储方法及装置
US8543596B1 (en) Assigning blocks of a file of a distributed file system to processing units of a parallel database management system
CN109815219A (zh) 支持多数据库引擎的数据生命周期管理的实现方法
US10169446B1 (en) Relational modeler and renderer for non-relational data
CN105069134A (zh) 一种Oracle统计信息自动收集方法
US20130047161A1 (en) Selecting processing techniques for a data flow task
CN104133772A (zh) 一种自动生成测试数据的方法
US20070250517A1 (en) Method and Apparatus for Autonomically Maintaining Latent Auxiliary Database Structures for Use in Executing Database Queries
EP2255276A2 (en) Method and apparatus for enhancing performance of database and environment thereof
CN111324606B (zh) 数据分片的方法及装置
US11308066B1 (en) Optimized database partitioning
US11055193B2 (en) Multi-version query retry in a database environment
EP2662783A1 (en) Data archiving approach leveraging database layer functionality
CN107291938A (zh) 订单查询系统及方法
CN101388790B (zh) 一种导入无线网络性能数据的方法
CN110321388A (zh) 一种基于Greenplum的快速排序查询方法及系统
CN112115115B (zh) 基于数据仓库的文件移动方法、设备和存储介质
CN105183368A (zh) 多种存储介质并存的系统及进行文件操作的方法和装置
CN117495472A (zh) 一种发票数据加工方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20211102

Termination date: 20220218