CN110147353B - 基于日志分析的MongoDB数据迁移监控方法及装置 - Google Patents

基于日志分析的MongoDB数据迁移监控方法及装置 Download PDF

Info

Publication number
CN110147353B
CN110147353B CN201910331821.6A CN201910331821A CN110147353B CN 110147353 B CN110147353 B CN 110147353B CN 201910331821 A CN201910331821 A CN 201910331821A CN 110147353 B CN110147353 B CN 110147353B
Authority
CN
China
Prior art keywords
data
migration
mongodb
information
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910331821.6A
Other languages
English (en)
Other versions
CN110147353A (zh
Inventor
石婧文
须成忠
叶可江
王洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN201910331821.6A priority Critical patent/CN110147353B/zh
Publication of CN110147353A publication Critical patent/CN110147353A/zh
Priority to PCT/CN2019/130542 priority patent/WO2020215799A1/zh
Application granted granted Critical
Publication of CN110147353B publication Critical patent/CN110147353B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1734Details of monitoring file system events, e.g. by the use of hooks, filter drivers, logs
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及电子信息技术领域,具体涉及一种基于日志分析的MongoDB数据迁移监控方法及装置,首先搭建一个MongoDB分片集群;将MongoDB分片集群数据中二次数据迁移的数据量累加和处于预设阈值范围内;获取MongoDB分片集群中历史数据块动态分裂与迁移信息;再以历史数据块发生成功迁移为界,将数据迁移路线分为不同的阶段,并将每个阶段的数据块键值区间按照比例顺序画出。该方法及装置利用了MongoDB配置服务器中的日志数据,观测数据块在不同服务器之间现有分布与过去分布迁移情况,并定义写放大估算公式评估分裂与迁移策略好坏,帮助MongoDB数据库更好地进行预划分和资源分配。与传统的观测方法相比,不受其他因素干扰,使用历史日记数据,结果更加准确。

Description

基于日志分析的MongoDB数据迁移监控方法及装置
技术领域
本发明涉及电子信息技术领域,具体而言,涉及一种基于日志分析的MongoDB数据迁移监控方法及装置。
背景技术
随着海量非结构化数据(传感器采集的空间数据、路网数据)源源不断地产生,分布式Nosql数据库,如MongoDB、Hbase等地位日益提高。MongoDB支持数据在集群中分片(shard)存储与副本集(Replica Set)存储两种存储方式。副本集存储的主要目的是利用主从模式进行自动故障恢复功能,而分片存储是为了将键值区间无重叠地划分给不同服务器存储,提高读写吐量。另外,当服务器存储的数据块不均匀时,Mongodb会启动数据迁移模块进行数据块迁移,保证各台服务器存储数据量大致相同。但由于数据可能存在严重不可预测的数据倾斜,分片和迁移过程可能带来很多冗余开销。
发明内容
本发明实施例提供了一种基于日志分析的MongoDB数据迁移监控方法及装置,以至少解决现有MongoDB数据分片和迁移过程中存在冗余开销的技术问题。
根据本发明的一实施例,提供了一种基于日志分析的MongoDB数据迁移监控方法,包括以下步骤:
搭建一个MongoDB分片集群,MongoDB分片集群包含Shard、Mongos和Configserver3种组件;
将MongoDB分片集群数据中二次数据迁移的数据量累加和处于预设阈值范围内;
获取MongoDB分片集群中历史数据块动态分裂与迁移信息;
以历史数据块发生成功迁移为界,将数据迁移路线分为不同的阶段,并将每个阶段的数据块键值区间按照比例顺序画出。
进一步地,MongoDB数据迁移监控方法还包括:
将每个阶段的数据块键值区间用不同颜色代表不同的服务器填充数据块。
进一步地,MongoDB分片集群数据中二次数据迁移的数据量累加和为transfersize,其计算公式为:
transfer size=∑clonedBytes;
Mongos可获取Config server上的changelog集合数据,transfer size可通过遍历changelog集合数据获取,changelog集合数据以字典形式保存;clonedBytes代表数据量累加字节。
进一步地,MongoDB分片集群数据中二次数据迁移的数据量累加计算中采用两种操作类型:
moveChunks.commit:该日志记录从数据块迁出服务器获取,包含有数据块键值信息、迁出服务器、迁入服务器、从属集合名称、拷贝数据量信息;
moveChunks.from:该日志记录从数据块迁移接收服务器获取,包含有数据块键值信息、迁出服务器、迁入服务器、从属集合名称、是否成功信息。
进一步地,利用Config server上的chunks集合,描绘当前数据块集群中的分布情况,从MongoDB分片集群的Changelog集合数据中获取历史数据块动态分裂与迁移信息。
进一步地,从MongoDB分片集群的Changelog集合数据中获取历史数据块动态分裂与迁移信息过程中采用三种操作类型:
moveChunks.from:该日志记录从数据块迁移接收服务器获取,包含有数据块键值信息、迁出服务器、迁入服务器、从属集合名称、是否成功信息;
shardCollection.start:该日志记录由mongos执行创建,指定了初始数据块MinKey、MaxKey所在shard服务器;
multi-split:该日志记录从执行分裂的shard服务器获取,包含分片前数据块信息、分片后数据块信息、集合名称、数据块所在shard服务器信息。
进一步地,初始数据块的键值区间和所在shard服务器信息从shardCollection.start中获取,之后所有数据块都由已存在数据块分裂而来,从multi-split中获取,数据块迁移信息从moveChunks.from中获取。
根据本发明的另一实施例,提供了一种基于日志分析的MongoDB数据迁移监控装置,包括:
集群搭建单元,用于搭建一个MongoDB分片集群,MongoDB分片集群包含Shard、Mongos和Config server3种组件;
阈值单元,用于将MongoDB分片集群数据中二次数据迁移的数据量累加和处于预设阈值范围内;
信息获取单元,用于获取MongoDB分片集群中历史数据块动态分裂与迁移信息;
键值区间划分单元,用于以历史数据块发生成功迁移为界,将数据迁移路线分为不同的阶段,并将每个阶段的数据块键值区间按照比例顺序画出。
一种存储介质,存储介质存储有能够实现上述任意一项基于日志分析的MongoDB数据迁移监控方法的程序文件。
一种处理器,处理器用于运行程序,其中,程序运行时执行上述任意一项的基于日志分析的MongoDB数据迁移监控方法。
本发明实施例中的基于日志分析的MongoDB数据迁移监控方法及装置,利用了MongoDB配置服务器中的日志数据,观测数据块在不同服务器之间现有分布与过去分布迁移情况,并定义写放大估算公式评估分裂与迁移策略好坏,帮助MongoDB数据库更好地进行预划分和资源分配。与传统的观测方法相比,不受其他因素干扰,使用历史日记数据,结果更加准确。结果直观,通过公式指标或可视化评估呈现分片数据库性能,并能直观体现衡量观察数据迁移策略、分裂机制、键值设计是否合理。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明基于日志分析的MongoDB数据迁移监控方法的流程图;
图2为本发明基于日志分析的MongoDB数据迁移监控方法的优选流程图;
图3为本发明基于日志分析的MongoDB数据迁移监控方法中数据块分裂与迁移过程示意图;
图4为本发明基于日志分析的MongoDB数据迁移监控装置的模块图;
图5为本发明基于日志分析的MongoDB数据迁移监控装置的优选模块图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
现有工具或方法虽然实时性好,能够通过测量网络或者磁盘I/O,绘制出长期跟踪曲线,但是难以体现资源消耗与上层机制(如迁移策略)的关系。测量结果易受到各种干扰,如I/O的观察往往混合了数据库其他I/O影响或者其他应用的I/O干扰,并且难以从一个混合指标中分解出实际需要的资源消耗。这不利于找到性能问题存在、评估上层策略、改进数据库机制等。本发明提出了一种从日志文件准确提取数据块迁移信息的方案,可用来衡量数据迁移策略、分裂机制、键值设计是否合理。
分布式数据库比起单机数据库引入了很多的新问题,如数据在服务器之间的分发与迁移问题,这些新过程带来的开销和影响往往被人们忽视,可视化与量化公式可以帮助数据库管理员更好地判断预划分效果。但数据块的分裂与迁移是一个持续进行的长期过程,中间伴有数据块动态分裂,迁移过程中部分数据可能发生多次冗余网络传输,以上各种因素增加了观测复杂性,现有技术中还没有具体方法将迁移分裂过程中的写放大和冗余网络传输直观观测与量化。为此,我们针对分布式MongoDB数据库集群提出了新的监控分析方法。
其中MongoDB分片集群由Shard、Mongos和Config server3种组件构成:
(1)Mongos负责提供集群访问接口,保证集群一致性,并将用户请求正确路由到对应的Shard。同时,Mongos提供了用户命令行工具mongos shell,通过mongos shell我们可以获取数据库与数据集合少量统计信息。数据库中的部分数据来源于shell命令。
(2)Shard负责存储数据,数据以chunk形式在Shard集群中进行存储和迁移。
(3)Config server保存Shard集群所有元数据,Mongos连接Config server获取元数据信息。其中元数据信息包含日志集changelog和chunks集合,changelog集合存储了数据库变动情况,chunks集合存储了当前所有数据块信息。
以往的数据库监控方案与工具大多直接测量资源利用情况,如:MongoDB自带的监控工具mongostat可以显示执行操作花费时间、cache命中情况;MongoDB官网提供的网页监控工具MMS(MongoDB Monitoring Service)可以检测硬件事件。针对MongoDB等nosql数据库性能改进的现有技术大多以插入、查询时间代价和存储代价为指标,没有进一步的数据迁移分析。
本发明的技术方案可以衡量当前数据库迁移和配置是否合理,并可在分片集群中可视化观测历史键值区间分布、数据块分裂、数据块在不同服务器之间的迁移。
实施例1
根据本发明一实施例,提供了一种基于日志分析的MongoDB数据迁移监控方法,参见图1,包括以下步骤:
S101:搭建一个MongoDB分片集群,MongoDB分片集群包含Shard、Mongos和Configserver3种组件;
S102:将MongoDB分片集群数据中二次数据迁移的数据量累加和处于预设阈值范围内,即数据量累加和越小越好;
S103:获取MongoDB分片集群中历史数据块动态分裂与迁移信息;
S104:以历史数据块发生成功迁移为界,将数据迁移路线分为不同的阶段,并将每个阶段的数据块键值区间按照比例顺序画出。
本发明的基于日志分析的MongoDB数据迁移监控方法,利用了MongoDB配置服务器中的日志数据,观测数据块在不同服务器之间现有分布与过去分布迁移情况,并定义写放大估算公式评估分裂与迁移策略好坏,帮助MongoDB数据库更好地进行预划分和资源分配。与传统的观测方法相比,不受其他因素干扰,使用历史日记数据,结果更加准确。结果直观,通过公式指标或可视化评估呈现分片数据库性能,并能直观体现衡量观察数据迁移策略、分裂机制、键值设计是否合理。
作为优选的技术方案中,参见图2,该MongoDB数据迁移监控方法方法还包括:
S105:将每个阶段的数据块键值区间用不同颜色代表不同的服务器填充数据块,可视化了整个数据集合数据块的分裂、迁移过程。
下面以具体实施例,对本方法进行详细说明,本发明一种基于日志分析的MongoDB数据迁移监控方法中:
首先,搭建一个MongoDB分片集群,包含Shard、Mongos和Config server3种组件,创建分片集合,并向分片集合中进行数据处理。
平衡开销计算方法:用transfer size代表数据在平衡组件指导下进行二次数据迁移的数据量累加和。在使数据块在分片集群中达到尽可能均匀分布同时,数据迁移的网络传输资源开销越小越好。定义如下公式:
transfer size=∑clonedBytes;
transfer size可通过遍历changelog集合获取,Mongos可以获取Config server上的changelog数据,clonedeBytes代表数据量累加字节。该数据以字典形式保存:
{"_id":"silverdew-2018-10-06T20:42:02.820+0800-5bb8ad9a11fa6074beda8f4b","server":"silverdew","clientAddr":"127.0.0.1:33058","time":ISODate("2018-10-06T12:42:02.820Z"),"what":"moveChunk.commit","ns":"two_zero_one_seven.Jan_sh_hil_fourlogic","details":{"min":{"key":{"$minKey":1}},"max":{"key":"03100002001021021033022023100231"},"from":"shard0000","to":"shard0001","counts":{"cloned":NumberLong(1),"clonedBytes":NumberLong(310),"catchup":NumberLong(0),"steady":NumberLong(0)}}}。
“what”属性代表操作类型,写放大比例计算过程中主要用到两种操作类型:
“moveChunks.commit”:该日志记录从数据块迁出服务器获取,包含有数据块键值信息、迁出服务器、迁入服务器、从属集合名称、拷贝数据量等信息。
“moveChunks.from”:该日志记录从数据块迁移接收服务器获取,包含有数据块键值信息、迁出服务器、迁入服务器、从属集合名称、是否成功等信息。在该种操作类型中,transfer size为历史记录中经过moveChunks.from确认迁移成功的拷贝数据量累加和。
历史数据块分裂迁移可视化方法:利用Config server上的chunks集合,描绘当前数据块集群中的分布情况,从Changelog获取历史数据块动态分裂与迁移情况。
可视化过程中主要的“what”操作类型有:
“moveChunks.from”:该日志记录从数据块迁移接收服务器获取,包含有数据块键值信息、迁出服务器、迁入服务器、从属集合名称、是否成功等信息。在该种操作类型中,transfer size为历史记录中经过moveChunks.from确认迁移成功的拷贝数据量累加和。
"shardCollection.start":该日志记录由mongos执行创建,指定了初始数据块【MinKey,MaxKey】所在shard服务器。
"multi-split":该日志记录从执行分裂的shard服务器获取,包含分片前数据块信息、分片后数据块信息、集合名称、数据块所在shard服务器等信息。
以数据块发生成功迁移为界,将数据迁移路线分为不同的阶段,并将每个阶段的数据块键值区间按照比例顺序画出,用不同颜色代表不同的shard服务器填充数据块,可视化了整个数据集合数据块的分裂、迁移过程。其中初始数据块的键值区间和所在shard服务器信息从"shardCollection.start"中获取,之后所有数据块都由已存在数据块分裂而来,因此都从"multi-split"中获取,数据块迁移信息从“moveChunks.from”中获取。
参见图3,图3中不同数据块之间有间隔,数据块长度与负责存储的键值区间成正比,绿色、紫色、蓝色分别代表数据块所在不同的服务器(shard000为蓝色、shard001为绿色、shard002为紫色)。除了stage0到stage1是由数据块第一次分裂造成,之后新的stage都是由数据迁移导致。
实施例2
根据本发明另一实施例,提供了一种基于日志分析的MongoDB数据迁移监控装置,参见图4,包括:
集群搭建单元201,用于搭建一个MongoDB分片集群,MongoDB分片集群包含Shard、Mongos和Config server3种组件;
阈值单元202,用于将MongoDB分片集群数据中二次数据迁移的数据量累加和处于预设阈值范围内;
信息获取单元203,用于获取MongoDB分片集群中历史数据块动态分裂与迁移信息;
键值区间划分单元204,用于以历史数据块发生成功迁移为界,将数据迁移路线分为不同的阶段,并将每个阶段的数据块键值区间按照比例顺序画出。
本发明实施例中的基于日志分析的MongoDB数据迁移监控装置,利用了MongoDB配置服务器中的日志数据,观测数据块在不同服务器之间现有分布与过去分布迁移情况,并定义写放大估算公式评估分裂与迁移策略好坏,帮助MongoDB数据库更好地进行预划分和资源分配。与传统的观测方法相比,不受其他因素干扰,使用历史日记数据,结果更加准确。结果直观,通过公式指标或可视化评估呈现分片数据库性能,并能直观体现衡量观察数据迁移策略、分裂机制、键值设计是否合理。
作为优选的技术方案中,参见图5,该装置还包括:
颜色填充单元205,用于将每个阶段的数据块键值区间用不同颜色代表不同的服务器填充数据块,可视化了整个数据集合数据块的分裂、迁移过程。
实施例3
一种存储介质,存储介质存储有能够实现上述任意一项基于日志分析的MongoDB数据迁移监控方法的程序文件。
实施例4
一种处理器,处理器用于运行程序,其中,程序运行时执行上述任意一项的基于日志分析的MongoDB数据迁移监控方法。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的系统实施例仅仅是示意性的,例如单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (8)

1.一种基于日志分析的MongoDB数据迁移监控方法,其特征在于,包括以下步骤:
搭建一个MongoDB分片集群,所述MongoDB分片集群包含Shard、Mongos和Configserver3种组件;
将所述MongoDB分片集群数据中二次数据迁移的数据量累加和处于预设阈值范围内;
获取所述MongoDB分片集群中历史数据块动态分裂与迁移信息;
以历史数据块发生成功迁移为界,将数据迁移路线分为不同的阶段,并将每个阶段的数据块键值区间按照比例顺序画出;
将每个阶段的数据块键值区间用不同颜色代表不同的服务器填充数据块,其中,不同数据块之间有间隔,数据块长度与负责存储的键值区间成正比;
所述MongoDB分片集群数据中二次数据迁移的数据量累加计算中采用两种操作类型:
moveChunks.commit:该日志记录从数据块迁出服务器获取,包含有数据块键值信息、迁出服务器、迁入服务器、从属集合名称、拷贝数据量信息;
moveChunks.from:该日志记录从数据块迁移接收服务器获取,包含有数据块键值信息、迁出服务器、迁入服务器、从属集合名称、是否成功信息。
2.根据权利要求1所述的MongoDB数据迁移监控方法,其特征在于,所述MongoDB分片集群数据中二次数据迁移的数据量累加和为transfer size,其计算公式为:
transfer size=∑clonedBytes
Mongos获取Config server上的changelog集合数据,transfer size通过遍历changelog集合数据获取,changelog集合数据以字典形式保存;clonedBytes代表数据量累加字节。
3.根据权利要求1所述的MongoDB数据迁移监控方法,其特征在于,利用Config server上的chunks集合,描绘当前数据块集群中的分布情况,从所述MongoDB分片集群的Changelog集合数据中获取历史数据块动态分裂与迁移信息。
4.根据权利要求3所述的MongoDB数据迁移监控方法,其特征在于,从所述MongoDB分片集群的Changelog集合数据中获取历史数据块动态分裂与迁移信息过程中采用三种操作类型:
moveChunks.from:该日志记录从数据块迁移接收服务器获取,包含有数据块键值信息、迁出服务器、迁入服务器、从属集合名称、是否成功信息;
shardCollection.start:该日志记录由mongos执行创建,指定了初始数据块MinKey、MaxKey所在shard服务器;
multi-split:该日志记录从执行分裂的shard服务器获取,包含分片前数据块信息、分片后数据块信息、集合名称、数据块所在shard服务器信息。
5.根据权利要求4所述的MongoDB数据迁移监控方法,其特征在于,初始数据块的键值区间和所在shard服务器信息从shardCollection.start中获取,之后所有数据块都由已存在数据块分裂而来,从multi-split中获取,数据块迁移信息从moveChunks.from中获取。
6.一种基于日志分析的MongoDB数据迁移监控装置,其特征在于,包括:
集群搭建单元,用于搭建一个MongoDB分片集群,所述MongoDB分片集群包含Shard、Mongos和Config server3种组件;
阈值单元,用于将所述MongoDB分片集群数据中二次数据迁移的数据量累加和处于预设阈值范围内;
信息获取单元,用于获取所述MongoDB分片集群中历史数据块动态分裂与迁移信息;
键值区间划分单元,用于以历史数据块发生成功迁移为界,将数据迁移路线分为不同的阶段,并将每个阶段的数据块键值区间按照比例顺序画出;
将每个阶段的数据块键值区间用不同颜色代表不同的服务器填充数据块,其中,不同数据块之间有间隔,数据块长度与负责存储的键值区间成正比;
所述MongoDB分片集群数据中二次数据迁移的数据量累加计算中采用两种操作类型:
moveChunks.commit:该日志记录从数据块迁出服务器获取,包含有数据块键值信息、迁出服务器、迁入服务器、从属集合名称、拷贝数据量信息;
moveChunks.from:该日志记录从数据块迁移接收服务器获取,包含有数据块键值信息、迁出服务器、迁入服务器、从属集合名称、是否成功信息。
7.一种存储介质,其特征在于,所述存储介质存储有能够实现权利要求1至5中任意一项所述基于日志分析的MongoDB数据迁移监控方法的程序文件。
8.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至5中任意一项所述的基于日志分析的MongoDB数据迁移监控方法。
CN201910331821.6A 2019-04-24 2019-04-24 基于日志分析的MongoDB数据迁移监控方法及装置 Active CN110147353B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910331821.6A CN110147353B (zh) 2019-04-24 2019-04-24 基于日志分析的MongoDB数据迁移监控方法及装置
PCT/CN2019/130542 WO2020215799A1 (zh) 2019-04-24 2019-12-31 基于日志分析的MongoDB数据迁移监控方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910331821.6A CN110147353B (zh) 2019-04-24 2019-04-24 基于日志分析的MongoDB数据迁移监控方法及装置

Publications (2)

Publication Number Publication Date
CN110147353A CN110147353A (zh) 2019-08-20
CN110147353B true CN110147353B (zh) 2022-04-26

Family

ID=67594373

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910331821.6A Active CN110147353B (zh) 2019-04-24 2019-04-24 基于日志分析的MongoDB数据迁移监控方法及装置

Country Status (2)

Country Link
CN (1) CN110147353B (zh)
WO (1) WO2020215799A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147353B (zh) * 2019-04-24 2022-04-26 深圳先进技术研究院 基于日志分析的MongoDB数据迁移监控方法及装置
CN113806046A (zh) * 2021-09-15 2021-12-17 武汉虹信技术服务有限责任公司 一种基于线程池的任务调度系统
CN114202365A (zh) * 2021-12-15 2022-03-18 广东电力信息科技有限公司 一种基于电力行业营销系统实时数据的监控方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102917072A (zh) * 2012-10-31 2013-02-06 北京奇虎科技有限公司 用于数据服务器集群之间进行数据迁移的设备、系统及方法
CN109145121A (zh) * 2018-07-16 2019-01-04 浙江大学 一种时变图数据的快速存储查询方法

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101207510B1 (ko) * 2008-12-18 2012-12-03 한국전자통신연구원 클러스터 데이터 관리시스템 및 클러스터 데이터 관리 시스템에서 공유 재수행 로그를 이용한 데이터 재구축 방법
WO2012103839A2 (zh) * 2012-03-29 2012-08-09 华为技术有限公司 数据块处理方法及系统、前端显示设备和后台处理设备
CN102930062B (zh) * 2012-11-30 2016-04-13 南京富士通南大软件技术有限公司 一种数据库快速水平扩展的方法
CN103259843B (zh) * 2013-03-22 2018-06-05 嘉兴安尚云信软件有限公司 一个智能化PaaS云计算平台系统
CN106126543B (zh) * 2016-06-15 2019-09-03 清华大学 一种关系型数据库到MongoDB的模型转换和数据迁移方法
CN106777225B (zh) * 2016-12-26 2021-04-06 腾讯科技(深圳)有限公司 一种数据的迁移方法和系统
CN108241555B (zh) * 2016-12-26 2022-03-01 阿里巴巴集团控股有限公司 一种分布式数据库的备份、恢复方法、装置和服务器
CN107343021A (zh) * 2017-05-22 2017-11-10 国网安徽省电力公司信息通信分公司 国网云中应用的一种基于大数据的日志管理系统
US11269822B2 (en) * 2017-10-09 2022-03-08 Sap Se Generation of automated data migration model
CN108664580A (zh) * 2018-05-04 2018-10-16 西安邮电大学 一种MongoDB数据库中细粒度的负载均衡方法及系统
CN108959525A (zh) * 2018-06-28 2018-12-07 郑州云海信息技术有限公司 一种冷热数据可视化方法、系统、设备及计算机存储介质
CN109344153B (zh) * 2018-08-22 2023-12-05 中国平安人寿保险股份有限公司 业务数据的处理方法及终端设备
CN110147353B (zh) * 2019-04-24 2022-04-26 深圳先进技术研究院 基于日志分析的MongoDB数据迁移监控方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102917072A (zh) * 2012-10-31 2013-02-06 北京奇虎科技有限公司 用于数据服务器集群之间进行数据迁移的设备、系统及方法
CN109145121A (zh) * 2018-07-16 2019-01-04 浙江大学 一种时变图数据的快速存储查询方法

Also Published As

Publication number Publication date
WO2020215799A1 (zh) 2020-10-29
CN110147353A (zh) 2019-08-20

Similar Documents

Publication Publication Date Title
CN110147353B (zh) 基于日志分析的MongoDB数据迁移监控方法及装置
JP5123641B2 (ja) 性能履歴の管理方法および性能履歴の管理システム
US10452625B2 (en) Data lineage analysis
CN108536761A (zh) 报表数据查询方法及服务器
CN106648446A (zh) 一种用于时序数据的存储方法、装置及电子设备
CN104756106A (zh) 表征数据存储系统中的数据源
US8682850B2 (en) Method of enhancing de-duplication impact by preferential selection of master copy to be retained
US20190303356A1 (en) Database capacity estimation for database sizing
JP6633642B2 (ja) 分散データベースにおけるデータブロックを処理する方法およびデバイス
CN103714004A (zh) Jvm在线内存泄露分析方法及系统
US20170270183A1 (en) Sensor data management apparatus, sensor data management method, and computer program product
WO2021179488A1 (zh) 监控数据存储方法、设备、服务器及存储介质
CN110222920A (zh) 绩效数据存储方法、装置、设备及可读存储介质
CN111159165A (zh) 基于云平台的电力井下低功耗边缘计算系统及其方法
CN116662371A (zh) 一种跨域数据融合方法
CN109947730A (zh) 元数据恢复方法、装置、分布式文件系统及可读存储介质
CN112085535A (zh) 资源计量计费方法、装置、集群及存储介质
WO2015168988A1 (zh) 一种数据索引创建方法、装置及计算机存储介质
JPWO2019168599A5 (zh)
US9275091B2 (en) Database management device and database management method
JP6204753B2 (ja) 分散クエリ処理装置、処理方法及び処理プログラム
US8548980B2 (en) Accelerating queries based on exact knowledge of specific rows satisfying local conditions
CN115374109B (zh) 数据访问方法、装置、计算设备和系统
CN107590160A (zh) 一种监控基数树内部结构的方法及装置
CN113901092B (zh) 一种用于赛场运行监测的文件管理方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant