CN111966656B - 存储文件高负载场景模拟方法、系统、终端及存储介质 - Google Patents
存储文件高负载场景模拟方法、系统、终端及存储介质 Download PDFInfo
- Publication number
- CN111966656B CN111966656B CN202010693926.9A CN202010693926A CN111966656B CN 111966656 B CN111966656 B CN 111966656B CN 202010693926 A CN202010693926 A CN 202010693926A CN 111966656 B CN111966656 B CN 111966656B
- Authority
- CN
- China
- Prior art keywords
- distributed database
- partition
- data
- storage
- distributed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003860 storage Methods 0.000 title claims abstract description 57
- 238000000034 method Methods 0.000 title claims abstract description 35
- 238000012360 testing method Methods 0.000 claims abstract description 29
- 238000012544 monitoring process Methods 0.000 claims abstract description 7
- 238000005192 partition Methods 0.000 claims description 34
- 230000006870 function Effects 0.000 claims description 30
- 238000007726 management method Methods 0.000 claims description 8
- 238000013500 data storage Methods 0.000 claims description 6
- 230000008676 import Effects 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000010076 replication Effects 0.000 claims description 3
- 238000004088 simulation Methods 0.000 claims description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000006467 substitution reaction Methods 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000001680 brushing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/36—Preventing errors by testing or debugging software
- G06F11/3668—Software testing
- G06F11/3672—Test management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/172—Caching, prefetching or hoarding of files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/252—Integrating or interfacing systems involving database management systems between a Database Management System and a front-end application
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Stored Programmes (AREA)
Abstract
本发明提供一种存储文件高负载场景模拟方法、系统、终端及存储介质,包括:通过修改服务端参数关闭存储文件合并功能并增大数据写入效率;通过配置分布式数据库服务端集群的端口和日志路径增加节点上运行的服务对象数量;利用分布式数据库的压测工具将测试数据从客户端并发写入分布式数据库服务端;在将所述测试数据全部写入分布式数据库的服务端之后,删除增设的服务对象,并监控存储文件负载情况。本发明实现了快速准备HBase的RegionServer高hfile负载的情况,大幅减少了准备测试环境的时间,方便快捷地模拟极端环境,有利于迅速发现问题及验证,降低了测试场景复现的成本。
Description
技术领域
本发明涉及分布式存储技术领域,具体涉及一种存储文件高负载场景模拟方法、系统、终端及存储介质。
背景技术
HBase是一个分布式的、面向列的开源数据库。HBase的数据通常存储在HDFS(分布式文件系统)上。HDFS为HBase提供了高可靠性的底层存储支持。HBase的RegionServer服务提供具体的数据查询和插入,管理存储数据的region,对内存需求比较高。因此需要对极端负载情况进行模拟,判断生产上可能发生的问题。例如,将hbase数据目录设置为纠删码格式,regionserver高hfile负载时发生的内存不足宕掉。
然而Hbase现有的入库方式要达到模拟存储文件HFile高负载的场景的目的,需要的时间比较久,不方便进行测试。此外,由于hbase在高负载情况下,运行的现象和低负载下有很多不一致,生产环境积累的负载通常比较高,如果不提高模拟高负载情况的速度,复现问题需要的代价就会比较高。
发明内容
针对现有技术的上述不足,本发明提供一种存储文件高负载场景模拟方法、系统、终端及存储介质,以解决上述技术问题。
第一方面,本发明提供一种存储文件高负载场景模拟方法,包括:
通过修改服务端参数关闭存储文件合并功能并增大数据写入效率;
通过配置分布式数据库服务端集群的端口和日志路径增加节点上运行的服务对象数量;
利用分布式数据库的压测工具将测试数据从客户端并发写入分布式数据库服务端;
在将所述测试数据全部写入分布式数据库的服务端之后,删除增设的服务对象,并监控存储文件负载情况。
进一步的,所述通过修改服务端参数关闭存储文件合并功能并增大数据写入效率,包括:
关闭分布式文件系统服务端对同个列组下的存储文件的合并功能;
关闭分布式文件系统服务端对小存储文件的合并功能;
增大刷写到存储文件的线程数;
降低内存限额,所述内存保存待刷写至存储文件的数据;
增大写缓存比例;
关闭对分布式文件系统的分区的自动分裂功能。
进一步的,通过配置分布式数据库服务端集群的节点端口目录增加节点上运行的服务对象数量,包括:
获取内存可用容量,确认所述可用容量不低于预设标准容量;
在分布式数据库服务端的配置目录中修改数据存储管理服务端口和日志路径。
进一步的,所述方法还包括:
获取分布式数据库的分区数量;
若存储文件数量未达到预设数量阈值,则利用分布式拷贝命令将已经写完的表数据目录复制到临时目录中;
将临时目录批量导入新建表,所述新建表的分区与现有表相同或仅采用一个分区。
第二方面,本发明提供一种存储文件高负载场景模拟系统,包括:
功能设置单元,配置用于通过修改服务端参数关闭存储文件合并功能并增大数据写入效率;
服务扩容单元,配置用于通过配置分布式数据库服务端集群的端口和日志路径增加节点上运行的服务对象数量;
数据写入单元,配置用于利用分布式数据库的压测工具将测试数据从客户端并发写入分布式数据库服务端;
服务缩容单元,配置用于在将所述测试数据全部写入分布式数据库的服务端之后,删除增设的服务对象,并监控存储文件负载情况。
进一步的,所述功能设置单元包括:
第一关闭模块,配置用于关闭分布式文件系统服务端对同个列组下的存储文件的合并功能;
第二关闭模块,配置用于关闭分布式文件系统服务端对小存储文件的合并功能;
线程设置模块,配置用于增大刷写到存储文件的线程数;
内存设置模块,配置用于降低内存限额,所述内存保存待刷写至存储文件的数据;
比例设置模块,配置用于增大写缓存比例;
分裂设置模块,配置用于关闭对分布式文件系统的分区的自动分裂功能。
进一步的,所述服务扩容单元包括:
内存监控模块,配置用于获取内存可用容量,确认所述可用容量不低于预设标准容量;
目录设置模块,配置用于在分布式数据库服务端的配置目录中修改数据存储管理服务端口和日志路径。
进一步的,所述系统还包括:
分区获取单元,配置用于获取分布式数据库的分区数量;
目录复制单元,配置用于若存储文件数量未达到预设数量阈值,则利用分布式拷贝命令将已经写完的表数据目录复制到临时目录中;
存储新建单元,配置用于将临时目录批量导入新建表,所述新建表的分区与现有表相同或仅采用一个分区。
第三方面,提供一种终端,包括:
处理器、存储器,其中,
该存储器用于存储计算机程序,
该处理器用于从存储器中调用并运行该计算机程序,使得终端执行上述的终端的方法。
第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。
本发明的有益效果在于,
本发明提供的存储文件高负载场景模拟方法、系统、终端及存储介质,实现了快速准备HBase的RegionServer高hfile负载的情况,大幅减少了准备测试环境的时间,方便快捷地模拟极端环境,有利于迅速发现问题及验证,降低了测试场景复现的成本。
此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一个实施例的方法的示意性流程图。
图2是本发明一个实施例的方法的示意性流程图。
图3是本发明一个实施例的系统的示意性框图。
图4为本发明实施例提供的一种终端的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
下面对本发明中出现的关键术语进行解释。
RegionServer: HBase集群运行在每个工作节点上的服务,即多实例所指的对象
Region:具体存储数据的结构,HBase 是一个会自动分片的数据库,一个 Region就相当于关系型数据库中分区表的一个分区
MemStore:每个 Store 中有一个 MemStore 实例,数据写入 WAL 之后就会被放入 MemStore。MemStore 是内存的存储对象,只有当 MemStore 满了的时候才会将数据刷写(flush)到 HFile 中
HFile:在 Store 中有多个 HFile,当 MemStore 满了之后 HBase 就会在 HDFS上生成一个新的 HFile,然后把 MemStore 中的内容写到这个 HFile 中。HFile 直接跟分布式文件系统HDFS对接,是数据的存储实体
DistCp:分布式拷贝,是用于大规模集群内部和集群之间拷贝的工具,使用Map/Reduce实现文件分发,错误处理和恢复,以及报告生成。
图1是本发明一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种存储文件高负载场景模拟系统。
如图1所示,该方法100包括:
步骤110,通过修改服务端参数关闭存储文件合并功能并增大数据写入效率;
步骤120,通过配置分布式数据库服务端集群的端口和日志路径增加节点上运行的服务对象数量;
步骤130,利用分布式数据库的压测工具将测试数据从客户端并发写入分布式数据库服务端;
步骤140,在将所述测试数据全部写入分布式数据库的服务端之后,删除增设的服务对象,并监控存储文件负载情况。
具体的,如图2所示,所述存储文件高负载场景模拟方法包括:
S1、通过修改服务端参数关闭存储文件合并功能并增大数据写入效率。
要快速实现目标,需要关闭服务端的大合并,小合并(大合并:指定region的一个列族的所有HFile.合并完成后,这个列族的所有HFile文件合并成一个HFile文件,可以在shell中手动触发,但该动作相当耗资源。小合并是将多个小的HFile文件内容读取出来合并生成一个大的HFile,把新文件设置成激活状态,然后删除小的HFile),调大flush(刷写)线程数,调小memstore大小,调大写缓存比例,关闭自动split:将hbase.hregion.majorcompaction的值设置为0,将 hbase.hstore.blockingStoreFiles的值设置为10000, hbase.hstore.compaction.min的值设置为10000(较新版本的情况),hbase.hstore.compactionThreshold的值设置为10000(较老版本的情况)……使服务端缩减hfile的过程停止,减少io浪费,使服务端刷写hfile的过程从尽量大尽量少的hfile到频繁刷写2M附近的hfile。
S2、服务端扩容缩容,此步骤为本发明的优选实施方式,在本发明的其他实施方式中可不执行该步骤。
扩容-在每个节点都开启regionserver(数据存储管理服务)。如果内存充足,通过修改classpath 里的conf目录中的端口配置和日志地址配置,并使用修改后的配置目录作为启动配置,使单个节点换两个端口和日志,多开几个regionserver实例,充分利用资源;缩容-在写数据入库结束后关闭多开的regionserver,使region即hfile负载集中到剩余的regionserver上。
conf目录的具体修改方法为:
修改端口的是/etc/hbase/conf2hbase-site.xml里 hbase.regionserver.port和hbase.regionserver.info.port
修改日志等文件的是
/etc/hbase/conf2/hbase-env.sh
export HBASE_LOG_DIR=/var/log/hbase2
export HBASE_PID_DIR=/var/run/hbase2
S3、客户端的测试数据快速入库,具体方法为:
使用hbase pe或者其它压测工具(pe为hbase自身携带)随机写多线程进行入库(randomRead 线程数),通过命令行参数调整预分区数量避免写入速度被region刷写频繁限制(presplit=region数),通过命令行参数关闭入库时预写日志减少服务端IO消耗和写WAL等待(writeToWAL=false),开启客户端缓存并自动flush减少rpc刷写次数。同时在多个客户端节点多个进程写入不同的表,每个进程多线程写入不同的region。入库指定大小或行数的数据,完成一张表flush一张表。
S4、数据批量入库,该步骤为本发明的优选实施方式,在本发明的其他实施方式中可不执行该步骤。
如果客户端入库后region数量不满足需要,使用hadoop的distcp并发复制已经写完的表数据目录到临时目录中,复制完成后开始下一表的复制,并同时开始以region为单位将临时目录buckload(即hbase的LoadIncrementalHFiles工具)入库到新建的表中,新表region数应该和旧表一致,或仅为1个region,使批量导入不用重新分割hfile,提高效率。如此重复直至达到需要的hfile数量。可以从master ui获取storefile数量,即hfile数量。
如图3所示,该系统300包括:
功能设置单元310,配置用于通过修改服务端参数关闭存储文件合并功能并增大数据写入效率;
服务扩容单元320,配置用于通过配置分布式数据库服务端集群的端口和日志路径增加节点上运行的服务对象数量;
数据写入单元330,配置用于利用分布式数据库的压测工具将测试数据从客户端并发写入分布式数据库服务端;
服务缩容单元340,配置用于在将所述测试数据全部写入分布式数据库的服务端之后,删除增设的服务对象,并监控存储文件负载情况。
可选地,作为本发明一个实施例,所述功能设置单元包括:
第一关闭模块,配置用于关闭分布式文件系统服务端对同个列组下的存储文件的合并功能;
第二关闭模块,配置用于关闭分布式文件系统服务端对小存储文件的合并功能;
线程设置模块,配置用于增大刷写到存储文件的线程数;
内存设置模块,配置用于降低内存限额,所述内存保存待刷写至存储文件的数据;
比例设置模块,配置用于增大写缓存比例;
分裂设置模块,配置用于关闭对分布式文件系统的分区的自动分裂功能。
可选地,作为本发明一个实施例,所述服务扩容单元包括:
内存监控模块,配置用于获取内存可用容量,确认所述可用容量不低于预设标准容量;
目录设置模块,配置用于在分布式数据库服务端的配置目录中修改数据存储管理服务端口和日志路径。
可选地,作为本发明一个实施例,所述系统还包括:
分区获取单元,配置用于获取分布式数据库的分区数量;
目录复制单元,配置用于若存储文件数量未达到预设数量阈值,则利用分布式拷贝命令将已经写完的表数据目录复制到临时目录中;
存储新建单元,配置用于将临时目录批量导入新建表,所述新建表的分区与现有表相同或仅采用一个分区。
图4为本发明实施例提供的一种终端400的结构示意图,该终端400可以用于执行本发明实施例提供的存储文件高负载场景模拟方法。
其中,该终端400可以包括:处理器410、存储器420及通信单元430。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本发明的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
其中,该存储器420可以用于存储处理器410的执行指令,存储器420可以由任何类型的易失性或非易失性存储终端或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。当存储器420中的执行指令由处理器410执行时,使得终端400能够执行以下上述方法实施例中的部分或全部步骤。
处理器410为存储终端的控制中心,利用各种接口和线路连接整个电子终端的各个部分,通过运行或执行存储在存储器420内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子终端的各种功能和/或处理数据。所述处理器可以由集成电路(Integrated Circuit,简称IC) 组成,例如可以由单颗封装的IC 所组成,也可以由连接多颗相同功能或不同功能的封装IC而组成。举例来说,处理器410可以仅包括中央处理器(Central Processing Unit,简称CPU)。在本发明实施方式中,CPU可以是单运算核心,也可以包括多运算核心。
通信单元430,用于建立通信信道,从而使所述存储终端可以与其它终端进行通信。接收其他终端发送的用户数据或者向其他终端发送用户数据。
本发明还提供一种计算机存储介质,其中,该计算机存储介质可存储有程序,该程序执行时可包括本发明提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-only memory,简称:ROM)或随机存储记忆体(英文:random access memory,简称:RAM)等。
因此,本发明实现了快速准备HBase的RegionServer高hfile负载的情况,大幅减少了准备测试环境的时间,方便快捷地模拟极端环境,有利于迅速发现问题及验证,降低了测试场景复现的成本,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。
本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机终端(可以是个人计算机,服务器,或者第二终端、网络终端等)执行本发明各个实施例所述方法的全部或部分步骤。
本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。
在本发明所提供的几个实施例中,应该理解到,所揭露的系统和方法,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,系统或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (8)
1.一种存储文件高负载场景模拟方法,其特征在于,包括:
通过修改服务端参数关闭存储文件合并功能并增大数据写入效率;
通过配置分布式数据库服务端集群的端口和日志路径增加节点上运行的服务对象数量;
利用分布式数据库的压测工具将测试数据从客户端并发写入分布式数据库服务端;
在将所述测试数据全部写入分布式数据库的服务端之后,删除增设的服务对象,并监控存储文件负载情况;
所述通过修改服务端参数关闭存储文件合并功能并增大数据写入效率,包括:
关闭分布式文件系统服务端对同个列组下的存储文件的合并功能;
关闭分布式文件系统服务端对小存储文件的合并功能;
增大刷写到存储文件的线程数;
降低内存限额,所述内存保存待刷写至存储文件的数据;
增大写缓存比例;
关闭对分布式文件系统的分区的自动分裂功能。
2.根据权利要求1所述的方法,其特征在于,通过配置分布式数据库服务端集群的节点端口目录增加节点上运行的服务对象数量,包括:
获取内存可用容量,确认所述可用容量不低于预设标准容量;
在分布式数据库服务端的配置目录中修改数据存储管理服务端口和日志路径。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取分布式数据库的分区数量;
若存储文件数量未达到预设数量阈值,则利用分布式拷贝命令将已经写完的表数据目录复制到临时目录中;
将临时目录批量导入新建表,所述新建表的分区与现有表相同或仅采用一个分区。
4.一种存储文件高负载场景模拟系统,其特征在于,包括:
功能设置单元,配置用于通过修改服务端参数关闭存储文件合并功能并增大数据写入效率;
服务扩容单元,配置用于通过配置分布式数据库服务端集群的端口和日志路径增加节点上运行的服务对象数量;
数据写入单元,配置用于利用分布式数据库的压测工具将测试数据从客户端并发写入分布式数据库服务端;
服务缩容单元,配置用于在将所述测试数据全部写入分布式数据库的服务端之后,删除增设的服务对象,并监控存储文件负载情况;
所述功能设置单元包括:
第一关闭模块,配置用于关闭分布式文件系统服务端对同个列组下的存储文件的合并功能;
第二关闭模块,配置用于关闭分布式文件系统服务端对小存储文件的合并功能;
线程设置模块,配置用于增大刷写到存储文件的线程数;
内存设置模块,配置用于降低内存限额,所述内存保存待刷写至存储文件的数据;
比例设置模块,配置用于增大写缓存比例;
分裂设置模块,配置用于关闭对分布式文件系统的分区的自动分裂功能。
5.根据权利要求4所述的系统,其特征在于,所述服务扩容单元包括:
内存监控模块,配置用于获取内存可用容量,确认所述可用容量不低于预设标准容量;
目录设置模块,配置用于在分布式数据库服务端的配置目录中修改数据存储管理服务端口和日志路径。
6.根据权利要求4所述的系统,其特征在于,所述系统还包括:
分区获取单元,配置用于获取分布式数据库的分区数量;
目录复制单元,配置用于若存储文件数量未达到预设数量阈值,则利用分布式拷贝命令将已经写完的表数据目录复制到临时目录中;
存储新建单元,配置用于将临时目录批量导入新建表,所述新建表的分区与现有表相同或仅采用一个分区。
7.一种终端,其特征在于,包括:
处理器;
用于存储处理器的执行指令的存储器;
其中,所述处理器被配置为执行权利要求1-3任一项所述的方法。
8.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-3中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010693926.9A CN111966656B (zh) | 2020-07-17 | 2020-07-17 | 存储文件高负载场景模拟方法、系统、终端及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010693926.9A CN111966656B (zh) | 2020-07-17 | 2020-07-17 | 存储文件高负载场景模拟方法、系统、终端及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111966656A CN111966656A (zh) | 2020-11-20 |
CN111966656B true CN111966656B (zh) | 2022-11-11 |
Family
ID=73361737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010693926.9A Active CN111966656B (zh) | 2020-07-17 | 2020-07-17 | 存储文件高负载场景模拟方法、系统、终端及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111966656B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115617280B (zh) * | 2022-12-19 | 2023-03-03 | 苏州浪潮智能科技有限公司 | 临时目录的优化管理方法、装置、电子设备及存储介质 |
CN116795552B (zh) * | 2023-07-07 | 2024-06-14 | 哈尔滨工业大学 | 一种基于MapReduce的大规模负载测试方法及其评价方法 |
CN116910016B (zh) * | 2023-09-14 | 2024-06-11 | 交通运输部北海航海保障中心天津通信中心 | 一种ais数据处理方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110515918A (zh) * | 2019-08-19 | 2019-11-29 | 南京邮电大学 | 一种基于hdfs的分布式存储平台及构建方法 |
US10592475B1 (en) * | 2013-12-27 | 2020-03-17 | Amazon Technologies, Inc. | Consistent data storage in distributed computing systems |
-
2020
- 2020-07-17 CN CN202010693926.9A patent/CN111966656B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10592475B1 (en) * | 2013-12-27 | 2020-03-17 | Amazon Technologies, Inc. | Consistent data storage in distributed computing systems |
CN110515918A (zh) * | 2019-08-19 | 2019-11-29 | 南京邮电大学 | 一种基于hdfs的分布式存储平台及构建方法 |
Non-Patent Citations (2)
Title |
---|
《Approaches To Modeling The Load On A Distributed Storage System》;A. A. Zarubin 等;《2018Systems of Signal Synchronization, Generating and Processing in Telecommunications (SYNCHROINFO)》;20181231;全文 * |
《面向大数据分布式存储的动态负载均衡算法》;张栗粽 等;《计算机科学》;20170531;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111966656A (zh) | 2020-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111966656B (zh) | 存储文件高负载场景模拟方法、系统、终端及存储介质 | |
CN110147411B (zh) | 数据同步方法、装置、计算机设备及存储介质 | |
CN114140047B (zh) | 一种系统物料清单生成方法、系统、存储介质及设备 | |
CN111917834A (zh) | 一种数据同步方法、装置、存储介质及计算机设备 | |
CN110597891A (zh) | MySQL聚合为PostgreSQL数据库的设备、系统、方法、存储介质 | |
CN111737227A (zh) | 数据修改方法及系统 | |
CN105512276B (zh) | 一种构建垃圾文件的方法、装置及电子设备 | |
CN110597821A (zh) | 数据仓库表结构变更方法及装置 | |
CN113986241A (zh) | 一种基于知识图谱的业务规则的配置方法以及装置 | |
CN106951593B (zh) | 一种生成保护测控装置的配置文件的方法和装置 | |
CN111124772A (zh) | 一种云平台存储性能测试方法、系统、终端及存储介质 | |
CN114297196A (zh) | 元数据存储方法、装置、电子设备及存储介质 | |
CN111309297B (zh) | 脚本开发系统及方法 | |
CN115757174A (zh) | 一种数据库的差异检测方法及装置 | |
WO2022001626A1 (zh) | 注入时序数据的方法、查询时序数据的方法及数据库系统 | |
CN109164988A (zh) | 基于处理器的虚拟机快照方法和系统 | |
CN115168840A (zh) | 一种故障注入方法、装置及计算机可读存储介质 | |
CN114490865A (zh) | 数据库同步方法、装置、设备及计算机存储介质 | |
CN114020214A (zh) | 存储集群的扩容方法、装置、电子设备及可读存储介质 | |
CN113254332A (zh) | 一种存储系统多场景测试方法、系统、终端及存储介质 | |
CN110703988B (zh) | 一种分布式存储的存储池创建方法、系统、终端及存储介质 | |
CN113204485A (zh) | 一种内存数据库压力测试方法、系统、终端及存储介质 | |
CN116112377B (zh) | 接口模拟方法、装置、设备及存储介质 | |
CN111143193A (zh) | 基于RobotFramework的大数据服务测试方法、系统、终端及存储介质 | |
CN105427890A (zh) | 一种记录存储系统重启次数的方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |