CN109271381A - 测试数据表的处理方法、装置、计算机设备和存储介质 - Google Patents

测试数据表的处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN109271381A
CN109271381A CN201810955956.5A CN201810955956A CN109271381A CN 109271381 A CN109271381 A CN 109271381A CN 201810955956 A CN201810955956 A CN 201810955956A CN 109271381 A CN109271381 A CN 109271381A
Authority
CN
China
Prior art keywords
test data
data table
database
hadoop
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810955956.5A
Other languages
English (en)
Inventor
董芳宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN201810955956.5A priority Critical patent/CN109271381A/zh
Publication of CN109271381A publication Critical patent/CN109271381A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及数据处理领域,提供了一种测试数据表的处理方法、装置、计算机设备和存储介质,检测Hadoop的数据库的存储容量占用率,并判断所述存储容量占用率是否达到第一阈值;若达到,则获取所述Hadoop的数据库中的测试数据表的属性;根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表;按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率。本申请避免Hadoop的数据库出现测试环境崩溃、报错。

Description

测试数据表的处理方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机数据处理技术领域,特别涉及一种测试数据表的处理方法、装置、计算机设备和存储介质。
背景技术
Hadoop(海杜普)是一种大数据框架,主要用于大数据测试环境。Hadoop使用的数据库是hive库,hive是基于Hadoop的一个数据仓库工具,可以提供完整的sql查询功能,并可以将sql语句转换为MapReduce任务进行运行。Hadoop的数据库的优点是成本低;缺点是,Hadoop的数据库中存储有大量的测试数据表,由于数据库的存储资源有限,当存储不足时,容易造成测试环境崩溃、报错等。
发明内容
本申请的主要目的为提供一种测试数据表的处理方法、装置、计算机设备和存储介质,降低Hadoop的数据库中的存储容量占用率。
为实现上述目的,本申请提供了一种测试数据表的处理方法,包括以下步骤:
检测Hadoop的数据库的存储容量占用率,并判断所述存储容量占用率是否达到第一阈值;
若达到,则获取所述Hadoop的数据库中的测试数据表的属性;
根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表;
按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率。
进一步地,所述测试数据表的属性包括所述测试数据表的文件名称,所述根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤,包括:
根据所述测试数据表的文件名称,选择出所述文件名称中包括预设关键字的测试数据表,作为所述目标数据表;
或者,根据所述测试数据表的文件名称,选择出所述文件名称不符合预设命名规则的测试数据表,作为所述目标数据表。
进一步地,所述测试数据表的属性包括所述测试数据表的使用频率以及被程序依赖的依赖关系,所述根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤,包括:
根据所述测试数据表的使用频率以及被程序依赖的依赖关系,选择出所述使用频率以及被程序依赖的依赖关系均满足对应条件的所述测试数据表,作为所述目标数据表。
进一步地,所述测试数据表的属性包括所述测试数据表的数据存储量,所述根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤,包括:
判断所述测试数据表的数据存储量是否达到设定值;
将达到所述设定值的测试数据表作为所述目标数据表。
进一步地,所述按照预设方式对所述目标数据表进行处理的步骤,包括:
对所述目标数据表进行压缩;和/或,对所述目标数据表中的数据内容进行检测,并判断所述数据内容是否满足清理条件,将满足清理条件的所述数据内容进行清理。
进一步地,所述按照预设方式对所述目标数据表进行处理的步骤,包括:
运行预设的清理脚本,对所述目标数据表进行清理;或者,将所述目标数据表从所述Hadoop的数据库中移动至备用数据库中。
进一步地,所述按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率的步骤之后,包括:
检测所述Hadoop的数据库当前的可用空间比例,并判断所述可用空间比例是否小于第二阈值;
若小于,则按照预设规则从所述Hadoop的数据库的测试数据表中选择出对应的第一测试数据表,将选择出的所述第一测试数据表转移至备用数据库中,并对应修改所述第一测试数据表的调用路径。
进一步地,所述按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率的步骤之后,包括:
检测所述Hadoop的数据库当前的可用空间量,并按照所述可用空间量的比例设定一个存储阈值;其中,所述比例小于1;
接收到添加新的第二测试数据表至所述Hadoop的数据库的请求时,判断所述第二测试数据表的数据存储量是否大于所述存储阈值;
若大于,则禁止将所述第二测试数据表加入至所述Hadoop的数据库中;若小于,则将所述第二测试数据表加入至所述Hadoop的数据库中。
本申请还提供了一种测试数据表的处理装置,包括:
第一检测单元,用于检测Hadoop的数据库的存储容量占用率,并判断所述存储容量占用率是否达到第一阈值;
获取单元,用于若达到,则获取所述Hadoop的数据库中的测试数据表的属性;
第一选择单元,用于根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表;
处理单元,用于按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。
本申请还提供一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。
本申请中提供的测试数据表的处理方法、装置、计算机设备和存储介质,具有以下有益效果:
本申请中提供的测试数据表的处理方法、装置、计算机设备和存储介质,检测Hadoop的数据库的存储容量占用率,并判断所述存储容量占用率是否达到第一阈值;若达到,则获取所述Hadoop的数据库中的测试数据表的属性;根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表;按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率,避免Hadoop的数据库出现测试环境崩溃、报错。
附图说明
图1是本申请一实施例中测试数据表的处理方法步骤示意图;
图2是本申请另一实施例中测试数据表的处理方法步骤示意图;
图3是本申请又一实施例中测试数据表的处理方法步骤示意图;
图4是本申请一实施例中测试数据表的处理装置结构框图;
图5是本申请另一实施例中测试数据表的处理装置结构框图;
图6是本申请又一实施例中测试数据表的处理装置结构框图;
图7是本申请一实施例的计算机设备的结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请一实施例中提供了一种测试数据表的处理方法,包括以下步骤:
步骤S1,检测Hadoop的数据库的存储容量占用率,并判断所述存储容量占用率是否达到第一阈值。
在本实施例中,上述存储容量占用率是指上述Hadoop的数据库中的所有数据占用的存储空间与所述Hadoop的数据库总存储空间的比例,例如Hadoop的的数据库的总存储空间为A,其存储的数据占用的存储空间为B,则上述存储容量占用率为B/A。由于,Hadoop的数据库的存储资源有限,因此,当其存储资源较少时,需要对其进行相应的处理,以释放其存储资源。本实施例中,设置有一个第一阈值,以第一阈值来界定上述Hadoop的数据库的存储资源是否充足;当所述存储容量占用率达到第一阈值时,则表明存储资源不足;当所述存储容量占用率未达到第一阈值时,则表明存储资源充足。
步骤S2,若达到,则获取所述Hadoop的数据库中的测试数据表的属性。
在本实施例中,上述测试数据表的属性主要包括:文件名称、文件类型、文件更新时间、文件更新频率、文件的数据存储量等多种。本实施例中,对于所有存入至上述Hadoop的数据库中的测试数据表或者更新测试数据表,都会记录其相对应的属性并存储在数据库中;当上述Hadoop的数据库的存储容量占用率达到第一阈值时,则可以从上述记录中获取到测试数据表的属性。在其它实施例中,可以是定期按时获取一次上述Hadoop的数据库中测试数据表的属性。
步骤S3,根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表。
在本实施例中,获取到测试数据表的属性之后,则可以根据其属性确定出所有满足预设条件的测试数据表,并将其作为目标数据表。本步骤中满足预设条件指的是上述测试数据表的属性满足对应的预设条件,若某一个测试数据表的属性满足预设条件,则将其作为目标数据表。上述目标数据表即为一种脏数据(Dirty Read)或者临时数据。上述脏数据是指不在给定的范围内或对于实际业务毫无意义,或是数据格式非法,以及存在不规范的编码和含糊的数据。
步骤S4,按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率。
在本实施例中,按照预设方式对上述目标数据表进行处理,上述预设方式可以是运行预设的清理脚本,对所述目标数据表进行清理;或者,将所述目标数据表从所述Hadoop的数据库中移动至备用数据库中,或者也可以是对上述目标数据表进行压缩处理。经过上述处理方式对上述目标数据表进行处理之后,Hadoop的数据库中的测试数据表占用的存储空间降低,避免测试环境由于存储不足而造成崩溃、报错等;同时,释放上述Hadoop的数据库的存储空间,可以提高程序运行效率。其它实施例中,对所述目标数据表进行清理时,还可以将清理事件(清理时间、清理内容等)写入日志文件中。
在一实施例中,上述测试数据表的属性包括所述测试数据表的文件名称,所述根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤S3,包括:
步骤S3a,根据所述测试数据表的文件名称,选择出所述文件名称中包括预设关键字的测试数据表,作为所述目标数据表。
本实施例中,以文件名称中的关键字来进行分析,检测上述测试数据表的文件名称中是否包括预设的关键字。例如文件名称包含tmp、init、test等关键字,则表明该测试数据表是临时表;选择出文件名称中包括这些预设的关键字的测试数据表作为目标数据。
在另一实施例中,上述根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤S3,包括:
步骤S3b,根据所述测试数据表的文件名称,选择出所述文件名称不符合预设命名规则的测试数据表,作为所述目标数据表。
本实施例中,由于人为创建用作测试用的测试数据表的文件名称,通常为用户随意命名的,命名规则不符合上述Hadoop的数据库中的测试数据表的预设命名规则。因此可以根据所述测试数据表的文件名称,选择出文件名称中不符合预设命名规则的测试数据表作为目标数据。
在又一实施例中,上述测试数据表的属性包括所述测试数据表的使用频率以及被程序依赖的依赖关系,所述根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤S3,包括:
步骤S3c,根据所述测试数据表的使用频率以及被程序依赖的依赖关系,选择出所述使用频率以及被程序依赖的依赖关系均满足对应条件的所述测试数据表,作为所述目标数据表。
在本实施例中,不同的测试数据表,其用途不同,其使用频率也会不同,例如一些测试数据表为基础数据,基础数据被其它程序调用的频率高,需要经常被多个程序依赖使用。对于这些测试数据表较为重要,不应该被清理。而对于其它一些测试数据表只被一个程序所依赖,且使用频率也较低,则可以将其选择为目标数据。因此,本实施例中,可以根据测试数据表的使用频率以及被程序依赖的依赖关系,选择出满足对应条件的目标数据表。例如,将使用频率低于阈值且被程序依赖少于另一阈值的测试数据表作为目标数据表。
其它实施例中,还可以根据上述测试数据表的更新时间、更新频率等来选择是否将其作为目标数据。例如,近期(如一个月)都没有定时更新的测试数据表、或者更新频率过高且不是基础数据的测试数据表都可以选择为目标数据。
在又一实施例中,上述测试数据表的属性包括所述测试数据表的数据存储量,所述根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤S3,包括:
步骤S3d,判断所述测试数据表的数据存储量是否达到设定值;
步骤S3e,将达到所述设定值的测试数据表作为所述目标数据表。
本实施例中,上述测试数据表的数据存储量指的是上述测试数据表所占用的存储空间大小,不同的测试数据表其占用的存储空间也不同,由于数据库的存储资源有限,因此,可以选择出数据存储量较大(超过设定值)的测试数据表作为目标数据表。例如,若某个测试数据表的数据量大于1DB(刀字节)时,则将其作为目标数据表。
在上述实施例中,上述按照预设方式对所述目标数据表进行处理的步骤S4,包括:
步骤S4a,对所述目标数据表进行压缩;和/或,对所述目标数据表中的数据内容进行检测,并判断所述数据内容是否满足清理条件,将满足清理条件的所述数据内容进行清理。
本实施例中,上述压缩处理主要针对于上述数据存储量大于设定值的测试数据表;上述清理条件指的是上述数据内容中的无用内容、陈旧内容(例如一些很早之前就添加至测试数据表中的内容),将满足清理条件的数据内容从上述测试数据表中清理掉,便于释放上述Hadoop的数据库的存储资源。
参照图2,在一实施例中,上述按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率的步骤S4之后,包括:
步骤S51,检测所述Hadoop的数据库当前的可用空间比例,并判断所述可用空间比例是否小于第二阈值;
步骤S61,若小于,则按照预设规则从所述Hadoop的数据库的测试数据表中选择出对应的第一测试数据表,将选择出的所述第一测试数据表转移至备用数据库中,并对应修改所述第一测试数据表的调用路径。
在本实施例中,上述可用空间比例指的是上述Hadoop的数据库的可用空间与总存储空间的比例。由于对数据库中的目标数据表清理之后,可能还是存在数据库存储量不太足的情形,但是剩下的测试数据表一般是不能被清理的。因此在清理上述目标数据表之后,如上述步骤S51所述的,检测所述Hadoop的数据库当前的可用空间比例,并判断所述可用空间比例是否小于第二阈值。当小于时,则表明该Hadoop的数据库还是存储资料不足,因此,如上述步骤S61所述的按照预设规则从所述Hadoop的数据库的测试数据表中选择出对应的第一测试数据表,将选择出的所述第一测试数据表转移至备用数据库中,并对应修改所述第一测试数据表的调用路径,便于调用转移至备用数据库中的第一测试数据表。
上述转移的第一测试数据表可以是根据Hadoop的数据库测试数据表的属性来转移,例如将具有相同类别的测试数据表进行转移,或者按照加入数据库的时间顺序进行转移,选择将较早时间加入至上述数据库的测试数据表转移至备用数据库中。转移的测试数据表的数据量可以按规则设定,例如Hadoop的数据库可用空间比例为5%,则可以将占用20%或更多存储空间的测试数据表进行转移。
参照图3,在一实施例中,上述按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率的步骤S4之后,包括:
步骤S501,检测所述Hadoop的数据库当前的可用空间量,并按照所述可用空间量的比例设定一个存储阈值;其中,所述比例小于1。例如,Hadoop的数据库当前可用空间量为A,则存储阈值可以设置为0.5A。
步骤S601,接收到添加新的第二测试数据表至所述Hadoop的数据库的请求时,判断所述第二测试数据表的数据存储量是否大于所述存储阈值;
步骤S7,若大于,则禁止将所述第二测试数据表加入至所述Hadoop的数据库中;若小于,则将所述第二测试数据表加入至所述Hadoop的数据库中。
本实施例中,如上述步骤S601所述的,判断新添加的第二测试数据表的数据存储量是否大于存储阈值。再如步骤S7所述的,若大于,则禁止将所述第二测试数据表加入至所述Hadoop的数据库中;若小于,则将所述第二测试数据表加入至所述Hadoop的数据库中。避免将第二测试数据表加入后造成上述Hadoop的数据库的存储资源匮乏,从而避免造成测试环境崩溃、报错。
在其它实施例中,还可以是检测上述Hadoop的数据库当前的可用空间量,并判断其是否小于一个预设的第三阈值,若小于,则禁止任何测试数据表加入上述Hadoop的数据库中。或者,在新的测试数据表添加至上述Hadoop的数据库中时,判断该测试数据表是否为脏数据;若不是,则将其加入至上述Hadoop的数据库;若是,则禁止将其加入至上述Hadoop的数据库中,并将其添加至一个预设文件夹中集中管理。
在又一实施例中,上述按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率的步骤S4之后,包括:
步骤S5a,检测运行上述Hadoop的数据库的测试终端的硬件状态信息,当所述硬件状态信息达到设定条件时,则执行后台程序清理。例如检测到CPU占用、内存占用率过高时,则自动清理后台程序,以释放内存以及CPU占用。
参照图4,本申请一实施例中还提供了一种测试数据表的处理装置,包括:
第一检测单元10,用于检测Hadoop的数据库的存储容量占用率,并判断所述存储容量占用率是否达到第一阈值;
在本实施例中,上述存储容量占用率是指上述Hadoop的数据库中的所有数据占用的存储空间与所述Hadoop的数据库总存储空间的比例,例如Hadoop的的数据库的总存储空间为A,其存储的数据占用的存储空间为B,则上述存储容量占用率为B/A。由于,Hadoop的数据库的存储资源有限,因此,当其存储资源较少时,需要对其进行相应的处理,以释放其存储资源。本实施例中,设置有一个第一阈值,以第一阈值来界定上述Hadoop的数据库的存储资源是否充足;当第一检测单元10检测到所述存储容量占用率达到第一阈值时,则表明存储资源不足;当所述存储容量占用率未达到第一阈值时,则表明存储资源充足。
获取单元20,用于若达到,则获取所述Hadoop的数据库中的测试数据表的属性;
在本实施例中,上述测试数据表的属性主要包括:文件名称、文件类型、文件更新时间、文件更新频率、文件的数据存储量等多种。本实施例中,对于所有存入至上述Hadoop的数据库中的测试数据表或者更新测试数据表,都会记录其相对应的属性并存储在数据库中;当上述Hadoop的数据库的存储容量占用率达到第一阈值时,获取单元则可以从上述记录中获取到测试数据表的属性。在其它实施例中,可以是定期按时获取一次上述Hadoop的数据库中测试数据表的属性。
第一选择单元30,用于根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表;
在本实施例中,获取到测试数据表的属性之后,第一选择单元30则可以根据其属性确定出所有满足预设条件的测试数据表,并将其作为目标数据表。本步骤中满足预设条件指的是上述测试数据表的属性满足对应的预设条件,若某一个测试数据表的属性满足预设条件,则将其作为目标数据表。上述目标数据表即为一种脏数据(Dirty Read)或者临时数据。上述脏数据是指不在给定的范围内或对于实际业务毫无意义,或是数据格式非法,以及存在不规范的编码和含糊的数据。
处理单元40,用于按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率。
在本实施例中,处理单元40按照预设方式对上述目标数据表进行处理,上述预设方式可以是运行预设的清理脚本,对所述目标数据表进行清理;或者,将所述目标数据表从所述Hadoop的数据库中移动至备用数据库中,或者也可以是对上述目标数据表进行压缩处理。经过上述处理方式对上述目标数据表进行处理之后,Hadoop的数据库中的测试数据表占用的存储空间降低,避免测试环境由于存储不足而造成崩溃、报错等;同时,释放上述Hadoop的数据库的存储空间,可以提高程序运行效率。其它实施例中,对所述目标数据表进行清理时,还可以将清理事件(清理时间、清理内容等)写入日志文件中。
在一实施例中,上述测试数据表的属性包括所述测试数据表的文件名称,上述第一选择单元30包括:
第一选择子单元,用于根据所述测试数据表的文件名称,选择出所述文件名称中包括预设关键字的测试数据表,作为所述目标数据表;本实施例中,以文件名称中的关键字来进行分析,检测上述测试数据表的文件名称中是否包括预设的关键字。例如文件名称包含tmp、init、test等关键字,则表明该测试数据表是临时表;第一选择子单元选择出文件名称中包括这些预设的关键字的测试数据表作为目标数据。
或者,第一选择子单元,还用于根据所述测试数据表的文件名称,选择出所述文件名称不符合预设命名规则的测试数据表,作为所述目标数据表。
本实施例中,由于人为创建用作测试用的测试数据表的文件名称,通常为用户随意命名的,命名规则不符合上述Hadoop的数据库中的测试数据表的预设命名规则。因此,第一选择子单元可以根据所述测试数据表的文件名称,选择出文件名称中不符合预设命名规则的测试数据表作为目标数据。
在另一实施例中,上述测试数据表的属性包括所述测试数据表的使用频率以及被程序依赖的依赖关系,上述第一选择单元30包括:
第二选择子单元,用于根据所述测试数据表的使用频率以及被程序依赖的依赖关系,选择出所述使用频率以及被程序依赖的依赖关系均满足对应条件的所述测试数据表,作为所述目标数据表。
在本实施例中,不同的测试数据表,其用途不同,其使用频率也会不同,例如一些测试数据表为基础数据,基础数据被其它程序调用的频率高,需要经常被多个程序依赖使用。对于这些测试数据表较为重要,不应该被清理。而对于其它一些测试数据表只被一个程序所依赖,且使用频率也较低,则可以将其选择为目标数据。因此,本实施例中,第二选择子单元可以根据测试数据表的使用频率以及被程序依赖的依赖关系,选择出满足对应条件的目标数据表。例如,将使用频率低于阈值且被程序依赖少于另一阈值的测试数据表作为目标数据表。
其它实施例中,还可以根据上述测试数据表的更新时间、更新频率等来选择是否将其作为目标数据。例如,近期(如一个月)都没有定时更新的测试数据表、或者更新频率过高且不是基础数据的测试数据表都可以选择为目标数据。
在又一实施例中,上述测试数据表的属性包括所述测试数据表的数据存储量,上述第一选择单元30包括:
第三选择子单元,用于判断所述测试数据表的数据存储量是否达到设定值;将达到所述设定值的测试数据表作为所述目标数据表。
本实施例中,上述测试数据表的数据存储量指的是上述测试数据表所占用的存储空间大小,不同的测试数据表其占用的存储空间也不同,由于数据库的存储资源有限,因此,第三选择子单元可以选择出数据存储量较大(超过设定值)的测试数据表作为目标数据表。例如,若某个测试数据表的数据量大于1DB(刀字节)时,则将其作为目标数据表。
在上述实施例中,上述处理单元40具体用于:
对所述目标数据表进行压缩;和/或,对所述目标数据表中的数据内容进行检测,并判断所述数据内容是否满足清理条件,将满足清理条件的所述数据内容进行清理。
本实施例中,上述压缩处理主要针对于上述数据存储量大于设定值的测试数据表;上述清理条件指的是上述数据内容中的无用内容、陈旧内容(例如一些很早之前就添加至测试数据表中的内容),将满足清理条件的数据内容从上述测试数据表中清理掉,便于释放上述Hadoop的数据库的存储资源。
参照图5,在一实施例中,上述测试数据表的处理装置,还包括:
第二检测单元50,用于检测所述Hadoop的数据库当前的可用空间比例,并判断所述可用空间比例是否小于第二阈值;
第二选择单元60,用于若小于,则按照预设规则从所述Hadoop的数据库的测试数据表中选择出对应的第一测试数据表,将选择出的所述第一测试数据表转移至备用数据库中,并对应修改所述第一测试数据表的调用路径。
在本实施例中,上述可用空间比例指的是上述Hadoop的数据库的可用空间与总存储空间的比例。由于对数据库中的目标数据表清理之后,可能还是存在数据库存储量不太足的情形,但是剩下的测试数据表一般是不能被清理的。因此在清理上述目标数据表之后,如上述第二检测单元50所述的,检测所述Hadoop的数据库当前的可用空间比例,并判断所述可用空间比例是否小于第二阈值。当小于时,则表明该Hadoop的数据库还是存储资料不足,因此,第二选择单元60则按照预设规则从所述Hadoop的数据库的测试数据表中选择出对应的第一测试数据表,将选择出的所述第一测试数据表转移至备用数据库中,并对应修改所述第一测试数据表的调用路径,便于调用转移至备用数据库中的第一测试数据表。
上述第二选择单元60转移的第一测试数据表可以是根据Hadoop的数据库测试数据表的属性来转移,例如将具有相同类别的测试数据表进行转移,或者按照加入数据库的时间顺序进行转移,选择将较早时间加入至上述数据库的测试数据表转移至备用数据库中。转移的测试数据表的数据量可以按规则设定,例如Hadoop的数据库可用空间比例为5%,则可以将占用20%或更多存储空间的测试数据表进行转移。
参照图6,在一实施例中,上述测试数据表的处理装置,还包括:
第三检测单元501,用于检测所述Hadoop的数据库当前的可用空间量,并按照所述可用空间量的比例设定一个存储阈值;其中,所述比例小于1。例如,Hadoop的数据库当前可用空间量为A,则存储阈值可以设置为0.5A。
接收单元601,用于接收到添加新的第二测试数据表至所述Hadoop的数据库的请求时,判断所述第二测试数据表的数据存储量是否大于所述存储阈值;
添加单元70,用于若大于,则禁止将所述第二测试数据表加入至所述Hadoop的数据库中;若小于,则将所述第二测试数据表加入至所述Hadoop的数据库中。
本实施例中,上述接收单元601判断新添加的第二测试数据表的数据存储量是否大于存储阈值。若大于,添加单元70则禁止将所述第二测试数据表加入至所述Hadoop的数据库中;若小于,则将所述第二测试数据表加入至所述Hadoop的数据库中。避免将第二测试数据表加入后造成上述Hadoop的数据库的存储资源匮乏,从而避免造成测试环境崩溃、报错。
在其它实施例中,还可以包括第四检测单元,用于检测上述Hadoop的数据库当前的可用空间量,并判断其是否小于一个预设的第三阈值,若小于,则禁止任何测试数据表加入上述Hadoop的数据库中。或者,在新的测试数据表添加至上述Hadoop的数据库中时,判断该测试数据表是否为脏数据;若不是,则将其加入至上述Hadoop的数据库;若是,则禁止将其加入至上述Hadoop的数据库中,并将其添加至一个预设文件夹中集中管理。
在一实施例中,上述测试数据表的处理装置,还包括:
清理单元,用于检测运行上述Hadoop的数据库的测试终端的硬件状态信息,当所述硬件状态信息达到设定条件时,则执行后台程序清理。例如检测到CPU占用、内存占用率过高时,则自动清理后台程序,以释放内存以及CPU占用。
参照图7,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储测试数据表等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种测试数据表的处理方法。
上述处理器执行上述测试数据表的处理方法的步骤:
检测Hadoop的数据库的存储容量占用率,并判断所述存储容量占用率是否达到第一阈值;
若达到,则获取所述Hadoop的数据库中的测试数据表的属性;
根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表;
按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率。
在一实施例中,上述测试数据表的属性包括所述测试数据表的文件名称,所述处理器根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤,包括:
根据所述测试数据表的文件名称,选择出所述文件名称中包括预设关键字的测试数据表,作为所述目标数据表;
或者,根据所述测试数据表的文件名称,选择出所述文件名称不符合预设命名规则的测试数据表,作为所述目标数据表。
在一实施例中,上述测试数据表的属性包括所述测试数据表的使用频率以及被程序依赖的依赖关系,所述处理器根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤,包括:
根据所述测试数据表的使用频率以及被程序依赖的依赖关系,选择出所述使用频率以及被程序依赖的依赖关系均满足对应条件的所述测试数据表,作为所述目标数据表。
在一实施例中,上述测试数据表的属性包括所述测试数据表的数据存储量,所述处理器根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤,包括:
判断所述测试数据表的数据存储量是否达到设定值;
将达到所述设定值的测试数据表作为所述目标数据表。
在一实施例中,上述处理器按照预设方式对所述目标数据表进行处理的步骤,包括:
对所述目标数据表进行压缩;和/或,对所述目标数据表中的数据内容进行检测,并判断所述数据内容是否满足清理条件,将满足清理条件的所述数据内容进行清理。
在一实施例中,上述处理器按照预设方式对所述目标数据表进行处理的步骤,包括:
运行预设的清理脚本,对所述目标数据表进行清理;或者,将所述目标数据表从所述Hadoop的数据库中移动至备用数据库中。
在一实施例中,上述处理器按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率的步骤之后,包括:
检测所述Hadoop的数据库当前的可用空间比例,并判断所述可用空间比例是否小于第二阈值;
若小于,则按照预设规则从所述Hadoop的数据库的测试数据表中选择出对应的第一测试数据表,将选择出的所述第一测试数据表转移至备用数据库中,并对应修改所述第一测试数据表的调用路径。
在一实施例中,上述处理器按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率的步骤之后,包括:
检测所述Hadoop的数据库当前的可用空间量,并按照所述可用空间量的比例设定一个存储阈值;其中,所述比例小于1;
接收到添加新的第二测试数据表至所述Hadoop的数据库的请求时,判断所述第二测试数据表的数据存储量是否大于所述存储阈值;
若大于,则禁止将所述第二测试数据表加入至所述Hadoop的数据库中;若小于,则将所述第二测试数据表加入至所述Hadoop的数据库中。
本领域技术人员可以理解,图7中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定。
本申请一实施例还提供一种计算机存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种测试数据表的处理方法,具体为:
检测Hadoop的数据库的存储容量占用率,并判断所述存储容量占用率是否达到第一阈值;
若达到,则获取所述Hadoop的数据库中的测试数据表的属性;
根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表;
按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率。
在一实施例中,上述测试数据表的属性包括所述测试数据表的文件名称,所述处理器根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤,包括:
根据所述测试数据表的文件名称,选择出所述文件名称中包括预设关键字的测试数据表,作为所述目标数据表;
或者,根据所述测试数据表的文件名称,选择出所述文件名称不符合预设命名规则的测试数据表,作为所述目标数据表。
在一实施例中,上述测试数据表的属性包括所述测试数据表的使用频率以及被程序依赖的依赖关系,所述处理器根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤,包括:
根据所述测试数据表的使用频率以及被程序依赖的依赖关系,选择出所述使用频率以及被程序依赖的依赖关系均满足对应条件的所述测试数据表,作为所述目标数据表。
在一实施例中,上述测试数据表的属性包括所述测试数据表的数据存储量,所述处理器根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤,包括:
判断所述测试数据表的数据存储量是否达到设定值;
将达到所述设定值的测试数据表作为所述目标数据表。
在一实施例中,上述处理器按照预设方式对所述目标数据表进行处理的步骤,包括:
对所述目标数据表进行压缩;和/或,对所述目标数据表中的数据内容进行检测,并判断所述数据内容是否满足清理条件,将满足清理条件的所述数据内容进行清理。
在一实施例中,上述处理器按照预设方式对所述目标数据表进行处理的步骤,包括:
运行预设的清理脚本,对所述目标数据表进行清理;或者,将所述目标数据表从所述Hadoop的数据库中移动至备用数据库中。
在一实施例中,上述处理器按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率的步骤之后,包括:
检测所述Hadoop的数据库当前的可用空间比例,并判断所述可用空间比例是否小于第二阈值;
若小于,则按照预设规则从所述Hadoop的数据库的测试数据表中选择出对应的第一测试数据表,将选择出的所述第一测试数据表转移至备用数据库中,并对应修改所述第一测试数据表的调用路径。
在一实施例中,上述处理器按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率的步骤之后,包括:
检测所述Hadoop的数据库当前的可用空间量,并按照所述可用空间量的比例设定一个存储阈值;其中,所述比例小于1;
接收到添加新的第二测试数据表至所述Hadoop的数据库的请求时,判断所述第二测试数据表的数据存储量是否大于所述存储阈值;
若大于,则禁止将所述第二测试数据表加入至所述Hadoop的数据库中;若小于,则将所述第二测试数据表加入至所述Hadoop的数据库中。
综上所述,为本申请实施例中提供的测试数据表的处理方法、装置、计算机设备和存储介质,检测Hadoop的数据库的存储容量占用率,并判断所述存储容量占用率是否达到第一阈值;若达到,则获取所述Hadoop的数据库中的测试数据表的属性;根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表;按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率,避免Hadoop的数据库出现测试环境崩溃、报错。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储与一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种测试数据表的处理方法,其特征在于,包括以下步骤:
检测Hadoop的数据库的存储容量占用率,并判断所述存储容量占用率是否达到第一阈值;
若达到,则获取所述Hadoop的数据库中的测试数据表的属性;
根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表;
按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率。
2.根据权利要求1所述的测试数据表的处理方法,其特征在于,所述测试数据表的属性包括所述测试数据表的文件名称,所述根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤,包括:
根据所述测试数据表的文件名称,选择出所述文件名称中包括预设关键字的测试数据表,作为所述目标数据表;
或者,根据所述测试数据表的文件名称,选择出所述文件名称不符合预设命名规则的测试数据表,作为所述目标数据表。
3.根据权利要求1所述的测试数据表的处理方法,其特征在于,所述测试数据表的属性包括所述测试数据表的使用频率以及被程序依赖的依赖关系,所述根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤,包括:
根据所述测试数据表的使用频率以及被程序依赖的依赖关系,选择出所述使用频率以及被程序依赖的依赖关系均满足对应条件的所述测试数据表,作为所述目标数据表。
4.根据权利要求1所述的测试数据表的处理方法,其特征在于,所述测试数据表的属性包括所述测试数据表的数据存储量,所述根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表的步骤,包括:
判断所述测试数据表的数据存储量是否达到设定值;
将达到所述设定值的测试数据表作为所述目标数据表。
5.根据权利要求1所述的测试数据表的处理方法,其特征在于,所述按照预设方式对所述目标数据表进行处理的步骤,包括:
运行预设的清理脚本,对所述目标数据表进行清理;或者,将所述目标数据表从所述Hadoop的数据库中移动至备用数据库中。
6.根据权利要求1-5任一项所述的测试数据表的处理方法,其特征在于,所述按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率的步骤之后,包括:
检测所述Hadoop的数据库当前的可用空间比例,并判断所述可用空间比例是否小于第二阈值;
若小于,则按照预设规则从所述Hadoop的数据库的测试数据表中选择出对应的第一测试数据表,将选择出的所述第一测试数据表转移至备用数据库中,并对应修改所述第一测试数据表的调用路径。
7.根据权利要求1-5任一项所述的测试数据表的处理方法,其特征在于,所述按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率的步骤之后,包括:
检测所述Hadoop的数据库当前的可用空间量,并按照所述可用空间量的比例设定一个存储阈值;其中,所述比例小于1;
接收到添加新的第二测试数据表至所述Hadoop的数据库的请求时,判断所述第二测试数据表的数据存储量是否大于所述存储阈值;
若大于,则禁止将所述第二测试数据表加入至所述Hadoop的数据库中;若小于,则将所述第二测试数据表加入至所述Hadoop的数据库中。
8.一种测试数据表的处理装置,其特征在于,包括:
第一检测单元,用于检测Hadoop的数据库的存储容量占用率,并判断所述存储容量占用率是否达到第一阈值;
获取单元,用于若达到,则获取所述Hadoop的数据库中的测试数据表的属性;
第一选择单元,用于根据所述测试数据表的属性,选择出所述属性满足预设条件的测试数据表作为目标数据表;
处理单元,用于按照预设方式对所述目标数据表进行处理,以降低所述Hadoop的数据库的存储容量占用率。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201810955956.5A 2018-08-21 2018-08-21 测试数据表的处理方法、装置、计算机设备和存储介质 Pending CN109271381A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810955956.5A CN109271381A (zh) 2018-08-21 2018-08-21 测试数据表的处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810955956.5A CN109271381A (zh) 2018-08-21 2018-08-21 测试数据表的处理方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN109271381A true CN109271381A (zh) 2019-01-25

Family

ID=65154208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810955956.5A Pending CN109271381A (zh) 2018-08-21 2018-08-21 测试数据表的处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN109271381A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110457300A (zh) * 2019-07-15 2019-11-15 中国平安人寿保险股份有限公司 一种公共测试库的清理方法及装置、电子设备
CN112181938A (zh) * 2019-07-05 2021-01-05 杭州海康威视数字技术股份有限公司 数据库清理方法、装置和计算机可读存储介质
CN112363886A (zh) * 2020-11-10 2021-02-12 中国平安人寿保险股份有限公司 数据库监控方法、系统、终端及存储介质
CN112579344A (zh) * 2019-09-29 2021-03-30 北京国双科技有限公司 数据处理方法、装置及设备

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0994734A (ja) * 1995-09-29 1997-04-08 Nippei Toyama Corp 加工機制御装置
CN105260140A (zh) * 2015-10-21 2016-01-20 浪潮(北京)电子信息产业有限公司 磁盘容量监控方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0994734A (ja) * 1995-09-29 1997-04-08 Nippei Toyama Corp 加工機制御装置
CN105260140A (zh) * 2015-10-21 2016-01-20 浪潮(北京)电子信息产业有限公司 磁盘容量监控方法及装置

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
DDSHANG: "Hive 执行时磁盘空间不足的问题", pages 1 - 4 *
胡军 等: "摩托车制动器性能测控系统数据库设计", vol. 30, no. 30, pages 42 - 47 *
郭建伟: "巧用"魔棒"智能调控进程", 电脑知识与技术, no. 2, 29 February 2016 (2016-02-29), pages 34 - 36 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112181938A (zh) * 2019-07-05 2021-01-05 杭州海康威视数字技术股份有限公司 数据库清理方法、装置和计算机可读存储介质
CN110457300A (zh) * 2019-07-15 2019-11-15 中国平安人寿保险股份有限公司 一种公共测试库的清理方法及装置、电子设备
CN110457300B (zh) * 2019-07-15 2024-02-02 中国平安人寿保险股份有限公司 一种公共测试库的清理方法及装置、电子设备
CN112579344A (zh) * 2019-09-29 2021-03-30 北京国双科技有限公司 数据处理方法、装置及设备
CN112363886A (zh) * 2020-11-10 2021-02-12 中国平安人寿保险股份有限公司 数据库监控方法、系统、终端及存储介质
CN112363886B (zh) * 2020-11-10 2023-07-25 中国平安人寿保险股份有限公司 数据库监控方法、系统、终端及存储介质

Similar Documents

Publication Publication Date Title
CN109271381A (zh) 测试数据表的处理方法、装置、计算机设备和存储介质
CN104424287B (zh) 数据查询方法和装置
CN103559299A (zh) 清理文件的方法、装置及移动终端
CN101552976B (zh) 多业务格式文件处理系统及方法
CN109002484A (zh) 一种用于顺序消费数据的方法及系统
CN101635651A (zh) 一种网络日志数据管理方法、系统及装置
CN104731816A (zh) 一种处理异常业务数据的方法和装置
CN111476596B (zh) 基于同源设备的家庭人口数据处理方法、系统及存储介质
CN103077197A (zh) 一种数据存储方法装置
CN109800131A (zh) Linux服务器的监控处理方法、装置、计算机设备和存储介质
CN108492005A (zh) 项目数据处理方法、装置、计算机设备和存储介质
CN109325026A (zh) 基于大数据平台的数据处理方法、装置、设备及介质
CN112948504B (zh) 数据采集方法、装置、计算机设备和存储介质
CN110737717B (zh) 一种数据库迁移方法及装置
CN106021566A (zh) 一种提高单台数据库并发处理能力的方法、装置及系统
CN107590162A (zh) 日志文件的存储方法及装置
CN116126843A (zh) 一种数据质量评估方法、装置、电子设备和存储介质
US11829377B2 (en) Efficient storage method for time series data
CN106156129A (zh) 文件管理方法及装置
US20070260579A1 (en) Method of designing query classification component for multilevel dbms
CN106021492A (zh) 一种对表格数据进行转存的方法及装置
CN101431760B (zh) 业务报表实现方法及系统
CN110457279B (zh) 数据离线扫描方法、装置、服务器及可读存储介质
CN107450907A (zh) 指纹模组的兼容方法、移动终端及具有存储功能的装置
CN110932935A (zh) 资源控制方法、装置、设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190125

RJ01 Rejection of invention patent application after publication