CN113111071B - 对象处理方法、装置、非易失性存储介质及处理器 - Google Patents

对象处理方法、装置、非易失性存储介质及处理器 Download PDF

Info

Publication number
CN113111071B
CN113111071B CN202110513417.8A CN202110513417A CN113111071B CN 113111071 B CN113111071 B CN 113111071B CN 202110513417 A CN202110513417 A CN 202110513417A CN 113111071 B CN113111071 B CN 113111071B
Authority
CN
China
Prior art keywords
target
information
data object
task
data objects
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110513417.8A
Other languages
English (en)
Other versions
CN113111071A (zh
Inventor
杨瑞峰
卢行
王豪迈
胥昕
翟静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Xingchen Tianhe Technology Co ltd
Original Assignee
Beijing Xingchen Tianhe Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Xingchen Tianhe Technology Co ltd filed Critical Beijing Xingchen Tianhe Technology Co ltd
Priority to CN202110513417.8A priority Critical patent/CN113111071B/zh
Publication of CN113111071A publication Critical patent/CN113111071A/zh
Application granted granted Critical
Publication of CN113111071B publication Critical patent/CN113111071B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2219Large Object storage; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/485Task life-cycle, e.g. stopping, restarting, resuming execution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种对象处理方法、装置、非易失性存储介质及处理器。其中,该方法包括:获取分层任务信息,其中,分层任务信息包括存储桶的名称,目标天数和第一日期;根据分层任务信息,获取存储桶的多个目标日志信息,其中,多个目标日志信息为在同一时间区段中生成的日志信息,时间区段的起始时间为第一日期,时间区段的结束时间为当前日期减去目标天数得到的日期;读取多个目标日志信息,得到多个数据对象;根据目标天数,从多个数据对象中筛选得到目标数据对象。本发明解决了难以确定分布式存储服务中的目标数据对象的技术问题。

Description

对象处理方法、装置、非易失性存储介质及处理器
技术领域
本发明涉及大数据领域,具体而言,涉及一种对象处理方法、装置、非易失性存储介质及处理器。
背景技术
随着互联网的高速度发展,海量非结构化数据需要存储,对象存储能够提供海量存储的解决方案。在很多应用场景中对象存储数据需要在热、温、冷数据之间流动,以追求更低的成本,因此,对象生命周期进行管理非常重要。为了帮助用户实现数据分层业务,需要建立分层任务以达到上述的目的,降低成本,满足业务需求。然而,在实际场景中执行对象的生命周期任务的时候,筛选符合要求的对象非常麻烦,难以做到高效、快速地识别符合条件的对象。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种对象处理方法、装置、非易失性存储介质及处理器,以至少解决难以确定分布式存储服务中的目标数据对象的技术问题。
根据本发明实施例的一个方面,提供了一种对象处理方法,包括:获取分层任务信息,其中,所述分层任务信息包括存储桶的名称,目标天数和第一日期,其中,所述存储桶为分布式存储服务中用于存储对象的容器;根据所述分层任务信息,获取所述存储桶的多个目标日志信息,其中,所述多个目标日志信息为在同一时间区段中生成的日志信息,所述时间区段的起始时间为所述第一日期,所述时间区段的结束时间为当前日期减去所述目标天数得到的日期;读取所述多个目标日志信息,得到多个数据对象;根据所述目标天数,从所述多个数据对象中筛选得到目标数据对象。
可选地,根据所述目标天数,从所述多个数据对象中筛选得到目标数据对象,包括:获取分别与所述多个数据对象匹配的多个生命周期任务;获取所述多个生命周期任务各自包括的分层任务的配置天数;在生命周期任务包括第一分层任务的情况下,确定与所述生命周期任务匹配的数据对象为所述目标数据对象,其中,所述第一分层任务的配置天数与所述目标天数相同。
可选地,从所述多个数据对象中筛选得到目标数据对象之后,还包括:对所述目标数据对象执行所述生命周期任务。
可选地,对所述目标数据对象执行所述生命周期任务,包括:在所述生命周期任务包括第二分层任务的情况下,检查所述目标数据对象,其中,所述第二分层任务的配置天数小于所述目标天数;在通过检查确定所述目标数据对象已执行所述第二分层任务的情况下,对所述目标数据对象执行所述第一分层任务。
可选地,在根据所述分层任务信息,获取所述存储桶的多个目标日志信息之前,还包括:获取多个初始数据对象的元数据;使用多个索引信息分别存储所述多个初始数据对象的参数信息,其中,所述多个初始数据对象的参数信息包括所述多个初始数据对象的元数据;扫描所述多个索引信息,生成初始日志信息,其中,所述初始日志信息包括所述多个目标日志信息。
可选地,使用多个索引信息分别存储所述多个初始数据对象的参数信息,包括:获取所述多个初始数据对象的更新状态,其中,所述多个初始数据对象的参数信息包括所述多个初始数据对象的更新状态;在第一初始数据对象的更新状态为已更新的情况下,生成所述第一初始数据对象的索引信息,其中,所述第一初始数据对象的索引信息包括第一索引信息和第二索引信息,所述多个初始数据对象包括所述第一初始数据对象;使用所述第一索引信息存储所述第一初始数据对象的元数据,使用所述第二索引信息标识所述第一初始数据对象的更新状态;在第二初始数据对象的更新状态为未更新的情况下,生成所述第二初始数据对象的索引信息,其中,所述多个初始数据对象包括所述第二初始数据对象;使用所述第二初始数据对象的索引信息存储所述第二初始数据对象的元数据。
可选地,扫描所述多个索引信息,生成多个初始日志信息,包括:扫描所述第二索引信息,得到所述第一初始数据对象;扫描所述第一初始数据对象的索引信息,得到所述初始日志信息。
根据本发明实施例的另一方面,还提供了一种对象处理装置,包括:第一获取模块,用于获取分层任务信息,其中,所述分层任务信息包括存储桶的名称,目标天数和第一日期,其中,所述存储桶为分布式存储服务中用于存储对象的容器;第二获取模块,用于根据所述分层任务信息,获取所述存储桶的多个目标日志信息,其中,所述多个目标日志信息为在同一时间区段中生成的日志信息,所述时间区段的起始时间为所述第一日期,所述时间区段的结束时间为当前日期减去所述目标天数得到的日期;读取模块,用于读取所述多个目标日志信息,得到多个数据对象;筛选模块,用于根据所述目标天数,从所述多个数据对象中筛选得到目标数据对象。
根据本发明实施例的另一方面,还提供了一种非易失性存储介质,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行上述任意一项所述对象处理方法。
根据本发明实施例的另一方面,还提供了一种处理器,包括:所述程序运行时执行上述任意一项所述对象处理方法。
在本发明实施例中,采用获取分层任务信息的方式,通过根据分层任务信息,获取存储桶的多个目标日志信息,其中,多个目标日志信息为在同一时间区段中生成的日志信息,时间区段的起始时间为第一日期,时间区段的结束时间为当前日期减去目标天数得到的日期;读取多个目标日志信息,得到多个数据对象;根据目标天数,从多个数据对象中筛选得到目标数据对象,达到了确定存储桶中与分层任务信息对应目标数据对象的目的,从而实现了高效地确定分布式存储服务中的目标数据对象的技术效果,进而解决了难以确定分布式存储服务中的目标数据对象的技术问题。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例提供的对象处理方法的流程示意图;
图2是根据本发明可选实施方式提供的生命周期任务的示意图;
图3是根据本发明可选实施方式提供的日志扫描示意图;
图4是根据本发明可选实施方式提供的目标数据对象筛选的流程示意图;
图5是根据本发明实施例提供的对象处理装置的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例1
根据本发明实施例,提供了一种对象处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
在分布式存储服务中,可能包括海量的存储桶,有时甚至可能有上亿个存储桶。存储桶可以用于存储对象,每一个桶理论上空间无上限,在每个桶中可以创建文件夹目录,目录下可以有多个文件,其中,每个文件为一个对象。为了与存储生命周期任务规则的对象区分,本申请中将存储桶中存储的文件对象称为数据对象,将存储生命周期任务规则的对象称为生命周期对象。
分层任务为与数据对象对应的生命周期任务中的子任务。分层任务可以包括多种类型,例如,可以包括复制、分层、归档或者删除。其中,复制可以将本地的数据对象拷贝到次级存储,可以将数据对象的数据和元数据都迁移走;分层可以将本地的数据对象的数据拷贝到次级存储,并删除数据对象在本地的数据,保留指向次级存储的指针;归档可以将本地数据对象拷贝至次级存储,并将数据对象在本地的数据和元数据都删除;删除则将本地数据对象的数据和元数据都直接删除。
图1是根据本发明实施例提供的对象处理方法的流程示意图,如图1所示,该方法包括如下步骤:
步骤S102,获取分层任务信息,其中,分层任务信息包括存储桶的名称,目标天数和第一日期,其中,存储桶为分布式存储服务中用于存储对象的容器。
每一个存储桶中都存储了海量的数据对象,对应于每一个数据对象,都有一个生命周期任务,而生命周期任务中包括至少一个分层任务,用于规划该数据对象之后的分层动作。图2是根据本发明可选实施方式提供的生命周期任务的示意图,如图2所示,rule1、rule2和rule5分别为多个生命周期任务的命名,每个生命周期任务中可以包括一个或者多个分层任务,例如,生命周期任务rule1中,包括复制、分层、归档和删除四个分层任务,并且为每个分层任务设置了配置天数,具体的,1天后执行复制,15天后执行分层,20天后执行归档,50天后执行删除。正常情况下,当对一个数据对象执行完一个生命周期任务时,这个数据对象就按照配置天数的先后顺序执行完了该生命周期任务中的全部分层任务。图2中所示,每个生命周期任务中都有一个前缀,该前缀用于确定存储桶中的数据对象与该存储桶中的生命周期任务的对应关系,例如,当存储桶中有海量数据对象,而仅有少数的生命周期任务的情况下,每一个数据对象会按照与其相对应的生命周期任务执行该生命周期任务中包括的分层任务,并将执行记录进行保存。
分层任务信息可以用于存储一类分层任务的信息。可选地,分层任务信息可以存储在生命周期对象中的K-V键值对中,生命周期对象中存储有多个K-V键值对,通过读取K-V键值对中的信息以获取分层任务信息。每一条分层任务信息用于存储一类分层任务,这一类分层任务可以归属于同一个存储桶,且配置天数相同。例如,一条分层任务信息可以包括存储桶的名称、目标天数和第一日期,存储桶的名称可以包括存储桶的名字和存储桶的ID,存储桶的ID可以为全局唯一的ID,用于识别存储桶;目标天数为与该分层任务信息对应的分层任务的配置天数,例如,当目标天数为15天时,表示该分层任务信息对应的所有分层任务的配置天数均为15天;第一日期用于确定筛选目标数据对象的时间范围。
步骤S104,根据分层任务信息,获取存储桶的多个目标日志信息,其中,多个目标日志信息为在同一时间区段中生成的日志信息,时间区段的起始时间为第一日期,时间区段的结束时间为当前日期减去目标天数得到的日期。
可选地,第一日期可以预先指定,也可以采用其他方式确定,例如,可以将上一次根据分层任务信息对应的分层任务筛选目标数据对象的日期确定为第一日期。
步骤S106,读取多个目标日志信息,得到多个数据对象。具体的,可以通过读取目标日志信息,确定在目标日志信息对应的时间区段中上传或者更新的数据对象。
步骤S108,根据目标天数,从多个数据对象中筛选得到目标数据对象。可选地,在数据对象对应的生命周期任务中,如果包括配置天数与目标天数相同的分层任务,则可以确定该数据对象即为符合要求的目标数据对象。依次对多个数据对象执行上述检查,可以从多个数据对象中筛选得到符合要求的目标数据对象。
通过上述步骤,采用获取分层任务信息的方式,通过根据分层任务信息,获取存储桶的多个目标日志信息,其中,多个目标日志信息为在同一时间区段中生成的日志信息,时间区段的起始时间为第一日期,时间区段的结束时间为当前日期减去目标天数得到的日期;读取多个目标日志信息,得到多个数据对象;根据目标天数,从多个数据对象中筛选得到目标数据对象,达到了确定存储桶中与分层任务信息对应目标数据对象的目的,从而实现了高效地确定分布式存储服务中的目标数据对象的技术效果,进而解决了难以确定分布式存储服务中的目标数据对象技术问题。
作为一种可选的实施例,在根据分层任务信息,获取存储桶的多个目标日志信息之前,还可以采用如下方式生成存储桶中的初始日志信息:获取多个初始数据对象的元数据;使用多个索引信息分别存储多个初始数据对象的参数信息,其中,多个初始数据对象的参数信息包括多个初始数据对象的元数据;扫描多个索引信息,生成初始日志信息,其中,初始日志信息包括多个目标日志信息。
本可选的实施例公开了一种在存储桶中生成日志的方式。其中,初始数据对象可以是存入存储桶的文件对象,其元数据中可以记载该初始数据对象的文件名、文件大小、文件类型以及分层的历史过程信息等参数。索引信息可以用于存储初始数据对象的参数信息,例如可以存储初始数据对象的元数据,通过使用索引信息的方式,可以实现对存储桶中的海量的数据对象的元数据进行方便地查找和管理。可选地,索引信息可以存储在索引对象中,在索引对象中存储索引信息可以采用在索引对象中生成K-V键值对的形式,将索引信息存在K-V键值对中,便于查找和管理。
通过扫描索引信息,可以生成关于初始数据对象的初始日志信息。可选地,当上传新的初始数据对象时,索引对象中会创建一条新的与该初始数据对象对应的索引信息,用于记录包括该初始数据对象元数据的参数信息,当扫描到该索引信息时,即可生成记录了该初始数据对象的上传动作的日志信息;或者当初始数据对象发生更新时,该初始数据对象对应的索引信息也会发生变化,通过扫描索引信息,也可以生成与该初始数据对象对应的日志信息。
作为一种可选的实施例,使用多个索引信息分别存储多个初始数据对象的参数信息,可以采用如下方式:获取多个初始数据对象的更新状态,其中,多个初始数据对象的参数信息包括多个初始数据对象的更新状态;在第一初始数据对象的更新状态为已更新的情况下,生成第一初始数据对象的索引信息,其中,第一初始数据对象的索引信息包括第一索引信息和第二索引信息,多个初始数据对象包括第一初始数据对象;使用第一索引信息存储第一初始数据对象的元数据,使用第二索引信息标识第一初始数据对象的更新状态;在第二初始数据对象的更新状态为未更新的情况下,生成第二初始数据对象的索引信息,其中,多个初始数据对象包括第二初始数据对象;使用第二初始数据对象的索引信息存储第二初始数据对象的元数据。
本可选的实施例中提供了一种生成索引信息的方案,用于存储初始数据对象的参数信息。由于一个存储桶中可以包括海量的数据对象,因此与数据对象对应的索引信息也是海量的。为了便于后续扫描海量的索引信息生成日志信息的过程快速高效,可以采用如下方式生成索引信息:
S1,获取初始数据对象的更新状态,当初始数据对象为新上传的对象或者是更新过的对象,则其更新状态为已更新,否则为未更新;
S2,在初始数据对象的更新状态为已更新的情况下,生成该对象的索引信息时,分别生成用于存储该对象的元数据的第一索引信息,和用于标识该对象的更新状态的第二索引信息,第二索引信息可以不存储任何的内容,仅仅用于标识该对象的更新状态为已更新;
S3,在初始数据对象的更新状态为未更新的情况下,生成该对象的索引信息时,仅生成用于存储该对象的元数据的索引信息即可,而不需要生成标识该对象的更新状态的索引信息。
作为一种可选的实施例,生成多个初始日志信息,可以先扫描第二索引信息,得到第一初始数据对象;然后扫描第一初始数据对象的索引信息,得到初始日志信息。由于仅在初始数据对象的更新状态为已更新的情况下才会生成第二索引信息,因此通过扫描第二索引信息,可以方便快捷地直接确定索引对象中有哪些索引信息对应的初始数据对象为已更新的对象。第一初始数据对象即为通过扫描第二索引信息确定的已更新的数据对象,后续只需要生成针对第一初始数据对象的日志信息即可,针对第一初始数据对象的日志信息即为初始日志信息。
作为一种可选的实施例,可以根据目标天数,从多个数据对象中筛选得到目标数据对象,通过获取分别与多个数据对象匹配的多个生命周期任务,获取多个生命周期任务各自包括的分层任务的配置天数,然后在生命周期任务包括第一分层任务的情况下,确定与生命周期任务匹配的数据对象为目标数据对象,其中,第一分层任务的配置天数与目标天数相同。
需要说明的是,从日志信息中读取确定的多个数据对象并不全都是符合要求的目标数据对象,因此,可以对多个数据对象进行筛选。具体的,可以依次获取多个数据对象对应的生命周期任务,然后确定每个数据对象对应的生命周期任务中是否有符合要求的分层任务,例如,是否有配置天数与目标天数相同的分层任务,若有,则确定该数据对象为目标数据对象,并继续判断下一个数据对象,直到找出全部的符合要求的目标数据对象。
作为一种可选的实施例,从多个数据对象中筛选得到目标数据对象之后,还包括对目标数据对象执行生命周期任务。具体的,对目标数据对象执行生命周期任务,可以为对目标数据对象执行其生命周期任务中的配置天数与目标天数相同的分层任务。
作为一种可选的实施例,对目标数据对象执行生命周期任务,可以在生命周期任务包括第二分层任务的情况下,检查目标数据对象,其中,第二分层任务的配置天数小于目标天数;在通过检查确定目标数据对象已执行第二分层任务的情况下,对目标数据对象执行第一分层任务。
通过本可选的实施例,可以实现目标数据对象的生命周期任务的保序执行,避免生命周期任务中配置天数更小的第二分层任务尚未执行的情况下执行第一分层任务。
图3是根据本发明可选实施方式提供的日志扫描示意图。如图3所示,假设当前日期为2020-09-30,生命周期任务中的分层任务为删除创建30天的对象,该分层任务的配置天数为30天。对该分层任务的扫描检查在2020-09-30第一次执行,扫描范围从日志2020-06-01-0000001开始,结束位置为日志2020-08-31-0398777,因为范围较大,需要执行多天,效率较低。
第二次执行时间为2020-10-03,扫描从2020-09-01-0000001开始,结束位置为2020-09-02-066001。范围较小,可以快速完成执行。
第三次执行时间为2020-10-04,扫描从2020-09-03-0000001开始,结束位置为2020-09-03-0667701。范围较小。
本可选的实施方式中,可以通过确定扫描的日期区间,实现只扫描一天内上传的对象,扫描范围较小,满足对象存储生命周期的功能,降低扫描对资源的消耗,将筛选目标数据对象的性能与数据对象的规模解耦。
图4是根据本发明可选实施方式提供的目标数据对象筛选的流程示意图。如图4所示,从存储桶的初始数据对象中筛选得到目标数据对象,可以采用如下步骤:
步骤S41,获取存储桶1以及存储桶1中的初始数据对象;
步骤S42,创建一个索引对象,将存储桶1中的初始数据对象的元数据和更新状态均以索引信息的形式存入索引对象中,例如,数据对象1的更新状态为已更新,则与数据对象1对应的索引信息有两条,分别是存储元数据的第一索引信息和用于标识更新状态的第二索引信息,数据对象2和数据对象3的更新状态均为未更新,故与这两个数据对象对应的索引信息仅包括用于存储元数据的第一索引信息;
步骤S43,通过扫描索引对象中的第二索引信息,确定更行状态为已更新的数据对象,然后扫描已更新的数据对象的第一索引信息,生成与已更新的数据对象对应的日志信息;
步骤S44,获取分层任务信息,其中,分层任务信息可以以{存储桶名称:目标天数:第一日期}的形式拼接而成;
步骤S45,根据分层任务信息,确定读取存储桶1中的目标日志信息的范围,并读取该范围内的目标日志信息,具体的,该范围可以为一时间区段,时间区段的起始时间为第一日期,结束时间为当前日期减去目标天数得到的日期;
步骤S46,读取目标日志信息,从目标日志信息中获取已更新的数据对象;
步骤S47,根据分层任务信息中的目标天数,从数据对象中筛选得到目标数据对象。
实施例2
根据本发明实施例,还提供了一种用于实施上述对象处理方法的对象处理装置,图5是根据本发明实施例提供的对象处理装置的结构框图,如图5所示,该对象处理装置包括:第一获取模块52,第二获取模块54,读取模块56和筛选模块58,下面对该对象处理装置进行说明。
第一获取模块52,用于获取分层任务信息,其中,分层任务信息包括存储桶的名称,目标天数和第一日期,其中,存储桶为分布式存储服务中用于存储对象的容器;
第二获取模块54,连接于上述第一获取模块52,用于根据分层任务信息,获取存储桶的多个目标日志信息,其中,多个目标日志信息为在同一时间区段中生成的日志信息,时间区段的起始时间为第一日期,时间区段的结束时间为当前日期减去目标天数得到的日期;
读取模块56,连接于上述第二获取模块54,用于读取多个目标日志信息,得到多个数据对象;
筛选模块58,连接于上述读取模块56,用于根据目标天数,从多个数据对象中筛选得到目标数据对象。
此处需要说明的是,上述第一获取模块52,第二获取模块54,读取模块56和筛选模块58对应于实施例1中的步骤S102至步骤S108,多个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。
实施例3
本发明的实施例可以提供一种计算机设备,可选地,在本实施例中,上述计算机设备可以位于计算机网络的多个网络设备中的至少一个网络设备。该计算机设备包括存储器和处理器。
其中,存储器可用于存储软件程序以及模块,如本发明实施例中的对象处理方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的对象处理方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取分层任务信息,其中,所述分层任务信息包括存储桶的名称,目标天数和第一日期,其中,所述存储桶为分布式存储服务中用于存储对象的容器;根据所述分层任务信息,获取所述存储桶的多个目标日志信息,其中,所述多个目标日志信息为在同一时间区段中生成的日志信息,所述时间区段的起始时间为所述第一日期,所述时间区段的结束时间为当前日期减去所述目标天数得到的日期;读取所述多个目标日志信息,得到多个数据对象;根据所述目标天数,从所述多个数据对象中筛选得到目标数据对象。
可选的,上述处理器还可以执行如下步骤的程序代码:根据所述目标天数,从所述多个数据对象中筛选得到目标数据对象,包括:获取分别与所述多个数据对象匹配的多个生命周期任务;获取所述多个生命周期任务各自包括的分层任务的配置天数;在生命周期任务包括第一分层任务的情况下,确定与所述生命周期任务匹配的数据对象为所述目标数据对象,其中,所述第一分层任务的配置天数与所述目标天数相同。
可选的,上述处理器还可以执行如下步骤的程序代码:从所述多个数据对象中筛选得到目标数据对象之后,还包括:对所述目标数据对象执行所述生命周期任务。
可选的,上述处理器还可以执行如下步骤的程序代码:对所述目标数据对象执行所述生命周期任务,包括:在所述生命周期任务包括第二分层任务的情况下,检查所述目标数据对象,其中,所述第二分层任务的配置天数小于所述目标天数;在通过检查确定所述目标数据对象已执行所述第二分层任务的情况下,对所述目标数据对象执行所述第一分层任务。
可选的,上述处理器还可以执行如下步骤的程序代码:在根据所述分层任务信息,获取所述存储桶的多个目标日志信息之前,还包括:获取多个初始数据对象的元数据;使用多个索引信息分别存储所述多个初始数据对象的参数信息,其中,所述多个初始数据对象的参数信息包括所述多个初始数据对象的元数据;扫描所述多个索引信息,生成初始日志信息,其中,所述初始日志信息包括所述多个目标日志信息。
可选的,上述处理器还可以执行如下步骤的程序代码:使用多个索引信息分别存储所述多个初始数据对象的参数信息,包括:获取所述多个初始数据对象的更新状态,其中,所述多个初始数据对象的参数信息包括所述多个初始数据对象的更新状态;在第一初始数据对象的更新状态为已更新的情况下,生成所述第一初始数据对象的索引信息,其中,所述第一初始数据对象的索引信息包括第一索引信息和第二索引信息,所述多个初始数据对象包括所述第一初始数据对象;使用所述第一索引信息存储所述第一初始数据对象的元数据,使用所述第二索引信息标识所述第一初始数据对象的更新状态;在第二初始数据对象的更新状态为未更新的情况下,生成所述第二初始数据对象的索引信息,其中,所述多个初始数据对象包括所述第二初始数据对象;使用所述第二初始数据对象的索引信息存储所述第二初始数据对象的元数据。
可选的,上述处理器还可以执行如下步骤的程序代码:扫描所述多个索引信息,生成多个初始日志信息,包括:扫描所述第二索引信息,得到所述第一初始数据对象;扫描所述第一初始数据对象的索引信息,得到所述初始日志信息。
采用本发明实施例,提供了一种图像处理的方案。通过,从而达到了目的,进而解决了相关技术中,的技术问题。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
实施例4
本发明的实施例还提供了一种非易失性存储介质。可选地,在本实施例中,上述非易失性存储介质可以用于保存上述实施例1所提供的对象处理方法所执行的程序代码。
可选地,在本实施例中,上述非易失性存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中,或者位于移动终端群中的任意一个移动终端中。
可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:获取分层任务信息,其中,所述分层任务信息包括存储桶的名称,目标天数和第一日期,其中,所述存储桶为分布式存储服务中用于存储对象的容器;根据所述分层任务信息,获取所述存储桶的多个目标日志信息,其中,所述多个目标日志信息为在同一时间区段中生成的日志信息,所述时间区段的起始时间为所述第一日期,所述时间区段的结束时间为当前日期减去所述目标天数得到的日期;读取所述多个目标日志信息,得到多个数据对象;根据所述目标天数,从所述多个数据对象中筛选得到目标数据对象。
可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:根据所述目标天数,从所述多个数据对象中筛选得到目标数据对象,包括:获取分别与所述多个数据对象匹配的多个生命周期任务;获取所述多个生命周期任务各自包括的分层任务的配置天数;在生命周期任务包括第一分层任务的情况下,确定与所述生命周期任务匹配的数据对象为所述目标数据对象,其中,所述第一分层任务的配置天数与所述目标天数相同。
可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:从所述多个数据对象中筛选得到目标数据对象之后,还包括:对所述目标数据对象执行所述生命周期任务。
可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:对所述目标数据对象执行所述生命周期任务,包括:在所述生命周期任务包括第二分层任务的情况下,检查所述目标数据对象,其中,所述第二分层任务的配置天数小于所述目标天数;在通过检查确定所述目标数据对象已执行所述第二分层任务的情况下,对所述目标数据对象执行所述第一分层任务。
可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:在根据所述分层任务信息,获取所述存储桶的多个目标日志信息之前,还包括:获取多个初始数据对象的元数据;使用多个索引信息分别存储所述多个初始数据对象的参数信息,其中,所述多个初始数据对象的参数信息包括所述多个初始数据对象的元数据;扫描所述多个索引信息,生成初始日志信息,其中,所述初始日志信息包括所述多个目标日志信息。
可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:使用多个索引信息分别存储所述多个初始数据对象的参数信息,包括:获取所述多个初始数据对象的更新状态,其中,所述多个初始数据对象的参数信息包括所述多个初始数据对象的更新状态;在第一初始数据对象的更新状态为已更新的情况下,生成所述第一初始数据对象的索引信息,其中,所述第一初始数据对象的索引信息包括第一索引信息和第二索引信息,所述多个初始数据对象包括所述第一初始数据对象;使用所述第一索引信息存储所述第一初始数据对象的元数据,使用所述第二索引信息标识所述第一初始数据对象的更新状态;在第二初始数据对象的更新状态为未更新的情况下,生成所述第二初始数据对象的索引信息,其中,所述多个初始数据对象包括所述第二初始数据对象;使用所述第二初始数据对象的索引信息存储所述第二初始数据对象的元数据。
可选地,在本实施例中,非易失性存储介质被设置为存储用于执行以下步骤的程序代码:扫描所述多个索引信息,生成多个初始日志信息,包括:扫描所述第二索引信息,得到所述第一初始数据对象;扫描所述第一初始数据对象的索引信息,得到所述初始日志信息。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (9)

1.一种对象处理方法,其特征在于,包括:
获取分层任务信息,其中,所述分层任务信息包括存储桶的名称,目标天数和第一日期,所述存储桶为分布式存储服务中用于存储对象的容器;
根据所述分层任务信息,获取所述存储桶的多个目标日志信息,其中,所述多个目标日志信息为在同一时间区段中生成的日志信息,所述时间区段的起始时间为所述第一日期,所述时间区段的结束时间为当前日期减去所述目标天数得到的日期;
读取所述多个目标日志信息,得到多个数据对象,其中,所述多个数据对象为在所述多个目标日志信息对应的时间区段中上传或者更新的数据对象;
根据所述目标天数,从所述多个数据对象中筛选得到目标数据对象;
根据所述目标天数,从所述多个数据对象中筛选得到目标数据对象,包括:
获取分别与所述多个数据对象匹配的多个生命周期任务;
获取所述多个生命周期任务各自包括的分层任务的配置天数;
在生命周期任务包括第一分层任务的情况下,确定与所述生命周期任务匹配的数据对象为所述目标数据对象,其中,所述第一分层任务的配置天数与所述目标天数相同。
2.根据权利要求1所述的方法,其特征在于,从所述多个数据对象中筛选得到目标数据对象之后,还包括:对所述目标数据对象执行所述生命周期任务。
3.根据权利要求2所述的方法,其特征在于,对所述目标数据对象执行所述生命周期任务,包括:
在所述生命周期任务包括第二分层任务的情况下,检查所述目标数据对象,其中,所述第二分层任务的配置天数小于所述目标天数;
在通过检查确定所述目标数据对象已执行所述第二分层任务的情况下,对所述目标数据对象执行所述第一分层任务。
4.根据权利要求1所述的方法,其特征在于,在根据所述分层任务信息,获取所述存储桶的多个目标日志信息之前,还包括:
获取多个初始数据对象的元数据;
使用多个索引信息分别存储所述多个初始数据对象的参数信息,其中,所述多个初始数据对象的参数信息包括所述多个初始数据对象的元数据;
扫描所述多个索引信息,生成初始日志信息,其中,所述初始日志信息包括所述多个目标日志信息。
5.根据权利要求4所述的方法,其特征在于,使用多个索引信息分别存储所述多个初始数据对象的参数信息,包括:
获取所述多个初始数据对象的更新状态,其中,所述多个初始数据对象的参数信息包括所述多个初始数据对象的更新状态;
在第一初始数据对象的更新状态为已更新的情况下,生成所述第一初始数据对象的索引信息,其中,所述第一初始数据对象的索引信息包括第一索引信息和第二索引信息,所述多个初始数据对象包括所述第一初始数据对象;
使用所述第一索引信息存储所述第一初始数据对象的元数据,使用所述第二索引信息标识所述第一初始数据对象的更新状态;
在第二初始数据对象的更新状态为未更新的情况下,生成所述第二初始数据对象的索引信息,其中,所述多个初始数据对象包括所述第二初始数据对象;
使用所述第二初始数据对象的索引信息存储所述第二初始数据对象的元数据。
6.根据权利要求5所述的方法,其特征在于,扫描所述多个索引信息,生成多个初始日志信息,包括:
扫描所述第二索引信息,得到所述第一初始数据对象;
扫描所述第一初始数据对象的索引信息,得到所述初始日志信息。
7.一种对象处理装置,其特征在于,包括:
第一获取模块,用于获取分层任务信息,其中,所述分层任务信息包括存储桶的名称,目标天数和第一日期,其中,所述存储桶为分布式存储服务中用于存储对象的容器;
第二获取模块,用于根据所述分层任务信息,获取所述存储桶的多个目标日志信息,其中,所述多个目标日志信息为在同一时间区段中生成的日志信息,所述时间区段的起始时间为所述第一日期,所述时间区段的结束时间为当前日期减去所述目标天数得到的日期;
读取模块,用于读取所述多个目标日志信息,得到多个数据对象,其中,所述多个数据对象为在所述多个目标日志信息对应的时间区段中上传或者更新的数据对象;
筛选模块,用于根据所述目标天数,从所述多个数据对象中筛选得到目标数据对象;
其中,所述筛选模块还用于:获取分别与所述多个数据对象匹配的多个生命周期任务;获取所述多个生命周期任务各自包括的分层任务的配置天数;在生命周期任务包括第一分层任务的情况下,确定与所述生命周期任务匹配的数据对象为所述目标数据对象,其中,所述第一分层任务的配置天数与所述目标天数相同。
8.一种非易失性存储介质,其特征在于,所述非易失性存储介质包括存储的程序,其中,在所述程序运行时控制所述非易失性存储介质所在设备执行权利要求1至6中任意一项所述对象处理方法。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任意一项所述对象处理方法。
CN202110513417.8A 2021-05-11 2021-05-11 对象处理方法、装置、非易失性存储介质及处理器 Active CN113111071B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110513417.8A CN113111071B (zh) 2021-05-11 2021-05-11 对象处理方法、装置、非易失性存储介质及处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110513417.8A CN113111071B (zh) 2021-05-11 2021-05-11 对象处理方法、装置、非易失性存储介质及处理器

Publications (2)

Publication Number Publication Date
CN113111071A CN113111071A (zh) 2021-07-13
CN113111071B true CN113111071B (zh) 2024-05-07

Family

ID=76721964

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110513417.8A Active CN113111071B (zh) 2021-05-11 2021-05-11 对象处理方法、装置、非易失性存储介质及处理器

Country Status (1)

Country Link
CN (1) CN113111071B (zh)

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107148617A (zh) * 2014-09-19 2017-09-08 亚马逊科技公司 日志协调存储组的自动配置
CN107590182A (zh) * 2017-08-03 2018-01-16 华南理工大学 一种分布式日志收集方法
EP3327586A1 (en) * 2016-11-28 2018-05-30 Sap Se Physio-logical logging for in-memory row-oriented database system
CN109120678A (zh) * 2018-07-26 2019-01-01 北京百度网讯科技有限公司 用于分布式存储系统的服务托管的方法和装置
CN109471851A (zh) * 2018-10-17 2019-03-15 上海达梦数据库有限公司 数据处理方法、装置、服务器和存储介质
CN109525422A (zh) * 2018-10-31 2019-03-26 武汉雨滴科技有限公司 一种日志数据监控管理方法
CN109840157A (zh) * 2017-11-28 2019-06-04 中国移动通信集团浙江有限公司 故障诊断的方法、装置、电子设备和存储介质
CN110825526A (zh) * 2019-11-08 2020-02-21 欧冶云商股份有限公司 基于er关系的分布式调度方法及装置、设备以及存储介质
CN111078657A (zh) * 2019-12-26 2020-04-28 北京思特奇信息技术股份有限公司 一种分布式系统的业务日志查询方法、系统、介质及设备
CN111224963A (zh) * 2019-12-30 2020-06-02 北京安码科技有限公司 网络靶场任务复盘方法、系统、电子设备及存储介质
US10733002B1 (en) * 2016-06-28 2020-08-04 Amazon Technologies, Inc. Virtual machine instance data aggregation
CN112000806A (zh) * 2020-08-25 2020-11-27 携程旅游信息技术(上海)有限公司 异常日志监控分析方法、系统、设备及存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080294670A1 (en) * 2007-05-21 2008-11-27 Lazar Borissov Method and system for hierarchical logging
US10776439B2 (en) * 2017-11-17 2020-09-15 Vmware, Inc. Efficient log-file-based query processing

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107148617A (zh) * 2014-09-19 2017-09-08 亚马逊科技公司 日志协调存储组的自动配置
US10733002B1 (en) * 2016-06-28 2020-08-04 Amazon Technologies, Inc. Virtual machine instance data aggregation
EP3327586A1 (en) * 2016-11-28 2018-05-30 Sap Se Physio-logical logging for in-memory row-oriented database system
CN107590182A (zh) * 2017-08-03 2018-01-16 华南理工大学 一种分布式日志收集方法
CN109840157A (zh) * 2017-11-28 2019-06-04 中国移动通信集团浙江有限公司 故障诊断的方法、装置、电子设备和存储介质
CN109120678A (zh) * 2018-07-26 2019-01-01 北京百度网讯科技有限公司 用于分布式存储系统的服务托管的方法和装置
CN109471851A (zh) * 2018-10-17 2019-03-15 上海达梦数据库有限公司 数据处理方法、装置、服务器和存储介质
CN109525422A (zh) * 2018-10-31 2019-03-26 武汉雨滴科技有限公司 一种日志数据监控管理方法
CN110825526A (zh) * 2019-11-08 2020-02-21 欧冶云商股份有限公司 基于er关系的分布式调度方法及装置、设备以及存储介质
CN111078657A (zh) * 2019-12-26 2020-04-28 北京思特奇信息技术股份有限公司 一种分布式系统的业务日志查询方法、系统、介质及设备
CN111224963A (zh) * 2019-12-30 2020-06-02 北京安码科技有限公司 网络靶场任务复盘方法、系统、电子设备及存储介质
CN112000806A (zh) * 2020-08-25 2020-11-27 携程旅游信息技术(上海)有限公司 异常日志监控分析方法、系统、设备及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Key-Value型NoSQL本地存储系统研究;马文龙;朱妤晴;蒋德钧;熊劲;张立新;孟潇;包云岗;;计算机学报(第08期);第32-61页 *
基于Petri网的分层业务过程挖掘方法;刘聪;程龙;曾庆田;闻立杰;欧阳春;;计算机集成制造系统(第06期);第85-97页 *

Also Published As

Publication number Publication date
CN113111071A (zh) 2021-07-13

Similar Documents

Publication Publication Date Title
Hebig et al. The quest for open source projects that use UML: mining GitHub
AU2013329525B2 (en) System and method for recursively traversing the internet and other sources to identify, gather, curate, adjudicate, and qualify business identity and related data
JP5186390B2 (ja) ノードの番号付けによるファイル・システムのダンプ/復元のための方法、システム、およびデバイス
CN109063178B (zh) 一种自动扩展的自助分析报表的方法及装置
CN112965936B (zh) 一种异构分布式模型的处理方法、装置、设备和存储介质
CN110956269A (zh) 数据模型的生成方法、装置、设备以及计算机存储介质
CN111858301B (zh) 基于变更历史的组合服务测试用例集约简方法及装置
CN104461826A (zh) 对象流转监控的方法、装置及系统
CN113837584B (zh) 业务处理系统和基于业务处理系统的异常数据处理方法
CN113157414B (zh) 任务处理方法、装置、非易失性存储介质及处理器
CN113448946B (zh) 数据迁移方法及装置、电子设备
CN113111071B (zh) 对象处理方法、装置、非易失性存储介质及处理器
CN111176901B (zh) 一种hdfs删除文件恢复方法、终端设备及存储介质
CN110134434B (zh) 一种应用生成处理方法及系统、应用生成系统
CN110413587A (zh) 一种老化历史数据的方法和装置
CN114880387A (zh) 数据集成脚本生成方法及装置、存储介质及电子设备
CN104572943A (zh) 免安装程序清理方法及装置
CN114089962A (zh) 一种构件管理方法、设备及介质
CN113282586A (zh) 一种信息处理方法、装置、设备及可读存储介质
KR100986998B1 (ko) 서버의 개인정보 진단 방법 및 장치
CN111400243A (zh) 基于流水线服务的研发管理系统以及文件存储方法、装置
CN106469086B (zh) 事件处理方法和装置
CN116382596B (zh) 基于分布式技术的时空大数据存储方法及系统
CN116975007B (zh) 一种网络资产存储、展示的方法、系统、设备及介质
CN110716739B (zh) 一种代码变更信息统计方法、系统和可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information

Address after: 100094 101, floors 1-5, building 7, courtyard 3, fengxiu Middle Road, Haidian District, Beijing

Applicant after: Beijing Xingchen Tianhe Technology Co.,Ltd.

Address before: 100097 806-1xing, block B, block 2, Jinyuan times shopping center, lantianchang, Haidian District, Beijing

Applicant before: XSKY BEIJING DATA TECHNOLOGY Corp.,Ltd.

CB02 Change of applicant information
GR01 Patent grant
GR01 Patent grant