CN112597112B - 数据处理方法及装置、电子设备和存储介质 - Google Patents

数据处理方法及装置、电子设备和存储介质 Download PDF

Info

Publication number
CN112597112B
CN112597112B CN202011562642.2A CN202011562642A CN112597112B CN 112597112 B CN112597112 B CN 112597112B CN 202011562642 A CN202011562642 A CN 202011562642A CN 112597112 B CN112597112 B CN 112597112B
Authority
CN
China
Prior art keywords
storage device
period
data
file
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011562642.2A
Other languages
English (en)
Other versions
CN112597112A (zh
Inventor
张敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sensetime Technology Development Co Ltd
Original Assignee
Beijing Sensetime Technology Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sensetime Technology Development Co Ltd filed Critical Beijing Sensetime Technology Development Co Ltd
Priority to CN202011562642.2A priority Critical patent/CN112597112B/zh
Publication of CN112597112A publication Critical patent/CN112597112A/zh
Application granted granted Critical
Publication of CN112597112B publication Critical patent/CN112597112B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/162Delete operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/1737Details of further file system functions for reducing power consumption or coping with limited storage space, e.g. in mobile devices

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供一种数据处理方法及装置、电子设备和存储介质,该方法包括:在每个第一周期达到时,将每个第一周期内存入存储设备中的至少一个数据,读取至内存中;对读取至内存中的至少一个数据进行处理,获得待存储的文件,并将待存储的文件存入存储设备中,该文件包括一个标识信息;根据存储设备中所存储的各文件的标识信息,删除存储设备中的至少一个文件。即本申请将第一周期内的数据合并为一个文件,并为该文件设置标识信息。这样在后续的删除过程中,直接根据文件的标识信息删除文件,而无需多次读写操作,提高脏数据的删除效率,提高存储设备的使用寿命,不存在写放大,避免浪费存储空间。

Description

数据处理方法及装置、电子设备和存储介质
技术领域
本申请实施例涉及计算机技术领域,尤其涉及一种数据处理方法及装置、电子设备和存储介质。
背景技术
随着安全防范意识的增强,安防监控得到快速发展,在安防监控过程中会产生大量的视图特征数据,大量的视图特征数据的存储一直是安防领域研究的主要问题之一。目前视图特征数据采用轮转的方式进行存储,即存储设备中只存储最新一段时间内所产生的视图特征数据,最新一段时间之前所产生的视图特征数据为脏数据,需要从存储设备中删除,以释放存储空间。
目前安防领域通常采用基于日志结构合并树(log-structured merge tree,LSM-Tree)的存储系统来存储大量的视图特征数据。对于LSM-Tree而言,存储引擎中的文件是分层存储的,通过合并动作,从第i层和第i+1层选取若干文件,读入内存,对这些文件中的数据进行排序,以去除脏数据,然后将去除脏数据后的数据写入文件,放到第i+1层。
由此可知,LSM-Tree使用合并动作去除脏数据时,存在写放大,例如脏数据位于第N层时,要消除该脏数据需要进行N-1次读写操作,其效率低,影响存储设备的使用寿命,且存在写放大,浪费存储设备的存储空间。
发明内容
本申请实施例提供一种数据处理方法及装置、电子设备和存储介质,以向用户推送用户需要的软件信息。
第一方面,本申请实施例提供一种数据处理方法,包括:
在每个第一周期达到时,将每个第一周期内存入存储设备中的至少一个数据,读取至内存中;
对读取至内存中的至少一个数据进行处理,获得待存储的文件,并将待存储的文件存入存储设备中,文件包括标识信息;
根据存储设备中所存储的各文件的标识信息,删除存储设备中的至少一个文件。
可选的,上述标识信息为时间标识信息。
在第一方面的一种可能的实现方式中,根据存储设备中所存储的各文件的标识信息,删除存储设备中的至少一个文件,包括:根据存储设备中所存储的各文件的标识信息和第二周期,删除至少一个文件,其中第二周期大于第一周期。
在第一方面的一种可能的实现方式中,内存中存储有文件对应的索引,此时该方法还包括:从内存中移除至少一个文件的索引。
在第一方面的一种可能的实现方式中,该方法还包括:根据第一周期内存入存储设备中的数据量,以及存储设备的剩余空间大小,调整第二周期;
此时,上述根据存储设备中所存储的各文件的标识信息和第二周期,删除至少一个文件,包括:根据存储设备中所存储的各文件的标识信息和调整后的存储时长,删除至少一个文件。
在第一方面的一种可能的实现方式中,根据第一周期内存入存储设备中的数据量,以及存储设备的剩余空间大小,调整第二周期,包括:
在检测到第一预设数量个第一周期中,每个第一周期内存入存储设备中的数据量均小于第一预设值时,根据存储设备的剩余空间大小,增大第二周期;和/或,在检测到第二预设数量个第一周期中,每个第一周期内存入存储设备中的数据量均大于第二预设值时,根据存储设备的剩余空间大小,减小第二周期,其中第二预设值小于第一预设值。
在第一方面的一种可能的实现方式中,根据第一周期内存入存储设备中的数据量,以及存储设备的剩余空间大小,调整第二周期,包括:
根据第一周期内存入存储设备中的数据量大小,以及存储设备的剩余空间大小,向用户发送第一信息,第一信息用于指示第一周期内存入存储设备中的数据量大小、以及存储设备的剩余空间大小;
响应于用户发送的第二信息,调整存储时长,第二信息用于指示对存储时长进行调整。
在第一方面的一种可能的实现方式中,确定文件的标识信息的方式包括:
方式一,文件的标识信息是基于文件中每个数据对应的第一时间确定的,每个数据对应的第一时间为每个数据初次存入存储设备的时间。
方式二,文件的标识信息为文件中最后存入存储设备的数据所对应的第一时间。
方式三,文件的标识信息是基于文件的生成时间确定的。
在第一方面的一种可能的实现方式中,方法还包括:
根据第一周期内存入存储设备中的数据量大小,调整第一周期;
在每个第一周期达到时,将每个所述第一周期内存入存储设备中的至少一个数据,读取至内存中,包括:
在每一调整后的第一周期达到时,将每个所述调整后的第一周期内存入所述存储设备中的至少一个数据,读取至内存中。
在第一方面的一种可能的实现方式中,根据第一周期内存入存储设备中的数据量大小,调整第一周期,包括:
在检测到第三预设数量个第一周期内存入存储设备中的数据量大于第三预设值时,减小第一周期;和/或,在检测到第四预设数量个第一周期内存入存储设备中的数据量小于第四预设值时,增大第一周期。
在第一方面的一种可能的实现方式中,上述对读取至所述内存中的至少一个数据进行处理,获得待存储的文件,包括:
对读取至内存中的至少一个数据进行一次合并,得到待存储的文件。
第二方面,本申请实施例提供一种数据处理装置,包括:
读取模块,用于在每个第一周期达到时,将每个第一周期内存入存储设备中的至少一个数据,读取至内存中;
处理模块,用于对读取至内存中的至少一个数据进行处理,获得待存储的文件,并将待存储的文件存入存储设备中,文件包括标识信息;
删除模块,用于根据存储设备中所存储的各文件的标识信息,删除存储设备中的至少一个文件。
可选的,上述标识信息为时间标识信息。
在第二方面的一种可能的实现方式中,删除模块,具体用于根据存储设备中所存储的各文件的标识信息和第二周期,删除至少一个文件,其中第二周期大于第一周期。
在第二方面的一种可能的实现方式中,内存中存储有文件对应的索引,删除模块,还用于从内存中移除至少一个文件的索引。
在第二方面的一种可能的实现方式中,装置还包括调整模块;
调整模块,用于根据第一周期内存入存储设备中的数据量,以及存储设备的剩余空间大小,调整第二周期;
删除模块,具体用于根据存储设备中所存储的各文件的标识信息和调整后的存储时长,删除至少一个文件。
在第二方面的一种可能的实现方式中,调整模块,具体用于在检测到第一预设数量个第一周期中,每个第一周期内存入存储设备中的数据量均小于第一预设值时,根据存储设备的剩余空间大小,增大第二周期;和/或,在检测到第二预设数量个第一周期中,每个第一周期内存入存储设备中的数据量均大于第二预设值时,根据存储设备的剩余空间大小,减小第二周期,其中第二预设值小于第一预设值。
在第二方面的一种可能的实现方式中,装置还包括发送模块;
发送模块,用于根据第一周期内存入存储设备中的数据量大小,以及存储设备的剩余空间大小,向用户发送第一信息,第一信息用于指示第一周期内存入存储设备中的数据量大小、以及存储设备的剩余空间大小;
调整模块,具体用于响应于用户发送的第二信息,调整存储时长,第二信息用于指示对存储时长进行调整。
在第二方面的一种可能的实现方式中,文件的标识信息是基于文件中每个数据对应的第一时间确定的,每个数据对应的第一时间为每个数据初次存入存储设备的时间;或者,文件的标识信息为文件中最后存入存储设备的数据所对应的第一时间;或者,文件的标识信息是基于文件的生成时间确定的。
在第二方面的一种可能的实现方式中,文件的标识信息是基于文件的生成时间确定的。
在第二方面的一种可能的实现方式中,调整模块,还用于根据第一周期内存入存储设备中的数据量大小,调整第一周期;
读取模块,具体用于在每一调整后的第一周期达到时,将每个所述调整后的第一周期内存入所述存储设备中的至少一个数据,读取至内存中。
在第二方面的一种可能的实现方式中,调整模块,具体用于在检测到第三预设数量个第一周期内存入存储设备中的数据量大于第三预设值时,减小第一周期;和/或,在检测到第四预设数量个第一周期内存入存储设备中的数据量小于第四预设值时,增大第一周期。
在第二方面的一种可能的实现方式中,处理模块,具体用于对读取至所述内存中的所述至少一个数据进行一次合并,得到所述待存储的文件。
第三方面,本申请实施例提供一种电子设备,包括处理器和存储器;
所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序以实现上述第一方面任一项所述的数据处理方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,所述存储介质包括计算机指令,当所述指令被计算机执行时,使得所述计算机实现如第一方面任一项所述的数据处理方法。
第五方面,本申请实施例提供一种计算机程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,计算机的至少一个处理器可以从所述可读存储介质读取所述计算机程序,所述至少一个处理器执行所述计算机程序使得计算机实施第一方面任一所述的数据处理方法。
本申请实施例提供的数据处理方法及装置、电子设备和存储介质,通过在每个第一周期达到时,将每个第一周期内存入存储设备中的至少一个数据,读取至内存中;接着对读取至内存中的至少一个数据进行处理,获得待存储的文件,并将待存储的文件存入存储设备中,其中每个文件包括一个标识信息;最后,根据存储设备中所存储的各文件的标识信息,删除存储设备中的至少一个文件。即本申请实施例,通过设置第一周期,将第一周期内的数据合并为一个文件,并为该文件设置标识信息。这样在后续的删除过程中,直接根据文件的标识信息对文件进行删除,而无需进行多次读写操作,进而提高了脏数据的删除效率,提高存储设备的使用寿命,且不存在写放大,避免浪费存储设备的存储空间。
附图说明
图1为LSM树的一种可能的存储结构示意图;
图2为本申请实施例涉及的一种电子设备的结构示意图;
图3为本申请实施例涉及的数据处理方法的一种流程示意图;
图4为本申请实施例涉及的数据处理方法的另一种流程示意图;
图5为本申请实施例涉及的数据处理方法的又一种流程示意图;
图6为本申请实施例提供的数据处理装置的一种结构示意图;
图7为本申请实施例提供的数据处理装置的另一种结构示意图;
图8为本申请实施例提供的数据处理装置的另一种结构示意图;
图9为本申请实施例涉及的电子设备的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
应理解,在本申请实施例中,“与A对应的B”表示B与A相关联。在一种实现方式中,可以根据A确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息确定B。本文中的术语“多个”是指两个或两个以上。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等字样对功能和作用基本相同的相同项或相似项进行区分。本领域技术人员可以理解“第一”、“第二”等字样并不对数量和执行次序进行限定,并且“第一”、“第二”等字样也并不限定一定不同。
为了便于理解本申请的实施例,首先对本申请实施例涉及到的相关概念进行如下简单介绍:
写放大(read and write amplification)是LSM-tree的主要问题,具体是:写放大=磁盘上实际写的数据量/用户需要的数据量。需要说明的是,该上式中所述的数据量是指与存储设备交互的数据量,而与在内存里处理的次数无关,例如,用户要写1KB数据到存储设备,但是该数据在内存里经过多次处理后,写入存储设备中10KB的数据,则写放大为10。
日志结构合并树(Log-structured merge-tree,LSM Tree)是一种广泛应用于数据存储领域的多层树形数据结构,是专门为key-value存储系统设计的,具有如下特点:
(1)数据分层放置:数据在最初时写入的是存储系统(以LSM树结构存储数据的系统)中的内存空间,再从上到下逐渐写入其他层次的硬盘驱动器(Hard Disk Drive,HDD)或固态硬盘(Solid State Drive,SSD)等持久化存储设备中。
(2)数据异地更新,将key-value结构的数据以日志(log)的方式写入。
(3)系统的后台进程不断地将数据从上层到下层(例如从第L0层到第LN层)合并,将键(key)值相同的数据中的较旧的版本删除,保留排序的新版本。数据随着合并的进行,数据不断由上层存储空间向下层存储空间移动。
LSM包括多层(level),当某层的数据大小超过预设阈值时,该层中的某个范围内的数据与下一层中的相同的范围内的数据进行合并操作。因此,先写入LSM的数据经过多次合并排序之后,一般被置于相对较大的层级,而后写入LSM的数据则被置于相对较小的层级。
图1为LSM树的一种可能的存储结构示意图,例如LSM树包括4层,自下而上将每层分别标记为Li,其中,0≤i≤4,从第L0层到第L4层每层的存储空间大小呈递增趋势,也就是,第L0层的存储空间最小,第L4层的存储空间最大。通常,第L0层设置在内存中,也是数据最开始写入的一层,其他各层设置在持久化存储设备(如磁盘)中。由系统的后台进程不断地将数据从低层到高层合并(Compaction),将key相同的K-V结构中的较旧的版本删除,保留排序的新版本。这样,随着Compaction的进行,数据就由内存转向存储设备,再从存储设备的低层向高层移动,避免了随机I/O直接对持久化设备的影响。
目前安防领域通常采用基于LSM-Tree的存储系统来存储大量的视图特征数据,且在预设的删除时间到达时,写入删除标记来标记要删除的数据,通过合并来删除数据。例如图1所示,在预设的特征数据A的删除时间到达时,在第L0层写入“标记删除特征数据“A”的信息,而特征数据A在第L3层存储。通过合并的方式删除特征数据A,具体是,第L0层的所有数据与第L1层的最左侧的存储区域中的数据进行合并。当第L1层的最左侧的存储区域中存储的数据达到100MB时,将第L1层的左侧的存储区域和第L2层的最左侧的存储区域中的数据读入内存中进行合并,并将合并后的数据再写入第L2层最左侧的存储区域中。当第L2层最左侧的存储区域中存储的数据达到200MB时,将第L2层的最左侧的存储区域和第L3层的数据读入内存中进行合并,在合并的过程中,检测到标记的特征数据A位于第L3层,则删除特征数据A,并将合并后的数据再写入第L3层。
由上述可知,基于LSM-Tree的存储系统,在删除特征数据A的过程中,需要对存储设备进行多次读写操作,其效率低,影响存储设备的使用寿命,且存在写放大,浪费存储设备的存储空间。
为了解决上述技术问题,本申请实施例提供的数据处理方法,通过设置第一周期,将第一周期内的数据合并为一个文件,并为该文件设置标识信息。这样在后续的删除过程中,直接根据文件的标识信息对文件进行删除,而无需进行多次读写操作,可以提高存储设备的使用寿命,可以及时删除脏数据,且不存在写放大,有效提高存储设备的存储空间利用率。
下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
首先结合图2对本申请实施例涉及的一种电子设备进行介绍,需要说明的是,图2仅示出了电子设备中的部分元件,该电子设备除了图2所示的元件外,还可以包括其他的元件,本申请实施例对此不做限制。
图2为本申请实施例涉及的一种电子设备的结构示意图,包括:处理器、内存和存储设备。
处理器可以与内存和存储设备进行信息交互,用于执行本申请实施例提供的数据处理方法。
存储设备用于存储数据。本申请实施例所述的存储设备可以为永久性存储设备,例如磁性介质(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
内存又称主存或主存储器,用于暂时存放处理器从存储设备中读取的数据。
在图2所示的电子设备的基础上,下面对本申请实施例涉及的数据处理方法进行详细描述。
图3为本申请实施例涉及的数据处理方法的一种流程示意图。如图3所示,本申请实施例的方法包括:
S101、在每个第一周期达到时,将每个第一周期内存入存储设备中的至少一个数据,读取至内存中。
本申请实施例的执行主体为具有数据处理功能的装置,例如为数据处理装置,该数据处理装置可以为图2所示的处理器。为了便于阐述,本申请实施例以执行主体为处理器为例进行说明。
上述第一周期为预先设定的,例如第一周期为24小时、12小时等。该第一周期可以根据实际情况进行调整,例如第一周期为24小时,但在24小时内的数据量较少时,为了降低不必要的读写次数,可以将该第一周期调大,例如将第一周期调整为36小时。再例如,在24小时内的数据量较多时,为了提高数据的处理速度,可以将该第一周期调小,例如将第一周期调整为12小时。对第一周期的具体调整过程可以参照下面图4所示的实施例,在此不再赘述。
可选地,上述第一周期为用户设置的,例如用户通过与电子设备之间的通信接口,输入该第一周期。
可选地,上述第一周期还可以是电子设备根据历史数据估计的。以安防领域为例,假设该电子设备与区域A的监控摄像头连接,则处理器获取区域A的监控摄像头在历史时长内产生的历史监控数据,并根据在该历史时长内所产生的历史监控数据量来确定上述第一周期,例如,当在该历史时长内所产生的历史监控数据量较大时,可以将第一周期设置的较小,当在该历史时长内所产生的历史监控数据量较小时,可以将第一周期设置的较大。
可选地,处理器还可以根据其他的方法确定上述第一周期,本申请实施例对此不做限制。
在实际应用中,处理器对第一周期进行监控,并在每个第一周期到达时,将每个第一周期内存入存储设备中的至少一个数据,读取至内存中。
S102、对读取至内存中的至少一个数据进行处理,获得待存储的文件,并将待存储的文件存入存储设备中。
本申请实施例获得的文件均包括一个标识信息,该标识信息用于唯一指示该文件,可选的,该标识信息为时间标识信息,用于标识文件对应的时间信息。
本申请实施例中确定文件的标识信息的方法包括但不限于如下几种:
方式一,文件的时间标识是基于文件中每个数据对应的第一时间确定的,其中每个数据对应的第一时间为每个数据初次存入存储设备的时间。
举例说明,以文件1为例,该文件1中包括数据1、数据2和数据3,其中,数据1初次写入存储设备的时间为时间1,数据2初次写入存储设备的时间为时间2,数据3初次写入存储设备的时间为时间3。也就是说,数据1对应的第一时间为时间1,数据2对应的第一时间为时间2,数据3对应的第一时间为时间3,这样处理器可以根据时间1、时间2和时间3来确定文件1的时间标识。
其中,基于文件中每个数据对应的第一时间确定文件的标识信息的方式包括但不限于如下几种示例:
示例一,将文件中最早存入存储设备的数据所对应的第一时间作为该文件的标识信息。继续以文件1为例,假设上述时间1早于时间2,时间2早于时间3,则将时间1作为文件1的标识信息。
示例二,将文件中各数据对应的第一时间的平均值作为该文件的标识信息。继续以文件1为例,将时间1、时间2和时间3这三个时间的时间平均值作为文件1的标识信息。
示例三,将文件中最后存入存储设备的数据所对应的第一时间作为文件的标识信息。继续以文件1为例,假设时间1早于时间2,时间2早于时间3,则将时间3作为文件1的标识信息。
方式二,将文件所包括的数据读入内存中的时间作为文件的标识信息。继续以文件1为例,假设处理器在时间b将存储设备中的数据1、数据2和数据3读入内存中,则将时间b作为文件1的标识信息。
方式三,文件的标识信息是基于文件的生成时间确定的。继续以文件1为例,假设处理器在时间a,对数据1、数据2和数据3进行处理,生成文件1,生成文件1的时间为时间d,则可以将时间d作为文件1的标识信息。
可选地,本申请实施例还可以采用其他的方式来确定文件的标识信息,本申请对此不做限制,只要文件的标识信息可以标识该文件对应的时间信息即可。
本步骤中,对读取至内存中的至少一个数据所进行处理可以是Compaction(合并)。例如,对读取至内存中的至少一个数据所进行一次合并,生成一个待存储的文件,且为该待存储的文件配置一个标识信息,并将配置有标识信息的待存储的文件存储至存储设备中。
可选地,存储设备中各文件按照标识信息的时间信息进行顺序排序。
为了便于说明本申请实施例的技术效果,先将本申请实施例与现有技术进行如下对比:
现有技术,每次向存储设备中存入新数据时,可能会造成对存储设备的多次读写操作。例如图1所示,首先从存储设备中读取第L1层左侧存储区域1内的数据c至内存,将数据c与位于内存中的特征数据进行合并,获得数据d,将数据d存入存储设备的第L1层左侧存储区域1内。由图1可知,假设存储区域1的大小为100MB,而数据d的大小为120MB,此时存储区域1无法存储数据d,则读取第L2层的左侧区域2中的数据e至内存,并将数据d与数据e进行合并得到数据f,将数据f存入第L2层的左侧区域2,如左侧区域2中无法存下数据f时,则继续上述步骤,直到LSM-Tree中存入数据f为止。由此可知,现有技术在存入新的数据时,可能造成对存储设备的多次读写操作,存在写放大,严重影存储设备的使用寿命,浪费存储设备的存储空间,且耗时。
而本申请实施例,通过设置第一周期,将第一周期内存入存储设备中的数据读入内存中,进行处理,生成一个待存储的文件,并为该待存储的文件配置一个标识信息,再将具有标识信息的待存储的文件存入存储设备中。依次类推,可以将每个第一周期内的数据生成一个文件存入存储设备中,且生成每个第一周期对应的文件的过程相互独立,互不干涉。也就是说,本申请实施例在存入新的数据时,不会读取之前第一周期对应的文件,进而减少了对存储设备的读写次数,不存在写放大,进而提高了存储设备的使用寿命,节约了存储设备的存储空间,且数据写入速度快。
在一些实施例中,将存储设备中第一周期1对应的数据读取至内存中进行处理,生成待存储的文件,将待存储的文件存入存储设备后,可以删除存储设备中原先存储的该第一周期1对应的数据。
在一些实施例中,第一周期内存入存储设备的至少一个数据可以是以数据文件的形式存在,例如将每两小时产生的数据存放在一个数据文件中。在这种情况下,上述S101可以是将第一周期内存入存储设备的至少一个数据文件读取内存中,对应的上述S102可以是对读入内存中的至少一个数据文件进行处理,生成一个待存储的文件。
S103、根据存储设备中所存储的各文件的标识信息,删除存储设备中的至少一个文件。
本申请实施例中,由于为每个文件配置一个标识信息,且每个文件之间相互独立,这样在后续删除过程中,直接根据文件的标识信息来删除存储设备中的至少一个文件即可,而无需进行多次读写操作,可以及时删除存储设备中的脏数据,提高存储设备的使用寿命,且不存在写放大,避免浪费存储设备的存储空间。
在一些实施例中,本申请实施例还包括第二周期,该第二周期可以理解为根据上述S101和S102生成的文件在存储设备中所存储的时间长度。该第二周期大于上述第一周期,例如,上述第二周期为365天,则上述生成的文件在存储设备中存储的最大时长为365天,也就是说,存储设备中存储的文件为365天内的文件,存储时长超过365天的文件则被删除。
此时,上述S103可以是包括步骤A:
步骤A,根据存储设备中所存储的各文件的标识信息和第二周期,删除至少一个文件。
具体是,根据存储设备中所存储的各文件的标识信息和第二周期,将存储时间超过第二周期的文件从存储设备中删除。
本申请实施例,通过设置第二周期,来确定文件的删除时机,不需要写入删除标记,删除过程简单,可以实现文件的快速删除。由上述图1所示,而现有技术需要写入删除标记,并要进行多次合并操作后,才可以删除文件,其效率差,过程繁琐,耗时。
在一些实施例中,内存中存储有文件对应的索引,此时,删除存储设备中的至少一个文件的同时,还需要从内存中移除该至少一个文件的索引。
本申请实施例提供的数据处理方法,通过在每个第一周期达到时,将每个第一周期内存入存储设备中的至少一个数据,读取至内存中;接着对读取至内存中的至少一个数据进行处理,获得待存储的文件,并将待存储的文件存入存储设备中,其中每个文件包括一个标识信息;最后,根据存储设备中所存储的各文件的标识信息,删除存储设备中的至少一个文件。即本申请实施例,通过设置第一周期,将第一周期内的数据合并为一个文件,并为该文件设置标识信息,用于标识该文件的时间信息。这样在后续的删除过程中,直接根据文件的标识信息对文件进行删除,而无需进行多次读写操作,进而提高了脏数据的删除效率,提高存储设备的使用寿命,且不存在写放大,避免浪费存储设备的存储空间。
在上述图3所示的实施例的基础上,本申请实施例还包括调整第二周期的步骤,具体如图4所示,包括:
S201、根据第一周期内存入存储设备中的数据量,以及存储设备的剩余空间大小,调整第二周期。
本申请实施例,根据第一周期内存入存储设备中的数据量大小,以及存储设备的剩余空间大小,调整第二周期包括但不限于如下情况:
情况1,在检测到第一预设数量个第一周期中,每个第一周期内存入存储设备中的数据量均小于第一预设值时,根据存储设备的剩余空间大小,增大第二周期。
上述第一预设数量为任意大于或等于1的正整数,例如为3、4、5等正整数。上述第一预设值为任意大于0的正数。
需要说明的是,上述第一预设数量和第一预设值均是用户预先设定的,且可以更改的,本申请实施例对第一预设数量和第一预设值的取值范围不做限制,具体根据实际情况确定。
在一种示例中,上述第一预设数量个第一周期可以为连续的第一周期,例如第一预设数量为3,则3个第一周期为连续的3个第一周期。
在另一种示例中,上述第一预设数量个第一周期可以为非连续的第一周期。例如第一预设数量为5,选择距离当前时刻最近的7个连续的第一周期,这7个连续的第一周期按照时间先后顺序为:第一周期1、第一周期2、第一周期3、第一周期4、第一周期5、第一周期6和第一周期7。选择这7个第一周期中任意5个第一周期作为第一预设数量个第一周期。
处理器检测第一预设数量个第一周期中,每个第一周期内存入存储设备的数据量均小于第一预设值时,则根据存储设备的剩余空间,将当前第二周期调大。
举例说明,假设当前的第一周期为24小时,第一预设数据量为3,处理器在检测到连续3天中每天存入存储设备的数据量均小于第一预设值,则处理器根据存储设备的剩余空间,将当前第二周期调大,例如从24个月调整为36个月。这样在后续数据删除过程中,处理器删除在存储设备中存储时间超过36个月的文件,进而延长文件在存储设备中的存储时间。
情况2,在检测到第二预设数量个第一周期中,每个第一周期内存入存储设备中的数据量均大于第二预设值时,根据存储设备的剩余空间大小,减小第二周期。第二预设值小于上述第一预设值
上述第二预设数量为任意大于或等于1的正整数,例如为3、4、5等正整数。上述第二预设值为任意大于0的正数。
需要说明的是,上述第二预设数量和第二预设值均是用户预先设定的,且可以更改的,本申请实施例对第二预设数量和第二预设值的取值范围不做限制,具体根据实际情况确定。
在一种示例中,上述第二预设数量个第一周期可以为连续的第一周期,例如第二预设数量为3,则3个第一周期为连续的3个第一周期。
在另一种示例中,上述第二预设数量个第一周期可以为非连续的第一周期。例如第二预设数量为5,选择距离当前时刻最近的7个连续的第一周期,这7个连续的第一周期按照时间先后顺序为:第一周期1、第一周期2、第一周期3、第一周期4、第一周期5、第一周期6和第一周期7。选择这7个第一周期中任意5个第一周期作为第二预设数量个第一周期。
处理器检测第二预设数量个第一周期中,每个第一周期内存入存储设备的数据量均大于第二预设值时,则根据存储设备的剩余空间,将当前第二周期调小。
举例说明,假设当前的第一周期为24小时,第二预设数据量为3,处理器在检测到连续3天中每天存入存储设备的数据量均大于第二预设值,则处理器根据存储设备的剩余空间,将当前第二周期调小,例如将当前第二周期从24个月调整为12个月。这样在后续数据删除过程中,处理器删除在存储设备中存储时间超过12个月的文件,进而及时删除脏数据,释放存储空间用于存储新的数据,从而提高存储设备的存储空间的利用率。
可选地,上述第一预设数量等于上述第二预设数量。
可选地,上述第二预设值小于上述第一预设值。
本申请实施例中,根据第一周期内存入存储设备中的数据量大小,以及存储设备的剩余空间大小,调整第二周期的方法包括但不限于如下几种:
方式一,根据第一周期内存入存储设备中的数据量大小,以及存储设备的剩余空间大小,处理器自动调整第二周期。
方式二,用户指示处理器调整第二周期,具体包括步骤B1和步骤B2:
步骤B1、根据第一周期内存入存储设备中的数据量大小,以及存储设备的剩余空间大小,向用户发送第一信息。
上述第一信息用于指示第一周期内存入存储设备中的数据量大小、以及存储设备的剩余空间大小。
步骤B2、响应于用户发送的第二信息,调整存储时长,第二信息用于指示对存储时长进行调整。
具体的,处理器根据第一周期内存入存储设备中的数据量大小,以及存储设备的剩余空间大小,向用户发送第一信息。用户根据第一信息所指示的第一周期内存入存储设备中的数据量大小、以及存储设备的剩余空间大小,向处理器输入第二信息,该第二信息用于指示对当前的存储时长进行调整。处理器根据第二信息的指示,调整当前第二周期。
例如,处理器在检测到第一预设数量个第一周期中,每个第一周期内存入存储设备中的数据量均小于第一预设值时,向用户发送第一信息,该第一信息用于指示每个第一周期内存入存储设备中的数据量,以及存储设备的剩余空间大小。用户根据第一信息所指示的每个第一周期内存入存储设备中的数据量,以及存储设备的剩余空间大小,向处理器发送第二信息,该第二信息用于指示将存储时长调大。
再例如,处理器在检测到第二预设数量个第一周期中,每个第一周期内存入存储设备中的数据量均大于第二预设值时,向用户发送第一信息,该第一信息用于指示每个第一周期内存入存储设备中的数据量,以及存储设备的剩余空间大小。用户根据第一信息所指示的每个第一周期内存入存储设备中的数据量,以及存储设备的剩余空间大小,向处理器发送第二信息,该第二信息用于指示将存储时长调小。
在一些实施例中,用户指示处理器对第二周期进行调整的指示方式包括但不限于如下几种:
方式一,用户向处理器发送的指示信息(例如第二信息)中包括调整后的第二周期。例如,当前第二周期为24个月,若用户发送的指示信息中包括36个月,则指示当前第二周期从24个月调整为36个月。
方式二,用户向处理器发送的指示信息(例如第二信息)中包括第二周期的调整增益值。例如,当前第二周期为24个月,若用户发送的指示信息中包括-8个月,则指示将第二周期从24个月调整为16个月,若用户发送的指示信息中包括+8个月,则指示将第二周期从24个月调整为32个月。
本申请实施例,根据上述步骤S201的方法,根据第一周期内存入存储设备中的数据量大小,以及存储设备的剩余空间大小,对第二周期进行调整,此时,上述S103可以被下面的S202替换。
S202、根据存储设备中所存储的各文件的标识信息和调整后的存储时长,删除至少一个文件。
举例说明,根据上述步骤S201将原有的存储时长24个月,调整为12个月,这样在后续删除过程中,根据文件的标识信息,将在存储设备中存储的时长超过12个月的文件从存储设备中删除。
可选地,在从存储设备中删除超过12个月的文件的同时,从内存中移除该文件对应的索引。
本申请实施例提供的数据处理过程,处理器根据第一周期内存入存储设备中的数据量,以及存储设备的剩余空间大小,可以灵活调整第二周期,这样在删除后续数据时,根据存储设备中所存储的各文件的标识信息和调整后的存储时长,来灵活删除文件。即本申请实施例,通过动态调整第二周期,实现了当第一周期内存入存储设备中的数据量较小时,根据存储设备的剩余空间,调大第二周期,以延长数据在存储设备中的存储时间。当第一周期内存入存储设备中的数据量较大时,根据存储设备的剩余空间,调小第二周期,使得存储设备及时释放空间用于存储新的数据。
在上述图3和图4所示的实施例的基础上,本申请实施例还包括调整第一周期的步骤,具体的如图5所示,包括:
S301、根据第一周期内存入存储设备中的数据量大小,调整第一周期。
本申请实施例,根据第一周期内存入存储设备中的数据量大小,调整第一周期包括但不限于如下情况:
情况1,在检测到第三预设数量个第一周期内存入存储设备中的数据量大于第三预设值时,减小第一周期。
上述第三预设数量为任意大于或等于1的正整数,例如为3、4、5等正整数。
上述第三预设值为任意大于0的正数,例如上述存入存储设备中的数据量为a比特时,则该第三预设值为大于a比特的任意比特值。
需要说明的是,上述第三预设数量和第三预设值均是用户预先设定的,且可以更改的,本申请实施例对第三预设数量和第三预设值的取值范围不做限制,具体根据实际情况确定。
在一种示例中,上述第三预设数量个第一周期可以为连续的第一周期。
在另一种示例中,上述第三预设数量个第一周期可以为非连续的第一周期。例如第三预设数量为5,选择距离当前时刻最近的7个连续的第一周期,这7个连续的第一周期按照时间先后顺序为:第一周期1、第一周期2、第一周期3、第一周期4、第一周期5、第一周期6和第一周期7。选择这7个第一周期中任意5个第一周期作为第三预设数量个第一周期。
处理器检测第三预设数量个第一周期中,每个第一周期内存入存储设备的数据量均大于第三预设值时,将当前的第一周期调大。
举例说明,假设当前的第一周期为24小时,第三预设数据量为3,处理器在检测到连续3天中每天存入存储设备的数据量均小于第三预设值,则处理器将当前的第一周期调大,例如调整为36小时。这样在后续数据处理过程中,处理器每隔36小时,将新存入存储设备中的数据读取至内存中进行合并处理,生成一个具有标识信息的文件存入存储设备中,进而减少了一个文件中所包括的数据量,提高处理器后期对该文件的读取性能。
情况2,在检测到第四预设数量个第一周期内存入存储设备中的数据量小于第四预设值时,增大第一周期。
上述第四预设数量为任意大于或等于1的正整数,例如为3、4、5等正整数。上述第四预设值为任意大于0的正数。
需要说明的是,上述第四预设数量和第四预设值均是用户预先设定的,且可以更改的,本申请实施例对第四预设数量和第四预设值的取值范围不做限制,具体根据实际情况确定。
在一种示例中,上述第四预设数量个第一周期可以为连续的第一周期。
在另一种示例中,上述第四预设数量个第一周期可以为非连续的第一周期。例如第四预设数量为5,选择距离当前时刻最近的7个连续的第一周期,这7个连续的第一周期按照时间先后顺序为:第一周期1、第一周期2、第一周期3、第一周期4、第一周期5、第一周期6和第一周期7。选择这7个第一周期中任意5个第一周期作为第四预设数量个第一周期。
处理器检测第四预设数量个第一周期中,每个第一周期内存入存储设备的数据量均小于第四预设值时,则将当前第一周期调大。
举例说明,假设当前的第一周期为24小时,第四预设数据量为3,处理器在检测到连续3天中每天存入存储设备的数据量均小于第四预设值,则处理器将当前的第一周期调大,例如将当前的第一周期从24小时调整为36个月。这样在后续数据处理过程中,处理器每隔36小时,将新存入存储设备中的数据读取至内存中进行合并处理,生成一个具有标识信息的文件存入存储设备中,进而减少了生成的文件数量,降低处理器读取文件的次数。
可选地,上述第三预设数量等于上述第四预设数量。
可选地,上述第三预设值大于上述第四预设值。
本申请实施例中,根据第一周期内存入存储设备中的数据量大小,调整第一周期的方法包括但不限于如下几种:
方式一,根据第一周期内存入存储设备中的数据量大小,处理器自动调整第一周期。
方式二,用户指示处理器调整第一周期。具体是,根据第一周期内存入存储设备中的数据量大小,向用户发送第三信息,该上述第三信息用于指示第一周期内存入存储设备中的数据量大小。用户根据第三信息所指示的第一周期内存入存储设备中的数据量大小,向处理器输入第四信息,该第四信息用于指示对当前的第一周期进行调整。处理器根据第四信息的指示,调整当前的第一周期。
例如,处理器在检测到第三预设数量个第一周期中,每个第一周期内存入存储设备中的数据量均大于第三预设值时,向用户发送第三信息,该第三信息用于指示每个第一周期内存入存储设备中的数据量。用户根据第三信息指示的每个第一周期内存入存储设备中的数据量,向处理器发送第四信息,该第四信息用于指示将第一周期调小,以减小每个文件所包括的数据量,便于文件的读取。
再例如,处理器在检测到第四预设数量个第一周期中,每个第一周期内存入存储设备中的数据量均小于第四预设值时,向用户发送第三信息,该第三信息用于指示每个第一周期内存入存储设备中的数据量。用户根据第三信息指示的每个第一周期内存入存储设备中的数据量,向处理器发送第四信息,该第四信息用于指示将第一周期调大,以增长处理器形成一个文件的时间,减小形成的文件的数量,降低处理器读取文件的次数,提高处理器的读性能。
在一些实施例中,用户指示处理器对第一周期进行调整的指示方式包括但不限于如下几种:
方式一,用户向处理器发送的指示信息(例如第四信息)中包括调整后的第一周期。例如,当前的第一周期为24小时,若用户发送的指示信息中包括36小时,则指示将第一周期从24小时调整为36小时。
方式二,用户向处理器发送的指示信息(例如第四信息)中包括第一周期的调整增益值。例如,当前的第一周期为24小时,若用户发送的指示信息中包括-8小时,则指示将第一周期从24小时调整为16小时,若用户发送的指示信息中包括+8小时,则指示将第一周期从24小时调整为32小时。
本申请实施例,根据上述步骤S301的方法,根据第一周期内存入存储设备中的数据量大小,对第一周期进行调整,此时,上述S101可以被下面S302替换。
S302、在每一调整后的第一周期达到时,将每个调整后的第一周期内存入存储设备中的至少一个数据,读取至内存中。
举例说明,根据上述步骤S301将第一周期从24小时调整为12小时,这样处理器每隔12小时,将初始存入存储设备中的数据读取至内存中,进行处理,生成一个文件。
本申请实施例提供的数据处理过程,处理器根据第一周期内存入存储设备中的数据量大小,可以灵活调整第一周期,例如在检测到第三预设数量个第一周期内存入存储设备中的数据量大于第三预设值时,减小第一周期,进而减少了一个文件中所包括的数据量,提高处理器后期对该文件的读取性能。再例如,在检测到第四预设数量个第一周期内存入存储设备中的数据量小于第四预设值时,增大第一周期,以减少生成的文件数量,降低处理器读取文件的次数,提高处理器的读取性能。
图6为本申请实施例提供的数据处理装置的一种结构示意图。该数据处理装置可以是电子设备,也可以是电子设备的部件(例如,集成电路,芯片等等),该电子设备可以为图1所示的电子设备。如图6所示,该数据处理装置100可以包括:读取模块110、处理模块120和删除模块130。
读取模块110,用于在每个第一周期达到时,将每个第一周期内存入存储设备中的至少一个数据,读取至内存中;
处理模块120,用于对读取至内存中的至少一个数据进行处理,获得待存储的文件,并将待存储的文件存入存储设备中,文件包括标识信息;可选的,标识信息为时间标识信息。
删除模块130,用于根据存储设备中所存储的各文件的标识信息,删除存储设备中的至少一个文件。
在一些实施例中,删除模块130,具体用于根据存储设备中所存储的各文件的标识信息和第二周期,删除至少一个文件,其中第二周期大于第一周期。
在一些实施例中,内存中存储有文件对应的索引,删除模块130,还用于从内存中移除至少一个文件的索引。
在一些实施例中,处理模块120,具体用于对读取至内存中的至少一个数据进行一次合并,得到待存储的文件。
本申请实施例的数据处理装置,可以用于执行上述各方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图7为本申请实施例提供的数据处理装置的另一种结构示意图。图7所示,本申请实施例的数据处理装置100还包括调整模块140;
调整模块140,用于根据第一周期内存入存储设备中的数据量,以及存储设备的剩余空间大小,调整第二周期;
删除模块130,具体用于根据存储设备中所存储的各文件的标识信息和调整后的存储时长,删除至少一个文件。
在一些实施例中,调整模块140,具体用于在检测到第一预设数量个第一周期中,每个第一周期内存入存储设备中的数据量均小于第一预设值时,根据存储设备的剩余空间大小,增大第二周期;和/或,在检测到第二预设数量个第一周期中,每个第一周期内存入存储设备中的数据量均大于第二预设值时,根据存储设备的剩余空间大小,减小第二周期,其中,二预设值小于第一预设值。
本申请实施例的数据处理装置,可以用于执行上述各方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图8为本申请实施例提供的数据处理装置的另一种结构示意图。图8所示,本申请实施例的数据处理装置100还包括发送模块150;
发送模块150,用于根据第一周期内存入存储设备中的数据量大小,以及存储设备的剩余空间大小,向用户发送第一信息,第一信息用于指示第一周期内存入存储设备中的数据量大小、以及存储设备的剩余空间大小;
调整模块140,具体用于响应于用户发送的第二信息,调整存储时长,第二信息用于指示对存储时长进行调整。
在一些实施例中,文件的标识信息是基于文件中每个数据对应的第一时间确定的,每个数据对应的第一时间为每个数据初次存入存储设备的时间;或者,文件的标识信息为文件中最后存入存储设备的数据所对应的第一时间;或者,文件的标识信息是基于文件的生成时间确定的。
在一些实施例中,调整模块140,还用于根据第一周期内存入存储设备中的数据量大小,调整第一周期;
读取模块110,具体用于在每一调整后的第一周期达到时,将每个所述调整后的第一周期内存入所述存储设备中的至少一个数据,读取至内存中。
在一些实施例中,调整模块140,具体用于在检测到第三预设数量个第一周期内存入存储设备中的数据量大于第三预设值时,减小第一周期;和/或,在检测到第四预设数量个第一周期内存入存储设备中的数据量小于第四预设值时,增大第一周期。
本申请实施例的数据处理装置,可以用于执行上述各方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。
图9为本申请实施例涉及的电子设备的框图,该设备可以是图2所示的电子设备,用于执行上述实施例的数据处理方法,具体参见上述方法实施例中的说明。
参照图9,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述数据处理方法实施例。
电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(I/O)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1932,上述指令可由电子设备1900的处理组件1922执行以完成上述数据处理方法。例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供了一种计算机程序产品,程序产品包括:计算机程序,计算机程序存储在可读存储介质中,服务器的至少一个处理器可以从可读存储介质读取计算机程序,至少一个处理器执行计算机程序使得服务器执行上述任一实施例提供的方案。
在示例性实施例中,还提供了一种计算机程序产品,包括计算机指令,计算机指令在被处理器执行时实现上述任一实施例提供的方案。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本申请实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘Solid State Disk(SSD))等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本发明旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求书指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求书来限制。

Claims (11)

1.一种数据处理方法,其特征在于,包括:
在每个第一周期达到时,将每个所述第一周期内存入存储设备中的至少一个数据,读取至内存中;
对读取至所述内存中的所述至少一个数据进行一次合并以生成待存储的文件,并将待存储的所述文件存入所述存储设备中,所述文件包括标识信息;
根据所述存储设备中所存储的各文件的标识信息,删除所述存储设备中的至少一个文件;
所述将待存储的所述文件存入所述存储设备中之后,还包括:
删除所述存储设备中存储的所述至少一个数据;
所述标识信息为时间标识信息;
所述根据所述存储设备中所存储的各文件的标识信息,删除所述存储设备中的至少一个文件,包括:
根据所述存储设备中所存储的各文件的标识信息和第二周期,删除所述至少一个文件,所述第二周期大于所述第一周期。
2.根据权利要求1所述的方法,其特征在于,所述内存中存储有文件对应的索引,所述方法还包括:
从所述内存中移除所述至少一个文件的索引。
3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
根据所述第一周期内存入所述存储设备中的数据量,以及所述存储设备的剩余空间大小,调整所述第二周期;
所述根据所述存储设备中所存储的各文件的标识信息和第二周期,删除所述至少一个文件,包括:
根据所述存储设备中所存储的各文件的标识信息和调整后的存储时长,删除所述至少一个文件。
4.根据权利要求3项所述的方法,其特征在于,所述根据所述第一周期内存入所述存储设备中的数据量,以及所述存储设备的剩余空间大小,调整所述第二周期,包括:
在检测到第一预设数量个所述第一周期中,每个所述第一周期内存入所述存储设备中的数据量均小于第一预设值时,根据所述存储设备的剩余空间大小,增大所述第二周期;和/或,
在检测到第二预设数量个所述第一周期中,每个所述第一周期内存入所述存储设备中的数据量均大于第二预设值时,根据所述存储设备的剩余空间大小,减小所述第二周期,所述第二预设值小于所述第一预设值。
5.根据权利要求3所述的方法,其特征在于,所述根据所述第一周期内存入所述存储设备中的数据量,以及所述存储设备的剩余空间大小,调整所述第二周期,包括:
根据所述第一周期内存入所述存储设备中的数据量大小,以及所述存储设备的剩余空间大小,向用户发送第一信息,所述第一信息用于指示所述第一周期内存入所述存储设备中的数据量大小、以及所述存储设备的剩余空间大小;
响应于所述用户发送的第二信息,调整所述存储时长,所述第二信息用于指示对所述存储时长进行调整。
6.根据权利要求1或2所述的方法,其特征在于,所述文件的标识信息是基于所述文件中每个数据对应的第一时间确定的,每个所述数据对应的第一时间为每个所述数据初次存入所述存储设备的时间;或者,所述文件的标识信息为所述文件中最后存入所述存储设备的数据所对应的第一时间;或者,所述文件的标识信息是基于所述文件的生成时间确定的。
7.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
根据所述第一周期内存入所述存储设备中的数据量大小,调整所述第一周期;
所述在每个第一周期达到时,将每个所述第一周期内存入存储设备中的至少一个数据,读取至内存中,包括:
在每一调整后的第一周期达到时,将每个所述调整后的第一周期内存入所述存储设备中的至少一个数据,读取至内存中。
8.根据权利要求7所述的方法,其特征在于,所述根据所述第一周期内存入所述存储设备中的数据量大小,调整所述第一周期,包括:
在检测到第三预设数量个所述第一周期内存入所述存储设备中的数据量大于第三预设值时,减小所述第一周期;和/或,
在检测到第四预设数量个所述第一周期内存入所述存储设备中的数据量小于第四预设值时,增大所述第一周期。
9.一种数据处理装置,其特征在于,包括:
读取模块,用于在每个第一周期达到时,将每个所述第一周期内存入存储设备中的至少一个数据,读取至内存中;
处理模块,用于对读取至所述内存中的所述至少一个数据进行一次合并以生成待存储的文件,并将待存储的所述文件存入所述存储设备中,所述文件包括标识信息;
删除模块,用于根据所述存储设备中所存储的各文件的标识信息,删除所述存储设备中的至少一个文件;
所述删除模块,还用于将待存储的所述文件存入所述存储设备中之后,删除所述存储设备中存储的所述至少一个数据;
所述标识信息为时间标识信息;
所述删除模块,具体用于根据所述存储设备中所存储的各文件的标识信息和第二周期,删除所述至少一个文件,所述第二周期大于所述第一周期。
10.一种电子设备,包括:存储器,处理器;
存储器;用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为:执行所述指令,以实现上述权利要求1至8任一项所述的数据处理方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至8任一项所述的数据处理方法。
CN202011562642.2A 2020-12-25 2020-12-25 数据处理方法及装置、电子设备和存储介质 Active CN112597112B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011562642.2A CN112597112B (zh) 2020-12-25 2020-12-25 数据处理方法及装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011562642.2A CN112597112B (zh) 2020-12-25 2020-12-25 数据处理方法及装置、电子设备和存储介质

Publications (2)

Publication Number Publication Date
CN112597112A CN112597112A (zh) 2021-04-02
CN112597112B true CN112597112B (zh) 2023-06-27

Family

ID=75202432

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011562642.2A Active CN112597112B (zh) 2020-12-25 2020-12-25 数据处理方法及装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN112597112B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113868082A (zh) * 2021-09-18 2021-12-31 浪潮电子信息产业股份有限公司 一种存储管控方法、装置、设备及计算机可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110297810A (zh) * 2019-07-05 2019-10-01 联想(北京)有限公司 一种流数据处理方法、装置及电子设备

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8620923B1 (en) * 2008-05-30 2013-12-31 Adobe Systems Incorporated System and method for storing meta-data indexes within a computer storage system
CN109783321B (zh) * 2019-01-24 2022-09-23 深圳市景阳信息技术有限公司 监控数据管理方法、装置、终端设备
CN111666260A (zh) * 2019-03-08 2020-09-15 杭州海康威视数字技术股份有限公司 数据处理方法及装置
CN111198856B (zh) * 2019-12-31 2023-12-29 北京旷视科技有限公司 文件管理方法、装置、计算机设备和存储介质

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110297810A (zh) * 2019-07-05 2019-10-01 联想(北京)有限公司 一种流数据处理方法、装置及电子设备

Also Published As

Publication number Publication date
CN112597112A (zh) 2021-04-02

Similar Documents

Publication Publication Date Title
US11604759B2 (en) Retention management for data streams
US9632826B2 (en) Prioritizing deferred tasks in pending task queue based on creation timestamp
US8818989B2 (en) Memory usage query governor
US9176805B2 (en) Memory dump optimization in a system
CN110609743A (zh) 用于配置资源的方法、电子设备和计算机程序产品
US20130006948A1 (en) Compression-aware data storage tiering
US8583608B2 (en) Maximum allowable runtime query governor
RU2651216C2 (ru) Способ, устройство и компьютерный носитель данных для перемещения данных
CN109726006B (zh) 用于控制存储系统的方法、装置和计算机存储介质
CN105574141B (zh) 一种对数据库进行数据迁移的方法和装置
CN109344296B (zh) 实现Redis的HASH键的域生命周期控制方法、系统、服务器及存储介质
US20220197539A1 (en) Method, electronic device, and computer program product for data processing
CN112597112B (zh) 数据处理方法及装置、电子设备和存储介质
CN115291806A (zh) 一种处理方法、装置、电子设备及存储介质
US20180018089A1 (en) Storing data in a stub file in a hierarchical storage management system
CN113742131B (zh) 用于存储管理的方法、电子设备和计算机程序产品
KR102175999B1 (ko) 컴퓨터 시스템에서의 입출력 완료 방법 및 이를 위한 컴퓨터 시스템
CN112711564B (zh) 合并处理方法以及相关设备
CN110413689B (zh) 一种内存数据库的多节点数据同步方法与装置
US20230100110A1 (en) Computing resource management method, electronic equipment and program product
CN115878042A (zh) 一种数据存储系统、数据处理方法及存储介质
CN114896215A (zh) 元数据的存储方法及装置
US11625184B1 (en) Recalling files from tape
US20220179782A1 (en) Buffer pool maintenance improvement
CN114416687A (zh) 一种时序数据的时间分层合并方法、装置、设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant