CN115544377A - 基于云端存储的档案的热度评估和更新方法 - Google Patents

基于云端存储的档案的热度评估和更新方法 Download PDF

Info

Publication number
CN115544377A
CN115544377A CN202211487065.4A CN202211487065A CN115544377A CN 115544377 A CN115544377 A CN 115544377A CN 202211487065 A CN202211487065 A CN 202211487065A CN 115544377 A CN115544377 A CN 115544377A
Authority
CN
China
Prior art keywords
heat
file
electronic
hot
electronic file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202211487065.4A
Other languages
English (en)
Other versions
CN115544377B (zh
Inventor
蔡利华
梁尔真
吴存锋
郑望献
周蕾
梁浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Xinghan Information Technology Ltd By Share Ltd
Original Assignee
Zhejiang Xinghan Information Technology Ltd By Share Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Xinghan Information Technology Ltd By Share Ltd filed Critical Zhejiang Xinghan Information Technology Ltd By Share Ltd
Priority to CN202211487065.4A priority Critical patent/CN115544377B/zh
Publication of CN115544377A publication Critical patent/CN115544377A/zh
Application granted granted Critical
Publication of CN115544377B publication Critical patent/CN115544377B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供一种基于云端存储的档案的热度评估和更新方法,属于数据处理技术领域,具体包括:基于电子档案的近三年的借阅次数、点击次数、存储时间得到基础热度;将基础热度大于第一热度阈值的电子档案作为潜在热门档案,并基于潜在热门档案的近一月的借阅次数、点击次数,对潜在热门档案的基础热度进行修正得到热度,并将热度大于第二热度阈值的潜在热门档案作为热门档案,基于热门档案的热度、热门档案的档案类型确定热门档案的备份的副本数量,从而实现了电子档案的热度的实时更新,提升了检索和借阅的效率。

Description

基于云端存储的档案的热度评估和更新方法
技术领域
本发明属于数据处理技术领域,具体涉及基于云端存储的档案的热度评估和更新方法。
背景技术
随着云端存储以及通信技术的进一步发展,使得通过云端存储实现对电子档案的管理的方式成为可能,不仅解决了纸质档案占用大量房间、不宜保存的难题,而且解决了以往调阅纸质文档不宜查找的难题。“云存储”免费提供多区域多数据副本功能服务,实现了灾备安全存储,进一步降低了档案永久保存存储成本。
为了解决采用远端存储的方式实现对电子档案的管理,在授权发明专利授权公告号CN113192586B《一种基于云档案库的档案管理系统》中通过云档案库存储用户需要存储的档案资料,用户管理模块对用户进行认证以及获取用户的操作指令,档案管理模块根据用户的操作指令对档案进行管理,派发管理模块根据用户的操作指令对档案资料进行唯一派发,从而解决了现有的基于云档案库的档案管理的系统中所存在档案资料大量重复、占用大量的存储空间不利于工作人员的准确查找的问题,但是却存在以下技术问题:
1、忽视了电子档案的热度的动态管理,不同的电子档案的点击次数、借阅次数、存储时间等反应电子档案的热度,若不能对电子档案的热度进行动态管理,从而会导致错误已经变为冷门的电子档案识别为热门档案,使得热门档案的查询和借阅效率都会受到影响,同时冷门档案的副本的过多存储也会导致存储资源的浪费。
2、在电子档案的备案的副本数量的确定过程中,忽视了同时将电子档案的热度与电子档案的类型同时作为电子档案的备份数量的考虑因素,仅仅考虑电子档案的热度或者电子档案的类型,都会导致电子档案的查询效率和存储资源的浪费。
基于上述技术问题,需要设计一种基于云端存储的档案的热度评估和更新方法。
发明内容
本发明的目的是提供一种基于云端存储的档案的热度评估和更新方法
为了解决上述技术问题,本发明第一方面提供了一种基于云端存储的档案的热度评估和更新方法,其特征在于,具体包括:
S11基于电子档案的近三年的借阅次数、点击次数,以及所述电子档案的存储时间,采用基于GSO算法优化的BP神经网络算法的基础热度预测模型,得到所述电子档案的基础热度;
S12判断所述电子档案的基础热度是否大于第一热度阈值,若是,则将所述基础热度大于第一热度阈值的电子档案作为潜在热门档案,并进入步骤S13,若否,则将所述电子方案作为冷门电子档案,并将所述冷门电子档案的基础热度作为所述冷门电子档案的热度,基于所述冷门电子档案的热度、冷门电子档案的档案类型确定所述冷门电子档案的备份的副本数量;
S13基于所述潜在热门档案的近一月的借阅次数、点击次数,对所述潜在热门档案的基础热度进行修正,得到所述潜在热门档案的热度,并判断所述潜在热门档案的热度是否大于第二热度阈值,若是,则将热度大于第二热度阈值的潜在热门档案作为热门档案,并进入步骤S14,若否,则将所述潜在热门档案作为冷门电子档案,并基于所述冷门电子档案的热度、冷门电子档案的档案类型确定所述冷门电子档案的备份的副本数量;
S14基于所述热门档案的热度、热门档案的档案类型确定所述热门档案的备份的副本数量。
通过基于电子档案的近三年的借阅次数、点击次数,以及所述电子档案的存储时间进行电子档案的基础热度的构建,从而充分集合了电子档案的受欢迎情况以及电子档案的存储时间,实现了从多角度对电子档案的基础热度的评价,也为进行电子档案的副本数量的确定奠定了基础。
通过第一热度阈值的设置,从而将基础热度较低的电子档案排除在外,进一步降低了进行进一步的热度的构建中系统处理的数量,进一步提升了处理的效率,保证了系统运行的可靠性和稳定性。
通过进一步结合近一月的借阅次数、点击次数,对所述潜在热门档案的基础热度进行修正,得到所述潜在热门档案的热度,从而实现了对潜在热门档案的实时更新,采用最近的数据保证了潜在热门档案的热度评价的可靠性以及识别的准确性。
通过基于所述热门档案的热度、热门档案的档案类型确定所述热门档案的备份的副本数量,从而使得副本数量的确定能够充分的考虑两方面的因素,在保证重要的档案类型的储存可靠性的同时,也促进了热度较高的档案的副本数量的需求,提升了档案检索借阅的效率。
进一步的技术方案在于,所述电子档案的基础热度的构建的具体步骤为:
S21基于所述电子档案的近三年的借阅次数与所有电子档案的近三年的平均借阅次数的比值构建所述电子档案的借阅比、基于所述电子档案的近三年的点击次数与所有电子档案的近三年的平均点击次数得到所述电子档案的点击比;
S22基于所述电子档案的借阅比与所述电子档案的点击比,得到所述电子档案的热度比,并判断所述电子档案的热度比是否第一阈值,若是,则进入步骤S23,若否,则将所述电子档案作为冷门电子档案,并将所述电子档案的基础热度设置为0,其中电子档案的基础热度的取值范围在0到1之间,基础热度的值越大,则所述电子档案的基础热度越高;
S23基于所述电子档案的热度比、所述电子档案的存储时间构建输入集,采用基于GSO算法优化的BP神经网络算法的基础热度优化预测模型,得到所述电子档案的基础热度。
通过借阅比、点击比、热度比的确定,从而使得在基础热度的构建中不仅仅考虑单一的档案的借阅数量、点击数量,而是充分考虑整体的点击数量和借阅数量,从而使得最终的基础热度的评估结果能够更加准确的反应电子档案的实际的基础热度。
通过第一阈值的设置,从而将热度较低的电子档案给排除在外,进一步降低了需要进行基础热度构建的电子档案的数量,提升了处理的效率。
通过热度比的构建,从而将借阅比以及点击比这两者结合起来,从而避免了从单一角度考虑借阅比或者点击比导致的准确度不高的技术问题,同时也降低了基础热度预测模型需要处理的数据的维度,进一步提升了效率。
进一步的技术方案在于,基于所述电子档案的借阅比与所述电子档案的点击比,采用基于层次分析法的模型,实现对所述电子档案的热度比的构建。
进一步的技术方案在于,第一热度阈值根据所有电子档案的基础热值的平均值、电子档案的数量进行确定,其中所述所有电子档案的基础热值的平均值越大,电子档案的数量越多,则所述第一热度阈值越大。
进一步的技术方案在于,所述档案类型至少包括国家机构档案、党派团体档案、企业单位档案、事业单位档案、名人档案;
进一步的技术方案在于,确定所述冷门电子档案的备份的副本数量的具体步骤为:
S31判断所述冷门电子档案的档案类型是否属于国家机构档案或者党派团体档案,若是,则按照所述热门档案的备份的副本数量的平均值确定所述冷门档案的备份的副本数量,若否,则进入步骤S32;
S32基于所述冷门电子档案的档案类型,采用专家打分的形式,确定所述冷门电子档案的可靠度要求评分;
S33基于所述冷门电子档案的可靠度要求评分、冷门电子档案的热度,构建所述冷门电子档案的备份重要性评分,并基于所述备份重要性评分的大小确定所述冷门电子档案的备份的副本数量。
通过可靠度要求评分的构建,从而实现了从数据角度对冷门电子档案的档案类型的解释,也使得最终的副本数量的确定变得更加的准确。
进一步的技术方案在于,潜在热门档案的热度构建的具体步骤为:
S41基于潜在热门档案的近一月的借阅次数与所有电子档案的近一月的平均借阅次数的比值构建所述潜在热门档案的近期借阅比、基于所述潜在热门档案的近一月的点击次数与所有电子档案的近一月的平均点击次数得到所述潜在热门档案的近期点击比;
S42基于所述潜在热门档案的近期借阅比与所述潜在热门档案的近期点击比,得到所述潜在热门档案的近期热度比,并判断所述潜在热门档案的近期热度比是否第二阈值,若是,则将所述潜在热门电子档案作为热门档案,并将所述潜在电子档案的热度设置为1,其中所述热度的取值范围在0到1之间,热度的值越大,则所述热度越高,若否,则进入步骤S43;
S43基于所述潜在热门档案的近期热度比,潜在热门档案的基础热度,采用基于GSO算法优化的BP神经网络算法的热度预测模型,得到所述潜在热门档案的热度
进一步的技术方案在于,当所述热门档案的热度大于第三阈值或者所述热门档案的档案类型属于国家机构档案或者党派团体档案,则将所述热门档案的备份的副本数量设置为备份数量上限值。
另一方面,本发明提供了一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时,实现上述的一种基于云端存储的档案的热度评估和更新方法。
另一方面,本发明提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的一种基于云端存储的档案的热度评估和更新方法。
其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点在说明书以及附图中所特别指出的结构来实现和获得。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
通过参照附图详细描述其示例实施方式,本发明的上述和其它特征及优点将变得更加明显。
图1是根据实施例1的一种基于云端存储的档案的热度评估和更新方法的流程图;
图2是实施例2中的一种计算机存储介质的框架图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式;相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。图中相同的附图标记表示相同或类似的结构,因而将省略它们的详细描述。
用语“一个”、“一”、“该”、“所述”用以表示存在一个或多个要素/组成部分/等;用语“包括”和“具有”用以表示开放式的包括在内的意思并且是指除了列出的要素/组成部分/等之外还可存在另外的要素/组成部分/等。
实施例1
为解决上述问题,根据本发明的一个方面,如图1所示,提供了一种基于云端存储的档案的热度评估和更新方法,其特征在于,具体包括:
S11基于电子档案的近三年的借阅次数、点击次数,以及所述电子档案的存储时间,采用基于GSO算法优化的BP神经网络算法的基础热度预测模型,得到所述电子档案的基础热度;
需要另外说明的是,当电子档案的存档时间不大于1年时,则直接将潜在热门档案的基础热度的平均值作为电子档案的平均值,不再进行电子档案的基础热度的构建。
需要另外说明的是,在实际的操作过程中可以采用基于神经网络算法或者层次分析法的方式,实现对电子档案的基础热度的构建。
需要另外说明的是,电子档案的基础热度的取值范围在0到1之间,电子档案的基础热度越高,则所述电子档案越受欢迎。
S12判断所述电子档案的基础热度是否大于第一热度阈值,若是,则将所述基础热度大于第一热度阈值的电子档案作为潜在热门档案,并进入步骤S13,若否,则将所述电子方案作为冷门电子档案,并将所述冷门电子档案的基础热度作为所述冷门电子档案的热度,基于所述冷门电子档案的热度、冷门电子档案的档案类型确定所述冷门电子档案的备份的副本数量;
需要另外说明的是,若电子档案的基础热度为1时,则直接将所述电子档案的热度设置为1,不再进入步骤S13,并且将所述电子档案的备份的副本数量设置为备份数量上限值,备份数量上限值至少为3。
需要另外说明的是,在实际操作时,可以首先冷门电子档案的档案类型,构建映射模型,得到档案类型所对应的最少的备份的副本数量,在此基础上,若冷门电子档案的热度小于一定的阈值,则采用最少的备份的副本数量,若大于或者等于一定的阈值,则再最少的备份的副本数量的基础上再加1。
S13基于所述潜在热门档案的近一月的借阅次数、点击次数,对所述潜在热门档案的基础热度进行修正,得到所述潜在热门档案的热度,并判断所述潜在热门档案的热度是否大于第二热度阈值,若是,则将热度大于第二热度阈值的潜在热门档案作为热门档案,并进入步骤S14,若否,则将所述潜在热门档案作为冷门电子档案,并基于所述冷门电子档案的热度、冷门电子档案的档案类型确定所述冷门电子档案的备份的副本数量;
需要另外说明的是,在实际操作时,可以采用基于神经网络算法的方式,基于潜在热门档案的近一月的借阅次数、点击次数,构建输入集,得到修正因子,对电子档案的基础热度进行修正。
需要另外说明的是,当潜在热门档案的近一月的借阅次数或者点击次数超过一定的阈值,则不再对基础热度进行修正,直接将潜在人们档案的热度设置为1。
需要另外说明的是,第二热度阈值根据电子档案的数量、电子档案的平均热度进行构建,具体的可以采用专家打分或者经验模型的方式进行构建。
S14基于所述热门档案的热度、热门档案的档案类型确定所述热门档案的备份的副本数量。
需要另外说明的是,在实际的操作过程中,根据热门档案的档案类型确定一个最低的备份的副本数量,在此基础上,通过热门档案的热度的大小,分为至少两个以上的等级,在不同的等级下面,在最低的备份的副本数量的基础上再进行数量的增加。
通过基于电子档案的近三年的借阅次数、点击次数,以及所述电子档案的存储时间进行电子档案的基础热度的构建,从而充分集合了电子档案的受欢迎情况以及电子档案的存储时间,实现了从多角度对电子档案的基础热度的评价,也为进行电子档案的副本数量的确定奠定了基础。
通过第一热度阈值的设置,从而将基础热度较低的电子档案排除在外,进一步降低了进行进一步的热度的构建中系统处理的数量,进一步提升了处理的效率,保证了系统运行的可靠性和稳定性。
通过进一步结合近一月的借阅次数、点击次数,对所述潜在热门档案的基础热度进行修正,得到所述潜在热门档案的热度,从而实现了对潜在热门档案的实时更新,采用最近的数据保证了潜在热门档案的热度评价的可靠性以及识别的准确性。
通过基于所述热门档案的热度、热门档案的档案类型确定所述热门档案的备份的副本数量,从而使得副本数量的确定能够充分的考虑两方面的因素,在保证重要的档案类型的储存可靠性的同时,也促进了热度较高的档案的副本数量的需求,提升了档案检索借阅的效率。
在另外一种可能的实施例中,所述电子档案的基础热度的构建的具体步骤为:
S21基于所述电子档案的近三年的借阅次数与所有电子档案的近三年的平均借阅次数的比值构建所述电子档案的借阅比、基于所述电子档案的近三年的点击次数与所有电子档案的近三年的平均点击次数得到所述电子档案的点击比;
需要另外说明的是,若电子档案的近三年的借阅次数为100次,所有电子档案的近三年的平均借阅次数为50次,则借阅比为2。
S22基于所述电子档案的借阅比与所述电子档案的点击比,得到所述电子档案的热度比,并判断所述电子档案的热度比是否第一阈值,若是,则进入步骤S23,若否,则将所述电子档案作为冷门电子档案,并将所述电子档案的基础热度设置为0,其中电子档案的基础热度的取值范围在0到1之间,基础热度的值越大,则所述电子档案的基础热度越高;
需要另外说明的是,电子档案的热度比的计算公式为:
Figure 379050DEST_PATH_IMAGE001
其中B2为电子档案的借阅比,B3为电子档案的点击比,K1、K2、K3为常数。
S23基于所述电子档案的热度比、所述电子档案的存储时间构建输入集,采用基于GSO算法优化的BP神经网络算法的基础热度优化预测模型,得到所述电子档案的基础热度。
需要另外说明的是,为提高GSO算法的收敛性,设计步长随迭代次数动态衰减,动态步长的计算公式为:
Figure 434731DEST_PATH_IMAGE002
式中:s(t)是第t代的步长;s0是初始步长;t是当前迭代次数;iter_max是最大迭代次数,rand(10-3,10-2)为取值在10-2到10-3之间的随机函数,K4、K5为常数。
GSO算法中选择移动的位置更新的计算公式为:
Figure 720218DEST_PATH_IMAGE003
Figure 722810DEST_PATH_IMAGE004
为萤火虫i与萤火虫j在第t代的欧氏距离,x i (t)第t代第i只萤火虫所处位置。
通过借阅比、点击比、热度比的确定,从而使得在基础热度的构建中不仅仅考虑单一的档案的借阅数量、点击数量,而是充分考虑整体的点击数量和借阅数量,从而使得最终的基础热度的评估结果能够更加准确的反应电子档案的实际的基础热度。
通过第一阈值的设置,从而将热度较低的电子档案给排除在外,进一步降低了需要进行基础热度构建的电子档案的数量,提升了处理的效率。
通过热度比的构建,从而将借阅比以及点击比这两者结合起来,从而避免了从单一角度考虑借阅比或者点击比导致的准确度不高的技术问题,同时也降低了基础热度预测模型需要处理的数据的维度,进一步提升了效率。
在另外一种可能的实施例中,基于所述电子档案的借阅比与所述电子档案的点击比,采用基于层次分析法的模型,实现对所述电子档案的热度比的构建。
在另外一种可能的实施例中,第一热度阈值根据所有电子档案的基础热值的平均值、电子档案的数量进行确定,其中所述所有电子档案的基础热值的平均值越大,电子档案的数量越多,则所述第一热度阈值越大。
在另外一种可能的实施例中,所述档案类型至少包括国家机构档案、党派团体档案、企业单位档案、事业单位档案、名人档案;
在另外一种可能的实施例中,确定所述冷门电子档案的备份的副本数量的具体步骤为:
S31判断所述冷门电子档案的档案类型是否属于国家机构档案或者党派团体档案,若是,则按照所述热门档案的备份的副本数量的平均值确定所述冷门档案的备份的副本数量,若否,则进入步骤S32;
需要另外说明的是,还可以根据设定好的国家机构档案或者党派团体档案备份的副本数量的要求,进行备份的副本数量的设置。
S32基于所述冷门电子档案的档案类型,采用专家打分的形式,确定所述冷门电子档案的可靠度要求评分;
需要另外说明的是,可靠度要求评分的取值范围在0到1之间,可靠性要求评分越大,说明该档案类型对可靠性要求的更高。
S33基于所述冷门电子档案的可靠度要求评分、冷门电子档案的热度,构建所述冷门电子档案的备份重要性评分,并基于所述备份重要性评分的大小确定所述冷门电子档案的备份的副本数量。
需要另外说明的是,备案重要性评分可以采用基于神经网络算法的方式也可以通过基于层次分析法模型,或者采用基于经验公式的方式实现对备案重要性评分的构建。
需要另外说明的是,根据冷门点在档案的备份重要性评分,构建至少二个以上的等级,对于不同的等级,对应其相对应的备份的副本数量的具体要求。
通过可靠度要求评分的构建,从而实现了从数据角度对冷门电子档案的档案类型的解释,也使得最终的副本数量的确定变得更加的准确。
在另外一种可能的实施例中,潜在热门档案的热度构建的具体步骤为:
S41基于潜在热门档案的近一月的借阅次数与所有电子档案的近一月的平均借阅次数的比值构建所述潜在热门档案的近期借阅比、基于所述潜在热门档案的近一月的点击次数与所有电子档案的近一月的平均点击次数得到所述潜在热门档案的近期点击比;
S42基于所述潜在热门档案的近期借阅比与所述潜在热门档案的近期点击比,得到所述潜在热门档案的近期热度比,并判断所述潜在热门档案的近期热度比是否第二阈值,若是,则将所述潜在热门电子档案作为热门档案,并将所述潜在电子档案的热度设置为1,其中所述热度的取值范围在0到1之间,热度的值越大,则所述热度越高,若否,则进入步骤S43;
S43基于所述潜在热门档案的近期热度比,潜在热门档案的基础热度,采用基于GSO算法优化的BP神经网络算法的热度预测模型,得到所述潜在热门档案的热度
在另外一种可能的实施例中,当所述热门档案的热度大于第三阈值或者所述热门档案的档案类型属于国家机构档案或者党派团体档案,则将所述热门档案的备份的副本数量设置为备份数量上限值。
实施例2
如图2所示,本发明提供了一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述的一种基于云端存储的档案的热度评估和更新方法。
实施例3
本发明提供了一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时,实现上述的一种基于云端存储的档案的热度评估和更新方法。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统和方法,也可以通过其它的方式实现。以上所描述的系统实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
以上述依据本发明的理想实施例为启示,通过上述的说明内容,相关工作人员完全可以在不偏离本项发明技术思想的范围内,进行多样的变更以及修改。本项发明的技术性范围并不局限于说明书上的内容,必须要根据权利要求范围来确定其技术性范围。

Claims (10)

1.一种基于云端存储的档案的热度评估和更新方法,其特征在于,具体包括:
S11基于电子档案的近三年的借阅次数、点击次数,以及所述电子档案的存储时间,采用基于GSO算法优化的BP神经网络算法的基础热度预测模型,得到所述电子档案的基础热度;
S12判断所述电子档案的基础热度是否大于第一热度阈值,若是,则将所述基础热度大于第一热度阈值的电子档案作为潜在热门档案,并进入步骤S13,若否,则将所述电子方案作为冷门电子档案,并将所述冷门电子档案的基础热度作为所述冷门电子档案的热度,基于所述冷门电子档案的热度、冷门电子档案的档案类型确定所述冷门电子档案的备份的副本数量;
S13基于所述潜在热门档案的近一月的借阅次数、点击次数,对所述潜在热门档案的基础热度进行修正,得到所述潜在热门档案的热度,并判断所述潜在热门档案的热度是否大于第二热度阈值,若是,则将热度大于第二热度阈值的潜在热门档案作为热门档案,并进入步骤S14,若否,则将所述潜在热门档案作为冷门电子档案,并基于所述冷门电子档案的热度、冷门电子档案的档案类型确定所述冷门电子档案的备份的副本数量;
S14基于所述热门档案的热度、热门档案的档案类型确定所述热门档案的备份的副本数量。
2.如权利要求1所述的档案的热度评估和更新方法,其特征在于,所述电子档案的基础热度的构建的具体步骤为:
S21基于所述电子档案的近三年的借阅次数与所有电子档案的近三年的平均借阅次数的比值构建所述电子档案的借阅比、基于所述电子档案的近三年的点击次数与所有电子档案的近三年的平均点击次数得到所述电子档案的点击比;
S22基于所述电子档案的借阅比与所述电子档案的点击比,得到所述电子档案的热度比,并判断所述电子档案的热度比是否第一阈值,若是,则进入步骤S23,若否,则将所述电子档案作为冷门电子档案,并将所述电子档案的基础热度设置为0,其中电子档案的基础热度的取值范围在0到1之间,基础热度的值越大,则所述电子档案的基础热度越高;
S23基于所述电子档案的热度比、所述电子档案的存储时间构建输入集,采用基于GSO算法优化的BP神经网络算法的基础热度优化预测模型,得到所述电子档案的基础热度。
3.如权利要求2所述的档案的热度评估和更新方法,其特征在于,基于所述电子档案的借阅比与所述电子档案的点击比,采用基于层次分析法的模型,实现对所述电子档案的热度比的构建。
4.如权利要求1所述的档案的热度评估和更新方法,其特征在于,第一热度阈值根据所有电子档案的基础热值的平均值、电子档案的数量进行确定,其中所述所有电子档案的基础热值的平均值越大,电子档案的数量越多,则所述第一热度阈值越大。
5.如权利要求1所述的档案的热度评估和更新方法,其特征在于,所述档案类型至少包括国家机构档案、党派团体档案、企业单位档案、事业单位档案、名人档案。
6.如权利要求5所述的档案的热度评估和更新方法,其特征在于,确定所述冷门电子档案的备份的副本数量的具体步骤为:
S31判断所述冷门电子档案的档案类型是否属于国家机构档案或者党派团体档案,若是,则按照所述热门档案的备份的副本数量的平均值确定所述冷门档案的备份的副本数量,若否,则进入步骤S32;
S32基于所述冷门电子档案的档案类型,采用专家打分的形式,确定所述冷门电子档案的可靠度要求评分;
S33基于所述冷门电子档案的可靠度要求评分、冷门电子档案的热度,构建所述冷门电子档案的备份重要性评分,并基于所述备份重要性评分的大小确定所述冷门电子档案的备份的副本数量。
7.如权利要求1所述的档案的热度评估和更新方法,其特征在于,潜在热门档案的热度构建的具体步骤为:
S41基于潜在热门档案的近一月的借阅次数与所有电子档案的近一月的平均借阅次数的比值构建所述潜在热门档案的近期借阅比、基于所述潜在热门档案的近一月的点击次数与所有电子档案的近一月的平均点击次数得到所述潜在热门档案的近期点击比;
S42基于所述潜在热门档案的近期借阅比与所述潜在热门档案的近期点击比,得到所述潜在热门档案的近期热度比,并判断所述潜在热门档案的近期热度比是否第二阈值,若是,则将所述潜在热门电子档案作为热门档案,并将所述潜在电子档案的热度设置为1,其中所述热度的取值范围在0到1之间,热度的值越大,则所述热度越高,若否,则进入步骤S43;
S43基于所述潜在热门档案的近期热度比,潜在热门档案的基础热度,采用基于GSO算法优化的BP神经网络算法的热度预测模型,得到所述潜在热门档案的热度。
8.如权利要求5所述的档案的热度评估和更新方法,其特征在于,当所述热门档案的热度大于第三阈值或者所述热门档案的档案类型属于国家机构档案或者党派团体档案,则将所述热门档案的备份的副本数量设置为备份数量上限值。
9.一种终端设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时,实现权利要求1-8任意一项所述的一种基于云端存储的档案的热度评估和更新方法。
10.一种计算机存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行权利要求1-8任意一项所述的一种基于云端存储的档案的热度评估和更新方法。
CN202211487065.4A 2022-11-25 2022-11-25 基于云端存储的档案的热度评估和更新方法 Active CN115544377B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211487065.4A CN115544377B (zh) 2022-11-25 2022-11-25 基于云端存储的档案的热度评估和更新方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211487065.4A CN115544377B (zh) 2022-11-25 2022-11-25 基于云端存储的档案的热度评估和更新方法

Publications (2)

Publication Number Publication Date
CN115544377A true CN115544377A (zh) 2022-12-30
CN115544377B CN115544377B (zh) 2023-04-07

Family

ID=84721135

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211487065.4A Active CN115544377B (zh) 2022-11-25 2022-11-25 基于云端存储的档案的热度评估和更新方法

Country Status (1)

Country Link
CN (1) CN115544377B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116451200A (zh) * 2023-06-14 2023-07-18 浙江星汉信息技术股份有限公司 一种基于云端存储的加密式档案资料的检索方法
CN117113440A (zh) * 2023-10-24 2023-11-24 浙江星汉信息技术股份有限公司 影像档案的完整性保护方法、系统与存储介质
CN117240613A (zh) * 2023-11-13 2023-12-15 浙江星汉信息技术股份有限公司 一种基于云端存储的档案风险管理方法与系统
CN117370272A (zh) * 2023-10-25 2024-01-09 浙江星汉信息技术股份有限公司 基于档案热度的档案管理方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103150347A (zh) * 2013-02-07 2013-06-12 浙江大学 基于文件热度的动态副本管理方法
US20140289492A1 (en) * 2013-03-19 2014-09-25 Samsung Electronics Co., Ltd. Method and an apparatus for analyzing data to facilitate data allocation in a storage device
CN108363643A (zh) * 2018-03-27 2018-08-03 东北大学 一种基于文件访问热度的hdfs副本管理方法
CN108416054A (zh) * 2018-03-20 2018-08-17 东北大学 基于文件访问热度的动态hdfs副本个数计算方法
CN109918481A (zh) * 2019-02-28 2019-06-21 深圳市海恒智能科技有限公司 自动化立体仓库存储图书的方法及系统
CN111124762A (zh) * 2019-12-30 2020-05-08 航天科工网络信息发展有限公司 一种基于改进粒子群算法的动态副本放置方法
CN111970046A (zh) * 2020-08-18 2020-11-20 北京邮电大学 一种面向无人机网络动态cache部署的协同传输方法
CN114827180A (zh) * 2022-06-22 2022-07-29 蒲惠智造科技股份有限公司 云端数据分布式存储的分配方法

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103150347A (zh) * 2013-02-07 2013-06-12 浙江大学 基于文件热度的动态副本管理方法
US20140289492A1 (en) * 2013-03-19 2014-09-25 Samsung Electronics Co., Ltd. Method and an apparatus for analyzing data to facilitate data allocation in a storage device
CN108416054A (zh) * 2018-03-20 2018-08-17 东北大学 基于文件访问热度的动态hdfs副本个数计算方法
CN108363643A (zh) * 2018-03-27 2018-08-03 东北大学 一种基于文件访问热度的hdfs副本管理方法
CN109918481A (zh) * 2019-02-28 2019-06-21 深圳市海恒智能科技有限公司 自动化立体仓库存储图书的方法及系统
CN111124762A (zh) * 2019-12-30 2020-05-08 航天科工网络信息发展有限公司 一种基于改进粒子群算法的动态副本放置方法
CN111970046A (zh) * 2020-08-18 2020-11-20 北京邮电大学 一种面向无人机网络动态cache部署的协同传输方法
CN114827180A (zh) * 2022-06-22 2022-07-29 蒲惠智造科技股份有限公司 云端数据分布式存储的分配方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YAHUI ZHAO等: "Dynamic Replica Creation Strategy Based on File Heat and Node Load in Hybrid Cloud", 《IEEE XPLORE》 *
谷磊: "档案馆档案统计数据可视化展示应用研究", 《中国档案》 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116451200A (zh) * 2023-06-14 2023-07-18 浙江星汉信息技术股份有限公司 一种基于云端存储的加密式档案资料的检索方法
CN116451200B (zh) * 2023-06-14 2023-09-05 浙江星汉信息技术股份有限公司 一种基于云端存储的加密式档案资料的检索方法
CN117113440A (zh) * 2023-10-24 2023-11-24 浙江星汉信息技术股份有限公司 影像档案的完整性保护方法、系统与存储介质
CN117113440B (zh) * 2023-10-24 2024-02-02 浙江星汉信息技术股份有限公司 影像档案的完整性保护方法、系统与存储介质
CN117370272A (zh) * 2023-10-25 2024-01-09 浙江星汉信息技术股份有限公司 基于档案热度的档案管理方法、装置、设备及存储介质
CN117370272B (zh) * 2023-10-25 2024-06-11 浙江星汉信息技术股份有限公司 基于档案热度的档案管理方法、装置、设备及存储介质
CN117240613A (zh) * 2023-11-13 2023-12-15 浙江星汉信息技术股份有限公司 一种基于云端存储的档案风险管理方法与系统
CN117240613B (zh) * 2023-11-13 2024-03-08 浙江星汉信息技术股份有限公司 一种基于云端存储的档案风险管理方法与系统

Also Published As

Publication number Publication date
CN115544377B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN115544377B (zh) 基于云端存储的档案的热度评估和更新方法
US8862604B2 (en) Method and apparatus of ordering search results
AU2014364942B2 (en) Long string pattern matching of aggregated account data
US20170235496A1 (en) Data deduplication with augmented cuckoo filters
US9418094B2 (en) Method and apparatus for performing multi-stage table updates
CN110555770B (zh) 一种基于增量哈希的区块链世界状态校验和恢复方法
US10817542B2 (en) User clustering based on metadata analysis
US10664481B2 (en) Computer system programmed to identify common subsequences in logs
CN111176578B (zh) 一种对象聚合方法、装置、设备及可读存储介质
US20160042024A1 (en) Continuous data health check
Kim et al. Twenty years since Joinpoint 1.0: Two major enhancements, their justification, and impact
US20230229580A1 (en) Dynamic index management for computing storage resources
CN109727030A (zh) 一种区块链中账户数据存储方法
US20230298016A1 (en) Systems and methods for validating asset destinations in blockchain networks
CN113342418B (zh) 基于区块链的分布式机器学习任务卸载方法
CN116452206A (zh) 资源处理策略的确定方法、装置、计算机设备和存储介质
CN113785317A (zh) 使用因领域而异的建模来进行反馈挖掘
US20170235781A1 (en) Method, server and computer program stored in computer readable medium for managing log data in database
CN103970844A (zh) 大数据的写入方法和装置、读取方法和装置及处理系统
CN112084201B (zh) 分布式账本处理方法和装置、存储介质和电子设备
US20230316345A1 (en) Machine learning techniques for integrating distinct clustering schemes given temporal variations
US20210406269A1 (en) Data storage selection based on data importance
CN112000955B (zh) 确定日志特征序列的方法、漏洞分析方法及系统、设备
US11429285B2 (en) Content-based data storage
US11860753B1 (en) Monitoring a distributed ledger network using hierarchical validation workflows

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant