CN112416858A - 文档存储方法、装置、电子设备和计算机可读存储介质 - Google Patents

文档存储方法、装置、电子设备和计算机可读存储介质 Download PDF

Info

Publication number
CN112416858A
CN112416858A CN202011219605.1A CN202011219605A CN112416858A CN 112416858 A CN112416858 A CN 112416858A CN 202011219605 A CN202011219605 A CN 202011219605A CN 112416858 A CN112416858 A CN 112416858A
Authority
CN
China
Prior art keywords
document
stored
storage
target storage
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011219605.1A
Other languages
English (en)
Inventor
王攀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Zhenai Jieyun Information Technology Co ltd
Original Assignee
Shenzhen Zhenai Jieyun Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Zhenai Jieyun Information Technology Co ltd filed Critical Shenzhen Zhenai Jieyun Information Technology Co ltd
Priority to CN202011219605.1A priority Critical patent/CN112416858A/zh
Publication of CN112416858A publication Critical patent/CN112416858A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/113Details of archiving
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/122File system administration, e.g. details of archiving or snapshots using management policies

Abstract

本申请涉及一种文档存储方法,包括:接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。实施本申请实施例具有用户体验度高的优点。

Description

文档存储方法、装置、电子设备和计算机可读存储介质
技术领域
本申请涉及计算机存储技术领域,特别是涉及一种文档存储方法、装置、电子设备和计算机可读存储介质。
背景技术
随着计算机存储技术的发展,出现了网盘存储技术,其中,目前的网盘存储技术主要由本地磁盘存储和云存储组成。
目前,在通过网盘存储技术进行存储时,只能在文档上传时由用户手动选择存储方式,存储功能单一,手动选择存储方式的流程复杂,存储周期长,浪费大量人力资源,并且,整个存储过程主观性强,从而导致文档存储的安全性低下,用户体验度不高。
发明内容
本申请实施例提供一种文档存储方法、装置、电子设备和计算机可读存储介质,用于针对待存储文档确定存储策略实现文档存储。
第一方面,本申请实施例提供一种文档存储方法,包括:
接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;
基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;
基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。
在其中一个实施例中,所述基于所述文档信息和所述待存储文档确定目标存储策略,包括:从所述文档信息中提取用户标识,判断预设的用户标识集是否包含所述用户标识;若包含,则获取所述用户标识对应的存储策略;若不包含,则获取所述用户标识对应的部门标识,基于所述部门标识确定目标存储策略。
在其中一个实施例中,所述基于所述部门标识确定目标存储策略,包括:判断预设部门标识集是否包含所述部门标识;若包含,则确定所述目标存储服务器为第一存储服务器;若不包含,则提取所述待存储文档的文本数据,基于所述文本数据确定所述目标存储服务器。
在其中一个实施例中,所述基于所述文本数据确定所述目标存储服务器,包括:将所述文本数据作为预设的评价模型的输入,得到所述文本数据对应的评价值;判断所述评价值是否大于预设的评价值阈值,若所述评价值大于所述评价值阈值,则确定所述待存储文档为第一类文档,确定所述目标存储服务器为第一存储服务器;若所述评价值小于所述评价值阈值,则确定所述存储文档为第二类文档,确定所述目标存储服务器为第二存储服务器。
在其中一个实施例中,所述基于所述文档信息和所述待存储文档确定目标存储策略,包括:获取所述待存储文档对应的目标存储服务器,获取所述目标存储服务器的存储根目录;从所述文档信息中获取所述待存储文档的文档名称;基于所述存储根目录对所述文档名称执行匹配操作,若匹配不成功,基于所述待存储文件在所述存储根目录创建文件标记;接收所述待存储文件的文档浏览频率值;判断所述文档浏览频率值是否大于预设的频率阈值,若大于,则确定所述目标存储模式为固态硬盘存储模式;若小于,则确定所述目标存储模式为普通硬盘存储模式。
在其中一个实施例中,所述基于所述待存储文件在所述存储根目录创建文件标记之前,还包括:向所述待存储文档对应的终端发送数据写入请求;接收所述终端返回的数据写入响应,从所述数据写入响应中提取至少一个数据包;计算所述至少一个数据表的总数据量,基于所述总数据量在所述存储根目录上确定目标存储节点。
在其中一个实施例中,所述以所述存储模式将所述待存储文档存储至所述目标存储服务器之后,还包括:针对所述待存储文件设置定时器;获取所述待存储文档在所述定时器的对应时间內的浏览次数;判断所述浏览次数是否大于预设的浏览次数阈值,若大于,则将所述待存储文件的目标存储模式更新为固态硬盘存储模式;若小于,则将所待存储文件的目标存储模式更新为本地硬盘存储模式。
第二方面,本申请实施例提供一种文档存储装置,包括:
接收单元,用于接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;
确定单元,用于基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;
存储单元,用于基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。
第三方面,本申请实施例提供一种电子设备,该电子设备包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如本申请实施例第一方面所述的方法中所描述的部分或全部步骤的指令。
第四方面,本申请实施例提供了一种计算机可读存储介质,其中,上述计算机可读存储介质用于存储计算机程序,其中,上述计算机程序被处理器执行,以实现如本申请实施例第一方面所述的方法中所描述的部分或全部步骤。
可以看出,在本申请实施例中,电子设备接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。如此,通过文档信息和待存储文档确定对应的目标存储策略,提高了文档存储流程的客观性,简化文档存储流程,缩短文档存储周期长,有利于提高文档存储效率和用户体验度。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种文档存储方法的应用环境示意图;
图2为本申请实施例提供的一种文档存储方法的流程示意图;
图3为本申请实施例提供的一种冷热数据分离方法的流程示意图;
图4为本申请实施例提供的另一种文档存储方法的流程示意图;
图5为本申请实施例提供的一种电子设备500的结构示意图;
图6为本申请实施例提供的一种文档存储装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结果或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
以下,对本申请中的部分用语进行解释说明,以便于本领域技术人员理解。
电子设备可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备(例如智能手表、智能手环、计步器等)、计算设备或通信连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(User Equipment,UE),移动台(Mobile Station,MS),终端设备(terminal device)等等。为方便描述,上面提到的设备统称为电子设备。
请参阅图1,图1为本申请实施例提供的一种文档存储方法的应用环境示意图,如图所示,本文档存储方法主要应用于电子设备102,电子设备102通过网络与终端101进行网络通信,电子设备102接收终端101发送的数据存储指令,电子设备102从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息,基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式,其中,目标存储服务器包括第一存储服务器103和第二存储服务器104;基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。
其中,电子设备102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,第一存储服务器103和第二存储服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
请参阅图2,图2为本申请实施例提供的一种文档存储方法的流程示意图,以该方法应用于图1中的电子设备为例说明,包括以下步骤:
步骤201、接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;
可选的,接收数据存储指令之前,还包括:当接收到用户访问请求时,启动预设的认证流程对所述用户进行用户认证;其中,对所述用户进行用户认证包括:获取所述用户的网络IP地址,获取预设的地址白名单列表,判断所述地址白名单列表是否包含所述网络IP地址,若包含,则确定所述用户为白名单用户,向所述用户返回同意访问响应,若不包含,确定所述用户为非白名单用户,向所述用户返回非法访问响应。
其中,上述认证流程可以基于openresty实现,所述openresty为一个基于Nginx和Lua的高性能Web平台。
其中,所述文档信息可以包括待存储文档名称、待存储文档大小、待存储文档的上传地址、待存储文档对应的用户标识、待存储文档的上传时间等等,在此不作限定。
步骤202、基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;
其中,所述目标存储服务器可以包括第一存储服务器和第二存储服务器,所述第一存储服务器可以包括本地存储服务器等,第二存储器可以包括云端存储服务器等,在此不作限定。
其中,所述目标存储模式可以包括固态硬盘存储模式、本地硬盘存储模式等等,再次不做限定。
步骤203、基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。
可选的,在基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器之后,还包括:获取数据分离规则,基于所述数据分离规则对所述待存储文档的目标存储模式进行更新。
在一可能的示例中,所述基于所述文档信息和所述待存储文档确定目标存储策略,包括:从所述文档信息中提取用户标识,判断预设的用户标识集是否包含所述用户标识;若包含,则获取所述用户标识对应的存储策略;若不包含,则获取所述用户标识对应的部门标识,基于所述部门标识确定目标存储策略。
可选的,从所述文档信息中提取用户标识,其中,所述用户标识可以包括用户ID、用户名称、用户IP地址等等,在此不作限定,基于所述用户标识提取所述预设的用户标识集,例如,若所述用户标识为用户ID,则提取预设的用户ID集,若所述用户标识为用户名称,则提取预设的用户名称集;判断所述用户标识集是否包含所述用户标识,若包含,则确定所述用户标识对应的用户为预设用户,获取预设的用户与存储策略的映射关系,从所述映射关系中提取所述预设用户对应的预设存储策略作为所述目标存储策略;若不包含,则确定所述用户标识对应的用户为非预设用户,其中,非预设用户标识所述用户不存在对应的预设存储策略。
进一步的,确定所述用户标识对应的用户为非预设用户后,确定所述用户标识对应的用户对应的职级,若所述职级大于预设的职级阈值,则提取预设的第一存储策略,其中,所述第一存储策略可以包括:以本地磁盘存储模式存储至本地存储服务器,若所述职级不大于所述职级阈值,则获取所述用户标识对应的部门标识,基于所述部门标识确定目标存储策略。
在一可能的示例中,所述基于所述部门标识确定目标存储策略,包括:判断预设部门标识集是否包含所述部门标识;若包含,则确定所述目标存储服务器为第一存储服务器;若不包含,则提取所述待存储文档的文本数据,基于所述文本数据确定所述目标存储服务器。
可选的,获取部门标识,其中,所述部门标识可以包括部门ID、部门名称等等,在此不作限定,基于所述部门标识提取预设部门标识集,即若所述部门标识为部门ID,则提取预设部门ID集;若所述部门标识为部门名称,则提取预设的部门名称集;判断预设部门标识集是否包含所述部门标识,若包含,则确定所述部门标识对应的部门为重要部门,确定部门存储服务器为第一存储服务器;若不包含,则确定所述部门标识对应的部门为非重要部门,提取所述待存储文本的文本数据,基于文本数据确定目标存储服务器。
具体实现过程中,假设获取的部门标识为部门名称(例如:财务部),提取预设的部门名称集,判断所述部门名称集是否包含财务部,若包含,则确定财务部为重要部门,若不包含,则确定财务部为非重要部门。
在一可能的示例中,所述基于所述文本数据确定所述目标存储服务器,包括:将所述文本数据作为预设的评价模型的输入,得到所述文本数据对应的评价值;判断所述评价值是否大于预设的评价值阈值,若所述评价值大于所述评价值阈值,则确定所述待存储文档为第一类文档,确定所述目标存储服务器为第一存储服务器;若所述评价值小于所述评价值阈值,则确定所述存储文档为第二类文档,确定所述目标存储服务器为第二存储服务器。
可选的,在基于文本数据确定目标存储服务器之前,还包括:配置关键词列表,其中,所述关键词列表中的关键词可以为用户预设的关键词,也可以为从历史文档中提取的关键词;获取预设的Word2Vec中文模型,将所述关键词作为所述中文模型的输入进行词向量计算,得到新的关键词列表,基于所述新的关键词列表对所述预设的评价模型进行更新。
其中,若所述关键词为历史文档中提取的关键词,则所述配置关键词,包括:第一存储服务器中的多个历史文档,针对所述多个历史文档执行匹配操作,得到多个关键词,针对所述多个词组中任意一个关键词,所述任意一个关键词与所述多个历史文档中两个或两个以上历史文档对应,即若所述多个历史文档中存在两个或两个以上历史文档均包含同一词组,则确定所述词组为关键词。
进一步地,在所述评价模型中,将所述文本数据作为所述评价模型的输入后,针所述评价模型首先对所述文本数据执行分词切割操作,得到所述文本数据中对应的多个词组,然后轮询判断所述多个词组中每一词组是否在关键词列表中,针对所述多个词组中任意一个词组,若所述关键词列表包含所述任意一个词组,则确定所述任意一个词组为评价词组,获取所述多个词组中评价词组对应的评价词组总数,依据所述多个词组的词组总数和所述评价词组的总数计算所述文本数据对应的评价值,其中,所述评价值的计算公式可以包括:D=10*(评价词组总数/词组总数),D为所述文本数据对应的评价值。
可选的,判断所述评价值是否大于预设的评价值阈值,若大于,则确定所述待存储文档为第一类文档,确定所述目标存储服务器为第一存储服务器;若小于,则确定待存储文档为第二类文档,确定所述目标存储服务器为第二存储服务器,若等于,则确定所述待存储文档为第一类文档,确定所述目标存储服务器为第一存储服务器。
在一可能的示例中,所述基于所述文档信息和所述待存储文档确定目标存储策略,包括:获取所述待存储文档对应的目标存储服务器,获取所述目标存储服务器的存储根目录;从所述文档信息中获取所述待存储文档的文档名称;基于所述存储根目录对所述文档名称执行匹配操作,若匹配不成功,基于所述待存储文件在所述存储根目录创建文件标记;接收所述待存储文件的文档浏览频率值;判断所述文档浏览频率值是否大于预设的频率阈值,若大于,则确定所述目标存储模式为固态硬盘存储模式;若小于,则确定所述目标存储模式为普通硬盘存储模式。
可选的,在确定所述存储文档对应的目标存储服务器后,首先从所述目标存储服务器中提取其对应的存储根目录,其中所述根目录可以包括分布式文件系统的namenode,namenode是分布式文件系统的master节点,类似于linux系统的根目录,所述存储根目录用于记录所述目标存储服务器中已存储的文档的名称及存储节点;首先基于所述存储根目录对所述文档名称执行匹配操作,即判断所述存储根目录是否包含所述文件名称,若所述存储根目录中包含所述文件名称,则确定匹配成功,从所述存储根目录中提取与所述文件名称匹配的文件标识,获取所述文件标识对应的存储文件,匹配所述存储文件与所述待存储文件,若匹配成功,则确定所述目标存储服务器已存储所述待存储文件,向所述待存储文件对应的终端返回预设的重复存储提示;若匹配不成功,则确定所述目标存储服务器未存储所述待存储文件。
进一步的,启动后台计算功能,控制所述后台功能对所述待存储文件的文件浏览频率值进行计算,判断所述文档浏览频率值是否大于预设的频率阈值,若大于,则确定所述目标存储模式为固态硬盘存储模式;若小于,则确定所述目标存储模式为普通硬盘存储模式。
在一可能的示例中,所述基于所述待存储文件在所述存储根目录创建文件标记之前,还包括:向所述待存储文档对应的终端发送数据写入请求;接收所述终端返回的数据写入响应,从所述数据写入响应中提取至少一个数据包;计算所述至少一个数据表的总数据量,基于所述总数据量在所述存储根目录上确定目标存储节点。
可选的,若所述存储文件与所述待存储文件匹配不成功,或者,所述存储根目录与所述文档名称匹配不成功,则基于所述待存储文件在所述存储根目录中创建文件标记,所述文件标记用于在所述存储根目录中对所述待存储文件进行记录,向所述待存储文件对应的终端返回上传确认指令,接收所述终端返回的上传确认响应,接收所述待存储文件对应的多个二进制数据包,依据所述多个二进制数据包的数量和大小在所述存储根目录上确定存储节点。
在一可能的示例中,所述以所述存储模式将所述待存储文档存储至所述目标存储服务器之后,还包括:针对所述待存储文件设置定时器;获取所述待存储文档在所述定时器的对应时间內的浏览次数;判断所述浏览次数是否大于预设的浏览次数阈值,若大于,则将所述待存储文件的目标存储模式更新为固态硬盘存储模式;若小于,则将所待存储文件的目标存储模式更新为本地硬盘存储模式。
可选的,针对所述待存储文件设置定时器,其中,所述定时器的时间可以包括:5min、10min、1day等等,在此不作限定;在所述定时器规定的时间内,针对所述待存储文件进行监控,记录所述待存储文件的被浏览次数。
在一可能的示例中,在以所述存储模式将所述待存储文档存储至所述目标存储服务器之后,还可以包括:获取预设的数据分离规则,其中,所述数据分离规则用于对固态硬盘存储模式下和本地硬盘存储模式下存储的数据进行更新,如图3所示流程,图3为本申请实施例提供的一种冷热数据分离方法的流程示意图,即获取数据分离规则,针对任一存储文件,当其满足数据分离规则时,将所述存储文件的目标存储模式更新为本地硬盘存储模式,即当所述存储文件满足“用户最近30天内访问次数低于3次”及“文件创建时间超过30天”中一条或一条以上条件时,则将所述存储文件的目标存储模式更新为固态硬盘存储模式,即当所述存储文件为固态磁盘存储模式时,将其更新为本地硬盘存储模式,当所述存储文件为本地硬盘存储模式时,所述存储模式保持不变。
可以看出,在本申请实施例中,电子设备接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。如此,通过文档信息和待存储文档确定对应的目标存储策略,提高了文档存储流程的客观性,简化文档存储流程,缩短文档存储周期长,有利于提高文档存储效率和用户体验度;同时将待存储文档进行冷热数据分离存储,其中,热数据存储至ssd固态硬盘,冷数据存储至hdd本地硬盘中,有利于提高数据提取速度以及实现存储资源利用最大化,同时有利于节约存储成本。
请参阅图4,图4为本申请实施例提供的另一种文档存储方法的流程示意图,如图4所示,本文档存储方法包括以下步骤:
步骤401、获取待存储文档和所述待存储文档的文档信息;
执行步骤401后针对文档信息提取用户标识,执行步骤402、判断预设的用户标识集是否包含所述用户标识;
若预设的用户标识集包含所述用户标识,则跳转步骤403、获取用户标识对应的存储策略,所述目标存储策略包括:目标存储服务器和目标存储模式;若预设的用户标识集不包含所述用户标识,则跳转步骤404、获取所述用户标识对应的部门标识;
执行步骤404后,跳转执行步骤405、判断预设部门标识集是否包含所述部门标识;
若预设部门标识集包含所述部门标识,则执行步骤406、确定所述目标存储服务器为第一存储服务器;若预设部门标识集不包含所述部门标识,则执行步骤407、提取所述待存储文档的文本数据,计算所述文本数据的评价值;
执行步骤407后,执行步骤408,判断所述评价值是否大于预设的评价值阈值;
若所述评价值大于预设的评价阈值,则跳转执行步骤406、确定所述目标存储服务器为第一存储服务器;若所述评价值小于预设的评价阈值,则执行步骤409、确定所述目标存储服务器为第二存储服务器;
执行步骤409或执行步骤406后,执行步骤410、确定目标存储服务模式;
执行步骤403或执行步骤410后,执行步骤411、基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。
应该理解的是,虽然图4的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图4中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
可以看出,在本申请实施例中,电子设备接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。如此,通过文档信息和待存储文档确定对应的目标存储策略,提高了文档存储流程的客观性,简化文档存储流程,缩短文档存储周期长,有利于提高文档存储效率和用户体验度;同时将待存储文档进行冷热数据分离存储,其中,热数据存储至ssd固态硬盘,冷数据存储至hdd本地硬盘中,有利于提高数据提取速度以及实现存储资源利用最大化,同时有利于节约存储成本。
请参阅图5,图5为本申请实施例提供的一种电子设备500的结构示意图,如图所示,所述服务器500包括应用处理器510,存储器520、通信接口530以及一个或多个程序521,其中,所述一个或多个程序521被存储在上述存储器520中,并且被配置由上述应用处理器510执行,所述一个或多个程序521包括用于执行以下步骤的指令:
接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;
基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;
基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。
可以看出,在本申请实施例中,电子设备接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。如此,通过文档信息和待存储文档确定对应的目标存储策略,提高了文档存储流程的客观性,简化文档存储流程,缩短文档存储周期长,有利于提高文档存储效率和用户体验度。
在一可能的示例中,在所述基于所述文档信息和所述待存储文档确定目标存储策略方面,所述程序中的指令具体用于执行以下操作:从所述文档信息中提取用户标识,判断预设的用户标识集是否包含所述用户标识;若包含,则获取所述用户标识对应的存储策略;若不包含,则获取所述用户标识对应的部门标识,基于所述部门标识确定目标存储策略。
在一可能的示例中,在所述基于所述部门标识确定目标存储策略方面,所述程序中的指令具体用于执行以下操作:判断预设部门标识集是否包含所述部门标识;若包含,则确定所述目标存储服务器为第一存储服务器;若不包含,则提取所述待存储文档的文本数据,基于所述文本数据确定所述目标存储服务器。
在一可能的示例中,在所述基于所述文本数据确定所述目标存储服务器方面,所述程序中的指令具体用于执行以下操作:将所述文本数据作为预设的评价模型的输入,得到所述文本数据对应的评价值;判断所述评价值是否大于预设的评价值阈值,若所述评价值大于所述评价值阈值,则确定所述待存储文档为第一类文档,确定所述目标存储服务器为第一存储服务器;若所述评价值小于所述评价值阈值,则确定所述存储文档为第二类文档,确定所述目标存储服务器为第二存储服务器。
在一可能的示例中,在所述基于所述文档信息和所述待存储文档确定目标存储策略方面,所述程序中的指令具体用于执行以下操作:获取所述待存储文档对应的目标存储服务器,获取所述目标存储服务器的存储根目录;从所述文档信息中获取所述待存储文档的文档名称;基于所述存储根目录对所述文档名称执行匹配操作,若匹配不成功,基于所述待存储文件在所述存储根目录创建文件标记;接收所述待存储文件的文档浏览频率值;判断所述文档浏览频率值是否大于预设的频率阈值,若大于,则确定所述目标存储模式为固态硬盘存储模式;若小于,则确定所述目标存储模式为普通硬盘存储模式。
在一可能的示例中,在所述基于所述待存储文件在所述存储根目录创建文件标记之前方面,所述程序中的指令还用于执行以下操作:向所述待存储文档对应的终端发送数据写入请求;接收所述终端返回的数据写入响应,从所述数据写入响应中提取至少一个数据包;计算所述至少一个数据表的总数据量,基于所述总数据量在所述存储根目录上确定目标存储节点。
在一可能的示例中,在所述以所述存储模式将所述待存储文档存储至所述目标存储服务器之后方面,所述程序中的指令还用于执行以下操作:针对所述待存储文件设置定时器;获取所述待存储文档在所述定时器的对应时间內的浏览次数;判断所述浏览次数是否大于预设的浏览次数阈值,若大于,则将所述待存储文件的目标存储模式更新为固态硬盘存储模式;若小于,则将所待存储文件的目标存储模式更新为本地硬盘存储模式。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,电子设备为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对电子设备进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个控制单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
请参阅图6,图6为本申请实施例提供的一种文档存储装置的结构示意图,包括:接收单元601、确定单元602和存储单元603,其中:
接收单元601,用于接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;
确定单元602,用于基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;
存储单元603,用于基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。
可以看出,在本申请实施例中,电子设备接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。如此,通过文档信息和待存储文档确定对应的目标存储策略,提高了文档存储流程的客观性,简化文档存储流程,缩短文档存储周期长,有利于提高文档存储效率和用户体验度。
在一可能的示例中,在所述基于所述文档信息和所述待存储文档确定目标存储策略方面,所述确定单元602,具体用于:从所述文档信息中提取用户标识,判断预设的用户标识集是否包含所述用户标识;若包含,则获取所述用户标识对应的存储策略;若不包含,则获取所述用户标识对应的部门标识,基于所述部门标识确定目标存储策略。
在一可能的示例中,在所述基于所述部门标识确定目标存储策略方面,所述确定单元602,具体用于:判断预设部门标识集是否包含所述部门标识;若包含,则确定所述目标存储服务器为第一存储服务器;若不包含,则提取所述待存储文档的文本数据,基于所述文本数据确定所述目标存储服务器。
在一可能的示例中,在所述基于所述文本数据确定所述目标存储服务器方面,所述确定单元602,具体用于:将所述文本数据作为预设的评价模型的输入,得到所述文本数据对应的评价值;判断所述评价值是否大于预设的评价值阈值,若所述评价值大于所述评价值阈值,则确定所述待存储文档为第一类文档,确定所述目标存储服务器为第一存储服务器;若所述评价值小于所述评价值阈值,则确定所述存储文档为第二类文档,确定所述目标存储服务器为第二存储服务器。
在一可能的示例中,在所述基于所述文档信息和所述待存储文档确定目标存储策略方面,所述确定单元602,具体用于:获取所述待存储文档对应的目标存储服务器,获取所述目标存储服务器的存储根目录;从所述文档信息中获取所述待存储文档的文档名称;基于所述存储根目录对所述文档名称执行匹配操作,若匹配不成功,基于所述待存储文件在所述存储根目录创建文件标记;接收所述待存储文件的文档浏览频率值;判断所述文档浏览频率值是否大于预设的频率阈值,若大于,则确定所述目标存储模式为固态硬盘存储模式;若小于,则确定所述目标存储模式为普通硬盘存储模式。
在一可能的示例中,在所述基于所述待存储文件在所述存储根目录创建文件标记之前方面,所述确定单元602,具体用于:向所述待存储文档对应的终端发送数据写入请求;接收所述终端返回的数据写入响应,从所述数据写入响应中提取至少一个数据包;计算所述至少一个数据表的总数据量,基于所述总数据量在所述存储根目录上确定目标存储节点。
在一可能的示例中,在所述以所述存储模式将所述待存储文档存储至所述目标存储服务器之后方面,所述存储单元603,具体用于:针对所述待存储文件设置定时器;获取所述待存储文档在所述定时器的对应时间內的浏览次数;判断所述浏览次数是否大于预设的浏览次数阈值,若大于,则将所述待存储文件的目标存储模式更新为固态硬盘存储模式;若小于,则将所待存储文件的目标存储模式更新为本地硬盘存储模式。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤,上述计算机包括电子设备。
本申请实施例还提供一种计算机程序产品,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如上述方法实施例中记载的任一方法的部分或全部步骤。该计算机程序产品可以为一个软件安装包,上述计算机包括电子设备。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种文档存储方法,其特征在于,包括:
接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;
基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;
基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。
2.根据权利要求1所述的方法,其特征在于,所述基于所述文档信息和所述待存储文档确定目标存储策略,包括:
从所述文档信息中提取用户标识,判断预设的用户标识集是否包含所述用户标识;
若包含,则获取所述用户标识对应的存储策略;
若不包含,则获取所述用户标识对应的部门标识,基于所述部门标识确定目标存储策略。
3.根据权利要求2所述的方法,其特征在于,所述基于所述部门标识确定目标存储策略,包括:
判断预设部门标识集是否包含所述部门标识;
若包含,则确定所述目标存储服务器为第一存储服务器;
若不包含,则提取所述待存储文档的文本数据,基于所述文本数据确定所述目标存储服务器。
4.根据权利要求3所述的方法,其特征在于,所述基于所述文本数据确定所述目标存储服务器,包括:
将所述文本数据作为预设的评价模型的输入,得到所述文本数据对应的评价值;
判断所述评价值是否大于预设的评价值阈值,若所述评价值大于所述评价值阈值,则确定所述待存储文档为第一类文档,确定所述目标存储服务器为第一存储服务器;
若所述评价值小于所述评价值阈值,则确定所述存储文档为第二类文档,确定所述目标存储服务器为第二存储服务器。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述基于所述文档信息和所述待存储文档确定目标存储策略,包括:
获取所述待存储文档对应的目标存储服务器,获取所述目标存储服务器的存储根目录;
从所述文档信息中获取所述待存储文档的文档名称;
基于所述存储根目录对所述文档名称执行匹配操作,若匹配不成功,基于所述待存储文件在所述存储根目录创建文件标记;
接收所述待存储文件的文档浏览频率值;
判断所述文档浏览频率值是否大于预设的频率阈值,若大于,则确定所述目标存储模式为固态硬盘存储模式;
若小于,则确定所述目标存储模式为普通硬盘存储模式。
6.根据权利要求5所述的方法,其特征在于,所述基于所述待存储文件在所述存储根目录创建文件标记之前,还包括:
向所述待存储文档对应的终端发送数据写入请求;
接收所述终端返回的数据写入响应,从所述数据写入响应中提取至少一个数据包;
计算所述至少一个数据表的总数据量,基于所述总数据量在所述存储根目录上确定目标存储节点。
7.根据权利要求1所述的方法,其特征在于,所述以所述存储模式将所述待存储文档存储至所述目标存储服务器之后,还包括:
针对所述待存储文件设置定时器;
获取所述待存储文档在所述定时器的对应时间內的浏览次数;
判断所述浏览次数是否大于预设的浏览次数阈值,若大于,则将所述待存储文件的目标存储模式更新为固态硬盘存储模式;
若小于,则将所待存储文件的目标存储模式更新为本地硬盘存储模式。
8.一种文档存储装置,其特征在于,包括:
接收单元,用于接收数据存储指令,从所述数据存储指令中提取待存储文档和所述待存储文档的文档信息;
确定单元,用于基于所述文档信息和所述待存储文档确定目标存储策略,其中,所述目标存储策略包括:目标存储服务器和目标存储模式;
存储单元,用于基于所述目标存储模式将所述待存储文档存储至所述目标存储服务器。
9.一种电子设备,其特征在于,包括处理器、存储器、通信接口,以及一个或多个程序,所述一个或多个程序被存储在所述存储器中,并且被配置由所述处理器执行,所述程序包括用于执行如权利要求1-7任一项所述的方法中的步骤的指令。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1至7任意一项所述的方法。
CN202011219605.1A 2020-11-09 2020-11-09 文档存储方法、装置、电子设备和计算机可读存储介质 Pending CN112416858A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011219605.1A CN112416858A (zh) 2020-11-09 2020-11-09 文档存储方法、装置、电子设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011219605.1A CN112416858A (zh) 2020-11-09 2020-11-09 文档存储方法、装置、电子设备和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN112416858A true CN112416858A (zh) 2021-02-26

Family

ID=74827956

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011219605.1A Pending CN112416858A (zh) 2020-11-09 2020-11-09 文档存储方法、装置、电子设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112416858A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113590559A (zh) * 2021-09-28 2021-11-02 中通服建设有限公司 一种企业项目管理文档管理全过程的方法
CN114817200A (zh) * 2022-05-06 2022-07-29 安徽森江人力资源服务有限公司 一种基于物联网的文档数据云端管理方法、系统及储存介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106155566A (zh) * 2015-03-31 2016-11-23 西门子公司 用于存储数据的方法、装置及系统
CN106776891A (zh) * 2016-11-30 2017-05-31 山东浪潮商用系统有限公司 一种文件存储的方法和装置
WO2017177752A1 (zh) * 2016-04-14 2017-10-19 杭州海康威视数字技术股份有限公司 一种文件存储方法及装置
CN107357932A (zh) * 2017-07-31 2017-11-17 云城(北京)数据科技有限公司 一种文件存储方法及装置
CN108363727A (zh) * 2018-01-10 2018-08-03 链家网(北京)科技有限公司 一种基于zfs文件系统的数据存储方法及装置
CN110018788A (zh) * 2019-03-01 2019-07-16 平安科技(深圳)有限公司 分级存储方法、装置、电子设备及计算机可读存储介质
CN110765075A (zh) * 2019-10-24 2020-02-07 北京百度网讯科技有限公司 自动驾驶数据的存储方法和设备
CN110781132A (zh) * 2019-10-24 2020-02-11 深圳前海环融联易信息科技服务有限公司 文件存储的实现方法、装置、及计算机设备
CN111208934A (zh) * 2018-11-21 2020-05-29 华为技术有限公司 一种数据存储方法及装置

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106155566A (zh) * 2015-03-31 2016-11-23 西门子公司 用于存储数据的方法、装置及系统
WO2017177752A1 (zh) * 2016-04-14 2017-10-19 杭州海康威视数字技术股份有限公司 一种文件存储方法及装置
CN106776891A (zh) * 2016-11-30 2017-05-31 山东浪潮商用系统有限公司 一种文件存储的方法和装置
CN107357932A (zh) * 2017-07-31 2017-11-17 云城(北京)数据科技有限公司 一种文件存储方法及装置
CN108363727A (zh) * 2018-01-10 2018-08-03 链家网(北京)科技有限公司 一种基于zfs文件系统的数据存储方法及装置
CN111208934A (zh) * 2018-11-21 2020-05-29 华为技术有限公司 一种数据存储方法及装置
CN110018788A (zh) * 2019-03-01 2019-07-16 平安科技(深圳)有限公司 分级存储方法、装置、电子设备及计算机可读存储介质
CN110765075A (zh) * 2019-10-24 2020-02-07 北京百度网讯科技有限公司 自动驾驶数据的存储方法和设备
CN110781132A (zh) * 2019-10-24 2020-02-11 深圳前海环融联易信息科技服务有限公司 文件存储的实现方法、装置、及计算机设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
杜红刚;吴岳忠;: "基于云存储的网络文档共享系统", 湖南工业大学学报, no. 05 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113590559A (zh) * 2021-09-28 2021-11-02 中通服建设有限公司 一种企业项目管理文档管理全过程的方法
CN114817200A (zh) * 2022-05-06 2022-07-29 安徽森江人力资源服务有限公司 一种基于物联网的文档数据云端管理方法、系统及储存介质
CN114817200B (zh) * 2022-05-06 2024-04-05 新疆利丰智能科技股份有限公司 一种基于物联网的文档数据云端管理方法、系统及储存介质

Similar Documents

Publication Publication Date Title
CN109743315A (zh) 针对网站的行为识别方法、装置、设备及可读存储介质
CN113412608B (zh) 内容推送方法、装置、服务端及存储介质
CN109815214B (zh) 数据库访问方法、系统、装置及存储介质
CN110515951B (zh) 一种bom标准化方法、系统及电子设备和存储介质
CN102497635A (zh) 服务器、终端和账户密码获取方法
CN110661829B (zh) 文件下载方法及装置、客户端和计算机可读存储介质
CN112416858A (zh) 文档存储方法、装置、电子设备和计算机可读存储介质
CN101316120A (zh) 射频用户识别模块、会员卡信息处理方法及处理系统
US11080322B2 (en) Search methods, servers, and systems
CN113157854B (zh) Api的敏感数据泄露检测方法及系统
CN109766422A (zh) 信息处理方法、装置及系统、存储介质、终端
CN103036910B (zh) 一种用户Web访问行为控制方法及装置
CN104899499A (zh) 基于互联网图片搜索的Web验证码生成方法
CN112615945B (zh) 域名解析记录管理方法、装置、计算机设备及存储介质
KR101931859B1 (ko) 전자문서의 대표 단어 선정 방법, 전자 문서 제공 방법, 및 이를 수행하는 컴퓨팅 시스템
CN103079194B (zh) 业务适配方法、装置及系统
CN107707686A (zh) 设备标识方法和装置
CN111160157B (zh) 基于dwg图纸的文本提取方法及相关产品
CN109241462B (zh) 网页黑词处理方法、装置、设备及存储介质
CN115297104B (zh) 文件上传方法、装置、电子设备和存储介质
CN110020290B (zh) 网页资源缓存方法、装置、存储介质及电子装置
CN113383314B (zh) 用户相似度计算方法、装置、服务端及存储介质
CN115795544A (zh) 文件安全属性存储方法及相关装置
CN112491939B (zh) 多媒体资源调度方法及系统
CN114221964A (zh) 一种访问请求处理方法、装置、计算机设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination