CN116226036B

CN116226036B - 一种文档管理方法、装置和设备

Info

Publication number: CN116226036B
Application number: CN202310491709.5A
Authority: CN
Inventors: 李再力; 魏涛; 赵芯玥; 杨欣然
Original assignee: CITIC Tianjin Financial Technology Service Co Ltd
Current assignee: CITIC Tianjin Financial Technology Service Co Ltd
Priority date: 2023-05-05
Filing date: 2023-05-05
Publication date: 2023-07-18
Anticipated expiration: 2043-05-05
Also published as: CN116226036A

Abstract

本申请涉及文档管理的技术领域，尤其涉及一种文档管理方法、装置和设备，该方法包括：获取待处理文档信息；对待处理文档信息中的文档内容进行信息识别，确定待处理文档信息对应的归档类别；基于归档类别，从已归档数据库中确定与待处理文档信息对应的归档类别相同的多个已归档文档信息；获取每一已归档文档信息对应的检测项信息；确定检测项信息种群的当前适应度方差，基于当前适应度方差，确定检测项信息种群的迭代次数；基于迭代次数对检测项信息种群进行迭代计算，确定最优检测项信息；获取最优检测项信息对应的检测流程，并基于检测流程对待处理文档信息进行检测。本申请提高了文档检测的效率。

Description

一种文档管理方法、装置和设备

技术领域

本申请涉及文档管理的技术领域，尤其是涉及一种文档管理方法、装置和设备。

背景技术

在企业发展中，文档管理工作是企业的基础管理工作之一，通过文档管理工作可以实现对企业各项经营活动的历史数据的整合和存储，进一步的，还可以为企业的发展提供数据指导。

相关技术在对文档进行检测时，会获取用户对检测项的决策，并基于用户对检测项的决策对文档进行检测，然而，每执行一次文档检测就需要获取用户对检测项的决策，当对多个文档进行检测时则需要花费较长时间获取用户决策，并根据与用户决策对应的检测项信息对文档进行检测。可见，相关技术中文档检测的效率较低。

发明内容

为了提高文档检测效率，本申请提供一种文档管理方法、装置和设备。

第一方面，本申请提供一种文档管理方法，采用如下的技术方案：

一种文档管理方法，包括：

当接收到文档管理请求后，获取待处理文档信息；

对待处理文档信息中的文档内容进行信息识别，以确定待处理文档信息对应的归档类别；

基于所述归档类别，从已归档数据库中确定与待处理文档信息对应的归档类别相同的多个已归档文档信息；

获取每一已归档文档信息对应的检测项信息，其中，所有已归档文档信息和各自对应的检测项信息构成检测项信息种群；

基于检测项信息种群确定检测项信息种群对应的当前适应度方差，并基于所述当前适应度方差，确定检测项信息种群的迭代次数；

基于所述迭代次数对检测项信息种群进行迭代计算，并从目标检测项信息种群中，确定最优检测项信息，其中，所述目标检测项信息种群为经过迭代次数的迭代计算的检测项信息种群；

根据最优检测项信息，获取最优检测项信息对应的检测流程，并基于所述检测流程对待处理文档信息进行检测。

通过采用上述技术方案，获取待处理文档信息，对待处理文档信息中的文档内容确定待处理文档信息对应的归档类别，以便根据归档类别有针对性的对待处理文档信息进行处理；再基于归档类别确定多个相同的已归档文档信息，以便筛选出参考价值较大的已归档文档信息，时间间隔较近的相同归档类别的已归档文档对待处理文档信息具有的参考价值更大；针对所有已归档文档的检测信息生成检测项信息种群，再确定迭代次数，基于迭代次数对检测项信息种群进行迭代计算，以便筛选出适应度较高的个体，检测项信息种群的每一次计算都可以筛选掉个体适应度低的个体，保留个体适应度高的个体，进而当达到迭代次数后的检测项信息种群中的个体都保持有较高的适应度，进一步的，可以确定最优检测项信息，最优检测项信息为与待处理文档信息适配度最高的检测项；获取与最优检测项信息对应的检测流程，并对待处理文档信息进行检测，相较于相关技术中每执行一次检测都需要获取用户的决策信息，本申请直接匹配与待处理文档信息适配度最高的检测项进行检测，有效提高了待处理文档信息检测的效率。

在一种可能实现的方式中，所述基于检测项信息种群确定检测项信息种群对应的当前适应度方差，包括：

基于检测项信息种群确定检测项信息种群中所有已归档文档信息和各自对应的检测项信息各自对应的适应度和所有已归档文档信息和各自对应的检测项信息的数量信息；

基于所有所述适应度和所述数量信息，确定检测项信息种群对应的当前适应度方差。

通过采用上述技术方案，确定所有已归档文档信息和各自对应的检测项信息各自对应的适应度和数量信息，根据所有适应度和数量信息确定检测项信息种群对应的当前适应度方差，以便通过方差对检测项信息种群的当前适应度和平均值之间的差值进行准确的衡量。

在一种可能实现的方式中，所述基于所述当前适应度方差，确定检测项信息种群的迭代次数，包括：

获取预期适应度方差；

基于所述预期适应度方差、所述当前适应度方差以及预设的适应度方差和迭代次数的对应关系，确定检测项信息种群的迭代次数。

通过采用上述技术方案，获取预期适应度方差，并根据预期适应度方差、当前适应度方差和预设的适应度方差和迭代次数的对应关系确定检测项信息种群的迭代次数，以便使用确定好的迭代次数对检测项信息种群进行迭代计算，基于确定好的迭代次数进行计算不仅可以避免迭代次数过高导致的效率较低的问题，还可以避免迭代次数过低导致的结果不准确的问题。

在一种可能实现的方式中，所述对待处理文档信息中的文档内容进行信息识别，以确定待处理文档信息对应的归档类别，包括：

基于待处理文档信息中的文档内容进行关键词识别，确定所述文档内容的关键词信息，其中，关键词信息包括多个关键词和各自对应的词频；

基于所述文档内容中的所有关键词和各自对应的词频，从所有关键词中确定目标关键词；

基于目标关键词和预先设立的文档归档类别识别模型，确定待处理文档信息对应的归档类别，其中，预先设立的文档归档类别识别模型为基于多个训练关键词和各自对应的归档类别标签进行训练得到的。

通过采用上述技术方案，对待处理文档信息中的内容进行关键词识别，确定文档内容中的关键词信息，再根据所有关键词、各自对应的词频和预设词频阈值确定目标关键词，以确定对文档内容影响度最大的关键词，基于影响度最大的关键词和文档归档类别识别模型进行分类，以实现了对待处理文档归档类别的准确判断。

在一种可能实现的方式中，所述基于所述检测流程对待处理文档信息进行检测之后，还包括：

获取检测结果，并基于检测结果，确定待处理文档信息是否能够归档；

若是，则基于待处理文档信息中的文档内容对待处理文档信息进行归档。

通过采用上述技术方案，获取检测结果确定待处理文档信息是否能够归档，若是，则表明待处理文档信息中的文档内容可以归档到档案库中，否则，则表明待处理文档信息中的文档内容无法进行归档，以更好对待处理文档信息进行管理。

在一种可能实现的方式中，所述基于待处理文档信息中的文档内容对待处理文档信息进行归档，包括：

基于待处理文档信息中的文档内容生成待处理文档信息对应的归档建议信息，其中，所述归档建议信息包括对文档保管期限的建议信息和文档密级级别的建议信息；

基于待处理文档信息对应的归档建议信息和预设归档模板，将待处理文档信息进行归档。

通过采用上述技术方案，当待处理文档信息中的文档内容可以归档时，获取待处理文档信息对应的归档建议，再结合预设归档模板对待处理文档信息进行归档，归档建议信息和归档模板可以为待处理文档信息的归档提供参考意见，辅助用户进行归档，进而有效提高归档效率。

在一种可能实现的方式中，所述基于待处理文档信息中的文档内容对待处理文档信息进行归档之后，还包括：

当接收到用户对目标类别文档的借阅请求信息后，获取用户的身份标识信息，其中，所述借阅请求信息表征用户对目标类别文档标识信息的借阅请求；

基于所述身份标识信息，获取与所述身份标识信息对应的用户的职位信息，其中，所述职位信息表征用户所在职位、用户所在职位的时间和用户所在职位状态，用户所在职位状态包括：用户处于在职状态和用户处于离职状态；

基于预设的职位信息与文档借阅权限信息的对应关系和所述职位信息，确定所述职位信息对应的用户文档借阅权限信息，其中，用户文档借阅权限信息表征用户能够借阅的所有类别文档各自对应的标识信息；

基于用户文档借阅权限信息和借阅请求信息，确定用户是否能够借阅目标类别文档；

若是，则根据所述目标类别文档的标识信息读取对应的文档信息并发送至用户客户端；

否则，则生成目标类别文档无借阅权限信号。

通过采用上述技术方案，当接收到借阅请求信息后，获取用户的身份标识信息，并根据身份标识信息确定用户的职位信息，再基于对应关系确定与用户职位信息对应的借阅权限，以便确定用户是否能够借阅目标类别文档，随着用户职位信息的变化其借阅权限也会随之变化，即用户在职或用户职位更高时，用户对企业来说更重要，同时用户的借阅权限也越大，相反用户离职或用户职位较低时借阅权限也更小，而以用户职位信息限制用户的借阅权限，可以起到较好的保密性，当用户能够借阅时，则将对应的文档信息发送至用户客户端。

在一种可能实现的方式中，所述根据所述目标类别文档的标识信息读取对应的文档信息并发送至用户客户端之前，还包括：

获取与目标类别文档的标识信息对应的密级级别和与目标类别文档的标识信息对应的借阅目的；

基于预设的审批流程和密级级别的对应关系和目标类别文档的标识信息，确定与目标类别文档的标识信息对应的审批流程；

基于目标类别文档的标识信息对应的审批流程和借阅目的，确定目标类别文档是否能够被借阅；

相应的，所述则根据所述目标类别文档的标识信息读取对应的文档信息并发送至用户客户端，包括：

若是，则根据所述目标类别文档的标识信息读取对应的文档信息并发送至用户客户端。

通过采用上述技术方案，获取密级级别和借阅目的，并确定对应的审批流程，基于审批流程和借阅目的确定是否能够借阅，以审批流程和借阅目的为限制，对目标类别文档进行再次限定，可以进一步提高文档的保密性。

第二方面，本申请提供一种文档管理装置，采用如下的技术方案：

一种文档管理装置，包括：

获取模块，用于当接收到文档管理请求后，获取待处理文档信息；

归档类别确定模块，用于对待处理文档信息中的文档内容进行信息识别，以确定待处理文档信息对应的归档类别；

相同已归档文档确定模块，用于基于所述归档类别，从已归档数据库中确定与待处理文档信息对应的归档类别相同的多个已归档文档信息；

检测项信息种群生成模块，用于获取每一已归档文档信息对应的检测项信息，其中，所有已归档文档信息和各自对应的检测项信息构成检测项信息种群；

迭代次数确定模块，用于基于检测项信息种群确定检测项信息种群对应的当前适应度方差，并基于所述当前适应度方差，确定检测项信息种群的迭代次数；

最优检测项信息确定模块，用于基于所述迭代次数对检测项信息种群进行迭代计算，并从目标检测项信息种群中，确定最优检测项信息，其中，所述目标检测项信息种群为经过迭代次数的迭代计算的检测项信息种群；

检测模块，用于根据最优检测项信息，获取最优检测项信息对应的检测流程，并基于所述检测流程对待处理文档信息进行检测。

第三面，本申请提供一种电子设备，采用如下的技术方案：

至少一个处理器；

存储器；

至少一个应用程序，其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行，所述至少一个应用程序配置用于：执行如第一方面任一项所示的文档管理方法。

第四方面，本申请提供一种计算机可读存储介质，采用如下的技术方案：

一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令所述计算机执行如第一方面任一项所示的文档管理方法。

综上所述，本申请包括以下有益技术效果：

1．获取待处理文档信息，对待处理文档信息中的文档内容确定待处理文档信息对应的归档类别，以便根据归档类别有针对性的对待处理文档信息进行处理；再基于归档类别确定多个相同的已归档文档信息，以便筛选出参考价值较大的已归档文档信息，时间间隔较近的相同归档类别的已归档文档对待处理文档信息具有的参考价值更大；针对所有已归档文档的检测信息生成检测项信息种群，再确定迭代次数，基于迭代次数对检测项信息种群进行迭代计算，以便筛选出适应度较高的个体，检测项信息种群的每一次计算都可以筛选掉个体适应度低的个体，保留个体适应度高的个体，进而当达到迭代次数后的检测项信息种群中的个体都保持有较高的适应度，进一步的，可以确定最优检测项信息，最优检测项信息为与待处理文档信息适配度最高的检测项；获取与最优检测项信息对应的检测流程，并对待处理文档信息进行检测，相较于相关技术中每执行一次检测都需要获取用户的决策信息，本申请直接匹配与待处理文档信息适配度最高的检测项进行检测，有效提高了待处理文档信息检测的效率。

附图说明

图1为本申请实施例提供的一种文档管理方法的流程示意图。

图2为本申请实施例提供的一种检测项信息种群迭代计算过程示意图。

图3为本申请实施例提供的一种文档检测流程和归档后文档的利用流程示意图。

图4为本申请实施例提供的一种文档管理装置示意图。

图5为本申请实施例提供的一种电子设备的结构示意图。

具体实施方式

以下结合图1至图5对本申请作进一步详细说明。

本具体实施例仅仅是对本申请的解释，其并不是对本申请的限制，本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改，但只要在本申请的范围内都受到专利法的保护。

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

另外，本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符“/”，如无特殊说明，一般表示前后关联对象是一种“或”的关系。

下面结合说明书附图对本申请实施例作进一步详细描述。在当前数字化发展日益重视的趋势下，文档与数据管理的重要性在不断提高，数据积累所体现出的价值也越来越高，而在文档管理的过程中文档检测流程必不可少。当前文档管理系统所暴露的问题为仅提供单一的管理流程，用户需要且仅能适应系统提供的文档管理方式，要想实现文档管理的数字化，需要同时购买多套系统，并进行制定开发，而档案外包企业提供的档案数字化服务和文档实物寄存机构提供的实物档案管理服务，需要首先进行数据对接。当前主流文档管理存在管理流程单一、文档利用率较差、无法实现流媒体文件的深度利用、无法提供指导多个问题。进一步的，为了实现高效率的文档管理目标，依托于云上技术服务平台而生的信息化文档管理服务应运而生。因而，实现文档管理的私有化定制，同时提高文档管理安全等级和文档检测效率有利于提高用户的体验感。

具体的，本申请实施例提供了一种文档管理方法，由电子设备执行，该电子设备可以为服务器也可以为终端设备，其中，该服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云计算服务的云服务器。终端设备可以是智能手机、平板电脑、笔记本电脑、台式计算机等，但并不局限于此，该终端设备以及服务器可以通过有线或无线通信方式进行直接或间接地连接，本申请实施例在此不做限制。

结合图1，图1为本申请实施例提供的一种文档管理方法的流程示意图，其中，该方法包括步骤S101、步骤S102、步骤S103、步骤S104、步骤S105、步骤S106和步骤S107，其中：

步骤S101、当接收到文档管理请求后，获取待处理文档信息。

具体的，电子设备接收到文档管理请求后，可以基于用户批量导入文档的文档信息获取待处理文档信息，还可以基于用户手动上传文档的文档信息获取待处理文档信息，也可以为用户在线创建文档的文档信息获取待处理文档信息，其中，用户可以进行在线文档创建，在线创建后的文档可以用于多人协作编辑，也可以仅为用户个人编辑，本申请实施例不进行限定。待处理文档信息可以包括：待处理文档的内容、待处理文档的文档名称、待处理文档中的电子印章和待处理文档信息的上传者的标识信息，其中，待处理文档信息的上传者的标识信息可以为上传者的姓名、上传者的工号、上传者的职位或上传者所在部门。

步骤S102、对待处理文档信息中的文档内容进行信息识别，以确定待处理文档信息对应的归档类别。

待处理文档信息中的文档内容可以为文字、视频、音频的任意组合，当文档内容中为视频或音频，或音频与视频的组合时，可以首先通过语音识别的方式将视频或音频中的内容转换为文字形式，再提取转换后的文字，以实现对待处理文档信息中的文档内容的识别。具体的，可以基于预先设立的文档归档类别识别模型和关键词确定，通过关键词和文档归档类别识别模型对待处理文档信息的归档类别进行确定，以有效提高待处理文档信息归档类别的准确性。归档类别可以为：发展类别、科技类别和财务类别，本申请实施例不进行限定。

步骤S103、基于归档类别，从已归档数据库中确定与待处理文档信息对应的归档类别相同的多个已归档文档信息。

具体的，可以根据时间匹配法确定归档类别相同的多个已归档文档信息，设定预设时段，例如，预设时段为30天，则以待处理文档信息的当前处理时间为终点，当前处理时间为12月12日，则时间起点为11月12日，筛选出在11月12日至12月12日内的所有已归档文档信息，已归档数据库中存储有所有企业或用户已完成归档的所有文档信息。基于归档类别从已归档数据库中确定与归档类别相同的所有第一已归档文档，再获取每一第一已归档文档对应的归档时间，归档时间为在文档归档时电子设备自动记录的，电子设备可以将归档时间转换为时间编号，例如：20221212143334，表征归档时间为2022年12月12日14时33分34秒；基于所有第一已归档文档各自对应的归档时间，确定处于预设时段内的第一已归档文档信息，即第二已归档文档信息。可以理解的是，在短时间内文档归档类别发生改变的概率较小，因而已归档文档信息的归档时间与待处理文档信息的处理时间间隔越短，具有的参考价值越大，确定的待处理文档信息的归档类别的准确度越高。

步骤S104、获取每一已归档文档信息对应的检测项信息，其中，所有已归档文档信息和各自对应的检测项信息构成检测项信息种群。

具体的，每一已归档文档信息对应的检测项信息在检测完成后会自动存储至电子设备中，每一已归档文档信息对应的检测项信息可以相同，也可以不同，在本申请实施例中，优选的检测项信息可以包括：文档的真实性检测、文档的完整性检测、文档的可用性检测和文档的安全性检测。检测项信息种群中包括多个个体，每一个体对应已归档文档和已归档文档的检测项信息，每一个体均可以使用预设长度的二进制串来表示，其中，检测项信息种群为已归档文档信息和各自对应的检测项信息的信息集合。在检测项信息种群中已归档文档信息和各自对应的检测项信息为待处理文档信息对应的解，所有已归档文档信息和各自对应的检测项信息对应的个数为解的个数，解的个数可以表征待处理文档信息解的精度，根据每一个解和每一个解对应的精度数值，可以使用十进制转二进制转换方法，得到每一个体对应的二进制串。例如，当取值范围为[0-1]时，在[0-1]的区间内有10个数，分别为0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9和1.0，根据十进制和二进制的转换法，可以将0.2转换为0100000000，即0.2对应的二进制串为0100000000。

步骤S105、基于检测项信息种群确定检测项信息种群对应的当前适应度方差，并基于当前适应度方差，确定检测项信息种群的迭代次数。

具体的，在检测项信息种群中适应度越高的个体越接近最优解，即适应度越高的个体对应的检测项信息与待处理文档信息的匹配度越高，而当前适应度方差表征每一个体对应的适应度与平均适应度之差平方的和的平均数，其中，平均适应度为每一已归档文档信息和对应的检测项信息的平均适应度，当前适应度方差越小，表明每一个体对应的适应度越接近平均适应度。

检测项信息种群对应的当前适应度方差表征检测项信息种群在未进行迭代计算前的适应度方差，可以根据对应关系确定检测项信息种群的迭代次数，或，根据迭代次数模型确定检测项信息种群的迭代次数。

因而，在一种可能的情况中，根据对应关系确定检测项信息种群的迭代次数，可以包括：根据预设的适应度方差与迭代次数的对应关系、当前适应度方差，确定与当前适应度方差对应的检测项信息种群的迭代次数，再获取预期适应度方差和对应的迭代次数，根据与当前适应度方差对应的迭代次数和与预期适应度方差对应的迭代次数确定检测项信息种群的迭代次数，其中，该对应关系为基于经验设置，其可以符合大多数实际需求；可以理解的是，根据对应关系确定检测项信息种群的迭代次数的可实现方式，相较于根据检测项信息种群的适应度变化趋势进行无限次的迭代，本申请实施例直接基于确定的迭代次数对检测项信息种群进行迭代计算，可以有效降低迭代次数过高导致计算效率较低和迭代次数过少导致计算结果不准确的问题的发生概率；

在另一种可能的情况中，根据迭代次数模型确定检测项信息种群的迭代次数的可实现方式，具体可以包括：将当前适当度方差输入至迭代次数模型中，迭代次数模型输出对应的迭代次数；其中，迭代次数模型为根据多个训练适应度方差确定的，将多个训练适应度方差输入至待训练迭代次数模型中，得到各自对应的训练迭代次数；根据训练迭代次数和各自对应的迭代次数，利用损失函数，确定损失值，再根据损失值和训练适应度方差对待训练迭代次数模型进行训练，直至损失值达到预设损失阈值，并将达到预设损失阈值的待训练迭代次数模型确定为迭代次数模型。其中，在本申请实施例中，优选的使用焦点损失函数以有效提高计算准确度，且本申请实施例不对预设损失阈值进行限定，用户可自行设置。

步骤S106、基于迭代次数对检测项信息种群进行迭代计算，并从目标检测项信息种群中，确定最优检测项信息，其中，目标检测项信息种群为经过迭代次数的迭代计算的检测项信息种群。

具体的，检测项信息种群的迭代过程可以包括：

选择：可以使用二元锦标赛选择法随机选择两个个体，根据两个个体各自对应的适应度，选择适应度高的个体进入下一执行步骤，例如，当前检测项信息种群的个体为：个体A、个体B、个体C和个体D，分别对应适应度为3、4、6、9，当前检测项信息种群的个体成为检测项信息种群1，第一次选择，随机选择出个体A和个体B，选择适应度高的个体B；第二次选择，随机选择出个体C和个体D, 选择适应度高的个体D；第三次选择，随机选择出个体C和个体B，选择适应度高的个体C；第四次选择，随机选择出个体B和个体D，选择适应度高的个体D，进而将选择得到的个体B、个体D、个体C和个体D生成检测项信息种群2，当检测项信息种群2中的个体数量与检测项信息种群1的个体数量相同，选择停止。

提高：针对检测项信息种群2的适应度最高的至少两个个体进行提高，即将适应度最高的个体的数量增加至预设数量，本申请实施例不对预设数量进行限定，以生成检测项信息种群3。

交叉：在检测项信息种群3中随机选择两个个体进行单点交叉，在两个二进制串中随机选择位置点进行分割，分割后每一个体分为两个片段，将选择的位置点为起点的片段相互交换，以完成交叉，并生成检测项信息种群4。

变异：在检测项信息种群4中，针对交叉后产生的新的个体进行变异，即随机选择二进制串中的任一位为变异位进行变异，针对二进制串的变异可以为将“0”变为“1”，将“1”变为“0”，进而可以再次产生新的个体，针对所有变异后的个体形成新的检测项信息种群。

针对新的检测项信息种群执行如上选择、提高、交叉和变异的步骤，具体的可参考图2，图2中的“1、2、3、4”均代表不同的个体，通过选择保留个体1、个体2、个体3和个体3，针对个体1和个体2进行提高，个体1的数量变为2，个体2的数量变为2，再将其中个体2和个体3进行交叉，产生了新的个体6和个体7，随机选择个体1进行变异，产生新的个体9，即一次迭代计算完成，基于当前的个体1、个体2、个体6、个体7和个体9再次进行迭代计算。针对达到迭代次数后的检测项信息种群确定为目标检测项信息种群，从目标检测项信息种群中选取个体适应度最高的最优个体，并将与最优个体对应的检测项信息确定为最优检测项信息，最优检测项信息即为待处理文档信息对应的检测项。

步骤S107、根据最优检测项信息，获取最优检测项信息对应的检测流程，并基于检测流程对待处理文档信息进行检测。

具体的，每一检测项信息对应的检测流程为预先输入至电子设备中的，其中，当最优检测项信息为真实性检测时，则对应的检测流程可以包括：验证待处理文档信息中的固化信息的有效性，固化信息可以包括：数字摘要、电子签名、电子印章，可以通过获取待处理文档信息上传前的固化信息，将上传前的固化信息与当前固化信息进行比对以实现固化信息的验证；当最优检测项信息为安全性检测时，则对应的检测流程可以包括：可以查看文档的属性信息，基于属性信息确定文档的存储环境，并调用病毒检测接口，检测存储环境信息对应的存储环境，以确定待处理文档信息是否安全；当最优检测项信息为完整性检测时，则对应的检测流程可以包括：获取文档元数据项，根据预设的完整元数据项和文档元数据项确定待处理文档信息是否完整，其中，文档元数据项可以包括：文件创建的作者、文件的编排结构，预设的完整元数据项可以为用户预先输入至电子设备中的，本申请实施例不进行限定；当最优检测项信息为可用性检测时，对应的检测流程可以包括：通过后缀名调用函数确定待处理文档信息的文档内容的格式，其中，后缀名调用函数可以为：strrchr()函数、explode()函数或pathinfo()函数，本申请实施例不对后缀名调用函数的具体内容进行限定，只要能够实现本申请技术方案即可。待处理文档信息的后缀名可以为：记事本类型（txt）、表格类型（xls）、可携带文档类型（pdf）、压缩文件类型（zip）、word文档类型（doc）、视频格式（rm）、图片格式（jpg）和音频格式（MID），基于文档内容的内容格式和预设内容标准格式，确定待处理文档信息是否可用，在本申请实施例中，为便于文档管理，优选的预设内容标准格式为word文档类型（doc），其中，预设内容标准格式为预先存储至电子设备中的。

基于上述实施例，获取待处理文档信息，对待处理文档信息中的文档内容确定待处理文档信息对应的归档类别，以便根据归档类别有针对性的对待处理文档信息进行处理；再基于归档类别确定多个相同的已归档文档信息，以便筛选出参考价值较大的已归档文档信息，时间间隔较近的相同归档类别的已归档文档对待处理文档信息具有的参考价值更大；针对所有已归档文档的检测信息生成检测项信息种群，再确定迭代次数，基于迭代次数对检测项信息种群进行迭代计算，以便筛选出适应度较高的个体，检测项信息种群的每一次计算都可以筛选掉个体适应度低的个体，保留个体适应度高的个体，进而当达到迭代次数后的检测项信息种群中的个体都保持有较高的适应度，进一步的，可以确定最优检测项信息，最优检测项信息为与待处理文档信息适配度最高的检测项；获取与最优检测项信息对应的检测流程，并对待处理文档信息进行检测，相较于相关技术中每执行一次检测都需要获取用户的决策信息，本申请直接匹配与待处理文档信息适配度最高的检测项进行检测，有效提高了待处理文档信息检测的效率。

进一步地，在本申请实施例中，基于检测项信息种群，确定检测项信息种群对应的当前适应度方差，包括步骤SA1-SA2（附图未示出），其中：

步骤SA1、基于检测项信息种群确定检测项信息种群中所有已归档文档信息和各自对应的检测项信息各自对应的适应度和所有已归档文档信息和各自对应的检测项信息的数量信息。

具体的，可以将每一已归档文档信息和对应的检测项信息输入至适应度确定模型中，以确定每一已归档文档信息和对应的检测项信息的对应的适应度，适应度确定模型为基于多个训练样本得到的，其中，适应度确定模型的训练过程包括：每个训练样本包括已归档文档信息和对应的检测项信息，将每一个体代表的样本作为DAG-SVM模型的训练样本，基于多个训练样本对DAG-SVM进行训练，再基于测试样本对训练结果进行检测，每一测试样本的准确率即为每一训练样本对应的个体的适应度，其中，每一测试样本的准确率为DAG-SVM确定已归档文档信息对应的检测项信息的准确率。

步骤SA2、基于所有适应度和数量信息，确定检测项信息种群对应的当前适应度方差。

可以根据方差计算公式确定检测项信息种群对应的当前适应度方差，其中：方差计算公式为：，/>=，其中， />表示i个个体适应度的平均数，/> 表示未进行迭代计算检测项信息种群的当前适应度方差，为第一个个体，个体/>的适应度值为/>，例如，当个体为/>时，对应的适应度值为，当个体为/>时，对应的适应度值为/> 。

基于上述实施例，确定所有检测项信息各自对应的适应度和检测项信息的数量，根据所有检测项信息各自对应的适应度和检测项信息的数量确定检测项信息种群对应的当前适应度方差，以便通过方差对检测项信息种群的当前适应度和平均值之间的差值进行准确的衡量。

进一步地，在本申请实施例中，基于当前适应度方差，确定检测项信息种群的迭代次数，包括步骤SB1-步骤SB2（附图未出示），其中：

步骤SB1、获取预期适应度方差。

具体的，预期适应度方差为预先存储至电子设备中的，预期适应度方差表征可以接受的最大的适应度方差，即希望检测项信息种群可以达到的方差数据。因而在设置时可以将预期适应度方差设置为较小的数，可以为0.001、0.002或0.0003，本申请实施例不进行限定。

步骤SB2、基于预期适应度方差、当前适应度方差和预设的适应度方差和迭代次数的对应关系，确定检测项信息种群的迭代次数。

基于对应关系，确定与预期适应度方差对应的第一迭代次数和与当前适应度方差对应的第二迭代次数，其中，适应度方差和迭代次数的对应关系为根据历史数据得到来的，例如，当适应度方差为5时，对应的迭代次数为10，当适应度方差为2时，对应的迭代次数为50，从而基于多个适应度方差和各自对应的迭代次数可以建立适应度方差和迭代次数的对应关系；根据迭代次数差值，确定检测项信息种群的迭代次数。其中，迭代次数差值=第一迭代次数-第二迭代次数。根据迭代次数差值，确定检测项信息种群的迭代次数，使得检测项信息种群的适应度方差能够通过迭代计算达到一个足够小的适应度方差数值，当检测项信息种群的适应度方差足够小时，得到的对应的检测项信息更加准确。

基于上述实施例，获取预期适应度方差，并根据预期适应度方差、当前适应度方差和预设的适应度方差和迭代次数的对应关系确定检测项信息种群的迭代次数，以便使用确定好的迭代次数对检测项信息种群进行迭代计算，基于确定好的迭代次数进行计算不仅可以减少迭代次数过高导致的效率较低的问题，还可以减少迭代次数过低导致的结果不准确的问题。

进一步地，在本申请实施例中，对待处理文档信息中的文档内容进行信息识别，以确定待处理文档信息对应的归档类别，包括步骤SC1-步骤SC3（附图未示出），其中：

步骤SC1、基于待处理文档信息中的文档内容进行关键词识别，确定文档内容的关键词信息，其中，关键词信息包括多个关键词和各自对应的词频。

具体的，可以将多个预设的关键词和文档内容一一进行匹配，以确定文档内容中的关键词信息，多个预设的关键词为预先输入至电子设备中的，每一文档内容中可以包括多个关键词，关键词的词频为关键词在文档内容中出现的次数，关键词的词频为根据文档内容的实际情况确定的。

步骤SC2、基于文档内容中的所有关键词和各自对应的词频，从所有关键词中确定目标关键词。

具体的，当文档内容中某一关键词的词频较高时，表明该关键词与文档内容的关联度越大，因而根据所有关键词和各自对应的词频，从所有关键词中选出关键词词频最高的关键词，可以理解的是，由于词频越高，关键词与文档内容的关联度较大，当出现最高词频对应至少两个不同的关键词时，至少两个不同的关键词也存在着较高的关联度，因而可以随机选择其中一个关键词确定为目标关键词。

步骤SC3、基于目标关键词和预先设立的文档归档类别识别模型，确定待处理文档信息对应的归档类别，其中，预先设立的文档归档类别识别模型为基于多个训练关键词和各自对应的归档类别标签进行训练得到的。

具体的，每一文档归档类别对应有多个关键词，文档归档类别识别模型可以为神经网络模型，也可以为KNN分类模型，本申请实施例不再进行限定，文档归档类别识别模型的训练过程包括：将训练关键词和归档类别标签输入至待训练文档归档类别识别模型中，得到训练关键词对应的训练归档类别标签；根据训练归档类别标签和各自对应的归档类别标签利用预设损失函数，确定损失值；根据损失值和训练归档类别标签对文档归档类别识别模型进行迭代训练，直至损失值达到预设损失阈值，并将达到预设损失阈值的待训练文档归档类别识别模型确定为文档归档类别识别模型。在本申请实施例中，优选的损失函数为焦点损失函数，以有效提高计算准确度，且本申请实施例不对预设损失阈值进行限定，可以为0.01、0.02或0.03；将目标关键词输入至预先设立的文档归档类别识别模型中，文档归档类别识别模型可以输出对应的归档类别。

基于上述实施例，对待处理文档信息中的内容进行关键词识别，确定文档内容中的关键词信息，再根据所有关键词、各自对应的词频和预设词频阈值确定目标关键词，以确定对文档内容影响度最大的关键词，基于影响度最大的关键词和文档归档类别识别模型进行分类，以实现了对待处理文档归档类别的准确判断。

进一步地，在本申请实施例中，基于检测流程对待处理文档信息进行检测之后，还包括步骤SD1-SD2（附图未示出），其中：

步骤SD1、获取检测结果，并基于检测结果，确定待处理文档信息是否能够归档。

具体的，检测结果可以包括：检测通过和检测不通过，其中，当待处理文档信息所有检测项信息对应的检测流程均通过时，则检测结果为检测通过，当检测结果为检测通过时，表明待处理文档信息符合归档要求，则待处理文档信息能够归档，并执行步骤SD2；当待处理文档信息存在任一项检测项信息对应的检测流程未通过时，则检测结果为不通过，当检测结果为检测不通过时，表明待处理文档信息不符合归档要求，待处理文档信息无法归档。

步骤SD2、若是，则基于待处理文档信息中的文档内容对待处理文档信息进行归档。

具体的，基于待处理文档信息中的文档内容对待处理文档信息进行归档，包括步骤SD21-SD22（附图未示出），其中：

步骤SD21、基于待处理文档信息中的文档内容生成待处理文档信息对应的归档建议信息，其中，归档建议信息包括对文档保管期限的建议信息和文档密级级别的建议信息。

具体的，可以根据归档建议模型，或，人工建议的方式生成归档建议信息。其中，一种基于归档建议模型生成归档建议信息的具体实现方式，可以包括：根据获取到的文档内容从已归档文档库中匹配相似的文档内容，再获取与相似的文档内容对应的文档保管期限和文档密级级别，将相似的文档内容对应的文档保管期限和文档密级级别作为待处理文档信息对应的文档保管期限和文档密级级别，其中，相似的文档内容表征已归档文档的内容与待处理文档信息的文档内容相似度达到预设相似度阈值，可以理解的是，每一文档在撰写时均有撰写模板，当已归档文档的内容与待处理文档信息的文档内容相似度达到预设相似度阈值时，表明模板相同，本申请实施例不对预设相似度阈值进行限定，用户可自行设置。其中，文档保管期限可以包括永久、长期和短期，可以理解的是，长期对应的时间长度大于短期对应的时间长度，本申请实施例不对长期对应的时间长度和短期对应的时间长度进行限定，用户可自行设置；文档密级级别可以包括：绝密、机密和秘密。其中，归档建议模型为基于多个已归档文档信息训练样本得到的。

一种基于人工建议的方式生成归档建议信息的具体实现方式，具体可以包括：电子设备将获取到的待处理文档信息的文档内容上传至归档建议指导人员对应的终端中，归档建议指导人员基于接收到的文档内容，对文档保管期限和文档密级级别进行判断，给出判断结果，并将判断结果上传至电子设备中，电子设备将判断结果即归档建议信息发送给用户。

步骤SD22、基于待处理文档信息对应的归档建议信息和预设归档模板，将待处理文档信息进行归档。

具体的，预设归档模板为预先输入至电子设备中的，在本申请实施例中，预设归档模板可以为用户结合实际需求设置的。可以理解的是，在本申请实施例中，预设归档模板为多个，每一归档类别对应唯一归档模板。归档模板中可以包括：文档的归档类别、归档内容、归档后的案件号、归档日期、归档年度、页数、待处理文档信息的来源部门。即在对待处理文档信息进行归档时，用户可以根据归档建议信息设置待处理文档信息的保管期限和密级级别，并将待处理文档信息添加至对应的归档类别和归档内容中，再手动输入归档日期、归档年度和页数，以完成待处理文档信息的归档。

基于上述实施例，获取检测结果确定待处理文档信息是否能够归档，若是，则表明待处理文档信息中的文档内容可以归档到档案库中，否则，则表明待处理文档信息中的文档内容无法进行归档；进一步的，当待处理文档信息中的文档内容可以归档时，获取待处理文档信息对应的归档建议，再结合预设归档模板对待处理文档信息进行归档，归档建议信息和归档模板为待处理文档信息的归档提供参考意见，辅助用户进行归档，可以有效提高归档效率。

进一步地，基于待处理文档信息对应的归档建议信息和预设归档模板，将待处理文档信息进行归档之后，还包括：

获取用户的决策信息和至少一个待处理已归档文档信息，其中，决策信息包括：档案利用、档案编研、档案统计和档案鉴定。

基于决策信息确定对应的档案处理流程，基于档案处理流程对所有待处理已归档文档信息进行处理。

用户在档案处理界面发起档案处理请求，并选择至少一个待处理已归档文档信息，档案处理界面跳转到决策信息选择界面，即用户可以选择档案利用功能，或档案编研功能，或档案统计功能，或档案鉴定功能。其中，与决策信息对应的档案处理流程为预先输入至电子设备中，每一决策信息对应的档案处理流程均不同。当用户选择档案利用功能或档案编研时，则可以为用户提供下载功能，用户可自行对下载后的文档进行编研和利用；当用户决策信息为档案统计时，则再次获取用户的统计决策信息，统计决策信息可以包括档案内容的统计和档案形式的统计。其中，档案统计结果可以以柱状图、饼图、环形图、表格的形式为用户进行展示，其中，档案统计结果为用户自定义元数据，有针对性的设置元数据属性、自由配置档案统计结果得到的，档案统计的自定义功能更好的满足了用户的个性化需求，同时多元化的数据展示形式也使得统计内容更通俗易懂；当用户决策信息为档案鉴定功能时，则可以选择对档案的开放程度进行鉴定，或选择档案销毁鉴定。其中，档案的开放程度可以基于档案的密级级别确定，当档案的密级级别越高时，则档案的开放程度越小；档案的销毁鉴定可以基于档案的保管期限确定，即对当到达档案的保管期限时，则可以选择继续存储或销毁，若继续存储，则重新设定保管期限；若销毁，则将档案移动至销毁库中。

进一步地，可参考图3，图3为本申请实施例提供的文档检测流程和归档后文档的利用流程图，电子设备接收上传的文档，其中，文档的上传方式可以为本地上传、离线导入、批量对接或系统对接，若接收到的待处理文档信息在上传前未经过检测，则需要对待处理文档信息进行检测，确定待处理文档信息检测是否通过，若通过，则对待处理文档信息进行归档，在归档的过程中可以选择归档指导以辅助用户进行归档，若未通过，则将待处理文档信息返还至用户端；进一步的，若未通过，且用户添加了预归档模块，则可以将未通过检测的待处理文档信息存放至预归档库中进行再次检测，若未通过，则返还至用户端，若待处理文档信息在上传前经过检测，则可以直接进行归档，针对所有通过检测的待处理文档信息进行归档，形成档案库，用户可自行选择相应的功能以对档案库中的档案进行利用。

进一步地，在本申请实施例中，基于待处理文档信息中的文档内容对待处理文档信息进行归档之后，还包括步骤SE1-SE6（附图未示出），其中：

步骤SE1、当接收到用户对目标类别文档的借阅请求信息后，获取用户的身份标识信息，其中，借阅请求信息表征用户对目标类别文档标识信息的借阅请求。

具体的，当用户需要借阅目标类别文档时，需要首先进入到借阅请求界面，在进入借阅请求界面前，用户需要输入用户名和用户密码，其中，用户名可以为用户的手机号，或用户的工号，或用户姓名，或用户的身份证号。进一步的，用户在借阅请求界面输入借阅请求信息，电子设备接收到借阅请求后，获取用户的身份标识，当用户名为手机号、工号和身份证号时，则可以基于对应关系获取用户的身份标识，在本申请实施例中，优选的用户的身份标识为用户的姓名，其中，对应关系为技术人员预先存储至电子设备中的。当用户的姓名出现重复时，可以在用户的姓名后添加对应的编号，以区分相同姓名的用户。

步骤SE2、基于身份标识信息，获取与身份标识信息对应的用户的职位信息，其中，职位信息表征用户所在职位、用户所在职位的时间和用户所在职位状态，用户所在职位状态包括：用户处于在职状态和用户处于离职状态。

具体的，可以基于身份标识信息与职位信息的对应关系实现用户职位信息的获取，身份标识信息与职位信息的对应关系为技术人员预先存储至电子设备中的，且实时更新的。其中，用户处于离职状态时可以包括：用户在未来预设时长内会离职的状态和用户已经离职的状态，在本申请实施例中，基于实际情况，优选的预设时长为一个月。

步骤SE3、基于预设的职位信息与文档借阅权限信息的对应关系和职位信息，确定职位信息对应的用户文档借阅权限信息，其中，用户文档借阅权限信息表征用户能够借阅的所有类别文档各自对应的标识信息。

具体的，预设的职位信息与文档借阅权限信息的对应关系为预先输入至电子设备中的，预设的职位信息和文档借阅权限信息的对应关系为管理人员设定的，本申请实施例不进行限定；电子设备确定用户的职位信息后可以基于对应关系直接确定用户文档借阅权限信息。

步骤SE4、基于用户文档借阅权限信息和借阅请求信息，确定用户是否能够借阅目标类别文档。

步骤SE5、若是，则根据目标类别文档的标识信息读取对应的文档信息并发送至用户客户端。

步骤SE6、否则，则生成目标类别文档无借阅权限信号。

具体的，可以将借阅请求信息与用户文档借阅权限信息一一进行匹配，若匹配成功，则表明用户能够借阅目标类别文档，并执行步骤SE5,读取与目标类别文档的标识信息对应的文档信息，并发送至用户客户端，使得用户能够借阅目标类别文档，其中，目标类别文档的标识信息可以为目标类别文档的类别名称，也可以为与目标类别文档对应的类别编号，本申请实施例不再进行限定，用户可自行设置。与目标类别文档的标识信息对应的文档信息可以为一个也可以为多个，当文档信息为多个时，用户可以通过检索选择最终要借阅的文档，其中，检索模式包括全文检索、模糊检索和精确检索，用户可以根据自身需求选择对应的检索模式。否则，则执行步骤SE6，表明用户无法借阅目标类别文档，生成目标类别文档无借阅权限信号以提示用户。

基于上述实施例，当接收到借阅请求信息后，获取用户的身份标识信息，并根据身份标识信息确定用户的职位信息，再基于对应关系确定与用户职位信息对应的借阅权限，以便确定用户是否能够借阅目标类别文档，随着用户职位信息的变化其借阅权限也会随之变化，即用户在职或用户职位更高时，用户对企业来说更重要，同时用户的借阅权限也越大，相反用户离职或用户职位较低时借阅权限也更小，而以用户职位信息限制用户的借阅权限，可以起到有效的保密性，当用户能够借阅时，则将对应的文档信息发送至用户客户端。

进一步地，在本申请实施例中，根据目标类别文档的标识信息读取对应的文档信息并发送至用户客户端之前，还包括步骤SF1-SF3（附图未示出），其中：

步骤SF1、获取与目标类别文档的标识信息对应的密级级别和与目标类别文档的标识信息对应的借阅目的。

具体的，每一目标类别文档的标识信息对应唯一的密级级别，每一目标类别文档的标识信息对应的密级级别为预先输入至电子设备中。与目标类别文档的标识信息对应的借阅目的可以为用户在借阅目标类别文档时输入的内容，也可以为用户在借阅界面选择的固定内容，其中，用户在借阅目标类别文档时输入的借阅目的的内容可以包括：借阅场景和借阅时间。

步骤SF2、基于预设的审批流程和密级级别的对应关系和目标类别文档的标识信息，确定与目标类别文档的标识信息对应的审批流程。

具体的，预设的审批流程和密级级别的对应关系为预先存储至电子设备中的，每一级别对应的审批流程可以为管理人员预先设置的，本申请实施例不再进行限定，其中，审批流程可以指定到任一企业角色或任一直属上级机构，每一审批流程可以包括：每一审批节点对应的审批人和审批不通过说明。

步骤SF3、基于目标类别文档的标识信息对应的审批流程和借阅目的，确定目标类别文档是否能够被借阅；

相应的，则根据目标类别文档的标识信息读取对应的文档信息并发送至用户客户端，包括：

若是，则根据目标类别文档的标识信息读取对应的文档信息并发送至用户客户端。

具体的，根据审批流程对与目标类别文档的标识信息对应的目标类别文档进行逐一审批，每一审批节点对应的审批人可以基于借阅目的进行审批，进而可以确定目标类别文档是否能够被借阅。相应的，若确定目标类别能够被借阅，则读取与目标类别文档的标识信息对应的文档信息，并将文档信息发送至用户客户端；否则，则生成目标类别文档无借阅权限信号，以禁止用户借阅目标类别文档。

基于上述实施例，获取密级级别和借阅目的，并确定对应的审批流程，基于审批流程和借阅目的确定是否能够借阅，以审批流程和借阅目的为限制，对目标类别文档进行再次限定，可以进一步提高文档的保密性。

进一步地，在本申请实施例中，获取待处理文档信息之前，还包括步骤SG1-SG5（附图未示出），其中：

步骤SG1、获取企业的携带有企业使用信息的文档管理应用请求。

具体的，企业在使用文档管理应用时，向电子设备发送应用请求，以使电子设备完成对携带有企业使用信息的文档管理应用请求的获取。携带有企业使用信息可以为携带有企业标识信息的使用信息，其中，企业的标识可以为企业的名称，也可以为企业对应的编号，可以理解的是每一企业对应唯一的编号。在本申请实施例中，企业可以为律所、社区管理机构、学校、培训机构、区县及以下档案室、诊所、药店或小型图书馆，本申请实施例不进行限定。其中，文档应用管理请求表征企业需要使用文档管理应用的请求。

步骤SG2、基于企业使用信息，确定企业是否具有文档管理应用的授权资格。

具体的，可以根据第一对应关系确定企业是否具有文档管理应用的授权资格，其中，第一对应关系为预先存储至电子设备中的，第一对应关系为基于企业的购买信息确定的，购买信息可以包括是否购买和购买金额，若企业已经购买文档管理应用，则可以建立第一对应关系，若企业未购买文档管理应用，则不存在第一对应关系。根据企业使用信息从第一对应关系中，确定企业的文档管理应用授权资格。若是，则表明企业可以使用文档管理应用，并执行步骤SG3，进一步判断企业的使用期限是否在授权期限内；否则，则表示企业无法使用文档管理应用。

步骤SG3、若是，则根据企业使用信息，确定企业的使用期限是否在授权期限内。

步骤SG4、若企业的使用期限在授权期限内，则赋予企业文档管理应用的使用资格。

步骤SG5、若企业的使用期限未在授权期限内，则发送提示信息至企业对应的用户端。

可以从企业使用信息中的购买金额确定企业的使用期限，若企业的购买金额为第一金额，则可以确定企业的使用期限为第一预设时长，若企业的购买金额为第二金额，则可以确定企业的使用期限为第二预设时长，本申请实施例不对第一金额和第二金额进行限定，可自行设置，在本申请实施例中，优选的第一预设时长为一个月，第二预设时长为一年，因此，第一金额<第二金额。若企业的使用期限在授权期限内，则执行步骤SG4，赋予企业文档管理应用的使用资格，否则，则表明企业未购买，无法使用文档管理应用，并执行步骤SG5，发送无使用资格提醒信号至企业对应的用户端。此外，当企业的购买金额在第一金额和第二金额之间，或大于第二金额，还可以根据企业的定制化需求更新文档管理应用的功能。

上述实施例从方法流程的角度介绍一种文档管理方法，下述实施例从虚拟模块或者虚拟单元的角度介绍了一种文档管理装置，具体详见下述实施例。

本申请实施例提供一种文档管理装置，如图4所示，该文档管理装置具体可以包括：

获取模块210，用于当接收到文档管理请求后，获取待处理文档信息；

归档类别确定模块220，用于对待处理文档信息中的文档内容进行信息识别，以确定待处理文档信息对应的归档类别；

相同已归档文档确定模块230，用于基于归档类别，从已归档数据库中确定与待处理文档信息对应的归档类别相同的多个已归档文档信息；

检测项信息种群生成模块240，用于获取每一已归档文档信息对应的检测项信息，其中，所有已归档文档信息和各自对应的检测项信息构成检测项信息种群；

迭代次数确定模块250，用于基于检测项信息种群确定检测项信息种群对应的当前适应度方差，并基于当前适应度方差，确定检测项信息种群的迭代次数；

最优检测项信息确定模块260，用于基于迭代次数对检测项信息种群进行迭代计算，并从目标检测项信息种群中，确定最优检测项信息，其中，目标检测项信息种群为经过迭代次数的迭代计算的检测项信息种群；

检测模块270，用于根据最优检测项信息，获取最优检测项信息对应的检测流程，并基于检测流程对待处理文档信息进行检测。

获取模块210获取待处理文档自信息，归档类别确定模块220对待处理文档信息中的文档内容确定待处理文档信息对应的归档类别，以便根据归档类别有针对性的对待处理文档信息进行处理；相同已归档文档确定模块230再基于归档类别确定多个相同的已归档文档信息，以便筛选出参考价值较大的已归档文档信息，时间间隔较近的相同归档类别的已归档文档对待处理文档信息具有的参考价值更大；检测项信息种群生成模块240针对所有已归档文档的检测信息生成检测项信息种群，迭代次数确定模块250确定迭代次数，基于迭代次数对检测项信息种群进行迭代计算，以便保留个体适应度较高的个体，检测项信息种群的每一次计算都可以筛选掉个体适应度低的个体，保留个体适应度高的个体，进而当达到迭代次数后的检测项信息种群中的个体都保持有较高的适应度，进一步的，最优检测项信息确定模块260可以确定最优检测项信息，最优检测项信息为与待处理文档信息适配度最高的检测项；检测模块270获取与最优检测项信息对应的检测流程，并对待处理文档信息进行检测，相较于相关技术中每执行一次检测都需要获取用户的决策信息，本申请直接匹配与待处理文档信息适配度最高的检测项进行检测，有效提高了待处理文档信息检测的效率。

本申请实施例中的一种可能的实现方式，迭代次数确定模块250在执行基于检测项信息种群确定检测项信息种群对应的当前适应度方差时，用于：

基于所有适应度和数量信息，确定检测项信息种群对应的当前适应度方差。

本申请实施例中的一种可能的实现方式，迭代次数确定模块250在执行基于当前适应度方差，确定检测项信息种群的迭代次数时，用于：

获取预期适应度方差；

基于预期适应度方差、当前适应度方差以及预设的适应度方差和迭代次数的对应关系，确定检测项信息种群的迭代次数。

本申请实施例中的一种可能的实现方式，归档类别确定模块220在执行对待处理文档信息中的文档内容进行信息识别，以确定待处理文档信息对应的归档类别时，用于：

基于待处理文档信息中的文档内容进行关键词识别，确定文档内容的关键词信息，其中，关键词信息包括多个关键词和各自对应的词频；

基于文档内容中的所有关键词和各自对应的词频，从所有关键词中确定目标关键词；

本申请实施例中的一种可能的实现方式，文档管理装置，还包括：

归档模块，用于：

若是，则基于待处理文档信息中的文档内容对待处理文档信息进行归档；

本申请实施例中的一种可能的实现方式，文档管理装置在执行基于待处理文档信息中的文档内容对待处理文档信息进行归档时，用于：

基于待处理文档信息中的文档内容生成待处理文档信息对应的归档建议信息，其中，归档建议信息包括对文档保管期限的建议信息和文档密级级别的建议信息；

已归档文档借阅模块，用于：

当接收到用户对目标类别文档的借阅请求信息后，获取用户的身份标识信息，其中，借阅请求信息表征用户对目标类别文档标识信息的借阅请求；

基于身份标识信息，获取与身份标识信息对应的用户的职位信息，其中，职位信息表征用户所在职位、用户所在职位的时间和用户所在职位状态，用户所在职位状态包括：用户处于在职状态和用户处于离职状态；

基于预设的职位信息与文档借阅权限信息的对应关系和职位信息，确定职位信息对应的用户文档借阅权限信息，其中，用户文档借阅权限信息表征用户能够借阅的所有类别文档各自对应的标识信息；

若是，则根据目标类别文档的标识信息读取对应的文档信息并发送至用户客户端；

否则，则生成目标类别文档无借阅权限信号。

在本申请实施例中的一种可能的实现方式，文档管理装置，还包括：

审批模块，用于：

相应的，已归档文档借阅模块则根据目标类别文档的标识信息读取对应的文档信息并发送至用户客户端时，用于：

下面对本申请实施例提供的一种电子设备进行介绍，下文描述的电子设备与上文描述的文档管理方法可相互对应参照。

本申请实施例提供了一种电子设备，如图5所示，图5为本申请实施例提供的一种电子设备的结构示意图，图5所示的电子设备300包括：处理器301和存储器303。其中，处理器301和存储器303相连，如通过总线302相连。可选地，电子设备300还可以包括收发器304。需要说明的是，实际应用中收发器304不限于一个，该电子设备300的结构并不构成对本申请实施例的限定。

处理器301可以是CPU（Central Processing Unit，中央处理器），通用处理器，DSP（Digital Signal Processor，数据信号处理器），ASIC（Application SpecificIntegrated Circuit，专用集成电路），FPGA（Field Programmable Gate Array，现场可编程门阵列）或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请实施例公开内容所描述的各种示例性的逻辑方框，模块和电路。处理器301也可以是实现计算功能的组合，例如包含一个或多个微处理器组合，DSP和微处理器的组合等。

总线302可包括一通路，在上述组件之间传送信息。总线302可以是PCI（Peripheral Component Interconnect，外设部件互连标准）总线或EISA（ExtendedIndustry Standard Architecture，扩展工业标准结构）总线等。总线302可以分为地址总线、数据总线、控制总线等。为便于表示，图5中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

存储器303可以是ROM（Read Only Memory，只读存储器）或可存储静态信息和指令的其他类型的静态存储设备，RAM（Random Access Memory，随机存取存储器）或者可存储信息和指令的其他类型的动态存储设备，也可以是EEPROM（Electrically ErasableProgrammable Read Only Memory，电可擦可编程只读存储器）、CD-ROM（Compact DiscRead Only Memory，只读光盘）或其他光盘存储、光碟存储（包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等）、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。

存储器303用于存储执行本申请实施例方案的应用程序代码，并由处理器301来控制执行。处理器301用于执行存储器303中存储的应用程序代码，以实现前述方法实施例所示的内容。

其中，电子设备包括但不限于：移动电话、笔记本电脑、数字广播接收器、PDA（个人数字助理）、PAD（平板电脑）、PMP（便携式多媒体播放器）、车载终端（例如车载导航终端）等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例，不应对本申请实施例的功能和使用范围带来任何限制。

下面对本申请实施例提供的一种计算机可读存储介质进行介绍，该计算机可读存储介质上存储有计算机程序，当其在计算机上运行时，使得计算机可以执行前述方法实施例中相应内容。与相关技术相比，获取待处理文档自信息，对待处理文档信息中的文档内容确定待处理文档信息对应的归档类别，以便根据归档类别有针对性的对待处理文档信息进行处理；再基于归档类别确定多个相同的已归档文档信息，以便筛选出参考价值较大的已归档文档信息，时间间隔较近的相同归档类别的已归档文档对待处理文档信息具有的参考价值更大；针对所有已归档文档的检测信息生成检测项信息种群，再根据适应度函数确定迭代次数，基于迭代次数对检测项信息种群进行迭代计算，以便保留个体适应度较高的个体，检测项信息种群的每一次计算都可以筛选掉个体适应度低的个体，保留个体适应度高的个体，进而当达到迭代次数后的检测项信息种群中的个体都保持有较高的适应度，进一步的，可以确定最优检测项信息，最优检测项信息为与待处理文档信息适配度最高的检测项；获取与最优检测项信息对应的检测流程，并对待处理文档信息进行检测，相较于相关技术中每执行一次检测都需要获取用户的决策信息，本申请直接匹配与待处理文档信息适配度最高的检测项进行检测，有效提高了待处理文档信息检测的效率。

应该理解的是，虽然附图的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，其可以以其他的顺序执行。而且，附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，其执行顺序也不必然是依次进行，而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

以上仅是本申请的部分实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种文档管理方法，其特征在于，包括：

当接收到文档管理请求后，获取待处理文档信息；

2.根据权利要求1所述的文档管理方法，其特征在于，所述基于检测项信息种群确定检测项信息种群对应的当前适应度方差，包括：

3.根据权利要求1所述的文档管理方法，其特征在于，所述基于所述当前适应度方差，确定检测项信息种群的迭代次数，包括：

获取预期适应度方差；

4.根据权利要求1所述的文档管理方法，其特征在于，所述对待处理文档信息中的文档内容进行信息识别，以确定待处理文档信息对应的归档类别，包括：

5.根据权利要求1所述的文档管理方法，其特征在于，所述基于所述检测流程对待处理文档信息进行检测之后，还包括：

6.根据权利要求5所述的文档管理方法，其特征在于，基于待处理文档信息中的文档内容对待处理文档信息进行归档，包括：

7.根据权利要求6所述的文档管理方法，其特征在于，所述基于待处理文档信息中的文档内容对待处理文档信息进行归档之后，还包括：

否则，则生成目标类别文档无借阅权限信号。

8.根据权利要求7所述的文档管理方法，其特征在于，所述根据所述目标类别文档的标识信息读取对应的文档信息并发送至用户客户端之前，还包括：

9.一种文档管理装置，其特征在于，包括：

10.一种电子设备，其特征在于，包括：

至少一个处理器；

存储器；

至少一个应用程序，其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行，所述至少一个应用程序配置用于：执行权利要求1～8任一项所述的文档管理方法。