CN106250440B

CN106250440B - 文档管理方法和装置

Info

Publication number: CN106250440B
Application number: CN201610596039.3A
Authority: CN
Inventors: 贾武阳; 黄卓标; 李君君
Original assignee: Kingdee Software China Co Ltd
Current assignee: Kingdee Software China Co Ltd
Priority date: 2016-07-26
Filing date: 2016-07-26
Publication date: 2019-07-09
Anticipated expiration: 2036-07-26
Also published as: CN106250440A

Abstract

本发明涉及一种文档管理方法和装置，包括：获取待存储文档的文档标识，其中，文档标识是唯一标识文档的多位随机数；解析所述待存储文档的文档标识，提取所述待存储文档的文档标识中的前N位字符，所述N为大于等于1的整数；根据预先存储的预设字符与预设分区之间的一一对应关系，查找与所述提取的前N位字符对应的分区，所述预设字符是根据文档标识的前至少一位位置所对应的字符得到的，所述预设字符为至少一个，每个预设字符包含至少一个的字符；将所述待存储文档存储至查找到的所述分区对应的存储位置。提高了存储位置的打开效率。

Description

文档管理方法和装置

技术领域

本发明涉及终端技术领域，特别是涉及一种文档管理方法和装置。

背景技术

通常在利用文档存储系统进行文档存储操作时，是将上传的文档直接存储到单一存储目录中，比如存储到某一固定的存储磁盘的指定目录下，并将该文档的唯一标识对应保存到该存储目录中。在对所存储的文档进行相关操作(比如读取、删除等操作)时，会打开该单一固定的存储目录，并从该存储目录中查找出与文档标识对应的文档，以进行相关操作。

然而，随着所存储的文档数量的不断增加，使得单一存储目录的文档条目信息增加，在打开该存储目录时，文档信息的加载速度就会变得很慢，打开效率很低。

发明内容

基于此，有必要针对上述问题，提供一种能够存储目录打开效率的文档管理方法和装置。

一种文档管理方法，所述方法包括以下步骤：

获取待存储文档的文档标识，其中，文档标识是唯一标识文档的多位随机数；

解析所述待存储文档的文档标识，提取所述待存储文档的文档标识中的前N位字符，所述N为大于等于1的整数；

根据预先存储的预设字符与预设分区之间的一一对应关系，查找与所述提取的前N位字符对应的分区，所述预设字符是根据文档标识的前至少一位位置所对应的字符得到的，所述预设字符为至少一个，每个预设字符包含至少一个的字符；

将所述待存储文档存储至查找到的所述分区对应的存储位置。

在其中一个实施例中，在所述获取待存储文档的文档标识的步骤之前，还包括：

获取待存储文档；

检测预设的多个分区的资源负载情况，获取所述多个分区中资源负载最小的分区所对应的预设字符；

将所述对应的预设字符作为起始字符生成不重复的随机数；

将所述生成的不重复的随机数作为唯一标识所述待存储文档的文档标识。

在其中一个实施例中，所述文档标识为全局唯一标识符。

在其中一个实施例中，所述将所述待存储文档存储至查找到的所述分区对应的存储位置的步骤，包括：

获取预设分区的分区标识和预设存储位置之间的映射关系；

根据所述映射关系，确定所述查找到的分区的分区标识所对应的存储位置，将所述待存储文档存储至所述确定的存储位置中。

在其中一个实施例中，所述预设存储位置包括文件夹层级、磁盘层级、主机层级和网络位置层级中的至少一种。

在其中一个实施例中，所述方法还包括：

获取待查找的文档标识，解析所述待查找的文档标识，提取所述待查找的文档标识中前N位字符，所述N为大于等于1的整数；

确定与所述提取的前N位字符对应的分区；

根据预设分区的分区标识与预设存储位置之间的映射关系，查找与所述确定的分区的分区标识对应的存储位置；

从所述查找到的存储位置中查找与所述待查找的文档标识对应的文档。

一种文档管理装置，所述装置包括：

获取模块，用于获取待存储文档的文档标识，其中，文档标识是唯一标识文档的多位随机数；

提取模块，用于解析所述待存储文档的文档标识，提取所述待存储文档的文档标识中的前N位字符，所述N为大于等于1的整数；

查找模块，用于根据预先存储的预设字符与预设分区之间的一一对应关系，查找与所述提取的前N位字符对应的分区，所述预设字符是根据文档标识的前至少一位位置所对应的字符得到的，所述预设字符为至少一个，每个预设字符包含至少一个的字符；

存储管理模块，用于将所述待存储文档存储至查找到的所述分区对应的存储位置。

在其中一个实施例中，所述获取模块还用于获取待存储文档；

所述装置还包括：

负载检测模块，用于检测预设的多个分区的资源负载情况，获取所述多个分区中资源负载最小的分区所对应的预设字符；

文档标识生成模块，用于将所述对应的预设字符作为起始字符生成不重复的随机数，将所述生成的不重复的随机数作为唯一标识所述待存储文档的文档标识。

在其中一个实施例中，所述文档标识为全局唯一标识符。

在其中一个实施例中，其特征在于，所述提取模块还用于获取待查找的文档标识，解析所述待查找的文档标识，提取所述待查找的文档标识中前N位字符，所述N为大于等于1的整数；

所述存储管理模块还用于确定与所述提取的前N位字符对应的分区，根据预设分区的分区标识与预设存储位置之间的映射关系，查找与所述确定的分区的分区标识对应的存储位置；

所述查找模块还用于从所述查找到的存储位置中查找与所述待查找的文档标识对应的文档。

上述文档管理方法和装置，通过获取待存储文档的文档标识，其中，文档标识是唯一标识文档的多位随机数；解析所述待存储文档的文档标识，提取所述待存储文档的文档标识的前N位字符，所述N为大于等于1的整数；根据预先存储的预设字符与预设分区之间的一一对应关系，查找与所述提取的前N位字符对应的分区，所述预设字符是根据文档标识的前至少一位位置所对应的字符得到的，所述预设字符为至少一个，每个预设字符包含至少一个的字符；将所述待存储文档存储至查找到的所述分区对应的存储位置。即根据文档标识的前预设位数的字符来查找对应的分区存储位置，可以实现将文档进行分区存储，则相较于将文档存放至同一存储目录而言，每个分区中文档数量较少，提高了存储位置的打开效率。

附图说明

图1为一个实施例中文档管理方法的流程示意图；

图2为一个实施例中文档标识生成方法的流程示意图；

图3为一个实施例中文档查找方法的流程示意图；

图4为一个实施例中文档管理装置的结构示意图；

图5为另一个实施例中文档管理装置的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

如图1所示，提供了一种文档管理方法，现以该方法应用于服务器中为例进行举例说明，该方法包括以下步骤：

步骤102，获取待存储文档的文档标识，其中，文档标识是唯一标识文档的多位随机数。

本实施例中，服务器在对待存储文档进行存储时，会获取该待存储文档的文档标识。其中，文档标识是唯一标识文档的多位随机数。也就是说，文档标识是随机生成的不重复的序列号，可以唯一标识文档。

在一个实施例中，文档标识为全局唯一标识符(GUID，Globally UniqueIdentifier)。其中，全局唯一标识符(以下简称GUID码)，是一种由算法生成的二进制长度为128位的数字标识符，在理想情况下，任何计算机和计算机集群都不会生成两个相同的GUID。可以理解，文档标识也可以是根据其他预设的随机数生成规则生成的不重复的其他类型的多位随机数。本发明实施例对文档标识的具体类型不做限定，只要满足其是能够随机生成的不重复的序列号即可。

步骤104，解析待存储文档的文档标识，提取待存储文档的文档标识中的前N位字符，其中，N为大于等于1的整数。

进一步，服务器会解析所获取的待存储文档的文档标识，提取该文档标识中前N位字符，其中N为大于等于1的整数。具体地，可以根据服务器中预设的提取位数来提取该文档标识中前N位字符，即可以根据服务器中预设的提取位数来确定要提取前多少位字符。

比如，文档标识为c1f70312-9389-45c9-88db-67dd662e92af，预设提取位数为1，则提取该文档标识中首位字符“c”。如果预设提取位数为2，则提取该文档标识中前2位字符“c1”。可以理解，可以根据实际需要预设不同的提取位数。

步骤106，根据预先存储的预设字符与预设分区之间的一一对应关系，查找与提取的前N位字符对应的分区，预设字符是根据文档标识的前至少一位位置所对应的字符得到的，预设字符为至少一个，每个预设字符包含至少一个的字符。

本实施例中，服务器中存储了多个预设字符，文档标识是多位随机数，该多个预设字符是根据文档标识的前至少一位位置所对应的字符得到的。可以理解，这里所说的前至少一位位置，是依照从左往右的顺序来进行描述的，越左位置越前，第一位即为最左边的那个位置。其中，每个预设字符包含至少一个的字符。

具体地，该多个预设字符可以是文档标识的首位位置(即第一位位置)所对应的字符。可以理解，因为文档标识是多位随机数，其各个位置所可能出现的字符也是随机的，则于该位置可能出现的字符即为该位置所对应的字符。比如，文档标识是GUID码时，基于GUID码的随机性，其首位位置可能出现的字符则为0-9以及A-F中的任意一个，那么该首位位置所对应的字符即为0-9以及A-F这16个字符。

此外，预设字符也可以是根据文档标识的前多位位置中不同位置所对应的字符之间的随机组合得到的多个字符组合。比如，文档标识是GUID码时，基于GUID码的随机性，其前两位位置中第一位和第二位分别对应的字符都是0-9以及A-F这16个字符，那么，将第一位对应的16个字符与第二位对应的16个字符进行随机组合，即可得到256个组合后的字符组合。

进一步，预设字符的设置决定步骤104所述的预设提取位数的设置。预设字符是根据前多少位的位置所对应的字符得到的，则预设提取位数就预设相同位数。比如，预设字符是根据前一位位置所对应的字符得到的，则预设提取位数为1位，预设字符是根据前两位位置所对应的字符得到的，则预设提取位数为2位。

进一步，服务器中针对各个预设字符对应设置了分区，各个预设字符与各个分区一一对应。服务器记录了预设字符与预设分区之间的一一对应关系，根据该对应关系，查找与提取的前N位字符对应的分区。

在一个实施例中，预设分区的分区标识即为其所对应的预设字符，则将提取的前N位字符作为分区标识，查找其所对应的分区。在另一个实施例中，服务器中存储了预设字符与分区标识之间的对应关系，根据该对应关系，查找与所提取的前N位字符对应的分区标识，该分区标识所对应的分区即为所确定的与提取的前N位字符对应的分区。

步骤108，将待存储文档存储至查找到的分区对应的存储位置。

本实施例中，服务器中预先针对每个分区设置了对应的存储位置。在查找到与提取的字符对应的分区后，会将待存储文档存储至查找到的分区所对应的存储位置。

进一步，所查找到的对应的存储位置为文件夹层级、磁盘层级、主机层级和网络位置层级中的任意一种。

本实施例中，根据文档标识的前至少一位位置所对应的字符进行预设字符的设置，并针对预设字符设置对应的预设分区，在对待存储文档进行存储时，提取待存储文档的文档标识中前N位字符，N为大于等于1的整数，其中，文档标识是唯一标识文档的多位随机数。根据预先存储的预设字符与预设分区之间的一一对应关系，查找与提取的前N位字符所对应的分区，将该待存储文档存储至所查找到的分区对应的存储位置。即根据文档标识的前预设位数的字符来查找对应的分区存储位置，可以实现将文档进行分区存储，则相较于将文档存放至同一存储目录而言，每个分区中文档数量较少，提高了打开效率。

此外，由于文档标识是多位随机数，那么，文档标识的各个位置中所出现的字符是随机的，根据文档标识的前至少一位位置对应的字符确定预设字符，根据确定的预设字符设置对应分区，进一步在存储文档时根据提取的待存储文档的前N位字符确定对应存储的分区。这样一来，使得每个分区中所存储的文档数量大概保持均衡。从而有利于资源的合理利用，以及提高了系统的稳定性。

在一个实施例中，在获取待存储文档的文档标识的步骤之前，还包括：确定文档标识的前预设位数的各个位置所对应的至少一个字符，当预设位数为一位时，则将文档标识首位位置所对应的至少一个字符作为预设字符，当预设位数为多位时，则将不同位置所对应的至少一个字符相互之间进行随机组合，得到预设字符；针对各个预设字符划分对应的分区，记录预设字符与划分的分区之间的一一对应关系。

本实施例中，文档标识为多位随机数的一种数据类型。基于文档标识的随机性，文档标识的每一位位置所可能出现的字符也是随机的，其中该位置可能出现的字符即为该位置所对应的字符。

进一步，服务器在确定预设字符时，可以先确定文档标识的前预设位数的各个位置所对应的字符，其中，每个位置所对应的字符为至少一个。

其中，当预设位数为一位时，则将文档标识首位位置所对应的至少一个字符作为预设字符，当预设位数为多位时，则将不同位置所对应的至少一个字符相互之间进行随机组合，得到预设字符。比如，文档标识为GUID码时，当预设位数为一位时，GUID码的首位位置所对应的字符为0～9以及A～F这16个字符，则将这16个字符作为预设字符。当预设位数为两位时，GUID码的第一位和第二位这两个位置分别对应的0～9以及A～F这16个字符，则将这两个位置各自对应的16个字符之间进行随机组合，得到256个字符组合，所得的256个字符组合即为预设字符。

进一步，针对所得到的预设字符划分对应的分区，并记录预设字符与所划分的预设分区之间的一一对应关系。

本实施例中，根据文档标识的前至少一位位置对应的字符确定预设字符，根据确定的预设字符设置对应分区。结合根据提取的待存储文档的前N位字符(N为大于等于1的整数)确定对应存储的分区，使得每个分区中所存储的文档数量大概保持均衡。从而有利于资源的合理利用，以及提高了系统的稳定性。

如图2所示，在一个实施例中，在获取待存储文档的文档标识的步骤之前，还包括文档标识生成步骤，具体包括以下步骤：

步骤202，获取待存储文档。

步骤204，检测预设的多个分区的资源负载情况，获取多个分区中资源负载最小的分区所对应的预设字符。

本实施例中，服务器预先设置了多个预设字符，并预设了与各个预设字符一一对应的分区。其中，预设字符是根据文档标识的前至少一位位置所对应的字符得到的。进一步，由于文档标识是随机数，文档标识中每个位置所对应的字符即为该位置所可能出现的字符。每个预设字符包含至少一个的字符。

服务器在获取上传的待存储文档之后，会检测预先设置的多个分区的资源负载情况，即检测预设的多个分区中所存储的资源的负载情况。

进一步，从多个分区中确定资源负载最小的分区，并根据预先存储的预设字符与预设分区之间的对应关系，获取资源负载最小的分区所对应的预设字符。

具体地，在一个实施例中，预设字符可以是预设分区的分区标识。那么则可以在确定资源负载最小的分区后，根据分区与分区标识之间的对应关系，直接获取该资源负载最小的分区的分区标识得到预设字符。在另一个实施例中，服务器中预先存储了预设字符与预设分区的分区标识之间的一一对应关系，根据该对应关系，查找资源负载最小的分区的分区标识所对应的预设字符。

步骤206，将该对应的预设字符作为起始字符生成不重复的随机数。

步骤208，将生成的不重复的随机数作为唯一标识待存储文档的文档标识。

本实施例中，在获取与资源负载最小的分区对应的预设字符后，服务器会将该对应的预设字符作为起始字符结合预设的随机数生成规则生成不重复的随机数。比如，获取对应的预设字符为c1，那么结合预设的随机数生成规则生成以c1为起始字符的随机数。

进一步，将生成的不重复的随机数作为唯一标识该待存储文档的文档标识。

在一个实施例中，将该对应的预设字符作为起始字符生成GUID码，将所生成的GUID码作为唯一标识待存储文档的文档标识。

本发明实施例对文档标识的具体类型不做限定，只要满足其是能够随机生成的不重复的序列号即可。

本实施例中，在获取待存储文档时，检测预设分区的资源负载情况，将资源负载最小的分区所对应的预设字符作为起始字符生成不重复的随机数，将生成的不重复的随机数作为唯一标识该待存储文档的文档标识。这样一来，在根据提取的待存储文档的文档标识的前N位字符(N为大于等于1的整数)查找对应的分区时，即可将该待存储文档存储至该资源负载最小的分区所对应的存储位置，从而提高了资源的利用率，进而也提高了系统的稳定性。

在一个实施例中，将待存储文档存储至查找到的分区对应的存储位置的步骤，包括：获取预设分区的分区标识和预设存储位置之间的映射关系，根据该映射关系，确定查找到的分区的分区标识所对应的存储位置，将待存储文档存储至确定的存储位置中的步骤。

本实施例中，服务器中预设了存储位置，并预先存储了预设分区的分区标识与预设存储位置之间的映射关系。在查找到与从待存储文档标识中提取的前N位字符(N为大于等于1的整数)对应的分区后，会根据该映射关系，确定查找到的分区的分区标识所对应的存储位置。进一步，将该待存储文档存储至确定的存储位置中。

在一个实施例中，预设存储位置包括文件夹层级、磁盘层级、主机层级和网络位置层级中的至少一种。

本实施例中，可以将多个预设存储位置设置成多种不同存储层级。进一步，预设存储位置包括文件夹层级、磁盘层级、主机层级和网络位置层级中的至少一种。将预设的存储位置设置成不同存储层级，而不局限于特定的存储层级，可以实现对不同存储资源的充分利用，进一步提高了存储资源的利用率。

如图3所示，在一个实施例中，该方法还包括文档查找的步骤，具体包括以下步骤：

步骤302，获取待查找的文档标识，解析待查找的文档标识，提取待查找的文档标识中前N位字符，其中，N为大于等于1的整数。

本实施例中，服务器在查找文档时，获取待查找文档的文档标识。并对待查找的文档标识进行解析，提取待查找文档标识中前N位字符，其中，N为大于等于1的整数。具体地，可以根据预设的提取位数从待查找文档标识中对应提取前N位字符。

步骤304，确定与提取的前N位字符对应的分区。

本实施例中，服务器中预先设置了预设字符，并设置了与各个预设字符对应的分区。根据上述对应关系，确定与所提取的前N位字符对应的分区。

具体地，在一个实施例中，预设字符即为其所对应的分区的分区标识。则将提取的前N位字符作为分区标识查找其所对应的分区。在另一个实施例中，服务器中存储了预设字符与分区标识之间的对应关系，根据该对应关系，查找与所提取的前N位字符对应的分区标识，该分区标识所对应的分区即为所确定的与提取的前N位字符对应的分区。

步骤306，根据预设分区的分区标识与预设存储位置之间的映射关系，查找与该确定的分区的分区标识对应的存储位置。

步骤308，从查找到的存储位置中查找与待查找的文档标识对应的文档。

本实施例中，服务器中预先存储了预设分区的分区标识与预设存储位置之间的映射关系，根据该映射关系，查找与确定的与提取的前N位字符对应的分区的分区标识所对应的存储位置。

进一步，从查找到的存储位置中查找与待查找的文档标识对应的文档。

本实施例中，获取待查找的文档标识，解析待查找的文档标识，提取待查找的文档标识中前N位字符，N为大于等于1的整数；确定与提取的前N位字符对应的分区；根据预设分区的分区标识与预设存储位置之间的映射关系，查找与确定的分区的分区标识对应的存储位置；从查找到的存储位置中查找与待查找的文档标识对应的文档。即根据文档标识中的前N位字符查找到对应的分区，并从对应分区所对应的存储位置中查找待查找的文档，提高了文档的查找效率。此外，各个分区中的文档数量均衡分布，进一步使得文档的查找速度更快。

如图4所示，在一个实施例中，提供了一种文档管理装置，该装置包括获取模块402、提取模块406、查找模块408以及存储管理模块410，其中：

获取模块402，用于获取待存储文档的文档标识，其中，文档标识是唯一标识文档的多位随机数。

提取模块406，用于解析待存储文档的文档标识，提取待存储文档的文档标识中的前N位字符，N为大于等于1的整数。

查找模块408，用于根据预先存储的预设字符与预设分区之间的一一对应关系，查找与提取的前N位字符对应的分区，预设字符是根据文档标识的前至少一位位置所对应的字符得到的，预设字符为至少一个，每个预设字符包含至少一个的字符。

存储管理模块410，用于将待存储文档存储至查找到的分区对应的存储位置。

在一个实施例中，获取模块402还用于获取待存储文档。如图5所示，本实施例中，该装置还包括：

负载检测模块404，用于检测预设的多个分区的资源负载情况，获取多个分区中资源负载最小的分区所对应的预设字符；

文档标识生成模块405，用于将对应的预设字符作为起始字符生成不重复的随机数，将生成的不重复的随机数作为唯一标识待存储文档的文档标识。

在一个实施例中，文档标识为全局唯一标识符。

在一个实施例中，存储管理模块410还用于获取预设分区的分区标识和预设存储位置之间的映射关系；根据映射关系，确定查找到的分区的分区标识所对应的存储位置，将待存储文档存储至确定的存储位置中。

在一个实施例中，提取模块406还用于获取待查找的文档标识，解析待查找的文档标识，提取待查找的文档标识中前N位字符，N为大于等于1的整数。

存储管理模块410还用于确定与提取的前N位字符对应的分区，根据预设分区的分区标识与预设存储位置之间的映射关系，查找与确定的分区的分区标识对应的存储位置。

查找模块408还用于从查找到的存储位置中查找与待查找的文档标识对应的文档。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

Claims

1.一种文档管理方法，所述方法包括以下步骤：

获取待存储文档；

将所述对应的预设字符作为起始字符生成不重复的随机数；并将所述生成的不重复的随机数作为唯一标识所述待存储文档的文档标识；其中，文档标识是唯一标识文档的多位随机数；

2.根据权利要求1所述的方法，其特征在于，所述文档标识为全局唯一标识符。

3.根据权利要求1所述的方法，其特征在于，所述将所述待存储文档存储至查找到的所述分区对应的存储位置的步骤，包括：

获取预设分区的分区标识和预设存储位置之间的映射关系；

4.根据权利要求1所述的方法，其特征在于，所述预设存储位置包括文件夹层级、磁盘层级、主机层级和网络位置层级中的至少一种。

5.根据权利要求1所述的方法，其特征在于，所述方法还包括：

确定与所述提取的前N位字符对应的分区；

6.一种文档管理装置，其特征在于，所述装置包括：

获取模块，用于获取待存储文档；

文档标识生成模块，用于将所述对应的预设字符作为起始字符生成不重复的随机数，将所述生成的不重复的随机数作为唯一标识所述待存储文档的文档标识，其中，文档标识是唯一标识文档的多位随机数；

7.根据权利要求6所述的装置，其特征在于，所述文档标识为全局唯一标识符。

8.根据权利要求6所述的装置，其特征在于，所述提取模块还用于获取待查找的文档标识，解析所述待查找的文档标识，提取所述待查找的文档标识中前N位字符，所述N为大于等于1的整数；

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。