CN106250440B - 文档管理方法和装置 - Google Patents

文档管理方法和装置 Download PDF

Info

Publication number
CN106250440B
CN106250440B CN201610596039.3A CN201610596039A CN106250440B CN 106250440 B CN106250440 B CN 106250440B CN 201610596039 A CN201610596039 A CN 201610596039A CN 106250440 B CN106250440 B CN 106250440B
Authority
CN
China
Prior art keywords
document
identification
subregion
stored
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201610596039.3A
Other languages
English (en)
Other versions
CN106250440A (zh
Inventor
贾武阳
黄卓标
李君君
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kingdee Software China Co Ltd
Original Assignee
Kingdee Software China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kingdee Software China Co Ltd filed Critical Kingdee Software China Co Ltd
Priority to CN201610596039.3A priority Critical patent/CN106250440B/zh
Publication of CN106250440A publication Critical patent/CN106250440A/zh
Application granted granted Critical
Publication of CN106250440B publication Critical patent/CN106250440B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems

Abstract

本发明涉及一种文档管理方法和装置,包括:获取待存储文档的文档标识,其中,文档标识是唯一标识文档的多位随机数;解析所述待存储文档的文档标识,提取所述待存储文档的文档标识中的前N位字符,所述N为大于等于1的整数;根据预先存储的预设字符与预设分区之间的一一对应关系,查找与所述提取的前N位字符对应的分区,所述预设字符是根据文档标识的前至少一位位置所对应的字符得到的,所述预设字符为至少一个,每个预设字符包含至少一个的字符;将所述待存储文档存储至查找到的所述分区对应的存储位置。提高了存储位置的打开效率。

Description

文档管理方法和装置
技术领域
本发明涉及终端技术领域,特别是涉及一种文档管理方法和装置。
背景技术
通常在利用文档存储系统进行文档存储操作时,是将上传的文档直接存储到单一存储目录中,比如存储到某一固定的存储磁盘的指定目录下,并将该文档的唯一标识对应保存到该存储目录中。在对所存储的文档进行相关操作(比如读取、删除等操作)时,会打开该单一固定的存储目录,并从该存储目录中查找出与文档标识对应的文档,以进行相关操作。
然而,随着所存储的文档数量的不断增加,使得单一存储目录的文档条目信息增加,在打开该存储目录时,文档信息的加载速度就会变得很慢,打开效率很低。
发明内容
基于此,有必要针对上述问题,提供一种能够存储目录打开效率的文档管理方法和装置。
一种文档管理方法,所述方法包括以下步骤:
获取待存储文档的文档标识,其中,文档标识是唯一标识文档的多位随机数;
解析所述待存储文档的文档标识,提取所述待存储文档的文档标识中的前N位字符,所述N为大于等于1的整数;
根据预先存储的预设字符与预设分区之间的一一对应关系,查找与所述提取的前N位字符对应的分区,所述预设字符是根据文档标识的前至少一位位置所对应的字符得到的,所述预设字符为至少一个,每个预设字符包含至少一个的字符;
将所述待存储文档存储至查找到的所述分区对应的存储位置。
在其中一个实施例中,在所述获取待存储文档的文档标识的步骤之前,还包括:
获取待存储文档;
检测预设的多个分区的资源负载情况,获取所述多个分区中资源负载最小的分区所对应的预设字符;
将所述对应的预设字符作为起始字符生成不重复的随机数;
将所述生成的不重复的随机数作为唯一标识所述待存储文档的文档标识。
在其中一个实施例中,所述文档标识为全局唯一标识符。
在其中一个实施例中,所述将所述待存储文档存储至查找到的所述分区对应的存储位置的步骤,包括:
获取预设分区的分区标识和预设存储位置之间的映射关系;
根据所述映射关系,确定所述查找到的分区的分区标识所对应的存储位置,将所述待存储文档存储至所述确定的存储位置中。
在其中一个实施例中,所述预设存储位置包括文件夹层级、磁盘层级、主机层级和网络位置层级中的至少一种。
在其中一个实施例中,所述方法还包括:
获取待查找的文档标识,解析所述待查找的文档标识,提取所述待查找的文档标识中前N位字符,所述N为大于等于1的整数;
确定与所述提取的前N位字符对应的分区;
根据预设分区的分区标识与预设存储位置之间的映射关系,查找与所述确定的分区的分区标识对应的存储位置;
从所述查找到的存储位置中查找与所述待查找的文档标识对应的文档。
一种文档管理装置,所述装置包括:
获取模块,用于获取待存储文档的文档标识,其中,文档标识是唯一标识文档的多位随机数;
提取模块,用于解析所述待存储文档的文档标识,提取所述待存储文档的文档标识中的前N位字符,所述N为大于等于1的整数;
查找模块,用于根据预先存储的预设字符与预设分区之间的一一对应关系,查找与所述提取的前N位字符对应的分区,所述预设字符是根据文档标识的前至少一位位置所对应的字符得到的,所述预设字符为至少一个,每个预设字符包含至少一个的字符;
存储管理模块,用于将所述待存储文档存储至查找到的所述分区对应的存储位置。
在其中一个实施例中,所述获取模块还用于获取待存储文档;
所述装置还包括:
负载检测模块,用于检测预设的多个分区的资源负载情况,获取所述多个分区中资源负载最小的分区所对应的预设字符;
文档标识生成模块,用于将所述对应的预设字符作为起始字符生成不重复的随机数,将所述生成的不重复的随机数作为唯一标识所述待存储文档的文档标识。
在其中一个实施例中,所述文档标识为全局唯一标识符。
在其中一个实施例中,其特征在于,所述提取模块还用于获取待查找的文档标识,解析所述待查找的文档标识,提取所述待查找的文档标识中前N位字符,所述N为大于等于1的整数;
所述存储管理模块还用于确定与所述提取的前N位字符对应的分区,根据预设分区的分区标识与预设存储位置之间的映射关系,查找与所述确定的分区的分区标识对应的存储位置;
所述查找模块还用于从所述查找到的存储位置中查找与所述待查找的文档标识对应的文档。
上述文档管理方法和装置,通过获取待存储文档的文档标识,其中,文档标识是唯一标识文档的多位随机数;解析所述待存储文档的文档标识,提取所述待存储文档的文档标识的前N位字符,所述N为大于等于1的整数;根据预先存储的预设字符与预设分区之间的一一对应关系,查找与所述提取的前N位字符对应的分区,所述预设字符是根据文档标识的前至少一位位置所对应的字符得到的,所述预设字符为至少一个,每个预设字符包含至少一个的字符;将所述待存储文档存储至查找到的所述分区对应的存储位置。即根据文档标识的前预设位数的字符来查找对应的分区存储位置,可以实现将文档进行分区存储,则相较于将文档存放至同一存储目录而言,每个分区中文档数量较少,提高了存储位置的打开效率。
附图说明
图1为一个实施例中文档管理方法的流程示意图;
图2为一个实施例中文档标识生成方法的流程示意图;
图3为一个实施例中文档查找方法的流程示意图;
图4为一个实施例中文档管理装置的结构示意图;
图5为另一个实施例中文档管理装置的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,提供了一种文档管理方法,现以该方法应用于服务器中为例进行举例说明,该方法包括以下步骤:
步骤102,获取待存储文档的文档标识,其中,文档标识是唯一标识文档的多位随机数。
本实施例中,服务器在对待存储文档进行存储时,会获取该待存储文档的文档标识。其中,文档标识是唯一标识文档的多位随机数。也就是说,文档标识是随机生成的不重复的序列号,可以唯一标识文档。
在一个实施例中,文档标识为全局唯一标识符(GUID,Globally UniqueIdentifier)。其中,全局唯一标识符(以下简称GUID码),是一种由算法生成的二进制长度为128位的数字标识符,在理想情况下,任何计算机和计算机集群都不会生成两个相同的GUID。可以理解,文档标识也可以是根据其他预设的随机数生成规则生成的不重复的其他类型的多位随机数。本发明实施例对文档标识的具体类型不做限定,只要满足其是能够随机生成的不重复的序列号即可。
步骤104,解析待存储文档的文档标识,提取待存储文档的文档标识中的前N位字符,其中,N为大于等于1的整数。
进一步,服务器会解析所获取的待存储文档的文档标识,提取该文档标识中前N位字符,其中N为大于等于1的整数。具体地,可以根据服务器中预设的提取位数来提取该文档标识中前N位字符,即可以根据服务器中预设的提取位数来确定要提取前多少位字符。
比如,文档标识为c1f70312-9389-45c9-88db-67dd662e92af,预设提取位数为1,则提取该文档标识中首位字符“c”。如果预设提取位数为2,则提取该文档标识中前2位字符“c1”。可以理解,可以根据实际需要预设不同的提取位数。
步骤106,根据预先存储的预设字符与预设分区之间的一一对应关系,查找与提取的前N位字符对应的分区,预设字符是根据文档标识的前至少一位位置所对应的字符得到的,预设字符为至少一个,每个预设字符包含至少一个的字符。
本实施例中,服务器中存储了多个预设字符,文档标识是多位随机数,该多个预设字符是根据文档标识的前至少一位位置所对应的字符得到的。可以理解,这里所说的前至少一位位置,是依照从左往右的顺序来进行描述的,越左位置越前,第一位即为最左边的那个位置。其中,每个预设字符包含至少一个的字符。
具体地,该多个预设字符可以是文档标识的首位位置(即第一位位置)所对应的字符。可以理解,因为文档标识是多位随机数,其各个位置所可能出现的字符也是随机的,则于该位置可能出现的字符即为该位置所对应的字符。比如,文档标识是GUID码时,基于GUID码的随机性,其首位位置可能出现的字符则为0-9以及A-F中的任意一个,那么该首位位置所对应的字符即为0-9以及A-F这16个字符。
此外,预设字符也可以是根据文档标识的前多位位置中不同位置所对应的字符之间的随机组合得到的多个字符组合。比如,文档标识是GUID码时,基于GUID码的随机性,其前两位位置中第一位和第二位分别对应的字符都是0-9以及A-F这16个字符,那么,将第一位对应的16个字符与第二位对应的16个字符进行随机组合,即可得到256个组合后的字符组合。
进一步,预设字符的设置决定步骤104所述的预设提取位数的设置。预设字符是根据前多少位的位置所对应的字符得到的,则预设提取位数就预设相同位数。比如,预设字符是根据前一位位置所对应的字符得到的,则预设提取位数为1位,预设字符是根据前两位位置所对应的字符得到的,则预设提取位数为2位。
进一步,服务器中针对各个预设字符对应设置了分区,各个预设字符与各个分区一一对应。服务器记录了预设字符与预设分区之间的一一对应关系,根据该对应关系,查找与提取的前N位字符对应的分区。
在一个实施例中,预设分区的分区标识即为其所对应的预设字符,则将提取的前N位字符作为分区标识,查找其所对应的分区。在另一个实施例中,服务器中存储了预设字符与分区标识之间的对应关系,根据该对应关系,查找与所提取的前N位字符对应的分区标识,该分区标识所对应的分区即为所确定的与提取的前N位字符对应的分区。
步骤108,将待存储文档存储至查找到的分区对应的存储位置。
本实施例中,服务器中预先针对每个分区设置了对应的存储位置。在查找到与提取的字符对应的分区后,会将待存储文档存储至查找到的分区所对应的存储位置。
进一步,所查找到的对应的存储位置为文件夹层级、磁盘层级、主机层级和网络位置层级中的任意一种。
本实施例中,根据文档标识的前至少一位位置所对应的字符进行预设字符的设置,并针对预设字符设置对应的预设分区,在对待存储文档进行存储时,提取待存储文档的文档标识中前N位字符,N为大于等于1的整数,其中,文档标识是唯一标识文档的多位随机数。根据预先存储的预设字符与预设分区之间的一一对应关系,查找与提取的前N位字符所对应的分区,将该待存储文档存储至所查找到的分区对应的存储位置。即根据文档标识的前预设位数的字符来查找对应的分区存储位置,可以实现将文档进行分区存储,则相较于将文档存放至同一存储目录而言,每个分区中文档数量较少,提高了打开效率。
此外,由于文档标识是多位随机数,那么,文档标识的各个位置中所出现的字符是随机的,根据文档标识的前至少一位位置对应的字符确定预设字符,根据确定的预设字符设置对应分区,进一步在存储文档时根据提取的待存储文档的前N位字符确定对应存储的分区。这样一来,使得每个分区中所存储的文档数量大概保持均衡。从而有利于资源的合理利用,以及提高了系统的稳定性。
在一个实施例中,在获取待存储文档的文档标识的步骤之前,还包括:确定文档标识的前预设位数的各个位置所对应的至少一个字符,当预设位数为一位时,则将文档标识首位位置所对应的至少一个字符作为预设字符,当预设位数为多位时,则将不同位置所对应的至少一个字符相互之间进行随机组合,得到预设字符;针对各个预设字符划分对应的分区,记录预设字符与划分的分区之间的一一对应关系。
本实施例中,文档标识为多位随机数的一种数据类型。基于文档标识的随机性,文档标识的每一位位置所可能出现的字符也是随机的,其中该位置可能出现的字符即为该位置所对应的字符。
进一步,服务器在确定预设字符时,可以先确定文档标识的前预设位数的各个位置所对应的字符,其中,每个位置所对应的字符为至少一个。
其中,当预设位数为一位时,则将文档标识首位位置所对应的至少一个字符作为预设字符,当预设位数为多位时,则将不同位置所对应的至少一个字符相互之间进行随机组合,得到预设字符。比如,文档标识为GUID码时,当预设位数为一位时,GUID码的首位位置所对应的字符为0~9以及A~F这16个字符,则将这16个字符作为预设字符。当预设位数为两位时,GUID码的第一位和第二位这两个位置分别对应的0~9以及A~F这16个字符,则将这两个位置各自对应的16个字符之间进行随机组合,得到256个字符组合,所得的256个字符组合即为预设字符。
进一步,针对所得到的预设字符划分对应的分区,并记录预设字符与所划分的预设分区之间的一一对应关系。
本实施例中,根据文档标识的前至少一位位置对应的字符确定预设字符,根据确定的预设字符设置对应分区。结合根据提取的待存储文档的前N位字符(N为大于等于1的整数)确定对应存储的分区,使得每个分区中所存储的文档数量大概保持均衡。从而有利于资源的合理利用,以及提高了系统的稳定性。
如图2所示,在一个实施例中,在获取待存储文档的文档标识的步骤之前,还包括文档标识生成步骤,具体包括以下步骤:
步骤202,获取待存储文档。
步骤204,检测预设的多个分区的资源负载情况,获取多个分区中资源负载最小的分区所对应的预设字符。
本实施例中,服务器预先设置了多个预设字符,并预设了与各个预设字符一一对应的分区。其中,预设字符是根据文档标识的前至少一位位置所对应的字符得到的。进一步,由于文档标识是随机数,文档标识中每个位置所对应的字符即为该位置所可能出现的字符。每个预设字符包含至少一个的字符。
服务器在获取上传的待存储文档之后,会检测预先设置的多个分区的资源负载情况,即检测预设的多个分区中所存储的资源的负载情况。
进一步,从多个分区中确定资源负载最小的分区,并根据预先存储的预设字符与预设分区之间的对应关系,获取资源负载最小的分区所对应的预设字符。
具体地,在一个实施例中,预设字符可以是预设分区的分区标识。那么则可以在确定资源负载最小的分区后,根据分区与分区标识之间的对应关系,直接获取该资源负载最小的分区的分区标识得到预设字符。在另一个实施例中,服务器中预先存储了预设字符与预设分区的分区标识之间的一一对应关系,根据该对应关系,查找资源负载最小的分区的分区标识所对应的预设字符。
步骤206,将该对应的预设字符作为起始字符生成不重复的随机数。
步骤208,将生成的不重复的随机数作为唯一标识待存储文档的文档标识。
本实施例中,在获取与资源负载最小的分区对应的预设字符后,服务器会将该对应的预设字符作为起始字符结合预设的随机数生成规则生成不重复的随机数。比如,获取对应的预设字符为c1,那么结合预设的随机数生成规则生成以c1为起始字符的随机数。
进一步,将生成的不重复的随机数作为唯一标识该待存储文档的文档标识。
在一个实施例中,将该对应的预设字符作为起始字符生成GUID码,将所生成的GUID码作为唯一标识待存储文档的文档标识。
本发明实施例对文档标识的具体类型不做限定,只要满足其是能够随机生成的不重复的序列号即可。
本实施例中,在获取待存储文档时,检测预设分区的资源负载情况,将资源负载最小的分区所对应的预设字符作为起始字符生成不重复的随机数,将生成的不重复的随机数作为唯一标识该待存储文档的文档标识。这样一来,在根据提取的待存储文档的文档标识的前N位字符(N为大于等于1的整数)查找对应的分区时,即可将该待存储文档存储至该资源负载最小的分区所对应的存储位置,从而提高了资源的利用率,进而也提高了系统的稳定性。
在一个实施例中,将待存储文档存储至查找到的分区对应的存储位置的步骤,包括:获取预设分区的分区标识和预设存储位置之间的映射关系,根据该映射关系,确定查找到的分区的分区标识所对应的存储位置,将待存储文档存储至确定的存储位置中的步骤。
本实施例中,服务器中预设了存储位置,并预先存储了预设分区的分区标识与预设存储位置之间的映射关系。在查找到与从待存储文档标识中提取的前N位字符(N为大于等于1的整数)对应的分区后,会根据该映射关系,确定查找到的分区的分区标识所对应的存储位置。进一步,将该待存储文档存储至确定的存储位置中。
在一个实施例中,预设存储位置包括文件夹层级、磁盘层级、主机层级和网络位置层级中的至少一种。
本实施例中,可以将多个预设存储位置设置成多种不同存储层级。进一步,预设存储位置包括文件夹层级、磁盘层级、主机层级和网络位置层级中的至少一种。将预设的存储位置设置成不同存储层级,而不局限于特定的存储层级,可以实现对不同存储资源的充分利用,进一步提高了存储资源的利用率。
如图3所示,在一个实施例中,该方法还包括文档查找的步骤,具体包括以下步骤:
步骤302,获取待查找的文档标识,解析待查找的文档标识,提取待查找的文档标识中前N位字符,其中,N为大于等于1的整数。
本实施例中,服务器在查找文档时,获取待查找文档的文档标识。并对待查找的文档标识进行解析,提取待查找文档标识中前N位字符,其中,N为大于等于1的整数。具体地,可以根据预设的提取位数从待查找文档标识中对应提取前N位字符。
步骤304,确定与提取的前N位字符对应的分区。
本实施例中,服务器中预先设置了预设字符,并设置了与各个预设字符对应的分区。根据上述对应关系,确定与所提取的前N位字符对应的分区。
具体地,在一个实施例中,预设字符即为其所对应的分区的分区标识。则将提取的前N位字符作为分区标识查找其所对应的分区。在另一个实施例中,服务器中存储了预设字符与分区标识之间的对应关系,根据该对应关系,查找与所提取的前N位字符对应的分区标识,该分区标识所对应的分区即为所确定的与提取的前N位字符对应的分区。
步骤306,根据预设分区的分区标识与预设存储位置之间的映射关系,查找与该确定的分区的分区标识对应的存储位置。
步骤308,从查找到的存储位置中查找与待查找的文档标识对应的文档。
本实施例中,服务器中预先存储了预设分区的分区标识与预设存储位置之间的映射关系,根据该映射关系,查找与确定的与提取的前N位字符对应的分区的分区标识所对应的存储位置。
进一步,从查找到的存储位置中查找与待查找的文档标识对应的文档。
本实施例中,获取待查找的文档标识,解析待查找的文档标识,提取待查找的文档标识中前N位字符,N为大于等于1的整数;确定与提取的前N位字符对应的分区;根据预设分区的分区标识与预设存储位置之间的映射关系,查找与确定的分区的分区标识对应的存储位置;从查找到的存储位置中查找与待查找的文档标识对应的文档。即根据文档标识中的前N位字符查找到对应的分区,并从对应分区所对应的存储位置中查找待查找的文档,提高了文档的查找效率。此外,各个分区中的文档数量均衡分布,进一步使得文档的查找速度更快。
如图4所示,在一个实施例中,提供了一种文档管理装置,该装置包括获取模块402、提取模块406、查找模块408以及存储管理模块410,其中:
获取模块402,用于获取待存储文档的文档标识,其中,文档标识是唯一标识文档的多位随机数。
提取模块406,用于解析待存储文档的文档标识,提取待存储文档的文档标识中的前N位字符,N为大于等于1的整数。
查找模块408,用于根据预先存储的预设字符与预设分区之间的一一对应关系,查找与提取的前N位字符对应的分区,预设字符是根据文档标识的前至少一位位置所对应的字符得到的,预设字符为至少一个,每个预设字符包含至少一个的字符。
存储管理模块410,用于将待存储文档存储至查找到的分区对应的存储位置。
在一个实施例中,获取模块402还用于获取待存储文档。如图5所示,本实施例中,该装置还包括:
负载检测模块404,用于检测预设的多个分区的资源负载情况,获取多个分区中资源负载最小的分区所对应的预设字符;
文档标识生成模块405,用于将对应的预设字符作为起始字符生成不重复的随机数,将生成的不重复的随机数作为唯一标识待存储文档的文档标识。
在一个实施例中,文档标识为全局唯一标识符。
在一个实施例中,存储管理模块410还用于获取预设分区的分区标识和预设存储位置之间的映射关系;根据映射关系,确定查找到的分区的分区标识所对应的存储位置,将待存储文档存储至确定的存储位置中。
在一个实施例中,预设存储位置包括文件夹层级、磁盘层级、主机层级和网络位置层级中的至少一种。
在一个实施例中,提取模块406还用于获取待查找的文档标识,解析待查找的文档标识,提取待查找的文档标识中前N位字符,N为大于等于1的整数。
存储管理模块410还用于确定与提取的前N位字符对应的分区,根据预设分区的分区标识与预设存储位置之间的映射关系,查找与确定的分区的分区标识对应的存储位置。
查找模块408还用于从查找到的存储位置中查找与待查找的文档标识对应的文档。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种文档管理方法,所述方法包括以下步骤:
获取待存储文档;
检测预设的多个分区的资源负载情况,获取所述多个分区中资源负载最小的分区所对应的预设字符;
将所述对应的预设字符作为起始字符生成不重复的随机数;并将所述生成的不重复的随机数作为唯一标识所述待存储文档的文档标识;其中,文档标识是唯一标识文档的多位随机数;
解析所述待存储文档的文档标识,提取所述待存储文档的文档标识中的前N位字符,所述N为大于等于1的整数;
根据预先存储的预设字符与预设分区之间的一一对应关系,查找与所述提取的前N位字符对应的分区,所述预设字符是根据文档标识的前至少一位位置所对应的字符得到的,所述预设字符为至少一个,每个预设字符包含至少一个的字符;
将所述待存储文档存储至查找到的所述分区对应的存储位置。
2.根据权利要求1所述的方法,其特征在于,所述文档标识为全局唯一标识符。
3.根据权利要求1所述的方法,其特征在于,所述将所述待存储文档存储至查找到的所述分区对应的存储位置的步骤,包括:
获取预设分区的分区标识和预设存储位置之间的映射关系;
根据所述映射关系,确定所述查找到的分区的分区标识所对应的存储位置,将所述待存储文档存储至所述确定的存储位置中。
4.根据权利要求1所述的方法,其特征在于,所述预设存储位置包括文件夹层级、磁盘层级、主机层级和网络位置层级中的至少一种。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取待查找的文档标识,解析所述待查找的文档标识,提取所述待查找的文档标识中前N位字符,所述N为大于等于1的整数;
确定与所述提取的前N位字符对应的分区;
根据预设分区的分区标识与预设存储位置之间的映射关系,查找与所述确定的分区的分区标识对应的存储位置;
从所述查找到的存储位置中查找与所述待查找的文档标识对应的文档。
6.一种文档管理装置,其特征在于,所述装置包括:
获取模块,用于获取待存储文档;
负载检测模块,用于检测预设的多个分区的资源负载情况,获取所述多个分区中资源负载最小的分区所对应的预设字符;
文档标识生成模块,用于将所述对应的预设字符作为起始字符生成不重复的随机数,将所述生成的不重复的随机数作为唯一标识所述待存储文档的文档标识,其中,文档标识是唯一标识文档的多位随机数;
提取模块,用于解析所述待存储文档的文档标识,提取所述待存储文档的文档标识中的前N位字符,所述N为大于等于1的整数;
查找模块,用于根据预先存储的预设字符与预设分区之间的一一对应关系,查找与所述提取的前N位字符对应的分区,所述预设字符是根据文档标识的前至少一位位置所对应的字符得到的,所述预设字符为至少一个,每个预设字符包含至少一个的字符;
存储管理模块,用于将所述待存储文档存储至查找到的所述分区对应的存储位置。
7.根据权利要求6所述的装置,其特征在于,所述文档标识为全局唯一标识符。
8.根据权利要求6所述的装置,其特征在于,所述提取模块还用于获取待查找的文档标识,解析所述待查找的文档标识,提取所述待查找的文档标识中前N位字符,所述N为大于等于1的整数;
所述存储管理模块还用于确定与所述提取的前N位字符对应的分区,根据预设分区的分区标识与预设存储位置之间的映射关系,查找与所述确定的分区的分区标识对应的存储位置;
所述查找模块还用于从所述查找到的存储位置中查找与所述待查找的文档标识对应的文档。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
CN201610596039.3A 2016-07-26 2016-07-26 文档管理方法和装置 Active CN106250440B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610596039.3A CN106250440B (zh) 2016-07-26 2016-07-26 文档管理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610596039.3A CN106250440B (zh) 2016-07-26 2016-07-26 文档管理方法和装置

Publications (2)

Publication Number Publication Date
CN106250440A CN106250440A (zh) 2016-12-21
CN106250440B true CN106250440B (zh) 2019-07-09

Family

ID=57603647

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610596039.3A Active CN106250440B (zh) 2016-07-26 2016-07-26 文档管理方法和装置

Country Status (1)

Country Link
CN (1) CN106250440B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108664623A (zh) * 2018-05-14 2018-10-16 中钞信用卡产业发展有限公司杭州区块链技术研究院 一种数据存储方法、装置、设备及介质
CN111191120A (zh) * 2019-12-18 2020-05-22 北京深演智能科技股份有限公司 匹配设备信息的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1777853A (zh) * 2003-02-21 2006-05-24 卡林戈公司 基于内容寻址中的附加散列函数
CN101710339A (zh) * 2009-11-20 2010-05-19 中国科学院计算技术研究所 控制机群文件系统中数据存储方法和系统及创建文件方法
CN103384256A (zh) * 2012-05-02 2013-11-06 天津书生投资有限公司 一种云存储方法及装置
CN104572870A (zh) * 2014-12-22 2015-04-29 北京京东尚科信息技术有限公司 提供文档在线阅读的方法和装置以及系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7546630B2 (en) * 2003-07-17 2009-06-09 International Business Machines Corporation Methods, systems, and media to authenticate a user

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1777853A (zh) * 2003-02-21 2006-05-24 卡林戈公司 基于内容寻址中的附加散列函数
CN101710339A (zh) * 2009-11-20 2010-05-19 中国科学院计算技术研究所 控制机群文件系统中数据存储方法和系统及创建文件方法
CN103384256A (zh) * 2012-05-02 2013-11-06 天津书生投资有限公司 一种云存储方法及装置
CN104572870A (zh) * 2014-12-22 2015-04-29 北京京东尚科信息技术有限公司 提供文档在线阅读的方法和装置以及系统

Also Published As

Publication number Publication date
CN106250440A (zh) 2016-12-21

Similar Documents

Publication Publication Date Title
CN108255958B (zh) 数据查询方法、装置和存储介质
CN110099059B (zh) 一种域名识别方法、装置及存储介质
US9171153B2 (en) Bloom filter with memory element
JP6716727B2 (ja) ストリーミングデータ分散処理方法及び装置
CN106874348B (zh) 文件存储和索引方法、装置及读取文件的方法
CN104572727A (zh) 一种数据查询方法及装置
EP3767483A1 (en) Method, device, system, and server for image retrieval, and storage medium
CN106326475B (zh) 一种高效的静态哈希表实现方法及系统
Awad et al. Chaotic searchable encryption for mobile cloud storage
CN110674247A (zh) 弹幕信息的拦截方法、装置、存储介质及设备
CN105447166A (zh) 一种基于关键字查找信息的方法及系统
CN106250440B (zh) 文档管理方法和装置
US8051060B1 (en) Automatic detection of separators for compression
CN111061972B (zh) 一种用于url路径匹配的ac查找优化方法和装置
US20150081710A1 (en) Data typing with probabilistic maps having imbalanced error costs
JP6233846B2 (ja) 可変長ノンスの生成
Belazzougui et al. Compressed string dictionary look-up with edit distance one
CN103823761B (zh) 一种提升终端黑名单容量和检索速度的方法
CN103220355B (zh) 内容分发网络中的多用户配置方法
CN109213972B (zh) 确定文档相似度的方法、装置、设备和计算机存储介质
CN107977381B (zh) 数据配置方法、索引管理方法、相关装置以及计算设备
US20230138113A1 (en) System for retrieval of large datasets in cloud environments
CN111597379B (zh) 音频搜索方法、装置、计算机设备和计算机可读存储介质
CN111858609A (zh) 区块链模糊查询方法及装置
Belazzougui et al. Compressed string dictionary search with edit distance one

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant