CN117971780A - 文档存储方法、装置、设备及存储介质 - Google Patents
文档存储方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117971780A CN117971780A CN202311865015.XA CN202311865015A CN117971780A CN 117971780 A CN117971780 A CN 117971780A CN 202311865015 A CN202311865015 A CN 202311865015A CN 117971780 A CN117971780 A CN 117971780A
- Authority
- CN
- China
- Prior art keywords
- document
- processed
- attribute tag
- target
- attribute
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 230000008569 process Effects 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 12
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 3
- 238000007726 management method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/16—File or folder operations, e.g. details of user interfaces specifically adapted to file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/11—File system administration, e.g. details of archiving or snapshots
- G06F16/113—Details of archiving
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/17—Details of further file system functions
- G06F16/172—Caching, prefetching or hoarding of files
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/10—File systems; File servers
- G06F16/18—File system types
- G06F16/182—Distributed file systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Probability & Statistics with Applications (AREA)
- Human Computer Interaction (AREA)
- Document Processing Apparatus (AREA)
Abstract
本公开涉及一种文档存储方法、装置、设备及存储介质,该方法包括:获取待处理文档;对所述待处理文档的内容进行分析,确定所述待处理文档对应的属性标签;将所述待处理文档与所述属性标签关联后进行存储。本公开通过对待处理文档的内容进行分析,自动确定待处理文档的属性标签,并在存储待处理文档时将其与属性标签关联存储,能够节省人工确定标签所需的时间,提高整体的工作效率,同时设置多维度的属性标签,并采用标准化的逻辑确定文档对应的属性标签,使得最终确定的属性标签更加准确、全面,方便后续基于标准化的逻辑对所有工作文档进行统一管理。
Description
技术领域
本公开涉及计算机技术领域,尤其涉及一种文档存储方法、装置、设备及存储介质。
背景技术
在日常工作中,经常会产生大量的文档。然而,由于文档数量众多、类型各异且管理分散,归档不及时,容易导致文档丢失或不完整。此外,传统的文档管理方式效率低下,用户通过人工录入标签,对文件进行管理,录入效率较低。同时由于人与人之间主观思考的角度存在差异,用户录入工作文档时确定的标签可能不够准确或不够全面,为后续的管理工作文档造成困难。
发明内容
为了解决上述技术问题,本公开提供了一种文档存储方法、装置、设备及存储介质。
本公开实施例的第一方面提供了一种文档存储方法,该方法包括:
获取待处理文档;
对所述待处理文档的内容进行分析,确定所述待处理文档对应的属性标签;
将所述待处理文档与所述属性标签关联后进行存储。
本公开实施例的第二方面提供了一种文档存储装置,该装置包括:
获取模块,用于获取待处理文档;
分析模块,用于对所述待处理文档的内容进行分析,确定所述待处理文档对应的属性标签;
存储模块,用于将所述待处理文档与所述属性标签关联后进行存储。
本公开实施例的第三方面提供了一种计算机设备,包括存储器和处理器,以及计算机程序,其中,存储器中存储有计算机程序,当计算机程序被处理器执行时,实现如上述第一方面的文档存储方法。
本公开实施例的第四方面提供了一种计算机可读存储介质,存储介质中存储有计算机程序,当计算机程序被处理器执行时,实现如上述第一方面的文档存储方法。
本公开实施例提供的技术方案与现有技术相比具有如下优点:
在本公开实施例提供的文档存储方法、装置、设备及存储介质中,通过获取待处理文档,对待处理文档的内容进行分析,确定待处理文档对应的属性标签,将待处理文档与属性标签关联后进行存储,能够设置多维度的属性标签,并自动确定待处理文档的属性标签,节省了人工确定标签所需的时间,同时采用标准化的逻辑确定文档对应的属性标签,使得最终确定的属性标签更加准确、全面,方便后续基于标准化的逻辑对所有工作文档进行统一管理。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本公开实施例提供的一种文档存储方法的流程图;
图2是本公开实施例提供的另一种文档存储方法的流程图;
图3是本公开实施例提供的一种确定属性标签的方法的流程图;
图4是本公开实施例提供的一种查找目标文档的方法的流程图;
图5是本公开实施例提供的一种文档存储装置的结构示意图;
图6是本公开实施例提供的一种计算机设备的结构示意图。
具体实施方式
为了能够更清楚地理解本公开的上述目的、特征和优点,下面将对本公开的方案进行进一步描述。需要说明的是,在不冲突的情况下,本公开的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本公开,但本公开还可以采用其他不同于在此描述的方式来实施;显然,说明书中的实施例只是本公开的一部分实施例,而不是全部的实施例。
应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
图1是本公开实施例提供的一种文档存储方法的流程图,该方法可以由一种文档存储装置执行。如图1所示,本实施例提供的文档存储方法包括如下步骤:
S101、获取待处理文档。
本公开实施例中的待处理文档可以理解为项目工作过程中产生的工作文档,比如过程文档和结果文档等,也可以理解为其他领域的工作文档,在此不做限定。
本公开实施例中,文档存储装置可以获取用户上传的待处理文档。
在本公开实施例的一种示例性的实施方式中,文档存储装置可以获取用户单独上传或批量上传的工作文档,若用户选择批量上传工作文档,则按照预设顺序将首篇文档确定为待处理文档进行后续处理,直至处理完成后将下一篇文档确定为待处理文档。
S102、对待处理文档的内容进行分析,确定待处理文档对应的属性标签。
本公开实施例中的属性标签可以理解为用于表征文档具有的属性的标签,示例的,属性标签可以包括过程文档、结果文档等,也可以包括人事档案、财务报表、图纸文档、计价文档、报验文档等,在此不做限定。
本公开实施例中,文档存储装置可以在获得待处理文档后,提取待处理文档的内容,并对内容进行文本分析,确定待处理文档对应的属性标签。
在本公开实施例的一种示例性的实施方式中,文档存储装置可以基于预设的与属性标签相关的关键词库对待处理文档进行关键词匹配,确定待处理文档包含的关键词,再基于待处理文档包含的关键词确定关键词对应的属性标签,比如在确定待处理文档包含“合同”、“签订”、“签字”等关键词时,确定待处理文档的属性标签包括合同文档。
在本公开实施例的另一种示例性的实施方案中,文档存储装置还可以对待处理文档的内容进行分词处理和词频统计,筛选出待处理文档中包含的高频词,再将高频词输入预训练的标签预测模型,由标签预测模型根据这些高频词确定待处理文本的属性标签,其中,标签预测模型可以是基于人工标注的训练数据训练得到的,训练数据包括大量的样本文档中的高频词以及人工确定的样本文档对应的属性标签。
S103、将待处理文档与属性标签关联后进行存储。
本公开实施例中,文档存储装置可以在确定待处理文档的属性标签后,将待处理文档与其对应的属性标签添加关联关系,并对待处理文档进行存储。
在本公开实施例的一种示例性的实施方式中,文档存储装置可以在确定待处理文档的属性标签后,在各个属性标签对应的文档列表中添加待处理文档的信息,比如待处理文档的文件名称和存储地址,以实现待处理文档与属性标签的关联。
本公开实施例通过获取待处理文档,对待处理文档的内容进行分析,确定待处理文档对应的属性标签,将待处理文档与属性标签关联后进行存储,能够设置多维度的属性标签,并自动确定待处理文档的属性标签,节省了人工确定标签所需的时间,同时采用标准化的逻辑确定文档对应的属性标签,使得最终确定的属性标签更加准确、全面,方便后续基于标准化的逻辑对所有工作文档进行统一管理。
图2是本公开实施例提供的另一种文档存储方法的流程图,如图2所示,在上述实施例的基础上,可以通过如下方法对文档进行存储。
S201、将待处理文档的内容与预设的关键词进行匹配,基于匹配结果,确定待处理文档所属的项目和/或流程阶段。
本公开实施例中的关键词可以理解为与项目、流程阶段中的至少一种相关的关键词,其中,流程阶段具体内容据相关专业而定,例如准备阶段、进行阶段等,在此不做限定。
本公开实施例中,文档存储装置可以在获得待处理文档后,将待处理文档的内容与预设的关键词进行匹配,确定待处理文档中包含的关键词,进而根据关键词确定待处理文档所属的项目、流程阶段中的至少一种。
在本公开实施例的一种示例性的实施方式中,关键词可以直接与某个具体的项目或流程阶段相对应,文档存储装置可以根据待处理文档包含关键词,将关键词对应的具体的项目或流程阶段确定为待处理文档所属的项目或流程阶段。
在本公开实施例的另一种示例性的实施方式中,关键词也可以不与某个具体的项目或流程阶段相对应,文档存储装置可以根据待处理文档包含的关键词在文档中的位置,获取关键词附近的信息,并对这些信息进行语义分析,从而确定待处理文档所属的项目和/或流程阶段。
S202、将待处理文档与属性标签关联后存入目标文件夹,目标文件夹包含的文档所属的项目和/或流程阶段与待处理文档相同。
本公开实施例中的目标文件夹可以理解为用于存储待处理文档所属的项目和/或流程阶段的文档文件的文件夹。
本公开实施例中,文档存储装置可以在确定待处理文档所属的项目和/或流程阶段后,在用于存储文档文件的多个文件夹中,确定待处理文档所属的项目和/或流程阶段对应的目标文件夹,该目标文件夹中包含的文档所属的项目和/或流程阶段与待处理文档相同,并在确定目标文件夹后,将待处理文档与属性标签关联后存入目标文件夹,具体关联方式与S103类似,此处不再赘述。
本公开实施例通过将待处理文档的内容与预设的关键词进行匹配,基于匹配结果,确定待处理文档所属的项目和/或流程阶段,将待处理文档与属性标签关联后存入目标文件夹,目标文件夹包含的文档所属的项目和/或流程阶段与待处理文档相同,能够将所属的项目、流程阶段相同的文档文件存入相同的文件夹,方便后续查看同一项目、同一流程阶段的所有文档文件时,直接查看对应文件夹内部的文件,进一步提高整体的工作效率。
图3是本公开实施例提供的一种确定属性标签的方法的流程图,如图3所示,在上述实施例的基础上,可以通过如下方法确定属性标签。
S301、基于待处理文档所属的项目和/或流程阶段,以及项目和/或流程阶段与属性标签的类型之间的对应关系,确定待处理文档所属的项目和/或流程阶段对应的属性标签的目标类型。
本公开实施例中的属性标签的类型可以理解为属性标签的分类依据,示例的,属性标签的类型可以包括所属项目、文档编号、文档类型、主要内容中的至少一种,也可以包括其他内容,在此不做限定。
本公开实施例中,文档存储装置可以在确定待处理文档所属的项目和/或流程阶段后,基于预先设定的项目和/或流程阶段与属性标签的类型之间的对应关系,确定待处理文档所属的项目和/或流程阶段对应的属性标签的类型,并将该类型确定为目标类型。
S302、基于目标类型对待处理文档的内容进行分析,确定待处理文档对应的目标类型的属性标签。
本公开实施例中,文档存储装置可以在确定与待处理文档所属的项目和/或流程阶段对应的属性标签的目标类型后,在确定待处理文档对应的属性标签时,可以对待处理文档的内容进行针对性的分析,确定待处理文档对应的目标类型的属性标签。
在本公开实施例的一种示例性的实施方式中,文档存储装置可以在确定目标类型后,基于预设的与目标类型相关的目标关键词,对待处理文档进行关键词匹配,确定待处理文档包含的目标关键词,再基于这些目标关键词确定对应的属性标签,比如,在目标类型包括文档类型时,文档存储装置可以确定目标关键词包括与图纸文档、计价文档和报验文档相关的目标关键词,对待处理文档的内容进行关键词匹配处理,并根据匹配成功的目标关键词确定其对应的具体的属性标签,并将其确定为待处理文档对应的属性标签。
本公开实施例通过基于待处理文档所属的项目和/或流程阶段,以及项目和/或流程阶段与属性标签的类型之间的对应关系,确定待处理文档所属的项目和/或流程阶段对应的属性标签的目标类型,基于目标类型对待处理文档的内容进行分析,确定待处理文档对应的目标类型的属性标签,能够针对不同的项目、流程阶段的文档,确定不同类型的属性标签,使得最终确定的待处理文档的属性标签更合理,从而通过属性标签更好的描述待处理文档,方便后续基于属性标签查找文档。
在本公开一些实施例中,文档存储装置可以将待处理文档与属性标签关联后进行分布式存储。
具体地,文档存储装置可以在将待处理文档与属性标签关联后存入多台存储设备的其中一台,以使所有工作文档能够在多部独立设备上进行分布式存储,也可以将待处理文档存入云端分布式存储节点,从而提高文档存储的安全性和可靠性。
图4是本公开实施例提供的一种查找目标文档的方法的流程图,如图4所示,在上述实施例的基础上,可以通过如下方法查找目标文档。
S401、响应于检测到文档查看指令,在存储的文档中查找目标属性标签关联的目标文档,目标属性标签为文档查看指令中包含的属性标签。
本公开实施例中的文档查看指令可以理解为用户发出的用于查看已存储的工作文档的指令,其中包含目标查看的文档的目标属性标签,文档查看指令可以是语音指令、手势指令、触控指令等,在此不做限定。
本公开实施例中,文档存储装置可以在检测到用户发出的文档查看指令后,从文档查看指令中提取目标属性标签,并将目标属性标签作为搜索条件,搜索所有与目标属性标签关联的工作文档,将其确定为目标文档。
在本公开实施例的一种示例性的实施方式中,文档存储装置可以在提取得到文档查看指令包含的目标属性标签后,从目标属性标签对应的文档列表中获取该目标属性标签关联的所有工作文档的信息,进而将这些工作文档确定为目标文档。
在本公开实施例的另一种示例性的实施方式中,目标属性标签可以为两个或两个以上的属性标签,文档存储装置可以基于各个目标属性标签对应的文档列表,确定这些文档列表的交集包含的工作文档,并将其确定为目标文档。
在本公开实施例的再一种示例性的实施方式中,文档查看指令中还可以包括项目和/或流程阶段的信息,文档存储装置可以根据文档查看指令中的项目和/或流程阶段找到对应的文件夹,再基于目标属性标签,在文件夹内部查找目标文档。
S402、对目标文档进行展示。
本公开实施例中,文档存储装置可以在确定目标文档后,对这些目标文档进行展示。
在本公开实施例的一种示例性的实施方式中,文档存储装置可以在确定目标文档后,对目标文档列表进行展示,并在用户选中其中的至少一份目标文档后,对选中的目标文档的内容进行展示。
本公开实施例通过响应于检测到文档查看指令,在存储的文档中查找目标属性标签关联的目标文档,目标属性标签为文档查看指令中包含的属性标签,对目标文档进行展示,能够根据属性标签搜索目标文档并展示,方便不同角色的用户基于不同的属性标签找到同一篇工作文档,查找方式更灵活,同时通过增加搜索时使用的目标属性标签的数量,也能不断缩小查找结果的范围,方便用户更快定位想要的工作文档,提升整体的工作效率。
在本公开另一些实施例中,用户在通过文档存储装置查找目标文档时,其个人账号需处于已登录的状态,文档存储装置在基于文档查看指令找到目标文档并进行展示时,可以对执行该操作的用户的登录信息以及最终找到的目标文档进行记录,或对用户的登录信息和其最终查看的目标文档进行记录,以便后续追溯,提高了对文档存储和查看的安全性。
图5是本公开实施例提供的一种文档存储装置的结构示意图。如图5所示,该文档存储装置500包括:获取模块510,分析模块520,存储模块530,其中,获取模块510,用于获取待处理文档;分析模块520,用于对所述待处理文档的内容进行分析,确定所述待处理文档对应的属性标签;存储模块530,用于将所述待处理文档与所述属性标签关联后进行存储。
可选的,所述文档存储装置500还包括:第一匹配模块,用于将所述待处理文档的内容与预设的关键词进行匹配,基于匹配结果,确定所述待处理文档所属的项目和/或流程阶段;所述存储模块,具体用于将所述待处理文档与所述属性标签关联后存入目标文件夹,所述目标文件夹包含的文档所属的项目和/或流程阶段与所述待处理文档相同。
可选的,所述分析模块520,包括:类型确定单元,用于基于所述待处理文档所属的项目和/或流程阶段,以及项目和/或流程阶段与属性标签的类型之间的对应关系,确定所述待处理文档所属的项目和/或流程阶段对应的属性标签的目标类型;分析单元,用于基于所述目标类型对所述待处理文档的内容进行分析,确定所述待处理文档对应的所述目标类型的属性标签。
可选的,所述属性标签的类型包括所属项目、文档编号、文档类型、主要内容中的至少一种。
可选的,所述存储模块530,具体用于将所述待处理文档与所述属性标签关联后进行分布式存储。
可选的,所述文档存储装置500还包括:查找模块,用于响应于检测到文档查看指令,在存储的文档中查找目标属性标签关联的目标文档,所述目标属性标签为所述文档查看指令中包含的属性标签;展示模块,用于对所述目标文档进行展示。
本实施例提供的文档存储装置能够执行上述任一实施例所述的方法,其执行方式和有益效果类似,在这里不再赘述。
图6是本公开实施例提供的一种计算机设备的结构示意图。
如图6所示,该计算机设备可以包括处理器610以及存储有计算机程序指令的存储器620。
具体地,上述处理器610可以包括中央处理器(CPU),或者特定集成电路(Application Specific Integrated Circuit,ASIC),或者可以被配置成实施本申请实施例的一个或多个集成电路。
存储器620可以包括用于信息或指令的大容量存储器。举例来说而非限制,存储器620可以包括硬盘驱动器(Hard Disk Drive,HDD)、软盘驱动器、闪存、光盘、磁光盘、磁带或通用串行总线(Universal Serial Bus,USB)驱动器或者两个及其以上这些的组合。在合适的情况下,存储器620可包括可移除或不可移除(或固定)的介质。在合适的情况下,存储器620可在综合网关设备的内部或外部。在特定实施例中,存储器620是非易失性固态存储器。在特定实施例中,存储器620包括只读存储器(Read-Only Memory,ROM)。在合适的情况下,该ROM可以是掩模编程的ROM、可编程ROM(Programmable ROM,PROM)、可擦除PROM(Electrical Programmable ROM,EPROM)、电可擦除PROM(Electrically ErasableProgrammable ROM,EEPROM)、电可改写ROM(Electrically Alterable ROM,EAROM)或闪存,或者两个或及其以上这些的组合。
处理器610通过读取并执行存储器620中存储的计算机程序指令,以执行本公开实施例所提供的文档存储方法的步骤。
在一个示例中,该计算机设备还可包括收发器630和总线640。其中,如图6所示,处理器610、存储器620和收发器630通过总线640连接并完成相互间的通信。
总线640包括硬件、软件或两者。举例来说而非限制,总线可包括加速图形端口(Accelerated Graphics Port,AGP)或其他图形总线、增强工业标准架构(ExtendedIndustry Standard Architecture,EISA)总线、前端总线(Front Side BUS,FSB)、超传输(Hyper Transport,HT)互连、工业标准架构(Industrial Standard Architecture,ISA)总线、无限带宽互连、低引脚数(Low Pin Count,LPC)总线、存储器总线、微信道架构(MicroChannel Architecture,MCA)总线、外围控件互连(Peripheral Component Interconnect,PCI)总线、PCI-Express(PCI-X)总线、串行高级技术附件(Serial Advanced TechnologyAttachment,SATA)总线、视频电子标准协会局部(Video Electronics StandardsAssociation Local Bus,VLB)总线或其他合适的总线或者两个或更多个以上这些的组合。在合适的情况下,总线640可包括一个或多个总线。尽管本申请实施例描述和示出了特定的总线,但本申请考虑任何合适的总线或互连。
本公开实施例还提供了一种计算机可读存储介质,该存储介质可以存储有计算机程序,当计算机程序被处理器执行时,使得处理器实现本公开实施例所提供的文档存储方法。
上述的存储介质可以例如包括计算机程序指令的存储器620,上述指令可由文档存储设备的处理器610执行以完成本公开实施例所提供的文档存储方法。可选的,存储介质可以是非临时性计算机可读存储介质,例如,非临时性计算机可读存储介质可以是ROM、随机存取存储器(Random Access Memory,RAM)、光盘只读存储器(Compact Disc ROM,CD-ROM)、磁带、软盘和光数据存储设备等。上述计算机程序可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码,所述程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。
需要说明的是,在本文中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅是本公开的具体实施方式,使本领域技术人员能够理解或实现本公开。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本公开的精神或范围的情况下,在其它实施例中实现。因此,本公开将不会被限制于本文所述的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。
Claims (10)
1.一种文档存储方法,其特征在于,包括:
获取待处理文档;
对所述待处理文档的内容进行分析,确定所述待处理文档对应的属性标签;
将所述待处理文档与所述属性标签关联后进行存储。
2.根据权利要求1所述的方法,其特征在于,所述对所述待处理文档的内容进行分析,确定所述待处理文档对应的属性标签之前,所述方法还包括:
将所述待处理文档的内容与预设的关键词进行匹配,基于匹配结果,确定所述待处理文档所属的项目和/或流程阶段;
所述将所述待处理文档与所述属性标签关联后进行存储,包括:
将所述待处理文档与所述属性标签关联后存入目标文件夹,所述目标文件夹包含的文档所属的项目和/或流程阶段与所述待处理文档相同。
3.根据权利要求2所述的方法,其特征在于,所述对所述待处理文档的内容进行分析,确定所述待处理文档对应的属性标签,包括:
基于所述待处理文档所属的项目和/或流程阶段,以及项目和/或流程阶段与属性标签的类型之间的对应关系,确定所述待处理文档所属的项目和/或流程阶段对应的属性标签的目标类型;
基于所述目标类型对所述待处理文档的内容进行分析,确定所述待处理文档对应的所述目标类型的属性标签。
4.根据权利要求3所述的方法,其特征在于,所述属性标签的类型包括所属项目、文档编号、文档类型、主要内容中的至少一种。
5.根据权利要求1所述的方法,其特征在于,所述将所述待处理文档与所述属性标签关联后进行存储,包括:
将所述待处理文档与所述属性标签关联后进行分布式存储。
6.根据权利要求1所述的方法,其特征在于,所述将所述待处理文档与所述属性标签关联后进行存储之后,所述方法还包括:
响应于检测到文档查看指令,在存储的文档中查找目标属性标签关联的目标文档,所述目标属性标签为所述文档查看指令中包含的属性标签;
对所述目标文档进行展示。
7.一种文档存储装置,其特征在于,所述装置包括:
获取模块,用于获取待处理文档;
分析模块,用于对所述待处理文档的内容进行分析,确定所述待处理文档对应的属性标签;
存储模块,用于将所述待处理文档与所述属性标签关联后进行存储。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第一匹配模块,用于将所述待处理文档的内容与预设的关键词进行匹配,基于匹配结果,确定所述待处理文档所属的项目和/或流程阶段;
所述存储模块,具体用于将所述待处理文档与所述属性标签关联后存入目标文件夹,所述目标文件夹包含的文档所属的项目和/或流程阶段与所述待处理文档相同。
9.一种计算机设备,其特征在于,包括:存储器;处理器;以及计算机程序;其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如权利要求1-6中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述存储介质中存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1-6中任一项所述的文档存储方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311865015.XA CN117971780A (zh) | 2023-12-29 | 2023-12-29 | 文档存储方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311865015.XA CN117971780A (zh) | 2023-12-29 | 2023-12-29 | 文档存储方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117971780A true CN117971780A (zh) | 2024-05-03 |
Family
ID=90858986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311865015.XA Withdrawn CN117971780A (zh) | 2023-12-29 | 2023-12-29 | 文档存储方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117971780A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114706938A (zh) * | 2022-03-28 | 2022-07-05 | 北京明略昭辉科技有限公司 | 一种文档标签确定方法、装置、电子设备及存储介质 |
CN114936269A (zh) * | 2022-06-07 | 2022-08-23 | 来也科技(北京)有限公司 | 文档搜索平台、搜索方法、装置、电子设备及存储介质 |
CN115525778A (zh) * | 2022-09-30 | 2022-12-27 | 深圳市大族数控科技股份有限公司 | 企业文档处理方法、装置及存储介质 |
CN115659969A (zh) * | 2022-12-13 | 2023-01-31 | 成方金融科技有限公司 | 文档标注方法、装置、电子设备及存储介质 |
CN115878793A (zh) * | 2022-05-25 | 2023-03-31 | 北京中关村科金技术有限公司 | 多标签文档分类方法、装置、电子设备及介质 |
KR20230103997A (ko) * | 2021-12-30 | 2023-07-07 | 주식회사 커넥트스토리 | 프로젝트 문서 관리 방법, 프로젝트 관리 서버, 이를 위한 컴퓨터 프로그램 |
CN116757183A (zh) * | 2023-06-27 | 2023-09-15 | 支付宝(杭州)信息技术有限公司 | 项目信息处理方法及装置 |
-
2023
- 2023-12-29 CN CN202311865015.XA patent/CN117971780A/zh not_active Withdrawn
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20230103997A (ko) * | 2021-12-30 | 2023-07-07 | 주식회사 커넥트스토리 | 프로젝트 문서 관리 방법, 프로젝트 관리 서버, 이를 위한 컴퓨터 프로그램 |
CN114706938A (zh) * | 2022-03-28 | 2022-07-05 | 北京明略昭辉科技有限公司 | 一种文档标签确定方法、装置、电子设备及存储介质 |
CN115878793A (zh) * | 2022-05-25 | 2023-03-31 | 北京中关村科金技术有限公司 | 多标签文档分类方法、装置、电子设备及介质 |
CN114936269A (zh) * | 2022-06-07 | 2022-08-23 | 来也科技(北京)有限公司 | 文档搜索平台、搜索方法、装置、电子设备及存储介质 |
CN115525778A (zh) * | 2022-09-30 | 2022-12-27 | 深圳市大族数控科技股份有限公司 | 企业文档处理方法、装置及存储介质 |
CN115659969A (zh) * | 2022-12-13 | 2023-01-31 | 成方金融科技有限公司 | 文档标注方法、装置、电子设备及存储介质 |
CN116757183A (zh) * | 2023-06-27 | 2023-09-15 | 支付宝(杭州)信息技术有限公司 | 项目信息处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6894534B2 (ja) | 情報処理方法及び端末、コンピュータ記憶媒体 | |
US10169305B2 (en) | Marking comparison for similar documents | |
KR101582108B1 (ko) | 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램 | |
EP3584728B1 (en) | Method and device for analyzing open-source license | |
RU2613846C2 (ru) | Метод и система извлечения данных из изображений слабоструктурированных документов | |
US9720912B2 (en) | Document management system, document management method, and document management program | |
US20150032747A1 (en) | Method for systematic mass normalization of titles | |
US9542474B2 (en) | Forensic system, forensic method, and forensic program | |
CN110941702A (zh) | 一种法律法规和法条的检索方法及装置、可读存储介质 | |
CN110489032B (zh) | 用于电子书的词典查询方法及电子设备 | |
US9558462B2 (en) | Identifying and amalgamating conditional actions in business processes | |
CN111444718A (zh) | 一种保险产品需求文档处理方法、装置及电子设备 | |
CN114743012B (zh) | 一种文本识别方法及装置 | |
CN112182451A (zh) | 网页内容摘要生成方法、设备、存储介质及装置 | |
CN112181490A (zh) | 功能点评估法中功能类别的识别方法、装置、设备及介质 | |
CN109783612B (zh) | 报表数据定位方法及装置、存储介质、终端 | |
CN114372122A (zh) | 信息的获取方法、计算设备及存储介质 | |
US20130054553A1 (en) | Method and apparatus for automatically extracting information of products | |
CN114116736A (zh) | 知识库更新、更新验证和基于知识库的搜索方法及装置 | |
CN116910650A (zh) | 数据识别方法、装置、存储介质及计算机设备 | |
CN117971780A (zh) | 文档存储方法、装置、设备及存储介质 | |
JP2012138027A (ja) | 情報検索システム、検索キーワード提示方法、およびプログラム | |
CN112148749B (zh) | 一种数据分析方法,计算设备及存储介质 | |
CN110990558B (zh) | 电子书内容展示方法、计算设备及计算机存储介质 | |
WO2021018016A1 (zh) | 一种专利信息展示方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20240503 |
|
WW01 | Invention patent application withdrawn after publication |