CN115576905A - 档案文件管理方法、装置、电子设备和存储介质 - Google Patents

档案文件管理方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN115576905A
CN115576905A CN202211361104.6A CN202211361104A CN115576905A CN 115576905 A CN115576905 A CN 115576905A CN 202211361104 A CN202211361104 A CN 202211361104A CN 115576905 A CN115576905 A CN 115576905A
Authority
CN
China
Prior art keywords
file
metadata
archive file
archive
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211361104.6A
Other languages
English (en)
Inventor
罗秀
许湛涛
陈丽华
黎荣成
任仕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN202211361104.6A priority Critical patent/CN115576905A/zh
Publication of CN115576905A publication Critical patent/CN115576905A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions
    • G06F16/172Caching, prefetching or hoarding of files
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata
    • G06F16/148File search processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/17Details of further file system functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种档案文件管理方法、装置、电子设备和存储介质,档案文件管理方法包括:接收用户端上传的档案文件;根据档案文件的元数据生成用于标识档案文件的标识信息;当档案文件包括文本数据时,对档案文件中的文本数据进行内容识别,获得用于指示档案文件中文本数据所属字段的摘要索引;接收来自用户端的检索请求;当检索请求与档案文件的标识信息和摘要索引相匹配时,将档案文件发送给用户端。本申请通过档案文件的元数据生成用于标识档案文件的标识信息,以及通过对档案文件中的文本数据进行内容识别,获得用于指示档案文件中文本数据所属字段的摘要索引的方式,能够提高对非结构化数据检索的查询速度。

Description

档案文件管理方法、装置、电子设备和存储介质
技术领域
本申请实施例涉及数据处理领域,尤其涉及一种档案文件管理方法、装置、电子设备和存储介质。
背景技术
档案管理系统建设是我国档案信息化建设的重要一环,它串联起了档案信息化建设生命周期的采集、归档、应用与处置等各个环节。
目前,为了实现档案管理的信息化建设,主要采用Oracle、SQL Server等数据库管理系统来实施。我国各地大小企事业单位使用的档案应用系统主要是目录级档案应用系统和全文级档案应用系统,这些系统主要采用C/S架构、B/S架构、C/B/S混合架构开发而成。
然而,随着全文数字化工作地不断开展,传统的检索模式面对海量的非结构化数据时,产生了资源耗费大、查询速度慢的问题。
发明内容
本发明实施例提供一种档案文件管理方法、装置、电子设备和存储介质,以解决或者缓解现有技术中的技术问题。
本发明采用的技术方案为:
第一方面,本申请实施例提供了一种档案文件管理方法,其包括:
接收用户端上传的档案文件;根据所述档案文件的元数据生成用于标识所述档案文件的标识信息;当所述档案文件包括文本数据时,对所述档案文件中的文本数据进行内容识别,获得用于指示所述档案文件中文本数据所属字段的摘要索引;接收来自所述用户端的检索请求;当所述检索请求与所述档案文件的标识信息和所述摘要索引相匹配时,将所述档案文件发送给所述用户端。
可选地,在一种实施例中,当所述档案文件包括图片数据时,通过识别所述图片数据获得对应于所述图片数据的文本转换数据;根据所述对应于所述图片数据的文本转换数据,生成用于进行所述内容识别的文本文件。
可选地,在一种实施例中,该档案文件管理方法还包括:接收待存储文件;当所述待存储文件的元数据与预设的标准元数据类型相同时,将所述待存储文件存储至预设的文档元数据存储表中;当所述待存储文件的元数据与预设的标准元数据类型不同时,将所述待存储文件存储至第一自定义元数据存储表中。
可选地,在一种实施例中,所述将所述待存储文件存储至第一自定义元数据存储表中,包括:根据所述待存储文件中与所述预设的标准元数据类型不同的元数据,在所述第一自定义元数据存储表中新建元数据结构;将所述新建元数据结构与所述第一自定义元数据存储表中的元数据结构聚合,获得第二元数据结构;将所述待存储文件根据所述第二元数据结构存储至所述第一自定义元数据存储表中。
可选地,在一种实施例中,该档案文件管理方法还包括:接收所述用户端发送的查询指令,其中,所述查询指令用于从所述第一自定义元数据存储表中查询对应于查询指令包括的元数据结构的数据;根据所述查询指令对所述第一自定义元数据存储表进行查询,获取查询到的数据,并将所述查询到的数据发送给所述用户端,以使所述用户端对所述查询到的数据进行展示。
可选地,在一种实施例中,该档案文件管理方法还包括:获取待传输文件的元数据的结构;将所述元数据结构与待传输文件发送给接收端,所述接收端根据所述元数据结构将所述待传输文件存储至所述接收端的元数据存储表中。
第二方面,本申请实施例提供了一种档案文件管理装置,其包括:
第一接收模块,用于接收用户端上传的档案文件;生成模块,用于根据所述档案文件的元数据生成用于标识所述档案文件的标识信息;获取模块,用于当所述档案文件包括文本数据时,对所述档案文件中的文本数据进行内容识别,获得用于指示所述档案文件中文本数据所属字段的摘要索引;第二接收模块,用于接收来自所述用户端的检索请求;发送模块,用于当所述检索请求与所述档案文件的标识信息和所述摘要索引相匹配时,将所述档案文件发送给所述用户端。
第三方面,本申请实施例提供了一种电子设备,其上存储有计算机程序,该程序被处理器执行时实现如实施例第一方面中任一项所述的档案文件管理方法
处理器、通信接口、存储器和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行如实施例第一方面中任一项所述的档案文件管理方法对应的操作。
第四方面,本申请实施例提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如实施例第一方面中任一项所述的档案文件管理方法。
第五方面,本申请实施例提供了一种计算机程序产品,其包括计算机指令,所述计算机指令指示计算设备执行如实施例第一方面中任一项所述的档案文件管理方法对应的操作。
由上述方案可知,通过档案文件的元数据生成用于标识档案文件的标识信息,以及通过对档案文件中的文本数据进行内容识别,获得用于指示档案文件中文本数据所属字段的摘要索引的方式,能够在对非结构化数据检索时,也能够对特定的信息(标识信息和摘要索引)进行检索,提高了对非结构化数据检索的查询速度,并且由于标识信息是通过档案文件的元数据生成的,所以不会产生重复,在查询的过程中不会造成数据冗余,节省了查询资源。
附图说明
图1为本申请一个实施例的档案文件管理方法的流程图;
图2为本申请一个实施例的文件存储方法的流程图;
图3为本申请一个实施例的数据展示方法的流程图;
图4为本申请一个实施例的档案文件管理装置的示意图;
图5为本申请一个实施例的电子设备的示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
档案文件管理方法
图1为本申请一个实施例的档案文件管理方法的流程图,如图1所示,该档案文件管理方法包括如下步骤:
步骤101、接收用户端上传的档案文件。
在进行档案管理的过程中,为了便于进行查询,需要对所有上传的档案文档进行处理,以对传统查询方式进行优化。首先接收用户端上传的档案文件。
步骤102、根据档案文件的元数据生成用于标识档案文件的标识信息。
在接收到用户端上传的档案文件后,根据档案文件的元数据,生成用于标识档案文件的标识信息。
例如,对于每个接收到的档案文件,可以通过FileNet BPM进行识别索引,以生成档案文件的摘要,作为标识信息对档案文件进行标识。进行标识的过程可以是使用Key-Value的形式,档案文件中的信息对象有多少成员,就生成多少个key-value对儿,用用户ID+对应属性的名称作为唯一标识来取得对应属性的值。
又例如,可以通过Redis提供的Hash,Redis的Hash实际是内部存储的Value为一个HashMap,并提供了直接存取这个Map成员的接口。此时,Key仍然是用户ID,value是一个Map,Map的key是成员的属性名,value是属性值,对数据的修改和存取都可以直接通过其内部Map的Key(Redis里称内部Map的key为field),也就是可以通过key(用户ID)+field(属性标签)对对应属性数据进行查询。
需要说明的是,在FileNet BPM中,最核心的组件是:Process Engine和ContentEngine。Process Engine提供了流程的运行和管理功能,是一个高效的工作流引擎。Content Engine是负责内容管理的核心解决方案,它为结构化数据、半结构化数据和非结构化数据进行统一集中式管理,具体的功能有:内容的搜索与存储、版本管理、文档的生命周期管理、事件订阅等。本方法对实现的具体组件不作限定,能够具体实施本方法即可。
步骤103、判断档案文件包括的数据类型,当档案文件包括文本数据时,执行步骤104,当档案文件包括图片数据时,执行步骤107。
在对接收到的档案文件进行标识后,需要对档案文件包括的数据类型进行判断,并根据不同的结果进行分别处理。
步骤104、对档案文件中的文本数据进行内容识别,获得用于指示档案文件中文本数据所属字段的摘要索引。
在确定档案文件包括文本数据时,识别档案文件中的内容,并获得用于指示档案文件中文本数据所属字段的摘要索引。
例如,在进行档案文件中的内容识别时,可以通过FileNet BPM对内容进行识别索引,以获得摘要索引。
步骤105、接收来自用户端的检索请求。
在完成对档案文件的内容识别和标识后,已经完成了对检索过程的优化,此时接收来自用户端的检索请求,可以通过优化后的检索过程对档案文件进行检索。
步骤106、当检索请求与档案文件的标识信息和摘要索引相匹配时,将档案文件发送给用户端,并结束当前流程。
将检索请求与档案文件中的标识信息和摘要索引进行匹配,将与标识信息和摘要索引匹配的档案文件发送给用户端,完成档案文件的检索。
例如,可以通过Object Store对档案文件进行检索。Object Store是一个独立的、存在于Domain的对象。它提供了对资源的访问和存取,这里的资源包括documents,folders,custom objects等,以及有关这些资源的元数据。Object Store代表了这些资源在Content Engine上的存储位置。借助Object Store对象提供的方法,可以对ContentEngine Server中的资源进行查询。可以使用API按照Document Class的名字在ObjectStore中搜索相关的对象。
步骤107、通过识别图片数据获得对应于图片数据的文本转换数据。
在档案文件包括图片数据时,需要对图片数据进行文字提取,可以通过图像识别或其他的方式进行。并获得提取后的文本转换数据。
例如,可以通过集成DataCap OCR服务器,DataCap在识别到的图像中的文字部分后,会提取出文字部分的内容。
步骤108、根据对应于图片数据的文本转换数据,生成用于进行内容识别的文本文件,并执行步骤104。
在提取出文本转换数据后,根据文本转换数据生成文本文件,该文本文件用于在识别该文本文件中的内容后,获得用于指示该文本文件中文本转换数据所属字段的摘要索引。
例如,可以通过集成DataCap OCR服务器,将提取出文字部分的内容转写成text文本格式。
在本申请实施例中,通过档案文件的元数据生成用于标识档案文件的标识信息,以及通过对档案文件中的文本数据进行内容识别,获得用于指示档案文件中文本数据所属字段的摘要索引的方式,能够在对非结构化数据检索时,也能够对特定的信息(标识信息和摘要索引)进行检索,提高了对非结构化数据检索的查询速度,并且由于标识信息是通过档案文件的元数据生成的,所以不会产生重复,在查询的过程中不会造成数据冗余,节省了查询资源。
图2为本申请一个实施例的文件存储方法的流程图。如图2所示,该文件存储方法包括如下步骤:
步骤201、接收待存储文件;
在进行文件存储的过程中,首先接收待存储的文件。
步骤202、判断待存储文件的元数据与预设的标准元数据类型是否相同,若是,执行步骤203,若否,执行步骤204。
在接收到待存储的文件后,判断待存储文件的元数据类型与预设的标准元数据类型是否相同,并分别进行处理。
步骤203、将待存储文件存储至预设的文档元数据存储表中,并结束当前流程。
当待存储文件的元数据类型与预设的标准元数据类型相同时,可以直接将待存储文件存储至预设的文档元数据存储表中。
步骤204、将待存储文件存储至第一自定义元数据存储表中。
当待存储文件的元数据类型与预设的标准元数据类型不同时,将待存储文件存储值第一自定义元数据存储表中,采用预设的文档元数据存储表加自定义元数据存储表联合存储的方式以便满足用户存储所需数据。
在本申请实施例中,通过采用预设的文档元数据存储表加自定义元数据存储表联合存储的方式,能够根据元数据类型的不同分别对待存储文件进行存储,由于第一自定义元数据存储表可以自定义且无限扩展,因此提高了存储效率。
在一种可能实现的方式中,将待存储文件存储至第一自定义元数据存储表中的过程还可以包括:
根据待存储文件中与预设的标准元数据类型不同的元数据,在第一自定义元数据存储表中新建元数据结构。
在完成元数据结构的新建后,将新建元数据结构与第一自定义元数据存储表中的元数据结构聚合,获得第二元数据结构。
最后,将待存储文件根据第二元数据结构存储至第一自定义元数据存储表中,完成将待存储文件存储至第一自定义元数据存储表中的过程。
为了实现第一自定义元数据存储表可以无限扩展的特性,因此在待存储文件中的元数据与预设的标准元数据类型不同时,新建对应于待存储文件的元数据结构,并通过聚合的方式对第一自定义元数据存储表中的元数据结构进行更新,以便待存储文件进行存储
在本申请实施例中,通过新建对应于待存储文件的元数据结构,并与聚合第一自定义元数据存储表中的元数据结构的方式,能够完成对第一自定义元数据存储表的无限扩展,提高了文件存储的效率。
在一种可能实现的方式中,还可以获取待传输文件的元数据的结构。在获取到待传输文件的元数据的结构之后,将元数据结构与待传输文件发送给接收端,接收端根据元数据结构将待传输文件存储至接收端的元数据存储表中。
在进行数据传输的过程中,由于各系统之间的元数据存储表中的元数据结构不尽相同,因此在传输文件的过程中同时传输待传输文件的元数据的结构和待传输文件,能够使接收系统根据待传输文件的元数据的结构更新原本的元数据的结构,并将待传输文件存储至更新后的元数据的结构内。
例如,在元数据的结构传输的过程中,可以通过标准化的编码生成固定的XML编码方案,来支持系统内部存储与外部交互元数据的结构的需要。
在本申请实施例中,通过在文件传输的过程中同时传输元数据结构和文件的形式,能够支持不同系统间的文件传输和存储,有利于屏蔽原有系统之间技术异构、环境异构、数据模型异构等问题,有利于实现档案资源系统的集成,从而彻底解决档案“信息孤岛”问题。
图3为本申请一个实施例的数据展示方法的流程图。如图3所示,该数据展示方法包括如下步骤:
步骤301、接收用户端发送的查询指令。
在用户端查询数据的过程中,可以对查询数据进行相应的展示。首先接收用户端发送的查询指令。
步骤302、根据查询指令对第一自定义元数据存储表进行查询,获取查询到的数据。
在接收到用户端发送的查询指令后,根据查询指令对第一自定义元数据存储表进行查询,以获得查询到的数据。
步骤303、将查询到的数据发送给用户端。
在获得查询到的数据后,将查询到的数据发送给用户端,以使用户端对所述查询到的数据进行展示。
例如,用户端可以通过显示屏对查询到的数据进行展示。
在本申请实施例中,通过将查询到的数据发送给用户端,能够使用户端可以通过显示屏对查询到的数据进行展示,当用户使用用户端时,用户端会根据查询到的数据显示相应的数据而不是所有数据,提高了数据展示的效率和用户的体验感。
档案文件管理装置
图4为本申请一个实施例的档案文件管理装置的示意图,如图4所示,该档案文件管理装置400包括:第一接收模块401、生成模块402、获取模块403、第二接收模块404和发送模块405。
第一接收模块401,用于接收用户端上传的档案文件。
在进行档案管理的过程中,为了便于进行查询,需要对所有上传的档案文档进行处理,以对传统查询方式进行优化。首先通过第一接收模块401接收用户端上传的档案文件。
生成模块402,用于根据档案文件的元数据生成用于标识档案文件的标识信息。
在第一接收模块401接收到用户端上传的档案文件后,生成模块402根据档案文件的元数据,生成用于标识档案文件的标识信息。
获取模块403,用于当档案文件包括文本数据时,对档案文件中的文本数据进行内容识别,获得用于指示档案文件中文本数据所属字段的摘要索引。
在获取模块403确定档案文件包括文本数据时,获取模块403识别档案文件中的内容,并获得用于指示档案文件中文本数据所属字段的摘要索引。
第二接收模块404,用于接收来自用户端的检索请求。
在生成模块402和获取模块403完成对档案文件的内容识别和标识后,已经完成了对检索过程的优化,此时第二接收模块404接收来自用户端的检索请求,可以通过优化后的检索过程对档案文件进行检索。
发送模块405,用于当检索请求与档案文件的标识信息和摘要索引相匹配时,将档案文件发送给用户端。
发送模块405将检索请求与档案文件中的标识信息和摘要索引进行匹配,将与标识信息和摘要索引匹配的档案文件发送给用户端,完成档案文件的检索。
在本申请实施例中,生成模块402通过档案文件的元数据生成用于标识档案文件的标识信息,以及获取模块403通过对档案文件中的文本数据进行内容识别,获得用于指示档案文件中文本数据所属字段的摘要索引的方式,能够在对非结构化数据检索时,也能够对特定的信息(标识信息和摘要索引)进行检索,提高了对非结构化数据检索的查询速度,并且由于标识信息是通过档案文件的元数据生成的,所以不会产生重复,在查询的过程中不会造成数据冗余,节省了查询资源。
电子设备
图5为本申请一个实施例的电子设备的示意图,本申请具体实施例并不对电子设备的具体实现做限定。如图5所示,该电子设备500可以包括:处理器(processor)501、通信接口(Communications Interface)502、存储器(memory)503、以及通信总线504。其中:
处理器501、通信接口502、以及存储器503通过通信总线504完成相互间的通信。
通信接口502,用于与其他电子设备或服务器进行通信。
处理器501,用于执行程序505,具体可以执行前述多个方法实施例中的任一方法实施例中的相关步骤。
具体地,程序505可以包括程序代码,该程序代码包括计算机操作指令。
处理器501可能是CPU,或者是特定集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。智能设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器503,用于存放程序505。存储器503可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序505具体可以用于使得处理器501执行前述实施例中多个方法实施例中的任一方法。
程序505中各步骤的具体实现可以参见前述档案文件管理方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
通过本申请实施例的电子设备,通过档案文件的元数据生成用于标识档案文件的标识信息,以及通过对档案文件中的文本数据进行内容识别,获得用于指示档案文件中文本数据所属字段的摘要索引的方式,能够在对非结构化数据检索时,也能够对特定的信息(标识信息和摘要索引)进行检索,提高了对非结构化数据检索的查询速度,并且由于标识信息是通过档案文件的元数据生成的,所以不会产生重复,在查询的过程中不会造成数据冗余,节省了查询资源。
计算机存储介质
本申请还提供了一种计算机可读存储介质,存储用于使一机器执行如本文所述的多个方法实施例中的任一方法的指令。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本申请的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
计算机程序产品
本申请实施例还提供了一种计算机程序产品,包括计算机指令,该计算机指令指示计算设备执行上述多个方法实施例中的任一对应的操作。
需要指出,根据实施的需要,可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本申请实施例的目的。
上述根据本申请实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的方法。此外,当通用计算机访问用于实现在此示出的方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的方法的专用计算机。
需要说明的是,上述各流程和各系统结构图中不是所有的步骤和模块都是必需的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构,也可以是逻辑结构,即,有些模块可能由同一物理实体实现,或者,有些模块可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
以上各实施例中,硬件模块可以通过机械方式或电气方式实现。例如,一个硬件模块可以包括永久性专用的电路或逻辑(如专门的处理器,FPGA或ASIC)来完成相应操作。硬件模块还可以包括可编程逻辑或电路(如通用处理器或其他可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。
上文通过附图和优选实施例对本申请进行了详细展示和说明,然而本申请不限于这些已揭示的实施例,基于上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的代码审核手段得到本申请更多的实施例,这些实施例也在本申请的保护范围之内。

Claims (10)

1.一种档案文件管理方法,其特征在于,所述方法包括:
接收用户端上传的档案文件;
根据所述档案文件的元数据生成用于标识所述档案文件的标识信息;
当所述档案文件包括文本数据时,对所述档案文件中的文本数据进行内容识别,获得用于指示所述档案文件中文本数据所属字段的摘要索引;
接收来自所述用户端的检索请求;
当所述检索请求与所述档案文件的标识信息和所述摘要索引相匹配时,将所述档案文件发送给所述用户端。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
当所述档案文件包括图片数据时,通过识别所述图片数据获得对应于所述图片数据的文本转换数据;
根据所述对应于所述图片数据的文本转换数据,生成用于进行所述内容识别的文本文件。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
接收待存储文件;
当所述待存储文件的元数据与预设的标准元数据类型相同时,将所述待存储文件存储至预设的文档元数据存储表中;
当所述待存储文件的元数据与预设的标准元数据类型不同时,将所述待存储文件存储至第一自定义元数据存储表中。
4.根据权利要求3所述的方法,其特征在于,所述将所述待存储文件存储至第一自定义元数据存储表中,包括:
根据所述待存储文件中与所述预设的标准元数据类型不同的元数据,在所述第一自定义元数据存储表中新建元数据结构;
将所述新建元数据结构与所述第一自定义元数据存储表中的元数据结构聚合,获得第二元数据结构;
将所述待存储文件根据所述第二元数据结构存储至所述第一自定义元数据存储表中。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
接收所述用户端发送的查询指令,其中,所述查询指令用于从所述第一自定义元数据存储表中查询对应于查询指令包括的元数据结构的数据;
根据所述查询指令对所述第一自定义元数据存储表进行查询,获取查询到的数据,并将所述查询到的数据发送给所述用户端,以使所述用户端对所述查询到的数据进行展示。
6.根据权利要求1-5中任一所述的方法,其特征在于,所述方法还包括:
获取待传输文件的元数据的结构;
将所述元数据结构与待传输文件发送给接收端,所述接收端根据所述元数据结构将所述待传输文件存储至所述接收端的元数据存储表中。
7.一种档案文件管理装置,其特征在于,包括:
第一接收模块,用于接收用户端上传的档案文件;
生成模块,用于根据所述档案文件的元数据生成用于标识所述档案文件的标识信息;
获取模块,用于当所述档案文件包括文本数据时,对所述档案文件中的文本数据进行内容识别,获得用于指示所述档案文件中文本数据所属字段的摘要索引;
第二接收模块,用于接收来自所述用户端的检索请求;
发送模块,用于当所述检索请求与所述档案文件的标识信息和所述摘要索引相匹配时,将所述档案文件发送给所述用户端。
8.一种电子设备,包括:处理器、通信接口、存储器和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行如权利要求1-6中任一项所述的档案文件管理方法对应的操作。
9.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-6中任一项所述的档案文件管理方法。
10.一种计算机程序产品,包括计算机指令,所述计算机指令指示计算设备执行如权利要求1-6中任一项所述的档案文件管理方法对应的操作。
CN202211361104.6A 2022-11-02 2022-11-02 档案文件管理方法、装置、电子设备和存储介质 Pending CN115576905A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211361104.6A CN115576905A (zh) 2022-11-02 2022-11-02 档案文件管理方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211361104.6A CN115576905A (zh) 2022-11-02 2022-11-02 档案文件管理方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN115576905A true CN115576905A (zh) 2023-01-06

Family

ID=84588238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211361104.6A Pending CN115576905A (zh) 2022-11-02 2022-11-02 档案文件管理方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN115576905A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116319718A (zh) * 2023-03-10 2023-06-23 北京振中电子技术有限公司 一种云数据存储处理方法、系统、设备及介质
CN117591625A (zh) * 2024-01-18 2024-02-23 之江实验室 一种数据存储方法、装置、存储介质及电子设备

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116319718A (zh) * 2023-03-10 2023-06-23 北京振中电子技术有限公司 一种云数据存储处理方法、系统、设备及介质
CN116319718B (zh) * 2023-03-10 2023-12-12 北京振中电子技术有限公司 一种云数据存储处理方法、系统、设备及介质
CN117591625A (zh) * 2024-01-18 2024-02-23 之江实验室 一种数据存储方法、装置、存储介质及电子设备
CN117591625B (zh) * 2024-01-18 2024-04-12 之江实验室 一种数据存储方法、装置、存储介质及电子设备

Similar Documents

Publication Publication Date Title
CN111046034B (zh) 管理内存数据及在内存中维护数据的方法和系统
CN115576905A (zh) 档案文件管理方法、装置、电子设备和存储介质
CN111459985B (zh) 标识信息处理方法及装置
US20240013456A1 (en) Computerized systems and methods for graph data modeling
CN110659282B (zh) 数据路由的构建方法、装置、计算机设备和存储介质
WO2020155740A1 (zh) 信息查询方法、装置、计算机设备及存储介质
CN108170752B (zh) 基于模板的元数据管理方法和系统
CN109669980B (zh) 数据跨库访问方法及装置
KR20100117415A (ko) 데이터베이스 관리 방법 및 시스템
CN111309868B (zh) 一种知识图谱构建、检索方法及装置
CN110941629B (zh) 元数据处理方法、装置、设备及计算机可读存储介质
CN112416755B (zh) 人工智能模型评测方法、装置、电子设备及存储介质
CN111723161A (zh) 一种数据处理方法、装置及设备
CN111125213A (zh) 数据采集的方法、装置及其系统
CN114328981B (zh) 基于模式映射的知识图谱建立和数据获取方法、装置
CN117171108B (zh) 一种虚拟模型映射方法和系统
EP3282372B1 (en) Method and apparatus for storing data
CN113297274B (zh) 一种签收数据查询方法和系统
CN115114297A (zh) 数据轻量存储及查找方法、装置、电子设备及存储介质
CN111695031A (zh) 基于标签的搜索方法、装置、服务器及存储介质
CN111858609A (zh) 区块链模糊查询方法及装置
JP5954742B2 (ja) 文書を検索する装置及び方法
CN110609926A (zh) 数据标签存储管理方法及装置
CN111737282B (zh) 服务端接受参数进行组织数据库查询条件的方法及其系统
CN112835857B (zh) 一种工作群组的文件主名管理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination