CN113377902A - 一种数字档案著录配置方法、系统、装置和存储介质 - Google Patents

一种数字档案著录配置方法、系统、装置和存储介质 Download PDF

Info

Publication number
CN113377902A
CN113377902A CN202110595025.0A CN202110595025A CN113377902A CN 113377902 A CN113377902 A CN 113377902A CN 202110595025 A CN202110595025 A CN 202110595025A CN 113377902 A CN113377902 A CN 113377902A
Authority
CN
China
Prior art keywords
file
archive
bibliographic
digital
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110595025.0A
Other languages
English (en)
Inventor
张君
丁胜利
刘欢
杜富芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Power Grid Digital Grid Research Institute Co Ltd
Original Assignee
Southern Power Grid Digital Grid Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern Power Grid Digital Grid Research Institute Co Ltd filed Critical Southern Power Grid Digital Grid Research Institute Co Ltd
Priority to CN202110595025.0A priority Critical patent/CN113377902A/zh
Publication of CN113377902A publication Critical patent/CN113377902A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/258Heading extraction; Automatic titling; Numbering

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种数字档案著录配置方法、系统、装置和存储介质,方法包括:获取档案文件的档案内容;根据所述档案内容和预设的著录项类型,从所述档案内容中得出对应的著录信息;将所述著录信息填入所述档案文件的著录项中。本发明通过档案文件的档案内容得出著录信息,并填入著录项,从而实现了档案文件自动配置著录信息,不仅大大提高了著录信息配置的效率,而且能有效节省人力资源,这样能在满足档案门类多样化配置的同时,也能保持着配置工作的高效性。

Description

一种数字档案著录配置方法、系统、装置和存储介质
技术领域
本发明涉及数字档案技术领域,尤其涉及一种数字档案著录配置方法、系统、装置和存储介质。
背景技术
随着国家大数据发展战略和“互联网+”行动计划的推进,深刻影响档案工作的理念、技术、方法及模式;档案日益成为国家基础性战略资源;档案工作领域更加广泛、内容更加丰富、需求更加多样,地位和作用越来越重要。数字档案应用已经成为企业日常档案工作不可缺少的重要工具。
然而,随着数字档案的数量越来越多,数字档案的管理变得越来越复杂,当需要查找对应数字档案时需要的效率越来越低,而若要对数字档案提高管理,则需要对数字档案进行著录信息配置,但现在的著录信息标注只能通过人工的方式进行操作,极为耗费人力资源,且工作效率较低。
发明内容
本发明的主要目的在于提供一种数字档案著录配置方法、系统、装置和计算机存储介质,旨在解决的著录信息配置效率低的技术问题。
为实现上述目的,第一方面,本发明提供了一种数字档案著录配置方法,所述数字档案著录配置方法包括以下步骤:
获取档案文件的档案内容;
根据所述档案内容和预设的著录项类型,从所述档案内容中得出对应的著录信息;
将所述著录信息填入所述档案文件的著录项中。
在本发明一实施例中,所述获取档案文件的档案信息,具体为:
根据预设的间隔时间,定时获取档案文件的档案内容。
在本发明一实施例中,还包括:
根据所述著录信息和预设的分类条件,将所述档案文件进行分类,得出所述档案文件对应的分类项。
在本发明一实施例中,还包括:
根据所述分类项,对所述档案文件分类显示。
在本发明一实施例中,所述档案内容包括档案标题和档案摘要,所述根据所述档案内容和预设的著录项类型,从所述档案内容中得出对应的著录信息,包括:
根据所述档案标题和所述档案摘要,提取档案特征字段;
根据所述档案特征字段和所述著录项类型,查找出与所述著录项类型匹配的档案特征字段,得出著录信息。
第二方面,本发明提供一种数字档案著录配置系统,所述数字档案著录配置系统包括:
获取单元,用于获取档案文件的档案内容;
提取单元,用于根据所述档案内容和预设的著录项类型,从所述档案内容中得出对应的著录信息;
填入单元,用于将所述著录信息填入所述档案文件的著录项中。
在本发明一实施例中,所述获取单元具体用于:
根据预设的间隔时间,定时获取档案文件的档案信息。
在本发明一实施例中,所述档案内容包括档案标题和档案摘要,所述填入单元包括:
特征提取单元,用于根据所述档案标题和所述档案摘要,提取档案特征字段;
著录匹配单元,用于根据所述档案特征字段和所述著录项类型,查找出与所述著录项类型匹配的档案特征字段,得出著录信息。
第三方面,本发明还提供了一种数字档案著录配置装置,所述数字档案著录配置装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:所述计算机程序被所述处理器执行时实现所述的数字档案著录配置方法的步骤。
第四方面,本发明还提供了一种计算机存储介质,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述的数字档案著录配置方法的步骤。
本发明的有益效果是:
本发明通过档案文件的档案内容得出著录信息,并填入著录项,从而实现了档案文件自动配置著录信息,不仅大大提高了著录信息配置的效率,而且能有效节省人力资源,这样能在满足档案门类多样化配置的同时,也能保持着配置工作的高效性。
附图说明
图1是本发明一种数字档案著录配置方法的步骤流程图;
图2是本发明一种数字档案著录配置方法中收录流程图;
图3是本发明一种数字档案著录配置系统的模块方框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明,本发明实施例中所有方向性指示(诸如上、下、左、右、前、后……)仅用于解释在某一特定姿态(如附图所示)下各部件之间的相对位置关系、运动情况等,如果该特定姿态发生改变时,则该方向性指示也相应地随之改变。
另外,在本发明中如涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“连接”、“固定”等应做广义理解,例如,“固定”可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
另外,本发明各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本发明要求的保护范围之内。
参考图1,本发明实施例提供了一种数字档案著录配置方法,所述数字档案著录配置方法包括以下步骤:
S1、获取档案文件的档案内容。
S2、根据所述档案内容和预设的著录项类型,从所述档案内容中得出对应的著录信息。
S3、将所述著录信息填入所述档案文件的著录项中。
本实施例中,档案内容可以包括档案标题、档案摘要和档案全文等。著录项具体可以根据需要进行设置,将档案文件的著录信息填入到著录项后可以方便查阅人员根据著录项对档案文件进行查阅,不仅大大提高查阅的效率,而且也方便了后续分类时的工作,有效提高分类的效率。
在一实施例中,所述获取档案文件的档案信息,具体为:
根据预设的间隔时间,定时获取档案文件的档案内容。
本实施例中,会定时对获取档案文件的档案内容,从而能及时对新进的档案文件进行自动著录信息配置,避免未配置档案文件的堆积。
在一实施例中,还包括:
根据所述著录信息和预设的分类条件,将所述档案文件进行分类,得出所述档案文件对应的分类项。
在一实施例中,还包括:
根据所述分类项,对所述档案文件分类显示。
本实施例中,档案文件进行分类显示后,大大方便查阅人员的查看,能有效提高用户的体验。
参考图2,在一实施例中,所述档案内容包括档案标题和档案摘要,所述根据所述档案内容和预设的著录项类型,从所述档案内容中得出对应的著录信息,包括:
S31、根据所述档案标题和所述档案摘要,提取档案特征字段;
S32、根据所述档案特征字段和所述著录项类型,查找出与所述著录项类型匹配的档案特征字段,得出著录信息。
参考图3,本发明提供一种数字档案著录配置系统,所述数字档案著录配置系统包括:
获取单元,用于获取档案文件的档案内容;
提取单元,用于根据所述档案内容和预设的著录项类型,从所述档案内容中得出对应的著录信息;
填入单元,用于将所述著录信息填入所述档案文件的著录项中。
其中,系统的各个功能模块实现的步骤可参照本发明数字档案著录配置方法的各个实施例,此处不再赘述。
在一实施例中,所述获取单元具体用于:
根据预设的间隔时间,定时获取档案文件的档案信息。
在一实施例中,所述档案内容包括档案标题和档案摘要,所述填入单元包括:
特征提取单元,用于根据所述档案标题和所述档案摘要,提取档案特征字段;
著录匹配单元,用于根据所述档案特征字段和所述著录项类型,查找出与所述著录项类型匹配的档案特征字段,得出著录信息。
此外,本发明实施例还提出一种数字档案著录配置装置,所述装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:
所述计算机程序被所述处理器执行时实现上述各实施例中所述的数字档案著录配置方法的步骤。
此外,本发明实施例还提出一种计算机存储介质。
所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述实施例提供的数字档案著录配置方法中的操作。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体/操作/对象与另一个实体/操作/对象区分开来,而不一定要求或者暗示这些实体/操作/对象之间存在任何这种实际的关系或者顺序;术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
对于装置实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的。可以根据实际的需要选择中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (10)

1.一种数字档案著录配置方法,其特征在于,所述数字档案著录配置方法包括以下步骤:
获取档案文件的档案内容;
根据所述档案内容和预设的著录项类型,从所述档案内容中得出对应的著录信息;
将所述著录信息填入所述档案文件的著录项中。
2.根据权利要求1所述的一种数字档案著录配置方法,其特征在于,所述获取档案文件的档案信息,具体为:
根据预设的间隔时间,定时获取档案文件的档案内容。
3.根据权利要求1所述的一种数字档案著录配置方法,其特征在于,还包括:
根据所述著录信息和预设的分类条件,将所述档案文件进行分类,得出所述档案文件对应的分类项。
4.根据权利要求3所述的一种数字档案著录配置方法,其特征在于,还包括:
根据所述分类项,对所述档案文件分类显示。
5.根据权利要求1所述的一种数字档案著录配置方法,其特征在于,所述档案内容包括档案标题和档案摘要,所述根据所述档案内容和预设的著录项类型,从所述档案内容中得出对应的著录信息,包括:
根据所述档案标题和所述档案摘要,提取档案特征字段;
根据所述档案特征字段和所述著录项类型,查找出与所述著录项类型匹配的档案特征字段,得出著录信息。
6.一种数字档案著录配置系统,其特征在于,所述数字档案著录配置系统包括:获取单元,用于获取档案文件的档案内容;
提取单元,用于根据所述档案内容和预设的著录项类型,从所述档案内容中得出对应的著录信息;
填入单元,用于将所述著录信息填入所述档案文件的著录项中。
7.根据权利要求6所述的一种数字档案著录配置系统,其特征在于,所述获取单元具体用于:
根据预设的间隔时间,定时获取档案文件的档案信息。
8.根据权利要求6所述的一种数字档案著录配置系统,其特征在于,所述档案内容包括档案标题和档案摘要,所述填入单元包括:
特征提取单元,用于根据所述档案标题和所述档案摘要,提取档案特征字段;著录匹配单元,用于根据所述档案特征字段和所述著录项类型,查找出与所述著录项类型匹配的档案特征字段,得出著录信息。
9.一种数字档案著录配置装置,其特征在于,所述数字档案著录配置装置包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其中:所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的数字档案著录配置方法的步骤。
10.一种计算机存储介质,其特征在于,所述计算机存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的数字档案著录配置方法的步骤。
CN202110595025.0A 2021-05-28 2021-05-28 一种数字档案著录配置方法、系统、装置和存储介质 Pending CN113377902A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110595025.0A CN113377902A (zh) 2021-05-28 2021-05-28 一种数字档案著录配置方法、系统、装置和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110595025.0A CN113377902A (zh) 2021-05-28 2021-05-28 一种数字档案著录配置方法、系统、装置和存储介质

Publications (1)

Publication Number Publication Date
CN113377902A true CN113377902A (zh) 2021-09-10

Family

ID=77574787

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110595025.0A Pending CN113377902A (zh) 2021-05-28 2021-05-28 一种数字档案著录配置方法、系统、装置和存储介质

Country Status (1)

Country Link
CN (1) CN113377902A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1182238A (zh) * 1996-11-08 1998-05-20 国际商业机器公司 在可拆卸海量存储介质上制作档案的方法及档案服务器
CN105893369A (zh) * 2014-11-19 2016-08-24 北京航天长峰科技工业集团有限公司 一种基于物联网的数字化档案管理系统
CN109359878A (zh) * 2018-10-26 2019-02-19 珠海市时杰信息科技有限公司 流程化档案数据数字化处理方法、计算机装置及计算机可读存储介质
CN109598228A (zh) * 2018-11-30 2019-04-09 泰华智慧产业集团股份有限公司 将纸质文件电子化著录归档的方法和系统
CN112052749A (zh) * 2020-08-20 2020-12-08 中国建设银行股份有限公司 档案的归档方法、装置、电子设备及计算机可读存储介质

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1182238A (zh) * 1996-11-08 1998-05-20 国际商业机器公司 在可拆卸海量存储介质上制作档案的方法及档案服务器
CN105893369A (zh) * 2014-11-19 2016-08-24 北京航天长峰科技工业集团有限公司 一种基于物联网的数字化档案管理系统
CN109359878A (zh) * 2018-10-26 2019-02-19 珠海市时杰信息科技有限公司 流程化档案数据数字化处理方法、计算机装置及计算机可读存储介质
CN109598228A (zh) * 2018-11-30 2019-04-09 泰华智慧产业集团股份有限公司 将纸质文件电子化著录归档的方法和系统
CN112052749A (zh) * 2020-08-20 2020-12-08 中国建设银行股份有限公司 档案的归档方法、装置、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN109145047B (zh) 用户标签画像的配置方法、数据处理装置及存储介质
US20100235447A1 (en) Email characterization
CN109299157B (zh) 一种分布式大单表的数据导出方法及装置
CN113486144A (zh) 一种数字档案收录方法、系统、装置和存储介质
CN101394608A (zh) 一种基于短信平台的农业信息查询方法及系统
CN109063215B (zh) 数据检索方法及装置
CN108459956A (zh) 测试报告自动化管理方法、装置、设备及存储介质
CN110765158A (zh) 分页查询方法、系统和装置
CN110807050A (zh) 性能分析方法、装置、计算机设备及存储介质
CN113377902A (zh) 一种数字档案著录配置方法、系统、装置和存储介质
CN111125226B (zh) 一种配置数据采集方法及装置
CN113205130A (zh) 一种数据审核方法、装置、电子设备及存储介质
CN111046113A (zh) 用于不同类型数据仓库的数据检索装置及方法
CN110134867A (zh) 企业信息查询方法及相关产品
US11468126B2 (en) Method for collecting component model in component e-commerce platform
CN111833085A (zh) 一种计算物品价格的方法和装置
CN109165704A (zh) 智能识别货架及智能识别方法
CN106570004B (zh) 一种数据管理方法及装置
CN114218258A (zh) 一种用户标签管理方法、系统、设备及存储介质
CN110750514B (zh) 一种为主数据打标签的方法及终端
CN115080504A (zh) 文件管理方法、终端及存储介质
CN114240548A (zh) 社会化客户关系管理系统的数据处理方法、装置、设备及存储介质
CN112214146A (zh) 数据处理的方法、装置、电子设备及存储介质
CN111352824A (zh) 测试方法、装置及计算机设备
CN110737675A (zh) 关联id查询方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210910

RJ01 Rejection of invention patent application after publication