CN105335506A - 一种电子档案编研方法及系统 - Google Patents

一种电子档案编研方法及系统 Download PDF

Info

Publication number
CN105335506A
CN105335506A CN201510718587.4A CN201510718587A CN105335506A CN 105335506 A CN105335506 A CN 105335506A CN 201510718587 A CN201510718587 A CN 201510718587A CN 105335506 A CN105335506 A CN 105335506A
Authority
CN
China
Prior art keywords
archives
level
electronic record
module
selection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510718587.4A
Other languages
English (en)
Inventor
倪时龙
林振天
陈又咏
陈天宇
黄敬林
高松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujian Yirong Information Technology Co Ltd
Original Assignee
Fujian Yirong Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujian Yirong Information Technology Co Ltd filed Critical Fujian Yirong Information Technology Co Ltd
Priority to CN201510718587.4A priority Critical patent/CN105335506A/zh
Publication of CN105335506A publication Critical patent/CN105335506A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/83Querying

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种电子档案编研方法及系统,其中方法包括如下步骤,资源池构建步骤,辅助选题步骤和智能选材步骤;其中资源池库构建步骤包括,收录电子档案,对所述电子档案内容进行关联分析,得到一级关联信息、二级关联信息;本发明实现了电子档案之间通过语义网的关联,并且通过所述一级参考、二级参考信息,对用户选题及选材做出辅助、推荐。提高了用户查阅电子档案的效率,也节省了用户筛选素材的时间。

Description

一种电子档案编研方法及系统
技术领域
本发明涉及电子档案库架构领域,尤其涉及一种电子档案编研方法及装置。
背景技术
现有技术:
档案编研是对档案信息进行优化处理有效利用的重要手段,对社会文化内涵提炼和历史文化的传播与保护,促进历史文化研究具有重要的意义。传统的人工档案编研方法在选题、选材、加工、总篆、审核过程中,完全依靠编研人员的个人能力,通过对单位、社会需求分析和馆藏内容评估,完成选题及后续工作,我国经多年信息化建设,档案编研工作经历了以下几个阶段:
1.手段数字化。传统的编研工作主要是通过手工对档案信息资源进行筛选、排列、组合、摘编和汇集等,这种加工方式往往加工速度缓慢,周期较长。针对此问题有关管理者和专家提出编研工作应追求“短、平、快”,提高加工速度和缩短编研周期以适应发展需要,但此法仅适合于单一问
题和小型资料编研,对于大型的综合性的资料编研却是很难实施。数字化技术的发展,使得编研手段转向数字化,这一问题得以根本解决。档案数字化编研的本质特征是利用数字化技术将众多形式的档案信息转化、表达成数字形式,形成档案信息数据库,通过各种传播渠道在极为广泛的领域间更有效地进行档案信息资源的存储、传输和共享,大大的提高编研加工速度,缩短编研周期,促进档案信息资源的开发利用。
2.平台网络化。传统档案部门多设有档案编研科处,是编研工作的主要平台,编研人员集中在一起进行编辑和研究工作。数字时代编研平台则走向网络化,一种虚拟化的网络编研,即依靠网络实现档案信息资源的研究、编辑、传播和反馈的全过程。网络平台既可以是内部网,也可以是互联网。网络化编研可精简工作人员和经济开支,一定程度上提高编研工作的效益。
目前大多数档案馆均建立了信息化系统,对档案管理工作及档案内容进行了不同程度的数字化与信息化,但基本上以流程管理和辅助查询为主,即手段数字化和平台网络化,尚未有针对电子档案的智能编研信息系统,实现智能化。青岛大学在2014年申请了《一种档案自动编研方法》(公开号104361111A)的专利,其内容为“首先按照案卷目录、卷内目录和专家登记卡界面给出的统一格式分别录入档案信息,再由档案录入与管理模块利用自动层次分类算法对档案信息进行自动分类和汇总,并分别存入相对应的数据库中;然后档案编研模块根据用户输入的编研条件和存入的信息对相应数据库进行检索、查询并汇总生成档案编研结果,最后将档案编研结果显示在屏幕上,或将档案编研结果以Word文档或Excel报表的形式导出打印后形成纸质文档保存,实现档案的自动编研”。此技术的主要内容是利用信息系统实现了档案目录、专家登记卡等档案信息的录入,之后档案编研人员输入条件对以上数据进行查询汇总,其实质仍然是信息系统常见的查询统计功能。
现有技术的缺点及其原因分析:
档案编研一般包括选题、选材、加工、编篆、审核发布几个核心过程,现有的自动编研方法,其特征在于在基于B/S架构的档案管理信息系统中由档案录入与管理模块和档案编研模块联合实现档案自动编研,其具体步骤为:
(1)先进行档案信息录入,按照系统显示的案卷目录、卷内目录和专家登记卡界面给出的统一格式分别录入档案标题、档案所属分类、档号、年度和专家情况各类基本信息;
(2)再由档案录入与管理模块利用本发明提出的自动层次分类算法自动对步骤(1)录入的档案信息进行自动分类和汇总,并分别存入相对应的档案目录、卷内目录与专家基本信息登记目录数据库和专家数据库中;
(3)再由档案编研模块根据用户输入的编研条件和存入的信息对相应档案目录、卷内目录与专家基本信息登记目录数据库和专家数据库进行检索、查询并汇总生成档案编研结果;
(4)将档案编研结果显示在屏幕上,或将档案编研结果以Word文档或Excel报表的形式导出后打印输出形成纸质文档保存,实现档案的自动编研
通过以上内容可以发现,在选题环节现有技术未对当今社会选题内容的社会化趋势进行分析,未针对这一需求进行相应的支撑,以人工收集信息分析选题为主。选题是编研工作的首要环节,好的选题方能发挥最佳效益,因此在选题环节现有技术未能利用现有的信息化技术手段进行辅助选题。在选材、加工、编篆等环节,由于现有技术未能对档案信息资源进行内容进行扫描识别,因此必须依赖于信息录入,即“按照系统显示的案卷目录、卷内目录和专家登记卡界面给出的统一格式分别录入档案标题、档案所属分类、档号、年度和专家情况各类基本信息”,此种方式虽然以一种普遍简易的信息化手段在一定程度上解决了档案信息资源的检索问题,但必然带来人工工作量巨大的问题。同时,由于未对档案信息内容进行智能识别与信息关联,档案信息只以全宗、目录、案卷等树型层次进行关联,在档案编研过程中无法进行自动的智能分析辅助。
发明内容
为此,需要提供一种能够辅助用户选题并提供推荐素材的电子档案编研方法及装置。
为实现上述目的,发明人提供了一种电子档案编研方法,包括如下步骤,资源池构建步骤,辅助选题步骤和智能选材步骤;
其中资源池库构建步骤包括,收录电子档案,对所述电子档案内容进行关联分析,得到一级关联信息、二级关联信息;
所述辅助选题步骤包括,对资源库中的搜索历史进行记录,将搜索频率高的搜索内容作为热点搜索;接受用户选题信息,根据用户信息进行选题推荐;
所述智能选材步骤包括,根据用户选定的编研主题,自动从资源池中智能检索出有用的素材信息,通过选题-档案关联、和档案-档案关联等方式实现智能选材,即以选题关键词为基准,在档案资源池中实现一次选材识别,标识出待选材的档案资源,再对这部分档案的一级参考和二级参考档案进行识别标识,实现二次选材识别。在建立电子档案编研库的时候录入一级参考、二级参考信息,实现了电子档案之间通过语义网的关联,并且通过所述一级参考、二级参考信息,对用户选题及选材做出辅助、推荐。提高了用户查阅电子档案的效率,也节省了用户筛选素材的时间。
进一步地,还包括素材汇编步骤,
接收汇编主题信息,根据所述汇编主题信息筛选对应的电子档案,将对应的电子档案根据预设的体裁模板汇编成素材集。通过上述方案进行素材汇编,可极大地降低人工汇编的工作量,提升档案编研过程的自动化水平。
进一步地,还包括总纂修订步骤、审核发布步骤,
所述总纂修订步骤包括,利用辅助修订工具对初步汇编的素材集进行辅助修订;利用系统化编排工具对素材集进行统一编排,并对格式结构进行加工完善得到最终素材集;
所述审核发布步骤包括,通过系统后台将所述最终素材集呈递专家审定,经专家综合审定核校后,通过数字会签进行确认,将确认后的最终素材集审核发布。通过上述步骤,提高了汇编档案的成集质量。
具体地,
所述一级关联包括一级参考、一级引证、同一组卷和同一作者:
所述一级参考指本档案直接引用参考的档案;
所述一级引证指直接引用本档案的档案;
所述同一组卷指本档案组卷内的档案;
所述同一作者指同一作者发布的其他档案;
所述二级关联包括:二级参考、二级引证、同引档案、同被引档案、同一领域或相关领域;
所述二级参考指所述一级参考引用参考的档案;
所述二级引证指引用一级引证档案的档案;
所述同引档案指与本档案有共同参考的档案;
所述同被引档案指与本档案同时被引用的档案;
所述同一领域指基于知识库来挖掘和本档案在同一细分知识领域的档案;
所述相关领域指基于知识库来挖掘和本档案在相近细分知识领域的档案。
一种电子档案编研系统,包括如下模块,资源池构建模块,辅助选题模块和智能选材模块;
其中资源池库构建模块用于收录电子档案,对所述电子档案内容进行关联分析,得到一级关联信息、二级关联信息;
所述辅助选题模块用于对资源库中的搜索历史进行记录,将搜索频率高的搜索内容作为热点搜索;接受用户选题信息,根据用户信息进行选题推荐;
所述智能选材模块用于根据用户选定的编研主题,自动从资源池中智能检索出有用的素材信息,以选题关键词为基准,在档案资源池中进行一次选材识别,标识出待选材的档案资源,再对所述待选材的档案资源的一级参考和二级参考档案进行识别标识,进行二次选材识别。本系统通过所述一级参考、二级参考信息,对用户选题及选材做出辅助、推荐。提高了用户查阅电子档案的效率,也节省了用户筛选素材的时间。
进一步地,还包括素材汇编模块,
所述素材汇编模块用于接收汇编主题信息,根据所述汇编主题信息筛选对应的电子档案,将对应的电子档案根据预设的体裁模板汇编成素材集。通过素材汇编模块进行素材汇编,可极大地降低人工汇编的工作量,提升档案编研过程的自动化水平。
进一步地,还包括总纂修订模块、审核发布模块,
所述总纂修订模块用于利用辅助修订工具对初步汇编的素材集进行辅助修订;利用系统化编排工具对素材集进行统一编排,并对格式结构进行加工完善得到最终素材集;
所述审核发布模块用于通过系统后台将所述最终素材集呈递专家审定,经专家综合审定核校后,通过数字会签进行确认,将确认后的最终素材集审核发布。通过上述模块,提高了汇编档案的成集质量。
具体地,
所述一级关联包括一级参考、一级引证、同一组卷和同一作者:
所述一级参考指本档案直接引用参考的档案;
所述一级引证指直接引用本档案的档案;
所述同一组卷指本档案组卷内的档案;
所述同一作者指同一作者发布的其他档案;
所述二级关联包括:二级参考、二级引证、同引档案、同被引档案、同一领域或相关领域;
所述二级参考指所述一级参考引用参考的档案;
所述二级引证指引用一级引证档案的档案;
所述同引档案指与本档案有共同参考的档案;
所述同被引档案指与本档案同时被引用的档案;
所述同一领域指基于知识库来挖掘和本档案在同一细分知识领域的档案;
所述相关领域指基于知识库来挖掘和本档案在相近细分知识领域的档案。
区别于现有技术,上述技术方案在建立电子档案编研库的时候录入一级参考、二级参考信息,实现了电子档案之间通过语义网的关联,并且通过所述一级参考、二级参考信息,对用户选题及选材做出辅助、推荐。提高了用户查阅电子档案的效率,也节省了用户筛选素材的时间。还通过素材汇编、修订审核提高了汇编档案的成集质量。
附图说明
图1为本发明具体实施方式所述方法流程图;
图2为本发明具体实施方式所述语义网体系结构示意图;
图3为本发明具体实施方式所述一级参考和二级参考结构示意图;
图4为本发明具体实施方式所述系统模块图。
附图标记说明:
400、资源池构建模块;
402、辅助选题模块;
404、智能选材模块;
406、素材汇编模块;
408、总纂修订模块;
410、审核发布模块。
具体实施方式
为详细说明技术方案的技术内容、构造特征、所实现目的及效果,以下结合具体实施例并配合附图详予说明。
请参阅图1,为本发明一种电子档案编研方法,包括如下步骤,资源池构建步骤,辅助选题步骤和智能选材步骤;
其中资源池库构建步骤包括,S100收录电子档案,对所述电子档案内容进行关联分析,得到一级关联信息、二级关联信息;
具体地,语义网技术是当前研究的热点之一。Berners-Lee提出了最初的语义网体系结构,随着人们对语义网的深入研究,语义网的体系结构也在不断地发展演变。图2中给出了语义Web的体系结构,各层的功能自下而上逐渐增强。
第1层:基础层,主要包含Unicode和URI(Uniformresourceidentifier)。其中Unicode是一种流行的字符集,采用两字节的全编码,可以表示65536个字符,这使得任何语言的字符都可以被机器容易地接受。URI即通用资源标识符是用于唯一标识抽象或物理资源的简单字符串。网络上的任何资源包括HTML文档、程序、图片、音视频等都有一个能被URI编码的地址,从而实现对Web资源的定位。
第2层:句法层,核心是XML及相关规范。XML是SGML(标准通用标记语言)的一个子集,它以一种自我描述的方式定义数据结构。在描述数据内容的同时能突出对结构的描述,从而体现出数据之间的联系。用户可以在XML中自由地定义标记名称及元素的层次结构。为了便于程序或其他用户能够正确处理用户定义的内容,XML还定义了命名空间(NameSpace)和XML模式规范(XMLSchema)以提供更好地XML文档服务。
第3层:资源描述框架,主要包括RDF及相关规范。RDF是一种用于描述WWW上资源信息的通用框架,比如网页的内容、作者以及被创建和修改的日期等。RDF本质上是一种数据模型,用主体(subject)、谓词或属性(predicate或property)、客体或属性值(object或propertyvalue)所构成的三元组来描述资源的元数据。RDF也可以用于表达其它元数据,例如分子的结构、图书的书目信息等。正因为RDF的灵活性,它成为了诸如生物、化学等许多领域表达元数据的基本方法。可以说,RDF已经成为知识表达的通用形式。如果把XML看成一种标准的元数据语法规范的话,那么RDF就可以看做一种标准的元数据语义描述规范。
第4层:本体层,即定义本体(Ontology)。该层在RDF的基础上定义了RDFS(RDFSchema)和OWL(WebOntologyLanguage)帮助用户构建应用领域相关的轻量级的本体。RDFS和OWL定义了语义,可以支持机器在用RDFS和OWL描述的知识库和本体中进行推理,以达到语义网的目标。
第5至7层分别是逻辑层(Logic)、验证层(Proof)、信任层(Trust)。逻辑层在前面各层的基础上进行逻辑推理操作。验证层根据逻辑陈述进行验证,以得出结论。信任层是语义网安全的组成部分,与加密不同的是,该层主要负责发布语义网所能支持的信任评估。
基于以上语义网技术,通过建立电子档案本体(Ontology),可以支持机器在用RDFS和OWL描述的电力企业档案知识库和本体中进行推理。对档案内容进行关联分析后,档案信息不再是孤立的,得到一级关联、二级关联信息。在用户进行编研、浏览档案时更加智能的展现本专题、本档案的背景信息、同类档案或相关档案,实现智能编研。
如图3所示的具体的实施例中,所述一级关联包括一级参考、一级引证、同一组卷和同一作者:
所述一级参考指本档案直接引用参考的档案;
所述一级引证指直接引用本档案的档案;
所述同一组卷指本档案组卷内的档案;
所述同一作者指同一作者发布的其他档案;
所述二级关联包括:二级参考、二级引证、同引档案、同被引档案、同一领域或相关领域;
所述二级参考指所述一级参考引用参考的档案;
所述二级引证指引用一级引证档案的档案;
所述同引档案指与本档案有共同参考的档案;
所述同被引档案指与本档案同时被引用的档案;
所述同一领域指基于知识库来挖掘和本档案在同一细分知识领域的档案;
所述相关领域指基于知识库来挖掘和本档案在相近细分知识领域的档案。通过档案关联分析,将档案结构由原有的树型结构变为网状结构,与现实世界的知识架构相符,把死档案变成活知识。智能编研技术方案首先构建编研素材资源池,以对多源异构编研素材统一管理和利用;建立编研模型,充分挖掘可用编研素材;辅以智能化素材编排和修订工具,以对编研素材辅助加工处理和核校审定;编研成果以“图文并茂,声像并举”的方式呈现和数字化平台共享,最大限度地实现档案的价值。
所述辅助选题步骤包括,S102对资源库中的搜索历史进行记录,将搜索频率高的搜索内容作为热点搜索;S104接受用户选题信息,根据用户信息进行选题推荐;在本电子档案编研库中,用户可按时间段、专业领域、编研模版等条件实现对当前编研关注的热点内容进行搜索,搜索历史被记录下来以供统计、推荐等,用户可以输入自己的用户选题信息了解选题的需求动态和趋势;系统按照用户输入的用户选题信息进行自动推荐,所述用户选题信息包括热点搜索、专业领域、专家推荐、政策倾向等等,各条推荐内容还将根据资源库情况进行粗略分析,例如通过一级参考判断可用资源数,供编研人员选题;历史选题用于实现历史选题信息的再现,辅助用户了解自己或他人过去编研选题情况,从而确定编研主题。
所述智能选材步骤包括,S106根据用户选定的编研主题,自动从资源池中智能检索出有用的素材信息,通过选题-档案关联、和档案-档案关联等方式实现智能选材,即以选题关键词为基准,在档案资源池中实现一次选材识别,标识出待选材的档案资源,再对这部分档案的一级参考和二级参考档案进行识别标识,实现二次选材识别。在具体的实施例中,所述选题-档案关联即根据用户选定的编研主题,根据一级参考信息选择调用文本素材检索、图像素材检索(人脸图像、物品图像等)、语音素材检索、视频素材检索等检索服务,从资源池中检索出与编研主题一级相关的素材集,再通过档案-档案关联即根据选定的一级相关的素材集的二级参考资料进行搜索,确定二级相关的素材集。素材评估根据制定选材标准机制,例如关键词匹配度、领域限定度、素材时限、素材可信度等自动对检索出的相关素材集进行评估,筛选出有用的素材集;素材审定实现用户对自动筛选的有用素材集进行审核,以确认作为编研的素材。
通过上述方案,在建立电子档案编研库的时候录入一级参考、二级参考信息,实现了电子档案之间通过语义网的关联,并且通过所述一级参考、二级参考信息,对用户选题及选材做出辅助、推荐。提高了用户查阅电子档案的效率,也节省了用户筛选素材的时间。
在另一些进一步的实施例中,还包括素材汇编步骤,
S108接收汇编主题信息,根据所述汇编主题信息筛选对应的电子档案,将对应的电子档案根据预设的体裁模板汇编成素材集。素材汇编是编研的核心环节,负责对编研素材的加工处理,形成初步的编研成果。在需要对预设汇编主题的素材集进行汇编时,用户在系统中输入汇编主题,系统根据所述汇编主题筛选对应的电子档案,将对应的电子档案根据预设的体裁模板进行汇编,所述体裁模板包括字体大小、字体颜色、图像、目录格式等等。可以包括素材删节、文字勘正、规范处理、信息标注、图像编辑、音频剪辑、视频剪辑、视频摘要、音频合成、视频合成、组织目录、体裁模板、初步汇编等子模块。通过上述方案进行素材汇编,可极大地降低人工汇编的工作量,提升档案编研过程的自动化水平。
在另一些实施例中,还包括总纂修订步骤、审核发布步骤,
所述总纂修订步骤包括,S110利用辅助修订工具对初步汇编的素材集进行辅助修订;利用系统化编排工具对素材集进行统一编排,并对格式结构进行加工完善得到最终素材集;
所述审核发布步骤包括,S112通过系统后台将所述最终素材集呈递专家审定,经专家综合审定核校后,通过数字会签进行确认,将确认后的最终素材集审核发布。通过总纂修订步骤和审核发布步骤,提高了最终素材集的成集质量。
一种电子档案编研系统,包括如下模块,资源池构建模块400,辅助选题模块402和智能选材模块404;
其中资源池构建模块400用于收录电子档案,对所述电子档案内容进行关联分析,得到一级关联信息、二级关联信息;
所述辅助选题模块402用于对资源库中的搜索历史进行记录,将搜索频率高的搜索内容作为热点搜索;接受用户选题信息,根据用户信息进行选题推荐;
所述智能选材模块404用于根据用户选定的编研主题,自动从资源池中智能检索出有用的素材信息,以选题关键词为基准,在档案资源池中进行一次选材识别,标识出待选材的档案资源,再对所述待选材的档案资源的一级参考和二级参考档案进行识别标识,进行二次选材识别。本系统通过所述一级参考、二级参考信息,对用户选题及选材做出辅助、推荐。提高了用户查阅电子档案的效率,也节省了用户筛选素材的时间。
进一步地,还包括素材汇编模块406,
所述素材汇编模块406用于接收汇编主题信息,根据所述汇编主题信息筛选对应的电子档案,将对应的电子档案根据预设的体裁模板汇编成素材集。通过素材汇编模块进行素材汇编,可极大地降低人工汇编的工作量,提升档案编研过程的自动化水平。
进一步地,还包括总纂修订模块408、审核发布模块410,
所述总纂修订模块408用于利用辅助修订工具对初步汇编的素材集进行辅助修订;利用系统化编排工具对素材集进行统一编排,并对格式结构进行加工完善得到最终素材集;
所述审核发布模块410用于通过系统后台将所述最终素材集呈递专家审定,经专家综合审定核校后,通过数字会签进行确认,将确认后的最终素材集审核发布。通过上述模块,提高了汇编档案的成集质量。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括……”或“包含……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的要素。此外,在本文中,“大于”、“小于”、“超过”等理解为不包括本数;“以上”、“以下”、“以内”等理解为包括本数。
本领域内的技术人员应明白,上述各实施例可提供为方法、装置、或计算机程序产品。这些实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。上述各实施例涉及的方法中的全部或部分步骤可以通过程序来指令相关的硬件来完成,所述的程序可以存储于计算机设备可读取的存储介质中,用于执行上述各实施例方法所述的全部或部分步骤。所述计算机设备,包括但不限于:个人计算机、服务器、通用计算机、专用计算机、网络设备、嵌入式设备、可编程设备、智能移动终端、智能家居设备、穿戴式智能设备、车载智能设备等;所述的存储介质,包括但不限于:RAM、ROM、磁碟、磁带、光盘、闪存、U盘、移动硬盘、存储卡、记忆棒、网络服务器存储、网络云存储等。
上述各实施例是参照根据实施例所述的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到计算机设备的处理器以产生一个机器,使得通过计算机设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机设备以特定方式工作的计算机设备可读存储器中,使得存储在该计算机设备可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机设备上,使得在计算机设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已经对上述各实施例进行了描述,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改,所以以上所述仅为本发明的实施例,并非因此限制本发明的专利保护范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围之内。

Claims (8)

1.一种电子档案编研方法,其特征在于,包括如下步骤,资源池构建步骤,辅助选题步骤和智能选材步骤;
其中资源池库构建步骤包括,收录电子档案,对所述电子档案内容进行关联分析,得到一级关联信息、二级关联信息;
所述辅助选题步骤包括,对资源库中的搜索历史进行记录,将搜索频率高的搜索内容作为热点搜索;接受用户选题信息,根据用户信息进行选题推荐;
所述智能选材步骤包括,根据用户选定的编研主题,自动从资源池中智能检索出有用的素材信息,以选题关键词为基准,在档案资源池中进行一次选材识别,标识出待选材的档案资源,再对所述待选材的档案资源的一级参考和二级参考档案进行识别标识,进行二次选材识别。
2.根据权利要求1所述的电子档案编研方法,其特征在于,还包括素材汇编步骤,
接收汇编主题信息,根据所述汇编主题信息筛选对应的电子档案,将对应的电子档案根据预设的体裁模板汇编成素材集。
3.根据权利要求2所述的电子档案编研方法,其特征在于,还包括总纂修订步骤、审核发布步骤,
所述总纂修订步骤包括,利用辅助修订工具对初步汇编的素材集进行辅助修订;利用系统化编排工具对素材集进行统一编排,并对格式结构进行加工完善得到最终素材集;
所述审核发布步骤包括,通过系统后台将所述最终素材集呈递专家审定,经专家综合审定核校后,通过数字会签进行确认,将确认后的最终素材集审核发布。
4.根据权利要求1所述的电子档案编研方法,其特征在于,
所述一级关联包括一级参考、一级引证、同一组卷和同一作者:
所述一级参考指本档案直接引用参考的档案;
所述一级引证指直接引用本档案的档案;
所述同一组卷指本档案组卷内的档案;
所述同一作者指同一作者发布的其他档案;
所述二级关联包括:二级参考、二级引证、同引档案、同被引档案、同一领域或相关领域;
所述二级参考指所述一级参考引用参考的档案;
所述二级引证指引用一级引证档案的档案;
所述同引档案指与本档案有共同参考的档案;
所述同被引档案指与本档案同时被引用的档案;
所述同一领域指基于知识库来挖掘和本档案在同一细分知识领域的档案;
所述相关领域指基于知识库来挖掘和本档案在相近细分知识领域的档案。
5.一种电子档案编研系统,其特征在于,包括如下模块,资源池构建模块,辅助选题模块和智能选材模块;
其中资源池库构建模块用于收录电子档案,对所述电子档案内容进行关联分析,得到一级关联信息、二级关联信息;
所述辅助选题模块用于对资源库中的搜索历史进行记录,将搜索频率高的搜索内容作为热点搜索;接受用户选题信息,根据用户信息进行选题推荐;
所述智能选材模块用于根据用户选定的编研主题,自动从资源池中智能检索出有用的素材信息,以选题关键词为基准,在档案资源池中进行一次选材识别,标识出待选材的档案资源,再对所述待选材的档案资源的一级参考和二级参考档案进行识别标识,进行二次选材识别。
6.根据权利要求5所述的电子档案编研系统,还包括素材汇编模块,
所述素材汇编模块用于接收汇编主题信息,根据所述汇编主题信息筛选对应的电子档案,将对应的电子档案根据预设的体裁模板汇编成素材集。
7.根据权利要求6所述的电子档案编研系统,还包括总纂修订模块、审核发布模块,
所述总纂修订模块用于利用辅助修订工具对初步汇编的素材集进行辅助修订;利用系统化编排工具对素材集进行统一编排,并对格式结构进行加工完善得到最终素材集;
所述审核发布模块用于通过系统后台将所述最终素材集呈递专家审定,经专家综合审定核校后,通过数字会签进行确认,将确认后的最终素材集审核发布。
8.根据权利要求5所述的电子档案编研方法,其特征在于,
所述一级关联包括一级参考、一级引证、同一组卷和同一作者:
所述一级参考指本档案直接引用参考的档案;
所述一级引证指直接引用本档案的档案;
所述同一组卷指本档案组卷内的档案;
所述同一作者指同一作者发布的其他档案;
所述二级关联包括:二级参考、二级引证、同引档案、同被引档案、同一领域或相关领域;
所述二级参考指所述一级参考引用参考的档案;
所述二级引证指引用一级引证档案的档案;
所述同引档案指与本档案有共同参考的档案;
所述同被引档案指与本档案同时被引用的档案;
所述同一领域指基于知识库来挖掘和本档案在同一细分知识领域的档案;
所述相关领域指基于知识库来挖掘和本档案在相近细分知识领域的档案。
CN201510718587.4A 2015-10-29 2015-10-29 一种电子档案编研方法及系统 Pending CN105335506A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510718587.4A CN105335506A (zh) 2015-10-29 2015-10-29 一种电子档案编研方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510718587.4A CN105335506A (zh) 2015-10-29 2015-10-29 一种电子档案编研方法及系统

Publications (1)

Publication Number Publication Date
CN105335506A true CN105335506A (zh) 2016-02-17

Family

ID=55286033

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510718587.4A Pending CN105335506A (zh) 2015-10-29 2015-10-29 一种电子档案编研方法及系统

Country Status (1)

Country Link
CN (1) CN105335506A (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874477A (zh) * 2017-02-17 2017-06-20 重庆市科学技术研究院 一种作文素材共享教学系统及其作文素材共享方法
CN108830540A (zh) * 2018-04-03 2018-11-16 国家电网公司 工程项目档案的处理方法、装置和系统
CN109857875A (zh) * 2019-01-31 2019-06-07 山东省国土测绘院 一种电子档案组卷方法及系统
CN113378916A (zh) * 2021-06-08 2021-09-10 紫光软件系统有限公司 一种基于聚类分析的智慧档案馆分层服务模式
CN114201658A (zh) * 2022-02-16 2022-03-18 广东图友软件科技有限公司 一种基于人脸识别的档案快速检索方法
CN114947402A (zh) * 2022-06-20 2022-08-30 国网山东省电力公司冠县供电公司 一种档案筛选分类处理装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462306A (zh) * 2014-11-28 2015-03-25 青岛大学 一种档案自动编研装置
WO2015052584A1 (en) * 2013-10-10 2015-04-16 Calgary Scientific Inc. Methods and systems for intelligent archive searching in multiple repository systems

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015052584A1 (en) * 2013-10-10 2015-04-16 Calgary Scientific Inc. Methods and systems for intelligent archive searching in multiple repository systems
CN104462306A (zh) * 2014-11-28 2015-03-25 青岛大学 一种档案自动编研装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
李文以: "基于现代信息技术条件的档案文献编纂模式探微", 《档案学通讯》 *
高申: ""中国知网"在科技期刊选题策划中的应用", 《编辑学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106874477A (zh) * 2017-02-17 2017-06-20 重庆市科学技术研究院 一种作文素材共享教学系统及其作文素材共享方法
CN106874477B (zh) * 2017-02-17 2020-06-12 重庆市科学技术研究院 一种作文素材共享教学系统及其作文素材共享方法
CN108830540A (zh) * 2018-04-03 2018-11-16 国家电网公司 工程项目档案的处理方法、装置和系统
CN108830540B (zh) * 2018-04-03 2022-08-02 国家电网公司 工程项目档案的处理方法、装置和系统
CN109857875A (zh) * 2019-01-31 2019-06-07 山东省国土测绘院 一种电子档案组卷方法及系统
CN113378916A (zh) * 2021-06-08 2021-09-10 紫光软件系统有限公司 一种基于聚类分析的智慧档案馆分层服务模式
CN114201658A (zh) * 2022-02-16 2022-03-18 广东图友软件科技有限公司 一种基于人脸识别的档案快速检索方法
CN114201658B (zh) * 2022-02-16 2022-04-26 广东图友软件科技有限公司 一种基于人脸识别的档案快速检索方法
CN114947402A (zh) * 2022-06-20 2022-08-30 国网山东省电力公司冠县供电公司 一种档案筛选分类处理装置

Similar Documents

Publication Publication Date Title
CN105335506A (zh) 一种电子档案编研方法及系统
CN110597981B (zh) 一种采用多策略自动生成摘要的网络新闻概要系统
JP5530425B2 (ja) ユーザ駆動によるセマンティックネットワークの動的生成およびメディア統合のための方法、システム、ならびにコンピュータプログラム
US8447758B1 (en) System and method for identifying documents matching a document metaprint
US8392472B1 (en) Auto-classification of PDF forms by dynamically defining a taxonomy and vocabulary from PDF form fields
WO2007043893A2 (en) Information access with usage-driven metadata feedback
CN115757689A (zh) 一种信息查询系统、方法及设备
CN105007314A (zh) 面向海量读者阅读数据的大数据处理系统
Smith et al. Scratchpads: a data-publishing framework to build, share and manage information on the diversity of life
Kalboussi et al. How to organize the annotation systems in human-computer environment: study, classification and observations
US20090198668A1 (en) Apparatus and method for displaying documents relevant to the content of a website
CN115190331A (zh) 一种适用于5g环境的全服务型媒资资源管理系统及方法
Wittenburg et al. FAIR practices in Europe
Geisler et al. A crowdsourcing framework for the production and use of film and television data
Kiryakos et al. The benefits of RDF and external ontologies for heterogeneous data: a case study using the Japanese visual media graph
Zeng et al. Navigating the intersection of library bibliographic data and linked music information sources: a study of the identification of useful metadata elements for interlinking
Satish A study on applications, approaches and issues of web content mining
El Haddadi et al. Mining unstructured data for a competitive intelligence system XEW
Li et al. Research on hot news discovery model based on user interest and topic discovery
Zaharee Building controlled vocabularies for metadata harmonization
CN105701243A (zh) 一种基于元数据模型的管控方法及装置
Fattahi et al. Recent research and developments in information organization in Iran: a historical review
Pavlova-Draganova et al. Modelling the Functionality of the Multimedia Digital Library for Fashion Objects
Yadav et al. Resources, facilities and services of the Indian citation index (ICI)
Wilmering et al. Audio effects data on the semantic web

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20160217

RJ01 Rejection of invention patent application after publication