CN110162607B - 一种基于卷积神经网络的政府组织公文信息追溯方法及装置 - Google Patents

一种基于卷积神经网络的政府组织公文信息追溯方法及装置 Download PDF

Info

Publication number
CN110162607B
CN110162607B CN201910127479.8A CN201910127479A CN110162607B CN 110162607 B CN110162607 B CN 110162607B CN 201910127479 A CN201910127479 A CN 201910127479A CN 110162607 B CN110162607 B CN 110162607B
Authority
CN
China
Prior art keywords
government organization
tracing
text
official
documents
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910127479.8A
Other languages
English (en)
Other versions
CN110162607A (zh
Inventor
付永晗
孔嘉明
宫勐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiefeng Data Technology Co ltd
Original Assignee
Beijing Jiefeng Data Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiefeng Data Technology Co ltd filed Critical Beijing Jiefeng Data Technology Co ltd
Priority to CN201910127479.8A priority Critical patent/CN110162607B/zh
Publication of CN110162607A publication Critical patent/CN110162607A/zh
Application granted granted Critical
Publication of CN110162607B publication Critical patent/CN110162607B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions
    • G06F16/3323Query formulation using system suggestions using document space presentation or visualization, e.g. category, hierarchy or range presentation and selection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

本发明提供一种基于卷积神经网络的政府组织公文信息追溯方法及装置。方法包括步骤:建立各级政府组织公文的自上而下的若干层目录;获取待追溯文本,将待追溯文本的所有字符作为目标字符;采用设定的神经网络模型将待追溯文本自下而上匹配各级政府组织公文的标题和正文;形成包括目标政府组织公文的标题和匹配段落的追溯子集;将上述追溯子集在电子设备上予以关系图显示。针对性解决政府组织公文的文档特点,提高了追溯政府组织公文信息的效率;采用了神经网络技术尤其是前馈卷积神经网络技术,对目标文本和公文信息的匹配准确性较高;以关系图及节点链接予以显示,利于人们的浏览的文件的调阅;对模型算法予以了优化,提高了匹配的准确性。

Description

一种基于卷积神经网络的政府组织公文信息追溯方法及装置
技术领域
本发明涉及电子文本处理领域,尤其涉及政府组织公文信息的归档追溯处理方法及装置。
背景技术
目前包括政府公文在内的文档处理、收集和归档工作,在“两化融合”的背景下,越来越走向在线自动化处理,为企事业政府机关等单位办公带来很大便利性。
政府组织的公文有其特殊性。第一是各级的由上至下的逐级传达,第二是兄弟单位的协助制定相关配套的公文函件,第三是主题的相关性较高。在大量的政府组织公文的日积月累下,政府组织自身有文档的存档,但后续制定出新的文档,存在追溯和归档困难,如果随意的追溯归档给日后的使用调阅带来很大的不便。对于关注政府组织公文的企业收集了大量与企业业务发展相关的大量政府组织公文,如果无序的归档和缺少合适的公文信息追溯方法或者电子设备,当需要调阅相关主题的历史文档时,显得捉襟见肘无法应对。
另外在现有技术中存在对政府公文的相关处理方法,比如公开号为CN108829651A的专利文件,由平安科技(深圳)有限公司申请,解决的公文自动匹配的智能化问题,但仍不足以在出现相关待追溯信息或者主题时,便于人们快速地获取相关的历史政府组织的公文,这也是现有技术的不足之处。
发明内容
本发明要解决的技术问题是,针对现有技术中存在的上述不足,提供一种基于卷积神经网络的政府组织公文信息追溯方法及装置,实现对政府组织公文信息的追溯自动化,便于人们的信息获取,提高作业效率和降低成本。
本发明为解决上述技术问题所采用的技术方案是:
本发明的政府组织公文信息追溯方法,包括以下步骤:
建立各级政府组织公文的自上而下的若干层目录;
获取待追溯文本,将待追溯文本的所有字符作为目标字符;
采用设定的神经网络模型将待追溯文本自下而上匹配各级政府组织公文的标题和正文;
形成包括目标政府组织公文的标题和匹配段落的追溯子集;
将上述追溯子集在电子设备上予以关系图显示。
优选的是,若干层目录包括兄弟级目录、父子级目录和子孙级目录。
优选的是,设定的神经网络模型为前馈卷积神经网络。
优选的是,关系图为网络图谱关系图或时间序列关系图。
优选的是,采用设定的神经网络模型将待追溯文本自下而上匹配政府组织公文的标题和正文,包括将待追溯文本分词后与公文分词后的标题和正文进行模型运算,其中标题所占权重系数不小于正文所占权重系数,得到待追溯文本与政府组织公文的关联度,当关联度大于预设阈值时将该政府组织公文纳入追溯子集。
优选的是,关系图的节点链接到对应的公文正文。
优选的是,追溯子集的关系图重新以兄弟级目录、父子级目录和子孙级目录的形式展现。
优选的是,将该方法用于政府组织公文的分类归档。
在本发明中还相应提供一种计算机可读存储介质。
其中,该计算机可读存储介质,存储有政府组织公文且具有信息追溯的装置,该装置的执行器执行如前述的政府组织公文信息追溯方法。
进一步地,在本发明中还相应提供一种用于政府组织公文信息追溯的装置。
其中,该用于政府组织公文信息追溯的装置,包括:
目录建立单元,用于在电子设备上建立各级政府组织公文的自上而下的若干层目录,若干层目录包括兄弟级目录、父子级目录和子孙级目录;
追溯文本获取单元,用于获取待追溯文本,并将待追溯文本的所有字符作为目标字符;
公文匹配单元,用于采用前馈卷积神经网络在建立的目录和公文中,将待追溯文本自下而上匹配各级政府组织公文的标题和正文;
追溯子集形成单元,用于将上述公文匹配单元匹配之后,形成包括目标政府组织公文的标题和匹配段落的追溯子集;
以及显示单元,用于将上述追溯子集在电子设备上予以关系图显示,关系图为网络图谱关系图或时间序列关系图。
与现有技术相比,本发明的有益效果包括:
(1)采用层级目录提高了信息追溯的效率和准确性,针对性解决政府组织公文的文档特点,提高了追溯政府组织公文信息的效率。
(2)采用了神经网络技术尤其是前馈卷积神经网络技术,对目标文本和公文信息的匹配准确性较高。
(3)重新对追溯子集予以汇总,以关系图及节点链接予以显示,利于人们的浏览的文件的调阅。
(4)对模型算法予以了优化,提高了匹配的准确性;对现有技术提供了一种新的政府组织公文信息的归档追溯处理方法及装置。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明政府组织公文信息追溯方法的步骤示意图;
图2为用于政府组织公文信息追溯的装置的结构示意图;
图3为政府组织公文的若干层的层级示意图;
图4为政府组织公文的时间序列关系图;
其中,0-电子设备,1-目录建立单元,2-追溯文本获取单元,3-公文匹配单元,4-追溯子集形成单元,5-显示单元。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,政府组织公文信息追溯方法,包括以下步骤:
01建立各级政府组织公文的自上而下的若干层目录;
02获取待追溯文本,将待追溯文本的所有字符作为目标字符;
03采用设定的神经网络模型将待追溯文本自下而上匹配各级政府组织公文的标题和正文;
04形成包括目标政府组织公文的标题和匹配段落的追溯子集;
05将上述追溯子集在电子设备上予以关系图显示。
这里,若干层目录包括兄弟级目录、父子级目录和子孙级目录,可以像图3一样,实际的公文数量和层级比这里多很多。在科技部下发的公文中,通常需要财政部、海关总署或者教育部下发配套的相关公文,以推动政策的具体落地施行;到了地方政府,他们会根据上级的政策文件制定进一步的细化公文政策,予以具体布置;再进一步地公文到达县市级,会有更细化的公文政策,用于指导企业或者个人如何去操作。
这里,设定的神经网络模型为前馈卷积神经网络。前馈卷积神经网络能够对文本滤波和降维,提高模型的准确性和可靠性。
这里,关系图为网络图谱关系图或时间序列关系图,时间序列图的图示可为图4。对于追溯到子集,提供了网络图谱关系图,有利于人们了解公文的归口单位和协助单位;时间序列图有利于人们了解公文的发生时间,整个来龙去脉有据可循。
这里,采用设定的神经网络模型将待追溯文本自下而上匹配政府组织公文的标题和正文,包括将待追溯文本分词后与公文分词后的标题和正文进行模型运算,其中标题所占权重系数不小于正文所占权重系数,得到待追溯文本与政府组织公文的关联度,当关联度大于预设阈值时将该政府组织公文纳入追溯子集。
这里,关系图的节点链接到对应的公文正文。
这里,追溯子集的关系图重新以兄弟级目录、父子级目录和子孙级目录的形式展现,子集也可如图3一样。
这里,将该方法用于政府组织公文的分类归档。
相应提供一种计算机可读存储介质。
其中,该计算机可读存储介质,存储有政府组织公文且具有信息追溯的装置,其特征在于装置的执行器执行如前述的政府组织公文信息追溯方法。
还相应提供一种用于政府组织公文信息追溯的装置。
其中,该用于政府组织公文信息追溯的装置,如图2所述,包括:
目录建立单元1,用于在电子设备0上建立各级政府组织公文的自上而下的若干层目录,若干层目录包括兄弟级目录、父子级目录和子孙级目录;
追溯文本获取单元2,用于获取待追溯文本,并将待追溯文本的所有字符作为目标字符;
公文匹配单元3,用于采用前馈卷积神经网络在建立的目录和公文中,将待追溯文本自下而上匹配各级政府组织公文的标题和正文;
追溯子集形成单元4,用于将上述公文匹配单元匹配之后,形成包括目标政府组织公文的标题和匹配段落的追溯子集;
以及显示单元5,用于将上述追溯子集在电子设备0上予以关系图显示,关系图为网络图谱关系图或时间序列关系图。
电子设备0的形式包括但不限于台式电脑、手提笔记本、手机终端、IPad和手表等形式。
当然,所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种政府组织公文信息追溯方法,其特征在于,包括以下步骤:
建立各级政府组织公文的自上而下的若干层目录;
获取待追溯文本,将所述待追溯文本的所有字符作为目标字符;
采用设定的神经网络模型将待追溯文本自下而上匹配各级政府组织公文的标题和正文;
形成包括目标政府组织公文的标题和匹配段落的追溯子集;
将上述追溯子集在电子设备上予以关系图显示。
2.根据权利要求1所述的政府组织公文信息追溯方法,其特征在于,所述若干层目录包括兄弟级目录、父子级目录和子孙级目录。
3.根据权利要求1所述的政府组织公文信息追溯方法,其特征在于,所述设定的神经网络模型为前馈卷积神经网络。
4.根据权利要求1所述的政府组织公文信息追溯方法,其特征在于,所述关系图为网络图谱关系图或时间序列关系图。
5.根据权利要求1所述的政府组织公文信息追溯方法,其特征在于,所述的采用设定的神经网络模型将待追溯文本自下而上匹配政府组织公文的标题和正文,包括将待追溯文本分词后与公文分词后的标题和正文进行模型运算,其中标题所占权重系数不小于正文所占权重系数,得到待追溯文本与政府组织公文的关联度,当关联度大于预设阈值时将该政府组织公文纳入追溯子集。
6.根据权利要求4所述的政府组织公文信息追溯方法,其特征在于,所述关系图的节点链接到对应的公文正文。
7.根据权利要求2所述的政府组织公文信息追溯方法,其特征在于,所述追溯子集的关系图重新以兄弟级目录、父子级目录和子孙级目录的形式展现。
8.根据权利要求1所述的政府组织公文信息追溯方法,其特征在于,将该方法用于政府组织公文的分类归档。
9.一种计算机可读存储介质,存储有政府组织公文且具有信息追溯的装置,其特征在于所述装置的执行器执行如权利要求1至8之一所述的政府组织公文信息追溯方法。
10.一种用于政府组织公文信息追溯的装置,其特征在于,包括:
目录建立单元,用于在电子设备上建立各级政府组织公文的自上而下的若干层目录,所述若干层目录包括兄弟级目录、父子级目录和子孙级目录;
追溯文本获取单元,用于获取待追溯文本,并将待追溯文本的所有字符作为目标字符;
公文匹配单元,用于采用前馈卷积神经网络在建立的目录和公文中,将待追溯文本自下而上匹配各级政府组织公文的标题和正文;
追溯子集形成单元,用于将上述公文匹配单元匹配之后,形成包括目标政府组织公文的标题和匹配段落的追溯子集;
以及显示单元,用于将上述追溯子集在电子设备上予以关系图显示,所述关系图为网络图谱关系图或时间序列关系图。
CN201910127479.8A 2019-02-20 2019-02-20 一种基于卷积神经网络的政府组织公文信息追溯方法及装置 Active CN110162607B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910127479.8A CN110162607B (zh) 2019-02-20 2019-02-20 一种基于卷积神经网络的政府组织公文信息追溯方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910127479.8A CN110162607B (zh) 2019-02-20 2019-02-20 一种基于卷积神经网络的政府组织公文信息追溯方法及装置

Publications (2)

Publication Number Publication Date
CN110162607A CN110162607A (zh) 2019-08-23
CN110162607B true CN110162607B (zh) 2021-08-31

Family

ID=67645397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910127479.8A Active CN110162607B (zh) 2019-02-20 2019-02-20 一种基于卷积神经网络的政府组织公文信息追溯方法及装置

Country Status (1)

Country Link
CN (1) CN110162607B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113836884A (zh) * 2021-09-22 2021-12-24 福建新大陆软件工程有限公司 一种公文模板推荐方法及系统
CN115758135B (zh) * 2022-11-03 2023-10-20 深圳交控科技有限公司 轨道交通信号系统功能需求追溯方法、装置及电子设备

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955529A (zh) * 2014-05-12 2014-07-30 中国科学院计算机网络信息中心 一种互联网信息搜索聚合呈现方法
CN104679825A (zh) * 2015-01-06 2015-06-03 中国农业大学 基于网络文本的地震宏观异常信息获取与筛选方法
CN106097064A (zh) * 2016-06-12 2016-11-09 安庆市扬智信息科技有限公司 一种多功能的知识产权网络交易平台
CN106126729A (zh) * 2016-07-01 2016-11-16 交通运输部路网监测与应急处置中心 一种电子地图里程桩数据采集及更新方法
CN106611246A (zh) * 2015-10-21 2017-05-03 星际空间(天津)科技发展有限公司 一种国土资源综合管理系统
CN107492059A (zh) * 2016-06-12 2017-12-19 深圳市华威世纪科技股份有限公司 面向煤矿安全的现场执法系统
CN108399164A (zh) * 2018-03-27 2018-08-14 国网黑龙江省电力有限公司电力科学研究院 基于模板的电子公文分类分级系统
CN108509424A (zh) * 2018-04-09 2018-09-07 平安科技(深圳)有限公司 制度信息处理方法、装置、计算机设备和存储介质
CN109033203A (zh) * 2018-06-29 2018-12-18 大连交通大学 一种面向大数据的特征提取并行处理方法
CN109063065A (zh) * 2018-07-20 2018-12-21 政和科技股份有限公司 一种政策信息推送的方法及装置
CN109360127A (zh) * 2018-10-24 2019-02-19 南京大学 一种证据链关系图建模方法
CN109359235A (zh) * 2018-10-16 2019-02-19 珠海智慧创新科技有限公司 一种政策资讯智能标注方法及智能匹配方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9530132B2 (en) * 2004-01-27 2016-12-27 George Chester Cox System and method for customer video authentication to prevent identity theft

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103955529A (zh) * 2014-05-12 2014-07-30 中国科学院计算机网络信息中心 一种互联网信息搜索聚合呈现方法
CN104679825A (zh) * 2015-01-06 2015-06-03 中国农业大学 基于网络文本的地震宏观异常信息获取与筛选方法
CN106611246A (zh) * 2015-10-21 2017-05-03 星际空间(天津)科技发展有限公司 一种国土资源综合管理系统
CN106097064A (zh) * 2016-06-12 2016-11-09 安庆市扬智信息科技有限公司 一种多功能的知识产权网络交易平台
CN107492059A (zh) * 2016-06-12 2017-12-19 深圳市华威世纪科技股份有限公司 面向煤矿安全的现场执法系统
CN106126729A (zh) * 2016-07-01 2016-11-16 交通运输部路网监测与应急处置中心 一种电子地图里程桩数据采集及更新方法
CN108399164A (zh) * 2018-03-27 2018-08-14 国网黑龙江省电力有限公司电力科学研究院 基于模板的电子公文分类分级系统
CN108509424A (zh) * 2018-04-09 2018-09-07 平安科技(深圳)有限公司 制度信息处理方法、装置、计算机设备和存储介质
CN109033203A (zh) * 2018-06-29 2018-12-18 大连交通大学 一种面向大数据的特征提取并行处理方法
CN109063065A (zh) * 2018-07-20 2018-12-21 政和科技股份有限公司 一种政策信息推送的方法及装置
CN109359235A (zh) * 2018-10-16 2019-02-19 珠海智慧创新科技有限公司 一种政策资讯智能标注方法及智能匹配方法
CN109360127A (zh) * 2018-10-24 2019-02-19 南京大学 一种证据链关系图建模方法

Also Published As

Publication number Publication date
CN110162607A (zh) 2019-08-23

Similar Documents

Publication Publication Date Title
US20220292103A1 (en) Information service for facts extracted from differing sources on a wide area network
Liu et al. The concepts of big data applied in personal knowledge management
Poorthuis et al. Making big data small: strategies to expand urban and geographical research using social media
Osae Otopah et al. Personal information management practices of students and its implications for library services
Hogan Facebook data storage centers as the archive’s underbelly
Bergman et al. The user‐subjective approach to personal information management systems design: Evidence and implementations
CN109710851B (zh) 基于互联网模式下多源数据分析的就业推荐方法及系统
US20040015514A1 (en) Method and system for managing data objects
Williams et al. The personal curation of digital objects: A lifecycle approach
CN110162607B (zh) 一种基于卷积神经网络的政府组织公文信息追溯方法及装置
Agarwal et al. Cognitive compliance for financial regulations
Ali et al. Modeling the process of personal digital archiving through ubiquitous and desktop devices: A systematic review
CN112559895B (zh) 一种数据处理方法、装置、电子设备及存储介质
Decker et al. Finding light in dark archives: using AI to connect context and content in email
Willett et al. Understanding digital note-taking practice for visualization
CN109803022A (zh) 一种数字化资源共享系统及其服务方法
Chaudhry Information management strategies of knowledge workers in the public sector in Kuwait
Nwagwu et al. Personal Information Creation, Storage and Finding Behaviours of Faculty in Selected Universities in Ghana.
Zhong Research on personal information management
Siegen Virtual Citation Proximity (VCP): Calculating Co-Citation-Proximity-Based Document Relatedness for Uncited Documents with Machine Learning (preprint)
Vassilakis et al. Database knowledge enrichment utilizing trending topics from Twitter
Lee et al. Entity-event lifelog ontology model (EELOM) for lifeLog ontology schema definition
Šajgalík et al. Efficient representation of the lifelong web browsing user characteristics
US11663542B2 (en) Electronic knowledge creation and management visual transformation tool
Jackson et al. Is there a role for knowledge management in saving the planet from too much data?

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder

Address after: 100000 Room 170, Zone C, Second Floor, College Park, Zhongguancun Dongsheng Science and Technology Park, No. A18 Xueqing Road, Haidian District, Beijing

Patentee after: Beijing Jiefeng Data Technology Co.,Ltd.

Address before: 100000-0719, 3 / F, No. 18, Beitaipingzhuang Road, Haidian District, Beijing

Patentee before: Beijing Jiefeng Data Technology Co.,Ltd.

CP02 Change in the address of a patent holder