CN109871468A - 非结构化文档管理与规章制度条目化管理一体化系统 - Google Patents

非结构化文档管理与规章制度条目化管理一体化系统 Download PDF

Info

Publication number
CN109871468A
CN109871468A CN201910102437.9A CN201910102437A CN109871468A CN 109871468 A CN109871468 A CN 109871468A CN 201910102437 A CN201910102437 A CN 201910102437A CN 109871468 A CN109871468 A CN 109871468A
Authority
CN
China
Prior art keywords
file
rules
regulations
structured document
index
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910102437.9A
Other languages
English (en)
Inventor
蒲涛
赵藟
余志军
王志民
石红
应成荣
朱宇
陈冬梅
李必清
李世佳
张治�
沈志平
马进
陈念
罗园
李小明
何名川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Sichuan Electric Power Co Ltd
Original Assignee
State Grid Sichuan Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Sichuan Electric Power Co Ltd filed Critical State Grid Sichuan Electric Power Co Ltd
Priority to CN201910102437.9A priority Critical patent/CN109871468A/zh
Publication of CN109871468A publication Critical patent/CN109871468A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种非结构化文档管理与规章制度条目化管理一体化系统,包括:数据录入模块,用于录入规章制度文件;制度文件数据集,用于存储规章制度文件数据;索引器,用于实现对规章制度文件数据构造索引;索引库,用于存储所有文件索引;分词器,从用户输入的检索信息中解析出至少一个检索关键词;检索器,从索引库中的各个文件索引中确定与检索关键词相匹配的目标文件索引,确定目标文件索引对应的目标描述信息并展示。本发明提供一种集非结构化文档管理与规章制度条目化管理于一体的存储与检索平台,用户可快速、准确地获得规章制度的全文检索结果,同时能够实现非结构化文档的云存储、访问和管理功能。

Description

非结构化文档管理与规章制度条目化管理一体化系统
技术领域
本发明涉及一种企业管理软件领域,具体是涉及一种非结构化文档管理与规章制度条目化管理一体化系统。
背景技术
现阶段,国网公司现有查询平台,不能检索制度详细内容,如需查询该制度里面的具体内容,仍需下载后进行检索,整体查询效率低,不利于需求信息的直接获取。并且,随着移动互联网技术的不断革新,特别是微信、微博、即时通讯等新媒体的崛起,大众已全面形成了“碎片化”获取信息的心理。在日常工作中,信息需求也全面呈现出“碎片化”特征,而条目化是解决需求碎片的唯一高效解。
另外,随着公司信息化的不断提高,电子文档成为公司知识积累的主要载体。随着各个业务系统的建设,信息流通的速度、强度和便捷度的加强,一方面让我们享受到了前所未有的方便和迅捷,但另一方面也承受着与各种非结构化文档的管理。在企业运营过程中,通过文档和客户交流的时间甚至超过90%,应用文档所产生的人工费占总人工费的40%,企业总收入的15%。知识管理成为了现代企业发展的关键,而企业在知识管理上却存在着巨大的问题。针对此种情况,可以通过单独开发应用系统解决此类问题,但经过调研发现现有办公信息系统存在以下两个问题:(1)这些系统往往是针对专门特殊的应用开发,不具有普遍的适用性,当需求发生变化时,需要重新开发,不仅投资比较大,较大局限性和需要大量培训。(2)在对文档文件的管理方式上也存在缺陷,海量的文件无法得到有效的维护处理。
发明内容
本发明的目的在于克服现有技术的不足,提供一种集非结构化文档管理与规章制度条目化管理于一体的存储与检索平台,用户可快速获得规章制度的全文检索结果,同时能够实现非结构化文档的云存储、访问和管理功能。
本发明的目的是通过以下技术方案来实现的:
非结构化文档管理与规章制度条目化管理一体化系统,包括:
数据录入模块,管理员通过数据录入模块录入规章制度文件,数据录入模块用于实现规章制度文件的文件保存、文件读取和纯文本化,形成纯文本化的规章制度文件数据;
制度文件数据集,用于存储规章制度文件数据;
非结构化文档存储服务器,用于存储非结构化文档数据;
索引器,用于实现对制度文件数据集内的规章制度文件数据、非结构化文档存储服务器内的非结构化文档数据构造索引,确定每一个所述规章制度文件数据、非结构化文档数据对应的描述信息,根据所述描述信息,构建每一个所述规章制度文件数据、非结构化文档数据对应的文件索引,并且存储在索引库中,同时实现生成、更新、删除文件索引的功能;
索引库,用于存储所有规章制度文件数据、非结构化文档数据对应的文件索引;
用户接口,用户通过用户接口输入检索信息;
分词器,用于实现中文分词及语义分析,从用户输入的检索信息中解析出至少一个检索关键词;
检索器,包括规章制度检索模块和非结构化文档检索模块,检索器从索引库中的各个文件索引中确定与用户输入的检索信息解析出的检索关键词相匹配的目标文件索引,计算各个文件索引与检索关键词的相关度,并将相关度大于阈值的目标文件索引按照相关度递减的顺序排列,确定所述目标文件索引对应的目标描述信息,并对所述目标描述信息进行展示。
非结构化文档管理与规章制度条目化管理一体化系统,还包括辅助更新服务器,辅助更新服务器中包括作废处理模块和过期处理模块,作废处理模块自动抓取规章制度文件中记载的原制度废止关键字,并由管理员确认后将废止的规章制度文件转存入废旧制度库;过期处理模块自动抓取规章制度文件中记载的原制度有效日期关键字,并由管理员确认后将过期的规章制度文件转存入废旧制度库。
所述的制度文件数据集通过通信网络与国网经法系统相连,保持数据更新。
所述的索引器对规章制度文件数据构造索引包括对需要查询的字段属性构造索引、对制度文件内容构造索引。
所述的分词器还包括检索关键词扩展模块,用于根据关键词扩展词库扩展检索关键词,由用户进行扩展关键词的选择和确定。
非结构化文档管理与规章制度条目化管理一体化系统,还包括语义分析大数据集群,语义分析大数据集群与分词器相连,语义分析大数据集群实现对主题模型分析,对实体或对象进行自动分类,以根据业务需要进行调整,能够对问题的上下文进行分解,对用户输入提供精准的分析。
所述的检索器还包括字符距离排序模块,当用户输入的检索信息中包括多个检索关键词时,字符距离排序模块计算各文件索引中关键词字符距离,并将目标文件索引按照关键词字符距离递增的顺序排列。
对所述目标描述信息进行展示时,支持在线预览,将规章制度文件直接转换为通用性的网络浏览格式文件,同时保留相应的图片和格式。
所述的非结构化文档存储服务器中,当其存储的非结构化文档数据被修改时,服务器会保留文档所有的操作历史,并且保存每个文档的修改版本。
本发明的有益效果是:
通过规章制度条目化建设,规范程序、创新管理、构建科学合理的规章制度管理体系,进一步规范了企业管理,较为彻底地解决了规章制度管理中存在的突出问题。
(一)促进了规章制度的完善,实现依法治企。
通过规章制度条目化建设,修订完善各项规章制度,使专业管理工作纳入到了规章制度管理体系中,增强了各单位有法可依的意识;通过对管理程序的规范,主动进行专业性检查,保证了规章制度的有效实施,进一步促进了各单位有法必依的自觉性,实现了依法治企目标。系统内容涵盖公司28个专业,包括454项通用制度和74项差异条款,237项非通用制度。
(二)实现了资源共享,提高了工作效率。
通过设计开发规章制度条目化管理系统,各单位间实现了资源共享,大大缩短了一些不必要的查询时间,提高了工作效率。现在各单位查询其他专业规章制度或文本已归档的规章制度,通过查询规章制度条目化系统,拓展了系统信息传递新模式,实现了资源共享。
(三)提高了企业整体管理水平。
企业要提高整体管理水平,就必须有规章制度作基本保障。通过实施规章制度条目化系统建设,使规章制度内容更加合理和科学,使规章制度程序更加规范、顺畅,使规章制度落实更加及时、有效,保证了各项工作职能职责履行真正落到实处,形成事事有人管、人人有事干,事事有章法、人人守规章的良好局面,并通过不断地持续改进,保证了企业整体水平不断提高。
(四)项目应用意义。
规章制度条目化,就是将公司现行有效规章制度按照关键字、主题进行基础单元的分割,便于“碎片化”需求的快速获取信息。每一个条目就是一个基础单元,就是一件事情、一个物、一个词的详细阐述。该系统随时保持在最新状态,提高了搜索结果的可用性、准确性。通过条目化推进制度信息的整合,构建实用、高效、准确的制度条目化管理系统,提高了公司整体管理水平,实现了降本增效的目标。
通过信息化手段对管理制度的创新,能够促进企业根据需要适时调理组织机构,保持机构精干、高放、权责分明、无交叉、无透漏,并且通过企业制度的制定、审核、发布、执行、修订、监督等系列体系。达到企业管理制度体系能够保持和增强科学、高度的运转效能。
本系统实现了非结构化文档的云存储、云访问、版本追溯、文档检索功能,工作效率以及规范性上在以下几个方面得到了提升。
1)员工的工作效率得到了提高
实施本系统后,员工的工作效率得到极大的提升,所有的工作完全在计算机上完成,解决过去互相推委的现象。
2)解决了产品文档难于管理的问题
在实施本系统前,开发新产品的技术文件及相关资料文档存放在多台计算机上,数据比较分散难于共享,难于统一管理。实施本系统后,技术文件及相关资料文档统一在平台中存储,定时备份,可以远程访问,且支持非结构化文档在线检索和查找,便于统一管理。
3)解决了过去修改版本难溯源的问题
随着业务系统的功能增加,修订文档是常见的事情,本系统对归档的图纸、文档进行修改时,不允许直接修改已审批通过的文件,取而代之的是将原来的文件另存为新的版本,通过修改新版本对象并重新提交审批来完成更改,而老版本的数据在系统仍将保留。
附图说明
图1为本发明系统结构框图。
具体实施方式
下面将结合实施例,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
参阅图1,本发明提供一种技术方案:
非结构化文档管理与规章制度条目化管理一体化系统,包括:
数据录入模块,管理员通过数据录入模块录入规章制度文件,数据录入模块用于实现规章制度文件的文件保存、文件读取和纯文本化,形成纯文本化的规章制度文件数据。目前系统中包含国网公司规章制度、国网四川电力、国网广元电力规章制度,上传文件包括电力行业的法律、法规、行业标准和各企业集团规定等,对规章制度进行更深层次的挖掘理解。企业在生产、培训时使用该软件可以更方便的查询到需要的文件。
制度文件数据集,用于存储规章制度文件数据。作为优选,本系统还包括辅助更新服务器,辅助更新服务器中包括作废处理模块和过期处理模块,作废处理模块自动抓取规章制度文件中记载的原制度废止关键字(例如:某制度文件中出现“原《…………规定》废止”字样),并由管理员确认后将废止的规章制度文件转存入废旧制度库;过期处理模块自动抓取规章制度文件中记载的原制度有效日期关键字(例如:某制度文件中出现“该规定自2019年1月1日起执行,有效期为1年”字样),并由管理员确认后将过期的规章制度文件转存入废旧制度库。系统自动抓取和识别作废制度文件信息,能够辅助管理员进行制度文件的更新和期限管理,避免人为管理的遗漏,可靠性高。
此外,目前系统与国网经法系统联网保持数据更新,对每一个文件的过期或作废等进行及时修订,保持系统的与时俱进,保证文件为实时适用的最新版本。
非结构化文档存储服务器,用于存储非结构化文档数据;为公司搭建一个文档资料(电子版、纸质、Office、txt、pdf)和各类数字资产(视频、音频、图片)等集中存储的平台,稳定可靠,文档上传至系统中进行集中存储,查找方便快捷,有效防止重要文件的丢失。系统采用B/S架构,支持互联网远程访问,使资料得以多人共享,文档管理随时随地;员工需要访问调阅某些文档时,只需登录系统即可查看,避免因员工出差等情况导致某些文档无法调用的情况发生。
所述的非结构化文档存储服务器中,当其存储的非结构化文档数据被修改时,服务器会保留文档所有的操作历史,并且保存每个文档的修改版本。文档正在被哪些用户编辑、文档各个时期的历史版本、文档被哪些用户查看过,都能够体现出来,给工作带来便捷,降低了错误率,提高了工作效率。
索引器,用于实现对制度文件数据集内的规章制度文件数据、非结构化文档存储服务器内的非结构化文档数据构造索引,确定每一个所述规章制度文件数据、非结构化文档数据对应的描述信息,根据所述描述信息,构建每一个所述规章制度文件数据、非结构化文档数据对应的文件索引,并且存储在索引库中,同时实现生成、更新、删除文件索引的功能。
所述的索引器对规章制度文件数据构造索引包括对需要查询的字段属性构造索引、对制度文件内容构造索引。将需要查询的字段属性建立索引,将多项输入变为单项输入,将复杂度由前台交互转移至后台程序处理,简化了查询操作;将制度文件内容建立索引,可直接查询制度文件内容,辅以文件在线预览、关键词高亮、关键词定位等技术支持,将大幅提高整体查询的效率。需要查询的字段属性包括制度名称、制度专业、制度文号。文件的查询搜索功能,既能输入文件名或关键字在数据库中全部搜索,又能按照法律、法规、标准或是生效年份等不同条件进行查询搜索。为了便于查询文件及对应文件内容的搜索,系统支持全文搜索功能。如在搜索界面输入关键词,在结果列表中即会显示相关文件的名称,也会显示部分带有关键字的制度文件详细内容。
索引库,用于存储所有规章制度文件数据、非结构化文档数据对应的文件索引;
用户接口,用户通过用户接口输入检索信息;
分词器,用于实现中文分词及语义分析,从用户输入的检索信息中解析出至少一个检索关键词;规章制度词类多样、语义复杂,只有在字、句和段之间能够明显的划分,而在词方面并没有一个明显的分界符,增加了中文语义分析的复杂性及分词的难度。本系统通过建立语义分析大数据集群,对主题模型分析,对实体或对象进行自动分类,以根据业务需要进行调整,能够对问题的上下文进行分解,对用户输入提供精准的分析。
作为进一步改进,所述的分词器还包括检索关键词扩展模块,用于根据关键词扩展词库扩展检索关键词,由用户进行扩展关键词的选择和确定。例如,检索用户通过用户接口输入的检索信息解析出的检索关键词为“奖励”时,检索关键词扩展模块根据关键词扩展词库中存储的扩展表得到扩展关键词“奖金、补贴、扶持资金、鼓励……”;检索关键词为“出差”时,得到扩展关键词“外出、外派、派遣……”。通过合理扩展关键词,可以帮助用户更轻松、快速地检索到更准确、更全面的制度文件结果。
检索器,包括规章制度检索模块和非结构化文档检索模块,检索器从索引库中的各个文件索引中确定与用户输入的检索信息解析出的检索关键词相匹配的目标文件索引,计算各个文件索引与检索关键词的相关度,并将相关度大于阈值的目标文件索引按照相关度递减的顺序排列,确定所述目标文件索引对应的目标描述信息,并对所述目标描述信息进行展示。
作为进一步改进,所述的检索器还包括字符距离排序模块,当用户输入的检索信息中包括多个检索关键词时,字符距离排序模块计算各文件索引中关键词字符距离,并将目标文件索引按照关键词字符距离递增的顺序排列。例如,用户输入的检索信息中包括检索关键词“住宿”和“标准”,包含这两个检索关键词的制度文件有:A文件,A文件中包含“员工应当保持住宿环境的卫生,公司后勤管理部门每季度开展职工宿舍卫生考评工作,严格按照考评标准打分……”;B文件,B文件中包含“员工出差时,需要住宿的,按照最高200元/天标准报销……”。字符距离排序模块计算得到A文件中关键词字符距离为“36字符”、B文件中关键词字符距离为“10字符”,由此返回给检索用户的结果中B文件排在A文件前,能够帮助检索用户快速地获得更为准确的检索结果。
对于制度文件的在线预览,原有方式通常采用安装浏览器插件、Active控件等方式进行。此种方式对于浏览器兼容性差,影响到浏览器的运行速度,安全性低,甚至造成浏览器的崩溃。本项目采用将制度文件直接转换为最具通用性的网络浏览格式文件,同时保留相应的图片和格式,兼容各种主流浏览器,提供兼容性更好,速度更快的文件在线预览功能。
本系统支持非结构化文档的高级搜索,可以基于正文、文件名/后缀、创建者、编号、属性、创建时间、更新时间、目录等属性组合搜索,解决了由于文档量大造成的查找不便的难题,大大节约了时间成本。
以上所述仅是本发明的优选实施方式,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文所述构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

Claims (10)

1.非结构化文档管理与规章制度条目化管理一体化系统,其特征在于,包括:
数据录入模块,管理员通过数据录入模块录入规章制度文件,数据录入模块用于实现规章制度文件的文件保存、文件读取和纯文本化,形成纯文本化的规章制度文件数据;
制度文件数据集,用于存储规章制度文件数据;
非结构化文档存储服务器,用于存储非结构化文档数据;
索引器,用于实现对制度文件数据集内的规章制度文件数据、非结构化文档存储服务器内的非结构化文档数据构造索引,确定每一个所述规章制度文件数据、非结构化文档数据对应的描述信息,根据所述描述信息,构建每一个所述规章制度文件数据、非结构化文档数据对应的文件索引,并且存储在索引库中,同时实现生成、更新、删除文件索引的功能;
索引库,用于存储所有规章制度文件数据、非结构化文档数据对应的文件索引;
用户接口,用户通过用户接口输入检索信息;
分词器,用于实现中文分词及语义分析,从用户输入的检索信息中解析出至少一个检索关键词;
检索器,包括规章制度检索模块和非结构化文档检索模块,检索器从索引库中的各个文件索引中确定与用户输入的检索信息解析出的检索关键词相匹配的目标文件索引,计算各个文件索引与检索关键词的相关度,并将相关度大于阈值的目标文件索引按照相关度递减的顺序排列,确定所述目标文件索引对应的目标描述信息,并对所述目标描述信息进行展示。
2.根据权利要求1所述的非结构化文档管理与规章制度条目化管理一体化系统,其特征在于:还包括辅助更新服务器,辅助更新服务器中包括作废处理模块和过期处理模块,作废处理模块自动抓取规章制度文件中记载的原制度废止关键字,并由管理员确认后将废止的规章制度文件转存入废旧制度库;过期处理模块自动抓取规章制度文件中记载的原制度有效日期关键字,并由管理员确认后将过期的规章制度文件转存入废旧制度库。
3.根据权利要求1所述的非结构化文档管理与规章制度条目化管理一体化系统,其特征在于:所述的制度文件数据集通过通信网络与国网经法系统相连,保持数据更新。
4.根据权利要求1-3中任一项所述的非结构化文档管理与规章制度条目化管理一体化系统,其特征在于:所述的索引器对规章制度文件数据构造索引包括对需要查询的字段属性构造索引、对制度文件内容构造索引。
5.根据权利要求4所述的非结构化文档管理与规章制度条目化管理一体化系统,其特征在于:需要查询的字段属性包括制度名称、制度专业、制度文号。
6.根据权利要求1-3中任一项所述的非结构化文档管理与规章制度条目化管理一体化系统,其特征在于:所述的分词器还包括检索关键词扩展模块,用于根据关键词扩展词库扩展检索关键词,由用户进行扩展关键词的选择和确定。
7.根据权利要求1所述的非结构化文档管理与规章制度条目化管理一体化系统,其特征在于:还包括语义分析大数据集群,语义分析大数据集群与分词器相连,语义分析大数据集群实现对主题模型分析,对实体或对象进行自动分类,以根据业务需要进行调整,能够对问题的上下文进行分解,对用户输入提供精准的分析。
8.根据权利要求1所述的非结构化文档管理与规章制度条目化管理一体化系统,其特征在于:所述的检索器还包括字符距离排序模块,当用户输入的检索信息中包括多个检索关键词时,字符距离排序模块计算各文件索引中关键词字符距离,并将目标文件索引按照关键词字符距离递增的顺序排列。
9.根据权利要求1所述的非结构化文档管理与规章制度条目化管理一体化系统,其特征在于:对所述目标描述信息进行展示时,支持在线预览,将规章制度文件直接转换为通用性的网络浏览格式文件,同时保留相应的图片和格式。
10.根据权利要求1所述的非结构化文档管理与规章制度条目化管理一体化系统,其特征在于:所述的非结构化文档存储服务器中,当其存储的非结构化文档数据被修改时,服务器会保留文档所有的操作历史,并且保存每个文档的修改版本。
CN201910102437.9A 2019-02-01 2019-02-01 非结构化文档管理与规章制度条目化管理一体化系统 Pending CN109871468A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910102437.9A CN109871468A (zh) 2019-02-01 2019-02-01 非结构化文档管理与规章制度条目化管理一体化系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910102437.9A CN109871468A (zh) 2019-02-01 2019-02-01 非结构化文档管理与规章制度条目化管理一体化系统

Publications (1)

Publication Number Publication Date
CN109871468A true CN109871468A (zh) 2019-06-11

Family

ID=66918526

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910102437.9A Pending CN109871468A (zh) 2019-02-01 2019-02-01 非结构化文档管理与规章制度条目化管理一体化系统

Country Status (1)

Country Link
CN (1) CN109871468A (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110851449A (zh) * 2019-11-11 2020-02-28 云南电网有限责任公司电力科学研究院 一种基于区块链技术的非结构化文档管理方法和装置
CN110851397A (zh) * 2019-11-12 2020-02-28 成都九鼎瑞信科技股份有限公司 一种基于云文档管理系统的知识库构建平台
CN111177306A (zh) * 2020-01-02 2020-05-19 中国银行股份有限公司 一种数据处理方法及装置
CN111353762A (zh) * 2020-03-30 2020-06-30 中国建设银行股份有限公司 一种规章制度管理方法及系统
CN111367499A (zh) * 2019-12-10 2020-07-03 中国航空综合技术研究所 一种基于标准指标库的产品需求定义和追溯方法
CN111625582A (zh) * 2020-05-18 2020-09-04 海南电网有限责任公司 数据仓储系统
CN111753221A (zh) * 2020-06-28 2020-10-09 中国银行股份有限公司 一种搜索引擎的智能提示方法及装置
CN113377950A (zh) * 2021-06-02 2021-09-10 浪潮软件股份有限公司 一种实现非结构化文档扁平化存储及实时预览的方法
CN113535936A (zh) * 2021-06-21 2021-10-22 杭州初灵数据科技有限公司 一种基于深度学习的规章制度检索方法及系统
CN114036256A (zh) * 2021-11-08 2022-02-11 北京环境特性研究所 基于Solr的非结构化文件检索方法、装置、设备及存储介质

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002222185A (ja) * 2001-01-25 2002-08-09 Sharp Corp 構造化文書共有装置、構造化文書共有方法及び構造化文書のファイル共有システム
CN101477568A (zh) * 2009-02-12 2009-07-08 清华大学 一种结构化数据和非结构化数据综合检索的方法
CN102693244A (zh) * 2011-03-23 2012-09-26 日电(中国)有限公司 用于识别非结构化文本中的信息的方法和装置
US20140156614A1 (en) * 2012-12-05 2014-06-05 Kirk KRAPPE Managing structured data fields within a social media channel
US20150310004A1 (en) * 2012-11-30 2015-10-29 Ubic, Inc. Document management system, document management method, and document management program
CN105868331A (zh) * 2016-03-28 2016-08-17 华北电力科学研究院有限责任公司 基于移动终端的电源侧技术服务辅助方法
CN106095779A (zh) * 2016-05-26 2016-11-09 达而观信息科技(上海)有限公司 一种基于关键词位置的检索方法及装置
CN106776851A (zh) * 2016-11-28 2017-05-31 国网上海市电力公司 文档结构化方法和设备
CN106844625A (zh) * 2017-01-17 2017-06-13 清华大学 银行运维规章制度变更的合规性查验方法及装置
CN107346325A (zh) * 2016-05-04 2017-11-14 中国石油集团长城钻探工程有限公司 信息查询方法及装置
CN108509547A (zh) * 2018-03-20 2018-09-07 中国长城科技集团股份有限公司 一种信息管理方法、信息管理系统及电子设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002222185A (ja) * 2001-01-25 2002-08-09 Sharp Corp 構造化文書共有装置、構造化文書共有方法及び構造化文書のファイル共有システム
CN101477568A (zh) * 2009-02-12 2009-07-08 清华大学 一种结构化数据和非结构化数据综合检索的方法
CN102693244A (zh) * 2011-03-23 2012-09-26 日电(中国)有限公司 用于识别非结构化文本中的信息的方法和装置
US20150310004A1 (en) * 2012-11-30 2015-10-29 Ubic, Inc. Document management system, document management method, and document management program
US20140156614A1 (en) * 2012-12-05 2014-06-05 Kirk KRAPPE Managing structured data fields within a social media channel
CN105868331A (zh) * 2016-03-28 2016-08-17 华北电力科学研究院有限责任公司 基于移动终端的电源侧技术服务辅助方法
CN107346325A (zh) * 2016-05-04 2017-11-14 中国石油集团长城钻探工程有限公司 信息查询方法及装置
CN106095779A (zh) * 2016-05-26 2016-11-09 达而观信息科技(上海)有限公司 一种基于关键词位置的检索方法及装置
CN106776851A (zh) * 2016-11-28 2017-05-31 国网上海市电力公司 文档结构化方法和设备
CN106844625A (zh) * 2017-01-17 2017-06-13 清华大学 银行运维规章制度变更的合规性查验方法及装置
CN108509547A (zh) * 2018-03-20 2018-09-07 中国长城科技集团股份有限公司 一种信息管理方法、信息管理系统及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
闫涛蔚 等: "《ERP基础理论与应用 Sunlike ERP实务》", 山东大学出版社, pages: 95 *

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110851449A (zh) * 2019-11-11 2020-02-28 云南电网有限责任公司电力科学研究院 一种基于区块链技术的非结构化文档管理方法和装置
CN110851397A (zh) * 2019-11-12 2020-02-28 成都九鼎瑞信科技股份有限公司 一种基于云文档管理系统的知识库构建平台
CN111367499A (zh) * 2019-12-10 2020-07-03 中国航空综合技术研究所 一种基于标准指标库的产品需求定义和追溯方法
CN111177306A (zh) * 2020-01-02 2020-05-19 中国银行股份有限公司 一种数据处理方法及装置
CN111177306B (zh) * 2020-01-02 2023-09-26 中国银行股份有限公司 一种数据处理方法及装置
CN111353762A (zh) * 2020-03-30 2020-06-30 中国建设银行股份有限公司 一种规章制度管理方法及系统
CN111353762B (zh) * 2020-03-30 2024-09-03 中国建设银行股份有限公司 一种规章制度管理方法及系统
CN111625582A (zh) * 2020-05-18 2020-09-04 海南电网有限责任公司 数据仓储系统
CN111625582B (zh) * 2020-05-18 2023-11-10 海南电网有限责任公司 数据仓储系统
CN111753221B (zh) * 2020-06-28 2024-03-26 中国银行股份有限公司 一种搜索引擎的智能提示方法及装置
CN111753221A (zh) * 2020-06-28 2020-10-09 中国银行股份有限公司 一种搜索引擎的智能提示方法及装置
CN113377950A (zh) * 2021-06-02 2021-09-10 浪潮软件股份有限公司 一种实现非结构化文档扁平化存储及实时预览的方法
CN113535936A (zh) * 2021-06-21 2021-10-22 杭州初灵数据科技有限公司 一种基于深度学习的规章制度检索方法及系统
CN113535936B (zh) * 2021-06-21 2024-02-13 杭州初灵数据科技有限公司 一种基于深度学习的规章制度检索方法及系统
CN114036256B (zh) * 2021-11-08 2024-05-31 北京环境特性研究所 基于Solr的非结构化文件检索方法、装置、设备及存储介质
CN114036256A (zh) * 2021-11-08 2022-02-11 北京环境特性研究所 基于Solr的非结构化文件检索方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
CN109871468A (zh) 非结构化文档管理与规章制度条目化管理一体化系统
Rusyn et al. Model and architecture for virtual library information system
US20230333919A1 (en) Flexible and scalable artificial intelligence and analytics platform with advanced content analytics and data ingestion
CN110597981B (zh) 一种采用多策略自动生成摘要的网络新闻概要系统
US20100114899A1 (en) Method and system for business intelligence analytics on unstructured data
US10235637B2 (en) Generating feature vectors from RDF graphs
EP3270303A1 (en) An automated monitoring and archiving system and method
JPH07319917A (ja) 文書データべース管理装置および文書データべースシステム
CN115757689A (zh) 一种信息查询系统、方法及设备
Meziane et al. A document management methodology based on similarity contents
CN113239111B (zh) 一种基于知识图谱的网络舆情可视化分析方法及系统
Das et al. A CV parser model using entity extraction process and big data tools
US20190317953A1 (en) System and method for computerized semantic indexing and searching
JP2008537811A (ja) リスティングを管理するためのシステム及び方法
KR101864401B1 (ko) 전통문화 융복합 지원을 위한 디지털 연표 표출 시스템
Maciołek et al. Cluo: Web-scale text mining system for open source intelligence purposes
Clavert History in the era of massive data: Online social media as primary sources for historians
KR102413961B1 (ko) Rpa 모니터링을 이용한 뉴스 분석 서비스 제공 방법
Salam et al. Distributed framework for political event coding in real-time
JP7420745B2 (ja) マルチソース型の相互運用性および/または情報検索の最適化
KR102434880B1 (ko) 멀티미디어 플랫폼 기반 지식 공유 서비스 제공 시스템
CN116467291A (zh) 一种知识图谱存储与搜索方法及系统
US12093222B2 (en) Data tagging and synchronisation system
Guo et al. Topic mining for call centers based on A‐LDA and distributed computing
KR102252096B1 (ko) 빅데이터 기반 회의록 가공 서비스 제공 시스템

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190611