CN115422319A - 一种线上归集工程资料的方法和系统 - Google Patents

一种线上归集工程资料的方法和系统 Download PDF

Info

Publication number
CN115422319A
CN115422319A CN202210930040.0A CN202210930040A CN115422319A CN 115422319 A CN115422319 A CN 115422319A CN 202210930040 A CN202210930040 A CN 202210930040A CN 115422319 A CN115422319 A CN 115422319A
Authority
CN
China
Prior art keywords
engineering data
engineering
data
file
collected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210930040.0A
Other languages
English (en)
Inventor
张�成
韩义成
杨鹏飞
朱毅
李洋
石毅
叶涵
卢愿
宋英杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shandong Zhiyuan Electric Power Design Consulting Co ltd
State Grid Corp of China SGCC
Economic and Technological Research Institute of State Grid Shandong Electric Power Co Ltd
Shandong Luruan Digital Technology Co Ltd
Original Assignee
Shandong Zhiyuan Electric Power Design Consulting Co ltd
State Grid Corp of China SGCC
Economic and Technological Research Institute of State Grid Shandong Electric Power Co Ltd
Shandong Luruan Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shandong Zhiyuan Electric Power Design Consulting Co ltd, State Grid Corp of China SGCC, Economic and Technological Research Institute of State Grid Shandong Electric Power Co Ltd, Shandong Luruan Digital Technology Co Ltd filed Critical Shandong Zhiyuan Electric Power Design Consulting Co ltd
Priority to CN202210930040.0A priority Critical patent/CN115422319A/zh
Publication of CN115422319A publication Critical patent/CN115422319A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/186Templates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/08Construction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Business, Economics & Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Economics (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种线上归集工程资料的方法和系统,该方法包括:制定第一模板作为收集工程资料的数字化文件目录,实现工程资料在各责任主体间的流转;对第一模板收集的工程资料设置电子签章和电子校验;通过将收集工程资料转化为关键词矩阵的方式构建收集工程资料的知识图谱,用于根据工程资料的相关性进行分组关联和相关性检索;构建知识图谱之后,按照预设规则对收集工程资料进行归档。基于该方法,还提出了一种线上归集工程资料的系统。本发明充分利用了信息化平台和技术优势,变革了传统重纸质工程档案轻电子档案的管理模式,形成了工程档案资料与工程建设项目同时策划、同时生成、同时核查、同时移交、同时考核管理机制。

Description

一种线上归集工程资料的方法和系统
技术领域
本发明属于电力系统工程资料管理领域,具体的说是一种线上归集工程资料的方法和系统。
背景技术
输变电工程建设档案资料,在电力工程建设领域和社会经济生活中有着十分重要的意义和使用价值,在电力工程建设项目管理中发挥着重要作用。如何对工程档案的形成、收集、整理、立卷、归档进行有效管控,并快速、精确的形成“来源可靠、程序规范、要素合规”完整高质量的输变电工程电子档案,都需要变革传统的工程档案管理办法,创新一种实现工程档案智能归集的方法和管理系统,实现工程与工程档案同步规划、同步实施、同步移交智能化系统。
传统的输变电工程档案管理,要求须同时移交保存纸质文件和电子文件,而电子文件只是作为纸质文件的备份放松了对电子文件的要求,导致纸质档案和电子档案不一致;存在轻资料重现场的现象,资料严重滞后现场实体进度,资料编制人员对现场实体施工情况不了解,导致资料与现场实体“两张皮”,从而导致资料管理工作留下隐患;存料线下收集、重新编目归集工程档案资料现象,资料的线下收集、重新编目一是可能造成资料与现场不符、资料收集不完全、工程档案归集效率低,且需要消耗大量时间和人力成本。如何采取一种更高效、简便、精确的工程档案归集方式,实现工程与工程档案同步规划、同步实施、同步形成、同步移交迫在眉睫。
发明内容
为了解决上述技术问题,本发明提出了一种线上归集工程资料的方法和系统,实现了工程过程文件与档案目录自动分类匹配、智能归集,从而降低了人工录入与核查的错误率,保证了数据准确可靠,提高了资料归档的工作效率。
为实现上述目的,本发明采用以下技术方案:
一种线上归集工程资料的方法,包括以下步骤:。
制定第一模板作为收集工程资料的数字化文件目录,实现工程资料在各责任主体间的流转;
对第一模板收集的工程资料设置电子签章和电子校验以保证工程资料的安全;
通过将收集工程资料转化为关键词矩阵的方式构建收集工程资料的知识图谱,用于根据工程资料的相关性进行分组关联和相关性检索;
构建知识图谱之后,按照预设规则对收集工程资料进行归档。
进一步的,所述方法还包括:对于已经生成纸质文件的工程资料采用扫描上传,采用OCR识别技术自动识别扫描后的文件,并同样以第一模板保存。
进一步的,所述第一模板包括工程资料的归档范围、归档方式、工程立项时间、可研费、设计费、竣工时间、监理单位、验收时间和验收资料。
进一步的,所述对第一模板收集的工程资料设置电子签章的过程包括:记录签章人、印章名称和签章时间,用于保证工程资料的可追溯性;以及利用电子签章将含有数字签名的电子签章转化为与纸质文件盖章操作相同的可视效果。
进一步的,所述构建收集工程资料的知识图谱的过程包括:
首先对以第一模板收集的工程资料进行数据清洗;
将清洗后的工程资料输入至Ucinet软件中,通过Ucinet软件将清洗后的工程资料转化为关键词矩阵,然后再以Excel的格式保存,最后再将关键词矩阵导入至Ucinet软件转换为Ucinet数据库格式;
Ucinet软件将以Ucinet数据库格式保存的工程资料可视化并生成共词网络简化图谱以及关键词共现网络定量指标。
进一步的,所述按照预设规则对收集工程资料进行归档的过程包括:
按照输变电工程档案管理分卷要求,梳理应归档文件清单及档号划分,形成输变电工程档案类目,同时构建工程过程资料与档案类目的对应关系模型,为档案智能归集提供依据;
或者建立工程资料文件的自动分类匹配关系,工程资料归档前辅助组卷,在系统内通过档号配置实现自动分类。
进一步的,所述方法还包括对不同粒度的组卷提供有效性验证依据数据,包括签章、内容、流转信息、流转时间的有效性证据提取。
本发明还提出了一种线上归集工程资料的系统,包括制定模板模块、设置模块、构建模块和归档模块;
所述制定模板模块用于制定第一模板作为收集工程资料的数字化文件目录,实现工程资料在各责任主体间的流转;
所述设置模块用于对第一模板收集的工程资料设置电子签章和电子校验以保证工程资料的安全;
所述构建模块用于通过将收集工程资料转化为关键词矩阵的方式构建收集工程资料的知识图谱,用于根据工程资料的相关性进行分组关联和相关性检索;
所述归档模块用于构建知识图谱之后,按照预设规则对收集工程资料进行归档。
进一步的,所述系统还包括扫描识别模块;
所述扫描识别模块用于对于已经生成纸质文件的工程资料采用扫描上传,采用OCR识别技术自动识别扫描后的文件,并同样以第一模板保存。
进一步的,所述构建模块实现的过程包括:
首先对以第一模板收集的工程资料进行数据清洗;
将清洗后的工程资料输入至Ucinet软件中,通过Ucinet软件将清洗后的工程资料转化为关键词矩阵,然后再以Excel的格式保存,最后再将关键词矩阵导入至Ucinet软件转换为Ucinet数据库格式;
Ucinet软件将以Ucinet数据库格式保存的工程资料可视化并生成共词网络简化图谱以及关键词共现网络定量指标。
发明内容中提供的效果仅仅是实施例的效果,而不是发明所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:
本发明提出了一种线上归集工程资料的方法和系统,该方法包括以下步骤:制定第一模板作为收集工程资料的数字化文件目录,实现工程资料在各责任主体间的流转;对第一模板收集的工程资料设置电子签章和电子校验以保证工程资料的安全;通过将收集工程资料转化为关键词矩阵的方式构建收集工程资料的知识图谱,用于根据工程资料的相关性进行分组关联和相关性检索;构建知识图谱之后,按照预设规则对收集工程资料进行归档。基于一种线上归集工程资料的方法,还提出了一种线上归集工程资料的系统。本发明充分利用了信息化平台和技术优势,变革了传统重纸质工程档案轻电子档案的管理模式,形成了工程档案资料与工程建设项目同时策划、同时生成、同时核查、同时移交、同时考核管理机制,并依据国工程档案相关管理规定,构建了输变电工程过程文件与档案类目的关系模型,实现了工程过程文件与档案目录自动分类匹配、智能归集,从而降低了人工录入与核查的错误率,保证了数据准确可靠,提高了资料归档的工作效率,实现了来源可靠、程序规范、要素合规的电子文件,对于输变电工程资料的规范化和高效处理具有很好的实现成效与应用前景。
本发明采用Ucinet软件构建收集工程资料的知识图谱,用于根据工程资料的相关性进行分组关联和相关性检索,提高了关联的准确性和相关性检索的效率。
附图说明
图1为本发明实施例1一种线上归集工程资料的方法流程图;
图2为本发明实施例2一种线上归集工程资料的系统示意图。
具体实施方式
为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本发明进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本发明的不同结构。为了简化本发明的公开,下文中对特定例子的部件和设置进行描述。此外,本发明可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本发明省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本发明。
实施例1
本发明实施例1提出了一种线上归集工程资料的方法,依托信息化平台、工作流、电子签章等平台和信息化技术,变革传统工程档案归集和管理方式,使传统的以纸质为载体的档案信息对象转为机读档案,不仅节约了保管费用,节省了占地空间,而且查阅方便迅速,避免了反复印制资料而造成的纸张和人员的浪费,提高了经济效益;工程档案的电子化可以实现信息相互分享,而且资料内容不可以随意更改或毁坏,杜绝了资料造假,同时方便备份不容易丢失。数字化档案管理使资料能及时归档,并尽快提供利用。
以输变电工程的改扩建为例,改扩建工程更加需要一套完整、真实、齐全的档案,但实际经常存在前期档案不全、现场和实际不符的现象,导致无法根据前期档案提供的信息准备无误的开展改扩建施工。实行档案数字化管理后,实现了信息汇集共享,可以及时提供详细、准确的信息,为改扩建工程的设备、人身安全保驾护航。数字化档案管理使查询资料变得非常简单,提高了工作效率。档案库也从文件实体的保管基本变成了提供利用方便的信息控制中心,提高了办公效率。
如图1为本发明实施例1一种线上归集工程资料的方法流程图;
该步骤S100中,制定第一模板作为收集工程资料的数字化文件目录,实现工程资料在各责任主体间的流转;
根据项目需求设置审批流程,并保留审批记录,电子文件在系统中生成、运转,用XML描述元数据具有等级结构,层次清晰,既可以很好地表达电子文件的物理结构,还能充分表达电子文件的内容及其逻辑结构,详细标识各个元素内容,业务系统收集的元数据项,包括公共元数据项及各类电子文件独有的元数据项。
在步骤S110中,对第一模板收集的工程资料设置电子签章和电子校验以保证工程资料的安全;
利用电子签章及其校验技术能够保障电子文件的真实性、合法性、完整性、可靠性以及签名人的不可否认性。同时记录签章人、印章名称、签章时间等信息,保证资料的可追溯性,利用电子签章技术将含有数字签名的电子电子签章转化为与纸质文件盖章操作相同的可视效果。
本发明中还包括:对于已经生成纸质文件的工程资料采用扫描上传,采用 OCR识别技术自动识别扫描后的文件,并同样以第一模板保存。
对于存量工程,支持用户将已经生成的纸质文档扫描上传,系统离线文档 OCR识别模块自动识别提取保存用户上传扫描文档的内容,最大化保持离线上传文档与电子流转文档保持一致。
在步骤S120中,通过将收集工程资料转化为关键词矩阵的方式构建收集工程资料的知识图谱,用于根据工程资料的相关性进行分组关联和相关性检索;
构建收集工程资料的知识图谱的过程包括:
首先对以第一模板收集的工程资料进行数据清洗;
将清洗后的工程资料输入至Ucinet软件中,通过Ucinet软件将清洗后的工程资料转化为关键词矩阵,然后再以Excel的格式保存,最后再将关键词矩阵导入至Ucinet软件转换为Ucinet数据库格式;
Ucinet软件将以Ucinet数据库格式保存的工程资料可视化并生成共词网络简化图谱以及关键词共现网络定量指标。
在步骤S130中,构建知识图谱之后,按照预设规则对收集工程资料进行归档。分析输变电工程相关标准化工作手册、管理办法、通用制度等,按照工程建设全过程管理框架,梳理工程档案电子化需求,同时按照输变电工程档案管理分卷要求,梳理应归档文件清单及档号划分,形成输变电工程档案类目,同时构建工程过程资料与档案类目的对应关系模型,为档案智能归集提供的有效的依据。建立工程文件自动分类匹配关系,工程资料归档前辅助组卷,在系统内通过档号配置实现自动分类;根据实际需要进行调整,实现工程档案文件智能归集和线上档案预组卷。
本发明可以对不同粒度的组卷提供有效性验证依据数据,包括签章、内容、流转信息、流转时间等有效性证据提取。
本发明实施例1提出的一种线上归集工程资料的方法,充分利用了信息化平台和技术优势,变革了传统重纸质工程档案轻电子档案的管理模式,形成了工程档案资料与工程建设项目同时策划、同时生成、同时核查、同时移交、同时考核管理机制,并依据国工程档案相关管理规定,构建了输变电工程过程文件与档案类目的关系模型,实现了工程过程文件与档案目录自动分类匹配、智能归集,从而降低了人工录入与核查的错误率,保证了数据准确可靠,提高了资料归档的工作效率,实现了来源可靠、程序规范、要素合规的电子文件,对于输变电工程资料的规范化和高效处理具有很好的实现成效与应用前景。
本发明实施例1提出的一种线上归集工程资料的方法,采用Ucinet软件构建收集工程资料的知识图谱,用于根据工程资料的相关性进行分组关联和相关性检索,提高了关联的准确性和相关性检索的效率。
实施例2
基于本发明实施例1提出的一种线上归集工程资料的方法,本发明实施例 2提出了一种线上归集工程资料的系统,如图2为本发明实施例2一种线上归集工程资料的系统示意图,该系统包括制定模板模块、设置模块、构建模块和归档模块;
制定模板模块用于制定第一模板作为收集工程资料的数字化文件目录,实现工程资料在各责任主体间的流转;
制定模板模块实现的过程包括:根据项目需求设置审批流程,并保留审批记录,电子文件在系统中生成、运转,用XML描述元数据具有等级结构,层次清晰,既可以很好地表达电子文件的物理结构,还能充分表达电子文件的内容及其逻辑结构,详细标识各个元素内容,业务系统收集的元数据项,包括公共元数据项及各类电子文件独有的元数据项。
设置模块用于对第一模板收集的工程资料设置电子签章和电子校验以保证工程资料的安全;
设置模块实现的过程为:利用电子签章及其校验技术能够保障电子文件的真实性、合法性、完整性、可靠性以及签名人的不可否认性。同时记录签章人、印章名称、签章时间等信息,保证资料的可追溯性,利用电子签章技术将含有数字签名的电子电子签章转化为与纸质文件盖章操作相同的可视效果。
本发明中还包括:对于已经生成纸质文件的工程资料采用扫描上传,采用 OCR识别技术自动识别扫描后的文件,并同样以第一模板保存。
对于存量工程,支持用户将已经生成的纸质文档扫描上传,系统离线文档 OCR识别模块自动识别提取保存用户上传扫描文档的内容,最大化保持离线上传文档与电子流转文档保持一致。
构建模块用于通过将收集工程资料转化为关键词矩阵的方式构建收集工程资料的知识图谱,用于根据工程资料的相关性进行分组关联和相关性检索;构建模块实现的过程包括:首先对以第一模板收集的工程资料进行数据清洗;将清洗后的工程资料输入至Ucinet软件中,通过Ucinet软件将清洗后的工程资料转化为关键词矩阵,然后再以Excel的格式保存,最后再将关键词矩阵导入至 Ucinet软件转换为Ucinet数据库格式;Ucinet软件将以Ucinet数据库格式保存的工程资料可视化并生成共词网络简化图谱以及关键词共现网络定量指标。
归档模块用于构建知识图谱之后,按照预设规则对收集工程资料进行归档。构建知识图谱之后,按照预设规则对收集工程资料进行归档。分析输变电工程相关标准化工作手册、管理办法、通用制度等,按照工程建设全过程管理框架,梳理工程档案电子化需求,同时按照输变电工程档案管理分卷要求,梳理应归档文件清单及档号划分,形成输变电工程档案类目,同时构建工程过程资料与档案类目的对应关系模型,为档案智能归集提供的有效的依据。建立工程文件自动分类匹配关系,工程资料归档前辅助组卷,在系统内通过档号配置实现自动分类;根据实际需要进行调整,实现工程档案文件智能归集和线上档案预组卷。
该系统还包括扫描识别模块;扫描识别模块用于对于已经生成纸质文件的工程资料采用扫描上传,采用OCR识别技术自动识别扫描后的文件,并同样以第一模板保存。
本发明实施例2提出的一种线上归集工程资料的系统,充分利用了信息化平台和技术优势,变革了传统重纸质工程档案轻电子档案的管理模式,形成了工程档案资料与工程建设项目同时策划、同时生成、同时核查、同时移交、同时考核管理机制,并依据国工程档案相关管理规定,构建了输变电工程过程文件与档案类目的关系模型,实现了工程过程文件与档案目录自动分类匹配、智能归集,从而降低了人工录入与核查的错误率,保证了数据准确可靠,提高了资料归档的工作效率,实现了来源可靠、程序规范、要素合规的电子文件,对于输变电工程资料的规范化和高效处理具有很好的实现成效与应用前景。
本发明实施例2提出的一种线上归集工程资料的系统,采用Ucinet软件构建收集工程资料的知识图谱,用于根据工程资料的相关性进行分组关联和相关性检索,提高了关联的准确性和相关性检索的效率。
本申请实施例提供的一种线上归集工程资料的系统中相关部分的说明可以参见本申请实施例1提供的一种线上归集工程资料的方法中对应部分的详细说明,在此不再赘述。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本申请实施例提供的上述技术方案中与现有技术中对应技术方案实现原理一致的部分并未详细说明,以免过多赘述。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制。对于所属领域的技术人员来说,在上述说明的基础上还可以做出其它不同形式的修改或变形。这里无需也无法对所有的实施方式予以穷举。在本发明的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims (10)

1.一种线上归集工程资料的方法,其特征在于,包括以下步骤:。
制定第一模板作为收集工程资料的数字化文件目录,实现工程资料在各责任主体间的流转;
对第一模板收集的工程资料设置电子签章和电子校验以保证工程资料的安全;
通过将收集工程资料转化为关键词矩阵的方式构建收集工程资料的知识图谱,用于根据工程资料的相关性进行分组关联和相关性检索;
构建知识图谱之后,按照预设规则对收集工程资料进行归档。
2.根据权利要求1所述的一种线上归集工程资料的方法,其特征在于,所述方法还包括:对于已经生成纸质文件的工程资料采用扫描上传,采用OCR识别技术自动识别扫描后的文件,并同样以第一模板保存。
3.根据权利要求1所述的一种线上归集工程资料的方法,其特征在于,所述第一模板包括工程资料的归档范围、归档方式、工程立项时间、可研费、设计费、竣工时间、监理单位、验收时间和验收资料。
4.根据权利要求1所述的一种线上归集工程资料的方法,其特征在于,所述对第一模板收集的工程资料设置电子签章的过程包括:记录签章人、印章名称和签章时间,用于保证工程资料的可追溯性;以及利用电子签章将含有数字签名的电子签章转化为与纸质文件盖章操作相同的可视效果。
5.根据权利要求1所述的一种线上归集工程资料的方法,其特征在于,所述构建收集工程资料的知识图谱的过程包括:
首先对以第一模板收集的工程资料进行数据清洗;
将清洗后的工程资料输入至Ucinet软件中,通过Ucinet软件将清洗后的工程资料转化为关键词矩阵,然后再以Excel的格式保存,最后再将关键词矩阵导入至Ucinet软件转换为Ucinet数据库格式;
Ucinet软件将以Ucinet数据库格式保存的工程资料可视化并生成共词网络简化图谱以及关键词共现网络定量指标。
6.根据权利要求1所述的一种线上归集工程资料的方法,其特征在于,所述按照预设规则对收集工程资料进行归档的过程包括:
按照输变电工程档案管理分卷要求,梳理应归档文件清单及档号划分,形成输变电工程档案类目,同时构建工程过程资料与档案类目的对应关系模型,为档案智能归集提供依据;
或者建立工程资料文件的自动分类匹配关系,工程资料归档前辅助组卷,在系统内通过档号配置实现自动分类。
7.根据权利要求6所述的一种线上归集工程资料的方法,其特征在于,所述方法还包括对不同粒度的组卷提供有效性验证依据数据,包括签章、内容、流转信息、流转时间的有效性证据提取。
8.一种线上归集工程资料的系统,其特征在于,包括制定模板模块、设置模块、构建模块和归档模块;
所述制定模板模块用于制定第一模板作为收集工程资料的数字化文件目录,实现工程资料在各责任主体间的流转;
所述设置模块用于对第一模板收集的工程资料设置电子签章和电子校验以保证工程资料的安全;
所述构建模块用于通过将收集工程资料转化为关键词矩阵的方式构建收集工程资料的知识图谱,用于根据工程资料的相关性进行分组关联和相关性检索;
所述归档模块用于构建知识图谱之后,按照预设规则对收集工程资料进行归档。
9.根据权利要求8所述的一种线上归集工程资料的系统,其特征在于,所述系统还包括扫描识别模块;
所述扫描识别模块用于对于已经生成纸质文件的工程资料采用扫描上传,采用OCR识别技术自动识别扫描后的文件,并同样以第一模板保存。
10.根据权利要求8所述的一种线上归集工程资料的系统,其特征在于,所述构建模块实现的过程包括:
首先对以第一模板收集的工程资料进行数据清洗;
将清洗后的工程资料输入至Ucinet软件中,通过Ucinet软件将清洗后的工程资料转化为关键词矩阵,然后再以Excel的格式保存,最后再将关键词矩阵导入至Ucinet软件转换为Ucinet数据库格式;
Ucinet软件将以Ucinet数据库格式保存的工程资料可视化并生成共词网络简化图谱以及关键词共现网络定量指标。
CN202210930040.0A 2022-08-03 2022-08-03 一种线上归集工程资料的方法和系统 Pending CN115422319A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210930040.0A CN115422319A (zh) 2022-08-03 2022-08-03 一种线上归集工程资料的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210930040.0A CN115422319A (zh) 2022-08-03 2022-08-03 一种线上归集工程资料的方法和系统

Publications (1)

Publication Number Publication Date
CN115422319A true CN115422319A (zh) 2022-12-02

Family

ID=84197344

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210930040.0A Pending CN115422319A (zh) 2022-08-03 2022-08-03 一种线上归集工程资料的方法和系统

Country Status (1)

Country Link
CN (1) CN115422319A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116756396A (zh) * 2023-06-29 2023-09-15 广东齐峰信息科技有限公司 基于知识图谱的数字档案管理系统及方法
CN117744788A (zh) * 2024-02-21 2024-03-22 贵州蓝梦工场科技有限公司 一种研发费用归集方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116756396A (zh) * 2023-06-29 2023-09-15 广东齐峰信息科技有限公司 基于知识图谱的数字档案管理系统及方法
CN116756396B (zh) * 2023-06-29 2023-12-22 广东齐峰信息科技有限公司 基于知识图谱的数字档案管理系统及方法
CN117744788A (zh) * 2024-02-21 2024-03-22 贵州蓝梦工场科技有限公司 一种研发费用归集方法及系统
CN117744788B (zh) * 2024-02-21 2024-08-06 贵州蓝梦工场科技有限公司 一种研发费用归集方法及系统

Similar Documents

Publication Publication Date Title
CN115422319A (zh) 一种线上归集工程资料的方法和系统
CN114117171B (zh) 一种基于赋能思维的工程档案智能收整方法及系统
CN103279542B (zh) 数据导入处理方法及数据处理装置
CN111767247A (zh) 一种工程资料实时监管的档案规范与同步形成控制平台
CN114003791B (zh) 基于深度图匹配的医疗数据元自动化分类方法及系统
CN102750370A (zh) 一种基于b/s结构的档案远程报送方法及装置
CN113190501A (zh) 水利水电工程质量验评电子文件形成及归档方法
CN104346438A (zh) 基于大数据数据管理服务系统
CN109766416A (zh) 一种新能源政策信息抽取方法及系统
CN115630621A (zh) 一种基于pdf财务数据报表的数据采集、处理的方法及系统
CN113902416A (zh) 建筑信息资产全过程的管理方法和相关设备
CN114792145A (zh) 一种基于知识图谱的标准数字化管理维护系统及方法
CN111680487B (zh) 实时在线校验归档文件的方法及设备
CN114254173A (zh) 一种档案管理系统及其管理方法
CN112200212A (zh) 一种基于人工智能的企业物资分类目录构建方法
CN114817139B (zh) 一种公证材料全无纸化自动归档编目编页码的技术方法
CN115688729A (zh) 一种输变电工程造价数据集成管理系统及其方法
CN114417859A (zh) 一种基于云化区块链技术的数据标准化方法及系统
CN115098585A (zh) 一种基于大数据的法律法规数据自动处理方法及系统
CN112686016A (zh) 一种用于工程管理文件电子化处理系统
CN113343661A (zh) 一种减刑假释文书自动生成方法及装置
CN113934907A (zh) 一种电网档案管理重构与档案价值挖掘方法和系统
LU504881B1 (en) Intelligent collection method and system for engineering archives based on enabling thinking
CN118277372B (zh) 一种电力客户数据清洗治理方法
CN108229928A (zh) 一种核销管理系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination