CN111950921B - 一种基于离线组网环境的多人协同评审方法 - Google Patents

一种基于离线组网环境的多人协同评审方法 Download PDF

Info

Publication number
CN111950921B
CN111950921B CN202010844283.3A CN202010844283A CN111950921B CN 111950921 B CN111950921 B CN 111950921B CN 202010844283 A CN202010844283 A CN 202010844283A CN 111950921 B CN111950921 B CN 111950921B
Authority
CN
China
Prior art keywords
data
review
content
expert
calculation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010844283.3A
Other languages
English (en)
Other versions
CN111950921A (zh
Inventor
王圣东
刘宝华
张科伟
翟永翠
杜乃瀚
陈端迎
武育
金逊
韩永磊
张桂平
李海滨
周昱君
李欧阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Jiangsu Jierui Information Technology Co ltd
Original Assignee
Jiangsu Jierui Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Jiangsu Jierui Information Technology Co ltd filed Critical Jiangsu Jierui Information Technology Co ltd
Priority to CN202010844283.3A priority Critical patent/CN111950921B/zh
Publication of CN111950921A publication Critical patent/CN111950921A/zh
Application granted granted Critical
Publication of CN111950921B publication Critical patent/CN111950921B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0631Resource planning, allocation, distributing or scheduling for enterprises or organisations
    • G06Q10/06311Scheduling, planning or task assignment for a person or group
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/103Workflow collaboration or project management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/105Human resources

Abstract

一种基于离线组网环境的多人协同评审方法,首先,将外部多批次数据源进行数据导入,通过分析数据集合的数据结构与关联,完成数据集成处理,将多个数据集融合为一个完整的结构化数据集;然后,根据不同评审专家的个人化属性,自动分析待评审数据集合的内容特征,与专家属性特征进行关联评估与自动匹配,实现评审内容的自动化分工;在评审过程中,在评审专家对数据进行审核与调整后,自动完成数据集成汇聚、数据关联计算和层级汇总计算;最后,对专家填写的评审意见进行分词与语义分析,提取文字内容中关键词和量化数据,并基于对内容属性的标识,对多人评审内容进行数据汇总计算与内容整合处理,自动生成评审结果报告。

Description

一种基于离线组网环境的多人协同评审方法
技术领域
本发明涉及多人协同评审技术领域,特别是一种基于离线组网环境的多人协同评审方法。
背景技术
针对政府、军队、公安、科研机构等保密业务环境,为满足移动性办公需要而构建的离线组网工作场景,需要按照相关管理要求,将内网环境数据批量导出后,再导入离线办公环境,从而具备离线环境的工作条件。对于面向大量数据和报表的评审工作任务来说,当评审对象的数据集合结构复杂,涉及表格类型多,数据量大,评审工作的有效组织和开展将变得更加困难,同时离线环境与内网环境的数据同步与版本控制也是制约其工作机制的重要阻力,为业务开展带来了非常大的工作负担与压力。
发明内容
本发明所要解决的技术问题是针对现有技术的不足,提供一种能够通过设计面向复杂数据集的数据同步集成与自动任务分工处理机制,实现针对离线环境下的多人数据评审工作高效协同开展和评审数据高效集成管理,根据业务特征设定语义分析模型,并与专家个人特征相匹配,从而实现任务自动分工,实现评审数据汇聚合成与报告自动生成的基于离线组网环境的多人协同评审方法。
本发明所要解决的技术问题是通过以下的技术方案来实现的。本发明是一种基于离线组网环境的多人协同评审方法,其步骤如下:
(1)对外部多批次数据源进行数据导入,通过分析数据集合的数据结构与关联,完成数据集成处理过程,将多个数据集融合为一个完整的结构化数据集;
(2)根据不同评审专家的业务、专业、经验的个人化属性,系统自动分析待评审数据集合的内容特征,与专家属性特征进行关联评估与自动匹配,实现评审内容的自动化分工;
(3)在评审过程中,评审专家对数据进行审核与调整,系统基于数据集结构和数据生成规则,自动完成数据集成汇聚、数据关联计算和层级汇总计算;
(4)对专家填写的评审意见进行分词与语义分析,提取文字内容中关键词和量化数据,并基于对内容属性的标识,对多人评审内容进行数据汇总计算与内容整合处理,自动生成评审结果报告;
(5)将评审报告和评审结果数据集进行导出与打印,完成离线工作环境下评审内容与结果的归档管理。
本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的基于离线组网环境的多人协同评审方法,在步骤(1)中,对外部多批次数据源的导入、集成与结构化融合处理,实现数据集合结构化评估分析框架,支撑任意规模数据集合的内容对比分析及数据版本标识,具体内容如下:
(1.1)复杂数据集合的结构标定
对于数据分析与评估业务场景下的大批量复杂数据评审对象,所涉及的数据集合结构复杂多样,在离网环境下的数据导入过程中,通过对辨识数据集合范围的辨识、定位与结构标定,满足复杂数据结构的多批次增量数据导入操作要求:
首先,对数据单元格、数据行、数据列、数据表、数据文件的数据内容进行定位标识;
然后,基于数据内容的定位标识,生成与内容对应的数据索引;
最后,辨识数据集合范围,完成对数据集合的结构性标定,实现数据集合范围与数据内容的精准定位;
(1.2)数据集合结构性分析
对于多文档、多表格样式、多字段的复杂数据集合,按照上述(1.1)步骤处理过程,完成评估数据包导入,及其所含数据文件结构与范围标定,进一步对数据内容进行结构性分析:
首先,针对数据包导入的数据内容,按照数据文件、数据表格、表格列范围、表格行范围、单元格范围逐级校验数据版本编号,并与数据库中数据版本进行对比验证;只有通过版本逻辑校验的数据,具备数据导入更新的合法性,对于版本关系异常的数据,汇总出异常数据清单,交由人工核验处理;
最后,基于数据内容结构性框架,由单元格、行列、表格到文件,自下而上开展数据差异对比分析,生成数据更新评估报告;
(1.3)数据结构化融合处理
基于单元格、行列数据、表格、文件进行多维度的数据对比分析结果,参考数据版本基准与数据更新策略,采用增量合并方式进行数据集合的更新与内容合并:
首先,对单元格级数据更新,通过版本校验和对比分析结果的核验,基于单元格定位对数据库中对应数据进行变更,变更操作只包含数据更新,同时更新单元格数据版本编号;
然后,对行数据进行批量变更,变更操作包含数据增加、数据更新、数据删除,同时更新行级数据版本编号;下一步对列数据进行更新,作为数据属性特征批量变更,变更操作只包含数据更新,同时更新列数据版本编号;
最后,变更整表数据,变更操作包含数据增加、数据更新、数据删除,同时更新表级数据版本编号。
本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的基于离线组网环境的多人协同评审方法,步骤(2)中,根据不同评审专家的个人化属性对评审内容自动化分工的处理,步骤如下:
(2.1)建立评审专家个人化特征集合
根据评审专家的行业背景、专业特长、所属单位、历史评审经验的信息,建立评审专家个人化特征集,包括以下内容:
(a)专家所属行业,包括航空、航天、船舶、电子、兵器;
(b)专业特长,包括材料、电子、机械结构、电力、动力、控制、通信;
(c)所属单位情况,包括单位名称、隶属集团、业务领域;
(d)历史评审经验,包括历史评审项目名称、历史评审专业领域、历史评审内容科目或类型;
针对上述特征,基于历史项目评审记录分项统计专家特征属性值;
(2.2)评审数据内容特征提取
根据评审数据集合与分类,对数据表与数据集合的内容进行特征提取,生成评审内容特征集合,具体特征提取包括以下内容:
(a)基于表级数据集合名称提取行业属性特征;
(b)基于行级数据项名称提取专业属性特征;
(c)基于数据列属性名称提取专业属性特征;
(d)基于数据集合中报送单位名称提取上报单位属性特征;
(2.3)评审内容自动化分工
首先,将待评审数据集合的内容特征按照行业属性,与专家属性特征进行关联性匹配,并基于相关度排序生成评审专家匹配清单;
其次,将行数据集合的内容特征按照专业属性,与专家属性特征进行关联性匹配,并基于相关度排序生成评审专家匹配清单;将数据集合报送单位属性,与专家所属单位属性进行关联性匹配,并基于相关度排序生成评审专家匹配清单;
最后,按照行业属性高于专业属性的优先级原则,对已完成匹配的行业级专家清单和专业级专家清单进行二次过滤排序,对于单位属性相关性进行反向排斥处理,最终形成专家与数据内容的匹配关系推荐,完成评审内容的自动化分工。
本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的基于离线组网环境的多人协同评审方法,步骤(3)中,建立数据集结构和数据生成规则,对评审专家数据审核结果进行自动数据集成汇聚、数据关联计算和层级汇总计算的处理,步骤如下:
(3.1)建立数据集结构和数据生成规则
根据评审业务对象特点,对数据集合进行结构化整理,对于具有数据层级特征以及数据分级汇总关系的数据子集,设定数据汇总计算关系;对于数据具有关联性,以及数据关联计算的数据项,设定数据关联计算规则;将上述数据关联计算规则绑定到数据表的有关数据项上,形成数据生成规则配置库;
(3.2)数据自动集成与计算
对于数据表中绑定数据生成规则的数据项,当专家评估过程中对所引用计算的数据单元进行内容审查调整操作后,关联计算的数据项依据数据计算规则进行自动重新计算,并将计算结果存储在数据库中,具体规则如下:
(a)对于层级汇总计算项,当子项数据变更后,自动触发父级各层级汇总数据的重新计算;
(b)对于跨数据项引用的关联计算,当引用对象数据变更后,自动触发关联计算数据项的重新计算;
(c)对于引用公式进行计算的数据项,当业务条件改变导致公式变化或参数调整,自动触发计算规则变更,系统重新计算数据项内容;
(d)在多人协同工作条件下,因交叉数据引用关系影响,导致数据计算规则的并发变更冲突情况,系统自动根据数据生成规则的数据项约束关系,按优先级进行数据项锁定与依次变更,同时将变更情况同步给相关的多位协同工作人员。
本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的基于离线组网环境的多人协同评审方法,步骤(4)中,多人评审内容整合与报告自动生成步骤如下:
(4.1)建立语义模型
根据评审报告结构和内容要求,分析报告关键内容的组织形式,采用框架语义表示方法,针对评审意见的文字形式,建立语义表示模型:
首先,设计采用领域、意图和属性三级结构来表示评审意见文本的语义结构;
然后,构建基于实体词语的语义知识库和训练样本库,依照语义结构模型对语义角色标注;
最后,通过样本集的训练过程,建立识别基本文本单元的语义模型和进行文法分析的语言模型;
(4.2)专家评审意见分析
首先,基于数据评审对象的复杂性结构,设计多层级评审意见结构,包括数据单元级评审意见、数据表级评审意见、数据文件级评审意见、数据包级评审意见;
然后,针对各级评审意见,自下而上进行文本分析,按照语义模型对评审意见完成分析与转换,输出框架语义表示内容;
(4.3)评审内容整合
按照数据结构性关系,从数据层级维度、数据属性维度、时间维度,对评审意见内容进行分类归纳与整合,辨识同类数据项进行分级汇总计算,形成自下而上的多级评审内容结构和相应层级数据汇总结果;
(4.4)评审报告生成
首先,根据不同类型评审项目,设置相应的报告文档结构及关键内容语义结构;
然后,将评审内容属性与评审报告内容结构属性进行关联匹配;
最后,将评审内容文字装载到报告模板中,输出完整的评审报告文档。
本发明所要解决的技术问题还可以通过以下的技术方案来进一步实现,对于以上所述的基于离线组网环境的多人协同评审方法,在步骤(5)中,对评审报告和评审结果数据集进行导出与打印,完成离线工作环境下评审内容与结果的归档管理,具体过程为:
(1)对离线组网环境下的评审结果数据集进行版本标识后,可以数据包或文档包的形式进行整体数据导出,或将部分数据集合经过筛选后打包导出;
(2)通过软件系统的功能,可以对数据表、数据文件、批量数据文件或数据包的内容,进行格式化打印输出;
(3)离线环境导出的数据文件或数据包,需要同步导入内网办公环境,基于版本标识的数据合并与整理后,完成数据归档处理。
与现有技术相比,本发明设计并实现了基于离线组网环境的多人协同评审方法,面对离线、移动办公环境下海量数据的协同评审工作需要,能够灵活装载、集成、调用数据资源,通过构建数据集合结构与数据内容特征,实现海量多维数据集的多人评审分工、评审结果合成与评审报告生成,有效地解决离线环境下系统资源高效集成与应用的问题,降低评审内容分工、归集与整合的复杂度及工作量,实现一种针对离线环境海量数据评审工作支撑与管理的通用化系统设计,其显著优点:
(1)创新使用数据集合结构标定技术,对多维度数据内容进行定位标定,从而支持基于数据结构化定位的内容分析、数据内容集成与版本管理,大大提高数据内容处理的精细化程度,增强复杂结构数据集合的可操作性、便捷性;
(2)创新设计面向数据结构化的内容特征提取框架,对复杂数据集合开展多维度下的特征提取,使评审内容分工可以在多个维度逐级细化,实现更加精细精准的数据单元分工;
(3)创新使用数据生成规则定义,并于数据结构定位相结合,在多人协同数据处理时,实现数据关联依赖的有效冲突检测与控制;
(4)在文本语义框架基础上,结合数据计算规则,完成整体报告文本的结构化生成与内容合成,降低文档内容编辑与数据汇总计算难度。
附图说明
图1为本发明的一种示意框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
参照图1,一种基于离线组网环境的多人协同评审方法,其步骤如下:
第一步、复杂数据集合结构化集成处理:
对外部多批次数据源的导入、集成与结构化融合处理,实现数据集合结构化评估分析框架,支撑任意规模数据集合的内容对比分析及数据版本标识等系统功能,详细的步骤如下:
(1)复杂数据集合的结构标定:对于数据分析与评估业务场景下的大批量复杂数据评审对象,所涉及的数据集合结构复杂多样,在离网环境下的数据导入过程中,通过对辨识数据集合范围的辨识、定位与结构标定,满足复杂数据结构的多批次增量数据导入操作要求;具体处理步骤如下:
(a)对数据单元格、数据行、数据列、数据表、数据文件等多个维度的数据内容进行定位标识;
(b)基于数据内容的定位标识,生成与内容对应的数据索引;
(c)辨识数据集合范围,完成对数据集合的结构性标定,实现数据集合范围与数据内容的精准定位;
(2)数据集合结构性分析:对于多文档、多表格样式、多字段的复杂数据集合,按照上述(1)环节处理过程,完成评估数据包导入,及其所含数据文件结构与范围标定,进一步对数据内容进行结构性分析;具体处理步骤如下:
(a)针对数据包导入的数据内容,按照数据文件、数据表格、表格列范围、表格行范围、单元格范围逐级校验数据版本编号,并与数据库中数据版本进行对比验证;
(b)将通过版本逻辑校验的数据进行导入更新,对于版本关系异常的数据,汇总出异常数据清单,交由人工核验处理;
(c)基于数据内容结构性框架,由单元格、行列、表格到文件,自下而上开展数据差异对比分析,生成数据更新评估报告;
(3)数据结构化融合处理:基于单元格、行列数据、表格、文件等多维度的数据对比分析结果,参考数据版本基准与数据更新策略,采用增量合并方式进行数据集合的更新与内容合并;具体处理步骤如下:
(a)对单元格级数据更新,通过版本校验和对比分析结果的核验,基于单元格定位对数据库中对应数据进行变更,变更操作只包含数据更新,同时更新单元格数据版本编号;
(b)对行数据进行批量变更,变更操作包含数据增加、数据更新、数据删除,同时更新行级数据版本编号;
(c)对列数据进行更新,作为数据属性特征批量变更,变更操作只包含数据更新,同时更新列数据版本编号;
(d)变更整表数据,变更操作包含数据增加、数据更新、数据删除,同时更新表级数据版本编号;
第二步、评审数据内容自动分工处理:
根据不同评审专家的业务、专业、经验等个人化属性,系统自动分析待评审数据集合的内容特征,与专家属性特征进行关联评估与自动匹配,实现评审内容的自动化分工,详细步骤如下所示:
(1) 建立评审专家个人化特征集合:根据评审专家的行业背景、专业特长、所属单位、历史评审经验等信息,建立评审专家个人化特征集,主要包括以下内容:
(a)专家所属行业,包括航空、航天、船舶、电子、兵器等;
(b)专业特长,包括材料、电子、机械结构、电力、动力、控制、通信等;
(c)所属单位情况,包括单位名称、隶属集团、业务领域等;
(d)历史评审经验,包括历史评审项目名称、历史评审专业领域、历史评审内容科目或类型等;
针对上述特征,基于历史项目评审记录分项统计专家特征属性值;
(2)评审数据内容特征提取:根据评审数据集合与分类,对数据表与数据集合的内容进行特征提取,生成评审内容特征集合,具体特征提取包括以下内容:
(a)基于表级数据集合名称提取行业属性特征;
(b)基于行级数据项名称提取专业属性特征;
(c)基于数据列属性名称提取专业属性特征;
(d)基于数据集合中报送单位名称提取上报单位属性特征;
(3)评审内容自动化分工:
首先,将待评审数据集合的内容特征按照行业属性,与专家属性特征进行关联性匹配,并基于相关度排序生成评审专家匹配清单;
其次,将行数据集合的内容特征按照专业属性,与专家属性特征进行关联性匹配,并基于相关度排序生成评审专家匹配清单;将数据集合报送单位属性,与专家所属单位属性进行关联性匹配,并基于相关度排序生成评审专家匹配清单;
最后按照行业属性高于专业属性的优先级原则,对已完成匹配的行业级专家清单和专业级专家清单进行二次过滤排序,对于单位属性相关性进行反向排斥处理,最终形成专家与数据内容的匹配关系推荐,完成评审内容的自动化分工;
第三步、评审结果数据汇聚与汇总计算:
在评审过程中,评审专家对数据进行审核与调整,系统基于数据集结构和数据生成规则,自动完成数据集成汇聚、数据关联计算和层级汇总计算,详细步骤如下所示:
(1)建立数据集结构和数据生成规则:根据评审业务对象特点,对数据集合进行结构化整理,对于具有数据层级特征以及数据分级汇总关系的数据子集,设定数据汇总计算关系;对于数据具有关联性,以及数据关联计算的数据项,设定数据关联计算规则;将上述数据关联计算规则绑定到数据表的有关数据项上,形成数据生成规则配置库;
(2)数据自动集成与计算:对于数据表中绑定数据生成规则的数据项,当专家评估过程中对所引用计算的数据单元进行内容审查调整操作后,关联计算的数据项依据数据计算规则进行自动重新计算,并将计算结果存储在数据库中,具体规则如下:
(a)对于层级汇总计算项,当子项数据变更后,自动触发父级各层级汇总数据的重新计算;
(b)对于跨数据项引用的关联计算,当引用对象数据变更后,自动触发关联计算数据项的重新计算;
(c)对于引用公式进行计算的数据项,当业务条件改变导致公式变化或参数调整,自动触发计算规则变更,系统重新计算数据项内容;
(d)在多人协同工作条件下,因交叉数据引用关系影响,导致数据计算规则的并发变更冲突情况,系统自动根据数据生成规则的数据项约束关系,按优先级进行数据项锁定与依次变更,同时将变更情况同步给相关的多位协同工作人员;
第四步、评审报告自动生成:
对专家填写的评审意见进行分词与语义分析,提取文字内容中关键词和量化数据,并基于对内容属性的标识,对多人评审内容进行数据汇总计算与内容整合处理,自动生成评审结果报告,详细步骤如下所示:
(1)建立语义模型:根据评审报告结构和内容要求,分析报告关键内容的组织形式,采用框架语义表示方法,针对评审意见的文字形式,建立语义表示模型。首先设计采用领域(domain)、意图(intent)和属性(slots)三级结构来表示评审意见文本的语义结构;然后构建基于实体词语的语义知识库和训练样本库,依照语义结构模型对语义角色标注;最后通过样本集的训练过程,建立识别基本文本单元的语义模型和进行文法分析的语言模型;
(2)专家评审意见分析:首先,基于数据评审对象的复杂性结构,设计多层级评审意见结构,包括数据单元级评审意见、数据表级评审意见、数据文件级评审意见、数据包级评审意见。然后针对各级评审意见,自下而上进行文本分析,按照语义模型对评审意见完成分析与转换,输出框架语义表示内容;
(3)评审内容整合:按照数据结构性关系,从数据层级维度、数据属性维度、时间维度等方面,对评审意见内容进行分类归纳与整合,辨识同类数据项进行分级汇总计算,形成自下而上的多级评审内容结构和相应层级数据汇总结果;
(4)评审报告生成:首先根据不同类型评审项目,设置相应的报告文档结构及关键内容语义结构;然后将评审内容属性与评审报告内容结构属性进行关联匹配;最终将评审内容文字装载到报告模板中,输出完整的评审报告文档;
第五步、评审结果输出与打印:
将评审报告和评审结果数据集进行导出与打印,完成离线工作环境下评审内容与结果的归档管理;具体处理过程为:
(1)对离线组网环境下的评审结果数据集进行版本标识后,可以数据包或文档包的形式进行整体数据导出,或将部分数据集合经过筛选后打包导出;
(2)通过软件系统的功能,可以对数据表、数据文件、批量数据文件或数据包的内容,进行格式化打印输出;
(3)离线环境导出的数据文件或数据包,需要同步导入内网办公环境,基于版本标识的数据合并与整理后,完成数据归档处理。
本申请的基于离线组网环境的多人协同评审方法,对于离线环境与内网环境的跨网数据交换场景,能够解决多批次多版本数据同步与数据集成问题的难点问题,减轻了复杂数据结构集合的版本冲突检测、数据合并校验、数据内容分工等处理环节工作量,通过报告内容生成技术手段,大大减轻了评审人员工作压力,同时也提高业务管理人员的工作效率、降低工作量;另外,基于数据生成规则的评审数据集成汇聚与计算处理方法使数据审查准确性大大提升,数据结构化标定的使用,大大增强数据处理过程的可靠性、扩展性、科学性,体现的数据管理思路与手段可以扩展应用于同类型数据管理与评估分析应用场景,具有较好的推广性;
同时,本申请通过采用结构化数据的多版本管理及数据同步与集成技术,将离线环境数据与在网数据进行有效集成,避免数据版本混乱、数据合并工作量大等问题;基于智能文本分析与内容推荐处理的评审内容自动化分工及评审结果集成处理,有效地解决了大数据量条件下多人协同评审任务处理的繁琐工作量问题;在离线组网环境下,面对复杂数据集的手动操作困难、效率低下、手段单一等问题,利用软件系统降低人工操作频度,将数据最大程度的结构化处理,并利用数据关系规则进行自动化关联计算与层级汇总;该方法已经应用于大型数据评审软件系统,实现了在复杂业务环境下的多人协同数据处理任务支撑。
本申请的优点在于:
(1)创新使用数据集合结构标定技术,对多维度数据内容进行定位标定,从而支持基于数据结构化定位的内容分析、数据内容集成与版本管理,大大提高数据内容处理的精细化程度,增强复杂结构数据集合的可操作性、便捷性;
(2)创新设计面向数据结构化的内容特征提取框架,对复杂数据集合开展多维度下的特征提取,使评审内容分工可以在多个维度逐级细化,实现更加精细精准的数据单元分工;
(3)创新使用数据生成规则定义,并于数据结构定位相结合,在多人协同数据处理时,实现数据关联依赖的有效冲突检测与控制;
(4)在文本语义框架基础上,结合数据计算规则,完成整体报告文本的结构化生成与内容合成,降低文档内容编辑与数据汇总计算难度。

Claims (1)

1.一种基于离线组网环境的多人协同评审方法,其特征在于:其步骤如下:
(1)对外部多批次数据源进行数据导入,通过分析数据集合的数据结构与关联,完成数据集成处理过程,将多个数据集融合为一个完整的结构化数据集;
(2)根据不同评审专家的业务、专业、经验的个人化属性,系统自动分析待评审数据集合的内容特征,与专家属性特征进行关联评估与自动匹配,实现评审内容的自动化分工;
(3)在评审过程中,评审专家对数据进行审核与调整,系统基于数据集结构和数据生成规则,自动完成数据集成汇聚、数据关联计算和层级汇总计算;
(4)对专家填写的评审意见进行分词与语义分析,提取文字内容中关键词和量化数据,并基于对内容属性的标识,对多人评审内容进行数据汇总计算与内容整合处理,自动生成评审结果报告;
(5)将评审报告和评审结果数据集进行导出与打印,完成离线工作环境下评审内容与结果的归档管理;
在步骤(1)中,对外部多批次数据源的导入、集成与结构化融合处理,实现数据集合结构化评估分析框架,支撑任意规模数据集合的内容对比分析及数据版本标识,具体内容如下:
(1.1)复杂数据集合的结构标定
对于数据分析与评估业务场景下的大批量复杂数据评审对象,所涉及的数据集合结构复杂多样,在离网环境下的数据导入过程中,通过对辨识数据集合范围的辨识、定位与结构标定,满足复杂数据结构的多批次增量数据导入操作要求:
首先,对数据单元格、数据行、数据列、数据表、数据文件的数据内容进行定位标识;
然后,基于数据内容的定位标识,生成与内容对应的数据索引;
最后,辨识数据集合范围,完成对数据集合的结构性标定,实现数据集合范围与数据内容的精准定位;
(1.2)数据集合结构性分析
对于多文档、多表格样式、多字段的复杂数据集合,按照上述(1.1)步骤处理过程,完成评估数据包导入,及其所含数据文件结构与范围标定,进一步对数据内容进行结构性分析:
首先,针对数据包导入的数据内容,按照数据文件、数据表格、表格列范围、表格行范围、单元格范围逐级校验数据版本编号,并与数据库中数据版本进行对比验证;只有通过版本逻辑校验的数据,具备数据导入更新的合法性,对于版本关系异常的数据,汇总出异常数据清单,交由人工核验处理;
最后,基于数据内容结构性框架,由单元格、行列、表格到文件,自下而上开展数据差异对比分析,生成数据更新评估报告;
(1.3)数据结构化融合处理
基于单元格、行列数据、表格、文件进行多维度的数据对比分析结果,参考数据版本基准与数据更新策略,采用增量合并方式进行数据集合的更新与内容合并:
首先,对单元格级数据更新,通过版本校验和对比分析结果的核验,基于单元格定位对数据库中对应数据进行变更,变更操作只包含数据更新,同时更新单元格数据版本编号;
然后,对行数据进行批量变更,变更操作包含数据增加、数据更新、数据删除,同时更新行级数据版本编号;下一步对列数据进行更新,作为数据属性特征批量变更,变更操作只包含数据更新,同时更新列数据版本编号;
最后,变更整表数据,变更操作包含数据增加、数据更新、数据删除,同时更新表级数据版本编号;
步骤(2)中,根据不同评审专家的个人化属性对评审内容自动化分工的处理,步骤如下:
(2.1)建立评审专家个人化特征集合
根据评审专家的行业背景、专业特长、所属单位、历史评审经验的信息,建立评审专家个人化特征集,包括以下内容:
(a)专家所属行业,包括航空、航天、船舶、电子、兵器;
(b)专业特长,包括材料、电子、机械结构、电力、动力、控制、通信;
(c)所属单位情况,包括单位名称、隶属集团、业务领域;
(d)历史评审经验,包括历史评审项目名称、历史评审专业领域、历史评审内容科目或类型;
针对上述特征,基于历史项目评审记录分项统计专家特征属性值;
(2.2)评审数据内容特征提取
根据评审数据集合与分类,对数据表与数据集合的内容进行特征提取,生成评审内容特征集合,具体特征提取包括以下内容:
(a)基于表级数据集合名称提取行业属性特征;
(b)基于行级数据项名称提取专业属性特征;
(c)基于数据列属性名称提取专业属性特征;
(d)基于数据集合中报送单位名称提取上报单位属性特征;
(2.3)评审内容自动化分工
首先,将待评审数据集合的内容特征按照行业属性,与专家属性特征进行关联性匹配,并基于相关度排序生成评审专家匹配清单;
其次,将行数据集合的内容特征按照专业属性,与专家属性特征进行关联性匹配,并基于相关度排序生成评审专家匹配清单;将数据集合报送单位属性,与专家所属单位属性进行关联性匹配,并基于相关度排序生成评审专家匹配清单;
最后,按照行业属性高于专业属性的优先级原则,对已完成匹配的行业级专家清单和专业级专家清单进行二次过滤排序,对于单位属性相关性进行反向排斥处理,最终形成专家与数据内容的匹配关系推荐,完成评审内容的自动化分工;
步骤(3)中,建立数据集结构和数据生成规则,对评审专家数据审核结果进行自动数据集成汇聚、数据关联计算和层级汇总计算的处理,步骤如下:
(3.1)建立数据集结构和数据生成规则
根据评审业务对象特点,对数据集合进行结构化整理,对于具有数据层级特征以及数据分级汇总关系的数据子集,设定数据汇总计算关系;对于数据具有关联性,以及数据关联计算的数据项,设定数据关联计算规则;将上述数据关联计算规则绑定到数据表的有关数据项上,形成数据生成规则配置库;
(3.2)数据自动集成与计算
对于数据表中绑定数据生成规则的数据项,当专家评估过程中对所引用计算的数据单元进行内容审查调整操作后,关联计算的数据项依据数据计算规则进行自动重新计算,并将计算结果存储在数据库中,具体规则如下:
(a)对于层级汇总计算项,当子项数据变更后,自动触发父级各层级汇总数据的重新计算;
(b)对于跨数据项引用的关联计算,当引用对象数据变更后,自动触发关联计算数据项的重新计算;
(c)对于引用公式进行计算的数据项,当业务条件改变导致公式变化或参数调整,自动触发计算规则变更,系统重新计算数据项内容;
(d)在多人协同工作条件下,因交叉数据引用关系影响,导致数据计算规则的并发变更冲突情况,系统自动根据数据生成规则的数据项约束关系,按优先级进行数据项锁定与依次变更,同时将变更情况同步给相关的多位协同工作人员;
步骤(4)中,多人评审内容整合与报告自动生成步骤如下:
(4.1)建立语义模型
根据评审报告结构和内容要求,分析报告关键内容的组织形式,采用框架语义表示方法,针对评审意见的文字形式,建立语义表示模型:
首先,设计采用领域、意图和属性三级结构来表示评审意见文本的语义结构;
然后,构建基于实体词语的语义知识库和训练样本库,依照语义结构模型对语义角色标注;
最后,通过样本集的训练过程,建立识别基本文本单元的语义模型和进行文法分析的语言模型;
(4.2)专家评审意见分析
首先,基于数据评审对象的复杂性结构,设计多层级评审意见结构,包括数据单元级评审意见、数据表级评审意见、数据文件级评审意见、数据包级评审意见;
然后,针对各级评审意见,自下而上进行文本分析,按照语义模型对评审意见完成分析与转换,输出框架语义表示内容;
(4.3)评审内容整合
按照数据结构性关系,从数据层级维度、数据属性维度、时间维度,对评审意见内容进行分类归纳与整合,辨识同类数据项进行分级汇总计算,形成自下而上的多级评审内容结构和相应层级数据汇总结果;
(4.4)评审报告生成
首先,根据不同类型评审项目,设置相应的报告文档结构及关键内容语义结构;
然后,将评审内容属性与评审报告内容结构属性进行关联匹配;
最后,将评审内容文字装载到报告模板中,输出完整的评审报告文档;
在步骤(5)中,对评审报告和评审结果数据集进行导出与打印,完成离线工作环境下评审内容与结果的归档管理,具体过程为:
(1)对离线组网环境下的评审结果数据集进行版本标识后,可以数据包或文档包的形式进行整体数据导出,或将部分数据集合经过筛选后打包导出;
(2)通过软件系统的功能,可以对数据表、数据文件、批量数据文件或数据包的内容,进行格式化打印输出;
(3)离线环境导出的数据文件或数据包,需要同步导入内网办公环境,基于版本标识的数据合并与整理后,完成数据归档处理。
CN202010844283.3A 2020-08-20 2020-08-20 一种基于离线组网环境的多人协同评审方法 Active CN111950921B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010844283.3A CN111950921B (zh) 2020-08-20 2020-08-20 一种基于离线组网环境的多人协同评审方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010844283.3A CN111950921B (zh) 2020-08-20 2020-08-20 一种基于离线组网环境的多人协同评审方法

Publications (2)

Publication Number Publication Date
CN111950921A CN111950921A (zh) 2020-11-17
CN111950921B true CN111950921B (zh) 2023-12-12

Family

ID=73358930

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010844283.3A Active CN111950921B (zh) 2020-08-20 2020-08-20 一种基于离线组网环境的多人协同评审方法

Country Status (1)

Country Link
CN (1) CN111950921B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112925790A (zh) * 2021-03-09 2021-06-08 网易(杭州)网络有限公司 数据管理方法及装置、电子设备、存储介质
CN113111633A (zh) * 2021-04-23 2021-07-13 广东电网有限责任公司 电网评审意见的在线编辑方法、系统、终端和存储介质
CN113781014B (zh) * 2021-09-26 2023-06-06 广域铭岛数字科技有限公司 一种涂装色差管理方法、系统、介质及终端
CN114386795A (zh) * 2021-12-28 2022-04-22 中国电子技术标准化研究院华东分院 一种基于评审任务的multi-agent双随机分发的方法和系统
CN115630929A (zh) * 2022-12-21 2023-01-20 广东知得失网络科技有限公司 一种知识产权信息统计分析方法及系统
CN116342074B (zh) * 2023-05-29 2023-08-15 鼎信数智技术集团股份有限公司 一种工程项目咨询专家库人才匹配服务系统

Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847221A (zh) * 2009-03-23 2010-09-29 浙江新能量科技有限公司 用于评标打分卡智能识别的方法及其系统
CN103136624A (zh) * 2011-11-29 2013-06-05 北京建龙重工集团有限公司 工程项目招标、投标、评标的在线管理方法
CN104980498A (zh) * 2015-05-28 2015-10-14 浙江工业大学 基于移动自组网络的广告信息推送分享系统
CN105512866A (zh) * 2016-02-24 2016-04-20 湖南财经工业职业技术学院 一种基于云平台的人力资源多样化智能管理系统
CN107423953A (zh) * 2017-07-27 2017-12-01 山东睿新通信技术有限公司 一种无线网络规划设计项目智能审核方法、系统
CN108345991A (zh) * 2018-01-31 2018-07-31 国网山东省电力公司经济技术研究院 一种融合电网多源信息的可研评审系统及评审方法
CN109377178A (zh) * 2018-10-23 2019-02-22 国网江苏省电力有限公司经济技术研究院 电网技改大修项目电子化评审系统及评审方法
CN109783505A (zh) * 2019-01-25 2019-05-21 上海创景信息科技有限公司 利用可视化控件实现离线评审的方法和系统及介质
CN109919582A (zh) * 2019-03-16 2019-06-21 长沙曙通信息科技有限公司 一种项目评审专家库管理系统设计方法
CN110009309A (zh) * 2019-04-11 2019-07-12 国网河北省电力有限公司物资分公司 电力物资资格预审的结构化评审方法及评审装置
KR102009132B1 (ko) * 2019-03-15 2019-08-19 주식회사 위즈덤그룹 빅데이터 온라인 공유플랫폼 및 이를 이용한 일자리 매칭시스템
CN110276520A (zh) * 2019-05-15 2019-09-24 阿里巴巴集团控股有限公司 项目案件筛选方法以及装置
WO2019204616A1 (en) * 2018-04-18 2019-10-24 Fisher-Rosemount Systems, Inc. Quality review management system
CN110533391A (zh) * 2019-09-02 2019-12-03 苏州国泰新点软件有限公司 一种电子评标方法、装置、服务器和介质
CN110955168A (zh) * 2019-12-11 2020-04-03 国网甘肃省电力公司检修公司 一种基于输变电设备的智能巡检管理方法
CN111131433A (zh) * 2019-12-20 2020-05-08 厦门瑞为信息技术有限公司 基于云边端协同的访客管理系统及管理方法
CN111127244A (zh) * 2018-11-01 2020-05-08 国网江苏电力设计咨询有限公司 输变电工程三维智能辅助评审系统及方法
CN111222734A (zh) * 2018-11-27 2020-06-02 中国石油天然气股份有限公司 应急管理审核方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040143489A1 (en) * 2003-01-20 2004-07-22 Rush-Presbyterian - St. Luke's Medical Center System and method for facilitating a performance review process
US7596594B2 (en) * 2004-09-02 2009-09-29 Yahoo! Inc. System and method for displaying and acting upon email conversations across folders
US20170154313A1 (en) * 2015-11-30 2017-06-01 Linkedin Corporation Personalized job posting presentation based on member data

Patent Citations (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847221A (zh) * 2009-03-23 2010-09-29 浙江新能量科技有限公司 用于评标打分卡智能识别的方法及其系统
CN103136624A (zh) * 2011-11-29 2013-06-05 北京建龙重工集团有限公司 工程项目招标、投标、评标的在线管理方法
CN104980498A (zh) * 2015-05-28 2015-10-14 浙江工业大学 基于移动自组网络的广告信息推送分享系统
CN105512866A (zh) * 2016-02-24 2016-04-20 湖南财经工业职业技术学院 一种基于云平台的人力资源多样化智能管理系统
CN107423953A (zh) * 2017-07-27 2017-12-01 山东睿新通信技术有限公司 一种无线网络规划设计项目智能审核方法、系统
CN108345991A (zh) * 2018-01-31 2018-07-31 国网山东省电力公司经济技术研究院 一种融合电网多源信息的可研评审系统及评审方法
WO2019204616A1 (en) * 2018-04-18 2019-10-24 Fisher-Rosemount Systems, Inc. Quality review management system
CN109377178A (zh) * 2018-10-23 2019-02-22 国网江苏省电力有限公司经济技术研究院 电网技改大修项目电子化评审系统及评审方法
CN111127244A (zh) * 2018-11-01 2020-05-08 国网江苏电力设计咨询有限公司 输变电工程三维智能辅助评审系统及方法
CN111222734A (zh) * 2018-11-27 2020-06-02 中国石油天然气股份有限公司 应急管理审核方法及系统
CN109783505A (zh) * 2019-01-25 2019-05-21 上海创景信息科技有限公司 利用可视化控件实现离线评审的方法和系统及介质
KR102009132B1 (ko) * 2019-03-15 2019-08-19 주식회사 위즈덤그룹 빅데이터 온라인 공유플랫폼 및 이를 이용한 일자리 매칭시스템
CN109919582A (zh) * 2019-03-16 2019-06-21 长沙曙通信息科技有限公司 一种项目评审专家库管理系统设计方法
CN110009309A (zh) * 2019-04-11 2019-07-12 国网河北省电力有限公司物资分公司 电力物资资格预审的结构化评审方法及评审装置
CN110276520A (zh) * 2019-05-15 2019-09-24 阿里巴巴集团控股有限公司 项目案件筛选方法以及装置
CN110533391A (zh) * 2019-09-02 2019-12-03 苏州国泰新点软件有限公司 一种电子评标方法、装置、服务器和介质
CN110955168A (zh) * 2019-12-11 2020-04-03 国网甘肃省电力公司检修公司 一种基于输变电设备的智能巡检管理方法
CN111131433A (zh) * 2019-12-20 2020-05-08 厦门瑞为信息技术有限公司 基于云边端协同的访客管理系统及管理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
《基于局域网的网络评审管理系统设计》;张莉莉,胡晓林,苏芳,赵显亮,楚佳,刘威,孙晓艳,桂春梅;《医院数字化》;第34卷(第8期);61-63 *
《科技项目局域网专家评审方式浅析》;吴达, 李光文, 张明;《科学学与科学技术管理》;15-16 *

Also Published As

Publication number Publication date
CN111950921A (zh) 2020-11-17

Similar Documents

Publication Publication Date Title
CN111950921B (zh) 一种基于离线组网环境的多人协同评审方法
CN110851667B (zh) 一种多源头大量数据的整合分析方法及工具
EP3654198A1 (en) Conversational database analysis
KR101505858B1 (ko) 대용량 데이터를 용이하게 분석하기 위하여 테이블 관계 및 참조의 템플릿을 검색하여 제공하는 템플릿 기반 온라인 분석보고서 작성 지원 시스템
CN110389950B (zh) 一种快速运行的大数据清洗方法
CN108446391A (zh) 数据的处理方法、装置、电子设备和计算机可读介质
CN105912594A (zh) Sql语句处理方法和系统
CN111680029A (zh) 基于数据标准系统落标的优化管理方法
CN110765233A (zh) 基于深度挖掘和知识管理技术的智能信息检索服务系统
CN116384889A (zh) 基于自然语言处理技术的情报大数据智能分析方法
Duke et al. Data storage architectures to accelerate chemical discovery: data accessibility for individual laboratories and the community
EP2000927A1 (en) Apparatus and method for abstracting data processing logic in a report
CN109063063B (zh) 基于多源数据的数据处理方法及装置
CN111046059A (zh) 基于分布式数据库集群的低效sql语句分析方法及系统
CN106682107B (zh) 数据库表关联关系确定方法及装置
CN112967759B (zh) 基于内存堆栈技术的dna物证鉴定str分型比对方法
CN110413602B (zh) 一种分层清洗式大数据清洗方法
CN114185875A (zh) 一种基于云计算的大数据统一分析处理系统
CN114004575A (zh) 一种个性化招聘系统及实现招聘系统个性化的方法
Amin et al. Development of Star-Schema Model for Lecturer Performance in Research Activities
CN113742498A (zh) 一种知识图谱的构建更新方法
Prasad et al. Text analytics to data warehousing
Mouyassir et al. Business Intelligence Model to analyze Social Media through Big Data analytics
CN116110499B (zh) 基于生物学的分类计算模型的元件库系统
Xie et al. Design and Implementation of Data Mining in Information Management System

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant