CN115994713B - 一种基于多源数据的操作训练效果评估方法及系统 - Google Patents
一种基于多源数据的操作训练效果评估方法及系统 Download PDFInfo
- Publication number
- CN115994713B CN115994713B CN202310279085.0A CN202310279085A CN115994713B CN 115994713 B CN115994713 B CN 115994713B CN 202310279085 A CN202310279085 A CN 202310279085A CN 115994713 B CN115994713 B CN 115994713B
- Authority
- CN
- China
- Prior art keywords
- data
- video
- source
- manual input
- equipment
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开一种基于多源数据的操作训练效果评估方法及系统,涉及训练评估领域,该方法包括:获取操作训练过程中的操作视频、装备日志和人工录入信息;将待评估视频数据输入基于操作视频的单源效果评估模型,获得视频评分;将待评估日志数据输入基于装备日志的单源效果评估模型,获得日志评分;将人工录入信息输入基于人工录入信息的单源效果评估模型,获得人工录入评分;对视频评分、装备评分和人工录入评分进行数据源一致性评估;将通过数据源一致性评估的评分输入多源决策融合模型,得到评估结果分数。本发明提高了评估结果的可靠性。
Description
技术领域
本发明涉及训练评估技术领域,特别是涉及一种基于多源数据的操作训练效果评估方法及系统。
背景技术
训练效果评估,是对训练效果的评议和估量。评估对象的多元性和评估类型的多样性,决定了实施训练评估的复杂性、困难性。训练效果评估作为训练过程的重要环节,通常运用多种分析手段,计算和评估训练任务达到预期目的的程度。其评估结果是牵引和推动训练手段持续改进,提升训练效果的重要依据。
目前有关训练效果的评估方法大多基于单源数据进行分析,如河北砺兵科技有限责任公司的梁伟等人,使用射击采集装置接收的数据信息对实弹射击训练效果进行评估;中国人民解放军海军工程大学的傅晟威等人,在模板设定模块中场景对应的评估指标基础上,进行指标权重设计等,使用评估原始数据实现训练效果评估;安徽动感智能科技有限公司的李锋刚,提出一种基于影像信息处理的康复训练效果评估方法,实现基于非结构化数据的效果评估。多源数据融合评估方法相对较少,中电普信(北京)科技发展有限公司的王运春等人,提出一种融合训练过程中采集到的指标数据和专家打分得到的指标数据的评估方法,实现了基于主客观多源数据的融合,但没有实现多模态数据间的融合及多源数据之间的一致性评估。
发明内容
本发明的目的是提供一种基于多源数据的操作训练效果评估方法及系统,提高了评估结果的可靠性。
为实现上述目的,本发明提供了如下方案:
一种基于多源数据的操作训练效果评估方法,包括:
获取操作训练过程中的操作视频、装备日志和人工录入信息;所述操作视频包括多个采集设备采集的操作视频,所述装备日志包括多种装备的日志数据,所述人工录入信息为多种固定表单数据;
分别将各采集设备采集的操作视频转化为统一格式的视频流信号;
从各所述视频流信号中提取关键帧,获得待评估视频数据;
采用基于聚类的日志解析方法对不同格式的日志数据进行特征提取,从提取出的特征字段中筛选出设定需求字段并获得设定需求字段对应的数值,获得待评估日志数据;
将人工录入信息转换为格式化数据,获得待评估录入数据;
将待评估视频数据输入基于操作视频的单源效果评估模型,获得视频评分,所述基于操作视频的单源效果评估模型是根据视频数据集训练确定的;所述视频数据集中样本数据包括视频数据和与视频数据对应的标签;
将待评估日志数据输入基于装备日志的单源效果评估模型,获得日志评分,所述基于装备日志的单源效果评估模型是根据装备日志数据集训练确定的;所述装备日志数据集中样本数据包括装备日志数据和与装备日志数据对应的标签;
将待评估录入数据输入基于人工录入信息的单源效果评估模型,获得人工录入评分,所述基于人工录入信息的单源效果评估模型是根据人工录入信息数据集训练确定的;所述人工录入信息数据集中样本数据包括人工录入信息的格式化数据和与人工录入信息的格式化数据对应的标签;
对所述视频评分、所述装备评分和所述人工录入评分进行数据源一致性评估;
将通过数据源一致性评估的评分输入多源决策融合模型,得到评估结果分数;所述多源决策融合模型是根据多源评估数据集训练确定的。
可选地,对所述视频评分、所述装备评分和所述人工录入评分进行数据源一致性评估,具体包括:
采用所述视频数据集、所述装备日志数据集和所述人工录入信息数据集中的标签数据进行三维曲面的拟合,获得拟合曲面;
分别判断所述视频评分、所述装备评分和所述人工录入评分与所述拟合曲面的偏离是否大于设定阈值,若大于设定阈值,则剔除大于设定阈值对应的评分,获得通过数据源一致性评估的评分。
可选地,对所述视频评分、所述装备评分和所述人工录入评分进行数据源一致性评估,具体包括:
采用所述视频数据集、所述装备日志数据集和所述人工录入信息数据集中任意两个数据集的标签数据进行二维曲线的拟合,获得三个拟合曲线;
在操作视频、装备日志和人工录入信息中任意来源数据缺失情况下,使用对应二维曲线进行数据源一致性评估:判断所述视频评分、所述装备评分或所述人工录入评分与对应所述拟合曲线的偏离是否大于设定阈值,若大于设定阈值,则剔除大于设定阈值对应的评分,获得通过数据源一致性评估的评分。
可选地,所述从各所述视频流信号中提取关键帧,获得待评估视频数据,具体包括:
从各所述视频流信号中选择视频镜头中光流移动次数最少的视频帧作为关键帧。
可选地,所述基于操作视频的单源效果评估模型的训练过程包括:
采用视频数据集,以关键帧构成的视频数据为输入,以视频评分为输出训练基于Yolact++特征提取的反向传播网络,获得基于操作视频的单源效果评估模型;所述网络的训练过程中采用关键帧提取与评分预测的联合损失作为优化目标,所述联合损失包括关键帧提取损失函数和回归损失函数,其中SmoothL1作为关键帧提取损失函数,均方差作为反向传播网络输出评分的回归损失函数。
可选地,所述基于装备日志的单源效果评估模型的训练过程包括:
采用装备日志数据集,以解析日志获得的设定需求字段对应的数值为输入,以装备评分为输出训练岭回归模型,获得基于装备日志的单源效果评估模型。
可选地,所述基于人工录入信息的单源效果评估模型的训练过程包括:
采用人工录入信息数据集,以人工录入信息的格式化数据为输入,以人工录入评分为输出,基于梯度下降的方法训练云重心评估模型,获得基于人工录入信息的单源效果评估模型。
本发明还公开了一种基于多源数据的操作训练效果评估系统,包括:
数据获取模块,用于获取操作训练过程中的操作视频、装备日志和人工录入信息;所述操作视频包括多个采集设备采集的操作视频,所述装备日志包括多种装备的日志数据,所述人工录入信息为多种固定表单数据;
视频信号统一模块,用于分别将各采集设备采集的操作视频转化为统一格式的视频流信号;
待评估视频数据确定模块,用于从各所述视频流信号中提取关键帧,获得待评估视频数据;
待评估日志数据确定模块,用于采用基于聚类的日志解析方法对不同格式的日志数据进行特征提取,从提取出的特征字段中筛选出设定需求字段并获得设定需求字段对应的数值,获得待评估日志数据;
待评估录入数据确定模块,用于将人工录入信息转换为格式化数据,获得待评估录入数据;
视频评分确定模块,用于将待评估视频数据输入基于操作视频的单源效果评估模型,获得视频评分,所述基于操作视频的单源效果评估模型是根据视频数据集训练确定的;所述视频数据集中样本数据包括视频数据和与视频数据对应的标签;
装备评分确定模块,用于将待评估日志数据输入基于装备日志的单源效果评估模型,获得日志评分,所述基于装备日志的单源效果评估模型是根据装备日志数据集训练确定的;所述装备日志数据集中样本数据包括装备日志数据和与装备日志数据对应的标签;
人工录入评分确定模块,用于将所述待评估录入数据输入基于人工录入信息的单源效果评估模型,获得人工录入评分,所述基于人工录入信息的单源效果评估模型是根据人工录入信息数据集训练确定的;所述人工录入信息数据集中样本数据包括人工录入信息的格式化数据和与人工录入信息的格式化数据对应的标签;
数据源一致性评估模块,用于对所述视频评分、所述装备评分和所述人工录入评分进行数据源一致性评估;
评估结果分数确定模块,用于将通过数据源一致性评估的评分输入多源决策融合模型,得到评估结果分数;所述多源决策融合模型是根据多源评估数据集训练确定的。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明将多个采集设备采集的操作视频转化为统一格式的视频流信号,基于聚类的日志解析方法对多种装备的日志数据进行解析,获得待评估日志数据,格式化多个固定表单的人工录入数据,并对三个单源效果评估模型输出的评分进行一致性评估,有效实现多源数据融合,从而提高了评估结果的可靠性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种基于多源数据的操作训练效果评估方法流程示意图一;
图2为本发明一种基于多源数据的操作训练效果评估方法流程示意图二;
图3为本发明一种基于多源数据的操作训练效果评估系统结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于多源数据的操作训练效果评估方法及系统,提高了评估结果的可靠性。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
操作训练过程中,可以通过录制操作视频、记录装备日志数据、人工录入信息等方式,对训练的内容进行记录,并为后续的训练效果评估提供参考。以测试设备操作为例,视频包括了多角度全流程操作录像,日志记录了多种测试设备使用过程中记录的节点时间及设备状态(成功与否,加电/掉电等),人工录入信息包括设计的多个关于测试设备操作的固定表单,具体涵盖人员、时间、地点及操作效果等数据。多源数据之间的差异较大,多模态的数据需要不同的采集、预处理及特征提取,且不同来源数据间无法直接进行比较,量化的一致性评估需建立在统一纲量的基础之上。基于此,为实现考虑一致性评估的多源(操作视频、装备日志、人工录入)数据操作训练效果评估,本发明拟通过决策层面融合,提出一种基于多源(操作视频、装备日志、人工录入)数据的操作训练效果评估方法。
图1为本发明一种基于多源数据的操作训练效果评估方法流程示意图一;图2为本发明一种基于多源数据的操作训练效果评估方法流程示意图二。如图1-图2所示,本发明一种基于多源数据的操作训练效果评估方法,包括:
步骤101:获取操作训练过程中的操作视频、装备日志和人工录入信息;所述操作视频包括多个采集设备采集的操作视频,所述装备日志包括多种装备的日志数据,所述人工录入信息为多种固定表单数据。
针对操作视频的采集,由于不同末端的采集设备(视频采集设备)的格式不同,采用的方法可选用:将不同末端采集到的各类格式的视频信号通过视频采集卡进行数字化,经过端口传输至模块内的CPU,进而采用H.264编码方式对其进行压缩编码,实现转换输出统一格式的视频流信号,便于实时传输及后续使用统一的预处理方法。
针对装备日志的采集,由于装备种类繁多,存在不同厂家的数控系统之间协议与接口封闭或不通用等难点问题。采用的方法可选用:对于开放数据接口的装备分系统,通过建立网络通信,或采用定期导出的方式,获取其装备日志数据;对于设置传感器方式记录的装备日志信息,通过模数转换模块进行数字化,或通过相应总线直接读取传感器的数字信号。
针对人工录入信息的采集,用于操作训练效果评估的人工数据通常对照特定场景中的固定表单进行收集,因此,具有结构性较强但错误率较高的特点。采用的方法可选用:针对各场景的固定表单设计人工录入界面,通过下拉选项的方式确保定性数据的完整性、一致性、准确性。通过冲突检查的方式,确保定量数据的录入符合特定场景下可能的范围和关系。如,当人工输入的操作时间间隔超出当前操作可能的时长,则可以通过提示错误的方式,要求用户修改完毕后才可以正常提交。
对采集的操作视频数据、装备日志数据和人工录入信息进行预处理,包括剔除异常值、填补缺失值、视频关键帧提取、图像归一化、非结构化日志解析、人工指标计算等。
步骤102:分别将各采集设备采集的操作视频转化为统一格式的视频流信号。
步骤103:从各所述视频流信号中提取关键帧,获得待评估视频数据。
其中,步骤103具体包括:
从各所述视频流信号中选择视频镜头中光流移动次数最少的视频帧作为关键帧。
针对操作视频的关键帧提取,基于运动分析的视频关键帧提取方法,在视频镜头中分析人物训练动作的光流量,每次选择视频镜头中光流移动次数最少的视频帧作为提取到的关键帧。利用光流法计算视频帧的运动量:
M(k)=∑∑|Lx(i,j,k)|+|Ly(i,j,k)|;
M(ki)=min[M(k)]。
其中,M(ki)表示关键帧ki的运动量。
步骤104:采用基于聚类的日志解析方法对不同格式的日志数据进行特征提取,从提取出的特征字段中筛选出设定需求字段并获得设定需求字段对应的数值,获得待评估日志数据。
待评估日志数据包括设定需求字段及设定需求字段对应的数值。
其中,步骤104具体包括:
基于聚类的自适应非结构化日志解析方法对日志数据进行解析,获得设定需求字段对应的数值,构成待评估日志数据。
装备在日常操作过程中会产生海量的原始日志数据,由于大多数系统日志采用非结构化的文本格式,难以对其中的可用信息进行高效的解析和提取。传统的非结构化日志解析方法,是根据不同的日志格式,构建对应的正则表达式进行解析,并进一步清洗、规范化处理和存储。但由于装备操作训练中设计的系统、分系统类型繁多,且不断进行更新迭代,需要专家知识进行频繁维护的传统解析手段已难以适应当前的日志格式变化频率。为实现根据日志格式进行自适应的日志解析方法生成,本方案采用基于聚类的日志解析方法进行非结构化日志的自动解析。
首先,对原始日志数据中冗余的日志产生日期、IP地址、端口号等无关信息进行剔除。而后对每条日志记录进行拆分与项对生成,设一条日志可利用空格拆分为n个字符串,则可将每个字符串依次与其后所有字符串组成个项对。最后基于项对进行日志的聚类,具体的步骤为:将原始日志以记录为单位随机分为k个部分,依次移动每条记录,迭代求解日志文本T的最优聚类方案使目标函数J(T)最大化:
其中,I(T)表示日志文本T中的项对集,N(i,T)表示某一项对i在日志文本T中的数量,P(i,T)则计算了日志文本T中项对i在项对全集中占的比例,也即含i的日志部分占全文的比率。迭代停止,即完成日志的聚类解析。
聚类自动获取了日志中各个条目与内容的对应关系,因此能够完成多种装备中不同类型日志的解析,可以将其转化为半结构化数据。根据操作训练大纲中对应的操作要求,可以针对特定操作构建评价指标体系,使用日志解析的结果对定性指标进行量化,从而获取设定需求字段与数值的对应关系,作为基于装备日志的单源效果评估模型的数值型输入。
步骤105:将人工录入信息转换为格式化数据,获得待评估录入数据。
步骤106:将待评估视频数据输入基于操作视频的单源效果评估模型,获得视频评分,所述基于操作视频的单源效果评估模型是根据视频数据集训练确定的;所述视频数据集中样本数据包括视频数据和与视频数据对应的标签。
所述基于操作视频的单源效果评估模型的训练过程包括:
采用视频数据集,以关键帧构成的视频数据为输入,以视频评分为输出,训练基于Yolact++特征提取的反向传播网络,获得基于操作视频的单源效果评估模型;所述网络的训练过程中采用关键帧提取与评分预测的联合损失作为优化目标,所述联合损失包括关键帧提取损失函数和回归损失函数,其中SmoothL1作为关键帧提取损失函数,均方差作为反向传播网络输出评分的回归损失函数。
经过数据预处理得到的关键帧图像,是一种高维的数据,为避免针对各场景进行人工的特征设计,本发明选用基于Yolact++网络的深度学习方法进行特征提取。Yolact++网络采用ResNet101作为主干网络对输入的图像进行特征提取,生成五个特征图,并选取其中三个特征图特征金字塔的中间输入层,经过多尺度特征融合后生成训练操作的相关特征。
Yolact++网络采用SmoothL1损失函数作为边界框回归损失函数,分别对预测框的长、宽、中心点横坐标和纵坐标的偏置进行损失计算,具体计算过程如下:
其中,xa,ya,wa,ha表示锚(anchor)的中心点坐标、长和宽;,/>,/>,/>表示真实框的中心点坐标、长和宽;u表示网络预测的anchor偏置矩阵;v表示真实框与anchor的偏置矩阵,/>和ti为中间参数。
基于Yolact++特征提取的反向传播网络训练阶段,将Yolact++网络提取得到的特征输入反向传播网络获得激励响应,而后使用激励响应与标记评分的均方差,求解隐层和输出层的响应误差(回归误差),迭代最小化特征提取与回归的联合损失函数,完成基于操作视频的单源效果评估模型训练。
步骤107:将待评估日志数据输入基于装备日志的单源效果评估模型,获得日志评分,所述基于装备日志的单源效果评估模型是根据装备日志数据集训练确定的;所述装备日志数据集中样本数据包括装备日志数据和与装备日志数据对应的标签。
所述基于装备日志的单源效果评估模型的训练过程包括:
根据操作训练中对装备的指标要求,构建相对应的评价指标体系确定需求字段,对其中的定性指标进行量化,从而将基于装备日志的单源效果评估问题转换为数值回归预测问题。采用装备日志数据集,以解析日志获得的需求字段数值为输入,以装备评分为输出训练岭回归模型,获得基于装备日志的单源效果评估模型。
步骤108:将待评估录入数据输入基于人工录入信息的单源效果评估模型,获得人工录入评分,所述基于人工录入信息的单源效果评估模型是根据人工录入信息数据集训练确定的;所述人工录入信息数据集中样本数据包括人工录入信息的格式化数据和与人工录入信息的格式化数据对应的标签。
所述基于人工录入信息的单源效果评估模型的训练过程包括:
采用人工录入信息数据集,以格式化后的待评估录入数据为输入,以人工录入评分为输出,基于梯度下降的方法训练云重心评估模型,获得基于人工录入信息的单源效果评估模型。
根据操作训练中人工录入信息的数据特点,该类来源的数据往往在针对任务设计的表单基础上进行数据采集,经过预处理的人工指标计算后,存在较多的定性指标,同时存在时间、评分等不同纲量的定量指标,为结合不同类型指标,本发明提出一种基于梯度下降的云重心评估模型,通过训练集学习得到各评价指标的权重,评估实际操作训练的云重心与理想状态的云重心的偏离情况,建立基于人工录入信息的单源效果评估模型。
第一步,构造定性评测云标尺,即对定性指标进行量化,将每个评价集中的语言变量映射到对应的数域中,如当某定性指标的评价集为{差,一般,中等,良好,优秀}时,将对应数域设置为[0,100],则评价与评定值对应关系为{0,25,50,75,100}。
第二步,构建各指标的云模型。分别求解精确数值型指标和定性评价型指标的云模型特征,包括期望值Ex、熵En及超熵Ee。精确数值型指标的云模型可表示为:
其中,Exi表示第i个样本的指标数值,n表示样本总数。
定性评价型指标的云模型可表示为:
第三步,对各指标对应的云重心进行度量。由p个指标组成p维云C=(C1,C2,…,Cp),l=(Ex1,Ex2,…,Exp)表示为云的位置,w=(w1,w2,…,wp)表示为云的高度,也即权重。
第四步,评估云重心的偏离程度,根据具体操作评估中设定的规则将偏离程度对应至训练评估结果,偏离越大则评估结果越差。将云重心向量做归一化处理:
其中,θ表示加权偏离度,wi表示权重。
模型训练阶段,使用已知的评价结果及各指标数值,利用梯度下降法学习权重。将损失函数L(w1,w2,…,wp)定义为当前权重计算得到的评价结果与标注结果之间的L2损失。确定当前权重取值下,损失函数关于wi的梯度,并乘以设置的步长得到下降距离。迭代结束的条件为:对所有的权重,下降的距离均小于设定的阈值。否则,应用如下更新公式:
达到迭代结束条件时,学习得到的权重即可用于构建基于人工录入信息的云评估模型(基于人工录入信息的单源效果评估模型)。
各个数据集中标签为评分。
步骤109:对所述视频评分、所述装备评分和所述人工录入评分进行数据源一致性评估。
根据前期标注,已知训练样本的三类单源数据评估结果。本发明针对三类来源数据之间的关系进行学习,分别拟合二维曲线及三维曲面,构建一致性评估模型。使用实际数据得到单源评估结果,计算与训练曲线的偏离程度,根据设定阈值判断单源数据是否存在较大偏差,确定其是否与其他来源数据存在一致性。
当拟合数据的内在形状较为复杂时,具有局部可调性质的B样条是一种有效的拟合函数,较简单的多项式而言能够更精确地拟合数据,本方案中拟合方法可选用:基于差分进化算法的B样条曲线曲面拟合算法。该方法在最小二乘法的基础上,结合差分进化算法,实现根据多源数据的变化情况自适应地设置节点,并对节点的数量和位置进行优化,在间断和尖点处产生拟多重节点,进而使得二源数据的拟合曲线和三源数据的拟合曲面能较好地拟合急剧变化的过程。
其中,作为具体实施方式,步骤109具体包括:
采用所述视频数据集、所述装备日志数据集和所述人工录入信息数据集中的标签数据进行三维曲面的拟合,获得拟合曲面。
分别判断所述视频评分、所述装备评分和所述人工录入评分与所述拟合曲面的偏离是否大于设定阈值,若大于设定阈值,则剔除大于设定阈值对应的评分,获得通过数据源一致性评估的评分。
其中,作为另一种具体实施方式,步骤109具体包括:
采用所述视频数据集、所述装备日志数据集和所述人工录入信息数据集中任意两个数据集的标签数据进行二维曲线的拟合,获得三个拟合曲线。
在操作视频、装备日志和人工录入信息中任意来源数据缺失情况下,使用对应二维曲线进行数据源一致性评估:判断所述视频评分、所述装备评分或所述人工录入评分与对应所述拟合曲线的偏离是否大于设定阈值,若大于设定阈值,则剔除大于设定阈值对应的评分,获得通过数据源一致性评估的评分。
下面以二源数据的二维曲线拟合为例,具体步骤为:
其中,εj为噪音误差,N为采样数量。定k次B样条曲线的节点为ξi∈[a,b](i=0,1,…,n+2k+1),n为内节点数,xj表示第j个采样数据,a表示采样数据下限,b表示采样数据上限,f(xj)表示第j个采样数据对应的真实值。接着将端节点设为k+1重节点,得到拟合函数:
其中,ξ0、ξ1、ξk、ξn+k+1、ξn+k+2、ξn+2k+1均为节点,di(i=0,1,…,n+k)为控制顶点,Ni,k(i=0,1,…,n+k)为k次B样条基函数,其递推公式及最小化的残差平方和R为:
第二步,基于最小二乘法的B样条拟合,实现B样条拟合的差分进化算法。在第一步求解的顶点基础上,进一步通过搜索求解更优顶点。
(1)初始化种群。在这里将B样条拟合问题中的一组可行内节点ξi=(ξ0,ξ1,…,ξn)(ni为ξi的长度)作为一个个体,种群包含NP个个体。本发明中初始种群个体长度均设为L=[λN],N是被拟合数据点数量,λ称为节点率,其取值随具体实例的不同而改变。
(2)变异。首先随机选取3个互不相同且不同于ξi,G的个体。当rand1<dp(dp为删除概率,rand1为[0,1]之间的随机数),则随机删除一个节点,得到一个新的个体/>,否则,按升序向ξi,G随机插入一个(a,b)之间的节点,得到一个新个体/>,其中G表示迭代次数。取/>,其中/>分别为的长度。如,当/>时,则将/>中每/>个元素相加后求其平均值按顺序依次存入/>中,即:
(3)杂交。将ξi,G和Ui,G杂交得到实验向量Vi,G:
其中,CR称为杂交系数,本发明中取值为CR=0.5×(1+rand4),随机数均位于[0,1]之间。
(4)选择。本发明使用统计学中贝叶斯信息准则BIC(评价模型拟合效果的一种方法)作为适应度函数,在本发明曲线拟合问题中,其表达式为:
BIC=N×(lnR)+(lnN)×(2n+k+1)。
其中,N为拟合数据点的数量,R为残差平方和,2n+k+1为变量的数量。BIC值的大小反映了拟合精度,其值越小,拟合精度越高。最后,根据贪婪法则,选择较优个体遗传到下一代:
其中,V_BIC表示实验向量Vi,G对应的BIC值,ξ_BIC表示原向量ξi,G对应的BIC值。
结合上述差分进化算法的描述,数据拟合方法即对每次迭代中的种群个体应用最小二乘法,求解与之对应的最小残差平方和,进而计算出适应度函数BIC值;进行变异和杂交操作后,根据适应度函数值进行选择及种群更新;达到迭代终止条件,则输出最优内节点组,完成拟合。终止条件均设为:平均平方误差MSE<10-5或者迭代次数大于设定值。
通过计算实际数据与训练拟合曲线或曲面的偏离程度,根据设定阈值判断单源数据是否存在较大偏差,确定其是否与其他来源数据存在一致性,为后续分析是否采信该来源数据提供参考。
对于判定为不一致的数据,可以进行剔除或重新采集的方式。针对可靠数据无法补充的情况,在多源决策融合模块中可以针对三种单源数据评估结果分数的两两组合作为输入,训练出缺失某一来源的多源决策融合模型,利用缺失条件下的数据进行双源评估。针对重新采集的数据,则重新进行一致性评估及后续决策融合。
步骤110:将通过数据源一致性评估的评分输入多源决策融合模型,得到评估结果分数;所述多源决策融合模型是根据多源评估数据集训练确定的。
本发明多源决策融合模型采用基于弹性网络回归和XGBoost的回归预测模型。
本发明将效果评估模块中得到的三种单源数据评估结果分数作决策层融合、进行训练,综合得到最终的基于多源数据的评估结果分数。
多源决策融合模型是一种数值型的回归模型,具有自变量间相关性较强、不同来源数据可参考价值不同(权重不同)的特点。弹性网络回归模型结合LASSO回归及岭回归,同时具有筛选重要变量和防止多重共线性的优点。XGBoost是一种改进的梯度提升算法,集成学习能够进一步提升标准算法的预测性能。因此,针对该步骤,采用的方法可选用:基于弹性网络回归和XGBoost的回归预测模型。将三种单源数据评估结果分数和已知的多源数据评估结果分数作为输入,记弹性网络回归模型为和XGBoost模型为/>,则模型训练的优化目标为:
其中,Yi表示模型对样本xi的多源评估结果分数的预测值,r和t分别表示弹性网络回归模型和XGBoost模型的权重。该方法充分利用了弹性网络回归具有较低的估计误差、XGBoost具有较低的逼近误差两项优势,能够获得更优的模型预测性能。
本发明通过数据采集及预处理,实现操作视频、装备日志、人工录入信息的多源原始数据的获取、清洗,并通过专家评估的方法构建基于单源数据及多源数据评估的训练样本;通过适应于原始数据特点的对应机器学习方法,分别构建基于操作视频、装备日志、人工录入信息的三个单源评估模型;建立关于三个单源评估结果间的回归预测模型,用于多源数据间的一致性评估,解决单源数据的可靠性问题;最终通过学习单源评估结果与多源评估结果间的关系,从决策层面解决多模态数据的融合问题,得到最终的多源训练评估结果。
1、本发明能够对多个采集设备上的操作视频、装备日志、人工录入等信息进行采集,实现同一模态内的格式转换,解决不同装备、系统、采集设备上数据格式不统一的矛盾问题。
2、本发明根据操作视频、装备日志、人工录入等多源数据的特点,对非结构化数据进行相应的预处理,其中,能够利用深度学习、机器学习算法实现非人工录入数据的自适应解析,针对人工录入信息实现基于指标体系的智能计算。
3、本发明能够训练得到针对单源数据的训练效果评估模型,具有数据缺失等特殊情况下的效果评估鲁棒性。基于单源数据的训练评估模型,均可以迁移应用至对应模态数据的其他效果评估。
4、本发明设置一致性评估模块,基于单源数据训练效果评估结果,对某一来源数据进行可靠性检验,能够有效提升效果评估的可信度,且可进一步拓展应用于虚假信息的识别。
5、本发明在决策层面实现对多源数据训练效果评估的融合,能够从多源数据维度给出最终效果评估的具体解释。
图3为本发明一种基于多源数据的操作训练效果评估系统结构示意图,如图3所示,一种基于多源数据的操作训练效果评估系统,包括:
数据获取模块201,用于获取操作训练过程中的操作视频、装备日志和人工录入信息;所述操作视频包括多个采集设备采集的操作视频,所述装备日志包括多种装备的日志数据,所述人工录入信息为多种固定表单数据。
视频信号统一模块202,用于分别将各采集设备采集的操作视频转化为统一格式的视频流信号。
待评估视频数据确定模块203,用于从各所述视频流信号中提取关键帧,获得待评估视频数据。
待评估日志数据确定模块204,用于采用基于聚类的日志解析方法对不同格式的日志数据进行特征提取,从提取出的特征字段中筛选出设定需求字段并获得设定需求字段对应的数值,获得待评估日志数据。
待评估录入数据确定模块205,用于将人工录入信息转换为格式化数据,获得待评估录入数据。
视频评分确定模块206,用于将待评估视频数据输入基于操作视频的单源效果评估模型,获得视频评分,所述基于操作视频的单源效果评估模型是根据视频数据集训练确定的;所述视频数据集中样本数据包括视频数据和与视频数据对应的标签。
装备评分确定模块207,用于将待评估日志数据输入基于装备日志的单源效果评估模型,获得日志评分,所述基于装备日志的单源效果评估模型是根据装备日志数据集训练确定的;所述装备日志数据集中样本数据包括装备日志数据和与装备日志数据对应的标签。
人工录入评分确定模块208,用于将待评估录入数据输入基于人工录入信息的单源效果评估模型,获得人工录入评分,所述基于人工录入信息的单源效果评估模型是根据人工录入信息数据集训练确定的;所述人工录入信息数据集中样本数据包括人工录入信息的格式化数据和与人工录入信息的格式化数据对应的标签。
数据源一致性评估模块209,用于对所述视频评分、所述装备评分和所述人工录入评分进行数据源一致性评估。
评估结果分数确定模块210,用于将通过数据源一致性评估的评分输入多源决策融合模型,得到评估结果分数;所述多源决策融合模型是根据多源评估数据集训练确定的。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
Claims (5)
1.一种基于多源数据的操作训练效果评估方法,其特征在于,包括:
获取操作训练过程中的操作视频、装备日志和人工录入信息;所述操作视频包括多个采集设备采集的操作视频,所述装备日志包括多种装备的日志数据,所述人工录入信息为多种固定表单数据;
分别将各采集设备采集的操作视频转化为统一格式的视频流信号;
从各所述视频流信号中提取关键帧,获得待评估视频数据;
采用基于聚类的日志解析方法对不同格式的日志数据进行特征提取,从提取出的特征字段中筛选出设定需求字段并获得设定需求字段对应的数值,获得待评估日志数据;
将人工录入信息转换为格式化数据,获得待评估录入数据;
将待评估视频数据输入基于操作视频的单源效果评估模型,获得视频评分,所述基于操作视频的单源效果评估模型是根据视频数据集训练确定的;所述视频数据集中样本数据包括视频数据和与视频数据对应的标签;
将待评估日志数据输入基于装备日志的单源效果评估模型,获得装备评分,所述基于装备日志的单源效果评估模型是根据装备日志数据集训练确定的;所述装备日志数据集中样本数据包括装备日志数据和与装备日志数据对应的标签;
将待评估录入数据输入基于人工录入信息的单源效果评估模型,获得人工录入评分,所述基于人工录入信息的单源效果评估模型是根据人工录入信息数据集训练确定的;所述人工录入信息数据集中样本数据包括人工录入信息的格式化数据和与人工录入信息的格式化数据对应的标签;
对所述视频评分、所述装备评分和所述人工录入评分进行数据源一致性评估;
将通过数据源一致性评估的评分输入多源决策融合模型,得到评估结果分数;所述多源决策融合模型是根据多源评估数据集训练确定的;
所述基于操作视频的单源效果评估模型的训练过程包括:
采用视频数据集,以关键帧构成的视频数据为输入,以视频评分为输出训练基于Yolact++特征提取的反向传播网络,获得基于操作视频的单源效果评估模型;所述网络的训练过程中采用关键帧提取与评分预测的联合损失作为优化目标,所述联合损失包括关键帧提取损失函数和回归损失函数,其中SmoothL1作为关键帧提取损失函数,均方差作为反向传播网络输出评分的回归损失函数;
所述基于装备日志的单源效果评估模型的训练过程包括:
采用装备日志数据集,以解析日志获得的设定需求字段对应的数值为输入,以装备评分为输出训练岭回归模型,获得基于装备日志的单源效果评估模型;
所述基于人工录入信息的单源效果评估模型的训练过程包括:
采用人工录入信息数据集,以人工录入信息的格式化数据为输入,以人工录入评分为输出,基于梯度下降的方法训练云重心评估模型,获得基于人工录入信息的单源效果评估模型。
2.根据权利要求1所述的基于多源数据的操作训练效果评估方法,其特征在于,对所述视频评分、所述装备评分和所述人工录入评分进行数据源一致性评估,具体包括:
采用所述视频数据集、所述装备日志数据集和所述人工录入信息数据集中的标签数据进行三维曲面的拟合,获得拟合曲面;
分别判断所述视频评分、所述装备评分和所述人工录入评分与所述拟合曲面的偏离是否大于设定阈值,若大于设定阈值,则剔除大于设定阈值对应的评分,获得通过数据源一致性评估的评分。
3.根据权利要求1所述的基于多源数据的操作训练效果评估方法,其特征在于,对所述视频评分、所述装备评分和所述人工录入评分进行数据源一致性评估,具体包括:
采用所述视频数据集、所述装备日志数据集和所述人工录入信息数据集中任意两个数据集的标签数据进行二维曲线的拟合,获得三个拟合曲线;
在操作视频、装备日志和人工录入信息中任意来源数据缺失情况下,使用对应二维曲线进行数据源一致性评估:判断所述视频评分、所述装备评分或所述人工录入评分与对应所述拟合曲线的偏离是否大于设定阈值,若大于设定阈值,则剔除大于设定阈值对应的评分,获得通过数据源一致性评估的评分。
4.根据权利要求1所述的基于多源数据的操作训练效果评估方法,其特征在于,所述从各所述视频流信号中提取关键帧,获得待评估视频数据,具体包括:
从各所述视频流信号中选择视频镜头中光流移动次数最少的视频帧作为关键帧。
5.一种基于多源数据的操作训练效果评估系统,其特征在于,包括:
数据获取模块,用于获取操作训练过程中的操作视频、装备日志和人工录入信息;所述操作视频包括多个采集设备采集的操作视频,所述装备日志包括多种装备的日志数据,所述人工录入信息为多种固定表单数据;
视频信号统一模块,用于分别将各采集设备采集的操作视频转化为统一格式的视频流信号;
待评估视频数据确定模块,用于从各所述视频流信号中提取关键帧,获得待评估视频数据;
待评估日志数据确定模块,用于采用基于聚类的日志解析方法对不同格式的日志数据进行特征提取,从提取出的特征字段中筛选出设定需求字段并获得设定需求字段对应的数值,获得待评估日志数据;
待评估录入数据确定模块,用于将人工录入信息转换为格式化数据,获得待评估录入数据;
视频评分确定模块,用于将待评估视频数据输入基于操作视频的单源效果评估模型,获得视频评分,所述基于操作视频的单源效果评估模型是根据视频数据集训练确定的;所述视频数据集中样本数据包括视频数据和与视频数据对应的标签;
装备评分确定模块,用于将待评估日志数据输入基于装备日志的单源效果评估模型,获得装备评分,所述基于装备日志的单源效果评估模型是根据装备日志数据集训练确定的;所述装备日志数据集中样本数据包括装备日志数据和与装备日志数据对应的标签;
人工录入评分确定模块,用于将所述待评估录入数据输入基于人工录入信息的单源效果评估模型,获得人工录入评分,所述基于人工录入信息的单源效果评估模型是根据人工录入信息数据集训练确定的;所述人工录入信息数据集中样本数据包括人工录入信息的格式化数据和与人工录入信息的格式化数据对应的标签;
数据源一致性评估模块,用于对所述视频评分、所述装备评分和所述人工录入评分进行数据源一致性评估;
评估结果分数确定模块,用于将通过数据源一致性评估的评分输入多源决策融合模型,得到评估结果分数;所述多源决策融合模型是根据多源评估数据集训练确定的;
所述基于操作视频的单源效果评估模型的训练过程包括:
采用视频数据集,以关键帧构成的视频数据为输入,以视频评分为输出训练基于Yolact++特征提取的反向传播网络,获得基于操作视频的单源效果评估模型;所述网络的训练过程中采用关键帧提取与评分预测的联合损失作为优化目标,所述联合损失包括关键帧提取损失函数和回归损失函数,其中SmoothL1作为关键帧提取损失函数,均方差作为反向传播网络输出评分的回归损失函数;
所述基于装备日志的单源效果评估模型的训练过程包括:
采用装备日志数据集,以解析日志获得的设定需求字段对应的数值为输入,以装备评分为输出训练岭回归模型,获得基于装备日志的单源效果评估模型;
所述基于人工录入信息的单源效果评估模型的训练过程包括:
采用人工录入信息数据集,以人工录入信息的格式化数据为输入,以人工录入评分为输出,基于梯度下降的方法训练云重心评估模型,获得基于人工录入信息的单源效果评估模型。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310279085.0A CN115994713B (zh) | 2023-03-22 | 2023-03-22 | 一种基于多源数据的操作训练效果评估方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310279085.0A CN115994713B (zh) | 2023-03-22 | 2023-03-22 | 一种基于多源数据的操作训练效果评估方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115994713A CN115994713A (zh) | 2023-04-21 |
CN115994713B true CN115994713B (zh) | 2023-06-16 |
Family
ID=85992254
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310279085.0A Active CN115994713B (zh) | 2023-03-22 | 2023-03-22 | 一种基于多源数据的操作训练效果评估方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115994713B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117152308B (zh) * | 2023-09-05 | 2024-03-22 | 江苏八点八智能科技有限公司 | 一种虚拟人动作表情优化方法与系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112330191A (zh) * | 2020-11-20 | 2021-02-05 | 安徽文香信息技术有限公司 | 一种基于人工智能黑板的教育教学评估系统及其评估方法 |
CN113921136A (zh) * | 2021-09-13 | 2022-01-11 | 吾征智能技术(北京)有限公司 | 一种融合多源数据智能评估预测慢性病风险的系统 |
CN114125495A (zh) * | 2020-08-11 | 2022-03-01 | 中国电信股份有限公司 | 视频质量评估模型训练方法、视频质量评价方法和装置 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20210166167A1 (en) * | 2019-12-02 | 2021-06-03 | Asia University | Artificial intelligence and blockchain-based inter-enterprise credit rating and risk assessment method and system |
CN111784168A (zh) * | 2020-07-02 | 2020-10-16 | 航天物联网技术有限公司 | 一种基于多源数据融合模型的军事训练水平综合评估方法 |
CN111984515B (zh) * | 2020-09-02 | 2024-01-23 | 大连大学 | 多源异构日志分析方法 |
CN112199421B (zh) * | 2020-12-04 | 2021-03-09 | 中国电力科学研究院有限公司 | 一种多源异构数据融合和量测数据多源互校验方法及系统 |
CN113392894A (zh) * | 2021-06-09 | 2021-09-14 | 瓴域影诺(北京)科技有限公司 | 一种多组学数据的聚类分析方法和系统 |
CN115643035A (zh) * | 2021-07-05 | 2023-01-24 | 中国石油化工股份有限公司 | 基于多源日志的网络安全态势评估方法 |
CN114118507A (zh) * | 2021-07-14 | 2022-03-01 | 青岛博天数通信息科技有限公司 | 一种基于多维信息融合的风险评估预警方法和装置 |
CN113657724A (zh) * | 2021-07-29 | 2021-11-16 | 上海淇玥信息技术有限公司 | 基于多源异构数据的资源分配方法、装置和电子设备 |
CN113729710A (zh) * | 2021-09-26 | 2021-12-03 | 华南师范大学 | 一种融合多生理模态的实时注意力评估方法及系统 |
CN114970667B (zh) * | 2022-03-30 | 2024-03-29 | 国网吉林省电力有限公司 | 一种多源异构能源数据融合方法 |
CN115329818A (zh) * | 2022-08-22 | 2022-11-11 | 深圳市云长数字医疗有限公司 | 基于vr的多模态融合注意力评估方法、系统及存储介质 |
CN115392375A (zh) * | 2022-08-25 | 2022-11-25 | 武汉东湖大数据交易中心股份有限公司 | 一种多源数据融合度智能评估方法及其系统 |
CN115774861B (zh) * | 2022-12-22 | 2023-07-21 | 广东五度空间科技有限公司 | 一种自然资源多源异构数据汇聚融合服务系统 |
-
2023
- 2023-03-22 CN CN202310279085.0A patent/CN115994713B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114125495A (zh) * | 2020-08-11 | 2022-03-01 | 中国电信股份有限公司 | 视频质量评估模型训练方法、视频质量评价方法和装置 |
CN112330191A (zh) * | 2020-11-20 | 2021-02-05 | 安徽文香信息技术有限公司 | 一种基于人工智能黑板的教育教学评估系统及其评估方法 |
CN113921136A (zh) * | 2021-09-13 | 2022-01-11 | 吾征智能技术(北京)有限公司 | 一种融合多源数据智能评估预测慢性病风险的系统 |
Non-Patent Citations (2)
Title |
---|
Tao Sun ; Min Yu.Research on Multi-source Data Fusion Method Based on Bayesian Estimation.《2016 9th International Symposium on Computational Intelligence and Design (ISCID)》.2017,全文. * |
多源数据信用评级普适模型栈框架的构建与应用;黄志刚;刘志惠;朱建林;;数量经济技术经济研究(第04期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN115994713A (zh) | 2023-04-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110490239B (zh) | 图像质控网络的训练方法、质量分类方法、装置及设备 | |
CN105975573A (zh) | 一种基于knn的文本分类方法 | |
CN115994713B (zh) | 一种基于多源数据的操作训练效果评估方法及系统 | |
CN112257441B (zh) | 一种基于反事实生成的命名实体识别增强方法 | |
CN113780003A (zh) | 时空数据变分编解码跨模态增强方法 | |
CN116340796B (zh) | 时序数据分析方法、装置、设备及存储介质 | |
CN109919921B (zh) | 基于生成对抗网络的环境影响程度建模方法 | |
CN110990718A (zh) | 一种公司形象提升系统的社会网络模型构建模块 | |
CN116610816A (zh) | 一种基于图卷积神经网络的人员画像知识图谱分析方法及系统 | |
CN116257759A (zh) | 一种深度神经网络模型的结构化数据智能分类分级系统 | |
CN114399066A (zh) | 基于弱监督学习的机械设备预知性维护系统和维护方法 | |
CN113779996A (zh) | 基于BiLSTM模型的标准实体文本确定方法、装置及存储介质 | |
CN113239159A (zh) | 基于关系推理网络的视频和文本的跨模态检索方法 | |
CN115757103A (zh) | 基于树结构的神经网络测试用例生成方法 | |
CN116864128A (zh) | 基于身体活动行为模式监测的心理状态评估系统及其方法 | |
CN115880472A (zh) | 一种电力红外图像数据智能诊断分析系统 | |
CN115048873B (zh) | 一种用于飞机发动机的剩余使用寿命预测系统 | |
CN114757097B (zh) | 一种线路故障诊断方法及装置 | |
CN113095386B (zh) | 一种基于三轴加速度空时特征融合的手势识别方法及系统 | |
CN114821299A (zh) | 一种遥感图像变化检测方法 | |
CN113238197A (zh) | 基于Bert和BiLSTM的雷达目标识别及据判方法 | |
CN117292243B (zh) | 基于深度学习的心磁信号时空图像预测方法、设备及介质 | |
CN113516242B (zh) | 一种基于自注意力机制的穿墙雷达人体动作识别方法 | |
CN117251599B (zh) | 一种视频语料智能测试优化方法、装置和存储介质 | |
CN117523203B (zh) | 一种基于Transformer半监督算法的蜂窝肺病灶图像分割识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |