发明内容
为改善相关技术中存在的技术问题,本发明提供了一种基于工业互联网的数据采集方法及系统。
第一方面,本发明实施例提供了一种基于工业互联网的数据采集方法,应用于数据采集系统,所述方法至少包括:获得第一智能化产线运行日志中每个AI交互事件定位单元对应的持续性定位特征变量,所述持续性定位特征变量表征所述AI交互事件定位单元对应的定位变化模式或定位变化倾向;对于各个所述AI交互事件定位单元,基于持续性定位特征变量对所述AI交互事件定位单元进行定位区间调整,得到所述AI交互事件定位单元对应的已调整定位单元;基于各个AI交互事件定位单元对应的已调整定位单元和所述第一智能化产线运行日志,确定第一待处理产线运行日志;对所述第一待处理产线运行日志进行定向大数据采集,得到所述第一智能化产线运行日志的AI交互事件数据集。
基于上述实施例,能够应对单一生产线环境下的定向大数据采集,也能够应对交互生产线环境下的定向大数据采集。对于本发明实施例而言,可以基于AI交互事件定位变化模式或者定位变化倾向动态变更待处理产线运行日志的日志内容量,使得待处理产线运行日志能够精准匹配AI交互事件的一些列交互变化,从而在AI交互事件变化时中避免了AI交互事件与待处理产线运行日志相脱离的可能性以及AI交互事件在待处理产线运行日志中所对应的日志数据集占比太少的可能性,显著提升了针对变化的AI交互事件的定向大数据采集质量。
在一些示例性实施例中,所述获得第一智能化产线运行日志中每个AI交互事件定位单元对应的持续性定位特征变量,包括:对所述第一智能化产线运行日志进行交互事件识别,得到所述第一智能化产线运行日志的交互事件识别信息,所述交互事件识别信息用于反映所述第一智能化产线运行日志中包括的AI交互事件定位单元的分布标签;依据所述第一智能化产线运行日志的交互事件识别信息,确定所述第一智能化产线运行日志的产线环境描述字段,以及所述第一智能化产线运行日志中每个AI交互事件定位单元对应的相关性评分,所述产线环境描述字段用于反映所述第一智能化产线运行日志为单一生产线环境下的智能化产线运行日志还是为交互生产线环境下的智能化产线运行日志,所述相关性评分用于反映所述AI交互事件定位单元中的AI交互事件数据与第一运行日志收集线程之间的匹配度,所述第一运行日志收集线程用于收集所述第一智能化产线运行日志;对于各个所述AI交互事件定位单元,基于所述产线环境描述字段、所述AI交互事件定位单元对应的相关性评分以及第一设定对应指示,得到所述AI交互事件定位单元对应的持续性定位特征变量,所述第一设定对应指示用于反映不同产线环境下、不同匹配度的AI交互事件定位单元对应的持续性定位特征变量。
对于本发明实施例而言,基于第一智能化产线运行日志的产线环境描述字段、第一智能化产线运行日志中AI交互事件定位单元对应的相关性评分,得到第一智能化产线运行日志中AI交互事件定位单元对应的持续性定位特征变量,从而为AI交互事件定位单元的定位区间调整提供了依据,以保障AI交互事件变化过程中的定向大数据采集质量。
在一些示例性实施例中,所述方法还包括:获得第一智能化产线监测报告,所述第一智能化产线监测报告对应于第一生产线环境,所述第一生产线环境为单一生产线环境或者交互生产线环境,所述第一智能化产线监测报告用于表征单一AI交互事件或多个AI交互事件在第一监测条件内的行为变化,其中,所述第一监测条件与第二运行日志收集线程存在第一匹配度,所述第二运行日志收集线程用于收集所述第一智能化产线监测报告;对所述第一智能化产线监测报告中的选定AI交互事件进行应答活动持续分析,得到所述选定AI交互事件对应的AI交互事件定位单元在所述第一智能化产线监测报告的各个智能化产线运行日志中的分布标签;基于所述选定AI交互事件对应的AI交互事件定位单元在所述第一智能化产线监测报告的各个智能化产线运行日志中的分布标签,确定所述选定AI交互事件的交互热度、应答安全等级和第二匹配度,所述第二匹配度用于反映所述选定AI交互事件与所述第一智能化产线监测报告的参考分布标签的匹配度;基于所述选定AI交互事件的交互热度和应答安全等级,获得第一持续性定位特征变量;依据所述第一生产线环境、所述第二匹配度和所述第一持续性定位特征变量,生成所述第一设定对应指示。
对于本发明实施例而言,通过应答活动持续分析对在先的智能化产线运行日志进行分析,从而获得了生产线环境以及选定AI交互事件的分布标签与持续性定位特征变量的对应指示,为确定第一智能化产线运行日志中的AI交互事件定位单元对应持续性定位特征变量贡献分析依据。
在一些示例性实施例中,所述方法还包括:在所述第一生产线环境为单一生产线环境的基础上,配置第一智能化产线监测报告中AI交互事件的交互更新描述值大于第一更新描述判定值,以及所述第一监测条件在所述第二运行日志收集线程的线程映射空间的第一映射指标上特征映射结果的量化值大于第一映射基准值;在所述第一生产线环境为交互生产线环境的基础上,配置第一智能化产线监测报告中AI交互事件的交互更新描述值不大于第二更新描述判定值,以及所述第一监测条件在所述第二运行日志收集线程的线程映射空间的第一映射指标上特征映射结果的量化值不大于第二映射基准值;其中,所述第二更新描述判定值不大于所述第一更新描述判定值,所述第二映射基准值不大于所述第一映射基准值。
对于本发明实施例而言,通过为单一生产线环境配置较大的监测条件和交互更新描述值,以及为交互生产线环境配置较小的监测条件和交互更新描述值,使得AI交互事件的定位变化模式与实际生产线环境互相配对,提高了AI交互事件定位单元对应持续性定位特征变量的精度,以保障AI交互事件变化过程中的定向大数据采集质量。
在一些示例性实施例中,所述基于所述AI交互事件定位单元对应的持续性定位特征变量对所述AI交互事件定位单元进行定位区间调整,得到所述AI交互事件定位单元对应的已调整定位单元,包括:基于所述AI交互事件定位单元对应的持续性定位特征变量和第二设定对应指示,确定所述AI交互事件定位单元的定位区间调整权重;结合所述定位区间调整权重对所述AI交互事件定位单元进行定位区间调整,得到所述AI交互事件定位单元对应的已调整定位单元,所述第二设定对应指示用于反映不同的持续性定位特征变量对应的定位区间调整权重。
在一些示例性实施例中,所述基于各个AI交互事件定位单元对应的已调整定位单元和所述第一智能化产线运行日志,确定第一待处理产线运行日志,包括:对所述各个AI交互事件定位单元对应的已调整定位单元进行加权得到加权定位单元;基于所述加权定位单元和所述第一智能化产线运行日志,得到所述第一待处理产线运行日志;其中,所述第一待处理产线运行日志对应于用于匹配全部AI交互事件定位单元对应的已调整定位单元的加权定位单元中,单元尺寸最小的加权定位单元。
对于本发明实施例而言,基于用于匹配全部AI交互事件定位单元对应的已调整定位单元的加权定位单元中,单元尺寸最小的加权定位单元对第一智能化产线运行日志进行数据采集,从而获得第一待处理产线运行日志。如此能够减少AI交互事件在第一待处理产线运行日志中所对应的数据集占比较少的概率,有助于提高定向大数据采集质量。
在一些示例性实施例中,所述对所述第一待处理产线运行日志进行定向大数据采集,得到所述第一智能化产线运行日志的AI交互事件数据集,包括:获得第二智能化产线运行日志对应的第二待处理产线运行日志,所述第二智能化产线运行日志为智能化产线监测报告中所述第一智能化产线运行日志的上一个智能化产线运行日志,所述第二待处理产线运行日志表示获得所述第二智能化产线运行日志的AI交互事件数据集时所使用的待处理产线运行日志;确定所述第一待处理产线运行日志相较于所述第二待处理产线运行日志的应答安全等级;在所述第一待处理产线运行日志相较于所述第二待处理产线运行日志的应答安全等级大于第一等级判定值的基础上,对所述第一待处理产线运行日志进行定向大数据采集,得到所述第一智能化产线运行日志的AI交互事件数据集。
对于本发明实施例而言,通过维护待处理产线运行日志所对应的分布标签,能够提高大数据定向采集的精度,减少采集误差和采集干扰。
在一些示例性实施例中,所述方法还包括:在所述第一待处理产线运行日志相较于所述第二待处理产线运行日志的应答安全等级不大于所述第一等级判定值的基础上,利用所述第二待处理产线运行日志进行定向大数据采集,得到所述第一智能化产线运行日志的AI交互事件数据集。
对于本发明实施例而言,能够采集应答安全等级不高的数据,从而避免潜在的数据安全问题。
在一些示例性实施例中,所述对所述第一待处理产线运行日志进行定向大数据采集,得到所述第一智能化产线运行日志的AI交互事件数据集,包括:获得第二智能化产线运行日志对应的第二待处理产线运行日志,所述第二智能化产线运行日志与所述第一智能化产线运行日志属于相同智能化产线监测报告,且所述第二智能化产线运行日志为所述第一智能化产线运行日志的上一个智能化产线运行日志,所述第二待处理产线运行日志表示获得所述第二智能化产线运行日志的AI交互事件数据集时所使用的待处理产线运行日志;确定所述第一待处理产线运行日志相较于所述第二待处理产线运行日志的数据辐射指数;在所述数据辐射指数小于第二等级判定值的基础上,对所述第一待处理产线运行日志进行定向大数据采集,得到所述第一智能化产线运行日志的AI交互事件数据集。
对于本发明实施例而言,能够实现待处理产线运行日志的快速变更,提高了定向大数据采集质量。
在一些示例性实施例中,所述方法还包括:在所述数据辐射指数不小于所述第二等级判定值的基础上,利用所述第二待处理产线运行日志进行定向大数据采集,得到所述第一智能化产线运行日志的AI交互事件数据集。
对于本发明实施例而言,基于数据辐射指数(数据覆盖范围)进行定向大数据采集,能够减少得到的AI交互事件数据集中的噪声数据的占比,从而提高AI交互事件数据集的数据质量。
第二方面,本发明还提供了一种数据采集系统,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述所述的方法。
具体实施方式
当下,智慧教育业务规模不断扩大,针对智慧教育的数据安全处理至关重要。发明人在对相关技术进行研究分析后发现,即使基于区块链技术的智慧教育终端在一定程度上能够防止数据篡改,但是在一些情况下,智慧教育业务数据在云端备份过程中(比如集中存储在云端或者服务器侧)容易被恶意篡改,而对智慧教育业务数据进行敏感数据特征挖掘,深入完善不同敏感数据特征之间的关联,能够为后续的数据防篡改处理提供准确可靠的参考依据。
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本发明实施例所提供的方法实施例可以在数据采集系统、计算机设备或者类似的运算装置中执行。以运行在数据采集系统上为例,图1是本发明实施例的实施一种基于工业互联网的数据采集方法的数据采集系统的硬件结构框图。如图1所示,数据采集系统10可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器104,可选地,上述数据采集系统还可以包括用于通信功能的传输装置106。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述数据采集系统的结构造成限定。例如,数据采集系统10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种基于工业互联网的数据采集方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至数据采集系统10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括数据采集系统10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
基于此,请参阅图2,图2是本发明实施例所提供的一种基于工业互联网的数据采集方法的流程示意图,该方法应用于数据采集系统,进一步可以包括以下内容描述的技术方案。
STEP11、获得第一智能化产线运行日志中每个AI交互事件定位单元对应的持续性定位特征变量。
举例而言,智能化产线运行日志为携带AI交互事件的窗口化日志数据。智能化产线运行日志中可以包含一个AI交互事件也可以包含多个AI交互事件。智能化产线运行日志可以是运行日志收集线程对某个工业互联网厂区进行日志收集后得到的,也可以是从智能化产线监测报告(其他设备生成或者采集的)中获得的包含AI交互事件的窗口化日志数据。而AI交互事件包括基于现有的一些人工智能技术实现的智能生产设备和控制设备之间的生产互动事件,或者基于现有的专家系统的GUI生产线的人机互动事件。
进一步,STEP11中的第一智能化产线运行日志可以表征当前待进行定向大数据采集的智能化产线运行日志。对于本发明实施例而言,第一智能化产线运行日志加载到根据实际需求配置的交互事件识别网络(比如神经网络模型)后,交互事件识别网络可以生成第一智能化产线运行日志的交互事件识别信息。该交互事件识别信息可以用于反映第一智能化产线运行日志中包括的AI交互事件定位单元的分布标签。
以一些示例来看待,第一智能化产线运行日志中包含的AI交互事件与交互事件识别信息指示的AI交互事件定位单元存在一对一对应关系。基于此,在第一智能化产线运行日志中包含一个AI交互事件时,在STEP11中可以获得到一个AI交互事件定位单元对应的持续性定位特征变量。在第一智能化产线运行日志中包含多个AI交互事件时,在STEP11中可以获得到多个AI交互事件定位单元对应的持续性定位特征变量。进一步地,AI交互事件定位单元可以通过窗口化的形式对AI交互事件所处的数据区域或者数据集进行捕捉处理或者定位处理。
基于上述内容,AI交互事件定位单元对应的持续性定位特征变量可以表征AI交互事件定位单元对应的定位变化模式或者定位变化倾向。其中,AI交互事件定位单元对应的定位变化模式可以用于反映基于在先的智能化产线运行日志分析而得的AI交互事件的行为变化。AI交互事件定位单元对应的定位变化倾向可以用于反映AI交互事件后续预测得到的行为变化。进一步地,AI交互事件在生产线运行过程中会存在数据传输、验证方式、会话状态等一些列的变化,因此可能导致AI交互事件对应的数据集的规模存在变化,在针对AI交互事件的数据采集时,为了提高采集质量,需要将AI交互事件的一些列变化考虑在内。
在一些示例性实施例中,AI交互事件定位单元的持续性定位特征变量包括但不限于AI交互事件定位单元的交互热度、应答安全等级和数据传输轨迹等用于反映AI交互事件行为变化的变量。
STEP12、对于各个所述AI交互事件定位单元,基于持续性定位特征变量对所述AI交互事件定位单元进行定位区间调整,得到所述AI交互事件定位单元对应的已调整定位单元。
举例而言,AI交互事件相较于运行日志收集线程的变化可以分解为时序优先级变化和/或数据格式变化。AI交互事件在相较于运行日志收集线程发生时序优先级变化时,若待处理产线运行日志的日志内容量维持,则可能出现AI交互事件脱离待处理产线运行日志的情况。在另一些情况下,如果维持待处理产线运行日志的日志内容量(日志内容量可以理解为确定出的窗口化数据集的窗口尺寸)不变,则会出现AI交互事件在待处理产线运行日志中所对应的数据集占比过少的情况。鉴于AI交互事件定位单元的持续性定位特征变量可以代表AI交互事件行为变化。基于此,对于本发明实施例而言,可以基于AI交互事件定位单元对应的持续性定位特征变量对AI交互事件定位单元进行定位区间调整,得到AI交互事件定位单元对应的已调整定位单元,不仅能够减少AI交互事件变化时脱离已调整定位单元的几率,还能够减少AI交互事件在已调整定位单元中所对应的数据集占比过少的几率。
在本发明实施例中对AI交互事件定位单元进行定位区间调整包括对AI交互事件定位单元进行尺寸减少或者对AI交互事件定位单元进行尺寸增加。其中,对AI交互事件定位单元进行尺寸减少得到已调整定位单元,可以提高AI交互事件在已调整定位单元中的数据集比例,有助于提升后续定向大数据采集时的精度,从而提升定向大数据采集质量;对AI交互事件定位单元进行尺寸增加得到已调整定位单元,可以降低AI交互事件脱离已调整定位单元的几率,使AI交互事件尽可能落入已调整定位单元内,从而保障定向大数据采集质量。
在一些示例性实施例中,所述STEP12中基于所述AI交互事件定位单元对应的持续性定位特征变量对所述AI交互事件定位单元进行定位区间调整,得到所述AI交互事件定位单元对应的已调整定位单元包括:基于所述AI交互事件定位单元对应的持续性定位特征变量和第二设定对应指示,确定所述AI交互事件定位单元的定位区间调整权重;结合所述定位区间调整权重对所述AI交互事件定位单元进行定位区间调整,得到所述AI交互事件定位单元对应的已调整定位单元。
进一步地,第二设定对应指示可以用于反映不同的持续性定位特征变量对应的定位区间调整权重。第二设定对应指示可以基于需要或者基于先验知识进行配置。比如,应答安全等级越大或者交互热度越大对应的定位区间调整权重也就越大。数据传输轨迹不兼容运行日志收集线程时,定位区间调整权重小于1,且不兼容的程度越高,定位区间调整权重越小;数据传输轨迹为兼容运行日志收集线程时,定位区间调整权重大于1,且兼容的程度越高,定位区间调整权重越大。以数据传输轨迹不兼容运行日志收集线程为例,比如在AI交互事件渐渐不兼容运行日志收集线程的过程中,AI交互事件在智能化产线运行日志中的数据集比例变小,AI交互事件定位单元也需要对应减少,且随着AI交互事件相对于运行日志收集线程的变化,AI交互事件定位单元减少的程度也一并增大,即表征AI交互事件定位单元减少程度的定位区间调整权重则会一并减少。相应的,数据传输轨迹为兼容运行日志收集线程时,AI交互事件在智能化产线运行日志中的数据集比例增大,AI交互事件定位单元的范围增加,定位区间调整权重增大。
此外,还可以基于AI技术定制智能化产线运行日志的日志数据特征空间。在一些示例性实施例中,定位区间调整权重包括智能化产线运行日志的日志数据特征空间的第一映射指标(x轴)上的定位区间调整权重和智能化产线运行日志的日志数据特征空间的第二映射指标(y轴)上的定位区间调整权重。比如,在单一生产线环境下,AI交互事件时序优先级变化较多,数据格式变化较少,换言之,AI交互事件定位单元在智能化产线运行日志的日志数据特征空间的第一映射指标应答安全等级较大,在智能化产线运行日志的日志数据特征空间的第二映射指标应答安全等级较小,基于此,为AI交互事件定位单元配置的智能化产线运行日志的日志数据特征空间的第一映射指标上的定位区间调整权重较大,第二映射指标上的定位区间调整权重较小。
在一些示例下,智能化产线运行日志的日志数据特征空间的第一映射指标上的定位区间调整权重为2,智能化产线运行日志的日志数据特征空间的第二映射指标的定位区间调整权重为1.5,进行定位区间调整后,在智能化产线运行日志的日志数据特征空间的第一映射指标上,已调整定位单元的量化值是AI交互事件定位单元的量化值的2倍,在智能化产线运行日志的日志数据特征空间的第二映射指标上,已调整定位单元的横向覆盖指数是AI交互事件定位单元横向覆盖指数的1.5倍。
在一些示例性实施例中,在定位区间调整权重包括尺寸增加权重和尺寸减少权重。在定位区间调整权重不小于1的基础上,定位区间调整权重可理解为尺寸增加权重,在这种情况下对AI交互事件定位单元进行尺寸增加可确定出已调整定位单元,换言之,已调整定位单元的单元尺寸不小于AI交互事件定位单元的单元尺寸。在定位区间调整权重小于1的基础上,定位区间调整权重可理解为尺寸减少权重,在这种情况下对AI交互事件定位单元进行尺寸减少可确定出已调整定位单元,换言之,已调整定位单元的单元尺寸小于AI交互事件定位单元的单元尺寸。
STEP13、基于各个AI交互事件定位单元对应的已调整定位单元和所述第一智能化产线运行日志,确定第一待处理产线运行日志。
进一步地,第一待处理产线运行日志用于表征后续用于进行定向大数据采集的窗口化日志数据。对于本发明实施例而言,可以按照各AI交互事件定位单元对应的已调整定位单元的分布标签(位置标签),对第一智能化产线运行日志进行拆解,从而得到第一待处理产线运行日志。
在一些示例性实施例中,STEP13可以包括对所述各个AI交互事件定位单元对应的已调整定位单元进行加权得到加权定位单元;基于所述加权定位单元和所述第一智能化产线运行日志,得到所述第一待处理产线运行日志。
其中,加权定位单元表示各个AI交互事件定位单元对应的已调整定位单元的融合结果。第一待处理产线运行日志对应于用于匹配全部AI交互事件定位单元对应的已调整定位单元的加权定位单元中,单元尺寸最小的加权定位单元。
在一些示例下,可以基于单一生产线环境和交互生产线环境对STEP13进行展开介绍。
在单一生产线环境下,在STEP11中可以获得到一个AI交互事件定位单元对应的持续性定位特征变量,在STEP12中可确定出一个AI交互事件定位单元对应的已调整定位单元,基于此,在STEP13中,可以按照这一个AI交互事件定位单元在第一智能化产线运行日志中的分布标签,从第一智能化产线运行日志中拆解出第一待处理产线运行日志。
在交互生产线环境下,在STEP11中可以获得到多个AI交互事件定位单元对应的持续性定位特征变量,在STEP12中可确定出多个AI交互事件定位单元对应的已调整定位单元,基于此,在STEP13中需要对各个AI交互事件定位单元对应的已调整定位单元进行加权得到加权定位单元,然后,按照加权定位单元的分布标签,从第一待处理产线运行日志中拆解出第一待处理产线运行日志。鉴于,AI交互事件在第一待处理产线运行日志中所对应的数据集占比过少会导致采集误差,基于此,加权定位单元的单元尺寸不能太大。基于此,对于本发明实施例而言,基于用于匹配全部AI交互事件定位单元对应的已调整定位单元的加权定位单元中,单元尺寸最小的加权定位单元对第一智能化产线运行日志进行数据采集,从而获得第一待处理产线运行日志。如此能够减少AI交互事件在第一待处理产线运行日志中所对应的数据集占比较少的概率,有助于提高定向大数据采集质量。
举例而言,在交互生产线环境下,将对多个已调整定位单元进行加权得到加权定位单元是可以选择的。换言之,在交互生产线环境下,在得到多个AI交互事件定位单元对应的已调整定位单元之后,可以分别基于各个已调整定位单元获得待处理产线运行日志,然后分别对各个待处理产线运行日志进行定向大数据采集,同样可确定出第一智能化产线运行日志的AI交互事件数据集。
在一些示例下,基于第一智能化产线运行日志获得了三个已调整定位单元,每个已调整定位单元对应一个AI交互事件。对三个已调整定位单元进行加权后,得到加权定位单元,加权定位单元可以囊括全部的已调整定位单元。比如,从全部的加权定位单元中选取单元尺寸最小的加权定位单元进行日志数据拆解,可确定出第一待处理产线运行日志。
对于一些传统技术而言,对于交互生产线环境,需要基于每个AI交互事件对应的已调整定位单元,获得每个AI交互事件对应的待处理产线运行日志,然后分别对各个AI交互事件对应的待处理产线运行日志进行定向大数据采集处理。这样一来,交互生产线环境下会造成定向大数据采集的资源开销过大。
对于本发明实施例而言,在交互生产线环境下将全部已调整定位单元进行加权,从而得到一个待处理产线运行日志,之后仅需要对一个待处理产线运行日志进行定向大数据采集处理。这样,将交互生产线环境下需要多轮进行定向大数据采集处理优化为了单轮的定向大数据采集处理,使得交互生产线环境和单一生产线环境下定向大数据采集处理能够避免消耗过多的资源。
STEP14、对所述第一待处理产线运行日志进行定向大数据采集,得到所述第一智能化产线运行日志的AI交互事件数据集。
对于本发明实施例而言,将第一待处理产线运行日志加载到数据拆解网络后,可确定出第一待处理产线运行日志的AI交互事件数据集,该第一待处理产线运行日志的AI交互事件数据集反映了第一待处理产线运行日志中的每个日志数据块是对应于AI交互事件还是对应于非AI交互事件。基于第一待处理产线运行日志的AI交互事件数据集,以及第一待处理产线运行日志在第一智能化产线运行日志的AI交互事件数据集,该第一智能化产线运行日志的AI交互事件数据集反映了第一智能化产线运行日志中的每个日志数据块是AI交互事件还是非AI交互事件。其中,数据拆解网络可以是深度学习模型。也可以是其他类型的神经网络模型。
对于本发明实施例而言,可以基于AI交互事件持续性定位特征变量动态变更待处理产线运行日志的日志内容量,使得待处理产线运行日志能够尽可能匹配AI交互事件的变化,从而减少了在AI交互事件变化时中AI交互事件脱离待处理产线运行日志的可能性以及AI交互事件在待处理产线运行日志中所对应的日志数据集占比太少的可能性,显著提升了针对变化的AI交互事件的定向大数据采集质量。
鉴于无论为单一生产线环境,还是为交互生产线环境,若AI交互事件每次处理都采用新的待处理产线运行日志进行定向大数据采集,则会导致数据采集扰动。为了使待处理产线运行日志所对应的分布标签尽可能不出现扰动,对于本发明实施例而言,可以对待处理产线运行日志进行优化处理。
在一些示例性实施例中,STEP14可以包括:获得第二智能化产线运行日志对应的第二待处理产线运行日志;确定所述第一待处理产线运行日志相较于所述第二待处理产线运行日志的应答安全等级;在所述第一待处理产线运行日志相较于所述第二待处理产线运行日志的应答安全等级大于第一等级判定值的基础上,对所述第一待处理产线运行日志进行定向大数据采集,得到所述第一智能化产线运行日志的AI交互事件数据集。
进一步地,第二智能化产线运行日志与所述第一智能化产线运行日志属于相同智能化产线监测报告,且第二智能化产线运行日志为第一智能化产线运行日志的上一个智能化产线运行日志。以一些示例来看待,第一智能化产线运行日志和第二智能化产线运行日志的数据窗口大小、特征识别度等都一致。
更进一步地,第二待处理产线运行日志表示获得所述第二智能化产线运行日志的AI交互事件数据集时所使用的待处理产线运行日志。对第二待处理产线运行日志进行定向大数据采集处理,可确定出第二智能化产线运行日志的AI交互事件数据集。第二待处理产线运行日志的获得过程可以结合第一待处理产线运行日志的获得过程(STEP11至STEP13)。
在一些示例性实施例中,可以基于第一待处理产线运行日志的设定分布标签与第二待处理产线运行日志的设定分布标签的标签差异,确定第一待处理产线运行日志相较于第二待处理产线运行日志的应答安全等级。
第一等级判定值可以基于需要进行配置,比如,第一等级判定值可以配置为5p或者15p等(p用于表征安全等级的基础值,通常根据实际场景设置为1)。在第一待处理产线运行日志相较于第二待处理产线运行日志的应答安全等级大于第一等级判定值的基础上,表明AI交互事件发生了显著的变化,在这种情况下为了提高定向大数据采集质量和采集安全性,可以对第一待处理产线运行日志进行定向大数据采集,得到第一智能化产线运行日志的AI交互事件数据集。
在一些示例性实施例中,所述方法还可以包括:在所述第一待处理产线运行日志相较于所述第二待处理产线运行日志的应答安全等级不大于所述第一等级判定值的基础上,利用所述第二待处理产线运行日志进行定向大数据采集,得到所述第一智能化产线运行日志的AI交互事件数据集。
在第一待处理产线运行日志相较于第二待处理产线运行日志的应答安全等级不大于第一等级判定值的基础上,表明AI交互事件应答安全等级较小,在这种情况下为了提高进行定向大数据采集的窗口化日志数据的抗干扰性,可以对第二待处理产线运行日志进行定向大数据采集,得到第一智能化产线运行日志的AI交互事件数据集。
在一些示例性实施例中,STEP14可以包括:获得第二智能化产线运行日志对应的第二待处理产线运行日志;确定所述第一待处理产线运行日志相较于所述第二待处理产线运行日志的数据辐射指数;在所述数据辐射指数小于第二等级判定值的基础上,对所述第一待处理产线运行日志进行定向大数据采集,得到所述第一智能化产线运行日志的AI交互事件数据集。
比如,可以将第一待处理产线运行日志与第二待处理产线运行日志的交叉单元尺寸与第二待处理产线运行日志的单元尺寸的比值,确定为第一待处理产线运行日志相较于第二待处理产线运行日志的数据辐射指数(数据窗口的包含概率)。
第二等级判定值可以基于需要进行配置,比如,第二等级判定值可以为0.4或者0.5等。在第一待处理产线运行日志相较于第二待处理产线运行日志的数据辐射指数小于第二等级判定值的基础上,表明AI交互事件发生了显著变化,需要对进行定向大数据采集的待处理产线运行日志进行更新,基于此,可以对第一待处理产线运行日志进行定向大数据采集,得到第一智能化产线运行日志的AI交互事件的数据采集质量。
在一些示例性实施例中,所述方法还可以包括:在所述数据辐射指数不小于所述第二等级判定值的基础上,利用所述第二待处理产线运行日志进行定向大数据采集,得到所述第一智能化产线运行日志的AI交互事件数据集。
在第一待处理产线运行日志相较于第二待处理产线运行日志的数据辐射指数不小于第二等级判定值的基础上,表明任意应答安全等级较小,在这种情况下为了保持AI交互事件的抗干扰性,可以对第二待处理产线运行日志进行定向大数据采集,得到第一智能化产线运行日志的AI交互事件数据集。这样,采用上一个智能化产线运行日志进行定向大数据采集时使用的待处理产线运行日志作为当前运行日志进行定向大数据采集时使用的待处理产线运行日志,使得进行定向大数据采集的待处理产线运行日志是相同运行日志,相应得到的定向大数据采集的噪声不会太多。
后续对获得第一智能化产线运行日志中每个AI交互事件定位单元对应的持续性定位特征变量的示例性过程进行介绍。鉴于这一过程中需要使用用于反映不同产线环境下、不同匹配度的AI交互事件定位单元对应的持续性定位特征变量的第一设定对应指示,所以先对获得第一设定对应指示的过程进行介绍。
第一设定对应指示中包括生产线环境、智能化产线运行日志中的人物与智能化产线监测报告的参考分布标签的匹配度以及持续性定位特征变量。在一些示例性实施例中,所述方法还包括:获得第一智能化产线监测报告;对所述第一智能化产线监测报告中的选定AI交互事件进行应答活动持续分析,得到所述选定AI交互事件对应的AI交互事件定位单元在所述第一智能化产线监测报告的各个智能化产线运行日志中的分布标签;基于所述选定AI交互事件对应的AI交互事件定位单元在所述第一智能化产线监测报告的各个智能化产线运行日志中的分布标签,确定所述选定AI交互事件的交互热度和应答安全等级和第二匹配度;基于所述选定AI交互事件的交互热度和应答安全等级,获得第一持续性定位特征变量;依据所述第一生产线环境、所述第二匹配度和所述第一持续性定位特征变量,生成所述第一设定对应指示。
进一步地,第一智能化产线监测报告对应于第一生产线环境,第一生产线环境可以为单一生产线环境或者交互生产线环境,第一智能化产线监测报告用于表征单一AI交互事件或多个AI交互事件在第一监测条件内的行为变化,其中,第一监测条件与第二运行日志收集线程存在第一匹配度,第二运行日志收集线程表示采集所述第一智能化产线监测报告的运行日志收集线程。
比如,在配置了第二运行日志收集线程之后,可以由AI交互事件在相对于第二运行日志收集线程第一匹配度的状态下的第一监测条件内变化。第二运行日志收集线程可以采集AI交互事件的变化智能化产线监测报告作为第一智能化产线监测报告。基于应答活动持续分析技术对第一智能化产线监测报告中的选定AI交互事件进行持续性分析,可确定出选定AI交互事件对应AI交互事件定位单元在第一智能化产线监测报告的各个智能化产线运行日志中的分布标签。基于选定AI交互事件对应的AI交互事件定位单元在所述第一智能化产线监测报告的各个智能化产线运行日志中的分布标签,确定所述选定AI交互事件的交互热度和应答安全等级和第二匹配度,从而获得第一持续性定位特征变量。基于第一生产线环境、第二匹配度和第一持续性定位特征变量,生成所述第一设定对应指示。
进一步地,第二匹配度用于反映所述选定AI交互事件与所述第一智能化产线监测报告的参考分布标签的匹配度。示例性地,可以将选定AI交互事件的设定分布标签与第一智能化产线监测报告的参考分布标签的匹配度,确定为选定AI交互事件对应的第二匹配度。其中,第一智能化产线监测报告的参考分布标签可以为第一智能化产线监测报告中预先指定的一个分布标签。相应的选定AI交互事件与第一智能化产线监测报告的第一设定数据窗口框之间的匹配度可理解为第二匹配度,或者选定AI交互事件与第一智能化产线监测报告的第二设定数据窗口框之间的匹配度。第二匹配度的大小可以用于表征选定AI交互事件与第二运行日志收集线程之间的匹配度。以第二匹配度用于反映选定AI交互事件与第一智能化产线监测报告的第一设定数据窗口框之间的匹配度为例,第二匹配度越大,表明选定AI交互事件匹配度第二运行日志收集线程越近,第二匹配度越小,表明选定AI交互事件匹配度第二运行日志收集线程越远。以第二匹配度用于反映选定AI交互事件与第一智能化产线监测报告的第二设定数据窗口框之间的匹配度为例,第二匹配度越大,表明选定AI交互事件匹配度第二运行日志收集线程越远,第二匹配度越小,表明选定AI交互事件匹配度第二运行日志收集线程越远。
在一些示例性实施例中,所述方法还包括:在所述第一生产线环境为单一生产线环境的基础上,配置第一智能化产线监测报告中AI交互事件的交互更新描述值大于第一更新描述判定值,以及所述第一监测条件在第二运行日志收集线程的线程映射空间的第一映射指标上特征映射结果的量化值大于第一映射基准值;在所述第一生产线环境为交互生产线环境的基础上,配置第一智能化产线监测报告中AI交互事件的交互更新描述值不大于第二更新描述判定值,以及所述第一监测条件在第二运行日志收集线程的线程映射空间的第一映射指标上特征映射结果的量化值不大于第二映射基准值;其中,所述第二更新描述判定值不大于所述第一更新描述判定值,所述第二映射基准值不大于所述第一映射基准值。
以一些示例来看待,鉴于单一生产线环境下AI交互事件的变化不大,基于此,单一生产线环境下AI交互事件的监测条件较大,交互生产线环境下AI交互事件的监测条件较小。第一匹配度越小,应答安全等级和交互热度越大;第一匹配度越大,应答安全等级和交互热度越小。基于此,第一生产线环境为单一生产线环境下配置的第一智能化产线监测报告中AI交互事件的交互更新描述值和监测条件大于交互生产线环境下配置的第一智能化产线监测报告中的AI交互事件的交互更新描述值和监测条件。另外,在交互生产线环境下的选定AI交互事件可以为多个AI交互事件中的任意一个或者多个AI交互事件。
举例而言,第一更新描述判定值、第一映射基准值、第二更新描述判定值和第二映射基准值可以基于需要进行配置,只需要配置第二更新描述判定值不大于第一更新描述判定值,第二映射基准值不大于第一映射基准值便可。
基于上述内容可以获得第一设定对应指示。基于此,对获得第一智能化产线运行日志中每个AI交互事件定位单元对应的持续性定位特征变量的过程进行介绍。
在一些示例性实施例中,STEP11获得第一智能化产线运行日志中每个AI交互事件定位单元对应的持续性定位特征变量可以包括:对所述第一智能化产线运行日志进行交互事件识别,得到所述第一智能化产线运行日志的交互事件识别信息;依据所述第一智能化产线运行日志的交互事件识别信息,确定所述第一智能化产线运行日志的产线环境描述字段,以及所述第一智能化产线运行日志中每个AI交互事件定位单元对应的相关性评分(皮尔森相关性系数);对于各个所述AI交互事件定位单元,基于所述产线环境描述字段、所述AI交互事件定位单元对应的相关性评分以及第一设定对应指示,确定所述AI交互事件定位单元对应的持续性定位特征变量。
进一步地,交互事件识别信息可以用于反映第一智能化产线运行日志中包括的AI交互事件定位单元的分布标签;产线环境描述字段可以用于反映第一智能化产线运行日志为单一生产线环境下的智能化产线运行日志还是为交互生产线环境下的智能化产线运行日志;相关性评分可以用于反映AI交互事件定位单元中的AI交互事件数据与第一运行日志收集线程之间的匹配度,第一运行日志收集线程表示采集第一智能化产线运行日志的运行日志收集线程。
在交互事件识别信息反映了一个AI交互事件定位单元的分布标签时,可以第一智能化产线运行日志为单一生产线环境下的智能化产线运行日志。在交互事件识别信息反映了多个AI交互事件定位单元的分布标签时,可以确定第一智能化产线运行日志是交互生产线环境下的智能化产线运行日志。
比如,可以基于AI交互事件定位单元在第一智能化产线运行日志中的分布标签,确定AI交互事件定位单元对应的相关性评分。示例性的,可以将AI交互事件定位单元的设定分布标签(在第一智能化产线运行日志的第二映射指标的映射值,确定为AI交互事件定位单元对应的相关性评分。比如,AI交互事件定位单元的单元基准点在第一智能化产线运行日志的第二映射指标的映射值越小,表明AI交互事件与第一运行日志收集线程之间的匹配度越高;AI交互事件定位单元的单元基准点在第一智能化产线运行日志的第二映射指标的映射值越大,表明AI交互事件与第一运行日志收集线程之间的匹配度越低。
对于本发明实施例而言,可以基于产线环境描述字段、所述AI交互事件定位单元对应的相关性评分确定相适应的第一设定对应指示,将适配的第一设定对应指示中的持续性定位特征变量确定为AI交互事件定位单元对应的持续性定位特征变量。
基于上述相同或相似的发明构思,还提供了一种基于工业互联网的数据采集方法的应用环境30的架构示意图,包括互相之间通信的数据采集系统10和智能化生产设备20,数据采集系统10和智能化生产设备20在运行时实现或者部分实现上述方法实施例所描述的技术方案。
进一步地,还提供了一种可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
在本发明实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本发明的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个不间断的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本发明各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,媒体业务服务器10,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。