CN105867323B - 基于动态克隆选择算法的工业云数据安全自动化生产线 - Google Patents

基于动态克隆选择算法的工业云数据安全自动化生产线 Download PDF

Info

Publication number
CN105867323B
CN105867323B CN201610200268.9A CN201610200268A CN105867323B CN 105867323 B CN105867323 B CN 105867323B CN 201610200268 A CN201610200268 A CN 201610200268A CN 105867323 B CN105867323 B CN 105867323B
Authority
CN
China
Prior art keywords
data
detector
self
cloud
memory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201610200268.9A
Other languages
English (en)
Other versions
CN105867323A (zh
Inventor
任立红
王伟凯
丁永生
郝矿荣
陈磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Donghua University
Original Assignee
Donghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Donghua University filed Critical Donghua University
Priority to CN201610200268.9A priority Critical patent/CN105867323B/zh
Publication of CN105867323A publication Critical patent/CN105867323A/zh
Application granted granted Critical
Publication of CN105867323B publication Critical patent/CN105867323B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B19/00Programme-control systems
    • G05B19/02Programme-control systems electric
    • G05B19/418Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM]
    • G05B19/4183Total factory control, i.e. centrally controlling a plurality of machines, e.g. direct or distributed numerical control [DNC], flexible manufacturing systems [FMS], integrated manufacturing systems [IMS] or computer integrated manufacturing [CIM] characterised by data acquisition, e.g. workpiece identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/34Director, elements to supervisory
    • G05B2219/34342Matching closest patterns stored in database with actual components
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/02Total factory control, e.g. smart factories, flexible manufacturing systems [FMS] or integrated manufacturing systems [IMS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physiology (AREA)
  • Quality & Reliability (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Automation & Control Theory (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Manufacturing & Machinery (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及基于动态克隆选择算法的工业云数据安全自动化生产线,特别是涉及一种基于动态克隆选择算法的工业云数据安全存储与高效计算框架的工业自动化生产线,本发明将工业现场采集到的大量生产数据打包作为输入传入云数据中心。存储区应用改进的基于动态克隆选择算法进行数据的安全防护,计算区根据用户请求提取相应的存储数据时,只需发送请求到控制节点,提取相应数据自体集进入存储区进行匹配。对于外界访问,如果得到的数据自体集与存储区服务器中“记忆”自体集完全匹配,则通过认证允许读写数据;如果此轮匹配失败则立即进行“记忆”检测器匹配,若能匹配则允许数据访问;否则,启用常规检测器检测。

Description

基于动态克隆选择算法的工业云数据安全自动化生产线
技术领域
本发明属技术领域,涉及基于动态克隆选择算法的工业云数据安全自动化生产线,特别是涉及一种基于动态克隆选择算法的工业云数据安全存储与高效计算框架的工业自动化生产线。
背景技术
进入21世纪以后,随着社会信息化和网络化的快速发展导致各行各业数据量的爆炸式增长。据不完全统计,2012年全球信息总量达到2.7ZB,而到2015年这一数值预计达到8ZB。如此大规模数据的有效存储与利用对当下科学计算模式提出了新的要求。同时,互联网上的海量计算机资源利用率一直处于不平衡状态,例如,一些企业和用户在某段时间内需要大量的计算和存储资源,而在大部分其他时段内需要的资源量有限。另一方面,数据中心硬件建设和管理维护所需的成本不断增加。因而继网格计算与并行计算之后,云计算模式被提出,用来实现资源和计算能力的分布式共享,解决海量数据的存储和处理问题。
云计算技术作为一种商业模式,它将计算任务分布在大量计算机构成的资源池上,使用用户能够按需获取计算能力、存储空间和信息服务,从而实现负载均衡,提高硬件资源的利用率。云计算在迅猛发展的同时,其安全问题,尤其是数据存储的安全性和隐私性问题日益突出。Gartner 2009年的调查结果显示,七成以上受访企业的首席技术官(ChiefTechnology Officer,CTO)认为不采用云计算的首要原因是存在对数据安全性与隐私性的忧虑;而近年来,Amazon、Google等云计算技术发起者不断被爆出各种安全事故更加剧了人们的担忧。相比于传统的数据安全,云数据中心的数据更加集中,对于企业用户来讲,一旦其存储在云数据中心的数据遭到泄露将给这些企业带来致命的风险。正如网络巨头思科公司首席执行官John Chambers预言,数据安全将成为云计算前进道路上的“噩梦”。
云计算因其具有资源利用率高、节约成本等各方面的优点而将成为未来的主流计算模式。然而,包括隐私保护在内的数据安全存储问题却成为云计算推广的巨大障碍。目前对云计算数据存储安全性技术研究,主要从加密存储、安全审计和密文访问控制三个方面进行展开。加密无疑是保护云中存储数据的安全性和隐私性的重要方法之一,当前对云数据加密存储的研究主要围绕云数据安全存储框架和安全存储技术进行,被关注的安全存储技术包括同态加密技术、基于加解密的数据安全存储技术、支持查询的数据加密技术和面向可信平台的数据安全存储技术。能解决企业存储与快速计算能力不足是云计算的重要优势之一,这意味着云数据中心应该支持海量数据的安全存储。显然,对于海量数据,加密存储并不是一种高效的方式。确实,传统数据加密技术可以给数据带来安全性的保证,但是在云数据中心,数据的存储与快速的数据计算是几乎同步的,对数据的加密存储会影响数据计算的速度。同时,加密存储、安全审计和密文访问控制技术都是被动的数据安全防护机制,对于云环境下实时变化网络环境和高效的计算模式,积极主动的安全防护方式更加适合。
正如以上所说,云安全是制约云计算发展的重要因素。解决云安全难题,提升云计算的数据处理能力是今后大数据时代的必备前提。
发明内容
本发明所要解决的技术问题是提供基于动态克隆选择算法的工业云数据安全自动化生产线,特别是提供一种基于动态克隆选择算法的工业云数据安全存储与高效计算框架的工业自动化生产线。本发明提出的应用于自动化生产线的基于动态克隆选择算法的工业云数据安全存储与高效计算框架,面对复杂变化的云计算网络环境采用更加积极主动的安全防御机制,不但可以实现云数据中心的数据安全更加提升了数据计算速率,为实现智能化的工业生产提供可靠的技术支持。
本发明的基于动态克隆选择算法的工业云数据安全自动化生产线,工业自动化生产线由若干工业机器人组成,所述工业自动化生产线还包括工业现场数据采集模块、云数据中心和终端用户;
所述工业现场数据采集模块通过安装在每个工业机器人的传感器实时采集工业现场数据,通过路由协议汇总到簇头节点并进行数据的异常值剔除以及数据压缩后汇聚到sink节点,再打包传输到所述云数据中心,在云数据中心中形成待存储数据包;
所述云数据中心包括云端数据存储区、云端数据计算区、云端控制节点和云端监测节点;
所述云端数据存储区是由基于Apache的Hadoop分布式系统架构搭建的存储服务器集群,该集群至少包含现场数据形成的自体集以及由自体集产生的检测器集、“记忆”自体集和“记忆”检测器;
所述自体集由待存储数据包经过特征提取并降维得到数据的低维表示,所述自体集采用实值形态空间表示的方法,包含数据热度值;所述数据热度值是指存储数据被访问次数,根据外界访问量自加;根据数据热度值排序,取前n个自体集作为“记忆”自体集,存储在所述云端数据存储区并传输到所述云端控制节点;根据计算区的访问请求赋予其“记忆”自体集,用于与存储区自体集快速匹配,实现计算数据的快速提取;
所述检测器集由多个检测器构成;检测器同样采用特征提取、降维得到数据的低维表示并且采用实值形态空间表示的方法,自适应学习实时变化的网络环境,提取环境中出现的有效特征构成动态疫苗库,对不适合的检测器采用状态变异,实现检测器的动态更新;选择通过自体耐受并且在生命周期内检测率高的检测器作为“记忆”检测器;
所述云端控制节点作为Hadoop平台的唯一NameNote节点,完成将待存储数据包分块存储到各个存储服务器中,各个存储服务器作为DataNote节点,存储区“记忆”自体集传入控制节点;
所述监测节点为监测云端服务器的运行状况;
所述终端用户,是指用户所操作的智能终端,用户通过终端提出访问请求,计算区将用户所需要的计算后的数据回显给用户;
计算区访问存储区数据需要先将访问请求发送到所述云端控制节点,提取存放在所述云端控制节点的“记忆”自体集,然后与所述云端数据存储区的“记忆”自体集进行匹配,如果能够完全匹配成功则允许数据访问;如果不能完全匹配成功,那么将云端控制节点的“记忆”自体集与所述云端数据存储区的“记忆”检测器进行匹配,若能匹配则允许访问,否则启动安全防御机制,即将该访问当做外来入侵,将其数据特征收入疫苗库,为之后的检测器生成提供资源。
数据的存储安全采用动态克隆选择算法,该算法仅相对于检测器而言,存储区成熟检测器的数量与质量决定了云端数据的安全性,如果成熟检测器在一个寿命周期内检测到的入侵次数达到设定阈值,则将其上升为“记忆”检测器;云端作为一个分布式入侵检测系统,每个服务器将自身的“记忆”检测器进行克隆共享,可以大大提升云数据中心的安全系数;云端存储的各项数据是时变的,可以被随时删除也可以随时有新的数据存入云端,对于被删除的数据,存储区删除其相应的自体集;对于新存储的数据,存储区相应将其提取的自体加入自体集,形成自体集的动态更新。
作为优选的技术方案:
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,所述自体集由待存储数据包经过特征提取得到数据的低维表示是指:
(1)设定待存储数据包的样本格式;
其中:
IP地址:采用IPV4(互联网协议第四版)格式,地址长度32位,占用4个字节;
传输协议(Protocol_type):协议类型,离散类型,为TCP、UDP或ICMP;
连接持续时间(Duration):以秒为单位,连续类型,范围是[0,58329];定义为从TCP连接以3次握手建立算起,到FIN/ACK连接结束为止的时间;若为UDP协议类型,则将每个UDP数据包作为一条连接;数据集中出现大量的duration=0的情况,是因为该条连接的持续时间不足1秒;
连接状态(Flag):连接正常或错误的状态,离散类型,共11种。’OTH’,‘REJ’,‘RSTO’,‘RSTOS0′,‘RSTR’,‘S0′,‘S1′,‘S2′,‘S3′,‘SF’,‘SH’;表示该连接是否按照协议要求开始或完成;例如SF表示连接正常建立并终止;S0表示只接到了SYN请求数据包,而没有后面的SYN/ACK。其中SF表示正常,其他10种都是error。
字节数(Src_bytes):从源主机到目标主机的数据的字节数,连续类型,范围是[0,1379963888];
位置信息:指生产线上工业机器人的具体位置,用于唯一区分不同工业机器人,采用编号的方式进行处理,即:1、2、3、4、5、…、N,N=10~1024;
指令信息:指系统对工业机器人下达的操作指令,采用数据匹配的方式进行,(假设采用的工业机器人臂为6自由度,自动化工业生产设备正常情况下是4自由度或者6自由度),采用数字1~6分别对应表示六个自由度:X、Y、Z的移动自由度及绕X、Y、Z的转动自由度;
(2)对于所述待存储数据包中的数据经过Hadoop平台分块存储到存储服务器中,对存储服务器中的数据采用主成分分析(Principal Component Analysis,PCA)的方法进行降维,并且在降维后对数据进行标准化与正规化处理,处理后的数据作为实值形态空间的自体样本,所述自体集合S表示为:
其中,
Ns为采样得到的自体个数;
每个自体表示为:
Si=(Si1,Si2,......,Sid);
其中,
Si表示第i个自体,i=1,2,3,…,Ns
Sij表示第i个自体第j维数据特征,并且d为数据样本特征维数的最大值,即j=1,2,3,…,d;
所述自体集S与自体Si以及其中每个自体数据关系如下:
所述降维是将采集到的高维自体集S通过主成分分析得到自体集的低维空间表示,降维过程如下:
计算自体集S每一维属性均值:
其中,uj表示第j维的平均值;
计算自体集S的协方差矩阵∑=(εab)d×d表示如下:
其中,a,b取值为1,2,3,…,d;
计算协方差矩阵∑的特征值与特征向量:
|∑-λE|=0,其中E为单位矩阵;
得到协方差矩阵∑的特征值λe,其中e=1,2,3,…,d,以及与特征值相对应的特征向量ξe,即:
对特征值λe进行降序排序,依次计算每个主成分贡献率为:累积贡献率为:其中,θ为累积贡献率达到0.99的特征值个数,θ<d;
取前θ个累积贡献率达到0.99的特征值所对应的特征向量,构成转换矩阵A,即:
使得
其中,T为降维后的自体矩阵;
完成高维数据的降维;
所述标准化是指云计算环境下的数据具有多个属性,各属于不同的度量单位,因而需要对其标准化,使得各属性均值为0,方差为1,具体过程为:
令Sij为工业现场采集到第i个数据的第j维特征,uj表示第j维的平均值,sj表示第j维的方差;
然后,对Sij进行标准化处理为:
所述正规化是指为了防止某一维或者某几维对数据影响过大,同时可以加快程序运行的收敛速度,计算正规化如下:
其中,分别为每一维数据特征的数值最大值与最小值;
(3)完成上述(2)的自体集数据处理后,为了实现自体集的匹配和热度值比较需要对原自体增加两个特征属性如下:
Si=(Si1,Si2,......,Sid,rsi,hotvaluei);
其中:
rsi表示第i个自体样本在自体区域覆盖区域半径;
hotvaluei表示第i个自体样本数据的热度值即对应的存储数据被访问的次数。
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,所述检测器集表示为:
其中,
Ndet为检测器个数;
每个检测器表示为:
Di=(Di1,Di2,......,Did,rdi,age,num);
其中,
Di表示第i个检测器;
Dij表示第i个检测器第j维数据特征,并且d为数据样本特征维数的最大值;
rdi表示第i个检测器在非自体区域覆盖区域半径;
age表示第i个检测器样本数据的寿命;
num表示检测器检测到的入侵样本数量;
实值形态空间下,用于亲和度的计算主要是采用Euclidean距离:
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,所述检测器的动态更新为检测器集合模拟生物体细胞中的生老病死的概念,加入age的维度属性;
如果成熟检测器在生成时间T≤age内未检测到非法入侵,则将该检测器进行移位,所述的检测器移位变异方式主要有两种:
在检测器生成初期,无法通过否定选择的检测器样本,通过变异使其远离自体集,成为成熟检测器,变异的方式如下:
其中,rs为自体集半径,rd为检测器半径,affinity为自体集与检测器之间的亲和力数值,也就是超维空间下自体集与检测器的Euclidean距离;
(c)在入侵检测阶段,检测器如果在生命周内没有检测到非法入侵,则将其进行变异,该变异将检测器向自体集靠近,变异方式如下:
如果成熟检测器在生成时间T≤age内检测到非法入侵,在每次检测器检测到入侵时,将该检测器age重置,num数值增加一个单位;当num达到设定的检测数目β时,其中β>5的正整数,该检测器转为“记忆”检测器。
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,对于云计算环境下存储资源服务器的可扩展性,即当云数据中心服务器需求量增大的时候,将“记忆”自体集样本与“记忆”检测器样本克隆到新扩展的服务器中,类似于新生体从母体中获得的先天性免疫机能。
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,所述完全匹配成功是指云端控制节点的“记忆”自体集与所述云端数据存储区的“记忆”自体集在多维空间下的欧式距离为0;所述能匹配成功是指云端控制节点的“记忆”自体集与所述云端数据存储区的“记忆”检测器在多维空间下的欧氏距离小于相应自体与检测器半径,即:
affinity(Di,Sj)<rsi+rdi
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,m的取值如下:
20<m<500,且m∈N*
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,θ为取降维过程中贡献率>0.99的维数,θ的取值如下:
θ<d且θ∈N*
本发明对于云计算环境下存储资源服务器的可扩展性,将“记忆”自体集样本与“记忆”检测器样本克隆到新扩展的服务器中,类似于新生体从母体中获得的先天性免疫机能。本发明的计算区提取控制节点要访问存储区服务器的自体集,经过存储区“记忆”自体集的第一轮匹配,如果二者完全匹配,则允许数据访问,类似于生物免疫系统的二次应答机制,实现快速反应。如果存储服务器第一轮匹配失败则立即经过“记忆”检测器进行匹配,实现较为快速的外界访问资源识别。如果仍然不能匹配,则启用常规检测器检测入侵。经过如此三轮的入侵检测,对于正常数据,本框架可以实现快速的数据提取,否则,可以更加有效的阻止外来入侵,并且提取相应特征组建入侵样本特征库,以实现更加优质的检测器。
有益效果
本发明对比已有技术具有以下创新点:
(1)将生物免疫机制应用到工业云数据安全自动化生产线,而不再仅仅采用被动的密码防护机制。
(2)生物免疫机制能够更加主动的应对外来入侵,同时能够自适应学习网络环境、动态更新检测器集和自体集,因而更加适合复杂多变的云计算环境应用。
(3)采用动态克隆选择算法的工业云数据安全自动化生产线,充分利用生物免疫的“二次应答”机制,能够更加快速地提取存储区数据用于计算,尤其适合海量数据的云存储,可以加快生产线的整体工作效率。
(4)对于云计算的可扩展性,当用户需求量变大需要的服务器增加时,可以将该控制节点的“记忆”自体集与存储区“记忆”检测器集预先克隆到新增的服务器中,使得新增的服务器具有同等数据安全防护能力,类似于生物体的“先天免疫”。
附图说明
图1为云数据安全存储与高效计算整体结构图
图2为实值形态空间入侵检测模型
图3为检测器的两种移位方式图
(a)为检测器生成初期未成熟检测器的变异方式
(b)为入侵检测阶段低效率检测器变异方式
图4为自体集动态更新流程图
图5为检测器动态更新流程图
图6为数据提取流程图
图7为存储区入侵检测流程图
具体实施方式
下面结合具体实施方式,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
本发明的基于动态克隆选择算法的工业云数据安全自动化生产线,该生产线框图如图1所示。工业自动化生产线由若干工业机器人组成,所述工业自动化生产线还包括工业现场数据采集模块、云数据中心和终端用户;
所述工业现场数据采集模块通过安装在每个工业机器人的传感器实时采集工业现场数据,通过路由协议汇总到簇头节点并进行数据的异常值剔除以及数据压缩后汇聚到sink节点,再打包传输到所述云数据中心,在云数据中心中形成待存储数据包;
所述云数据中心包括云端数据存储区、云端数据计算区、云端控制节点和云端监测节点;
所述云端数据存储区是由基于Apache的Hadoop分布式系统架构搭建的存储服务器集群,该集群至少包含现场数据形成的自体集以及由自体集产生的检测器集、“记忆”自体集和“记忆”检测器,理想化的自体集与检测器分布情况如图2所示,其中图中黑色部分表示自体集,白色圆圈表示检测器集;
所述自体集由待存储数据包经过特征提取并降维得到数据的低维表示,如图4所示,所述自体集采用实值形态空间表示的方法,包含数据热度值;所述数据热度值是指存储数据被访问次数,根据外界访问量自加;根据数据热度值排序,取前m个自体集作为“记忆”自体集,存储在所述云端数据存储区并传输到所述云端控制节点;根据计算区的访问请求赋予其“记忆”自体集,用于与存储区自体集快速匹配,实现计算数据的快速提取;
所述检测器集由多个检测器构成;检测器同样采用特征提取、降维得到数据的低维表示并且采用实值形态空间表示的方法,自适应学习实时变化的网络环境,提取环境中出现的有效特征构成动态疫苗库,对不适合的检测器采用状态变异,实现检测器的动态更新,如图5所示;选择通过自体耐受并且在生命周期内检测率高的检测器作为“记忆”检测器;
所述云端控制节点作为Hadoop平台的唯一NameNote节点,完成将待存储数据包分块存储到各个存储服务器中,各个存储服务器作为DataNote节点,存储区“记忆”自体集传入控制节点;
所述监测节点为监测云端服务器的运行状况;
所述终端用户,是指用户所操作的智能终端,用户通过终端提出访问请求,计算区将用户所需要的计算后的数据回显给用户;
计算区访问存储区数据需要先将访问请求发送到所述云端控制节点,提取存放在所述云端控制节点的“记忆”自体集,然后与所述云端数据存储区的“记忆”自体集进行匹配,如果能够完全匹配成功则允许数据访问;如果不能完全匹配成功,那么将云端控制节点的“记忆”自体集与所述云端数据存储区的“记忆”检测器进行匹配,若能匹配则允许访问,否则启动安全防御机制,即将该访问当做外来入侵,将其数据特征收入疫苗库,为之后的检测器生成提供资源。
数据的存储安全采用动态克隆选择算法,该算法仅相对于检测器而言,存储区成熟检测器的数量与质量决定了云端数据的安全性,如果成熟检测器在一个寿命周期内检测到的入侵次数达到设定阈值,则将其上升为“记忆”检测器;云端作为一个分布式入侵检测系统,每个服务器将自身的“记忆”检测器进行克隆共享,可以大大提升云数据中心的安全系数;云端存储的各项数据是时变的,可以被随时删除也可以随时有新的数据存入云端,对于被删除的数据,存储区删除其相应的自体集;对于新存储的数据,存储区相应将其提取的自体加入自体集,形成自体集的动态更新。
作为优选的技术方案:
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,所述自体集由待存储数据包经过特征提取得到数据的低维表示是指:
(1)设定待存储数据包的样本格式;
其中:
IP地址:采用IPV4(互联网协议第四版)格式,地址长度32位,占用4个字节;
传输协议(Protocol_type):协议类型,离散类型,为TCP、UDP或ICMP;
连接持续时间(Duration):以秒为单位,连续类型,范围是[0,58329];定义为从TCP连接以3次握手建立算起,到FIN/ACK连接结束为止的时间;若为UDP协议类型,则将每个UDP数据包作为一条连接;数据集中出现大量的duration=0的情况,是因为该条连接的持续时间不足1秒;
连接状态(Flag):连接正常或错误的状态,离散类型,共11种。’OTH’,‘REJ’,‘RSTO’,‘RSTOS0′,‘RSTR’,‘S0′,‘S1′,‘S2′,‘S3′,‘SF’,‘SH’;表示该连接是否按照协议要求开始或完成;例如SF表示连接正常建立并终止;S0表示只接到了SYN请求数据包,而没有后面的SYN/ACK。其中SF表示正常,其他10种都是error。
字节数(Src_bytes):从源主机到目标主机的数据的字节数,连续类型,范围是[0,1379963888];
位置信息:指生产线上工业机器人的具体位置,用于唯一区分不同工业机器人,采用编号的方式进行处理,即:1、2、3、4、5、…、N,N=10~1024;
指令信息:指系统对工业机器人下达的操作指令,采用数据匹配的方式进行,(假设采用的工业机器人臂为6自由度,自动化工业生产设备正常情况下是4自由度或者6自由度),采用数字1~6分别对应表示六个自由度:X、Y、Z的移动自由度及绕X、Y、Z的转动自由度;
(2)对于所述待存储数据包中的数据经过Hadoop平台分块存储到存储服务器中,对存储服务器中的数据采用主成分分析(Principal Component Analysis,PCA)的方法进行降维,并且在降维后对数据进行标准化与正规化处理,处理后的数据作为实值形态空间的自体样本,所述自体集合S表示为:
其中,
Ns为采样得到的自体个数;
每个自体表示为:
Si=(Si1,Si2,......,Sid);
其中,
Si表示第i个自体,i=1,2,3,…,Ns
Sij表示第i个自体第j维数据特征,并且d为数据样本特征维数的最大值,即
j=1,2,3,…,d;
所述自体集S与自体Si以及其中每个自体数据关系如下:
所述降维是将采集到的高维自体集S通过主成分分析得到自体集的低维空间表示,降维过程如下:
计算自体集S每一维属性均值:
其中,uj表示第j维的平均值;
计算自体集S的协方差矩阵∑=(εab)d×d表示如下:
其中,a,b取值为1,2,3,…,d;
计算协方差矩阵∑的特征值与特征向量:
|∑-λE|=0,其中E为单位矩阵;
得到协方差矩阵∑的特征值λe,其中e=1,2,3,…,d,以及与特征值相对应的特征向量ξe,即:
对特征值λe进行降序排序,依次计算每个主成分贡献率为:累积贡献率为:其中,θ为累积贡献率达到0.99的特征值个数,θ<d;
取前θ个累积贡献率达到0.99的特征值所对应的特征向量,构成转换矩阵A,即:
使得
其中,T为降维后的自体矩阵;
完成高维数据的降维;
所述标准化是指云计算环境下的数据具有多个属性,各属于不同的度量单位,因而需要对其标准化,使得各属性均值为0,方差为1,具体过程为:
令Sij为工业现场采集到第i个数据的第j维特征,uj表示第j维的平均值,sj表示第j维的方差;
然后,对Sij进行标准化处理为:
所述正规化是指为了防止某一维或者某几维对数据影响过大,同时可以加快程序运行的收敛速度,计算正规化如下:
其中,分别为每一维数据特征的数值最大值与最小值;
(3)完成上述(2)的自体集数据处理后,为了实现自体集的匹配和热度值比较需要对原自体增加两个特征属性如下:
Si=(Si1,Si2,......,Sid,rsi,hotvaluei);
其中:
rsi表示第i个自体样本在自体区域覆盖区域半径;
hotvaluei表示第i个自体样本数据的热度值即对应的存储数据被访问的次数。
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,所述检测器集表示为:
其中,
Ndet为检测器个数;
每个检测器表示为:
Di=(Di1,Di2,......,Did,rdi,age,num);
其中,
Di表示第i个检测器;
Dij表示第i个检测器第j维数据特征,并且d为数据样本特征维数的最大值;
rdi表示第i个检测器在非自体区域覆盖区域半径;
age表示第i个检测器样本数据的寿命;
num表示检测器检测到的入侵样本数量;
实值形态空间下,用于亲和度的计算主要是采用Euclidean距离:
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,所述检测器的动态更新为检测器集合模拟生物体细胞中的生老病死的概念,加入age的维度属性;
如果成熟检测器在生成时间T≤age内未检测到非法入侵,则将该检测器进行移位,所述的检测器移位变异方式主要有两种,如图3所示:
其中,图3(a)为在检测器生成初期,无法通过否定选择的检测器样本,通过变异使其远离自体集,成为成熟检测器,变异的方式如下:
其中,rs为自体集半径,rd为检测器半径,affinity为自体集与检测器之间的亲和力数值,也就是超维空间下自体集与检测器的Euclidean距离;
图3(b)为在入侵检测阶段,检测器如果在生命周内没有检测到非法入侵,则将其进行变异,该变异将检测器向自体集靠近,变异方式如下:
如果成熟检测器在生成时间T≤age内检测到非法入侵,在每次检测器检测到入侵时,将该检测器age重置,num数值增加一个单位;当num达到设定的检测数目β时,其中β>5的正整数,该检测器转为“记忆”检测器。
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,对于云计算环境下存储资源服务器的可扩展性,即当云数据中心服务器需求量增大的时候,将“记忆”自体集样本与“记忆”检测器样本克隆到新扩展的服务器中,类似于新生体从母体中获得的先天性免疫机能。
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,所述完全匹配成功是指云端控制节点的“记忆”自体集与所述云端数据存储区的“记忆”自体集在多维空间下的欧式距离为0;所述能匹配成功是指云端控制节点的“记忆”自体集与所述云端数据存储区的“记忆”检测器在多维空间下的欧氏距离小于相应自体与检测器半径,即:
affinity(Di,Sj)<rsi+rdi
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,m的取值如下:
20<m<500,且m∈N*
如上所述的基于动态克隆选择算法的工业云数据安全自动化生产线,θ为取降维过程中贡献率>0.99的维数,θ的取值如下:
θ<d且θ∈N*
计算区提取控制节点要访问存储区服务器的自体集,提取过程如图6所示,经过存储区“记忆”自体集的第一轮匹配,如果二者完全匹配,则允许数据访问,类似于生物免疫系统的二次应答机制,实现快速反应。如果存储服务器第一轮匹配失败则立即经过“记忆”检测器进行匹配,实现较为快速的外界访问资源识别。如果仍然不能匹配,则启用常规检测器检测入侵。匹配规则流程图如图7所示,经过如此三轮的入侵检测,对于正常数据,本发明可以实现快速的数据提取,否则,可以更加有效的阻止外来入侵,并且提取相应特征组建入侵样本特征库,以实现更加优质的检测器。

Claims (8)

1.基于动态克隆选择算法的工业云数据安全自动化生产线,工业自动化生产线由若干工业机器人组成,其特征是:所述工业自动化生产线还包括工业现场数据采集模块、云数据中心和终端用户;
所述工业现场数据采集模块通过安装在每个工业机器人的传感器实时采集工业现场数据,通过路由协议汇总到簇头节点并进行数据的异常值剔除以及数据压缩后汇聚到sink节点,再打包传输到所述云数据中心,在云数据中心中形成待存储数据包;
所述云数据中心包括云端数据存储区、云端数据计算区、云端控制节点和云端监测节点;
所述云端数据存储区是由基于Apache的Hadoop分布式系统架构搭建的存储服务器集群,该集群至少包含现场数据形成的自体集以及由自体集产生的检测器集、“记忆”自体集和“记忆”检测器;
所述自体集由待存储数据包经过特征提取、标准化和正规化得到数据的低维表示,所述自体集采用实值形态空间的表示方法,包含数据热度值;所述数据热度值是指存储数据被访问次数,根据外界访问量自加;根据数据热度值排序,取前m个自体集作为“记忆”自体集,存储在所述云端数据存储区并传输到所述云端控制节点;
所述检测器集由多个检测器构成;检测器同样采用特征提取、标准化和正规化得到数据的低维表示,并且采用实值形态空间的表示方法,自适应学习实时变化的网络环境,提取环境中出现的有效特征构成动态疫苗库,对不适合的检测器采用状态变异,实现检测器的动态更新;选择通过自体耐受并且在生命周期内检测率高的检测器作为“记忆”检测器;
所述云端控制节点作为Hadoop平台的唯一NameNote节点,完成将待存储数据包分块存储到各个存储服务器中,各个存储服务器作为DataNote节点,存储区“记忆”自体集传入控制节点;
所述监测节点为监测云端服务器的运行状况;
所述终端用户,是指用户所操作的智能终端,用户通过终端提出访问请求,计算区将用户所需要的计算后的数据回显给用户;
计算区访问存储区数据需要先将访问请求发送到所述云端控制节点,提取存放在所述云端控制节点的“记忆”自体集,然后与所述云端数据存储区的“记忆”自体集进行匹配,如果能够完全匹配成功则允许数据访问;如果不能完全匹配成功,那么将云端控制节点的“记忆”自体集与所述云端数据存储区的“记忆”检测器进行匹配,若能匹配则允许访问,否则启动安全防御机制,即将该访问当作外来入侵,将其数据特征收入疫苗库,为之后的检测器生成提供资源。
2.根据权利要求1所述的基于动态克隆选择算法的工业云数据安全自动化生产线,其特征在于,所述自体集由待存储数据包经过特征提取得到数据的低维表示是指:
(1)设定待存储数据包的样本格式;
其中:
IP地址:采用IPV4;
传输协议:TCP、UDP或ICMP;
连接持续时间:以秒为单位,连续类型,范围是[0,58329];
连接状态:连接正常或错误的状态;
字节数:从源主机到目标主机的数据的字节数,连续类型,范围是[0,1379963888];
位置信息:指生产线上工业机器人的具体位置,用于唯一区分不同工业机器人,采用编号的方式进行处理,即:1、2、3、4、5、…、N,N=10~1024;
指令信息:指系统对工业机器人下达的操作指令,采用数据匹配的方式进行,采用数字1~6分别对应表示六个自由度:X、Y、Z的移动自由度及绕X、Y、Z的转动自由度;
(2)对于所述待存储数据包中的数据经过Hadoop平台分块存储到存储服务器中,对存储服务器中的数据采用主成分分析的方法进行降维,并且在降维后对数据进行标准化与正规化处理,处理后的数据作为实值形态空间的自体,所述自体集S表示为:
S=(S1,S2,......,SNs);
其中,
Ns为采样得到的自体个数;
每个自体表示为:
Si=(Si1,Si2,......,Sid);
其中,
Si表示第i个自体,i=1,2,3,…,Ns
Sij表示第i个自体第j维数据特征,并且d为数据样本特征维数的最大值,即j=1,2,3,…,d;
所述自体集S与自体Si以及其中每个自体数据关系如下:
所述降维是将采集到的高维自体集S通过主成分分析得到自体集的低维空间表示,降维过程如下:
计算自体集S每一维属性均值:
其中,μj表示第j维的平均值;
计算自体集S的协方差矩阵∑=(εab)d×d表示如下:
其中,a,b取值为1,2,3,…,d;
计算协方差矩阵∑的特征值与特征向量:
|∑-λE|=0,其中E为单位矩阵;
得到协方差矩阵∑的特征值λe,其中e=1,2,3,…,d,以及与特征值相对应的特征向量ξe,即:
对特征值λe进行降序排序,依次计算每个主成分贡献率为:累积贡献率为:其中,θ为累积贡献率达到0.99的特征值个数,θ<d;
取前θ个累积贡献率达到0.99的特征值所对应的特征向量,构成转换矩阵A,即:
使得
其中,T为降维后的自体矩阵;
完成高维数据的降维;
所述标准化是指云计算环境下的数据具有多个属性,各属于不同的度量单位,因而需要对其标准化,使得各属性均值为0,方差为1,具体过程为:
令Sij为工业现场采集到第i个数据的第j维特征,μj表示第j维的平均值,sj表示第j维的方差;
然后,对Sij进行标准化处理为:
所述正规化是指为了防止某一维或者某几维对数据影响过大,同时可以加快程序运行的收敛速度,计算正规化如下:
其中,分别为每一维数据特征的数值最大值与最小值;(3)完成上述(2)的自体集数据处理后,为了实现自体集的匹配和热度值比较需要对原自体增加两个特征属性如下:
Si=(Si1,Si2,......,Sid,rsi,hotvaluei);
其中:
rsi表示第i个自体样本在自体区域覆盖区域半径;
hotvaluei表示第i个自体样本数据的热度值即对应的存储数据被访问的次数。
3.根据权利要求2所述的基于动态克隆选择算法的工业云数据安全自动化生产线,其特征在于,所述检测器集表示为:
其中,
Ndet为检测器个数;
每个检测器表示为:
Di=(Di1,Di2,......,Did,rdi,age,num);
其中,
Di表示第i个检测器;
Dij表示第i个检测器第j维数据特征,并且d为数据样本特征维数的最大值;
rdi表示第i个检测器在非自体区域覆盖区域半径;
age表示第i个检测器样本数据的寿命;
num表示检测器检测到的入侵样本数量;
实值形态空间下,用于亲和度的计算主要是采用Euclidean距离:
4.根据权利要求3所述的基于动态克隆选择算法的工业云数据安全自动化生产线,其特征在于,所述检测器的动态更新为检测器集合模拟生物体细胞中生老病死的概念,加入age的维度属性;
如果成熟检测器在生成时间T≤age内未检测到非法入侵,则将该检测器进行移位,所述的检测器移位变异方式主要有两种:
(a)在检测器生成初期,无法通过否定选择的检测器样本,通过变异使其远离自体集,成为成熟检测器,变异的方式如下:
其中,为变异前自体集与检测器样本所构成的方向向量,为该方向向量的模,为变异后的自体集与检测器样本所构成的方向向量,rs为自体集半径,rd为检测器半径,affinity为自体集与检测器之间的亲和力数值,也就是超维空间下自体集与检测器的Euclidean距离;
(b)在入侵检测阶段,检测器如果在生命周内没有检测到非法入侵,则将其进行变异,该变异将检测器向自体集靠近,变异方式如下:
其中,为变异前检测器样本与自体集所构成的方向向量,为该方向向量的模,为变异后检测器样本与自体集所构成的方向向量,如果成熟检测器在生成时间T≤age内检测到非法入侵,在每次检测器检测到入侵时,将该检测器age重置,num数值增加一个单位;当num达到设定的检测数目β时,其中β>5的正整数,该检测器转为“记忆”检测器。
5.根据权利要求1所述的基于动态克隆选择算法的工业云数据安全自动化生产线,其特征在于,对于云计算环境下存储服务器的可扩展性,即当云数据中心服务器需求量增大的时候,将“记忆”自体集样本与“记忆”检测器样本克隆到新扩展的服务器中。
6.根据权利要求4所述的基于动态克隆选择算法的工业云数据安全自动化生产线,其特征在于,所述完全匹配成功是指云端控制节点的“记忆”自体集与所述云端数据存储区的“记忆”自体集在多维空间下的欧式距离为0;所述能匹配是指云端控制节点的“记忆”自体集与所述云端数据存储区的“记忆”检测器在多维空间下的欧氏距离小于相应自体与检测器半径之和,即:affinity(Di,Sj)<rsi+rdi
7.根据权利要求1所述的基于动态克隆选择算法的工业云数据安全自动化生产线,其特征在于,20<m<500,且m∈N*。
8.根据权利要求4所述的基于动态克隆选择算法的工业云数据安全自动化生产线,其特征在于,θ为取降维过程中贡献率>0.99的维数,θ<d且θ∈N*
CN201610200268.9A 2016-03-31 2016-03-31 基于动态克隆选择算法的工业云数据安全自动化生产线 Expired - Fee Related CN105867323B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610200268.9A CN105867323B (zh) 2016-03-31 2016-03-31 基于动态克隆选择算法的工业云数据安全自动化生产线

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610200268.9A CN105867323B (zh) 2016-03-31 2016-03-31 基于动态克隆选择算法的工业云数据安全自动化生产线

Publications (2)

Publication Number Publication Date
CN105867323A CN105867323A (zh) 2016-08-17
CN105867323B true CN105867323B (zh) 2018-10-23

Family

ID=56626936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610200268.9A Expired - Fee Related CN105867323B (zh) 2016-03-31 2016-03-31 基于动态克隆选择算法的工业云数据安全自动化生产线

Country Status (1)

Country Link
CN (1) CN105867323B (zh)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977072B (zh) * 2017-07-28 2021-06-08 北京物灵智能科技有限公司 一种机器人使用的养成方法、养成专家系统及电子设备
CN107766051B (zh) * 2017-08-18 2020-06-05 爱乐云(杭州)科技有限公司 一种基于程序云的智能硬件管理控制系统及方法
CN108107729B (zh) * 2017-12-15 2019-11-08 东华大学 基于类脑分层记忆机制的实时数据流智能化处理平台
CN108540539A (zh) * 2018-03-20 2018-09-14 深圳大图科创技术开发有限公司 一种空气污染智能监测系统
CN110320890B (zh) * 2019-07-08 2021-08-03 北京科技大学 一种针对plc控制系统的入侵检测系统
WO2021014703A1 (ja) * 2019-07-19 2021-01-28 パナソニックIpマネジメント株式会社 実装基板製造システムおよび実装基板製造方法ならびに整合性判定装置
CN110647585A (zh) * 2019-09-24 2020-01-03 江苏医健大数据保护与开发有限公司 一种起到自动筛选和备份功能的数据部署系统
CN112347140A (zh) * 2020-10-19 2021-02-09 上海微亿智造科技有限公司 面向工业大数据的数据处理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101782771A (zh) * 2010-03-17 2010-07-21 东华大学 基于免疫神经网络的纺丝工艺智能优化设计方法
CN102833228A (zh) * 2012-07-27 2012-12-19 江苏亿通高科技股份有限公司 一种云计算环境下免疫网络的病毒检测系统及方法
CN103036998A (zh) * 2012-12-21 2013-04-10 北京邮电大学 云计算中一种基于免疫原理的入侵检测系统

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9246920B2 (en) * 2013-10-09 2016-01-26 Globalfoundries Inc. Cloud resource cloning based on collaborative content

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101782771A (zh) * 2010-03-17 2010-07-21 东华大学 基于免疫神经网络的纺丝工艺智能优化设计方法
CN102833228A (zh) * 2012-07-27 2012-12-19 江苏亿通高科技股份有限公司 一种云计算环境下免疫网络的病毒检测系统及方法
CN103036998A (zh) * 2012-12-21 2013-04-10 北京邮电大学 云计算中一种基于免疫原理的入侵检测系统

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
基于人工免疫的入侵检测模型在云计算平台下的研究;宋诗阳;《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》;20150215(第2期);全文 *
基于多维免疫的云计算数据安全技术研究;戴跃发;《中国优秀硕士学位论文全文数据库(电子期刊)信息科技辑》;20111215(第S2期);全文 *

Also Published As

Publication number Publication date
CN105867323A (zh) 2016-08-17

Similar Documents

Publication Publication Date Title
CN105867323B (zh) 基于动态克隆选择算法的工业云数据安全自动化生产线
An et al. Sample selected extreme learning machine based intrusion detection in fog computing and MEC
CN110784481B (zh) SDN网络中基于神经网络的DDoS检测方法及系统
Ali et al. A new intrusion detection system based on fast learning network and particle swarm optimization
Zhong et al. A systematic survey of data mining and big data analysis in internet of things
US9594907B2 (en) Unauthorized activity detection and classification
Ortet Lopes et al. Towards effective detection of recent DDoS attacks: A deep learning approach
Sharma et al. An efficient hybrid deep learning model for denial of service detection in cyber physical systems
Yang et al. An enhanced intrusion detection system for IoT networks based on deep learning and knowledge graph
He et al. 6g-enabled consumer electronics device intrusion detection with federated meta-learning and digital twins in a meta-verse environment
CN114785548A (zh) 基于加权自适应集成学习的虚拟流量异常检测方法、系统及流量智能监测平台
Xue et al. Prediction of computer network security situation based on association rules mining
Ahuja et al. DDoS attack traffic classification in SDN using deep learning
Roy et al. Top-Performing Unifying Architecture for Network Intrusion Detection in SDN Using Fully Convolutional Network
Hu et al. Classification of Abnormal Traffic in Smart Grids Based on GACNN and Data Statistical Analysis
Siddharthan et al. A novel framework approach for intrusion detection based on improved critical feature selection in Internet of Things networks
Ding et al. A data-driven based security situational awareness framework for power systems
CN115065519A (zh) 分布式边端协同的DDoS攻击实时监测方法
Shi et al. Privacy protection and intrusion detection system of wireless sensor network based on artificial neural network
Li et al. Distributed computing framework of intelligent sensor network for electric power internet of things
Salim et al. Intrusion Detection System In Iot Network Using Machine Learning
Hongwei et al. An information security analysis method of Internet of things based on balanced double SVM
Zhang et al. De privacy encryption and extraction model of smart grid data based on Spark Streaming
Ma et al. Optimized Random Forest for DDoS Attack Detection in SDN Environment
Yang et al. Optimization of Dynamic Routing Algorithm in SDN Network Based on Data Mining

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20181023

Termination date: 20210331

CF01 Termination of patent right due to non-payment of annual fee