基于内容过滤和多Agent协作的有源配电网大数据传输方法
技术领域
本发明涉及基于内容过滤和多Agent协作的有源配电网大数据传输方法,属于电力信息安全技术领域。
背景技术
配电网作为电力系统的重要组成部分,是智能电网建设的核心内容之一。尤其是近年来,随着大规模分布式能源、储能、柔性负荷等多元分布式设备和组件(如微网、充电桩等)单元的广泛接入,配电网正朝着有源配电网方向发展。相比传统配电网,有源配电网的组成以及源网荷间的互动关系更加频繁和复杂。随着配电自动化、用电信息采集等应用系统的推广应用,对于有千条馈线的大规模配电网,配电网中会产生指数级增长的海量异构、多态的数据,数据集合的大小达到了当今信息学界所关注的“大数据”级别。
随着无线通信、物联网等先进信息通信技术在有源配电网中的大量应用,整个有源配电网面临来自互联网的病毒、木马与黑客攻击的威胁日趋严重,同时来自信息通信网络内部的恶意攻击也可能使得整个有源配电网的控制网络崩溃。而现有的电力二次系统安全防护方案中并没有考虑有源配电网信息通信网络内部以及与外部交互时的安全防护问题,特别是随着坚强智能电网不断深入建设,有源配电网具有更加复杂的接入环境、灵活多样的接入方式(如GPRS、WiFi以及光纤通信等)、数量庞大的智能接入终端(如各类分布式能源的信息采集终端、配电设备和线路运行状态监测终端等)和动态分布的海量接入数据。因此,保证传输过程中有源配电网大数据的安全性和高效性,对提高传输速度、减小数据存储空间以及降低数据传输安全风险等方面都具有十分重要的意义。
发明内容
本发明所要解决的技术问题是提供一种基于内容过滤和多Agent协作的有源配电网大数据传输方法,能够针对有源配电网大数据,实现高效安全的传输。
本发明为了解决上述技术问题采用以下技术方案:本发明设计了一种基于内容过滤和多Agent协作的有源配电网大数据传输方法,包括如下步骤,其中数据发送方执行如下步骤001至步骤009,数据接收方执行步骤010至步骤016:
步骤001.采集有源配电网大数据样本,并针对有源配电网数据样本进行量化、归一化预处理,获得待处理训练样本数据集,进入步骤002;
步骤002.从待处理训练样本数据集中随机选择两个数据,初始化分别作为两个聚类中心,并进入步骤003;
步骤003.针对待处理训练样本数据集中除两个聚类中心所对应数据以外的其它各个数据,分别计算各个数据分别到两个聚类中心的欧式距离,然后分别将各个数据划分至其相对两个聚类中心,欧式距离较近的聚类中心所对应的聚类中,构成两个聚类中心分别所对应的聚类,并进入步骤004;
步骤004.针对获得的两个聚类,分别计算更新该两个聚类的聚类中心,并进入步骤005;
步骤005.针对两个聚类,判断是否存在更新后聚类中心的均值与对应更新前聚类中心的均值不相等的情况,是则返回步骤003;否则将该两个聚类作为内容过滤模型,并进入步骤006;
步骤006.针对有源配电网大数据的传输过程进行监测,判断是否发生数据泄露行为,是则进入步骤007;否则进入步骤008;
步骤007.根据内容过滤模型,判断待发送有源配电网大数据是否是敏感数据,是则针对该待发送有源配电网大数据插入数据自保护标记,更新待发送有源配电网大数据,并进入步骤008;否则直接进入步骤008;
步骤008.将待发送有源配电网大数据D转化为N×1的矩阵x,构建如下模型,并进入步骤009;
x=Ψα
其中,Ψ为预设N×N的矩阵,是矩阵x的稀疏基;α为N×1的矩阵;
步骤009.根据如下模型,将矩阵x投影到一组预设测量向量Φ上,获得与待发送有源配电网大数据存在对应关系的电网数据y,并针对电网数据y进行传输,进入步骤010;
y=Φx=ΦΨα=Θα
其中,Φ为预设M×N观测矩阵,且Φ为正定矩阵;y为M×1的矩阵,Θ为M×N感知矩阵;
步骤010.数据接收方接收电网数据y,并针对接收到的电网数据y,构建与l0范数等价的l1范数下的最优模型如下所示,进入步骤011;
其中,表示α的l1范数;
步骤011.针对接收到的电网数据y,初始化基因表达式编程算法的种群,并根据计算资源的数量K,针对基因表达式编程算法的种群进行平均划分获得K个子种群,进入步骤012;
步骤012.针对电网数据y,构建适应度评价函数并进入步骤013;其中,表示取2-范数运算;表示α的估计值;
步骤013.初始化适应度评价中的遗传代数,并根据适应度评价函数分别针对各个子种群,以函数值f取得最小值为目标进行适应度评价,进入步骤014;
步骤014.分别获得各个子种群中适应度值最大的个体,并且针对各个子种群中适应度值最大的个体进行两两彼此交换,更新获得各个子种群,进入步骤015;
步骤015.判断遗传代数是否达到预设最大遗传代数,是则数据接收方根据适应度评价函数中f所取得的最小值、电网数据y,以及预设在数据接收方的Θ,获得α的最优值,并进入步骤016;否则返回步骤013;
步骤016.数据接收方根据α的最优值和预设在数据接收方的Ψ,以及模型x=Ψα,重构获得矩阵x,最后针对矩阵x进行投影映射恢复获得有源配电网大数据D。
作为本发明的一种优选技术方案:所述步骤007中的数据自保护标记为数据传输阻断标记,用于阻断其所在待发送有源配电网大数据的传输。
作为本发明的一种优选技术方案:所述步骤007中的数据自保护标记为数据自销毁标记,用于在数据接收方,自动针对数据自销毁标记所在的有源配电网大数据进行销毁操作。
作为本发明的一种优选技术方案:所述步骤013中,分别针对各个子种群进行适应度评价后,分别针对各个子种群依次进行选择操作、变异操作、一点重组操作,以及两点重组操作。
作为本发明的一种优选技术方案:所述步骤016中,数据接收方根据α的最优值和预设已知的Ψ,以及模型x=Ψα,重构获得矩阵x,最后通过最小二乘法针对矩阵x进行投影映射恢复获得有源配电网大数据D。
本发明所述基于内容过滤和多Agent协作的有源配电网大数据传输方法采用以上技术方案与现有技术相比,具有以下技术效果:本发明设计的基于内容过滤和多Agent协作的有源配电网大数据传输方法,主要用于解决有源配电网大数据安全高效传输的问题,通过使用本发明中提出的方法可以实现有源配电网大数据的安全可靠高效传输。
附图说明
图1是本发明设计基于内容过滤和多Agent协作的有源配电网大数据传输方法的流程示意图。
具体实施方式
下面结合说明书附图对本发明的具体实施方式作进一步详细的说明。
有源配电网数据安全高效传输主要需考虑两个方面的问题:(1)如何选择一种技术来有效保证有源配电网大数据传输过程中的安全性;(2)如何利用压缩感知方法来保证大数据传输速度的高效性。对于有源配电网数据安全高效传输而言,选择一个合适的方法来保证大数据在传输过程中不被泄露和高效性,有诸多因素需要考虑:首先采集到的有源配电网大数据进行量化和归一化处理后,如何利用内容过滤方法来快速识别传输过程中的大数据是否为敏感数据;同时如何对待传输的大数据进行分布式快速压缩,提高传输效率和存储空间利用率都是有源配电网下大数据安全高效传输的关键技术。
如图1所示,本发明设计基于内容过滤和多Agent协作的有源配电网大数据传输方法,在实际应用过程当中,包括如下步骤,其中,对于数据发送方和数据接收方来说,数据发送方执行如下步骤001至步骤009,数据接收方执行步骤010至步骤016:
步骤001.采集有源配电网大数据样本,并针对有源配电网数据样本进行量化、归一化预处理,获得待处理训练样本数据集,进入步骤002。
步骤002.从待处理训练样本数据集中随机选择两个数据,初始化分别作为两个聚类中心,并进入步骤003。
步骤003.针对待处理训练样本数据集中除两个聚类中心所对应数据以外的其它各个数据,分别计算各个数据分别到两个聚类中心的欧式距离,然后分别将各个数据划分至其相对两个聚类中心,欧式距离较近的聚类中心所对应的聚类中,构成两个聚类中心分别所对应的聚类,并进入步骤004。
步骤004.针对获得的两个聚类,分别计算更新该两个聚类的聚类中心,并进入步骤005。
步骤005.针对两个聚类,判断是否存在更新后聚类中心的均值与对应更新前聚类中心的均值不相等的情况,是则返回步骤003;否则将该两个聚类作为内容过滤模型,并进入步骤006,这里的内容过滤模型即为敏感数据聚类和普通数据聚类。
步骤006.针对有源配电网大数据的传输过程进行监测,判断是否发生数据泄露行为(被监听、窃取、非法拷贝等各类网络传输异常行为),是则进入步骤007;否则进入步骤008。
步骤007.根据内容过滤模型,判断待发送有源配电网大数据是否是敏感数据,即根据敏感数据聚类和普通数据聚类,判断待发送有源配电网大数据是否是敏感数据,是则针对该待发送有源配电网大数据插入数据自保护标记,更新待发送有源配电网大数据,并进入步骤008;否则直接进入步骤008。
其中,这里所说的数据自保护标记为数据传输阻断标记,用于阻断其所在待发送有源配电网大数据的传输;或者,数据自保护标记为数据自销毁标记,用于在数据接收方,自动针对数据自销毁标记所在的有源配电网大数据进行销毁操作。
步骤008.将待发送有源配电网大数据D转化为N×1的矩阵x,构建如下模型,并进入步骤009;
x=Ψα
其中,Ψ为预设N×N的矩阵,是矩阵x的稀疏基;α为N×1的矩阵。
步骤009.根据如下模型,将矩阵x投影到一组预设测量向量Φ上,获得与待发送有源配电网大数据存在对应关系的电网数据y,并针对电网数据y进行传输,进入步骤010;
y=Φx=ΦΨα=Θα
其中,Φ为预设M×N观测矩阵,且Φ为正定矩阵;y为M×1的矩阵,Θ为M×N感知矩阵。
步骤010.数据接收方接收电网数据y,并针对接收到的电网数据y,构建与l0范数等价的l1范数下的最优模型如下所示,进入步骤011;
其中,表示α的l1范数。
步骤011.针对接收到的电网数据y,初始化基因表达式编程算法的种群,并根据计算资源的数量K,针对基因表达式编程算法的种群进行平均划分获得K个子种群,各个子种群分别代表一个Agent,即子种群Agent,进入步骤012。
步骤012.针对电网数据y,构建适应度评价函数并进入步骤013;其中,表示取2-范数运算;表示α的估计值。
步骤013.初始化适应度评价中的遗传代数,并根据适应度评价函数分别针对各个子种群Agent,以函数值f取得最小值为目标进行适应度评价,并且在分别针对各个子种群Agent进行适应度评价后,分别针对各个子种群Agent依次进行选择操作、变异操作、一点重组操作,以及两点重组操作,然后进入步骤014。
步骤014.分别获得各个子种群Agent中适应度值最大的个体,并且针对各个子种群Agent中适应度值最大的个体进行两两彼此交换,更新获得各个子种群Agent,进入步骤015。
步骤015.判断遗传代数是否达到预设最大遗传代数,是则数据接收方根据适应度评价函数中f所取得的最小值、电网数据y,以及预设在数据接收方的Θ,获得α的最优值,并进入步骤016;否则返回步骤013。
步骤016.数据接收方根据α的最优值和预设已知的Ψ,以及模型x=Ψα,重构获得矩阵x,最后通过最小二乘法针对矩阵x进行投影映射恢复获得有源配电网大数据D。
基于上述技术方案设计的基于内容过滤和多Agent协作的有源配电网大数据传输方法,能够有效实现有源配电网大数据的安全可靠高效传输,保证了有源配电网大数据在传输过程中的高效与稳定。
上面结合附图对本发明的实施方式作了详细说明,但是本发明并不限于上述实施方式,在本领域普通技术人员所具备的知识范围内,还可以在不脱离本发明宗旨的前提下做出各种变化。