CN110209745B - 基于Radviz的智能电网数据聚类可视化方法 - Google Patents

基于Radviz的智能电网数据聚类可视化方法 Download PDF

Info

Publication number
CN110209745B
CN110209745B CN201910455701.7A CN201910455701A CN110209745B CN 110209745 B CN110209745 B CN 110209745B CN 201910455701 A CN201910455701 A CN 201910455701A CN 110209745 B CN110209745 B CN 110209745B
Authority
CN
China
Prior art keywords
parameter
parameters
ant
arrangement
max
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201910455701.7A
Other languages
English (en)
Other versions
CN110209745A (zh
Inventor
何建
张琳
邹见效
于力
徐红兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201910455701.7A priority Critical patent/CN110209745B/zh
Publication of CN110209745A publication Critical patent/CN110209745A/zh
Application granted granted Critical
Publication of CN110209745B publication Critical patent/CN110209745B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于Radviz的智能电网数据聚类可视化方法,根据需要设置智能电网参数并获取数据记录,对智能电网参数进行降维,将降维后的数据记录进行聚类,然后计算降维后的智能电网参数两两之间的相似性,求取令矩阵相似性函数最小的最优参数排列,矩阵相似性函数通过智能电网参数之间的相似性计算;然后根据最优参数排列对各条数据记录进行Radviz聚类可视化。本发明通过引入矩阵相似性函数求取最优参数排序,提高智能电网数据聚类可视化效果。

Description

基于Radviz的智能电网数据聚类可视化方法
技术领域
本发明属于智能电网数据可视化技术领域,更为具体地讲,涉及一种基于Radviz的智能电网数据聚类可视化方法。
背景技术
由于智能电网中数据维数比较多,普通的图表无法清楚的展示数据。对于高维数据的可视化,目前常见方法有散点图、平行坐标图、Radviz可视化方法等,这些几何投影技术可以帮助用户发现多维数据集的投影信息,解决如何在二维空间里显示高维空间的数据的问题,且能比较容易地发现高维数据间的聚类等关系。
Radviz径向坐标可视化方法是使用胡克定律将物理学上的一组N维点映射到一个平面上,提供了一种有助于识别数据之间关系的独特方法,可以提供多维数据的全局视图。由于其展示多维度数据的功能强大且实现简单等特点,常用于发现数据间的聚类性特征。
目前,针对Radviz圆周上的不同维度顺序会显示不同的可视化效果,对于维度排序的问题可以近似于一个旅行商(TSP)问题,国内外已经展开了一定程度的研究。Leban等人引入VizRank算法,从一系列有标签的数据投影中自动选择最有意义的投影,但是该算法的时间复杂度随维度的增长呈指数级上涨;DiCaro等人仔细调研分析RadViz维度排布,使用最优化方法解决该问题,但是仍然需要枚举所有维度排列组合;Binh等人使用遗传算法作为TSP问题的算子,得到最优化问题的近似最优解,但是算法的耗时比较长。这些方法均改进了传统的Radviz可视化方法,但是也存在一些不足,仍然需要进一步改进。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于Radviz的智能电网数据聚类可视化方法,引入矩阵相似性函数求取最优参数排序,提高智能电网数据聚类聚类可视化效果。
为实现上述发明目的,本发明基于Radviz的智能电网数据聚类可视化方法包括以下步骤:
S1:根据需要设置智能电网参数,记参数数量为M,从智能电网历史运行数据中获取N条数据记录,每条数据记录表示为D′i=(d′i,1,d′i,1,…,d′i,M),其中d′i,j表示第i条数据记录中第j个参数的值,i=1,2,…,N,j=1,2,…,M;
S2:根据N条数据记录对步骤S1所设置的智能电网参数进行降维,记降维后的智能电网参数数量为P,降维后的每条数据记录Di=(di,1,di,1,…,di,P),其中di,p表示第i条数据记录中第p个降维后智能电网参数的值,p=1,2,…,P;
S3:对步骤S2所得到的N条数据记录Di进行聚类;
S4:采用以下公式计算降维后的P个智能电网参数两两之间的相似性spq
Figure BDA0002076520240000021
其中,p,q=1,2,…,P,且p≠q,minp=min{di,p,1≤i≤N},maxp=max{di,p,1≤i≤N},minq=min{di,q,1≤i≤N},maxq=max{di,q,1≤i≤N};
S5:求取最优参数排列π=(π12,…,πP),令矩阵相似性函数F最小,矩阵相似性函数F的计算公式如下:
Figure BDA0002076520240000022
其中,πp、πp+1分别表示经过参数排列后的参数序列中第p个、第p+1个参数对应的原始参数序号,其中πP+1=π1
Figure BDA0002076520240000023
表示第πp个参数和第πp+1个参数之间的相似性;
S6:根据步骤S5所求取的最优参数排列π=(π12,…,πP),对各条数据记录进行Radviz聚类可视化,具体方法为:采用如下公式计算各条数据记录Di=(di1,di1,…,diP)在Radviz可视化图像中显示点的坐标(xi,yi):
Figure BDA0002076520240000024
Figure BDA0002076520240000025
根据各条数据记录Di所属的分类,对不同类别的数据记录Di的显示点进行区别显示。
本发明基于Radviz的智能电网数据聚类可视化方法,根据需要设置智能电网参数并获取数据记录,对智能电网参数进行降维,将降维后的数据记录进行聚类,然后计算降维后的智能电网参数两两之间的相似性,求取令矩阵相似性函数最小的最优参数排列,矩阵相似性函数通过智能电网参数之间的相似性计算;然后根据最优参数排列对各条数据记录进行Radviz聚类可视化。本发明通过引入矩阵相似性函数求取最优参数排序,可以有效提高智能电网数据聚类可视化效果。
附图说明
图1是本发明基于Radviz的智能电网数据聚类可视化方法的具体实施方式流程图;
图2是本实施例中基于蚁群算法的最优参数排列方法的流程图;
图3是本实施例中基于模拟退火算法的最优参数排列方法的流程图;
图4是本实施例中基于模拟退火-蚁群算法的最优参数排列方法的流程图;
图5是本实施例的智能电网数据表;
图6是对本实施例中智能电网数据进行数据聚类后的数据表;
图7是本次实验验证中采用原始参数排列的Radviz可视化图像对比图;
图8是本次实验验证中采用基于蚁群算法所得到的最优参数排列的Radviz可视化图像对比图;
图9是本次实验验证中采用基于模拟退火算法所得到的最优参数排列的的Radviz可视化图像对比图;
图10是本次实验验证中采用基于模拟退火-蚁群算法所得到的最优参数排列的Radviz可视化图像对比图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明基于Radviz的智能电网数据聚类可视化方法的具体实施方式流程图。如图1所示,本发明基于Radviz的智能电网数据聚类可视化方法的具体步骤包括:
S101:获取智能电网数据:
根据需要设置智能电网参数,记参数数量为M,从智能电网历史运行数据中获取N条数据记录,每条数据记录表示为D′i=(d′i,1,d′i,1,…,d′i,M),其中d′i,j表示第i条数据记录中第j个参数的值,i=1,2,…,N,j=1,2,…,M。数据记录可以是N个历史时期的数据,也可以是N个地区的数据,根据需要设置即可。
S102:数据降维:
为了更好地提取出最能反映智能电网数据特点的智能电网参数,需要根据N条数据记录对步骤S101所设置的智能电网参数进行降维,记降维后的智能电网参数数量为P,降维后的每条数据记录Di=(di,1,di,1,…,di,P),其中di,p表示第i条数据记录中第p个降维后智能电网参数的值,p=1,2,…,P。数据降维方法可以根据实际需要选择,本实施例中采用基于PCA(Principal Component Analysis,主成分分析方法)的数据降维方法,该方法是一种常用的数据降维方法,其具体过程在此不再赘述。
S103:数据聚类:
对步骤S102所得到的N条数据记录Di进行聚类。数据聚类方法也可以根据实际需要选择,本实施例中采用k means聚类算法,该方法是一种常用的数据聚类方法,其具体过程在此不再赘述。
S104:计算参数相似性:
采用以下公式计算降维后的P个智能电网参数两两之间的相似性sp,q
Figure BDA0002076520240000041
其中,p,q=1,2,…,P,且p≠q,minp=min{di,p,1≤i≤N},maxp=max{di,p,1≤i≤N},minq=min{di,q,1≤i≤N},maxq=max{di,q,1≤i≤N}。显然,sp,q越小,参数p和参数q之间的相似性越小。
S105:求解最优参数排列:
为了取得更好的智能电网数据聚类可视化效果,使最终可视化图像中各数据记录对应点的分布更为合理,本发明中提出了一种矩阵相似性函数F,其计算公式如下:
Figure BDA0002076520240000051
其中,πp、πp+1分别表示经过参数排列后的参数序列中第p个、第p+1个参数对应的原始参数序号,其中πP+1=π1
Figure BDA0002076520240000052
表示第πp个参数和第πp+1个参数之间的相似性。
本发明中需要求取最优参数排列π=(π12,…,πP),令矩阵相似性函数F最小。
S106:Radviz可视化:
根据步骤S105所求取的最优参数排列π=(π12,…,πP),对各条数据记录进行Radviz可视化,采用如下公式计算各条数据记录Di=(di1,di1,…,diP)在Radviz可视化图像中显示点的坐标(xi,yi):
Figure BDA0002076520240000053
Figure BDA0002076520240000054
根据步骤S103聚类得到的各条数据记录Di所属的分类,对不同类别的数据记录Di的显示点进行区别显示。
对于求解最优参数排列的问题,本实施例中提出了三种求解方法,分别是基于蚁群算法的最优参数排列方法、基于模拟退火算法的最优参数排列方法和基于模拟退火-蚁群算法的最优参数排列方法,下面分别对三种最优参数排列求解方法进行详细说明。
·基于蚁群算法的最优参数排列方法
图2是本实施例中基于蚁群算法的最优参数排列方法的流程图。如图2所示,本实施例中基于蚁群算法的最优参数排列方法的具体步骤包括:
S201:初始化迭代次数t=1。
S202:蚁群初始化:
记蚁群中蚂蚁数量为K,将K只蚂蚁随机分配给P个参数,根据分配情况获取蚂蚁k的已到达参数集合tabuk,显然此时已到达参数集合tabuk中只包括一个参数。
S203:参数跳转:
每只蚂蚁根据参数之间的信息素选择参数跳转的方向从而进行参数跳转,具体方法为:计算蚂蚁k从参数p转移到参数q的状态转移概率
Figure BDA0002076520240000061
选择状态转移概率
Figure BDA0002076520240000062
最大的参数q进行跳转,其中状态转移概率
Figure BDA0002076520240000063
的计算公式为:
Figure BDA0002076520240000064
其中,allowk表示蚂蚁k的可选择参数集合,即还未到达过的参数集合,τp,q(t)表示第t次迭代时参数p和参数q之间的信息素,其初始值τp,q(1)=C,C表示预设常数;ηp,q(t)=1/sp,q,sp,q表示参数p和参数q之间的相似性,α为信息素因子,是信息素的指数,表示信息素在状态转移概率中所占的权重,显示了轨迹的相对重要性;β为启发函数因子,是启发式函数的指数,该因子代表了蚂蚁k从参数p转移到参数q的可能性,值越大,可能性越大。
在确定各只蚂蚁k的跳转参数后,将跳转至的参数加入已到达参数集合tabuk,并从可选择参数集合allowk中删除。
S204:判断是否各个蚂蚁的可选择参数集合allowk均为空,如果是,进入步骤S205,否则返回步骤S203。
S205:信息素更新:
当所有的蚂蚁完成所有参数的一次遍历之后,参数间的信息素也会发生变化,需要根据每只蚂蚁所走路径对参数间的信息素进行更新,其更新过程可以由如下公式表示:
τp,q(t+1)=(1-ρ)·τp,q(t)+Δτp,q(t)
Figure BDA0002076520240000071
其中,ρ表示预设的信息素挥发系数,0≤ρ≤1;Δτp,q(t)为本次循环后路径上信息素的增量,
Figure BDA0002076520240000072
表示蚂蚁k在本次遍历后残留在参数p和参数q之间的信息素,可以采用如下公式表示:
Figure BDA0002076520240000073
其中,Q表示预设的信息素强度;Lk(t)为蚂蚁k在本次遍历后所走参数间累积相似性值。
Figure BDA0002076520240000074
反映了每只蚂蚁对于自己经过的维度之间信息素的贡献量,可以看出,在本发明中,参数间的相似性越大,则对于信息素的贡献量也就越低,参数间的相似性越小,则对于信息素的贡献量也就越高。信息素累积贡献量大的参数路径被选择的概率也就大,所以蚂蚁能够根据各参数间的信息素选择出相似性最好的参数排列顺序路径。
S206:判断是否t<tmax,tmax表示预设的最大迭代次数,如果是,进入步骤S207,否则进入步骤S208。
S207:令t=t+1,返回步骤S202。
S208:获取最优参数排列:
从当前蚁群中各只蚂蚁所走路径对应的参数排列中,选择最小矩阵相似性函数值对应的参数排列作为最优参数排列。
·基于模拟退火算法的最优参数排列方法
图3是本实施例中基于模拟退火算法的最优参数排列方法的流程图。如图3所示,本实施例中基于模拟退火算法的最优参数排列方法的具体步骤包括:
S301:初始化温度T=T0,T0表示起始温度,根据实际需要设置。
S302:随机生成初始参数排列:
随机生成P个智能电网参数的初始参数排列S1,计算得到其矩阵相似性函数值F(S1)。
S303:初始化迭代次数t=1。
S304:生成新参数排列:
对参数排列S1进行扰动,生成新参数排列S2,计算得到其矩阵相似性函数值F(S2)。
S305:判断是否ΔF=F(S2)-F(S1)≤0,如果是,则进入步骤S306,否则进入步骤S307。
S306:接受新参数排列,即令S1=S2,F(S1)=F(S2),进入步骤S308。
S307:按照Metropolis准则接受新参数排列:
计算接受概率δ:
Figure BDA0002076520240000081
其中,kB表示Boltzmann常数,
以接受概率δ接受新参数排列,即判断是否0<δ<1,如果是,不接受新参数排列,即不作任何操作,否则接受新参数排列,令S1=S2,F(S1)=F(S2)。然后进入步骤S308。
S308:判断是否t<tmax,tmax表示预设的最大迭代次数,如果是,进入步骤S309,否则进入步骤S310。
S309:令t=t+1,返回步骤S304。
S310:判断是否当前温度T>T1,T1表示预设的终止温度,如果是,进入步骤S311,否则进入步骤S312。
S311:令温度T=ωT,ω表示预设的降温系数,返回步骤S303。
S312:获取最优参数排列:
将当前的参数排列S1作为最优参数排列。
·基于模拟退火-蚁群算法的最优参数排列方法
图4是本实施例中基于模拟退火-蚁群算法的最优参数排列方法的流程图。如图4所示,本实施例中基于模拟退火-蚁群算法的最优参数排列方法的具体步骤包括:
S401:模拟退火参数初始化:
初始化温度T=T0,T0表示起始温度,初始化回火次数G=0。
S402:初始化蚁群算法迭代次数t=1。
S403:蚁群参数初始化:
记蚁群中蚂蚁数量为K,将K只蚂蚁随机分配给P个参数,根据分配情况获取蚂蚁k的已到达参数集合tabuk
S404:参数跳转:
每只蚂蚁根据参数之间的信息素选择参数跳转的方向从而进行参数跳转,具体方法为:计算蚂蚁k从参数p转移到参数q的状态转移概率
Figure BDA0002076520240000091
选择状态转移概率
Figure BDA0002076520240000092
最大的参数q进行跳转,其中状态转移概率
Figure BDA0002076520240000093
的计算公式为:
Figure BDA0002076520240000094
其中,allowk表示蚂蚁k的可选择参数集合,τp,q(t)表示第t次迭代时参数p和参数q之间的信息素,其初始值τp,q(1)=C,C表示预设常数;ηp,q(t)=1/sp,q,sp,q表示参数p和参数q之间的相似性,α为信息素因子,β为启发函数因子。
在确定各只蚂蚁k的跳转参数后,将跳转至的参数加入已到达参数集合tabuk,并从可选择参数集合allowk中删除。
S405:判断是否各个蚂蚁的可选择参数集合allowk均为空,如果是,进入步骤S406,否则返回步骤S404。
S406:信息素更新:
根据每只蚂蚁所走路径对参数之间的信息素进行更新。信息素更新过程可以由如下公式表示:
τp,q(t+1)=(1-ρ)·τp,q(t)+Δτp,q(t)
Figure BDA0002076520240000095
其中,ρ表示预设的信息素挥发系数,0≤ρ≤1;Δτp,q(t)为本次循环后路径上信息素的增量,
Figure BDA0002076520240000096
表示蚂蚁k在本次遍历后残留在参数p和参数q之间的信息素,可以采用如下公式表示:
Figure BDA0002076520240000097
其中,Q表示预设的信息素强度;Lk(t)为蚂蚁k在本次遍历后所走路径经过的参数间的累积相似性值。
S407:获取当前最优参数排列:
从当前蚁群中各只蚂蚁所走路径对应的参数排列中,选择最小矩阵相似性函数值对应的参数排列作为当前最优参数排列S1,记其矩阵相似性函数值为F(S1)。
S408:初始化模拟退火算法迭代次数t′=1;
S409:生成新参数排列:
对参数排列S1进行扰动,生成新参数排列S2,计算得到其矩阵相似性函数值F(S2)。
S410:判断是否ΔF=F(S2)-F(S1)≤0,如果不是,则进入步骤S411,否则进入步骤S412。
S411:判断是否按照Metropolis准则接受新参数排列,如果接受,则进入步骤S412,否则进入步骤S414。Metropolis准则的具体方法为:
计算接受概率δ:
Figure BDA0002076520240000101
其中,kB表示Boltzmann常数,
以接受概率δ接受新参数排列,即判断是否0<δ<1,如果是,不接受新参数排列,即不作任何操作,否则接受新参数排列。
S412:接受新参数排列,即令当前最优参数排列S1=S2,对应的矩阵相似性函数值F(S1)=F(S2),进入步骤S413。
S413:判断是否t′<t′max,t′max表示预设的模拟退火算法在单个温度下的最大迭代次数,如果是,进入步骤S414,否则进入步骤S415。
S414:令t′=t′+1,返回步骤S409。
S415:令温度T=ωT,ω表示预设的降温系数。
S416:判断是否T<T1,T1表示预设的终止温度,如果是,进入步骤S417,否则进入步骤S418;
S417:获取最优参数排列:
将当前的参数排列S1作为最优参数排列。
S418:信息素更新:
将当前最优参数排列S1作为蚁群中每只蚂蚁所走路径,对参数之间的信息素进行更新,进入步骤S419。
S419:判断是否温度T≥Tmin,Tmin表示预设的回火温度范围[Tmin,Tmax]的下限,其中,T1<Tmin<Tmax<T0,如果是,进入步骤S422,否则进入步骤S420。
S420:判断是否回火次数G<Gmax,Gmax表示最大回火次数,如果是,进入步骤S421,否则进入步骤S422。
S421:令温度T=Tmax,Tmax表示预设的回火温度范围的上限,令回火次数G=G+1,进入步骤S422。
S422:令迭代次数t=t+1,返回步骤S404。
在本实施例的基于模拟退火-蚁群算法的最优参数排列方法中,首先采用蚁群算法进行搜索得出一个当前最优参数排列,作为模拟退火算法的一个初始参数排列,然后用模拟退火随机扰动产生新参数排列,通过迭代次数进行内循环的搜索,这样可以跳出搜索范围的限制,避免蚁群算法陷入局部最优。在跳出模拟退火的内循环后,判断是否需要回火,回火机制的引入可以提高模拟退火算法的搜索次数,使最终得到的参数排列更优。
为了更好地说明本发明的技术效果,采用一组智能电网数据对本发明进行实验验证。图5是本实施例的智能电网数据表。如图5所示,本实施例中设置智能电网参数有16个,代表不同行业的用电量,从历史运行数据中提取了21个地区的数据记录。经过数据降维后,本实施例中保留了7个智能电网参数。图6是对本实施例中智能电网数据进行数据聚类后的数据表。如图6所示,本实施例中将21条数据记录划分为3类。
本次实验验证中,将采用原始参数排列的Radviz可视化结果作为对比结果,与本发明基于三种不同方法所得到的参数排列的Radviz可视化结果进行比较。本次实验验证运行在Java的开发环境中,通过不同方法的参数排列对应的矩阵相似性函数值以及得出结果的执行时间来对比方法的性能。表1是本次实验验证中三种最优参数排列算法的参数设置表。
Figure BDA0002076520240000121
表1
表2是本次实验验证中最优参数排列的性能对比表。
Figure BDA0002076520240000122
表2
如表2所示,基于三种算法的最优参数排列方法所得到的参数排列,在矩阵相似性函数上均优于原始参数排列的矩阵相似性函数。在算法运行时间上,基于模拟退火-蚁群算法的最优参数排列方法在运行时间上有一定的优势,具有更好的运算性能。
从聚类的可视化效果来看,比较好的数据投影是:相似性高的数据越靠近,相似性低的数据越分离,即簇内紧凑,簇间分离,展示出不同数据间内聚性和分离性的特点。本实施例中采用Dunn指数作为聚类评价指标,Dunn指数用任意类别的类内最小距离和类间最大距离的比值来评价聚类效果,其值越大说明聚类效果越好。图7是本次实验验证中采用原始参数排列的Radviz可视化图像对比图。图8是本次实验验证中采用基于蚁群算法所得到的最优参数排列的Radviz可视化图像对比图。图9是本次实验验证中采用基于模拟退火算法所得到的最优参数排列的的Radviz可视化图像对比图。图10是本次实验验证中采用基于模拟退火-蚁群算法所得到的最优参数排列的Radviz可视化图像对比图。
表3是本次实验验证中四种方法的Dunn指数对比表。
Radviz可视化图像 Dunn指数
图7 0.0055
图8 0.1083
图9 0.1172
图10 0.1714
表3
根据图7-图10和表3可以看出,与基于原始参数排列的Radviz可视化图像相比,基于三种算法的最优参数排列所得到的Radviz可视化图像的聚类效果更好,Dunn指数也更大,而其中以通过拟退火-蚁群算法的最优参数排列得到的可视化聚类效果最好,数据的聚类信息更明显,Dunn指数也最大。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (4)

1.一种基于Radviz的智能电网数据聚类可视化方法,其特征在于,包括以下步骤:
S1:根据需要设置智能电网参数,记参数数量为M,从智能电网历史运行数据中获取N条数据记录,每条数据记录表示为D′i=(d′i,1,…,d′i,M),其中d′i,j表示第i条数据记录中第j个参数的值,i=1,2,…,N,j=1,2,…,M;
S2:根据N条数据记录对步骤S1所设置的智能电网参数进行降维,记降维后的智能电网参数数量为P,降维后的每条数据记录Di=(di,1,…,di,P),其中di,p表示第i条数据记录中第p个降维后智能电网参数的值,p=1,2,…,P;
S3:对步骤S102所得到的N条数据记录Di进行聚类;
S4:采用以下公式计算降维后的P个智能电网参数两两之间的相似性sp,q
Figure FDA0003281879660000011
其中,p,q=1,2,…,P,且p≠q,minp=min{di,p,1≤i≤N},maxp=max{di,p,1≤i≤N},minq=min{di,q,1≤i≤N},maxq=max{di,q,1≤i≤N};
S5:求取最优参数排列π=(π12,…,πP),令矩阵相似性函数F最小,矩阵相似性函数F的计算公式如下:
Figure FDA0003281879660000012
其中,πp、πp+1分别表示经过参数排列后的参数序列中第p个、第p+1个参数对应的原始参数序号,其中πP+1=π1
Figure FDA0003281879660000013
表示第πp个参数和第πp+1个参数之间的相似性;
S6:根据步骤S5所求取的最优参数排列π=(π12,…,πP),对各条数据记录进行Radviz聚类可视化,具体方法为:采用如下公式计算各条数据记录Di=(di,1,…,di,P)在Radviz可视化图像中显示点的坐标(xi,yi):
Figure FDA0003281879660000021
Figure FDA0003281879660000022
根据各条数据记录Di所属的分类,对不同类别的数据记录Di的显示点进行区别显示。
2.根据权利要求1所述的智能电网数据聚类可视化方法,其特征在于,所述步骤S5中最优参数排列采用基于蚁群算法的最优参数排列方法得到,具体方法如下:
1)初始化迭代次数t=1;
2)记蚁群中蚂蚁数量为K,将K只蚂蚁随机分配给P个参数,根据分配情况获取蚂蚁k的已到达参数集合tabuk
3)计算蚂蚁k从参数p转移到参数q的状态转移概率
Figure FDA0003281879660000023
选择状态转移概率
Figure FDA0003281879660000024
最大的参数q进行跳转,其中状态转移概率
Figure FDA0003281879660000025
的计算公式为:
Figure FDA0003281879660000026
其中,allowk表示蚂蚁k的可选择参数集合,τp,q(t)表示第t次迭代时参数p和参数q之间的信息素,其初始值τp,q(1)=C,C表示预设常数;ηp,q(t)=1/sp,q,sp,q表示参数p和参数q之间的相似性,α为信息素因子,β为启发函数因子;
在确定各只蚂蚁k的跳转参数后,将跳转至的参数加入已到达参数集合tabuk,并从可选择参数集合allowk中删除;
4)判断是否各个蚂蚁的可选择参数集合allowk均为空,如果是,进入步骤5),否则返回步骤3);
5)根据每只蚂蚁所走路径对参数之间的信息素进行更新;
6)判断是否t<tmax,tmax表示预设的最大迭代次数,如果是,进入步骤7),否则进入步骤8);
7)令t=t+1,返回步骤2);
8)从当前蚁群中各只蚂蚁所走路径对应的参数排列中,选择最小矩阵相似性函数值对应的参数排列作为最优参数排列。
3.根据权利要求1所述的智能电网数据聚类可视化方法,其特征在于,所述步骤S5中最优参数排列采用基于模拟退火算法的最优参数排列方法得到,具体方法如下:
1)初始化温度T=T0,T0表示起始温度;
2)随机生成P个智能电网参数的初始参数排列S1,计算得到其矩阵相似性函数值F(S1);
3)初始化迭代次数t=1;
4)对参数排列S1进行扰动,生成新参数排列S2,计算得到其矩阵相似性函数值F(S2);
5)判断是否ΔF=F(S2)-F(S1)≤0,如果是,则进入步骤6),否则进入步骤7);
6)接受新参数排列,即令S1=S2,F(S1)=F(S2),进入步骤8);
7)按照Metropolis准则接受新参数排列:
计算接受概率δ:
Figure FDA0003281879660000031
其中,kB表示Boltzmann常数;
以接受概率δ接受新参数排列,即判断是否0<δ<1,如果是,不接受新参数排列,即不作任何操作,否则接受新参数排列,令S1=S2,F(S1)=F(S2), 然后进入步骤8);
8)判断是否t<tmax,tmax表示预设的最大迭代次数,如果是,进入步骤9),否则进入步骤10);
9)令t=t+1,返回步骤4);
10)判断是否当前温度T>T1,T1表示预设的终止温度,如果是,进入步骤11),否则进入步骤12);
11)令温度T=ωT,ω表示预设的降温系数;
12)将当前的参数排列S1作为最优参数排列。
4.根据权利要求1所述的智能电网数据聚类可视化方法,其特征在于,所述步骤S5中最优参数排列采用基于模拟退火-蚁群算法的最优参数排列方法得到,具体方法如下:
1)初始化温度T=T0,T0表示起始温度,初始化回火次数G=0;
2)初始化蚁群算法迭代次数t=1;
3)记蚁群中蚂蚁数量为K,将K只蚂蚁随机分配给P个参数,根据分配情况获取蚂蚁k的已到达参数集合tabuk
4)计算蚂蚁k从参数p转移到参数q的状态转移概率
Figure FDA0003281879660000041
选择状态转移概率
Figure FDA0003281879660000042
最大的参数q进行跳转,其中状态转移概率
Figure FDA0003281879660000043
的计算公式为:
Figure FDA0003281879660000044
其中,allowk表示蚂蚁k的可选择参数集合,τp,q(t)表示第t次迭代时参数p和参数q之间的信息素,其初始值τp,q(1)=C,C表示预设常数;ηp,q(t)=1/sp,q,sp,q表示参数p和参数q之间的相似性,α为信息素因子,β为启发函数因子;
在确定各只蚂蚁k的跳转参数后,将跳转至的参数加入已到达参数集合tabuk,并从可选择参数集合allowk中删除;
5)判断是否各个蚂蚁的可选择参数集合allowk均为空,如果是,进入步骤6),否则返回步骤4);
6)根据每只蚂蚁所走路径对参数之间的信息素进行更新;
7)从当前蚁群中各只蚂蚁所走路径对应的参数排列中,选择最小矩阵相似性函数值对应的参数排列作为当前最优参数排列S1,记其矩阵相似性函数值为F(S1);
8)初始化模拟退火算法迭代次数t′=1;
9)对参数排列S1进行扰动,生成新参数排列S2,计算得到其矩阵相似性函数值F(S2);
10)判断是否ΔF=F(S2)-F(S1)≤0,如果不是,则进入步骤S11),否则进入步骤S12);
11)判断是否按照Metropolis准则接受新参数排列,如果接受,则进入步骤12),否则进入步骤14),Metropolis准则的具体方法为:
计算接受概率δ:
Figure FDA0003281879660000051
其中,kB表示Boltzmann常数,
以接受概率δ接受新参数排列,即判断是否0<δ<1,如果是,不接受新参数排列,即不作任何操作,否则接受新参数排列;
12)接受新参数排列,即令当前最优参数排列S1=S2,对应的矩阵相似性函数值F(S1)=F(S2),进入步骤13);
13)判断是否t′<t′max,t′max表示预设的模拟退火算法在单个温度下的最大迭代次数,如果是,进入步骤S14),否则进入步骤15);
14)令t′=t′+1,返回步骤9);
15)令温度T=ωT,ω表示预设的降温系数;
16)判断是否T<T1,T1表示预设的终止温度,如果是,进入步骤17),否则进入步骤18);
17)将当前的参数排列S1作为最优参数排列;
18)将当前最优参数排列S1作为蚁群中每只蚂蚁所走路径,对参数之间的信息素进行更新,进入步骤S19);
19)判断是否温度T≥Tmin,Tmin表示预设的回火温度范围[Tmin,Tmax]的下限,其中,T1<Tmin<Tmax<T0,如果是,进入步骤22),否则进入步骤20);
20)判断是否回火次数G<Gmax,Gmax表示最大回火次数,如果是,进入步骤21),否则进入步骤22);
21)令温度T=Tmax,Tmax表示预设的回火温度范围的上限,令回火次数G=G+1,进入步骤22);
22)令迭代次数t=t+1,返回步骤4)。
CN201910455701.7A 2019-05-29 2019-05-29 基于Radviz的智能电网数据聚类可视化方法 Expired - Fee Related CN110209745B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910455701.7A CN110209745B (zh) 2019-05-29 2019-05-29 基于Radviz的智能电网数据聚类可视化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910455701.7A CN110209745B (zh) 2019-05-29 2019-05-29 基于Radviz的智能电网数据聚类可视化方法

Publications (2)

Publication Number Publication Date
CN110209745A CN110209745A (zh) 2019-09-06
CN110209745B true CN110209745B (zh) 2021-12-10

Family

ID=67789223

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910455701.7A Expired - Fee Related CN110209745B (zh) 2019-05-29 2019-05-29 基于Radviz的智能电网数据聚类可视化方法

Country Status (1)

Country Link
CN (1) CN110209745B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027599B (zh) * 2019-11-25 2023-07-04 中国建设银行股份有限公司 基于随机抽样的聚类可视化方法及装置
CN113159516B (zh) * 2021-03-24 2023-07-14 国网浙江省电力有限公司宁波供电公司 一种基于电网运行数据的三维可视化信息分析系统
CN114996362B (zh) * 2022-08-04 2023-03-21 河南云帆电子科技有限公司 一种数据处理和存储方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055580A (zh) * 2016-05-23 2016-10-26 中南大学 一种基于Radviz的模糊聚类结果可视化方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7734607B2 (en) * 2005-02-01 2010-06-08 University Of Massachusetts Universal visualization platform

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106055580A (zh) * 2016-05-23 2016-10-26 中南大学 一种基于Radviz的模糊聚类结果可视化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Extending Dimensions in Radviz Based on Mean Shift;Fangfang Zhou等;《2015 IEEE Pacific Visualization Symposium (PacificVis)》;20150716;全文 *
基于维度扩展的Radviz 可视化聚类分析方法;周芳芳等;《软件学报》;20161231;全文 *

Also Published As

Publication number Publication date
CN110209745A (zh) 2019-09-06

Similar Documents

Publication Publication Date Title
CN110209745B (zh) 基于Radviz的智能电网数据聚类可视化方法
KR102673288B1 (ko) 질의되는 개체와 관련된 질병, 유전자 또는 단백질을 예측하는 예측 모델을 학습시키는 방법
US8332346B1 (en) Fuzzy-learning-based extraction of time-series behavior
AU2017201206B2 (en) Parameter set determination for clustering of datasets
JP2019514148A (ja) デジタルデータを解析するための方法
WO2022159710A1 (en) Systems and methods for facilitating parcel combination
CN111709560A (zh) 一种基于改进蚁群算法的解决车辆路径问题方法
Qin et al. Solving multiple travelling officers problem with population-based optimization algorithms
Gong et al. Global biological network alignment by using efficient memetic algorithm
CN115080587B (zh) 一种基于知识图谱的电子元器件替代方法、装置及介质
Hess et al. Visual exploration of parameter influence on phylogenetic trees
Gonzalez-Alvarez et al. Comparing multiobjective swarm intelligence metaheuristics for DNA motif discovery
WO2024146200A1 (zh) 一种同时实现电力生产数据建模与可视化分析的方法
US20070072226A1 (en) Mining protein interaction networks
KR100924370B1 (ko) 셀 상태 값을 이용한 연속 스카이라인 질의 방법, 그시스템 및 이를 기록한 기록매체
Xiong et al. Genome wide prediction of protein function via a generic knowledge discovery approach based on evidence integration
KR20210148544A (ko) 아미노산 간의 인접 지도를 이용한 단백질의 3차 구조 예측 방법
Chaturvedi et al. Fused lasso algorithm for Cox′ proportional hazards and binomial logit models with application to copy number profiles
Zhou et al. Support vector machine for classification of meiotic recombination hotspots and coldspots in Saccharomyces cerevisiae based on codon composition
El Hajjar et al. Long Short-Term Memory and Attention Models for Simulating Urban Densification
CN115221782A (zh) 一种大型公共建筑能耗混合预测方法及系统
WO2022221593A1 (en) Efficient voxelization for deep learning
Karthika et al. Genetic Algorithm-Based Feature Selection and Self-Organizing Auto-Encoder (Soae) for Snp Genomics Data Classifications
Citarella et al. Gene Ontology Terms Visualization with Dynamic Distance-Graph and Similarity Measures (S).
Wong et al. Pareto-aware strategies for faster convergence in multi-objective multi-scale search optimization

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20211210

CF01 Termination of patent right due to non-payment of annual fee