CN110209745A - 基于Radviz的智能电网数据聚类可视化方法 - Google Patents

基于Radviz的智能电网数据聚类可视化方法 Download PDF

Info

Publication number
CN110209745A
CN110209745A CN201910455701.7A CN201910455701A CN110209745A CN 110209745 A CN110209745 A CN 110209745A CN 201910455701 A CN201910455701 A CN 201910455701A CN 110209745 A CN110209745 A CN 110209745A
Authority
CN
China
Prior art keywords
parameter
ant
smart grid
arrangement
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910455701.7A
Other languages
English (en)
Other versions
CN110209745B (zh
Inventor
何建
张琳
邹见效
于力
徐红兵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN201910455701.7A priority Critical patent/CN110209745B/zh
Publication of CN110209745A publication Critical patent/CN110209745A/zh
Application granted granted Critical
Publication of CN110209745B publication Critical patent/CN110209745B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/283Multi-dimensional databases or data warehouses, e.g. MOLAP or ROLAP
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于Radviz的智能电网数据聚类可视化方法,根据需要设置智能电网参数并获取数据记录,对智能电网参数进行降维,将降维后的数据记录进行聚类,然后计算降维后的智能电网参数两两之间的相似性,求取令矩阵相似性函数最小的最优参数排列,矩阵相似性函数通过智能电网参数之间的相似性计算;然后根据最优参数排列对各条数据记录进行Radviz聚类可视化。本发明通过引入矩阵相似性函数求取最优参数排序,提高智能电网数据聚类可视化效果。

Description

基于Radviz的智能电网数据聚类可视化方法
技术领域
本发明属于智能电网数据可视化技术领域,更为具体地讲,涉及一种基于Radviz的智能电网数据聚类可视化方法。
背景技术
由于智能电网中数据维数比较多,普通的图表无法清楚的展示数据。对于高维数据的可视化,目前常见方法有散点图、平行坐标图、Radviz可视化方法等,这些几何投影技术可以帮助用户发现多维数据集的投影信息,解决如何在二维空间里显示高维空间的数据的问题,且能比较容易地发现高维数据间的聚类等关系。
Radviz径向坐标可视化方法是使用胡克定律将物理学上的一组N维点映射到一个平面上,提供了一种有助于识别数据之间关系的独特方法,可以提供多维数据的全局视图。由于其展示多维度数据的功能强大且实现简单等特点,常用于发现数据间的聚类性特征。
目前,针对Radviz圆周上的不同维度顺序会显示不同的可视化效果,对于维度排序的问题可以近似于一个旅行商(TSP)问题,国内外已经展开了一定程度的研究。Leban等人引入VizRank算法,从一系列有标签的数据投影中自动选择最有意义的投影,但是该算法的时间复杂度随维度的增长呈指数级上涨;DiCaro等人仔细调研分析RadViz维度排布,使用最优化方法解决该问题,但是仍然需要枚举所有维度排列组合;Binh等人使用遗传算法作为TSP问题的算子,得到最优化问题的近似最优解,但是算法的耗时比较长。这些方法均改进了传统的Radviz可视化方法,但是也存在一些不足,仍然需要进一步改进。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于Radviz的智能电网数据聚类可视化方法,引入矩阵相似性函数求取最优参数排序,提高智能电网数据聚类聚类可视化效果。
为实现上述发明目的,本发明基于Radviz的智能电网数据聚类可视化方法包括以下步骤:
S1:根据需要设置智能电网参数,记参数数量为M,从智能电网历史运行数据中获取N条数据记录,每条数据记录表示为D′i=(d′i,1,d′i,1,…,d′i,M),其中d′i,j表示第i条数据记录中第j个参数的值,i=1,2,…,N,j=1,2,…,M;
S2:根据N条数据记录对步骤S1所设置的智能电网参数进行降维,记降维后的智能电网参数数量为P,降维后的每条数据记录Di=(di,1,di,1,…,di,P),其中di,p表示第i条数据记录中第p个降维后智能电网参数的值,p=1,2,…,P;
S3:对步骤S2所得到的N条数据记录Di进行聚类;
S4:采用以下公式计算降维后的P个智能电网参数两两之间的相似性spq
其中,p,q=1,2,…,P,且p≠q,minp=min{di,p,1≤i≤N},maxp=max{di,p,1≤i≤N},minq=min{di,q,1≤i≤N},maxq=max{di,q,1≤i≤N};
S5:求取最优参数排列π=(π12,…,πP),令矩阵相似性函数F最小,矩阵相似性函数F的计算公式如下:
其中,πp、πp+1分别表示经过参数排列后的参数序列中第p个、第p+1个参数对应的原始参数序号,其中πP+1=π1表示第πp个参数和第πp+1个参数之间的相似性;
S6:根据步骤S5所求取的最优参数排列π=(π12,…,πP),对各条数据记录进行Radviz聚类可视化,具体方法为:采用如下公式计算各条数据记录Di=(di1,di1,…,diP)在Radviz可视化图像中显示点的坐标(xi,yi):
根据各条数据记录Di所属的分类,对不同类别的数据记录Di的显示点进行区别显示。
本发明基于Radviz的智能电网数据聚类可视化方法,根据需要设置智能电网参数并获取数据记录,对智能电网参数进行降维,将降维后的数据记录进行聚类,然后计算降维后的智能电网参数两两之间的相似性,求取令矩阵相似性函数最小的最优参数排列,矩阵相似性函数通过智能电网参数之间的相似性计算;然后根据最优参数排列对各条数据记录进行Radviz聚类可视化。本发明通过引入矩阵相似性函数求取最优参数排序,可以有效提高智能电网数据聚类可视化效果。
附图说明
图1是本发明基于Radviz的智能电网数据聚类可视化方法的具体实施方式流程图;
图2是本实施例中基于蚁群算法的最优参数排列方法的流程图;
图3是本实施例中基于模拟退火算法的最优参数排列方法的流程图;
图4是本实施例中基于模拟退火-蚁群算法的最优参数排列方法的流程图;
图5是本实施例的智能电网数据表;
图6是对本实施例中智能电网数据进行数据聚类后的数据表;
图7是本次实验验证中采用原始参数排列的Radviz可视化图像对比图;
图8是本次实验验证中采用基于蚁群算法所得到的最优参数排列的Radviz可视化图像对比图;
图9是本次实验验证中采用基于模拟退火算法所得到的最优参数排列的的Radviz可视化图像对比图;
图10是本次实验验证中采用基于模拟退火-蚁群算法所得到的最优参数排列的Radviz可视化图像对比图。
具体实施方式
下面结合附图对本发明的具体实施方式进行描述,以便本领域的技术人员更好地理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许会淡化本发明的主要内容时,这些描述在这里将被忽略。
实施例
图1是本发明基于Radviz的智能电网数据聚类可视化方法的具体实施方式流程图。如图1所示,本发明基于Radviz的智能电网数据聚类可视化方法的具体步骤包括:
S101:获取智能电网数据:
根据需要设置智能电网参数,记参数数量为M,从智能电网历史运行数据中获取N条数据记录,每条数据记录表示为D′i=(d′i,1,d′i,1,…,d′i,M),其中d′i,j表示第i条数据记录中第j个参数的值,i=1,2,…,N,j=1,2,…,M。数据记录可以是N个历史时期的数据,也可以是N个地区的数据,根据需要设置即可。
S102:数据降维:
为了更好地提取出最能反映智能电网数据特点的智能电网参数,需要根据N条数据记录对步骤S101所设置的智能电网参数进行降维,记降维后的智能电网参数数量为P,降维后的每条数据记录Di=(di,1,di,1,…,di,P),其中di,p表示第i条数据记录中第p个降维后智能电网参数的值,p=1,2,…,P。数据降维方法可以根据实际需要选择,本实施例中采用基于PCA(Principal Component Analysis,主成分分析方法)的数据降维方法,该方法是一种常用的数据降维方法,其具体过程在此不再赘述。
S103:数据聚类:
对步骤S102所得到的N条数据记录Di进行聚类。数据聚类方法也可以根据实际需要选择,本实施例中采用k means聚类算法,该方法是一种常用的数据聚类方法,其具体过程在此不再赘述。
S104:计算参数相似性:
采用以下公式计算降维后的P个智能电网参数两两之间的相似性sp,q
其中,p,q=1,2,…,P,且p≠q,minp=min{di,p,1≤i≤N},maxp=max{di,p,1≤i≤N},minq=min{di,q,1≤i≤N},maxq=max{di,q,1≤i≤N}。显然,sp,q越小,参数p和参数q之间的相似性越小。
S105:求解最优参数排列:
为了取得更好的智能电网数据聚类可视化效果,使最终可视化图像中各数据记录对应点的分布更为合理,本发明中提出了一种矩阵相似性函数F,其计算公式如下:
其中,πp、πp+1分别表示经过参数排列后的参数序列中第p个、第p+1个参数对应的原始参数序号,其中πP+1=π1表示第πp个参数和第πp+1个参数之间的相似性。
本发明中需要求取最优参数排列π=(π12,…,πP),令矩阵相似性函数F最小。
S106:Radviz可视化:
根据步骤S105所求取的最优参数排列π=(π12,…,πP),对各条数据记录进行Radviz可视化,采用如下公式计算各条数据记录Di=(di1,di1,…,diP)在Radviz可视化图像中显示点的坐标(xi,yi):
根据步骤S103聚类得到的各条数据记录Di所属的分类,对不同类别的数据记录Di的显示点进行区别显示。
对于求解最优参数排列的问题,本实施例中提出了三种求解方法,分别是基于蚁群算法的最优参数排列方法、基于模拟退火算法的最优参数排列方法和基于模拟退火-蚁群算法的最优参数排列方法,下面分别对三种最优参数排列求解方法进行详细说明。
·基于蚁群算法的最优参数排列方法
图2是本实施例中基于蚁群算法的最优参数排列方法的流程图。如图2所示,本实施例中基于蚁群算法的最优参数排列方法的具体步骤包括:
S201:初始化迭代次数t=1。
S202:蚁群初始化:
记蚁群中蚂蚁数量为K,将K只蚂蚁随机分配给P个参数,根据分配情况获取蚂蚁k的已到达参数集合tabuk,显然此时已到达参数集合tabuk中只包括一个参数。
S203:参数跳转:
每只蚂蚁根据参数之间的信息素选择参数跳转的方向从而进行参数跳转,具体方法为:计算蚂蚁k从参数p转移到参数q的状态转移概率选择状态转移概率最大的参数q进行跳转,其中状态转移概率的计算公式为:
其中,allowk表示蚂蚁k的可选择参数集合,即还未到达过的参数集合,τp,q(t)表示第t次迭代时参数p和参数q之间的信息素,其初始值τp,q(1)=C,C表示预设常数;ηp,q(t)=1/sp,q,sp,q表示参数p和参数q之间的相似性,α为信息素因子,是信息素的指数,表示信息素在状态转移概率中所占的权重,显示了轨迹的相对重要性;β为启发函数因子,是启发式函数的指数,该因子代表了蚂蚁k从参数p转移到参数q的可能性,值越大,可能性越大。
在确定各只蚂蚁k的跳转参数后,将跳转至的参数加入已到达参数集合tabuk,并从可选择参数集合allowk中删除。
S204:判断是否各个蚂蚁的可选择参数集合allowk均为空,如果是,进入步骤S205,否则返回步骤S203。
S205:信息素更新:
当所有的蚂蚁完成所有参数的一次遍历之后,参数间的信息素也会发生变化,需要根据每只蚂蚁所走路径对参数间的信息素进行更新,其更新过程可以由如下公式表示:
τp,q(t+1)=(1-ρ)·τp,q(t)+Δτp,q(t)
其中,ρ表示预设的信息素挥发系数,0≤ρ≤1;Δτp,q(t)为本次循环后路径上信息素的增量,表示蚂蚁k在本次遍历后残留在参数p和参数q之间的信息素,可以采用如下公式表示:
其中,Q表示预设的信息素强度;Lk(t)为蚂蚁k在本次遍历后所走参数间累积相似性值。反映了每只蚂蚁对于自己经过的维度之间信息素的贡献量,可以看出,在本发明中,参数间的相似性越大,则对于信息素的贡献量也就越低,参数间的相似性越小,则对于信息素的贡献量也就越高。信息素累积贡献量大的参数路径被选择的概率也就大,所以蚂蚁能够根据各参数间的信息素选择出相似性最好的参数排列顺序路径。
S206:判断是否t<tmax,tmax表示预设的最大迭代次数,如果是,进入步骤S207,否则进入步骤S208。
S207:令t=t+1,返回步骤S202。
S208:获取最优参数排列:
从当前蚁群中各只蚂蚁所走路径对应的参数排列中,选择最小矩阵相似性函数值对应的参数排列作为最优参数排列。
·基于模拟退火算法的最优参数排列方法
图3是本实施例中基于模拟退火算法的最优参数排列方法的流程图。如图3所示,本实施例中基于模拟退火算法的最优参数排列方法的具体步骤包括:
S301:初始化温度T=T0,T0表示起始温度,根据实际需要设置。
S302:随机生成初始参数排列:
随机生成P个智能电网参数的初始参数排列S1,计算得到其矩阵相似性函数值F(S1)。
S303:初始化迭代次数t=1。
S304:生成新参数排列:
对参数排列S1进行扰动,生成新参数排列S2,计算得到其矩阵相似性函数值F(S2)。
S305:判断是否ΔF=F(S2)-F(S1)≤0,如果是,则进入步骤S306,否则进入步骤S307。
S306:接受新参数排列,即令S1=S2,F(S1)=F(S2),进入步骤S308。
S307:按照Metropolis准则接受新参数排列:
计算接受概率δ:
其中,kB表示Boltzmann常数,
以接受概率δ接受新参数排列,即判断是否0<δ<1,如果是,不接受新参数排列,即不作任何操作,否则接受新参数排列,令S1=S2,F(S1)=F(S2)。然后进入步骤S308。
S308:判断是否t<tmax,tmax表示预设的最大迭代次数,如果是,进入步骤S309,否则进入步骤S310。
S309:令t=t+1,返回步骤S304。
S310:判断是否当前温度T>T1,T1表示预设的终止温度,如果是,进入步骤S311,否则进入步骤S312。
S311:令温度T=ωT,ω表示预设的降温系数,返回步骤S303。
S312:获取最优参数排列:
将当前的参数排列S1作为最优参数排列。
·基于模拟退火-蚁群算法的最优参数排列方法
图4是本实施例中基于模拟退火-蚁群算法的最优参数排列方法的流程图。如图4所示,本实施例中基于模拟退火-蚁群算法的最优参数排列方法的具体步骤包括:
S401:模拟退火参数初始化:
初始化温度T=T0,T0表示起始温度,初始化回火次数G=0。
S402:初始化蚁群算法迭代次数t=1。
S403:蚁群参数初始化:
记蚁群中蚂蚁数量为K,将K只蚂蚁随机分配给P个参数,根据分配情况获取蚂蚁k的已到达参数集合tabuk
S404:参数跳转:
每只蚂蚁根据参数之间的信息素选择参数跳转的方向从而进行参数跳转,具体方法为:计算蚂蚁k从参数p转移到参数q的状态转移概率选择状态转移概率最大的参数q进行跳转,其中状态转移概率的计算公式为:
其中,allowk表示蚂蚁k的可选择参数集合,τp,q(t)表示第t次迭代时参数p和参数q之间的信息素,其初始值τp,q(1)=C,C表示预设常数;ηp,q(t)=1/sp,q,sp,q表示参数p和参数q之间的相似性,α为信息素因子,β为启发函数因子。
在确定各只蚂蚁k的跳转参数后,将跳转至的参数加入已到达参数集合tabuk,并从可选择参数集合allowk中删除。
S405:判断是否各个蚂蚁的可选择参数集合allowk均为空,如果是,进入步骤S406,否则返回步骤S404。
S406:信息素更新:
根据每只蚂蚁所走路径对参数之间的信息素进行更新。信息素更新过程可以由如下公式表示:
τp,q(t+1)=(1-ρ)·τp,q(t)+Δτp,q(t)
其中,ρ表示预设的信息素挥发系数,0≤ρ≤1;Δτp,q(t)为本次循环后路径上信息素的增量,表示蚂蚁k在本次遍历后残留在参数p和参数q之间的信息素,可以采用如下公式表示:
其中,Q表示预设的信息素强度;Lk(t)为蚂蚁k在本次遍历后所走路径经过的参数间的累积相似性值。
S407:获取当前最优参数排列:
从当前蚁群中各只蚂蚁所走路径对应的参数排列中,选择最小矩阵相似性函数值对应的参数排列作为当前最优参数排列S1,记其矩阵相似性函数值为F(S1)。
S408:初始化模拟退火算法迭代次数t′=1;
S409:生成新参数排列:
对参数排列S1进行扰动,生成新参数排列S2,计算得到其矩阵相似性函数值F(S2)。
S410:判断是否ΔF=F(S2)-F(S1)≤0,如果不是,则进入步骤S411,否则进入步骤S412。
S411:判断是否按照Metropolis准则接受新参数排列,如果接受,则进入步骤S412,否则进入步骤S414。Metropolis准则的具体方法为:
计算接受概率δ:
其中,kB表示Boltzmann常数,
以接受概率δ接受新参数排列,即判断是否0<δ<1,如果是,不接受新参数排列,即不作任何操作,否则接受新参数排列。
S412:接受新参数排列,即令当前最优参数排列S1=S2,对应的矩阵相似性函数值F(S1)=F(S2),进入步骤S413。
S413:判断是否t′<t′max,t′max表示预设的模拟退火算法在单个温度下的最大迭代次数,如果是,进入步骤S414,否则进入步骤S415。
S414:令t′=t′+1,返回步骤S409。
S415:令温度T=ωT,ω表示预设的降温系数。
S416:判断是否T<T1,T1表示预设的终止温度,如果是,进入步骤S417,否则进入步骤S418;
S417:获取最优参数排列:
将当前的参数排列S1作为最优参数排列。
S418:信息素更新:
将当前最优参数排列S1作为蚁群中每只蚂蚁所走路径,对参数之间的信息素进行更新,进入步骤S419。
S419:判断是否温度T≥Tmin,Tmin表示预设的回火温度范围[Tmin,Tmax]的下限,其中,T1<Tmin<Tmax<T0,如果是,进入步骤S422,否则进入步骤S420。
S420:判断是否回火次数G<Gmax,Gmax表示最大回火次数,如果是,进入步骤S421,否则进入步骤S422。
S421:令温度T=Tmax,Tmax表示预设的回火温度范围的上限,令回火次数G=G+1,进入步骤S422。
S422:令迭代次数t=t+1,返回步骤S404。
在本实施例的基于模拟退火-蚁群算法的最优参数排列方法中,首先采用蚁群算法进行搜索得出一个当前最优参数排列,作为模拟退火算法的一个初始参数排列,然后用模拟退火随机扰动产生新参数排列,通过迭代次数进行内循环的搜索,这样可以跳出搜索范围的限制,避免蚁群算法陷入局部最优。在跳出模拟退火的内循环后,判断是否需要回火,回火机制的引入可以提高模拟退火算法的搜索次数,使最终得到的参数排列更优。
为了更好地说明本发明的技术效果,采用一组智能电网数据对本发明进行实验验证。图5是本实施例的智能电网数据表。如图5所示,本实施例中设置智能电网参数有16个,代表不同行业的用电量,从历史运行数据中提取了21个地区的数据记录。经过数据降维后,本实施例中保留了7个智能电网参数。图6是对本实施例中智能电网数据进行数据聚类后的数据表。如图6所示,本实施例中将21条数据记录划分为3类。
本次实验验证中,将采用原始参数排列的Radviz可视化结果作为对比结果,与本发明基于三种不同方法所得到的参数排列的Radviz可视化结果进行比较。本次实验验证运行在Java的开发环境中,通过不同方法的参数排列对应的矩阵相似性函数值以及得出结果的执行时间来对比方法的性能。表1是本次实验验证中三种最优参数排列算法的参数设置表。
表1
表2是本次实验验证中最优参数排列的性能对比表。
表2
如表2所示,基于三种算法的最优参数排列方法所得到的参数排列,在矩阵相似性函数上均优于原始参数排列的矩阵相似性函数。在算法运行时间上,基于模拟退火-蚁群算法的最优参数排列方法在运行时间上有一定的优势,具有更好的运算性能。
从聚类的可视化效果来看,比较好的数据投影是:相似性高的数据越靠近,相似性低的数据越分离,即簇内紧凑,簇间分离,展示出不同数据间内聚性和分离性的特点。本实施例中采用Dunn指数作为聚类评价指标,Dunn指数用任意类别的类内最小距离和类间最大距离的比值来评价聚类效果,其值越大说明聚类效果越好。图7是本次实验验证中采用原始参数排列的Radviz可视化图像对比图。图8是本次实验验证中采用基于蚁群算法所得到的最优参数排列的Radviz可视化图像对比图。图9是本次实验验证中采用基于模拟退火算法所得到的最优参数排列的的Radviz可视化图像对比图。图10是本次实验验证中采用基于模拟退火-蚁群算法所得到的最优参数排列的Radviz可视化图像对比图。
表3是本次实验验证中四种方法的Dunn指数对比表。
Radviz可视化图像 Dunn指数
图7 0.0055
图8 0.1083
图9 0.1172
图10 0.1714
表3
根据图7-图10和表3可以看出,与基于原始参数排列的Radviz可视化图像相比,基于三种算法的最优参数排列所得到的Radviz可视化图像的聚类效果更好,Dunn指数也更大,而其中以通过拟退火-蚁群算法的最优参数排列得到的可视化聚类效果最好,数据的聚类信息更明显,Dunn指数也最大。
尽管上面对本发明说明性的具体实施方式进行了描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。

Claims (4)

1.一种基于Radviz的智能电网数据聚类可视化方法,其特征在于,包括以下步骤:
S1:根据需要设置智能电网参数,记参数数量为M,从智能电网历史运行数据中获取N条数据记录,每条数据记录表示为D′i=(d′i,1,d′i,1,…,d′i,M),其中d′i,j表示第i条数据记录中第j个参数的值,i=1,2,…,N,j=1,2,…,M;
S2:根据N条数据记录对步骤S1所设置的智能电网参数进行降维,记降维后的智能电网参数数量为P,降维后的每条数据记录Di=(di,1,di,1,…,di,P),其中di,p表示第i条数据记录中第p个降维后智能电网参数的值,p=1,2,…,P;
S3:对步骤S102所得到的N条数据记录Di进行聚类;
S4:采用以下公式计算降维后的P个智能电网参数两两之间的相似性sp,q
其中,p,q=1,2,…,P,且p≠q,minp=min{di,p,1≤i≤N},maxp=max{di,p,1≤i≤N},minq=min{di,q,1≤i≤N},maxq=max{di,q,1≤i≤N};
S5:求取最优参数排列π=(π12,…,πP),令矩阵相似性函数F最小,矩阵相似性函数F的计算公式如下:
其中,πp、πp+1分别表示经过参数排列后的参数序列中第p个、第p+1个参数对应的原始参数序号,其中πP+1=π1表示第πp个参数和第πp+1个参数之间的相似性;
S6:根据步骤S5所求取的最优参数排列π=(π12,…,πP),对各条数据记录进行Radviz聚类可视化,具体方法为:采用如下公式计算各条数据记录Di=(di1,di1,…,diP)在Radviz可视化图像中显示点的坐标(xi,yi):
根据各条数据记录Di所属的分类,对不同类别的数据记录Di的显示点进行区别显示。
2.根据权利要求1所述的智能电网数据聚类可视化方法,其特征在于,所述步骤S5中最优参数排列采用基于蚁群算法的最优参数排列方法得到,具体方法如下:
1)初始化迭代次数t=1;
2)记蚁群中蚂蚁数量为K,将K只蚂蚁随机分配给P个参数,根据分配情况获取蚂蚁k的已到达参数集合tabuk
3)计算蚂蚁k从参数p转移到参数q的状态转移概率选择状态转移概率最大的参数q进行跳转,其中状态转移概率的计算公式为:
其中,allowk表示蚂蚁k的可选择参数集合,τp,q(t)表示第t次迭代时参数p和参数q之间的信息素,其初始值τp,q(1)=C,C表示预设常数;ηp,q(t)=1/sp,q,sp,q表示参数p和参数q之间的相似性,α为信息素因子,β为启发函数因子;
在确定各只蚂蚁k的跳转参数后,将跳转至的参数加入已到达参数集合tabuk,并从可选择参数集合allowk中删除;
4)判断是否各个蚂蚁的可选择参数集合allowk均为空,如果是,进入步骤5),否则返回步骤3);
5)根据每只蚂蚁所走路径对参数之间的信息素进行更新;
6)判断是否t<tmax,tmax表示预设的最大迭代次数,如果是,进入步骤7),否则进入步骤8);
7)令t=t+1,返回步骤2);
8)从当前蚁群中各只蚂蚁所走路径对应的参数排列中,选择最小矩阵相似性函数值对应的参数排列作为最优参数排列。
3.根据权利要求1所述的智能电网数据聚类可视化方法,其特征在于,所述步骤S5中最优参数排列采用基于模拟退火算法的最优参数排列方法得到,具体方法如下:
1)初始化温度T=T0,T0表示起始温度;
2)随机生成P个智能电网参数的初始参数排列S1,计算得到其矩阵相似性函数值F(S1);
3)初始化迭代次数t=1;
4)对参数排列S1进行扰动,生成新参数排列S2,计算得到其矩阵相似性函数值F(S2);
5)判断是否ΔF=F(S2)-F(S1)≤0,如果是,则进入步骤6),否则进入步骤7);
6)接受新参数排列,即令S1=S2,F(S1)=F(S2),进入步骤8);
7)按照Metropolis准则接受新参数排列:
计算接受概率δ:
其中,kB表示Boltzmann常数;
以接受概率δ接受新参数排列,即判断是否0<δ<1,如果是,不接受新参数排列,即不作任何操作,否则接受新参数排列,令S1=S2,F(S1)=F(S2)。然后进入步骤8);
8)判断是否t<tmax,tmax表示预设的最大迭代次数,如果是,进入步骤9),否则进入步骤10);
9)令t=t+1,返回步骤4);
10)判断是否当前温度T>T1,T1表示预设的终止温度,如果是,进入步骤11),否则进入步骤12);
11)令温度T=ωT,ω表示预设的降温系数;
12)将当前的参数排列S1作为最优参数排列。
4.根据权利要求1所述的智能电网数据聚类可视化方法,其特征在于,所述步骤S5中最优参数排列采用基于模拟退火-蚁群算法的最优参数排列方法得到,具体方法如下:
1)初始化温度T=T0,T0表示起始温度,初始化回火次数G=0;
2)初始化蚁群算法迭代次数t=1;
3)记蚁群中蚂蚁数量为K,将K只蚂蚁随机分配给P个参数,根据分配情况获取蚂蚁k的已到达参数集合tabuk
4)计算蚂蚁k从参数p转移到参数q的状态转移概率选择状态转移概率最大的参数q进行跳转,其中状态转移概率的计算公式为:
其中,allowk表示蚂蚁k的可选择参数集合,τp,q(t)表示第t次迭代时参数p和参数q之间的信息素,其初始值τp,q(1)=C,C表示预设常数;ηp,q(t)=1/sp,q,sp,q表示参数p和参数q之间的相似性,α为信息素因子,β为启发函数因子;
在确定各只蚂蚁k的跳转参数后,将跳转至的参数加入已到达参数集合tabuk,并从可选择参数集合allowk中删除;
5)判断是否各个蚂蚁的可选择参数集合allowk均为空,如果是,进入步骤6),否则返回步骤4);
6)根据每只蚂蚁所走路径对参数之间的信息素进行更新;
7)从当前蚁群中各只蚂蚁所走路径对应的参数排列中,选择最小矩阵相似性函数值对应的参数排列作为当前最优参数排列S1,记其矩阵相似性函数值为F(S1);
8)初始化模拟退火算法迭代次数t′=1;
9)对参数排列S1进行扰动,生成新参数排列S2,计算得到其矩阵相似性函数值F(S2);
10)判断是否ΔF=F(S2)-F(S1)≤0,如果不是,则进入步骤S11),否则进入步骤S12);
11)判断是否按照Metropolis准则接受新参数排列,如果接受,则进入步骤12),否则进入步骤14),Metropolis准则的具体方法为:
计算接受概率δ:
其中,kB表示Boltzmann常数,
以接受概率δ接受新参数排列,即判断是否0<δ<1,如果是,不接受新参数排列,即不作任何操作,否则接受新参数排列;
12)接受新参数排列,即令当前最优参数排列S1=S2,对应的矩阵相似性函数值F(S1)=F(S2),进入步骤13);
13)判断是否t′<t′max,t′max表示预设的模拟退火算法在单个温度下的最大迭代次数,如果是,进入步骤S14),否则进入步骤15);
14)令t′=t′+1,返回步骤9);
15)令温度T=ωT,ω表示预设的降温系数;
16)判断是否T<T1,T1表示预设的终止温度,如果是,进入步骤17),否则进入步骤18);
17)将当前的参数排列S1作为最优参数排列;
18)将当前最优参数排列S1作为蚁群中每只蚂蚁所走路径,对参数之间的信息素进行更新,进入步骤S19);
19)判断是否温度T≥Tmin,Tmin表示预设的回火温度范围[Tmin,Tmax]的下限,其中,T1<Tmin<Tmax<T0,如果是,进入步骤22),否则进入步骤20);
20)判断是否回火次数G<Gmax,Gmax表示最大回火次数,如果是,进入步骤21),否则进入步骤22);
21)令温度T=Tmax,Tmax表示预设的回火温度范围的上限,令回火次数G=G+1,进入步骤22);
22)令迭代次数t=t+1,返回步骤4)。
CN201910455701.7A 2019-05-29 2019-05-29 基于Radviz的智能电网数据聚类可视化方法 Expired - Fee Related CN110209745B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910455701.7A CN110209745B (zh) 2019-05-29 2019-05-29 基于Radviz的智能电网数据聚类可视化方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910455701.7A CN110209745B (zh) 2019-05-29 2019-05-29 基于Radviz的智能电网数据聚类可视化方法

Publications (2)

Publication Number Publication Date
CN110209745A true CN110209745A (zh) 2019-09-06
CN110209745B CN110209745B (zh) 2021-12-10

Family

ID=67789223

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910455701.7A Expired - Fee Related CN110209745B (zh) 2019-05-29 2019-05-29 基于Radviz的智能电网数据聚类可视化方法

Country Status (1)

Country Link
CN (1) CN110209745B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027599A (zh) * 2019-11-25 2020-04-17 中国建设银行股份有限公司 基于随机抽样的聚类可视化方法及装置
CN113159516A (zh) * 2021-03-24 2021-07-23 国网浙江省电力有限公司宁波供电公司 一种基于电网运行数据的三维可视化信息分析系统
CN114996362A (zh) * 2022-08-04 2022-09-02 深圳市共赢晶显技术有限公司 一种数据处理和存储方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060218563A1 (en) * 2005-02-01 2006-09-28 University Of Massachusetts, A Massachusetts Corporation Universal visualization platform
CN106055580A (zh) * 2016-05-23 2016-10-26 中南大学 一种基于Radviz的模糊聚类结果可视化方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060218563A1 (en) * 2005-02-01 2006-09-28 University Of Massachusetts, A Massachusetts Corporation Universal visualization platform
CN106055580A (zh) * 2016-05-23 2016-10-26 中南大学 一种基于Radviz的模糊聚类结果可视化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FANGFANG ZHOU等: "Extending Dimensions in Radviz Based on Mean Shift", 《2015 IEEE PACIFIC VISUALIZATION SYMPOSIUM (PACIFICVIS)》 *
周芳芳等: "基于维度扩展的Radviz 可视化聚类分析方法", 《软件学报》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111027599A (zh) * 2019-11-25 2020-04-17 中国建设银行股份有限公司 基于随机抽样的聚类可视化方法及装置
CN111027599B (zh) * 2019-11-25 2023-07-04 中国建设银行股份有限公司 基于随机抽样的聚类可视化方法及装置
CN113159516A (zh) * 2021-03-24 2021-07-23 国网浙江省电力有限公司宁波供电公司 一种基于电网运行数据的三维可视化信息分析系统
CN113159516B (zh) * 2021-03-24 2023-07-14 国网浙江省电力有限公司宁波供电公司 一种基于电网运行数据的三维可视化信息分析系统
CN114996362A (zh) * 2022-08-04 2022-09-02 深圳市共赢晶显技术有限公司 一种数据处理和存储方法
CN114996362B (zh) * 2022-08-04 2023-03-21 河南云帆电子科技有限公司 一种数据处理和存储方法

Also Published As

Publication number Publication date
CN110209745B (zh) 2021-12-10

Similar Documents

Publication Publication Date Title
Yao et al. Sensing spatial distribution of urban land use by integrating points-of-interest and Google Word2Vec model
Olson et al. Simulation of fuzzy multiattribute models for grey relationships
Abrantes et al. Modelling urban form: A multidimensional typology of urban occupation for spatial analysis
CN107833117B (zh) 一种考虑标签信息的贝叶斯个性化排序推荐方法
CN110209745A (zh) 基于Radviz的智能电网数据聚类可视化方法
Hanczar et al. Ensemble methods for biclustering tasks
CN105874753A (zh) 用于社交数据网络用户行为细分的系统和方法
CN106650763A (zh) 一种电力缴费渠道分析的指标选择、权值优化与渠道规划的计算方法
Feng et al. An SOE-based learning framework using multisource big data for identifying urban functional zones
Roy et al. Understanding resilience in slums using an agent-based model
Hu et al. Nonnegative matrix tri-factorization with user similarity for clustering in point-of-interest
Lin et al. Extracting urban landmarks from geographical datasets using a random forests classifier
Desjardins et al. Interactive visual clustering
CN112800111B (zh) 一种基于训练数据挖掘的位置预测方法
CN109919227A (zh) 一种面向混合属性数据集的密度峰值聚类方法
Macintyre et al. Using gene ontology annotations in exploratory microarray clustering to understand cancer etiology
Pan Using data mining for service satisfaction performance analysis for mainland tourists in Taiwan
Xie et al. We know your preferences in new cities: Mining and modeling the behavior of travelers
Cai et al. The mining of urban hotspots based on multi-source location data fusion
CN109583712B (zh) 一种数据指标分析方法及装置、存储介质
Putra et al. Application of The K-Means Clustering Method To Search For Potential Tourists of Bendesa Hotel
Barret et al. Predicting the Environment of a Neighborhood: A Use Case for France.
Haedo et al. Specialized agglomerations with Lattice data: Model and detection
Liu et al. GODoc: high-throughput protein function prediction using novel k-nearest-neighbor and voting algorithms
Yildirim et al. Evaluating the role of the nuclear microenvironment in gene function by population-based modeling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20211210

CF01 Termination of patent right due to non-payment of annual fee