CN107169089A - 一种基于聚类的多维流数据可视分析方法 - Google Patents

一种基于聚类的多维流数据可视分析方法 Download PDF

Info

Publication number
CN107169089A
CN107169089A CN201710333955.2A CN201710333955A CN107169089A CN 107169089 A CN107169089 A CN 107169089A CN 201710333955 A CN201710333955 A CN 201710333955A CN 107169089 A CN107169089 A CN 107169089A
Authority
CN
China
Prior art keywords
cluster
data
flow data
mrow
msub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201710333955.2A
Other languages
English (en)
Other versions
CN107169089B (zh
Inventor
高曙
陆丛
曹秀峰
魏万淇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan University of Technology WUT
Original Assignee
Wuhan University of Technology WUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan University of Technology WUT filed Critical Wuhan University of Technology WUT
Priority to CN201710333955.2A priority Critical patent/CN107169089B/zh
Publication of CN107169089A publication Critical patent/CN107169089A/zh
Application granted granted Critical
Publication of CN107169089B publication Critical patent/CN107169089B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2264Multidimensional index structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24568Data stream processing; Continuous queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种基于聚类的多维流数据可视分析方法,该方法包括:1)接收多维流数据,对多维流数据进行数据聚类,将聚类结果存储至可视化数据库中;2)通过Web后端访问可视化数据库,得到需要可视化的数据信息,然后使用WebSocket将可视化信息发送至Web前端;3)在Web前端利用数据聚类的结果进行视觉聚类,使用平行坐标法进行多维流数据的动态加载。本发明从数据聚类出发,引入了时间衰减因子,从数据挖掘的角度探究多维流数据的内在结构;在数据聚类的基础上,利用平行坐标对多维流数据进行视觉聚类,使用贝塞尔曲线代替折线并进行视觉编码操作,从而对数据聚类结果进行有效地可视化表征,让用户更好地发现流数据中的潜在规律。

Description

一种基于聚类的多维流数据可视分析方法
技术领域
本发明涉及数据挖掘和可视分析技术,尤其涉及一种基于聚类的多维流数据可视分析方法。
背景技术
随着物联网技术的飞速发展,产生了大量的多维流数据,如金融数据、图像数据、文本数据。相比于传统的静态数据,流数据具有如下特点:1)数据潜在大小是无限的;2)数据在线不断到达,需要实时处理;3)数据到达的顺序与数量每时每刻不同;4)除非可以保存,每条数据只能被处理一次。
这类数据复杂性更高、特点更难发现,且隐含的信息更加丰富。面对复杂繁多的数据,如何进行数据分析,能够发现信息背后深层的信息与规律,一直是困扰学术界的一大难题。采用可视化的方式可以使用户更直观、更高效的获取数据流中潜藏的、未知的、有价值的信息,发觉数据流中的内在模式,为管理者进行决策提供强有力的支持,多维数据的可视化技术有平行坐标,散点图矩阵,径向坐标等。对多维流数据进行可视分析,离不开人和计算机的相互协作。多维流数据的可视分析方法可以从两个维度展开。其一是以人为分析主体出发,强调符合人类认知的分析方法,这个维度的分析方法以交互式可视分析为代表;其二是从计算机角度出发,强调高性能的数据挖掘算法,例如数据聚类。结合流数据挖掘方法,提出一种基于聚类的多维流数据可视分析方法,能够帮助人们更直观、更高效地了解多维流数据内在结构和潜在规律,从而更好地发现有价值的信息,辅助人们进行决策。
发明内容
本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种基于聚类的多维流数据可视分析方法。
本发明解决其技术问题所采用的技术方案是:一种基于聚类的多维流数据可视分析方法,该方法包括:
1)接收多维流数据,对多维流数据进行数据聚类,将聚类结果存储至可视化数据库中;
2)通过Web后端访问可视化数据库,得到需要可视化的数据信息,然后使用WebSocket将可视化信息发送至Web前端;
3)在Web前端利用数据聚类的结果进行视觉聚类,使用平行坐标法进行多维流数据的动态加载。
按上述方案,所述步骤1)多维流数据进行数据聚类的具体方法如下:
1.1)设流数据S是一个M维的数据集合,用表示,对应在时刻(T1,…,Tk,…)到达。每一个对象都为M维数据:那么流数据可以表示为的无限集合,对于给定的微簇个数q,通过公式计算出对应的加权簇心Cω,j
其中,n为数据集的样本数量,ωi为对象的权重,q为设置的微簇的数目,为数据点在t时刻的实时权重。
1.2)当流数据对象到达时,通过以下公式计算与各个微簇的加权距离Dx,并选择最小值min Dx,记对应的微簇为CMC(Current Micro Cluster);
其中,M为数据集的维度,Xi j为第i个对象第j个维度上的值。
1.3)比较min Dx与用户自己设定的阈值半径Dc,若min Dx<Dc,则将当前流数据对象归并到微簇CMC中,结束当前微簇的更新;否则,以为中心构建新簇并进入步骤(1.4);
1.4)计算每一个微簇中最后到达的m个流数据对象的平均时间戳CFT(m),并选择最小值minCFT(m),然后比较minCFT(m)与用户输入的时间阈值h;若minCFT(m)<h,则合并两个最早的(若没有最早的,则合并规模最小的两个)旧微簇;否则,删除对应的旧微簇。
按上述方案,所述步骤1)中利用Spark平台对多维流数据进行数据聚类。
按上述方案,所述步骤3)在Web前端利用数据聚类的结果进行视觉聚类的具体方法如下:
3.1)根据多维流数据聚类的结果,计算每一个类簇的簇心在平行坐标上的映射位置;
3.2)根据公式计算每一个数据对象在(M-1)个数值轴相邻空间中聚合轴上的坐标位置;
Q′i=(1-β)Qi+βCi
其中,Q′i为聚合轴上的坐标位置,Qi是原始折线与聚合轴相交的位置,β为曲线的聚合程度,决定Q′i距离聚类中心的长度。
3.3)根据公式计算每一个相邻空间上的贝塞尔曲线;
B(t)=(1-t)3(i,pi)+3t(1-t)2(i+α,b1)+3t2(1-t)(i+1/2-α,b2)+t3(i+1/2,qi)其中,B(t)相邻空间上的贝塞尔曲线,α为曲线的平滑程度,(i,pi)为贝塞尔曲线的起始点坐标位置,(i+α,b1)、(i+1/2-α,b2)分别为三次贝塞尔曲线控制点的坐标,(i+1/2,qi)为Q′i的坐标位置,t从0到1不断增加。
3.4)使用不同的颜色编码来表示不同的类簇信息,同时进行渲染与绘制。
按上述方案,所述步骤3)中面向多维流数据的动态加载方法,具体步骤为:
使用VRSC对流数据进行数据聚类,并将聚类结果保存到可视化数据库中;
Web服务器不断查询可视化数据库,并将实时的数据聚类结果推送给Web前端;
Web前端接收到当前数据聚类结果后,将其缓存到数组中,根据数据聚类结果中各个类簇的中心,使用曲线聚合模型计算数组中各数据项的贝塞尔曲线控制点坐标;
清空平行坐标上前一时刻滑动窗口中的所有曲线,并通过贝塞尔曲线控制点的位置,利用公式(8)逐条绘制每个数据项的贝塞尔曲线,从而完成流数据的动态加载。
本发明产生的有益效果是:
首先,从数据聚类出发,引入了时间衰减因子,并使用Spark计算平台进行并行化处理,从数据挖掘的角度探究多维流数据的内在结构;
其次,在数据聚类的基础上,利用平行坐标对多维流数据进行视觉聚类,使用贝塞尔曲线代替折线并进行视觉编码操作,从而对数据聚类结果进行有效地可视化表征,让用户更好地发现流数据中的潜在规律。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明实施例的方法流程图;
图2是本发明实施例的多维流数据可视分析流程示意图;
图3是本发明实施例的多维流数据的数据聚类方法流程图;
图4是本发明实施例的平行坐标折线示意图;
图5是本发明实施例的基于平行坐标的曲线聚合模型示意图;
图6是本发明实施例的面向多维流数据的动态加载方法流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
如图1和图2所示,一种基于聚类的多维流数据可视分析方法,该方法包括:
1)接收多维流数据,对多维流数据进行数据聚类,将聚类结果存储至可视化数据库中;本实施例中步骤1)采用基于流数据聚类的可视化表征算法实现;
2)通过Web后端访问可视化数据库,得到需要可视化的数据信息,然后使用WebSocket将可视化信息发送至Web前端;
3)在Web前端利用数据聚类的结果进行视觉聚类,使用平行坐标法进行多维流数据的动态加载。
如图3,基于流数据聚类的可视化表征算法具体步骤:
本发明改进了传统的流数据聚类算法,引入衰减时间因子,使得离当前时间越近的数据点权重越大,反之则越小,各数据点的权重随着时间的流逝不断的衰减,动态地反映流数据的演化信息,提出了基于流数据聚类的可视化表征算法VRSC(VisualRepresentation algorithm based on Stream data Clustering)。
设流数据S是一个M维的数据集合,用表示,对应在时刻(T1,…,Tk,…)到达。每一个对象都为M维数据:那么流数据可以表示为的无限集合。
定义1衰减时间微簇特征DTCF
在引入衰减时间窗口后,可以将微簇的特征向量更新为衰减时间微簇特征(DecayTime Cluster Feature,记作DTCF)。DTCF具体描述为:
其中,用于保存微簇中各个元组的数据平方和,一共有M个值;用于保存微簇中各个元组的数据和,一共有M个值;CF2t用于保存时间戳的平方和;CF1t用于保存时间戳的线性和;ω表示所有元组的权重和;n是微簇中样本的个数;t表示最近元组到达的时间,相当于t=max(Ti)。
定义2衰减函数f(t)
选用公式(2)作为衰减衰减函数,其中λ>0,λ的值代表流数据的衰减速率,λ越大说明历史数据的权重随着时间衰减的越快。
f(t)=2-λt(λ>0) (2)
定义3实时权重
基于公式(2),使用公式(3)定义数据点在t时刻的实时权重其中tc为数据点到达的时间。
定义4加权簇心Cω,j
在传统的聚类算法中,类簇的中心一般都是簇内全部数据点的几何中心,但是由于时间衰减导致数据对象的实时权重不一,几何中心的方法不能够确定簇的中心。针对衰减时间因子的微簇特征,类簇的中心可以定义为簇内数据点的加权线性均值,如公式(4)所示,其中q为微簇的数目。
定义5加权距离Dx
当流数据对象到达时,需要计算与所有微簇之间的距离并选取最小值Dx,然后将该值与用户自己定义的微簇阈值半径Dc做比较。当min Dx<Dc时,将与该微簇合并;以为中心构建新簇,Dx的定义如公式(5)所示。
定义6平均时间戳CFT(m)
由公式(1)可知,CF1t是流数据时间戳的线性加权和,n是微簇中数据对象的个数,流数据对象的平均时间戳为CF1t/n,记CFT(m)为最后m个到达数据的平均时间戳,Tc为当前时刻,那么CFT(m)可以用公式(6)定义。
基于流数据聚类的可视化表征算法流程图如图3,具体的实现步骤为:
1.1)对于给定的微簇个数q,通过公式(4)计算出对应的加权簇心Cω,j
1.2)当流数据对象到达时,通过公式(5)计算与各个微簇的加权距离,并选择最小值min Dx,记对应的微簇为CMC(Current Micro Cluster);
1.3)比较min Dx与用户自己定义的阈值半径Dc,若min Dx<Dc,则将当前流数据对象归并到微簇CMC中,结束当前微簇的更新;否则,以为中心构建新簇并进入步骤1.4);
1.4)计算每一个微簇中最后到达的m个流数据对象的平均时间戳CFT(m),并选择最小值minCFT(m),然后比较minCFT(m)与用户输入的时间阈值h。若minCFT(m)<h,则合并两个最早的旧微簇;否则,删除对应的旧微簇。
实现上述算法采用多维流数据的数据聚类方法的并行化策略是:
1)Spark Streaming创建对象StreamingContext并配置参数,将输入的多维流数据按照Batch Size分成一个一个的离散流DStream(Discretized Stream);
2)DStream结构可以将各种运算流都转化成为一系列短时间间隔的无状态、确定性的批计算,然后将每一个DStream都转换为Spark平台中的RDD,缓存到内存空间中;
3)根据Spark资源管理器的任务分配算法,将各个离散流RDD分配到各自的Worker节点上,执行DP-CluStream算法的在线微聚类操作;
4)由主节点汇总所有的Worker节点,并结合用户输入的内容,完成VRSC的离线宏聚类操作,最终将结果存储到数据库中;
5)每当有数据流入时,Spark Streaming都会迭代上述的过程,从而实现多维流数据的并行聚类处理。
步骤3)在Web前端利用数据聚类的结果进行视觉聚类的具体方法如下:
记经过数据聚类且标准化后的多维数据集为XM×N,其中,M为数据集的维度,N为数据集的样本数量,那么需要M个平行坐标轴表示这个数据集,记这M个坐标轴分别为A1,A2,…,AM。对于数据集XM×N中的一个数据点xi=(xi1,xi2,…,xiM),可以在平行坐标上用折线P1,P2,…,PM表示,P1,P2,…,PM分别是平行坐标轴A1,A2,…,AM上的数值点,如图4所示。
使用贝塞尔曲线代替折线P1,P2,…,PM,并通过数据聚类中心将同类簇的曲线进行聚合,让用户能够在平行坐标视图上直观的观察到多维数据集的数据聚类情况。
考虑两个相邻的平行坐标数值轴Ai和Ai+1围成的空间,聚合轴Vi将这个空间均分为两个部分,每个部分分别定义两条控制轴,每个控制轴与对应的数值轴与聚合轴的距离都为α(数值轴Ai和Ai+1之间的距离为1),如图5所示。折线PiPi+1与聚合轴Vi相交于点Qi。折线PiPi+1被均分成了PiQi与QiPi+1两个部分,可以使用两条三次贝塞尔曲线表示这两条线段。附图5中,Ci为该折线所在聚簇的聚类中心,Q′i的位置由公式(7)决定。
Q′i=(1-β)Qi+βCi (7)
参数α与β用于调整贝塞尔曲线的形状。α决定贝塞尔曲线控制点的位置,称作曲线的平滑程度;β决定Q′i距离数据聚类中心的长度,称作曲线的聚合程度。
第一条三次贝塞尔曲线的起点是Pi,终点是Q′i,两个控制点分别落在控制轴Yi,1、Zi,1上,如附图5中的红色点所示。同理,第二条三次贝塞尔曲线的两个控制点会在控制轴Yi,2、Zi,2上(未标出)。这两条三次贝塞尔曲线会共享同一个控制点Q′i,所以两条曲线会在Q′i保持曲线的连续性。
记第一条贝塞尔曲线的起始点Pi的坐标向量为(i,pi),终点Q'i的坐标向量为(i+1/2,qi)(qi由公式(7)决定),控制点B1、B2的坐标向量分别为(i+α,b1),(i+1/2-α,b2),那么曲线PiQ′i可以描述为:
B(t)=(1-t)3(i,pi)+3t(1-t)2(i+α,b1)+3t2(1-t)(i+1/2-α,b2)+t3(i+1/2,qi) (8)
其中,t从0到1不断变化。
M个平行坐标轴上会形成M-1个区域,一个数据项在每一个区域都有两条三次贝塞尔曲线,一共需要绘制2(M-1)条三次贝塞尔曲线。当有N个数据项时,共需绘制2N(M-1)条三次贝塞尔曲线。具体实现步骤为:
3.1)根据多维流数据聚类的结果,计算每一个类簇的簇心在平行坐标上的映射位置;
3.2)根据公式(7)计算每一个数据对象在(M-1)个数值轴相邻空间中聚合轴上的坐标位置;
3.3)根据公式(8)计算每一个相邻空间上的贝塞尔曲线;
3.4)使用不同的颜色编码来表示不同的类簇信息,同时进行渲染与绘制。
面向多维流数据的动态加载方法,如图6,具体步骤为:
1)使用VRSC对流数据进行数据聚类,并将聚类结果保存到可视化数据库中;
2)Web服务器不断查询可视化数据库,并将实时的数据聚类结果推送给Web前端。
3)Web前端接收到当前数据聚类结果后,将其缓存到数组中,根据数据聚类结果中各个类簇的中心,使用曲线聚合模型计算数组中各数据项的贝塞尔曲线控制点坐标。
4)清空平行坐标上前一时刻滑动窗口中的所有曲线,并通过贝塞尔曲线控制点的位置,利用公式(8)逐条绘制每个数据项的贝塞尔曲线,从而完成流数据的动态加载。
应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

Claims (4)

1.一种基于聚类的多维流数据可视分析方法,其特征在于,该方法包括:
1)接收多维流数据,对多维流数据进行数据聚类,将聚类结果存储至可视化数据库中;
2)通过Web后端访问可视化数据库,得到需要可视化的数据信息,然后使用WebSocket将可视化信息发送至Web前端;
3)在Web前端利用数据聚类的结果进行视觉聚类,使用平行坐标法进行多维流数据的动态加载。
2.根据权利要求1所述的基于聚类的多维流数据可视分析方法,其特征在于,所述步骤1)多维流数据进行数据聚类的具体方法如下:
1.1)设流数据S是一个M维的数据集合,用表示,对应在时刻(T1,…,Tk,…)到达。每一个对象都为M维数据:那么流数据可以表示为的无限集合,对于给定的微簇个数q,通过公式计算出对应的加权簇心Cω,j
<mrow> <msub> <mi>C</mi> <mrow> <mi>&amp;omega;</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <mo>=</mo> <mfrac> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>&amp;omega;</mi> <mi>i</mi> </msub> <mo>*</mo> <mover> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>&amp;OverBar;</mo> </mover> </mrow> <mrow> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mi>&amp;omega;</mi> <mrow> <mo>(</mo> <mover> <msub> <mi>X</mi> <mi>i</mi> </msub> <mo>&amp;OverBar;</mo> </mover> <mo>,</mo> <msub> <mi>t</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>,</mo> <mi>j</mi> <mo>&amp;Element;</mo> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>,</mo> <mi>q</mi> <mo>&amp;rsqb;</mo> </mrow>
其中,n为数据集的样本数量,ωi为对象的权重,q为设置的微簇的数目,为数据点在t时刻的实时权重。
1.2)当流数据对象到达时,通过以下公式计算与各个微簇的加权距离Dx,并选择最小值min Dx,记对应的微簇为CMC;
<mrow> <msub> <mi>D</mi> <mi>x</mi> </msub> <mo>=</mo> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>&amp;omega;</mi> <mi>i</mi> </msub> <mo>*</mo> <mo>|</mo> <msubsup> <mi>X</mi> <mi>i</mi> <mi>j</mi> </msubsup> <mo>-</mo> <msub> <mi>C</mi> <mrow> <mi>&amp;omega;</mi> <mo>,</mo> <mi>j</mi> </mrow> </msub> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>,</mo> <mi>j</mi> <mo>&amp;Element;</mo> <mo>&amp;lsqb;</mo> <mn>1</mn> <mo>,</mo> <mi>q</mi> <mo>&amp;rsqb;</mo> </mrow>
其中,M为数据集的维度,Xi j为第i个对象第j个维度上的值。
1.3)比较min Dx与用户自己设定的阈值半径Dc,若min Dx<Dc,则将当前流数据对象归并到微簇CMC中,结束当前微簇的更新;否则,以为中心构建新簇并进入步骤(1.4);
1.4)计算每一个微簇中最后到达的m个流数据对象的平均时间戳CFT(m),并选择最小值minCFT(m),然后比较minCFT(m)与用户输入的时间阈值h;若minCFT(m)<h,则合并两个最早的旧微簇;否则,删除对应的旧微簇。
3.根据权利要求1所述的基于聚类的多维流数据可视分析方法,其特征在于,所述步骤1)中利用Spark平台对多维流数据进行数据聚类。
4.根据权利要求1所述的基于聚类的多维流数据可视分析方法,其特征在于,所述步骤3)在Web前端利用数据聚类的结果进行视觉聚类的具体方法如下:
3.1)根据多维流数据聚类的结果,计算每一个类簇的簇心在平行坐标上的映射位置;
3.2)根据公式计算每一个数据对象在(M-1)个数值轴相邻空间中聚合轴上的坐标位置Q′i
Q′i=(1-β)Qi+βCi
其中,Q′i为聚合轴上的坐标位置,Qi是原始折线与聚合轴相交的位置,β为曲线的聚合程度,决定Q′i距离聚类中心的长度。
3.3)根据公式计算每一个相邻空间上的贝塞尔曲线B(t);
B(t)=(1-t)3(i,pi)+3t(1-t)2(i+α,b1)+3t2(1-t)(i+1/2-α,b2)+t3(i+1/2,qi)其中,B(t)相邻空间上的贝塞尔曲线,α为曲线的平滑程度,(i,pi)为贝塞尔曲线的起始点坐标位置,(i+α,b1)、(i+1/2-α,b2)分别为三次贝塞尔曲线控制点的坐标,(i+1/2,qi)为Q′i的坐标位置,t从0到1不断增加。
3.4)使用不同的颜色编码来表示不同的类簇信息,同时进行渲染与绘制每个数据项的贝塞尔曲线。
CN201710333955.2A 2017-05-12 2017-05-12 一种基于聚类的多维流数据可视分析方法 Expired - Fee Related CN107169089B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710333955.2A CN107169089B (zh) 2017-05-12 2017-05-12 一种基于聚类的多维流数据可视分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710333955.2A CN107169089B (zh) 2017-05-12 2017-05-12 一种基于聚类的多维流数据可视分析方法

Publications (2)

Publication Number Publication Date
CN107169089A true CN107169089A (zh) 2017-09-15
CN107169089B CN107169089B (zh) 2020-09-01

Family

ID=59814917

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710333955.2A Expired - Fee Related CN107169089B (zh) 2017-05-12 2017-05-12 一种基于聚类的多维流数据可视分析方法

Country Status (1)

Country Link
CN (1) CN107169089B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165359A (zh) * 2017-11-06 2019-01-08 徐海飞 一种基于web服务平台的高维数据降维方法及系统
CN111509846A (zh) * 2020-04-17 2020-08-07 贵州电网有限责任公司 一种电网大数据高效收集方法及系统
CN113033615A (zh) * 2021-03-01 2021-06-25 电子科技大学 一种基于在线微簇聚类的雷达信号目标实时关联方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1340785A (zh) * 2000-09-01 2002-03-20 国际商业机器公司 以一个平行坐标系可视地分析点击流数据的系统与方法
US20090018801A1 (en) * 2007-07-09 2009-01-15 Irina Gladkova Lossless compression algorithm for hyperspectral data
CN103268327A (zh) * 2013-04-28 2013-08-28 浙江工业大学 面向高维服务数据的混合可视化方法
CN104794748A (zh) * 2015-03-17 2015-07-22 上海海洋大学 基于Kinect视觉技术的三维空间地图构建方法
CN106570104A (zh) * 2016-11-01 2017-04-19 南京理工大学 一种流数据的多分区聚类预处理方法
CN106651277A (zh) * 2017-01-04 2017-05-10 南阳师范学院 一种基于区域物流信息的网络传输系统及数据分析方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1340785A (zh) * 2000-09-01 2002-03-20 国际商业机器公司 以一个平行坐标系可视地分析点击流数据的系统与方法
US20090018801A1 (en) * 2007-07-09 2009-01-15 Irina Gladkova Lossless compression algorithm for hyperspectral data
CN103268327A (zh) * 2013-04-28 2013-08-28 浙江工业大学 面向高维服务数据的混合可视化方法
CN104794748A (zh) * 2015-03-17 2015-07-22 上海海洋大学 基于Kinect视觉技术的三维空间地图构建方法
CN106570104A (zh) * 2016-11-01 2017-04-19 南京理工大学 一种流数据的多分区聚类预处理方法
CN106651277A (zh) * 2017-01-04 2017-05-10 南阳师范学院 一种基于区域物流信息的网络传输系统及数据分析方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
CUZZOCREA A, ZALL D: "Parallel Coordinates Technique in Visual Data Mining: Advantages, Disadvantages and Combinations", 《INTERNATIONAL CONFERENCE ON INFORMATION VISUALISATION》 *
ZHANG Y: "Multi-view dimensionality reduction via canonical random correlation analysis", 《FRONTIERS OF COMPUTER SCIENCE》 *
刘芳: "信息可视化技术及应用研究", 《万方学位论文数据库》 *
孟浩: "网络安全流数据可视化技术研究", <中国优秀硕士学位论文全文数据库 信息科技辑> *
杨宁: "一种基于时态密度的倾斜分布数据流聚类算法", 《软件学报》 *
陈谊,蔡进峰,石耀斌: "基于平行坐标的多视图协同可视分析方法", 《系统仿真学报》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109165359A (zh) * 2017-11-06 2019-01-08 徐海飞 一种基于web服务平台的高维数据降维方法及系统
CN111509846A (zh) * 2020-04-17 2020-08-07 贵州电网有限责任公司 一种电网大数据高效收集方法及系统
CN113033615A (zh) * 2021-03-01 2021-06-25 电子科技大学 一种基于在线微簇聚类的雷达信号目标实时关联方法

Also Published As

Publication number Publication date
CN107169089B (zh) 2020-09-01

Similar Documents

Publication Publication Date Title
Yan et al. Coupled group lasso for web-scale ctr prediction in display advertising
Abhishekh et al. A score function-based method of forecasting using intuitionistic fuzzy time series
CN108537274B (zh) 一种基于网格的企业poi位置点快速空间多尺度聚类方法
CN107169089A (zh) 一种基于聚类的多维流数据可视分析方法
Li et al. Multi-attribute group decision-making considering opinion dynamics
Tang et al. Delegation mechanism-based large-scale group decision making with heterogeneous experts and overlapping communities
JPWO2006132194A1 (ja) 情報処理装置及び情報処理方法、画像処理装置及び画像処理方法、並びにコンピュータ・プログラム
Gautam et al. A Score Function-Based Method of Forecasting Using Intuitionistic Fuzzy Time Series.
CN115062237A (zh) 基于图神经网络和知识图谱结合的文化资源推荐方法
CN109559156A (zh) 基于客户属性及营销数据的客户意向有监督预测方法
CN107958020A (zh) 一种基于聚簇的电网数据处理和数据可视化方法
Qin et al. A new parameter reduction algorithm for soft sets based on chi-square test
Wang et al. Hierarchical visualization of geographical areal data with spatial attribute association
CN106649714B (zh) 针对数据不均匀及数据稀疏的topN推荐系统及方法
CN106021529A (zh) 一种基于平行坐标系的海量文件流转可视化方法
CN112270374A (zh) 基于som聚类模型的数学表达式的聚类方法
CN104462480B (zh) 基于典型性的评论大数据挖掘方法
CN106354886A (zh) 在推荐系统中利用潜在邻居关系图筛选最近邻居的方法
Huang [Retracted] Facility Layout Optimization of Urban Public Sports Services under the Background of Deep Learning
Hua et al. Applying data visualization techniques for stock relationship analysis
CN112419810B (zh) 基于自适应认知交互的精准控制智慧教育方法
Yang et al. Clues: a unified framework supporting interactive exploration of density-based clusters in streams
Mondal et al. Integral equations with pentagonal intuitionistic fuzzy numbers
CN109886313A (zh) 一种基于密度峰的动态图聚类方法
Cui et al. Confluent-drawing parallel coordinates: Web-based interactive visual analytics of large multi-dimensional data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20200901

Termination date: 20210512

CF01 Termination of patent right due to non-payment of annual fee