CN108363797B - 一种基于变换的关联图可视分析方法及其系统 - Google Patents

一种基于变换的关联图可视分析方法及其系统 Download PDF

Info

Publication number
CN108363797B
CN108363797B CN201810154975.8A CN201810154975A CN108363797B CN 108363797 B CN108363797 B CN 108363797B CN 201810154975 A CN201810154975 A CN 201810154975A CN 108363797 B CN108363797 B CN 108363797B
Authority
CN
China
Prior art keywords
association
data
nodes
view
graph
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810154975.8A
Other languages
English (en)
Other versions
CN108363797A (zh
Inventor
陈谊
杜晓敏
管泽礼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Technology and Business University
Original Assignee
Beijing Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Technology and Business University filed Critical Beijing Technology and Business University
Publication of CN108363797A publication Critical patent/CN108363797A/zh
Application granted granted Critical
Publication of CN108363797B publication Critical patent/CN108363797B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Abstract

本发明公布了一种基于变换的关联图可视分析方法、系统及应用,通过关联图TransGraph中关联描述及关联探索两个视图展示数据集中的复杂关联,利用基于力导引的布局方法、图简化技术及图可视化中的交互设计,实现对数据的关联信息进行可视分析,解决在表示复杂关联时容易因边的交叉而导致视觉混乱的问题,突出重点监管对象、全面地展现关联信息,从而可有效地辅助分析人员制定决策。该可视分析方法可应用于农药残留检测结果数据集的可视分析,并提供了利用该可视分析方法实现的农残数据关联可视分析系统。

Description

一种基于变换的关联图可视分析方法及其系统
技术领域
本发明属于信息可视化领域,涉及数据可视分析方法,尤其涉及一种基于变换的关联图可视分析方法及其系统。
背景技术
关联关系一直以来都是数据分析的重要研究对象,存在于现实世界的各个领域之中,以农药残留数据为例,它由农药和农产品这两个互不相交的集合组成,同时农药与农产品之间存在着残留这种关联关系。图是一种常见的用来为关联关系进行建模的数学方法,可以在高层次上对事物间的联系进行有效总结,而从可视化角度而言,图可视化也是信息可视化领域的一个重要分支,又称为关联网络、网络或关联图,是关联数据分析过程中的核心组成部分,在可视化研究领域中有着大量的研究成果。
然而,针对复杂关联的图可视化工作往往有着较大挑战性,通常易因边的交叉而导致视觉混乱(visual cluttering),且其布局复杂度也会因图的规模增大而受较大影响,难以将信息高效地传达至分析人员或最终用户。而基于数据抽象、视图变换等图简化技术从数据或视图层面上对原始图数据进行变换,则可有效降低可视化复杂度,减少视觉杂乱,并具有交互方法灵活等特点,进而能够充分发挥节点-链接图的优势,提升用户体验和工作效率,在分析复杂关联时有着重要的价值和意义。
针对图布局的优化方法一直以来都是图可视化研究的重点之一,常用的图布局方法主要包括节点-链接图(Node-Link Graph)和相邻矩阵(Adjacency Matrix)两大类。而节点-链接图是对网络关系最自然、经典的可视化布局表达,具有关系传递表达清晰、直观易理解的特点,在社交网络分析、生物网络研究等多个领域内得到了广泛地应用,力导引布局则为该类方法的一种代表性布局。力导引布局方法(Force-directed Algorithm)是一种广受欢迎的节点-链接图布局技术,该方法可有效避免边的交叉,尽量保持边长一致,能产生优美的网络布局,充分展现网络的整体结构及其特征。Eades基于弹簧模型将图看成一个顶点为钢环、边为弹簧的物理系统,进而模拟布局过程:在系统被赋予某个初始状态后,弹簧的作用会导致钢环的运动,过近的点会被弹开,过远的点被拉进,通过不断迭代使整个布局达到平衡并趋于稳定。力导引布局方法有着良好的美学特性,且直观、易理解,可以用于大多数网络关联数据集,这一特点使其成为具有较大吸引力的一种图布局方法。但是,因该方法需要通过反复迭代以使得模型能量最小化,故其复杂度通常相对较高。针对此问题许多学者对布局方法进行了优化,其思路主要为减少迭代次数和降低每次迭代的时间复杂度。然而,随着现阶段数据量的不断增大,图可视化面临着更多的挑战,仅仅依靠布局优化难以实时高效地完成图布局并视觉友好地将具有复杂关联的信息(层次或网络关联描述或探索信息)呈现在一个固定大小的屏幕之内,因此,基于简化技术动态、交互性地实现对图的信息分级和联动展示,实现通过变换来进行复杂图数据的呈现则具有更加重要的价值和作用。
图的简化技术是指针对复杂关联图所进行的图数据以及视图层次上的精简与可视表达方法,又称为基于变换的大图可视化方法。该类方法融合了现有的图布局方法、数据抽象(聚类、图过滤等)方法、视图变换(边绑定、鱼眼变换)以及主流交互技术(Overview+Detail,Focus+Context等),具有可视复杂度较低,用户交互体验好的优点,在分析复杂关联时可发挥重要的作用。其中,数据层次的简化往往需要结合数据挖掘或统计手段预先对数据进行过滤筛选、数据聚集或分层处理,将待可视化的图转换为小型图或特殊类型的图(如:树)以为后续进行信息编码及可视化渲染等做好准备,主要包括抽样、聚类和降维方法。而视图层次的简化则是指在可视化视图的层面上对图中的节点或连接的绘制以及可视化信息编码方面进行简化处理。边绑定技术(edge bundling)和鱼眼(fish eye)视图变换则是典型的视图层次的图简化方法。
此外,交互技术也是基于变换的图可视化方法的重要组成部分,在图可视化的一些早期研究工作中,主要为针对图结构的静态可视化布局算法的研究,往往不具有或具有非常有限的交互功能,而随着图数据量的增大以及人们认识的转变,交互技术也逐渐较多地融入图可视化的许多研究工作之中。交互组件允许用户通过过滤筛选、平移缩放及参数调整等操作动态地影响可视化结果,从而更加有效地帮助分析人员发现模式与规律。
现有可视化方法在解决关联数据可视分析的时候,往往无法同时实现针对复杂关联的描述及探索,突出展示重点对象、全面展示关联信息的功能。
发明内容
本发明提出了一种基于变换的关联图TransGraph可视分析方法及其系统,可实现针对复杂关联的描述及探索,突出展示重点对象、全面展示关联信息。
本发明中,关联图TransGraph主要由关联描述及关联探索两个主视图组成,用于实现对数据中复杂关联的描述与探索。关联图TransGraph采用力导向布局展现节点间的关联关系,利用双层圆环和放射环展示当前关注节点的数据分布和层次结构;采用图过滤实现数据层面的抽象和筛选,并通过K-means聚类探索图中节点的潜在相似性;通过鱼眼(fisheye)技术、边绑定以及基于细节分级原则(Level of Detail)的交互式分层探索方法进行视图变换,实现对焦点图元信息的突出展示和复杂视图的简化;支持用户交互式地逐层钻取查看图的细节及节点相似性。即通过本发明可以实现针对复杂关联的描述及探索,突出展示重点对象、全面展示关联信息。
本发明的技术方案如下:
一种基于变换的关联图TransGraph可视分析方法及其系统。关联图TransGraph主要包括关联描述及关联探索两个主视图,用于描述数据中的复杂关联;基于变换的关联图TransGraph可视分析方法,首先,针对关联数据的属性及关联信息映射为图模型(如:二部图)中的元素,然后对关联数据的属性及关联信息进行有选择性地过滤(例如特定的研究范围)及初步统计分析,然后利用TransGraph的关联描述视图与关联探索视图对关联信息进行视觉编码,将信息映射为颜色、形状或布局等视觉元素,进而完成待分析任务;如图1所示,具体包括如下步骤:
A.针对关联数据,提取关联数据中的的层次关系以树的形式来展示,通过节点的选择或者导航区的筛选,得到焦点fu
B.根据A所得的焦点fu,生成关联描述视图,所述关联描述视图为二部图;
本发明具体实施时,基于donut圆环图与力导向布局方法展现节点间的关联关系;采用基于Level of Detail思想的可视交互技术及鱼眼视图变换技术对力导向关联图布局进行简化;
C.根据A所得的焦点fu,生成关联探索视图;
本发明具体实施时,利用Sunburst放射环的根节点区域展示图中节点的K-means相似性聚类结果概览(包括簇的个数、每个簇中子数据(如实施例中的农药)的个数、各簇子数据整体属性),并支持通过视图切换进一步查看层次结构中的相似性(子数据属性相似)与关联细节,该部分内容基于层次边绑定思想实现展示各节点之间的连接密度;
其中,本发明以可视化两类数据间复杂关联为例,即用二部图(关联描述视图)进行建模,其中二部图为图论中的一种特殊模型,该类图的特点为其顶点集可以分成两个不相交的集合,使得在同一个集合内的顶点互不相邻(没有共同边),则步骤B所述操作包括的处理步骤具体为:
B1.获取A所得的焦点fu,计算与当前焦点关联的子图V,得到关联边集合E1;获取关联数据属性,计算不同属性值在该焦点中的占比,并用圆环实现可视化;
B2.计算与B1中V关联的其他节点所构成的子图U’,得到关联边集合E2,进而满足对不同节点的相同属性进行对比分析的需求,本发明将此过程称为二次关联;
B3.根据关联边集合E1,E2,基于力导向布局连接fu,V,U’图中相应节点,构成新的二部图G’,其中力中心根据圆环圆心位置进行初始设置和调整;基于弹簧模型Es的力导向布局方法的计算公式表示为式1:
Figure GDA0001707810170000041
其中,k为弹性系数,d(i,j)表示平面上两点i和j之间的欧式距离,s(i,j)表示弹簧的自然长度。
其后上述弹簧模型Es演化为能量模型E,即针对两点间的物理模型(弹簧模型)做了进一步丰富,采用静电力来模拟图中节点间的相互作用,进而计算节点间的相对位置关系,能量模型可表示为式2:
Figure GDA0001707810170000042
其中,r表示两点间的静电力常数;wiwj为两点的权重;d(i,j)同样表示平面上两点i和j之间的欧式距离;
B4.将二部图G’中两个部分别可视化为圆形与矩形视觉元素,以加以显示区分,更好地体现二者关联;
B5.在B4所得的视图基础上,通过鱼眼变形函数实现对普通视图中各节点坐标的变换,至此得到变换后的关联描述子视图,进而突出重点关注对象。鱼眼技术(鱼眼变形函数)最早由Furnas于1986年提出,具体通过式3建立用户对信息空间中对象的DOI函数(Degree of Interest Function):
DOI(x|y)=API(x)-D(x,y) (式3)
其中,x是任一个信息对象;y是当前的焦点对象;API(x)是用户对信息对象x的先验关注度(A Priori Interest);D(x,y)是x与y之间的空间距离或语义距离。
步骤C所述操作包括的步骤具体为:
C1.首先,获取A所得的焦点的关联数据属性及其所属分类,用交互式放射环展示层次关联;
C2.根据关联数据节点间的关联关系,确立待聚类的数据点,即获得数据集合节点相应的向量。
针对二部图中的其中一个数据集合节点vk(k=1,2,...,m,m为集合节点个数)以及另一数据集合序列u1,u2,u3,...,un(其中n为集合节点个数),定义如下:若vk与ul(l=1,2,...,n)存在关联关系,则对应标识ukl取值为1,否则为0,则对于任意一个vi都存在一个向量(ui1,ui2,ui3,...,uin);
C3.根据上述检出向量计算WSS(Within Sum of Square,内平方和):
Figure GDA0001707810170000051
其中pi为数据对象,q(i)表示与该数据对象最近的质心,d和N分别代表节点间的距离以及数据点的个数;根据WSS确定K-means聚类中的K的个数,通常随k值的增减使得WSS显著降低时的k较为合适。
C4.通过计算农药节点vi,vj(其中i,j=1,2,...,m,m为农药节点个数)之间的欧式距离(式5),进行K-means聚类(K为C3所得结果),得出聚类向量,该向量指出农药节点的聚类簇编号(如图7所示聚类向量中类别1、2、3)。
Figure GDA0001707810170000052
其中,d为节点间的距离;节点vi对应向量为(ui1,ui2,ui3,...,uin);
C5.将步骤C4的聚类结果以圆形节点簇的形式置于放射环的根节点区域内,每个圆代表一个农药节点,基于力导向布局将各个圆根据聚类结果组成各个簇,实现对结果的概览展示;
C6.通过视图切换和层次边绑定展示层次结构中的潜在关联细节,层次边绑定即以B样条曲线的形式借助层次关系进行关联边的弯曲,进而有效地展现关联层次复合图的复杂关系。并可根据节点及关联边数目调整绑定边的张力系数,即通过调整该系数控制边集束曲线的弯曲程度,进而实现降低视觉复杂度和展示关联边细节之间的权衡。
将上述方法应用于农药残留检测结果数据集,本发明实施例提供一种农残数据关联可视分析系统PestResiTGVis,该系统从关联描述及分析两个角度展示农药残留数据集中的复杂关联,包括农药与农产品间的检出关系,农产品的类别归属(层次关联),农药同农药之间的同源或衍生关系,农药毒性和功效分类(层次关联),检出值(超标量)随时间的变化关联,检出值(超标量)与不同地域的关联分布等。系统包括农残检测结果数据过滤导航模块、农产品与农药的检出关联描述模块、农残检出关联探索模块,还包括辅助视图模块;具体地:
一、农残检测结果数据过滤导航模块,用以获取用户过滤选择关注的焦点对象,满足按照农产品所属类目、特定样品名称、采样时间区间及省份进行数据筛选的需求。农残关联数据集可以表示为如下形式:
G=(U,V,E)
其中,图G代表农残检测结果数据集,U和V为图G的两个部(parts),分别代表农产品和农药集合。E则为U和V之间的关联边集合,对于每个E中的每条边e(u,v)代表在农产品u中有农药v检出。
二、农产品与农药的检出关联描述模块,该模块实现了在对比、展示数据中网络关联的同时体现当前关注节点的数据分布。支持节点双击钻取展示细节,钻取后展示细节描述图。该模块揭示当前关注农产品节点的农药检出情况(农药种类、检出频次、化学成分、毒性及超标分布)以及检出同种农药的其他农产品,支持通过节点双击钻取农产品子视图中农产品节点u,计算该农产品中的各种农药v的检出含量分布,将节点以donut圆环代替圆形来可视化分布,还结合了鱼眼视图与力导向图,可以展示切换后的关联细节(农残检出含量分布等)视图;
三、农残检出关联探索模块,该模块用于展示农药节点的K-means相似性聚类结果概览(簇的个数,每个簇中农药的个数,各簇农药整体毒性),支持通过视图切换进一步查看层次结构中的相似性(农药施用的对象相似)关联细节。还可以体现不同农药间的检出相似性关联以及功效分布。
四、辅助视图模块,该模块用于展示统计得出的农药残留数据,充分利用字云与条形图在信息对比排序、显示占比分布等方面的优势,进而直观展示检出频次较多的农药及农产品。能够提供农残超标排名前3名的水果、蔬菜名称,并对比显示相应的检出农药频次、检出农药种数及超标农药频次。
与现有技术相比,本发明的有益效果是:
本发明提出了一种基于变换的关联图可视分析方法及系统,提供关联描述及关联探索两个主视图区,支持在对比、展示数据中网络关联的同时体现当前关注节点的数据分布或层次结构,并能根据用户关注度交互式地逐层展示图的细节及节点的潜在相似性,从而更加有效地帮助分析人员发现模式与规律、突出展示重点对象、全面展示关联信息。
附图说明
图1为本发明实施例中农残可视分析方法/系统PestResiTGVis的流程框图。
图2为本发明实施例提供的关联描述及关联探索两个主视图区;
中,(a)为关联描述视图,(b)为关联探索视图;关联描述视图是用来对比、展示数据中网络关联的同时体现当前关注节点的数据分布;关联探索视图实现了对农药的功效类别归属的展示,并探索节点间的潜在关联。
图3为本发明实施例中的可视化分析视图;
其中,(A)、(B)为农残检测结果数据过滤导航区;(C)为农产品与农药的检出关联描述视图;(D)为农残检出关联探索视图;(E)为经权重过滤动态生成的C视图的变换效果图;(F)为经鱼眼视图变换与鼠标悬停高亮显示关联信息的交互效果图;(G)为视图为根据所聚类节点数目变换簇中节点大小后的效果图。
图4为本发明实施例中的导航过滤窗口(农产品层次分类树)。
图5为本发明实施例中关联描述视图;
其中,(a)、(b)分别为鱼眼视图变换前后的效果图;(c)为节点钻取之后的细节展示图;(d)为根据权重过滤动态生成的变换效果图。
图6为本发明实施例中聚类簇个数的计算结果。
图7为本发明实施例中500余种农药的聚类向量结果。
图8为本发明实施例中关联探索视图;
其中,(a)、(b)分别为包含不同类农药节点簇的放射环,环的颜色代表农药功效,环内节点颜色代表所属簇的类别。
图9为簇中节点名称所生成字云,其同簇颜色相同。
图10为本发明实施例中关联探索视图的辅助视图,展示农药层次结构中的潜在关联细节。
图11为本发明实施例中可视分析系统界面效果图;
其中,(H)为关联农药名称的字云视图;(I)为检测农药频次的条形图视图;(J)为原始关联数据展示区;(K)为农药残留统计数据展示视图。
图12为本发明实施例中二部图模型示意图。
具体实施方式
下文将结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。
本发明提供基于变换的关联图可视分析方法、系统及应用,从关联描述及探索两个角度展示数据集中的复杂关联(如图2所示),利用基于力导引的布局方法(节点-链接图)、图简化技术(K-means聚类、基于图拓扑的鱼眼变换技术、图过滤和边绑定技术)以及图可视化中的交互设计(焦点+上下文技术、平移和缩放技术、全局+细节的技术以及交互式动态过滤)。采用本发明方法能够解决在表示复杂关联时容易因边的交叉而导致视觉混乱的问题,突出重点监管对象、全面地展现关联信息,从而可有效地辅助分析人员制定决策。该方法的具体操作步骤为:
A.针对关联数据,将关联数据的层次信息投影到层次关系树中,通过节点的选择或者
导航区的筛选,得到焦点;具体实施方式是:
对农产品子图U’按照专家知识提取农产品层次关系树(如:水果→核果类水果→油桃),分为水果和蔬菜两个大类;将上述所获得层次关系树对应映射至树展示区,该树支持动态展开与收缩,采用树节点名称展示U’中元素名称,树中节点大小表示该子类下属的农产品数目,例如,数目越多,节点颜色越接近红色,否则则接近绿色(如图4以及图3中A、B区所示);选中节点,则可获取当前用户关注焦点fu。
B.根据A所得的焦点,生成关联描述视图;处理步骤具体为:
B1.获取当前关注农产品焦点fu,以红色边框标注;计算与当前焦点关联的农药子图V,得到关联边集合E1;获取农药化学成分属性(如:有机氮类农药),计算不同成分农药在该农产品中残留的占比,并用圆环实现可视化;
B2.计算与B1中V关联的其他农产品所构成的子图U’,得到关联边集合E2,进而满足T2的对比分析需求,本文将此过程称为二次关联;
B3.根据关联边集合E1,E2,基于力导向布局连接fu,V,U’图中相应节点,构成新的二部图G’,其中力中心根据圆环圆心位置进行初始设置和调整;其中力导向布局(Force-directed Algorithm)基于弹簧模型将图看成一个顶点为钢环、边为弹簧的物理系统,进而模拟布局过程:在系统被赋予某个初始状态后,弹簧的作用会导致钢环的运动,过近的点会被弹开,过远的点被拉进,通过不断迭代使整个布局达到平衡并趋于稳定。其后该方法演化为能量模型,针对两点间的物理模型做了进一步丰富,是对弹簧模型的一般化描述,该方法采用静电力来模拟图中节点间的相互作用,进而计算节点间的相对位置关系。
B4.将二部图G’中的农产品部与农药部分别可视化为圆形与矩形视觉元素,以加以显示区分,更好地体现二者关联;计算G’中所有农产品节点的农药检出品种数及频次,并根据其值分别可视化映射为农产品节点的颜色(插值)和大小,所检出的农药品种数值越大农产品节点越接近红色颜色,所检出频次越多,节点越大;获取农药毒性,则农药节点的矩形边框颜色将根据毒性(如:剧毒、高毒、中低毒)不同而有所不同(如:红、深橘、黄);
B5.在B4所得的视图(如图5(a)所示)基础上通过鱼眼变形函数实现对普通视图中各节点坐标的变换,至此得到子视图(如图5(b)所示)。
基于图拓扑的鱼眼变换技术(鱼眼变形函数)是另一种有效的图简化方法,该类方法可以产生类似摄影中鱼眼镜头的效果。鱼眼镜头是一种广角镜头,其拍摄所得效果近似于将图像径向扭曲变形,因此经此变换的可视化结果的特点是将焦点信息放大,而焦点周围的上下文信息则相对逐渐缩小,从而达到突出重点、兼顾周边信息的视觉效果。将鱼眼视图扩展到图(Graphs)的可视化,即扩展为图中的鱼眼视图。图中的鱼眼视图中,鱼眼视图中顶点的位置取决于它在变换前的普通视图中的位置以及它与当前焦点的距离;鱼眼视图中顶点的大小取决于它与焦点的距离以及它在普通视图中的大小,以及它的先验关注度;而在一个顶点中可显示的细节的数量则取决于其在鱼眼视图中的大小。
B6.本步为可选步骤,以展示具体农产品中的农药检出含量分布(如:1-5ug/kg;5-10ug/kg):双击钻取农产品子视图(如图5(b)所示)中农产品节点u,则计算该农产品中的各种农药v的检出含量分布,将节点以donut圆环代替圆形来可视化分布,得到变换后的关联描述子视图(如图5(c)所示)。
B7.本步为可选步骤,以能够满足高效展现农产品样品中所检出的农药品种数在一定范围内的农产品名称的任务T3:以农产品中所检出农药种数为权重动态过滤(如图3 E区所示)与生成图,并在该子图中过滤掉关联边集合E2,以突出关注对象(如图5(d)所示)。
C.根据A所得的焦点,生成关联探索视图;操作包括的步骤具体为:
C1.首先,获取A所得的焦点的关联数据属性及其所属分类,用交互式放射环展示层次关联,并可根据其化学成分进行动态过滤;
C2.根据农药与农产品节点间的关联关系,确立待聚类的农药对象数据点.针对农药节点vk(k=1,2,...,m,m为农药节点个数)以及农产品序列u1,u2,u3,...,un(其中n为农产品样品个数),定义如下:若农药vk在农产品ul(l=1,2,...,n)中被检出,则对应检出标识ukl取值为1,否则为0,则对于任意一个农药节点vi都存在一个检出向量(ui1,ui2,ui3,...,uin);
C3.根据检出向量计算WSS(Within Sum of Square,内平方和),WSS为所有待聚类点与各个最近质心之间距离的平方和的大小。确立K-means聚类中的K的个数(如图6所示),此处最优聚簇的数量为3;
C4.通过计算农药节点vi,vj(其中i,j=1,2,...,m,m为农药节点个数)之间的欧式距离,进行K-means聚类(K为C3所得结果),得出聚类向量(如图7所示),该向量指出农药节点的聚类簇编号。
C5.将C4的聚类结果以圆形节点簇的形式置于放射环的根节点区域内,每个圆代表一个农药节点,基于力导向布局将各个圆根据聚类结果组成各个簇,使得相同簇节点之间距离较近,不同簇之间以不同颜色进行标注(如图8(a)所示),以圆形节点的边框颜色代表农药毒性,根据簇中节点个数决定圆形节点半径的大小(如图8(b)所示),实现对结果的概览展示.并辅助以字云形式自动加载对应农药名称,其颜色和簇颜色相对应(如图9所示);
C6:通过视图切换和层次边绑定展示层次结构中的潜在关联细节(具体的农药名称,归属同一簇的农药,具体农药毒性),并可根据节点及关联边数目调整绑定边的张力系数(如图3D区及图10所示);
利用上述农残数据关联可视分析方法实现系统PestResiTGVis,该系统能够实现本技术方案所述方法,完成关联数据结构展示、数据关联描述、数据关联探索等功能。
需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。

Claims (9)

1.一种基于变换的关联图TransGraph可视分析方法,所述关联图TransGraph用于描述关联数据集中数据的复杂关联,包括关联描述视图和关联探索视图;所述关联图TransGraph采用力导向布局展现节点间的关联关系,利用双层圆环和放射环展示当前关注节点的数据分布和层次结构;采用图过滤实现数据层面的抽象和筛选,并通过K-means聚类探索图中节点的潜在相似性;通过鱼眼技术、边绑定及交互式分层探索方法进行视图变换,实现对焦点图元信息的突出展示和复杂视图的简化;支持用户交互式地逐层钻取查看图的细节及节点相似性;所述关联图可视分析方法首先将关联数据的属性及关联信息映射为图模型中的元素,然后针对关联数据的属性及关联信息进行有选择性地过滤及初步统计分析,再利用所述关联描述视图和关联探索视图对关联信息进行可视化,进而完成待分析任务;包括如下步骤:
A.针对关联数据集,提取关联数据中的层次关系,以树的形式来展示,通过节点的选择或导航区的筛选,得到焦点fu ;所述关联数据集表示为如下形式:
G=(U,V,E)
其中,图G代表关联数据集;U和V分别为图G的两个部分parts;E为U和V之间的关联边集合;每个E中的每条边e(u,v)用于表示u子集与v子集的关联关系;
B.根据A所得的焦点fu,生成关联描述视图:基于圆环图与力导向布局方法展现节点间的关联关系;采用可视交互方法和鱼眼视图变换方法对力导向关联图布局进行简化;具体包括如下操作:
B1.获取A所得的焦点fu,计算与当前焦点关联的子图V,得到关联边集合E1;获取关联数据属性,计算不同属性值在该焦点中的占比,并采用圆环实现可视化;
B2.进行二次关联:即计算与B1中V关联的其他节点所构成的子图U’,得到关联边集合E2,用于对不同节点的相同属性进行对比分析;
B3.根据关联边集合E1、E2,基于力导向布局连接fu、V、U’图中的相应节点,构成新的图G’,其中力中心根据圆环的圆心位置进行初始设置和调整;基于弹簧模型Es的力导向布局方法的计算公式表示为式1:
Figure FDA0002442507140000011
其中,k为弹性系数,d(i,j)表示平面上两点i和j之间的欧式距离,s(i,j)表示弹簧的自然长度;
再采用静电力模拟图中节点间的相互作用,进而计算节点间的相对位置关系,式1即表示为式2所示的能量模型:
Figure FDA0002442507140000021
其中,r表示两点间的静电力常数;wiwj为两点的权重;
B4.将图G’中两个部分别可视化为不同形状的视觉元素,使得二者区分显示且体现二者关联;
B5.在B4所得的视图基础上,通过鱼眼变形函数实现对普通视图中各节点坐标的变换,至此得到关联描述视图;
C.根据A所得的焦点fu,生成关联探索视图:利用放射环的根节点区域展示图中节点的相似性聚类结果概览,并通过视图切换进一步显示层次结构中的相似性与关联细节,实现各节点之间的连接密度的可视化;具体包括如下操作:
C1.获取A所得的焦点的关联数据属性及所属分类,用交互式放射环展示层次关联;
C2.根据关联数据节点间的关联关系,确立待聚类的数据点,获得数据集合节点相应的向量;数据集合节点vi对应的向量为(ui1,ui2,ui3,...,uin);
C3.根据C1中检出向量计算内平方和WSS,用于确定K-means聚类中的K的个数:
Figure FDA0002442507140000022
其中,pi为数据对象;q(i)表示与该数据对象最近的质心;d代表节点间的距离;N为数据点的个数;
C4.通过式5计算节点vi,vj之间的欧式距离,进行K-means聚类得出聚类向量:
Figure FDA0002442507140000023
其中,d为节点间的距离;节点vi对应向量为(ui1,ui2,ui3,...,uin);i、j=1,2,...,m,m为节点个数;
C5.将步骤C4的聚类结果以圆形节点簇的形式置于放射环的根节点区域内,每个圆代表一个节点,基于力导向布局将各个圆根据聚类结果组成各个簇,由此实现对聚类结果概览可视化;
C6.通过视图切换和层次边绑定方法,展示层次结构中的潜在关联细节,并可根据节点及关联边数目调整绑定边的张力系数;
通过上述步骤,利用所述关联描述视图和关联探索视图,实现对数据的关联信息进行可视分析。
2.如权利要求1所述的可视分析方法,其特征是,所述关联描述视图为二部图,图中的顶点集可分成两个不相交的集合,使得在同一个集合内的顶点没有共同边。
3.如权利要求1所述的可视分析方法,其特征是,所述鱼眼变形函数具体通过式3建立用户对信息对象的DOI函数(Degree of Interest Function):
DOI(x|y)=API(x)-D(x,y) (式3)
其中,x是任一个信息对象;y是当前的焦点对象;API(x)是用户对信息对象x的先验关注度;D(x,y)是x与y之间的空间距离或语义距离。
4.如权利要求1所述的可视分析方法,其特征是,步骤C所述节点的相似性聚类结果概览包括聚类簇的个数、每个聚类簇中子数据的个数、各聚类簇子数据的整体属性。
5.如权利要求1所述的可视分析方法,其特征是,步骤C6调整绑定边的张力系数,具体通过调整张力系数控制边集束曲线的弯曲程度,由此实现降低视觉复杂度和展示关联边细节之间的平衡。
6.如权利要求1所述的可视分析方法,其特征是,步骤C6中层次边绑定方法,具体通过B样条曲线的形式和层次关系进行关联边的弯曲,由此有效地展现关联层次。
7.权利要求1~6任一项所述的可视分析方法在农药残留检测结果数据集的可视分析中的应用。
8.一种利用权利要求1~6任一项所述的可视分析方法实现的农残数据关联可视分析系统PestResiTGVis,实现展示农药残留数据集中的关联关系;所述系统包括农残检测结果数据过滤导航模块、农产品与农药的检出关联描述模块、农残检出关联探索模块和辅助视图模块;
农残检测结果数据过滤导航模块,用于按照农产品所属类目、特定样品名称、采样时间区间及省份进行数据筛选;
农产品与农药的检出关联描述模块,用于在对比、展示农残数据中网络关联的同时展示当前关注节点的数据分布;包括双击节点钻取展示细节、钻取后展示细节描述视图;
农残检出关联探索模块,用于展示农药节点的相似性聚类结果概览,通过视图切换进一步查看层次结构中的相似性关联细节,展示不同农药间的检出相似性关联以及功效分布;
辅助视图模块,用于通过多种可视化方式对农药残留数据进行直观展示。
9.如权利要求8所述的农残数据关联可视分析系统,其特征是,农药残留数据集中的关联关系包括:农药与农产品间的检出关系、农产品的类别归属层次关联、农药同农药之间的同源或衍生关系、农药毒性和功效分类层次关联、检出值或超标量随时间的变化关联、检出值或超标量与不同地域的关联分布。
CN201810154975.8A 2018-01-04 2018-02-23 一种基于变换的关联图可视分析方法及其系统 Active CN108363797B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN2018100069880 2018-01-04
CN201810006988 2018-01-04

Publications (2)

Publication Number Publication Date
CN108363797A CN108363797A (zh) 2018-08-03
CN108363797B true CN108363797B (zh) 2020-07-10

Family

ID=63002312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810154975.8A Active CN108363797B (zh) 2018-01-04 2018-02-23 一种基于变换的关联图可视分析方法及其系统

Country Status (1)

Country Link
CN (1) CN108363797B (zh)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109189801B (zh) * 2018-08-27 2021-10-08 佰聆数据股份有限公司 一种用于多视图联动分析的分析思路可视化方法
CN109344194B (zh) * 2018-09-20 2021-09-28 北京工商大学 基于子空间聚类的农药残留高维数据可视分析方法与系统
CN111178375B (zh) * 2018-11-13 2024-04-09 北京京东尚科信息技术有限公司 用于生成信息的方法和装置
CN109766478B (zh) * 2019-01-08 2021-06-29 浙江财经大学 语义增强的大规模多元图简化可视化方法
CN110008279B (zh) * 2019-03-27 2021-03-23 北京工商大学 一种基于“关系-权值”有序矩阵的可视分析方法与应用
CN110647574B (zh) * 2019-09-24 2022-05-03 厦门市美亚柏科信息股份有限公司 一种社交网络数据展示方法、终端设备及存储介质
CN113867850B (zh) * 2020-06-29 2023-12-29 阿里巴巴集团控股有限公司 数据处理方法、装置、设备和存储介质
CN112507016A (zh) * 2020-12-02 2021-03-16 杭州橙鹰数据技术有限公司 数据的展示方法及装置
CN113326472B (zh) * 2021-05-28 2022-07-15 东北师范大学 一种基于时序多变量数据的模式提取与演化可视分析方法
CN113342992B (zh) * 2021-06-16 2022-11-08 中国科学院空天信息创新研究院 基于剪枝技术与自动图扩展的知识图谱关联图布局方法
CN113486619A (zh) * 2021-06-22 2021-10-08 国网新疆电力有限公司昌吉供电公司 一种基于能量模型的单线图分块布局算法
CN114138984A (zh) * 2021-12-08 2022-03-04 安天科技集团股份有限公司 关系图谱更新方法、装置、计算设备及存储介质
CN116150982B (zh) * 2023-01-31 2024-04-16 中国人民解放军战略支援部队航天工程大学 一种电磁态势多维可视化方法及系统
CN116776175B (zh) * 2023-08-24 2023-11-24 中国空气动力研究与发展中心计算空气动力研究所 一种基于层次聚类的数据标签体系构建方法及系统
CN117787510B (zh) * 2024-02-28 2024-05-03 青岛小蜂生物科技有限公司 基于时序预测分析的农药残留监测过程的优化方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9087117B2 (en) * 2009-10-30 2015-07-21 International Business Machines Corporation Method and system for visualization of data set

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103035239B (zh) * 2012-12-17 2014-10-08 清华大学 一种基于局部学习的说话人识别方法
CN104090957A (zh) * 2014-03-10 2014-10-08 中国科学院软件研究所 一种异构网络可交互可视化方法
CN105224656B (zh) * 2015-09-30 2018-06-15 北京工商大学 一种针对两类层次数据的对比关联可视分析方法和应用
CN106685716B (zh) * 2016-12-29 2019-04-26 平安科技(深圳)有限公司 网络拓扑自适应的数据可视化方法及装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9087117B2 (en) * 2009-10-30 2015-07-21 International Business Machines Corporation Method and system for visualization of data set

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
一种农残检测数据的融合对比可视化方法;陈红倩等;《系统仿真学报》;20160208(第02期);全文 *
一种针对农残检测数据的时序分组可视化方法;陈红倩等;《系统仿真学报》;20161008(第10期);全文 *
基于农残数据的双层次可视化建模算法;刘瑞军等;《系统仿真学报》;20150908(第09期);全文 *
基于可视分析的农药残留污染仿真评估方法;陈谊等;《计算机仿真》;20171015(第10期);全文 *

Also Published As

Publication number Publication date
CN108363797A (zh) 2018-08-03

Similar Documents

Publication Publication Date Title
CN108363797B (zh) 一种基于变换的关联图可视分析方法及其系统
Bastin et al. Visualizing uncertainty in multi-spectral remotely sensed imagery
Colombo et al. Graph-based interpretation of the molecular interstellar medium segmentation
Van den Elzen et al. Multivariate network exploration and presentation: From detail to overview via selections and aggregations
CA2797401C (en) Automated social networking graph mining and visualization
Van Den Elzen et al. Baobabview: Interactive construction and analysis of decision trees
Teoh et al. PaintingClass: interactive construction, visualization and exploration of decision trees
US9007373B2 (en) Systems and methods for creating texture exemplars
Liu et al. Scale computation on high spatial resolution remotely sensed imagery multi-scale segmentation
CN105354593B (zh) 一种基于nmf的三维模型分类方法
Gladisch et al. Navigation recommendations for exploring hierarchical graphs
Wang et al. Structure-aware fisheye views for efficient large graph exploration
CN105468666B (zh) 一种基于地图隐喻的视频内容可视分析方法
von Landesberger et al. Visual analysis of graphs with multiple connected components
Nocke et al. visual analytics of climate networks
Koua Using self-organizing maps for information visualization and knowledge discovery in complex geospatial datasets
de Leeuw et al. Multi-level topology for flow visualization
Hajij et al. Mog: Mapper on graphs for relationship preserving clustering
Walter et al. Interactive visualization and navigation in large data collections using the hyperbolic space
Buecken et al. From the Volumetric Algorithm for Single-Tree Delineation Towards a Fully-Automated Process for the Generation of “Virtual Forests”
Nguyen et al. Visual exploration of multiway dependencies in multivariate data
CN107103491A (zh) 一种房价数字估计模型的构建方法
Bereuter Quadtree-based real-time point generalisation for web and mobile mapping
Geng et al. Visual Analysis of Hurricane Data Using Joint Contour Net.
CN116756232B (zh) 一种智能生成动态网络图的数据可视化方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant