CN105512218A - 一种关联层次数据的可视化方法和应用 - Google Patents

一种关联层次数据的可视化方法和应用 Download PDF

Info

Publication number
CN105512218A
CN105512218A CN201510854881.8A CN201510854881A CN105512218A CN 105512218 A CN105512218 A CN 105512218A CN 201510854881 A CN201510854881 A CN 201510854881A CN 105512218 A CN105512218 A CN 105512218A
Authority
CN
China
Prior art keywords
point
data
ring
map
transition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510854881.8A
Other languages
English (en)
Other versions
CN105512218B (zh
Inventor
陈谊
赵云芳
孙悦红
林晓蕾
张珣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Technology and Business University
Original Assignee
Beijing Technology and Business University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Technology and Business University filed Critical Beijing Technology and Business University
Priority to CN201510854881.8A priority Critical patent/CN105512218B/zh
Publication of CN105512218A publication Critical patent/CN105512218A/zh
Application granted granted Critical
Publication of CN105512218B publication Critical patent/CN105512218B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/26Visual data mining; Browsing structured data

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Processing Or Creating Images (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公布了一种关联层次数据的可视化方法和应用,将两类具有地域分布的关联层次数据集作为待可视化数据,通过在放射环内放置地图和引入过渡点,利用贝塞尔曲线将两类层次数据集S1和S2中的数据节点进行连接,通过绘制矩形热图进行可视化。该方法应用于农残数据可视化分析,把具有关联性的农产品类和农药类设为两类具有地域分布的关联层次数据集,绘制地理热图、放射环分别表示超标农药农产品、超标农药类别、农药毒性分布;绘制贝塞尔曲线和矩阵热图。本发明利用多视图和交互方法对关联层次数据进行可视化,具有平稳性、连续性和可读性。

Description

一种关联层次数据的可视化方法和应用
技术领域
本发明属于信息可视化领域,具体涉及一种基于热图和放射环的关联层次数据可视化方法和对农残数据进行可视化的应用。
背景技术
现实世界是一个三维空间,包含地域分布的数据随处可见。身处大数据时代,数据量变大、数据维度增加、数据类型更为复杂,针对关联层次数据的可视分析也成为炙手可热的话题与挑战。其中一个非常具有挑战性的大数据类型是具有地域分布的关联层次数据。例如,在食品安全、交通、运输物流、商业贸易、电子通信行业的数据,它们普遍包含地理位置信息、层次关系以及关联关系,且每个节点和链接具有多个属性值。
迄今为止,针对不同类别的空间数据已有许多相应的可视化技术,主要分为点数据可视化、线数据可视化和区域数据可视化三大类,三类可视化技术的定义、不足和解决方法如表1所示:
表1点数据可视化、线数据可视化和区域数据可视化的定义、不足和解决方法
区域数据可视化,根据不同的映射方法,可分为地区分布图(Choroplethmaps)、统计地图(Cartogramsmaps)、比例标记地图(Proportionalsymbolmaps)三类,主要通过颜色或区域面积大小实现数据与区域的相互映射。现有的地图可视化,采用地图体现地理数据外,其他类型的数据主要通过两类方法展示。第一类是地图与其他可视化方法组合,最常见的直接在地图上体现,将统计图表放置在地图上,通过颜色、标签、文本框添加提示,帮助用户理解;其次就是放置在地图外,主要是将地图放置在中心,外圈采用其他可视化技术,例如采用NecklaceMaps,统计数据映射到项链环上的每个饼状图上,只能呈现地理位置信息和单一的统计信息。第二类是通过多视图方式展示。地图面积有限,从中得到的信息也有限,这时就需要通过与地图链接的其他视图来呈现数据的多面化,帮助用户获取更多潜在的信息。然而,针对具有空间分布的关联层次数据,现有的空间数据可视化并不能满足其需求。
层次数据可视化主要分为两大类:节点链接(Node-Link)法和空间填充(Space-Filling)法。最常见的空间填充法有放射环和树图。DannyHolten在其文章中提到四种方法。第一种是用嵌套圆表示包含关系,用直线边表示关联关系;第二种是用树图表示包含关系,用基于贝塞尔曲线的连线边表示关联关系;第三种是用矩形代表节点,用矩形的嵌套表示包含关系,用折线表示关联关系;第四种是用节点-链接表示包含关系,用邻接矩阵表示关联关系;后两种对前两种视觉杂乱的问题有所改进。此外,GouL等在2011提出一种利用放射环表示包含关系,用曲线表示关联关系,该方法不仅可以很好的表示关联关系,还利用边绑定技术降低了视觉杂乱,能很好的理解数据。2014年,ChenY等提出一种双关联树的混合布局算法,通过节点链接和放射环分别表示两类层次数据,通过贝塞尔曲线呈现关联关系。但以上方法对于数据的空间分布并没有很好的展现。
在地图绘制中最早使用的是流程图与地图的结合(称为流型图),将走势相同的连线绑定在一起,即对连线进行聚合,不但减少了视觉的复杂度,同时也提供了对数据更多层次的了解。但该算法只针对单个或少数起始点的连线问题,当出现多个起始点时,一般采用网络可视化中的边绑定算法,如:经典的层次化数据的边绑定算法(HEB算法)等等。但这些现有的边绑定技术绑定后的边只能看到整体趋势,无法查看细节。
综上所述,NecklaceMaps方法将统计数据映射到项链环上的每个饼状图上,只能呈现地理位置信息和单一的统计信息。经典的层次化数据的边绑定方法(HEB方法)绑定后的边存在的问题是只能看到整体趋势,而无法查看细节。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于热图和放射环的关联层次数据可视化方法(本发明称为SunMap方法)和应用,使用关联层次数据的可视分析中的边邦定方法(HEB方法)、热图方法和基于节点排序的放射环方法,通过在放射环内放置地图,引入过渡点,利用贝塞尔曲线将具有关联关系的两类节点进行连接,通过矩形热图+柱状图视图展示可视化结果,采用数据选择、多视图联动等交互方法,实现对层次数据进行可视化。
本发明提供的技术方案是:
一种关联层次数据的可视化方法,将两类具有地域分布的关联层次数据集S1和S2作为待可视化数据,其中,层次数据集S1具有地域分布属性,层次数据集S2具有多个与数据集S1有关联关系的属性;所述可视化方法通过在放射环内放置地图和引入过渡点,利用贝塞尔曲线将两类层次数据集S1和S2中的数据节点进行连接,通过绘制矩形热图进行可视化,具体包括如下步骤:
A.绘制地理热图,执行如下操作:
A1.对数据集S1和S2,通过统计得到不同地域中S1和S2数据的关联参数相应的频次,用颜色的深浅表示频次大小;
A2.根据数据采样点地区的经纬度坐标,将相应地理区域用与A1中相对应的颜色标识出来;
B.以地理热图的中心为圆心绘制放射环,执行如下操作;
B1.用放射环第一层父节点表示数据集S1,通过放射环的扇形大小表示S1和S2数据的关联参数相应的频次,并按从大到小排序;
B2.用放射环第二层子节点表示数据集S1中每个数据节点与数据集S2有关联的第一个S2属性数据;
B3.用放射环第三层叶子节点表示数据集S1中每个数据节点与数据集S2有关联的第二个S2属性数据;
C.选取围绕地理热图(地图)不与地图交叉的最小圆环为过渡圈,将过渡圈上的点称为过渡点,采用过渡点代表相应的地图上的点P,通过过渡点将放射环上的属性与相应的地理位置进行连接;
通过过渡圈上的点(过渡点)将放射环上的属性与相应的地理位置进行连接;即将地图上的点引到过渡圈上,用过渡圈上的点(过渡点)代表地区点,从而减少了地图上线的交叉;地图上的点到过渡圈的连线采用放射线段,即从圆心引线过各个地区点并延伸至过渡圈,使得这些地区点到过渡圈的路径最短;
D.绘制贝塞尔曲线进行路径优化,使得地理热图不被遮挡;
E.绘制矩阵热图,完成对两类具有地域分布的关联层次数据集S1和S2的可视化。
针对上述关联层次数据的可视化方法,进一步地,还可采用交互方法进行可视显示。
针对上述关联层次数据的可视化方法,进一步地,步骤E除绘制矩阵热图,还通过绘制柱状图视图进行多视图可视化;所述柱状图为两个,第一个柱状图置于所述矩形热图的上方,第二个柱状图置于所述矩形热图的右方,通过颜色深浅表示步骤B1所述频次的大小,第一个柱状图表示沿横轴方向,各属性对纵轴的统计值,第二个柱状图表示沿纵轴方向,各属性对横轴的统计值,并将统计结果标注在每个柱形条的最右侧;所述柱形图用于帮助用户理解数据。
针对上述关联层次数据的可视化方法,进一步地,步骤C所述将地图上的点P与相应的过渡点连接采用放射线段,从圆心引线经过地图上的点并延伸至过渡圈,使得地区点到过渡圈的路径最短。
针对上述关联层次数据的可视化方法,进一步地,步骤C所述将地图上的点P与相应的过渡点连接,所述相应的过渡点通过如下步骤获得:
C1.放射环的圆心设为O,连接O点与地理热图的点P,并延长该连线至过渡圈,该连线与过渡圈的交点设为Q1和Q2;
C2.过渡点设为点Qi,通过式2计算得到:
d ( P , Q i ) = | ( x Q i - x p ) 2 + ( y Q i - y p ) 2 | (式2)
式2中,P为地图上的某点;Qi为过渡点,i取值为1或2;Q1和Q2为连接圆心O与P并延长至过渡圈,与过渡圈的交点;x与y代表相应点的横坐标和纵坐标。
针对上述关联层次数据的可视化方法,进一步地,步骤D绘制贝塞尔曲线包括如下步骤:
D1.根据四个任意位置的点坐标根据式3绘制得到一条光滑曲线,该曲线为贝塞尔曲线:
B(t)=P0(1-t)3+3P1t(1-t)2+3P2t2(1-t)+P3t3,t∈[0,1](式3)
式3中,P0、P1、P2和P3是四个任意位置的点;
D2.贝塞尔曲线的起点A为过渡点Qi;贝塞尔曲线的终点D是放射环上某扇环内圈弧中点;过A点做内圆的外切线,根据勾股定理计算得到该切线与外圆交点到A点的距离d;
D3.判断A点与点D之间的距离d(A,D)是否小于d,若小于直接用直线连接点A和点D,完成绘制贝塞尔曲线;否则转入步骤D4寻找中间控制点B和C再完成绘制贝塞尔曲线;
D4.计算直线OA和直线OD的夹角,并划分三等份,同时取(R-r)/3作为圆心O到中间控制点的距离,确保中间控制点在内圆和外圆之间,控制中间控制点的角度位置,从而得到中间控制点B和C的位置,利用中间控制点B和C的位置完成绘制贝塞尔曲线。
针对上述关联层次数据的可视化方法,进一步地,步骤E所述绘制矩阵热图包括如下步骤:
E1.将数据集表示成一个N*M的矩阵,矩阵内位置(i,j)表示第i个节点和第j个节点之间的关联关系参数值;
E2.通过色彩RGB值反映位置(i,j)所代表的数值大小,形成矩阵热图。
其中,步骤E2通过设定矩阵N(M)的最大值实现自适应缩小矩阵大小,使得避免造成不必要的空间浪费,当N值大于所述最大值时,提取的矩阵数据节点数目为最大值,以使得形成的矩阵热图便于用户查看与分析。
本发明还将上述关联层次数据的可视化方法应用于农药残留数据的可视化分析,具体是,把具有关联性的农产品类和农药类设为两类具有地域分布的关联层次数据集,首先通过统计得到不同地区农产品检测出农药残留MRL值超标的频次,用颜色的深浅表示超标频次的大小,将相应的地理区域用对应的颜色标识,绘制成地理热图;再绘制基于节点排序的放射环,放射环第一层父节点、第二层子节点和第三层叶子节点分别表示检测出超标农药的农产品、每个农产品中检出超标农药的类别情况和每个农产品检出每种超标农药类别中农药毒性分布情况;然后采用放射线段连接地图上的点和过渡点,并绘制贝塞尔曲线;最后绘制矩阵热图,通过色彩RGB值表示矩阵位置所代表的数值大小,以达到两类具有地域分布的关联层次数据集的直观可视化且便于用户查看与分析的目的。
针对上述关联层次数据的可视化方法在农药残留数据的可视化分析中的应用,进一步地,还可通过绘制两个柱形图进行数据可视化,通过颜色深浅表示农药超标频次的大小;第一个柱状图表示沿横轴方向,各属性对纵轴的统计值,第二个柱状图表示沿纵轴方向,各属性对横轴的统计值,并将统计结果标注在每个柱形条的最右侧。
本发明实施例中,基于热图和放射环的关联层次数据可视化方法的应用将具有地域分布的关联层次数据作为待显示的数据集,进行可视化操作。待显示的数据集包括农产品的采样点区域、农产品检测出农药残留MRL值、农药类别和农药毒性数据,该数据集包含空间数据、层次数据、关联数据;
A绘制地理热图,执行如下操作:
A1.选定要查询的某种农产品或某类农产品,通过统计得到不同地区农产品检测出农药残留MRL值超标频次,用颜色的深浅表示超标频次的大小;
A2.再根据采样点的经纬度坐标,将相应的地理区域用与其与A1中对应的颜色标识出来;
B绘制放射环,执行如下操作;
B1.用放射环第一层父节点表示检测出超标农药的农产品,通过扇形大小表示超标频次的多少,并按从大到小排序;
B2.用放射环第二层子节点表示每个农产品中检出超标农药的类别情况;
B3.用放射环第三层叶子节点表示每个农产品检出每种超标农药类别中农药毒性分布情况;
C通过过渡圈上的点(过渡点)将放射环上的属性与相应的地理位置进行连接;即将地图上的点引到过渡圈上,用过渡圈上的点(过渡点)代表地区点,从而减少了地图上线的交叉;地图上的点到过渡圈的连线采用放射线段,即从圆心引线过各个地区点并延伸至过渡圈,使得这些地区点到过渡圈的路径最短;
D绘制贝塞尔曲线,解决遮挡热图的问题,使得结果整体看上去更加美观整洁;
E绘制矩阵热图。
展示结果用一个矩阵的横纵坐标代表不同的属性,本实施例中,矩阵热图具体是用矩阵中的每一个小方格代表相应的样品检测出相应农药的程度。颜色越深浓度越高,颜色越浅,浓度越低。
与现有技术相比,本发明的有益效果是:
本发明针对如何在标准显示空间内对包含空间数据、层次数据和关联数据的复杂数据集进行可视化的问题,提出了一种基于热图和放射环的关联层次数据可视化方法SunMap,并引入过渡点,利用贝塞尔曲线将具有关联关系的两类节点进行连接。此外,加入了矩形热图+柱状图视图,采用数据选择、多视图联动等交互手段,实现对层次关联数据的可视分析。并将上述两种方法应用于农药残留侦测模拟数据集,利用简单的多视图和交互方法来帮助用户理解数据。还可在SunMap布局中将针对关系边应用边绑定技术和渲染技术进行边优化,或寻求更好的边展现方式,减少视觉杂乱。本文提出的可视化方法可应用于电商,金融,食品等多方领域,对具有空间分布的关联层次数据进行可视化和可视分析。
本发明实现对层次关联数据的可视分析利用简单的多视图和交互方法来帮助用户理解数据。使得数据更具有平稳性、连续性和可读性。
附图说明
图1是本发明提供的关联层次数据可视化方法的流程框图。
图2为本发明实施例中经过贝塞尔曲线优化后的效果图;
其中,a图是直线连接效果图;b图是过渡点加入,直线连接的效果图;c是过渡点加入,贝塞尔曲线连接的效果图。a表示在地图上直接使用直线将地区点与放射环上节点相连表示其关联关系;但此方法会造成严重的视觉混乱,地图遮挡也较为严重;c为贝塞尔曲线;b为本发明提出通过过渡点并使用贝塞尔曲线,用于表现地理位置信息与层次信息的关联。
图3为本发明实施例中在矩阵热图的基础上添加两个柱形图辅助可视化的效果图;
其中,红色的深浅表示农药超标频次的高低,上方的柱形图表示沿横轴方向,各属性对纵轴的统计值,并将统计结果标注在每个柱形条上方;而右侧的柱形图表示沿纵轴方向,各属性对横轴的统计值,并将统计结果标注在每个柱形条的最右侧;以帮助用户更直观地理解数据。
图4为本发明实施例中SunMap方法应用于农药残留数据的可视化系统截图。
图5为本发明实施例中通过交互查看农药残留情况的示意图;
其中,(a)和(b)是实施例某农产品中检出农药残留情况分布图;(c)是实施例中某市检出农药残留的农产品分布图。
图6为本发明实施例评估方法效果所采用的用户体验任务完成时间的统计图。
图7为本发明实施例评估方法效果所采用的用户体验任务回答正确率的统计图。
图8为本发明方法中确定过渡点位置的示意图;
其中,圆心为O,连接O点与地图上某地区点P并延长改线至过渡圈,与过渡圈的交点为Q1,Q2,选取的点Qi作为过渡点。
图9为本发明方法中确定贝塞尔曲线连接线位置的示意图;
其中,(a)是计算d和点A点D之间距离d(A,D);b是确定贝塞尔曲线的中间控制点;贝塞尔曲线的起点A为过渡点Qi;贝塞尔曲线的终点D是放射环上某扇环内圈弧中点;点B和C是两个中间控制点。
具体实施方式
下面结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。
本发明提供一种基于热图和放射环的关联层次数据可视化方法(本发明称为SunMap方法),针对关联层次数据的可视分析中的边邦定方法、热图实现、基于节点排序的放射环算法,用于对层次数据进行可视化。
本实施例中的待可视化数据集为农残数据集,其属性表如表3所示:
表3农残数据集的属性表示
采用本发明提供的基于热图和放射环的关联层次数据可视化方法SunMap(Sunburst+Map),将具有地域分布的关联层次数据作为待显示的数据集,进行可视化操作,待显示的数据集包括农产品的采样点区域、农产品检测出农药残留MRL值、农药类别和农药毒性数据,该数据集包含空间数据、层次数据、关联数据。首先预处理数据,对农残侦测数据进行降噪处理,将冗余信息去除,对数据进行排序筛选操作等。
该可视化方法的具体操作步骤为:
A.进行地图热力型数据地图(简称热图,HeatMap)的绘制:
绘制基于地理信息的热图:既然农残侦测数据是带有地理属性的,绘制一个地对尽可能多的属性进行显示,才能达到可视化的效果。地理热图中,除了显示地理信息以外还对数据量大小以不同的颜色进行区分,可红色到黄色表示数据量大小为递减;
绘制基于地理信息的地理热图,首先将中国矢量地图进行地理坐标的匹配;然后将数据库中的农残侦测数据行降序排列查询;再对数值按数值范围划分为N段,将农残侦测数据的最大查询值Max对应某种颜色(如红色),农残侦测数据的最小结果Min对应另一种颜色(如蓝色);通过计算得到N段的每段颜色,如采用式1进行计算:
Ci=Min+(Max-Min)/N×i,i∈[1,N](式1)
式1中,Max为农残侦测数据的最大值,Min为农残侦测数据的最小值,N为农残侦测数据的总数。
绘制热图时,执行如下操作:
A1.选定要查询的某种农产品或某类农产品,通过统计得到不同地区农产品检测出农药残留MRL值超标频次,用颜色的深浅表示超标频次的大小;
A2.再根据采样点的经纬度坐标,将相应的地理区域用与其与A1中对应的颜色标识出来;
颜色深的区域表示此地区农产品检测出超标农药较多,颜色浅的区域表示此地区农产品检测出超标农药较少。
B.进行放射环绘制,用层次关系表示包含关系:
绘制基于节点排序的放射环。仅用地理热图无法观察到所有属性,因为在有限的地图上展示多种属性信息难以实现,因此需要结合其他可视化方法。本发明通过引入放射环算法,并对各个节点进行排序,争取做到最直观最简洁;
B1.放射环第一层父节点表示检测出超标农药的农产品,扇形大小表示超标频次的多少,并按从大到小排序;
B2.第二层子节点表示每个农产品中检出超标农药的类别情况;
B3.第三层叶子节点表示每个农产品检出每种超标农药类别中农药毒性分布情况;
C.进行连线:
引入过渡点,将放射环上的属性与相应的地理位置进行连接的时候,由于属性很多,很容易造成线的交叠,甚至对热图覆盖,所以我们为了解决这个问题引入了过渡点。即将地图上的点引到过渡点所在的过渡圈(过渡圈即选取的围绕地图不与地图交叉的最小圆环,过渡点即选取的过渡圈上的点)上,用过渡圈上的点(过渡点)代表地区点,从而减少了地图上线的交叉。地图上的点到过渡圈的连线采用放射线段,即从圆心引线过各个地区点并延伸至过渡圈,使得这些地区点到过渡圈的路径最短。
引入过渡点的具体步骤如下:
C1.圆心为O,连接O点与某地区点P,并延长该线至过渡圈,与过渡圈的交点为Q1,Q2。
C2.选取点Qi作为过渡点,计算公式如公式2所示,其中P代表地图上的点,xP、yP是P点的横纵坐标。xQi、yQi代表过渡点Qi的横纵坐标。其中i的取值为1、2。具体选择示意图见附图8。
d ( P , Q i ) = | ( x Q i - x p ) 2 + ( y Q i - y p ) 2 | (式2)
绘制贝塞尔曲线:虽然引入了过渡点,但是依然无法从根本上解决遮挡热图的问题。所以我们利用贝塞尔曲线来解决这个问题。通过绘制贝塞尔曲线,我们可以很好地解决遮挡热图的问题,使得结果整体看上去更加美观整洁;
利用贝塞尔曲线进行路径优化的步骤如下:
D1.贝塞尔曲线的绘制。贝塞尔曲线是根据四个任意位置的点坐标绘制出来的一条光滑曲线(贝塞尔曲线)。公式3如下:
B(t)=P0(1-t)3+3P1t(1-t)2+3P2t2(1-t)+P3t3,t∈[0,1](式3)
其中P0、P1、P2和P3是四个任意位置。
D2.如图9所示,贝塞尔曲线的起点A为过渡点Qi;贝塞尔曲线的终点D是放射环上某扇环内圈弧中点;过A点做内圆(此处内圆即过渡圈)的外切线,根据勾股定理,求出该切线与外圆交点到A点的距离d;
D3.确定A点与点D之间的距离d(A,D)是否小于距离d,若小于直接用直线连接点A和点D,否则寻找中间控制点B和C绘制贝塞尔曲线;
D4.计算直线OA和直线OD的夹角,并划分三等份,同时取(R-r)/3作为圆心O到中间控制点的距离,确保中间控制点在内圆和外圆之间,控制中间控制点的角度位置,从而得到中间控制点B和C的位置,利用中间控制点B和C的位置完成绘制贝塞尔曲线,再将A、B、C、D四个位置代入式3,如图9所示,完成绘制贝塞尔曲线。
连线步骤根据查询条件,得到每个地区农产品中含有超标农药的农产品类别数目统计结果,按地区划分,用线连接地区和对应查到的农产品;循环进行此连线操作;
然后引入矩阵热图:我们为了更好地展示农药与农产品之间的关系,引入了矩阵热图;通过矩阵热图,我们可以更加直观地观察最终的可视化结果;矩阵热图,是为了展示结果用一个矩阵的横纵坐标代表不同的属性,用矩阵中的每一个小方格代表相应的样品检测出相应农药的程度。颜色越深浓度越高,颜色越浅,浓度越低。
绘制矩阵热图具体的操作步骤如下:
E1.将数据集表示成一个N*M的矩阵H[N][M],矩阵内的位置H[i][j]表达了节点i和节点j之间的关系,本实施例中即表示某种农产品所对应的某种农药检出量的数值;
E2.采用矩阵热图,通过色彩RGB值反映位置H[i][j]所代表的数值大小。并设置N(M)的MAX值为20,当N值小于20时,可自适应缩小矩阵大小,避免造成不必要的空间浪费
E3.当N值大于20时,只提取20个节点,因为当N太大时,不便于用户查看与分析
E4.对于20个节点的选取,同样采用基于排序查询的方法,按指定的属性值从大到小排序,选取前20条数据对应的字段队列。
E5.添加两个柱形图帮助用户理解数据。红色的深浅表示农药超标频次的高低,上方的柱形图表示沿横轴(农药)方向,各属性对纵轴(农产品)的统计值,并将统计结果标注在每个柱形条上方;而右侧的柱形图表示沿纵轴方向,各属性对横轴的统计值,并将统计结果标注在每个柱形条的最右侧。如附图3所示。
经过上述步骤的操作,即可完成对待显示的农残数据生成正方化有序树图布局。
在绘制矩阵热图的基础上,本实施例添加两个柱形图帮助用户理解数据,具体是:红色的深浅表示农药超标频次的高低,上方的柱形图表示沿横轴方向,各属性对纵轴的统计值,并将统计结果标注在每个柱形条上方;右侧的柱形图表示沿纵轴方向,各属性对横轴的统计值,并将统计结果标注在每个柱形条的最右侧。
通过多视图(地理热图加过渡点和贝塞尔曲线的结合、矩阵热图)交互的方式,呈现不同的信息给用户,同时帮助用户更好的操作和理解数据;本实施例可执行如下操作:
11)观察图1中的热力型数据地图,可看出东部地区农药超标较严重。由于中国地域辽阔,各地区均有独特的自然环境和经济社会发展环境,农业生产的地域差异悬殊,使各地农业污染具有不同特征。东部地区较西部地区发达,农业规模大,资源多,其农药投入密度也较高,因此农药污染较为严重。
12)观察图1中放射环,可查看农药污染较为严重的前20种农产品,通过图9中A区对农产品进行条件选取,也可查看农药污染较为严重的前20种蔬菜或水果。而每种农产品下超标农药的种类分布和毒性分布也可通过扇形面积的大小得到。蔬菜中芹菜污染最为严重,水果中桃污染最为严重,需谨慎食用或合理清洗后食用。
观察附图4中矩形热图,由柱形图可知,芹菜和韭菜检出超标农药频次较高,carbendazim(多菌灵)、omethoate(氧乐果)、phorate(甲拌磷)三种禁药超标严重,提醒农业生产者,对于这些禁药有无可替代农药,是否可减少使用。
13)点击放射环任一扇形节点时,可以对该农产品检出农药超标情况进行进一步的分析。如附图5(a)某农产品中检出农药残留的情况分布所示;
14)当点击芹菜时,检出芹菜含有超标农药的地区对应的连线高亮,同时,在矩形热图上,芹菜那一行的数据块高亮显示。
15)点击地区任一区域,可查看该地区有哪些农产品污染严重,如附图5(b)某市被检出农药残留的农产品分布所示。
为了对本发明提供方法的可视化效果进行评估,对中国各地区农药残留检测模拟数据用优化布局后的SunMap进行可视化,邀请了10名被试者,实验过程设计如下:
F1.实验1:
F11.首先给出30min供被试者对该可视化方法进行熟悉;
F12.然后,要求每一位被试者通过查看优化布局后的SunMap可视化结果,回答问题列表(表4)所提的问题。记录下实验1完成效率和正确率,实验结果如附图6用户体验任务完成时间、附图7用户体验任务回答正确率所示。
表4用户体验问题表
序号 问题
Q1 全国各地区中哪几个地区农药污染较为严重
Q2 全国各地区哪种农产品中农药污染最严重
Q3 全国各地区哪种农药超标频次最高
Q4 北京市检出哪些农产品含有超标农药
Q5 芹菜在哪些地区中被检出超标
Q6 芹菜中哪几类农药检出超标9 -->
Q7 芹菜中哪类农药检出超标频次最高
Q8 芹菜检出的有机磷类农药中哪种毒性农药超标频次最高
Q9 芹菜中分别检出了哪些禁药
Q10 被检出的超标农药中共有多少种是禁药
F2.实验2:
F21.查看5万多条模拟数据及相关农药表回答问题;
F22.实验发现,一半以上问题需要对模拟数据表进行大量的统计工作,有些可在min级以下完成,但大部分问题完成时间属于min级,而非s级,其中Q8-Q10还涉及多个表,因为它需要先查询所需农药的所属类别、毒性、以及是否属于禁药。而本发明提出的多视图方法,可以简单明了的得到想要的结果,且正确率均在90%以上。说明该可视化方法使用户理解起来基本没有歧义。
需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。

Claims (10)

1.一种关联层次数据的可视化方法,将两类具有地域分布的关联层次数据集S1和S2作为待可视化数据,所述层次数据集S1具有地域分布属性,所述层次数据集S2具有多个与数据集S1有关联关系的属性;所述可视化方法通过在放射环内放置地图和引入过渡点,利用贝塞尔曲线将两类层次数据集S1和S2中的数据节点进行连接,通过绘制矩形热图进行可视化,具体包括如下步骤:
A.绘制地理热图,执行如下操作:
A1.对数据集S1和S2,通过统计得到不同地域中S1和S2数据的关联参数相应的频次,用颜色的深浅表示频次大小;
A2.根据数据采样点地区的经纬度坐标,将相应地理区域用与A1中相对应的颜色标识出来;
B.以地理热图的中心为圆心绘制放射环,执行如下操作;
B1.用放射环第一层父节点表示数据集S1,通过放射环的扇形大小表示S1和S2数据的关联参数相应的频次,并按从大到小排序;
B2.用放射环第二层子节点表示数据集S1中每个数据节点与数据集S2有关联的第一个S2属性数据;
B3.用放射环第三层叶子节点表示数据集S1中每个数据节点与数据集S2有关联的第二个S2属性数据;
C.选取围绕地理热图不与地理热图交叉的最小圆环作为过渡圈,将过渡圈上的点称为过渡点,采用过渡点代表相应的地图上的点P,通过过渡点将放射环上的属性与相应的地理位置进行连接;
D.绘制贝塞尔曲线进行路径优化,使得地理热图不被遮挡;
E.绘制矩阵热图,完成对两类具有地域分布的关联层次数据集S1和S2的可视化。
2.如权利要求1所述关联层次数据的可视化方法,其特征是,还可采用交互方法进行可视显示。
3.如权利要求1所述关联层次数据的可视化方法,其特征是,步骤E除绘制矩阵热图,还通过绘制柱状图视图进行多视图可视化;所述柱状图为两个,第一个柱状图置于所述矩形热图的上方,第二个柱状图置于所述矩形热图的右方,通过颜色深浅表示步骤B1所述频次的大小,第一个柱状图表示沿横轴方向,各属性对纵轴的统计值,第二个柱状图表示沿纵轴方向,各属性对横轴的统计值,并将统计结果标注在每个柱形条的最右侧;所述柱形图用于帮助用户理解数据。
4.如权利要求1所述关联层次数据的可视化方法,其特征是,步骤C所述将地图上的点P与相应的过渡点连接采用放射线段,从圆心引线经过地图上的点并延伸至过渡圈,使得地区点到过渡圈的路径最短。
5.如权利要求1所述关联层次数据的可视化方法,其特征是,步骤C所述将地图上的点P与相应的过渡点连接,所述相应的过渡点通过如下步骤获得:
C1.放射环的圆心设为O,连接O点与地理热图的点P,并延长该连线至过渡圈,该连线与过渡圈的交点设为Q1和Q2;
C2.过渡点设为点Qi,通过式2计算得到:
d ( P , Q i ) = | ( x Q i - x p ) 2 + ( y Q i - y p ) 2 | (式2)
式2中,P为地图上的某点;Qi为过渡点,i的取值为1或2;Qi为连接圆心O与P并延长至过渡圈,与过渡圈的交点;xP、yP分别是P点的横坐标、纵坐标。xQi、yQi代表过渡点Qi的横纵坐标。
6.如权利要求1所述关联层次数据的可视化方法,其特征是,步骤D绘制贝塞尔曲线包括如下步骤:
D1.根据四个任意位置的点坐标根据式3绘制得到一条光滑曲线,该曲线为贝塞尔曲线:
B(t)=P0(1-t)3+3P1t(1-t)2+3P2t2(1-t)+P3t3,t∈[0,1](式3)
式3中,P0、P1、P2和P3是四个任意位置的点;
D2.贝塞尔曲线的起点A为过渡点Qi;贝塞尔曲线的终点D是放射环上某扇环内圈弧中点;过A点做内圆的外切线,根据勾股定理计算得到该切线与外圆交点到A点的距离d;
D3.判断A点与点D之间的距离d(A,D)是否小于d,若小于直接用直线连接点A和点D,完成绘制贝塞尔曲线;否则转入步骤D4寻找中间控制点B和C再完成绘制贝塞尔曲线;
D4.计算直线OA和直线OD的夹角,并划分三等份,同时取(R-r)/3作为圆心O到中间控制点的距离,确保中间控制点在内圆和外圆之间,控制中间控制点的角度位置,从而得到中间控制点的位置,利用中间控制点的位置完成绘制贝塞尔曲线。
7.如权利要求1所述关联层次数据的可视化方法,其特征是,步骤E所述绘制矩阵热图包括如下步骤:
E1.将数据集表示成一个N*M的矩阵H[N][M],矩阵内位置H[i][j]表示节点i和节点j之间的关系;
E2.通过色彩RGB值反映位置H[i][j]所代表的数值大小,形成矩阵热图。
8.如权利要求7所述关联层次数据的可视化方法,其特征是,步骤E2通过设定矩阵N(M)的最大值实现自适应缩小矩阵大小,使得避免造成不必要的空间浪费,当N值大于所述最大值时,提取的矩阵数据节点数目为最大值,以使得形成的矩阵热图便于用户查看与分析。
9.将权利要求1所述关联层次数据的可视化方法应用于农药残留数据的可视化分析,其特征是,把具有关联性的农产品类和农药类设为两类具有地域分布的关联层次数据集,首先通过统计得到不同地区农产品检测出农药残留MRL值超标的频次,用颜色的深浅表示超标频次的大小,将相应的地理区域用对应的颜色标识,绘制成地理热图;再绘制基于节点排序的放射环,放射环第一层父节点、第二层子节点和第三层叶子节点分别表示检测出超标农药的农产品、每个农产品中检出超标农药的类别和每个农产品检出每种超标农药类别中农药毒性分布;然后采用放射线段连接地图上的点和过渡点,并绘制贝塞尔曲线;最后绘制矩阵热图,通过色彩RGB值表示矩阵位置所代表的数值大小,以达到两类具有地域分布的关联层次数据集的直观可视化且便于用户查看与分析的目的。
10.如权利要求9所述关联层次数据的可视化方法在农药残留数据的可视化分析中的应用,其特征在于,还绘制两个柱形图进行数据可视化,通过颜色深浅表示农药超标频次的大小;第一个柱状图表示沿横轴方向,各属性对纵轴的统计值,第二个柱状图表示沿纵轴方向,各属性对横轴的统计值,并将统计结果标注在每个柱形条的最右侧。
CN201510854881.8A 2015-11-30 2015-11-30 一种关联层次数据的可视化方法和应用 Active CN105512218B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510854881.8A CN105512218B (zh) 2015-11-30 2015-11-30 一种关联层次数据的可视化方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510854881.8A CN105512218B (zh) 2015-11-30 2015-11-30 一种关联层次数据的可视化方法和应用

Publications (2)

Publication Number Publication Date
CN105512218A true CN105512218A (zh) 2016-04-20
CN105512218B CN105512218B (zh) 2018-11-23

Family

ID=55720200

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510854881.8A Active CN105512218B (zh) 2015-11-30 2015-11-30 一种关联层次数据的可视化方法和应用

Country Status (1)

Country Link
CN (1) CN105512218B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354760A (zh) * 2016-08-18 2017-01-25 北京工商大学 基于变形统计地图的多视图时空数据可视化方法与应用
CN106874407A (zh) * 2017-01-19 2017-06-20 北京工商大学 基于概念层次树的农残数据融合处理方法及其系统
CN108304500A (zh) * 2018-01-17 2018-07-20 西南交通大学 一种基于类属性的平行坐标可视化曲线绑定方法
CN108415914A (zh) * 2017-02-10 2018-08-17 阿里巴巴集团控股有限公司 一种可视化对象中查询信息的方法、装置及设备
WO2018192421A1 (zh) * 2017-04-18 2018-10-25 中国检验检疫科学研究院 基于高分辨质谱+互联网+地理信息的农药残留在线溯源与预警视频化方法
CN109662350A (zh) * 2018-12-05 2019-04-23 山东中烟工业有限责任公司 一种辅助戒烟系统和通信终端
CN110427411A (zh) * 2019-08-02 2019-11-08 河南开合软件技术有限公司 一种通过图层将关联数据进行可视化的方法
CN112000761A (zh) * 2020-08-28 2020-11-27 中国科学院计算机网络信息中心 数据分析方法及装置、电子设备、计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049580A (zh) * 2013-01-17 2013-04-17 北京工商大学 一种层次数据的可视化方法和设备
CN103268389A (zh) * 2013-06-09 2013-08-28 北京工商大学 一种基于插值算法的平滑曲线式超图可视化方法
CN104268908A (zh) * 2014-09-02 2015-01-07 北京工商大学 一种基于可视化技术的油井灌浆过程实时展示方法
CN104281681A (zh) * 2014-10-07 2015-01-14 北京工商大学 针对层次数据的正方化有序树图布局方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103049580A (zh) * 2013-01-17 2013-04-17 北京工商大学 一种层次数据的可视化方法和设备
CN103268389A (zh) * 2013-06-09 2013-08-28 北京工商大学 一种基于插值算法的平滑曲线式超图可视化方法
CN104268908A (zh) * 2014-09-02 2015-01-07 北京工商大学 一种基于可视化技术的油井灌浆过程实时展示方法
CN104281681A (zh) * 2014-10-07 2015-01-14 北京工商大学 针对层次数据的正方化有序树图布局方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106354760B (zh) * 2016-08-18 2018-12-11 北京工商大学 基于变形统计地图的多视图时空数据可视化方法与应用
CN106354760A (zh) * 2016-08-18 2017-01-25 北京工商大学 基于变形统计地图的多视图时空数据可视化方法与应用
CN106874407B (zh) * 2017-01-19 2020-04-03 北京工商大学 基于概念层次树的农残数据融合处理方法及其系统
CN106874407A (zh) * 2017-01-19 2017-06-20 北京工商大学 基于概念层次树的农残数据融合处理方法及其系统
CN108415914A (zh) * 2017-02-10 2018-08-17 阿里巴巴集团控股有限公司 一种可视化对象中查询信息的方法、装置及设备
US10915548B2 (en) 2017-04-18 2021-02-09 Chinese Academy Of Inspection And Quarantine Method of online tracing pesticide residues and visualizing warning on basis of high resolution mass spectrum, internet and geographic information
WO2018192421A1 (zh) * 2017-04-18 2018-10-25 中国检验检疫科学研究院 基于高分辨质谱+互联网+地理信息的农药残留在线溯源与预警视频化方法
CN108304500B (zh) * 2018-01-17 2020-06-02 西南交通大学 一种基于类属性的平行坐标可视化曲线绑定方法
CN108304500A (zh) * 2018-01-17 2018-07-20 西南交通大学 一种基于类属性的平行坐标可视化曲线绑定方法
CN109662350A (zh) * 2018-12-05 2019-04-23 山东中烟工业有限责任公司 一种辅助戒烟系统和通信终端
CN110427411A (zh) * 2019-08-02 2019-11-08 河南开合软件技术有限公司 一种通过图层将关联数据进行可视化的方法
CN110427411B (zh) * 2019-08-02 2022-04-08 河南开合软件技术有限公司 一种通过图层将关联数据进行可视化的方法
CN112000761A (zh) * 2020-08-28 2020-11-27 中国科学院计算机网络信息中心 数据分析方法及装置、电子设备、计算机可读存储介质

Also Published As

Publication number Publication date
CN105512218B (zh) 2018-11-23

Similar Documents

Publication Publication Date Title
CN105512218A (zh) 一种关联层次数据的可视化方法和应用
CN103049580B (zh) 一种层次数据的可视化方法和设备
Hadlak et al. A Survey of Multi-faceted Graph Visualization.
Vogt et al. Mapping landscape corridors
WO2018192421A1 (zh) 基于高分辨质谱+互联网+地理信息的农药残留在线溯源与预警视频化方法
Lespinats et al. CheckViz: Sanity Check and Topological Clues for Linear and Non‐Linear Mappings
Shahparvari et al. A GIS-LP integrated approach for the logistics hub location problem
Vehlow et al. Visualizing fuzzy overlapping communities in networks
Sarlin Macroprudential oversight, risk communication and visualization
CN105488130A (zh) 一种关联数据可视化展示方法
CN106227828B (zh) 一种同构层次数据对比可视分析方法和应用
Ortner et al. Vis-a-ware: Integrating spatial and non-spatial visualization for visibility-aware urban planning
CN105404643B (zh) 针对具有多维属性的层次结构数据的可视化方法和应用
Leung et al. FpMapViz: a space-filling visualization for frequent patterns
CN105930461A (zh) 实现关联信息节点可视化追踪的数据处理方法
CN106226817B (zh) 基于连续平行坐标的多属性地震数据可视化方法
CN105956747A (zh) 一种企业信誉评估可视化方法
CN106055580A (zh) 一种基于Radviz的模糊聚类结果可视化方法
Luo et al. A geovisual analytic approach to understanding geo-social relationships in the international trade network
CN105354223A (zh) 一种针对非连续层次数据的可视化方法和应用
Wang et al. Hierarchical visualization of geographical areal data with spatial attribute association
CN110008279B (zh) 一种基于“关系-权值”有序矩阵的可视分析方法与应用
Parush et al. Impact of visualization type and contextual factors on performance with enterprise resource planning systems
CN102314606A (zh) 无向图结点定位方法
CN107562826A (zh) 一种多维度数据的可视化对比展示方法及其系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant