CN106227828A - 一种同构层次数据对比可视分析方法和应用 - Google Patents
一种同构层次数据对比可视分析方法和应用 Download PDFInfo
- Publication number
- CN106227828A CN106227828A CN201610591178.7A CN201610591178A CN106227828A CN 106227828 A CN106227828 A CN 106227828A CN 201610591178 A CN201610591178 A CN 201610591178A CN 106227828 A CN106227828 A CN 106227828A
- Authority
- CN
- China
- Prior art keywords
- tree
- subtree
- data
- isomorphism
- homogeneous
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 42
- 230000000007 visual effect Effects 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000013480 data collection Methods 0.000 claims abstract description 9
- 238000013517 stratification Methods 0.000 claims abstract description 7
- 235000013399 edible fruits Nutrition 0.000 claims description 54
- 230000002452 interceptive effect Effects 0.000 claims description 14
- 230000015572 biosynthetic process Effects 0.000 claims description 12
- 238000003786 synthesis reaction Methods 0.000 claims description 11
- 239000000284 extract Substances 0.000 claims description 10
- 238000012800 visualization Methods 0.000 claims description 10
- 239000000575 pesticide Substances 0.000 claims description 9
- 238000005516 engineering process Methods 0.000 claims description 8
- 239000000447 pesticide residue Substances 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 6
- 241000207199 Citrus Species 0.000 claims description 5
- 235000014443 Pyrus communis Nutrition 0.000 claims description 5
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical class N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 claims description 5
- 235000021028 berry Nutrition 0.000 claims description 5
- 235000020971 citrus fruits Nutrition 0.000 claims description 5
- 235000021038 drupes Nutrition 0.000 claims description 5
- 238000012216 screening Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000013079 data visualisation Methods 0.000 claims description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 3
- 241000705930 Broussonetia papyrifera Species 0.000 claims 1
- 235000013305 food Nutrition 0.000 abstract description 11
- 238000000605 extraction Methods 0.000 abstract description 2
- 241000220324 Pyrus Species 0.000 description 5
- 238000011160 research Methods 0.000 description 3
- 241000219112 Cucumis Species 0.000 description 2
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 241000033870 Citrullus lanatus subsp. vulgaris Species 0.000 description 1
- 235000012840 Citrullus vulgaris Nutrition 0.000 description 1
- 241001672694 Citrus reticulata Species 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241001093152 Mangifera Species 0.000 description 1
- 244000183278 Nephelium litchi Species 0.000 description 1
- 240000000851 Vaccinium corymbosum Species 0.000 description 1
- 235000003095 Vaccinium corymbosum Nutrition 0.000 description 1
- 235000017537 Vaccinium myrtillus Nutrition 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 235000021014 blueberries Nutrition 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004040 coloring Methods 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 235000021017 pears Nutrition 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000007794 visualization technique Methods 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/26—Visual data mining; Browsing structured data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Marine Sciences & Fisheries (AREA)
- General Health & Medical Sciences (AREA)
- Agronomy & Crop Science (AREA)
- Animal Husbandry (AREA)
- General Engineering & Computer Science (AREA)
- Mining & Mineral Resources (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公布了一种同构层次数据对比可视分析方法和应用,用节点‑链接法中的同构树表达层次结构,结合平行坐标进行布局,使得在展现数据的层次化关系的同时还可进行数据的对比分析;包括:对数据进行预处理,得到多个异构层次数据集;基于多个异构层次数据集,通过结构整合和减枝,抽取同构信息建立同构树;通过布局算法对同构树进行布局;结合同构树布局与平行坐标系,在展现数据的层次化关系的同时还可进行数据的对比分析。本发明支持对各节点属性值的对比分析,包括最大和最小值、属性值高低的分布模式和变化趋势、属性之间的关联等,可应用于对食品安全领域中多国MRL数据进行可视化。
Description
技术领域
本发明属于信息可视化技术领域,涉及层次数据对比可视分析方法,尤其涉及针对同构数据的层次特征建立的新型的平行坐标可视分析方法和应用,用于同构层次数据的对比分析。
背景技术
在不同领域中,经常需要对比多个层次数据。层次数据分为同构和异构两种。异构是指层次数据中的部分数据结构不完全相同。同构是指层次数据中的所有数据结构均相同。
农药残留是影响我国食品安全的主要因素之一,目前国际上通常用最大农药残留限量(下简称MRL)作为判定食品和农产品质量安全的依据。MRL是指某种农药在某种农产品中允许存在的最大限量值。食品中农药残留超标不仅会给人类的健康和生命带来威胁,还制约着食品的对外贸易,危及社会的繁荣和稳定。因此对比分析多国MRL标准,推动我国食品安全标准与国际标准接轨,提高食品安全的监管力度,增强我国食品在国际市场上的竞争力,具有十分重要的意义。当前,食品工业的发展计划在国家“十一五”和“十二五”中明确提出了需要解决食品安全的问题。通过对MRL标准数据的分析可知,农产品具有分层结构,各国MRL标准值具有可对比性,是典型的层次可对比数据。综上所述,多国MRL数据具有典型的层次属性和可对比性。
层次数据的可视化是目前的热点问题。现有的表示层次数据的方法主要包括节点-链接法和空间填充法两种。空间填充法中的树图利用面积显示数据,陈等人已经对8种常用的树图布局算法进行对比与优化研究,但是在显示层次关系上,空间填充法表现不及节点-链接法。节点-链接法可以直观清晰地表示承接的层次关系。
在信息可视化领域,多维数据的表示方法已相对成熟,其中平行坐标就是一种用于显示高维多元数据的可视化方法。平行坐标是将多维数据在两维平面显示出来,通过交互,人们可以更容易地发现数据背后隐含的规律。平行坐标可以良好地展示多维数据,但在层次数据展示方面却表现不佳;节点-链接法可以清楚地显示层次数据,但在数据对比方面略有欠缺。因此,现有可视化方法存在的不足,一方面是在对比数据的时候,往往无法兼顾层次属性;另一方面,单独对层次结构进行可视化的方法往往无法直观地对比各个节点的数值大小。如何在兼顾显示层次信息的同时进行数据对比成为了可视化领域一个亟待解决的问题。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于平行坐标和节点-链接树的同构层次数据对比可视分析方法PCNL(全称为Parallel Coordinates and Node-Link),将节点-链接法中的同构树表达层次结构的思想与平行坐标相结合,通过交互手段,使之展现层次化关系的同时,还可以进行数据的对比分析。
本发明的原理是:采用平行坐标模型可以有效地对数值进行对比,考虑到异构层次数据很难在平行坐标中表示,通过对同构层次数据的信息抽取,结合节点-链接法显示,可以良好地解决同构层次数据的对比问题。因此,本发明将现有传统的平行坐标可视化方法进行改进,加入节点-链接法的同构树思想,通过布局算法,颜色编码,形成一种具有用户交互功能且能够显示层次特性和数据对比的平行坐标图。本发明提出的能够兼顾显示同构层次数据和对比的可视化方法,首先对多个异构层次数据集进行对比统计,抽取出其中的同构信息,用节点链接法构建同构树;然后将节点链接与平行坐标结合,用平行坐标展示多个同构树中叶子节点的属性值,通过对节点进行布局、颜色编码,形成多个同构层次数据的平行坐标可视化表达;最后通过刷技术,点击高亮交互手段可有效的对比分析多个同构层次结构中每个叶子节点的多个属性。本发明方法可应用于对食品安全领域中多国MRL数据进行可视化。将该方法应用于MRL标准数据中,不仅可以体现多国农产品的层次结构,还可以对比单一农产品对应的各国MRL标准数值,有助于研究和找出中国MRL标准中存在的问题。
本发明提供的技术方案是:
一种同构层次数据对比可视分析方法,用节点-链接法中的同构树表达层次结构,结合平行坐标进行布局,使得在展现数据的层次化关系的同时还可进行数据的对比分析;包括如下步骤:
A)对数据进行预处理,得到多个异构层次数据集;
B)基于多个异构层次数据集,通过结构整合和减枝,抽取同构信息,建立同构树;
C)通过布局算法对同构树进行布局,所述布局算法将与根节点相连的一族子树称为一个子树簇,统计同构树中每个子树簇的叶子节点个数,按照叶子节点个数从多到少排序,将叶子节点个数最多的子树簇称为第一个子树簇,将所述第一个子树簇布局在图形中央,剩余的子树簇按照叶子节点个数从多到少依次排列在所述第一个子树簇的上下两端;
D)结合C)所述同构树布局与平行坐标系进行数据可视化,具体将平行坐标的列抽象显示为不同层次结构叶子节点的值,由此建立同构树布局与平行坐标系之间的关联;再增加一列用来显示不同数据的属性值;由此使得在展现数据的层次化关系的同时还可进行数据的对比分析。
针对上述同构层次数据对比可视分析方法,进一步地,步骤B)设定所述多个异构层次数据集为n,n至少为2;将n个异构层次数据集表示为n个具有层次结构的树形结构,分别记为树A、树B、树C、...共n个树,记录各个树中各个节点的层次信息;基于所述n个树建立同构树,具体包括如下步骤:
B11.n个树中,以树A为对比对象,对比树A与树B的层次结构和各个节点的信息,通过结构整合和减枝,抽取同构信息,形成新的同构树;
B12.以新形成的树为对比对象,逐个与n个树中余下的树中的其中一个树形结构进行层次结构和节点信息的对比,通过结构整合和减枝,抽取同构信息,形成新的同构树;
B13.重复B12中的步骤,直至遍历所有n个树,得到最后的同构树t。
针对上述同构层次数据对比可视分析方法,进一步地,步骤C)中,设定n为同构树中叶子结点的总数;m为同构树中子树簇的总数;k为同构树的深度;定义Sij为第i棵子树中第j个叶子节点的位置,其中i表示子树的编号,j表示叶子节点的编号;设定Sh表示当前已布局叶子节点的上边界位置;Sl表示当前已布局叶子节点下边界的位置;定义Hi’j’为第i’颗子树中第j’个子节点位置,其中i’表示子树的编号,j’表示子节点的编号;定义F(Hi’j’,k)为位于k层的第i’颗子树中第j’个子节点的定位函数;所述布局算法具体包括如下步骤:
step1:将坐标轴分为n等份,将第一个子树簇中的所有叶子节点按照所在子树进行编
号,初始化S11的位置为:;
step2:布局其余的叶子节点,直至遍历该子树的所有叶子节点:
step3:定义该子树簇中其余子树的叶子节点位置:
step4:计算上一层父节点位置的定位函数F(Hi’j’,k):
step5:令Hi’j’为新的子节点,重复step4,逐层向上递归计算,直至遍历整个子树簇。
step6:重复step3计算新的叶子节点位置,遍历一个完整的子树簇后,重复step4和step5,直至形成新的子树簇;
step7:重复step6,直至m个子树簇被遍历完,输出结果。
针对上述同构层次数据对比可视分析方法,更进一步地,所述第i棵子树中第j个叶子节点的位置Sij也是在步骤D)所述平行坐标系中的纵坐标,从而建立同构树布局与平行坐标系之间的关联。
针对上述同构层次数据对比可视分析方法,进一步地,采用颜色标识区分不同数据。还可通过交互可视化方法对数据进行筛选可视化。所述交互方法包括刷技术和点击高亮方法。
本发明将上述同构层次数据对比可视分析方法应用于多国最大农药残留限量数据MRL的可视化分析,其中,所述多国MRL数据具有典型的层次属性和可对比性;包括如下步骤:
A.从MRL标准数据库中抽取多国共有的水果MRL数据,经数据预处理后,根据水果分类
构建多国水果同构树;
B.统计多国水果同构树中各个子树的叶子节点个数;将子树按照包括叶子节点的个数进行排序;
C.根据布局算法构建同构树的布局,将包括叶子节点多的子树布局在图形中央,将子树按照包括叶子节点的个数按照由多到少的顺序依次布局在热带水果大类的上下两端;
D.对以水果为根结点的农产品同构树进行布局,采用平行坐标显示农药信息和各国水果MRL标准值。
上述多国最大农药残留限量数据MRL的可视化分析方法,进一步地,所述水果分类包括6大类、11子类、20种农产品和28种农药;所述6大类为柑橘大类、核果大类、浆果大类、热带水果大类、仁果大类和瓜果大类。
优选地,可使用颜色编码对图形进行着色;可使用鼠标拖拽的交互操作方法筛选各类水果信息。
与现有技术相比,本发明的有益效果是:
本发明将平行坐标和同构树型结构相结合,辅以相应的交互手段,是一种基于平行坐标的同构层次数据对比可视分析方法。该方法具有如下特点:
(一)使用节点-链接法清晰的展现了同构树的层次结构;
(二)使用平行坐标清晰的展现了多棵同构树中各节点的属性值;
(三)支持对各节点属性值的对比分析,包括最大和最小值、属性值高低的分布模式和变化趋势、属性之间的关联等等;
(四)通过交互操作和颜色区别支持快速筛选感兴趣的属性,高亮显示。
本发明方法可应用于对食品安全领域中多国MRL数据进行可视化。将该方法应用于MRL标准数据中,不仅可以体现多国农产品的层次结构,还可以对比单一农产品对应的各国MRL标准数值,有助于研究和找出中国MRL标准中存在的问题。
附图说明
图1为本发明方法中同构树的形成过程;
其中,图中含有需对比的n个树型结构(t1,t2...tn),通过P1进行相互比较、结构整合和减枝操作,形成处理后的各个树形结构,通过P2抽取同构信息,形成新的同构树。
图2为本发明布局算法的布局示意图;
其中,通过算法布局之前的同构树如T所示,通过算法布局P,将叶子节点个数较大的子树簇布局在图形的中央,剩余的子树簇按照叶子节点个数从大到小依次排列在第一个子树簇的上下两端。
图3为本发明布局算法的流程框图。
图4为本发明可视化表达示意图;
其中,平行坐标中第一列的值代表第一棵树中各叶子节点的属性值,以此类推,第n列的值代表第n棵树中各叶子节点的属性值,这n棵树为同构的;最靠近右端的一列为属性列,用来显示不同数据的属性值。
图5为本发明提供的基于平行坐标的同构层次数据对比可视分析方法的流程框图。
图6为使用本发明应用于各国MRL标准数据中常见的水果的可视化方法的流程框图。
图7为本发明实施例中对各国MRL标准数据中常见的水果数据生成的平行坐标图。
图8为本发明实施例中对各国MRL标准数据中常见的水果数据可视化交互系统截图。
具体实施方式
下面结合附图,通过实施例进一步描述本发明,但不以任何方式限制本发明的范围。
本发明提供一种基于平行坐标和节点-链接树的同构层次数据对比可视分析方法,具体流程如图5所示,具体操作步骤如下:
A.数据预处理:
获取多个异构层次数据集,进行数据的预处理操作。数据预处理包括,对数据进行数值单位统一、文本格式调整、层次同义词合并。整理好的多个异构层次数据集有助于同构树的建立。
B.同构树的建立:
若需要对比多个具有层次结构的树形结构,设树形结构数量为n(n至少为2),各个树分别记为树A、树B、树C...(共n个),记录各个树中各个节点的层次信息,例如Aij代表树A中第i行第j个节点的层次信息。
B11.以树A为对比对象,对比树A与树B的层次结构和各个节点的信息,通过结构整合和减枝,抽取同构信息,形成新的树形结构;
B12.以新形成的树为对象,按照C,D...的顺序与下一个树形结构进行层次结构和节点信息的对比,通过结构整合和减枝,抽取同构信息,形成新的同构树形结构。
B13.重复B12中的步骤,直至遍历n个树型结构,得到最后的同构树t,如图1所示。
C.对同构树通过布局算法进行布局:
本发明将与根节点相连的一族子树称为一个子树簇。统计同构树中每个子树簇的叶子节点个数,从大到小排序。将叶子节点个数最多的子树簇(称为第一个子树簇)将其布局在图形中央,剩余的子树簇按照叶子节点个数从大到小依次排列在第一个子树簇的上下两端,具体布局如图2所示。
C11在描述本算法前,先定义如下参数:
假设:n为同构树中叶子结点的总数;m为同构树中子树簇的总数;k为同构树的深度;
定义Sij为第i颗子树中第j个叶子节点的位置(在平行坐标系中的纵坐标),其中i表示子树的编号,j表示叶子节点的编号,如S1a表示第1颗子树中第a个叶子节点的位置;设Sh表示当前已布局叶子节点的上边界位置;Sl表示当前已布局叶子节点下边界的位置;
定义Hi’j’为第i’颗子树中第j’个子节点位置,其中i’表示子树的编号,j’表示子节点的编号;
定义F(H i’j’,k)为位于k层的第i’颗子树中第j’个子节点的定位函数;
具体布局算法描述如下:
step1:将坐标轴分为n等份,方便度量。将第1个子树簇中的所有叶子节点按照其子树编号。初始化S11的位置为:
step2:布局其余的叶子节点,直至遍历该子树的所有叶子节点:
step3:定义该子树簇中其余子树的叶子节点位置:
step4:计算上一层父节点位置的定位函数F(Hi’j’,k):
step5:令Hi’j’为新的子节点,重复step4,逐层向上递归计算,直至遍历整个子树簇。
step6:重复step3计算新的叶子节点位置,遍历一个完整的子树簇后,重复step4和step5,直至形成新的子树簇;
step7:重复step6,直至m个子树簇被遍历完,输出结果。
该布局算法有三个优点:
(1)将叶子节点较多的子树布局在图形中央,符合美学标准,使用户的注意力集中在可视化结果的主要区域;
(2)避免了层次结构中线条的交叉,使分类的层次更加清晰;
(3)新加入的子树布局在图形两侧,不会引起整体结构的改变。
D.结合同构树与传统平行坐标进行可视化:传统的结点-链接法在对比多棵树形结构时显示效果不佳。因此,我们将平行坐标的列抽象显示为不同层次结构叶子节点的值。如图4所示,平行坐标中第一列的值代表第一棵同构树中各叶子节点的值,以此类推,第n列的值代表第n棵同构树中各叶子节点的值。最靠近右端的一列用来显示不同数据的属性值。这样布局既没有损失多维数据属性的表示,也兼顾了多棵同构树的对比。
E.颜色选择:颜色选择是可视化的重要部分,好的颜色选择可以让用户更直观地了解可视化内容。在对比同构层次数据的时候,往往需要有参照物,即需要把某个同构层次数据与其它同构层次数据进行数值上的对比。除了用颜色大致区别每条数据之外,还用颜色标示了参照物各个叶子节点值的大小。
F.交互手段:用户可以通过可视化中的交互手段对自己感兴趣的数据进行筛选。本发明主要使用了刷技术和点击高亮(具体可参考具体实施例中效果)。
以下实施例采用多国MRL标准中的水果数据,使用本发明提供的上述基于平行坐标的同构层次数据对比可视分析方法(改进的平行坐标方法)进行可视化展示,具体流程如图6所示。图7左端的树形结构可以表示不同国家标准中水果的分级情况,右端的平行坐标可以显示不同水果在不同农药种的MRL值。通过简易直观的分析和交互手段可以较为容易地对MRL标准数据进行对比分析,同时得出相应的结论。
A.从MRL标准数据库中抽取多国共有的水果的MRL数据,经数据预处理后,根据水果分类构建多国水果同构树;
B.以各国MRL标准数据中常见的水果为例,统计多国水果同构树中各个子树的叶子节点个数;
本例中,通过统计所得结果:水果下共计6大类、11子类、20种农产品和28种农药。其中,柑橘大类下含有柑橘子类,柑橘子类下含有柑、橘两种农产品;核果大类下含有核果子类,核果子类下含有桃、杏、樱桃三种农产品;浆果大类下含有藤蔓类、攀缘类、浆果子类,藤蔓类下含有桑葚,攀缘类下含有猕猴桃、葡萄两种农产品,浆果子类下含有草莓、蓝莓两种农产品;热带水果大类下含有小型果类,中型果类,大型果类和带刺果类四种,小型果类下含有荔枝、橄榄两种农产品,中型果类下含有芒果一种农产品,大型果类下含有香蕉、木瓜两种农产品,带刺果类下含有菠萝一种农产品;仁果大类下含有仁果子类,仁果子类下含有梨、苹果两种农产品;瓜果大类下含有甜瓜类,甜瓜类下含有哈密瓜、西瓜两种农产品。
C.根据布局算法构建同构树的布局,含较多叶子节点的子树应布局在图形中央,即热带水果大类下所有子类和农产品在初始图形的正中央。其他子树依次布局在热带水果大类的上下两端。
D.依照上述可视化方法,对以水果为根结点的农产品同构树进行布局,加入平行坐标显示农药信息和各国MRL标准值,如图6所示。可以看出各国MRL标准值的总体趋势,在日本和欧盟处有明显降低。
在多国同构树右侧添加平行坐标显示各国MRL数据和农药。通过平行坐标中不同的连线可以看出各个农产品类别中的数据。
E.使用颜色编码对图形进行着色。除了用颜色大致区别每条数据之外,还用颜色标示了参照物各个叶子节点值的大小。如图7所示,该图为各国MRL标准数据中常见的水果的对比布局结果。可用颜色(或灰度)深浅表示属性值的大小,如图7的图例中,色带颜色越灰,代表中国MRL限量值越高;反之,色带颜色越黑(深)代表MRL值越低,这里的取值范围为0.01到20。
F.添加用户交互方法。用户可以通过刷技术,即鼠标拖拽的交互手段筛选各类水果信息。如图8所示,该图为使用刷技术筛选出的热带水果大类下所有的农产品信息。同时也可以单击平行坐标的线高亮显示出筛选所得的数据。可以看出,除木瓜之外,大中小型果整体MRL值在各国的MRL标准中均偏低,只有木瓜达到了10。这种对同构树的对比分析有助于用户找到同类农产品的不同MRL标准分布情况与趋势,与不同农产品在相同MRL标准下不同限量值的直观表达,有助于发掘农产品分类之间MRL限量值的关系,帮助领域人员进行相关决策。
本发明的主要内容已通过上述优选实例作了详细介绍。需要注意的是,公布实施例的目的在于帮助进一步理解本发明,但是本领域的技术人员可以理解:在不脱离本发明及所附权利要求的精神和范围内,各种替换和修改都是可能的。因此,本发明不应局限于实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。
Claims (10)
1.一种同构层次数据对比可视分析方法,用节点-链接法中的同构树表达层次结构,结合平行坐标进行布局,使得在展现数据的层次化关系的同时还可进行数据的对比分析;包括如下步骤:
A)对数据进行预处理,得到多个异构层次数据集;
B)基于多个异构层次数据集,通过结构整合和减枝,抽取同构信息,建立同构树;
C)通过布局算法对同构树进行布局,所述布局算法将与根节点相连的一族子树称为一个子树簇,统计同构树中每个子树簇的叶子节点个数,按照叶子节点个数从多到少排序,将叶子节点个数最多的子树簇称为第一个子树簇,将所述第一个子树簇布局在图形中央,剩余的子树簇按照叶子节点个数从多到少依次排列在所述第一个子树簇的上下两端;
D)结合C)所述同构树布局与平行坐标系进行数据可视化,具体将平行坐标的列抽象显示为不同层次结构叶子节点的值,由此建立同构树布局与平行坐标系之间的关联;再增加一列用来显示不同数据的属性值;由此使得在展现数据的层次化关系的同时还可进行数据的对比分析。
2.如权利要求1所述同构层次数据对比可视分析方法,其特征是,步骤B)设定所述多个异构层次数据集为n,n至少为2;将n个异构层次数据集表示为n个具有层次结构的树形结构,分别记为树A、树B、树C、...共n个树,记录各个树中各个节点的层次信息;基于所述n个树建立同构树,具体包括如下步骤:
B11.n个树中,以树A为对比对象,对比树A与树B的层次结构和各个节点的信息,通过结构整合和减枝,抽取同构信息,形成新的同构树;
B12.以新形成的树为对比对象,逐个与n个树中余下的树中的其中一个树形结构进行层次结构和节点信息的对比,通过结构整合和减枝,抽取同构信息,形成新的同构树;
B13.重复B12中的步骤,直至遍历所有n个树,得到最后的同构树t。
3.如权利要求1所述同构层次数据对比可视分析方法,其特征是,步骤C)中,设定n为同构树中叶子结点的总数;m为同构树中子树簇的总数;k为同构树的深度;定义Sij为第i棵子树中第j个叶子节点的位置,其中i表示子树的编号,j表示叶子节点的编号;设定Sh表示当前已布局叶子节点的上边界位;Sl表示当前已布局叶子节点下边界的位置;定义Hi’j’为第i’颗子树中第j’个子节点位置,其中i’表示子树的编号,j’表示子节点的编号;定义F(Hi’j’,k)为位于k层的第i’颗子树中第j’个子节点的定位函数;所述布局算法具体包括如下步骤:
step1:将坐标轴分为n等份,将第一个子树簇中的所有叶子节点按照所在子树进行编号,初始化S11的位置为:
step2:布局其余的叶子节点,直至遍历该子树的所有叶子节点:
step3:定义该子树簇中其余子树的叶子节点位置为:
step4:计算上一层父节点位置的定位函数F(Hi’j’,k):
step5:令Hi’j’为新的子节点,重复step4,逐层向上递归计算,直至遍历整个子树簇;
step6:重复step3计算新的叶子节点位置,遍历一个完整的子树簇后,重复step4和step5,直至形成新的子树簇;
step7:重复step6,直至m个子树簇被遍历完,输出结果。
4.如权利要求3所述同构层次数据对比可视分析方法,其特征是,所述第i棵子树中第j个叶子节点的位置Sij也是在步骤D)所述平行坐标系中的纵坐标,从而建立同构树布局与平行坐标系之间的关联。
5.如权利要求1所述同构层次数据对比可视分析方法,其特征是,采用颜色标识区分不同数据。
6.如权利要求1所述同构层次数据对比可视分析方法,其特征是,通过交互可视化方法对数据进行筛选可视化。
7.如权利要求6所述同构层次数据对比可视分析方法,其特征是,所述交互方法包括刷技术和点击高亮方法。
8.将权利要求1至7所述同构层次数据对比可视分析方法应用于多国最大农药残留限量数据MRL的可视化分析,其特征是,所述多国MRL数据具有典型的层次属性和可对比性;包括如下步骤:
A.从MRL标准数据库中抽取多国共有的水果MRL数据,经数据预处理后,根据水果分类构建多国水果同构树;
B.统计多国水果同构树中各个子树的叶子节点个数;将子树按照包括叶子节点的个数进行排序;
C.根据布局算法构建同构树的布局,将包括叶子节点多的子树布局在图形中央,将子树按照包括叶子节点的个数按照由多到少的顺序依次布局在热带水果大类的上下两端;
D.对以水果为根结点的农产品同构树进行布局,采用平行坐标显示农药信息和各国水果MRL标准值。
9.如权利要求8所述多国最大农药残留限量数据MRL的可视化分析方法,其特征是,所述水果分类包括6大类、11子类、20种农产品和28种农药;所述6大类为柑橘大类、核果大类、浆果大类、热带水果大类、仁果大类和瓜果大类。
10.如权利要求8所述多国最大农药残留限量数据MRL的可视化分析方法,其特征是,使用颜色编码对图形进行着色;使用鼠标拖拽的交互操作方法筛选各类水果信息。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610591178.7A CN106227828B (zh) | 2016-07-25 | 2016-07-25 | 一种同构层次数据对比可视分析方法和应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610591178.7A CN106227828B (zh) | 2016-07-25 | 2016-07-25 | 一种同构层次数据对比可视分析方法和应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106227828A true CN106227828A (zh) | 2016-12-14 |
CN106227828B CN106227828B (zh) | 2018-10-30 |
Family
ID=57532875
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610591178.7A Active CN106227828B (zh) | 2016-07-25 | 2016-07-25 | 一种同构层次数据对比可视分析方法和应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106227828B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106874407A (zh) * | 2017-01-19 | 2017-06-20 | 北京工商大学 | 基于概念层次树的农残数据融合处理方法及其系统 |
CN108153826A (zh) * | 2017-12-07 | 2018-06-12 | 北京大学 | 一种基于条形码树的可视化形式比较层次结构数据的方法和系统 |
CN108280191A (zh) * | 2018-01-25 | 2018-07-13 | 北京工商大学 | 多地区mrl标准的对比可视分析方法与系统 |
CN108427765A (zh) * | 2018-03-23 | 2018-08-21 | 北京工商大学 | 一种基于hct图的层次数据对比可视分析方法 |
CN110163348A (zh) * | 2019-04-29 | 2019-08-23 | 清华大学 | 深度神经网络鲁棒性可视分析系统及方法 |
CN110709826A (zh) * | 2016-12-22 | 2020-01-17 | 奥恩全球运营有限公司,新加坡分公司 | 用于链接来自异构数据库的数据记录的方法及系统 |
CN111625235A (zh) * | 2020-04-17 | 2020-09-04 | 北京大学 | 基于描述性语言的树可视化形式的构建、解构方法及系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010033644A1 (en) * | 2008-09-16 | 2010-03-25 | File System Labs Llc | Matrix-based error correction and erasure code methods and apparatus and applications thereof |
CN102629271A (zh) * | 2012-03-13 | 2012-08-08 | 北京工商大学 | 一种基于堆叠树图的复杂数据可视化方法及设备 |
CN103049580A (zh) * | 2013-01-17 | 2013-04-17 | 北京工商大学 | 一种层次数据的可视化方法和设备 |
CN103164520A (zh) * | 2013-03-08 | 2013-06-19 | 山东大学 | 一种面向层次化数据的交互可视方法及装置 |
CN105224656A (zh) * | 2015-09-30 | 2016-01-06 | 北京工商大学 | 一种针对两类层次数据的对比关联可视分析方法和应用 |
-
2016
- 2016-07-25 CN CN201610591178.7A patent/CN106227828B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2010033644A1 (en) * | 2008-09-16 | 2010-03-25 | File System Labs Llc | Matrix-based error correction and erasure code methods and apparatus and applications thereof |
CN102629271A (zh) * | 2012-03-13 | 2012-08-08 | 北京工商大学 | 一种基于堆叠树图的复杂数据可视化方法及设备 |
CN103049580A (zh) * | 2013-01-17 | 2013-04-17 | 北京工商大学 | 一种层次数据的可视化方法和设备 |
CN103164520A (zh) * | 2013-03-08 | 2013-06-19 | 山东大学 | 一种面向层次化数据的交互可视方法及装置 |
CN105224656A (zh) * | 2015-09-30 | 2016-01-06 | 北京工商大学 | 一种针对两类层次数据的对比关联可视分析方法和应用 |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110709826A (zh) * | 2016-12-22 | 2020-01-17 | 奥恩全球运营有限公司,新加坡分公司 | 用于链接来自异构数据库的数据记录的方法及系统 |
CN106874407A (zh) * | 2017-01-19 | 2017-06-20 | 北京工商大学 | 基于概念层次树的农残数据融合处理方法及其系统 |
CN106874407B (zh) * | 2017-01-19 | 2020-04-03 | 北京工商大学 | 基于概念层次树的农残数据融合处理方法及其系统 |
CN108153826A (zh) * | 2017-12-07 | 2018-06-12 | 北京大学 | 一种基于条形码树的可视化形式比较层次结构数据的方法和系统 |
CN108280191A (zh) * | 2018-01-25 | 2018-07-13 | 北京工商大学 | 多地区mrl标准的对比可视分析方法与系统 |
CN108280191B (zh) * | 2018-01-25 | 2020-07-17 | 北京工商大学 | 多地区mrl标准的对比可视分析方法与系统 |
CN108427765A (zh) * | 2018-03-23 | 2018-08-21 | 北京工商大学 | 一种基于hct图的层次数据对比可视分析方法 |
CN108427765B (zh) * | 2018-03-23 | 2020-06-12 | 北京工商大学 | 一种基于hct图的层次数据对比可视分析方法 |
CN110163348A (zh) * | 2019-04-29 | 2019-08-23 | 清华大学 | 深度神经网络鲁棒性可视分析系统及方法 |
CN111625235A (zh) * | 2020-04-17 | 2020-09-04 | 北京大学 | 基于描述性语言的树可视化形式的构建、解构方法及系统 |
CN111625235B (zh) * | 2020-04-17 | 2021-09-24 | 北京大学 | 基于描述性语言的树可视化形式的构建、解构方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN106227828B (zh) | 2018-10-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106227828A (zh) | 一种同构层次数据对比可视分析方法和应用 | |
CN102629271B (zh) | 一种基于堆叠树图的复杂数据可视化方法及设备 | |
CN103440682B (zh) | 一种快速三维成图方法和系统 | |
CN104899288B (zh) | 基于径向布局的多维层次可视化方法 | |
Kehrer et al. | Interactive visual analysis of heterogeneous scientific data across an interface | |
Vehlow et al. | Visualizing dynamic hierarchies in graph sequences | |
CN103678707A (zh) | 一种行道树生态景观监测系统和方法 | |
LU505928B1 (fr) | A decision tree-based inference method for a tunnel full-section blasting plan | |
CN105512218A (zh) | 一种关联层次数据的可视化方法和应用 | |
CN109344215A (zh) | 一种检测小班林业资源的方法 | |
CN106226817B (zh) | 基于连续平行坐标的多属性地震数据可视化方法 | |
Tang et al. | Three-dimensional Forest growth simulation in virtual geographic environments | |
CN108280191B (zh) | 多地区mrl标准的对比可视分析方法与系统 | |
CN106203516B (zh) | 一种基于维度相关性的子空间聚类可视分析方法 | |
CN102831316B (zh) | 一种基于云本体的茶树虫害智能诊断原型系统 | |
CN105303470A (zh) | 一种基于大数据的电力项目规划建设方法 | |
CN110008279B (zh) | 一种基于“关系-权值”有序矩阵的可视分析方法与应用 | |
CN108182185A (zh) | 一种农用地地球化学信息系统 | |
Graham et al. | Extending taxonomic visualisation to incorporate synonymy and structural markers | |
CN104915486B (zh) | 一种零件连接信息检索方法 | |
Vico et al. | Business Intelligence in Agriculture–A Practical Approach | |
CN107358115A (zh) | 一种考虑实用性的多属性数据去隐私方法 | |
CN1825139A (zh) | 一种基于变形场的地层面计算机图形生成方法 | |
Qing et al. | Integrating crop models into GIS to predict regional crop yield | |
CN109523143A (zh) | 一种基于多粒度计算的土地评价方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |