CN113345052B

CN113345052B - 基于相似显著性的分类数据多视图可视化着色方法及系统

Info

Publication number: CN113345052B
Application number: CN202110655673.0A
Authority: CN
Inventors: 汪云海; 卢克成; 曾琼; 华博; 解文龙
Original assignee: Shandong University
Current assignee: Shandong University
Priority date: 2021-06-11
Filing date: 2021-06-11
Publication date: 2023-01-10
Anticipated expiration: 2041-06-11
Also published as: CN113345052A

Abstract

本公开提出了基于相似显著性的分类数据多视图可视化着色方法及系统，包括：接收分类数据；将所述分类数据投影到可视空间，获取所述分类数据的位置信息；基于所述位置信息度量每类数据之间的分离度，基于相似性度量计算同一类在不同分类数据上的变化信息；重新组合调色板或从离散化的颜色空间中随机选择多个颜色作为初始解，结合类之间的分离度和变化信息，基于模拟退火算法寻找近似最优解，生成调色板；基于最优的调色板渲染分类数据。采用模拟退火算法，能够快速的对给定调色板重新分配或直接生成调色板，同时考虑数据内分布和数据间变化，结合颜色差异度量，提高发生变化区域的相似显著性，并保持类内区分度，提升了可视分析的效率。

Description

基于相似显著性的分类数据多视图可视化着色方法及系统

技术领域

本公开属于数据可视化技术领域，尤其涉及基于相似显著性的分类数据多视图可视化着色方法及系统。

背景技术

本部分的陈述仅仅是提供了与本公开相关的背景技术信息，不必然构成在先技术。

比较是数据分析和可视化过程中不可或缺的任务，我们经常需要在多个有类别标签的数据中寻找发生变化的某个类，而这种比较任务通常是通过并列视图的形式完成的。适用的方法有直方图、折线图和散点图，而不论是哪种可视化图表，每个类都是使用某种唯一的颜色来表示。颜色对于人们发现差异是有重要作用的，然而，寻找一个恰当的着色方案仍然是一个具有挑战性且尚未被解决的问题。针对这个问题，我们从三个不同方面寻找解决方案：

(1)视觉比较任务

视觉比较是交互式数据分析过程中的一个重要部分。Gleicher等人(M.Gleicher,D.Albers,R.Walker,I.Jusufi,C.D.Hansen,and J.C.Roberts.Visual comparison forinformation visualization.Information Visualization,10(4):289–309,2011.doi:10.1177/1473871611416549)对现有技术做出总结并提出了三种基本的布局设计方案以更好的支持比较任务，包含并列视图、重叠视图及显示编码视图。而在这些布局中，并列视图将多个不同数据集放置于不同视图下，不对原始可视化设计做出改变，因此被应用于很多应用中。然而，这经常导致认知负担，因为用户需要同时比较不同视图。Ondov等人(B.Ondov,N.Jardine,N.Elmqvist,and S.Franconeri.Face to face:evaluating visualcomparison.IEEE Transactions on Visualization and Computer Graphics,25(1):861–871,2019.doi:10.1109/TVCG.2018.2864884)和Jardine等人(N.Jardine,B.D.Ondov,N.Elmqvist,and S.Franconeri.The perceptual proxies of visual comparison.IEEETransactions on Visualization and Computer Graphics,26(1):1012–1021,2020.doi:10.1109/TVCG.2019.2934786)评估了不同布局方法在直方图的低级比较任务中的感知有效性，发现并列视图在某些任务上并不高效，如寻找最大变化的类。基于此，Gleicher等人(M.Gleicher,D.Albers,R.Walker,I.Jusufi,C.D.Hansen,and J.C.Roberts.Visualcomparison for information visualization.Information Visualization,10(4):289–309,2011.doi:10.1177/1473871611416549)和L’Yi等人(S.LYi,J.Jo,andJ.Seo.Comparative layouts revisited:design space,guidelines,and futuredirections.IEEE Transactions on Visualization and Computer Graphics,27(2):1525–1535,2021.doi:10.1109/TVCG.2020.3030419)都提出应谨慎设计视觉编码以提升效率。

(2)颜色设计

颜色设计方面可以分三个部分讨论，分别是调色板颜色优化、调色板生成及多视图中颜色设计：

调色板颜色优化：

将每个类映射到一个恰当的颜色上对类别数据可视化非常有意义。一些不同的原则被提出以指导用户寻找恰当的映射方案。例如，Lin等人(S.Lin,J.Fortuna,C.Kulkarni,M.Stone,and J.Heer.Selecting semantically-resonant colors for datavisualization.Computer Graphics Forum,32(3):401–410,2013.doi:10.1111/cgf.12127)提出优化类的语义信息和颜色的兼容性，Setlur和Stone(V.Setlur andM.C.Stone.A linguistic approach to categorical color assignment for datavisualization.IEEE Transactions on Visualization and Computer Graphics,22(1):698–707,2016.doi:10.1109/TVCG.2015.2467471)通过颜色名与类别信息的关联获取更好的可视化效果。针对没有明确语义信息的类别数据，Hunter等人(C.Hurter,M.Serrurier,R.Alonso,G.Tabart,and J.-L.Vinot.An automatic generation of schematic maps todisplay flight routes for air traffic controllers:structure and coloroptimization.In Proceedings of the International Conference on AdvancedVisual Interfaces,pp.233–240,2010.doi:10.1145/1842993.1843034)建议最大化相邻区域的感知颜色差异，Kim等人(H.-R.Kim,M.-J.Yoo,H.Kang,and I.-K.Lee.Perceptually-based color assignment.Computer Graphics Forum,33(7):309–318,2014.doi:10.1111/cgf.12499)将颜色的美观性和对比度加入优化过程中进行图片的重新着色。近期，Wang等人(Y.Wang,X.Chen,T.Ge,C.Bao,M.Sedlmair,C.-W.Fu,O.Deussen,and B.Chen.Optimizing color assignment for perception of class separabilityin multiclass scatterplots.IEEE Transactions on Visualization and ComputerGraphics,25(1):820–829,2019.doi:10.1109/TVCG.2018.2864912)提出基于颜色和空间关系的类分离度来最大化类区分度，同时考虑了与背景的对比度，实现了对多类别散点数据的颜色自动优化。然而，几乎所有的方法都只考虑在单个数据上的高效可视化表达。

调色板生成：

寻找一个较好的多类调色板，通常的做法是从在线工具上选择由设计师精心设计的调色板，比如ColorBrewer(M.Harrower and C.A.Brewer.ColorBrewer.org:an onlinetool for selecting colour schemes for maps.The Cartographic Journal,40(1):27–37,2003.doi:10.1179/000870403235002042)。Colorgorical(C.C.Gramazio,D.H.Laidlaw,and K.B.Schloss.Colorgorical:creating discriminable andpreferable color palettes for information visualization.IEEE Transactions onVisualization and Computer Graphics,23(1):521–530,2017.doi:10.1109/TVCG.2016.2598918)允许用户通过自定义的区分度和偏好度的参数设置，生成不同的调色板，然而并没有考虑数据分布。Chen等人(H.Chen,W.Chen,H.Mei,Z.Liu,K.Zhou,W.Chen,W.Gu,and K.Ma.Visual abstraction and exploration of multi-classscatterplots.IEEE Transactions on Visualization and Computer Graphics,20(12):1683–1692,2014.doi:10.1109/TVCG.2014.2346594)建议在CIELAB空间搜索颜色以最大化类区分度，然而这个方法没有考虑亮度的优化，导致无法寻找到恰当的颜色。最近，Palettailor(K.Lu,M.Feng,X.Chen,M.Sedlmair,O.Deussen,D.Lischinski,Z.Cheng,andY.Wang.Palettailor:discriminable colorization for categorical data.IEEETransactions on Visualization and Computer Graphics,27(2):475–484,2021.doi:10.1109/TVCG.2020.3030406)进一步完善了调色板自动生成的过程，综合考虑了数据分布与颜色差异，并适用于散点图、折线图和直方图等不同图表。可是，这些方法都只考虑了单个数据，而并没有考虑多个不同视图的差异。

多视图中颜色设计：

多视图可视化通常用于多元数据分析，尽管有一些设计原则被提出用于构建多视图可视化，很少是关于颜色设计的。Qu等人(Z.Qu and J.Hullman.Keeping multipleviews consistent:constraints,validations,and exceptions in visualizationauthoring.IEEE Transactions on Visualization and Computer Graphics,24(1):468–477,2017.doi:10.1109/TVCG.2017.2744198)认为在不同视图中颜色应保持一致性原则，也就是不同视图应使用相同的调色板及映射关系，而一个好的映射关系能够帮助用户发现视图间的不同。然而，很少有工作是关于此类设计的。

(3)视觉显著性与相似显著性

可视化中的视觉显著性：

人类视觉系统的特性使得观察者聚焦于图像的显著区域时会忽视其他区域，这主要由两个因素指引：基于视觉特征(如颜色，亮度和边缘)的预注意、自底向上的注意力机制，基于先验知识的任务驱动的自顶向下的注意力机制。在计算机视觉领域，大量的显著性检测模型被提出，以模拟自底向上的注意力机制，这些模型大部分都是通过度量图像区域与周围的低层次特征的对比度。其中，最有影响力的是Itti模型(L.Itti,C.Koch,andE.Niebur.A model of saliency-based visual attention for rapid sceneanalysis.IEEE Transactions on Pattern Analysis and Machine Intelligence,20(11):1254–1259,1998.doi:10.1109/34.730558)，通过中心与周围的差异来度量图像的显著性。Kim等人(Y.Kim and A.Varshney.Saliency-guided enhancement for volumevisualization.IEEE Transactions on Visualization and Computer Graphics,12(5):925–932,2006.doi:10.1109/TVCG.2006.174)使用这个模型来增强体数据中被选中部分的视觉显著性。Janicke和Chen(H.Janicke and M.Chen.A salience-based quality metricfor visualization.Computer Graphics Forum,29(3):1183–1192,2010.doi:10.1111/j.1467-8659.2009.01667.x)应用Itti模型定义了一个质量矩阵用于评价可视化结果。近期，Matzen等人(L.E.Matzen,M.J.Haass,K.M.Divis,Z.Wang,and A.T.Wilson.Datavisualization saliency model:a tool for evaluating abstract datavisualizations.IEEE Transactions on Visualization and Computer Graphics,24(1):563–573,2018.doi:10.1109/TVCG.2017.2743939)在大量的可视化数据集上评估了一系列显著性模型的效果，发现这些模型的效果很差。一个主要的原因是可视化通常是为某个目的所创造，而现有模型都是基于自底向上的注意力机制。为了解决这个缺点，他们通过将具有高层语义信息的特征与Itti模型融合，提出了数据可视化显著性模型。然而，这个模型并不是基于类的层次，因此也无法直接用于类别数据可视化。

图像的相似显著性：

与基于单幅图像的显著性模型不同，相似显著性模型评估在多个相关图像中每个像素的显著性。Jacobs等人(D.E.Jacobs,D.B.Goldman,and E.Shechtman.Cosaliency：where people look when comparing images.In Proceedings of the 23nd Annual ACMSymposium on User Interface Software and Technology,pp.219–228,2010.doi:10.1145/1866029.1866066)提出了第一个相似显著性模型，用于高亮两幅图片中最显著的差异。之后，这个概念被扩展到从图像集合中发现相似和显著的目标或前景(D.Zhang,H.Fu,J.Han,A.Borji,and X.Li.A review of co-saliency detection algorithms:fundamentals,applications,and challenges.ACM Transactions on IntelligentSystems and Technology,9(4):1–31,2018.doi:10.1145/3158674)。

上述现有技术存在的技术问题为：当前技术是针对图像的处理，而并没有考虑数据所代表的含义(可视化通常是针对数据的特定含义所创造)，且没有一个适用于可视化领域的多视图类别数据着色方法。分类数据广泛存在于生产生活中，如生物领域中不同植株的叶片、花瓣等统计信息，工业生产中不同气体的排放指标，均可以作为分类数据。现有技术只是针对单个数据进行着色，而不同数据特征是不同的，直接应用会导致某些类别间难以区分。

发明内容

为克服上述现有技术的不足，本公开提供了基于相似显著性的分类数据多视图可视化着色方法，适用于散点图、折线图和柱状图等分类数据的可视化，能够对给定调色板重新分配或直接生成调色板，同时考虑数据内分布和数据间变化，结合颜色差异度量，提高用户感兴趣区域的相似显著性，并保持类内区分度，提升了可视分析的效率。

为实现上述目的，本公开的一个或多个实施例提供了如下技术方案：

第一方面，公开了基于相似显著性的分类数据多视图可视化着色方法，包括：

接收分类数据；

将所述分类数据投影到可视空间，获取所述分类数据的位置信息；

基于所述位置信息度量每类数据之间的分离度，基于相似性度量计算同一类在不同分类数据上的变化信息；

重新组合调色板或从离散化的颜色空间中随机选择多个颜色作为初始解，结合类之间的分离度和变化信息，基于模拟退火算法寻找近似最优解，生成调色板；

基于最优的调色板渲染分类数据。

进一步的技术方案，接收分类数据时，可给定调色板，具体为：

给定多个具有相同类别标签的数据集；

所有的可视化渲染结果均使用相同的背景色和相同的颜色映射。

进一步的技术方案，将所述分类数据投影到可视空间，获取所述分类数据的位置信息，包括：

当所述分类数据为散点图时，获取各类散点中每个点的位置；

当所述分类数据为柱状图时，获取各柱形的几何中心的位置；

当所述分类数据为折线图时，按不同采样策略对图中的折线进行离散，获取各条折线中每个离散点的位置，具体采样策略为两种：按相同的线段长度进行采样，按相同的x轴距离间隔进行采样。

进一步的技术方案，基于所述位置信息度量每类数据之间的分离度，具体为：分别基于K近邻图和类中心距离计算类之间的分离度，将两个分离度进行线性加权组合得到每个类与其他类之间的分离度。

进一步的技术方案，基于相似性度量计算同一类在不同分类数据上的变化信息，具体为：使用推土机距离来度量不同散点图中类分布的差异，以评估用户感知类结构变化的程度。

进一步的技术方案，使用模拟退火算法快速寻找近似最优解，包含基于相似显著性的自动颜色分配和基于相似显著性的调色板生成。

进一步的技术方案，基于相似显著性的自动颜色分配包括：

给定一个调色板，包含多个不同的颜色，初始时，随即对上述多个不同的颜色做随机排列，使用评分函数和模拟退火算法来寻找最佳排列。

第二方面，公开了基于相似显著性的分类数据多视图可视化着色系统，包括：

加载数据模块，用于接收分类数据；

度量数据模块，用于将所述分类数据投影到可视空间，获取所述分类数据的位置信息；基于所述位置信息度量每类数据之间的分离度，基于相似性度量计算同一类在不同分类数据上的变化信息；

显著性计算模块，用于基于所述位置信息和数据差异度量类的显著性；

调色板优化模块，用于重新组合调色板或从离散化的颜色空间中随机选择多个颜色作为初始解，结合类之间的分离度和变化信息，基于模拟退火算法寻找近似最优解，生成调色板；

数据渲染模块，基于最优的调色板渲染分类数据。

以上一个或多个技术方案存在以下有益效果：

本发明在获取了分类数据分布和不同数据间差异的基础上，采用模拟退火算法，能够快速的对给定调色板重新分配或直接生成调色板，同时考虑数据内分布和数据间变化，结合颜色差异度量，提高发生变化区域的相似显著性，并保持类内区分度，提升了可视分析的效率。

本发明附加方面的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

构成本公开的一部分的说明书附图用来提供对本公开的进一步理解，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。

图1为本发明一个或多个实施例中基于相似显著性的分类数据多视图可视化着色方法流程图；

图2(a)-(d)分别为本发明一个或多个实施例中在同一数据上与其他方法的对比效果图，每个编号后为方法名称，括号内为使用我们相似显著性模型进行评估的分数；

图3(a)-(b)分别为本发明一个或多个实施例中局部类对比度和类变化大小的计算示意图；

图4(a)-(e)分别为本发明一个或多个实施例中算法不同组成部分的相似显著性示意图，(a)为输入的两个散点图，(b)为局部类对比度，(c)为全局背景对比度，(d)为类变化程度，(e)为最终的相似显著性；

图5为本发明一个或多个实施例中使用ColorBrewer 8-class Set1调色板效果示意图；

图6(a)-(c)为本发明一个或多个实施例中不同λ参数示意图；

图7(a)-(d)为本发明一个或多个实施例中转换函数与对应效果示意图。

图8(a)-(b)为本发明一个或多个实施例中在真实数据上使用折线图的效果示意图。

图9(a)-(b)为本发明一个或多个实施例中直方图与折线图的效果示意图。

具体实施方式

应该指出，以下详细说明都是示例性的，旨在对本公开提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本公开的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下，本公开中的实施例及实施例中的特征可以相互组合。

本公开提出的总体思路：

受最初的模型启发，尝试通过高亮并列的有标签数据的可视化视图中最具有相似显著性的特征来设计恰当的颜色映射。

实施例一

本实施例提供了一种基于相似显著性的分类数据多视图可视化着色方法，如图1所示，具体包括以下步骤：

步骤1：加载多个分类数据，选择模式：调色板颜色分配，调色板颜色生成。其中，选择分配模式需要用户给定调色板。

所述分类数据为散点图、折线图和柱状图等。

给定多个具有相同类别标签的数据集，第j个数据X^j包含M个类和n_j数据点

其中，每个点

具有类标签

而第i个类包含

个点

所有的可视化渲染结果均使用相同的背景色c_b和相同的颜色映射

需要说明的是，分配方案初始解是给定的调色板，生成方案是随机生成几个颜色。

步骤2：将分类数据投影到可视空间(屏幕空间)，获取所述分类数据的位置数据，用于后续局部与全局的类对比度计算。

步骤3：计算局部类对比度。

局部类对比度是指相邻类间的对比差异，用于度量不同类之间的区分度。本实施例中，结合对密度敏感的K近邻图(K-Nearest Neighbor Graph，KNNG)和类中心距离对局部类对比度进行度量：分别基于KNNG和类中心距离计算类之间的分离度，将两个分离度进行线性加权组合得到每个类与其他类之间的分离度，其中所涉及的权重可调整，在当前实现中该权重设置为1.0。具体包括：

计算点

的基于KNNG的分离度：

其中

表示点

的所有邻居；

表示点

的颜色；d是两个点之间的欧式距离。第i个类的局部对比度为属于i类的所有点的分离度之和：

其中，

当类标签

为i时等于1，否则为0。

然而，KNNG在两个类没有交叉的时候无法反映类间的对比度，如图2(a)所示，蓝色和棕色类没有KNNG分离度。为了解决这个问题，我们引入一个额外的基于类中心的对比度。假设第i类的类中心为

那么它的类对比度为：

这会为相邻类赋予较大的权重，而对于远的类赋予较小的权重。最终的第i类的类对比度为：

ω为KNNG对比度和类中心对比度的权重，当前设置为1.0。

步骤4：计算全局类对比度。

因为所有的散点图都使用相同的背景颜色，因此将全局类对比度定义为每个类的颜色与背景的颜色差异：

β_i＝Δε(c_i,c_b)

步骤5：计算类变化大小，步骤3-5的变量，均用于步骤6中的Ecos项。

类变化大小衡量的是不同散点图中同一类数据空间分布的差异。我们使用推土机距离(Earth Mover’s Distance)来度量不同散点图中类分布的差异，以评估用户感知类结构变化的程度。假设第i个类有两个属于不同散点图的点集：

和

为了寻找两个点集所有点之间的一一对应关系，通过最小化总的匹配耗费：

其中，x表示点与点间的一一对应关系，如图2(b)所示。这是一个经典的二分图匹配问题，可以通过匈牙利算法求解。因为两个点集的点数可能不同，将点数差异也考虑在变化度量方程中：

两项的范围均为[0,1]，v默认设置为1.0。

步骤6：计算当前可视化结果评分

将相似显著性的计算建模为两个部分：数据间的类变化和数据内的类对比度。类对比度描述的是每个类与周围类及与背景的颜色差异，这类似于感知类分离度(M.Aupetitand M.Sedlmair.Sepme:2002 new visual separation measures.In 2016IEEE PacificVisualization Symposium,pp.1–8,2016.doi:10.1109/PACIFICVIS.2016.7465244)。因此，定义了两种类型的类对比度，即步骤3中的局部类对比度和步骤4中的全局类对比度。类似于自底向上的图像相似显著性模型，第i个类的相似显著性的值由类变化大小和类对比度分数的乘积得到，最终可视化结果的相似显著性评分为：

其中，使用指数函数来增强类结构变化的权重，f是一个分段函数，用于加权与背景的对比度：

其中，κ是一个由用户指定的阈值，默认为0。通过对κ的调整，用户可以自由选择感兴趣区域，如图7所示。

步骤7：使用模拟退火算法快速寻找近似最优解，根据步骤一的模式选择，分为基于相似显著性的自动颜色分配和基于相似显著性的调色板生成。

具体过程如下所述：

7.1基于相似显著性的自动颜色分配：给定一个调色板，包含P个不同的颜色，其中P≥M。初始时，随即对P个颜色做随机排列，使用步骤6中的评分函数和模拟退火算法来寻找最佳排列。由于给定的颜色可能多于需要使用的颜色，生成新解的过程包含两种不同策略：

(1)随机将选中的m个颜色中的两个颜色交换位置；

(2)随机将m个选中颜色中的某个颜色替换为未选中的P-M个颜色中的某个颜色。

在多次迭代后，可以获得较好的颜色映射。

然而，这个方法存在两个主要限制：

(1)需要用户尝试多个不同调色板，以寻找最合适的；

(2)由于大多数现有调色板并不是针对视觉比较任务设计的，因此即使最好的颜色映射方案也依然不能提供较好的效果。例如，ColorBrewer8-class Set1(M.Harrowerand C.A.Brewer.ColorBrewer.org:an online tool for selecting colour schemesfor maps.The Cartographic Journal,40(1):27–37,2003.doi:10.1179/000870403235002042)调色板中所有颜色都具有很高的区分度，但它很难找到一个较好的方案，如图5所示，发生变化的两个类难以快速找到。因此，建议用户使用本申请基于相似显著性的调色板生成方法。

7.2基于相似显著性的调色板生成：最新提出的数据驱动的调色板生成方法(K.Lu,M.Feng,X.Chen,M.Sedlmair,O.Deussen,D.Lischinski,Z.Cheng,andY.Wang.Palettailor:discriminable colorization for categorical data.IEEETransactions on Visualization and Computer Graphics,27(2):475–484,2021.doi:10.1109/TVCG.2020.3030406)自动生成高可区分度和用户偏好的调色板，通过最大化三种调色板评分函数：点区分度，颜色名差异，颜色区分度。通过将点区分度替换为本发明的相似显著性模型(即步骤六中的E_Cos)，我们得到新的评分函数，调色板生成过程可以转变为一个优化问题：

其中，E_ND表示颜色名差异评分，E_CD表示最小的颜色差异，ω_n和ω_c为两项评分的权重，可以由用户进行调整，初始解由算法随机生成颜色。

步骤8：利用生成的调色板渲染数据。

实施例二

本实施例的目的是提供一种基于相似显著性的分类数据多视图可视化着色系统，包括：

加载数据模块，接收分类数据和调色板；

度量数据模块，将所述分类数据投影到可视空间，获取所述分类数据的位置信息，并计算不同分类数据间差异；

显著性计算模块，基于所述位置信息和数据差异度量类的显著性；

调色板优化模块，重新组合调色板或从离散化的颜色空间中随机选择多个颜色作为初始解，结合类之间的分离度和变化信息，基于模拟退火算法快速寻找近似最优解，生成调色板；

数据渲染模块，基于所述调色板渲染分类数据。

实施例三

本实施例的目的是提供一种电子设备。

为了实现上述目的，本实施例提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述方法的步骤。

实施例四

本实施例的目的是提供一种计算机可读存储介质。

为了实现上述目的，本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时执行上述方法的步骤。

本发明适用于散点图、折线图和柱状图等分类数据的可视化，能够对给定调色板重新分配或直接生成调色板，同时考虑数据内分布和数据间变化，结合颜色差异度量，提高用户感兴趣区域的相似显著性，并保持类内区分度，提升了可视分析的效率。

以上实施例二、三和四的装置中涉及的各步骤与方法实施例一相对应，具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质；还应当被理解为包括任何介质，所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本公开中的任一方法。

本领域技术人员应该明白，上述本公开的各模块或各步骤可以用通用的计算机装置来实现，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本公开不限制于任何特定的硬件和软件的结合。

以上所述仅为本公开的优选实施例而已，并不用于限制本公开，对于本领域的技术人员来说，本公开可以有各种更改和变化。凡在本公开的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

上述虽然结合附图对本公开的具体实施方式进行了描述，但并非对本公开保护范围的限制，所属领域技术人员应该明白，在本公开的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。

Claims

1.基于相似显著性的分类数据多视图可视化着色方法，其特征是，包括：

接收分类数据；

基于所述位置信息度量每类数据之间的分离度，具体为：分别基于K近邻图和类中心距离计算类之间的分离度，将两个分离度进行线性加权组合得到每个类与其他类之间的分离度；具体包括：

计算点

的基于KNNG的分离度：

其中

表示点

的所有邻居

表示点

的颜色；

是两个点之间的欧式距离；第i个类的局部对比度为属于i类的所有点的分离度之和：

其中，

当类标签

为i时等于1，否则为0；

然而，KNNG在两个类没有交叉的时候无法反映类间的对比度，蓝色和棕色类没有KNNG分离度；为此引入一个额外的基于类中心的对比度；假设第i类的类中心为

，那么它的类对比度为：

这会为相邻类赋予较大的权重，而对于远的类赋予较小的权重；最终的第i类的类对比度为：

为KNNG对比度和类中心对比度的权重，当前设置为1.0；

计算全局类对比度；

基于相似性度量计算同一类在不同分类数据上的变化信息；具体为：使用推土机距离来度量不同散点图中类分布的差异，以评估用户感知类结构变化的程度；假设第i个类有两个属于不同散点图的点集：

和

，为了寻找两个点集所有点之间的一一对应关系，通过最小化总的匹配耗费：

其中，

表示点与点间的一一对应关系，因为两个点集的点数可能不同，将点数差异也考虑在变化度量方程中：

两项的范围均为[0,1]，

默认设置为1.0；

将相似显著性的计算建模为两个部分：数据间的类变化和数据内的类对比度；类对比度描述的是每个类与周围类及与背景的颜色差异，这类似于感知类分离度；因此，定义了两种类型的类对比度，即局部类对比度和全局类对比度；类似于自底向上的图像相似显著性模型，第i个类的相似显著性的值由类变化大小和类对比度分数的乘积得到，最终可视化结果的相似显著性评分为：