WO2020244215A1

WO2020244215A1 - 一种基于数据分布的调色板生成方法及系统

Info

Publication number: WO2020244215A1
Application number: PCT/CN2019/130087
Authority: WO
Inventors: 汪云海; 卢克成
Original assignee: 山东大学
Priority date: 2019-06-06
Filing date: 2019-12-30
Publication date: 2020-12-10
Also published as: CN110196935A; CN110196935B

Abstract

一种基于数据分布的调色板生成方法及系统，所述方法包括以下步骤：接收分类数据和颜色数据，所述颜色数据包括离散化的颜色空间；将所述分类数据投影到可视空间，获取所述分类数据的位置信息；从离散化的颜色空间中随机选择多个颜色作为初始解，基于模拟退火算法寻找近似最优解，生成调色板；基于所述调色板渲染分类数据。该调色板生成方法考虑了数据的分布、颜色的差异化和美观性等因素，可视化效果好，且提高了可视化分析的效率。

Description

一种基于数据分布的调色板生成方法及系统

技术领域

本发明数据可视化技术领域，具体涉及一种基于数据分布的调色板生成方法及系统。

背景技术

对分类数据进行可视化常用的方法有直方图、折线图和散点图，通常是将每个类用一个颜色来表示，主要任务是可以较好的区分不同类。人们感知不同类的区分度受颜色的影响很大，然而如何寻找一个恰当的调色板现在仍然是一个复杂且耗时的任务，即使是对专家来说也如此。

针对分类数据的调色板设计，目前主要有三种方法，分别是调色板生成、调色板颜色分配及调色板颜色优化：

(1)调色板生成

生成合适的用于分类数据的调色板在视觉设计领域受到很大关注，大多数现有的颜色选择方法基于三种策略：颜色和谐度、颜色可区分度以及颜色名关系。

颜色的和谐度：该类方法一般是根据现有的一些和谐度模板来生成不同的调色板，如Adobe Color CC和COLOURLovers。虽然这些调色板是美学上令人满意的，但他们可能并不适用于需要较高区分度的可视化任务。

另一种根据和谐度生成调色板的方法是使用美学偏好。美学偏好和颜色和谐度通常被认为是一致的，尽管它们并不相同。Schloss和Palmer(K.B.Schloss and S.E.Palmer.Aesthetic response to color combinations:preference,harmony,and similarity.Attention,Perception,&Psychophysics,73(2):551–571,2011.doi:10.3758/s13414-010-0027-0)研究发现和谐的颜色是美观的，但却并没有将用户是否喜欢他们的组合考虑在内，而组合偏好被定义为“一个观察者有多么喜欢一对颜色搭配在一起。”基于这个研究他们拟合了一个线性回归模型用于组合偏好的评分。Gramazio等人(C.C.Gramazio,D.H.Laidlaw,and K.B.Schloss.Colorgorical:Creating discriminable and preferable color palettes for information visualization.IEEE Trans.Vis.&Comp.Graphics,23(1):521–530,2017.doi:10.1109/tvcg.2016.2598918)重新组织了这个模型，并使用它(Colorgorical)生成美观的调色板。

类区分度：该类方法一般是基于感知约束的一些原则，如颜色应当有较大的分离度，不应当互相竞争，应当是吸引人的。Healey(C.G.Healey.Choosing effective colours for data visualization.In Proc.IEEE Conf.on Visualization,pp.263–270,1996.doi:10.1109/visual.1996.568118)提出将蒙塞尔空间划分为10块色调区间，在每个区间选取一个有代表性的颜色，同时要满足所有颜色间的感知距离最大。但他有两个缺陷：a)他忽略了美观性；b)他受限于地理数据。Colorgorical克服了这两个缺陷，但他并没有将数据分布考虑在内，因此并不能很好的将给定数据区分开。

另一种设计区分度较高的调色板的方法是使用预先设计好的调色板，一个典型的例子是ColorBrewer，它是一个在线工具，用于选择调色板。尽管ColorBrewer提供了很多高质量的调色板，但它不允许用户做调整。Colorgorical允许用户通过指定想要的色调来生成调色板，但它并不考虑底层数据，因此无法为指定的类设计颜色。

颜色概念的关联：该类方法一般是根据某些颜色的语义信息来生成分类调色板。Lin等人(S.Lin,J.Fortuna,C.Kulkarni,M.Stone,and J.Heer.Selecting semantically-resonant colors for data visualization.Computer Graphics Forum,32(3pt4):401–410,2013.doi:10.1111/cgf.12127)提出了一种具有语义的颜色自动选择方法。然而在散点图中大多数类可能并没有清晰的语义。

(2)调色板颜色分配

这类方法一般是通过最大化多类散点图中的类分离度来分配调色板中的颜色到每个类上，以提高分析多类散点图的效率。Wang等人(Y.Wang,X.Chen,T. Ge,C.Bao,M.Sedlmair,C.-W.Fu,O.Deussen,and B.Chen.Optimizing color assignment for perception of class separability in multiclass scatterplots.IEEE Trans.Vis.&Comp.Graphics,25(1):820–829,2019.doi:10.1109/TVCG.2018.2864912)提出利用KNNG度量两个类之间的分离度实现对颜色的分配。然而他们的方法需要用户提供一个本身区分度较高的调色板。

(3)调色板颜色优化

此种方法是通过应用不同的原则，如数据理解、美观、能量保持和色盲等，实现对原始调色板颜色的优化。Lee等人(S.Lee,M.Sips,and H.-P.Seidel.Perceptually driven visibility optimization for categorical data visualization.IEEE Trans.Vis.&Comp.Graphics,19(10):1746–1757,2013.doi:10.1109/tvcg.2012.315)提出通过计算每个点的视觉显著程度来计算类分离度，并使用这种度量方式优化调色板得到了更好的类区分度。然而，这个方法的两个缺陷限制了它的可应用性：首先，它没有将颜色于背景的对比度考虑在内，导致优化结果不适应于所有场景。其次，它被设计用于地图数据的可视化，无法支持更多的分类信息可视化任务。不同于为一个特定可视化优化调色板，Fang等人(H.Fang,S.Walton,E.Delahaye,J.Harris,D.Storchak,and M.Chen.Categorical colormap optimization with visualization case studies.IEEE Trans.Vis.&Comp.Graphics,23(1):871–880,2017.doi:10.1109/tvcg.2016.2599214)提出一种最大化给定颜色间感知距离的方法，尽管这个方法可以结合不同的用户指定的约束，它并没有考虑数据分布，也因此会导致生成的可视化不能很好的展示不同类之间的数据结构。

发明内容

为克服上述现有技术的不足，本发明提供了一种基于数据分布的调色板生成方法及系统，适用于散点图、折线图和柱状图等分类数据的可视化，能够生成高可区分度的调色板，在考虑了数据分布的基础上，结合颜色的区分度和美观度，提高了数据可视化的效果，从而提升了可视分析的效率。

为实现上述目的，本发明的一个或多个实施例提供了如下技术方案：

一个或多个实施例提供了一种基于数据分布的调色板生成方法，包括以下步骤：

接收分类数据和颜色数据，所述颜色数据包括离散化的颜色空间；

将所述分类数据投影到可视空间，获取所述分类数据的位置信息；

基于所述位置信息度量类之间的分离度；

从离散化的颜色空间中随机选择多个颜色作为初始解，结合类之间的分离度，基于模拟退火算法快速寻找近似最优解，生成调色板；

基于所述调色板渲染分类数据。

一个或多个实施例提供了一种基于数据分布的调色板生成系统，包括：

数据加载模块，接收分类数据和颜色数据，所述颜色数据包括离散化的颜色空间；

数据分布确定模块，将所述分类数据投影到可视空间，获取所述分类数据的位置信息；

分离度度量模块，基于所述位置信息度量类之间的分离度；

调色板优化模块，从离散化的颜色空间中随机选择多个颜色作为初始解，结合类之间的分离度，基于模拟退火算法寻找近似最优解，生成调色板；

数据渲染模块，基于所述调色板渲染分类数据。

一个或多个实施例提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现所述的一种基于数据分布的调色板生成方法。

一个或多个实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现所述的一种基于数据分布的调色板生成方法。以上一个或多个技术方案存在以下有益效果：

本发明在获取了分类数据分布的基础上，采用模拟退火算法自动生成调色板，在考虑了数据分布的基础上，结合颜色的区分度和美观度，提高了数据可视化的效果，从而提升了可视分析的效率。

附图说明

构成本发明的一部分的说明书附图用来提供对本发明的进一步理解，本发明的示意性实施例及其说明用于解释本发明，并不构成对本发明的不当限定。

图1为本发明一个或多个实施例中基于数据分布的调色板生成方法流程图；

图2(a)-2(d)分别为本发明一个或多个实施例中模拟退火一次迭代过程初始化、迭代30次、150次和最终的示意图；

图3(a)-3(d)分别为本发明一个或多个实施例中权重λ＝0、λ＝0.3、λ＝0.6和λ＝1.0的结果示意图；

图4(a)-4(d)分别为本发明一个或多个实施例中扰动概率为0.1、0.5、0.8和1.0的结果示意图；

图5(a)-5(f)分别为本发明一个或多个实施例中不同权重设置效果示意图；

图6(a)-6(b)为本发明一个或多个实施例中直方图与折线图的计算示意图；

图7(a)-7(d)为本发明一个或多个实施例中直方图与折线图的效果示意图。

具体实施方式

应该指出，以下详细说明都是示例性的，旨在对本发明提供进一步的说明。除非另有指明，本文使用的所有技术和科学术语具有与本发明所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是，这里所使用的术语仅是为了描述具体实施方式，而非意图限制根据本发明的示例性实施方式。如在这里所使用的，除非上下文另外明确指出，否则单数形式也意图包括复数形式，此外，还应当理解的是，当在本说明书中使用术语“包含”和/或“包括”时，其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

在不冲突的情况下，本发明中的实施例及实施例中的特征可以相互组合。

实施例一

本实施例提供了一种基于数据分布的调色板生成方法，如图1所示，具体包括以下步骤：

步骤1：加载分类数据和颜色数据，颜色数据包含离散化的LAB颜色空间。

所述分类数据为散点图、折线图和柱状图等。

加载颜色数据的同时会剔除一些大部分用户不喜欢的颜色，如亮度小于35或者亮度大于95的颜色，亮度在35到75之间并且色调在85到114之间的颜色，这些颜色大部分是黄绿色。

步骤2：将分类数据投影到可视空间(屏幕空间)，获取所述分类数据的位置数据。

当所述分类数据为散点图时，获取各类散点中每个点的位置；

当所述分类数据为柱状图时，获取各柱形的几何中心的位置，如图6(a)所示；

当所述分类数据为折线图时，按设定间隔对图中的折线进行离散，获取各条折线中每个离散点的位置，如图6(b)所示。

步骤3：计算类分离度。

本实施例中，结合对密度敏感的K近邻图(K-Nearest Neighbor Graph，KNNG)和距离一致性(Dsitance Consistencty，DSC)方法对类分离度进行度量：分别基于KNNG和DSC计算类之间的不分离度，将两个不分离度进行线性加权组合得到任意两个类之间的不分离度，并且其中所涉及的权重可由用户根据需求进行调整。具体包括：

计算两个类C _i和C _j的基于KNNG的不分离程度：

其中n _i表示C _i类中点的数量，Ω(x _s)表示点x _s的所有邻居；当x _t的类标签为j 时，δ(l(x _t)，j)＝1，否则为0；

是两个点之间的欧式距离。两个互相交叉的类会得到一个较大的不分离度，表示他们之间的颜色差异应变大。需要注意的是kns(C _i，C _j)与kns(C _j，C _i)不同，因此我们需要把它们都计算在内。

然而，“KNNG距离”仅计算相邻有交集的两个类的距离，而不计算其它类的距离，这可能导致没有交集的两个类被赋予了相似的颜色，如图2a所示，为了解决这个问题，我们引入了基于类中心的“DSC距离”。

假设类C _i，C _j的中心分别为μ _i，μ _j，计算每个点

到第i个类的距离：

其中，a(x _i)是类内距离，b(x _i)是类间距离，通过结合类内距离和类间距离，我们获得了类的密度分布，只有“DSC距离”的效果如图2d所示。

将基于KNNG和DSC的不分离度按比例组合，我们得到：

ns(C _i，C _j)＝λdns(C _i，C _j)+(1-λ)kns(C _i，C _j)

ns(C _i，C _j)就是我们最终获得的任意两个类之间的不分离程度。λ是一个可由用户调整的权重(不同λ的效果如图2所示，可以看出，当只有KNNG时会产生较多相似的颜色，而只有DSC时交叉类的对比度较弱)，不同λ权重效果如图3(a)-3(d)所示。

步骤4：使用模拟退火算法快速寻找近似最优解，用户通过设置权重影响最终结果，如图5(a)-5(f)。

具体过程如下所述：

步骤4.1：从离散化的颜色空间中随机选择m个颜色组成初始解(m为数据中类的数量)，设置初始温度、降温系数与最低温度，一次完整的迭代过程如图2(a)-2(d)所示。

步骤4.2：如果当前温度大于最低温度，执行下一步，否则退出迭代，返回最终结果。

步骤4.3：对初始解进行随机扰动获得一个新解。考虑到完全随机扰动难以在有限时间内得到最优解，在随机概率小于0.5时对颜色进行随机扰动，不同随机概率的效果如图4(a)-4(d)所示，大于等于0.5时，对颜色的扰动遵循以下原则：新的颜色要使得当前的调色板评分更高。

步骤4.4：检查新解中所有颜色是否均满足较大的JND要求，如果不满足，对颜色进行扰动直到满足；如果在当前JND无法找到符合条件的调色板(颜色差异较大)，调整颜色使得JND减小直到JND无法减小，退出迭代，返回当前解。JND的计算方法具体可参见“Just Noticeable Difference，M.Stone,D.A.Szafir,and V.Setlur.An engineering model for color difference as a function of size.In Color and Imaging Conference,vol.2014,pp.253–258.Society for Imaging Science and Technology,2014”。

步骤4.5：对当前解进行评分，具体评分函数如下所述：

(1)美观性评分：我们使用颜色组合偏好(Pair Preference)和饱和度方差(Saturation Variance)来度量调色板的美观性，具体如下：

a.颜色组合偏好是指人们对于颜色组合的喜好程度，Schloss和Palmer(K.B.Schloss and S.E.Palmer.Aesthetic response to color combinations:preference,harmony,and similarity.Attention,Perception,&Psychophysics,73(2):551–571,2011.doi:10.3758/s13414-010-0027-0)从实验数据中发现了一个线性回归模型用于预测用户对于颜色组合的喜欢程度，主要由三个因子组成：冷度(coolness，κ)，色度相似性(hue similarity，ΔH)以及亮度对比度(lightness contrast，ΔL):

PP(c ₁，c ₂)＝75.15(κ ₁，κ ₁)+47.61|ΔL|-46.42|ΔH|

通过以上公式计算离散化LAB颜色空间得到的所有颜色间的颜色偏好程度组成最终的颜色偏好矩阵。

b.饱和度方差是指给定调色板中所有颜色的饱和度方差。给定一个调色板P＝{c ₁，...，c _m}，

其中S(c _i)表示颜色c _i的饱和度，μ表示整个调色板的饱和度平均值。

(2)可区分度评分：我们使用颜色名差异(Name Difference)、类区分度(Class Discriminability)和背景对比度(Contrast with Background)来度量调色板和最终可视化效果的可区分度，具体如下：

a.颜色名差异(Name Difference，ND)是指两个颜色间颜色名的差异，因为两个感知差异大的颜色可能具有相同的颜色名，如紫罗兰色和靛蓝色都属于紫色，但它们的感知距离很大，为了使得生成的调色板有更多不同的颜色，我们引入了Name Difference(J.Heer and M.Stone.Color naming models for color selection,image editing and palette design.In ACM Human Factors in Computing Systems(CHI),pages 1007–1016,New York,NY,USA,2012.ACM.)。具体计算方式为：

其中c为给定颜色，T为一个有C行W列的颜色名关联矩阵。

本实施例中，颜色名关联矩阵及颜色组合偏好矩阵均预先构建好以供后续调用。

b.类区分度(Class Discriminability，CD)表示两个类之间的类分离度，我们使用CIEDE2000颜色差异来度量两个颜色间的感知距离，并将感知距离与不分离度结合起来组成类分离度：

其中，Δε(c _i，c _j)表示CIEDE 2000距离，ns(C _i，C _j)表示两个类C _i，C _j的不分离程度。

c.背景对比度(Contrast with Background，CB)是指每个类与背景的对比度。Ware等人(C.Ware.Information visualization:perception for design.Elsevier,2012.)的研究发现，有较大交叉的类应该被赋予具有更大对比度的颜色以提升可读性。具体如下：

其中c _i表示类C _i的颜色，ΔL(c _i，c ₀)表示c _i与背景色c ₀的亮度差异。

综上，我们将最终的评分函数E(P)定义为：

E(P)＝ω ₁CD(C，P)+ω ₂CB(C，P，c ₀)+ω ₃ND(P)+ω ₄PP(P)+ω ₅SV(P)

其中，ω ₁～ω ₅为用户定义的权重系数，如图5(a)-5(f)所示，图5(a)和5(d)为使用高Class Visibility和高Name Difference生成的结果，图5(b)和5(e)为使用高Pair Preference和高Contrast with Background生成的，图5(c)中调色板的Saturation Variance较小，图5(f)中SV较大。

步骤4-6：如果当前解的评分优于上一个解，则对当前解做颜色分配，将当前解所对应的多个颜色分配到各个类中，以获取更好的结果，具体过程如下：

(1)颜色分配：将当前解所对应的多个颜色的分配进行优化，具体计算方法为：

计算点的区分度(Point Distinctness)：

其中，C _r＝τ(l(x _i))，C _S＝τ(l(x _j))分别表示x _i，x _j的颜色，Ω _i为点x _i的k个邻居的集合，Δε为CIEDE2000距离矩阵，g(d(x _i，x _j))是基于两点之间距离的函数，目的是使得较近的点赋予较大的权重，g(d)＝1/d。

计算点与背景的对比度(Point contrast with background)：

其中，ΔL(C _r，C _b)为点与背景色的亮度的差值，C _b为背景颜色，ns(x _i)为基于点位置的不分离程度。

最终的目标函数为：

其中λ为权重系数，在这里设置λ＝0.3。

所述颜色分配的优化方法可参见“Y.Wang,X.Chen,T.Ge,C.Bao,M.Sedlmair,C.-W.Fu,O.Deussen,and B.Chen.Optimizing color assignment for perception of class separability in multiclass scatterplots.IEEE Trans.Vis.&Comp.Graphics,25(1):820–829,2019”。

(2)如果颜色重新分配的结果优于当前解，则将此结果赋予当前解，否则进行下一步。

步骤4-7：如果当前解的评分差于上一个解，则以概率exp(ΔE/T _t)接受当前解，其中，ΔE表示当前解与上一个解的评分之差，T _t为当前温度。

步骤4-8：温度降低，返回步骤4-2继续迭代。

步骤5：利用生成的调色板渲染数据。

实施例二

本实施例的目的是提供一种基于数据分布的调色板生成系统。

为了实现上述目的，本实施例提供了一种基于数据分布的调色板生成系统，包括：

分离度度量模块，基于所述位置信息度量类之间的分离度；

数据渲染模块，基于所述调色板渲染分类数据。

实施例三

本实施例的目的是提供一种电子设备。

为了实现上述目的，本实施例提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现以下步骤，包括：

基于所述位置信息度量类之间的分离度；

从离散化的颜色空间中随机选择多个颜色作为初始解，结合类之间的分离度，基于模拟退火算法寻找近似最优解，生成调色板；

基于所述调色板渲染分类数据。

实施例四

本实施例的目的是提供一种计算机可读存储介质。

为了实现上述目的，本实施例提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时执行以下步骤：

基于所述位置信息度量类之间的分离度；

基于所述调色板渲染分类数据。

以上实施例二、三和四中涉及的各步骤与实施例一相对应，具体实施方式可参见实施例一的相关说明部分。术语“计算机可读存储介质”应该理解为包括一个或多个指令集的单个介质或多个介质；还应当被理解为包括任何介质，所述任何介质能够存储、编码或承载用于由处理器执行的指令集并使处理器执行本发明中的任一方法。

以上一个或多个实施例具有以下技术效果：

本发明采用模拟退火算法自动求解最优的调色板颜色组合，其中对于解的评分结合了用户的颜色喜好、颜色饱和度方差、颜色名差异、类分离度和与背景的对比度，能够得到一个兼顾美观和颜色区分度的调色板，使得可视化效果更加合理，且符合人类感知，用户体验好。

本发明在计算类分离度时设置了用户可调的权重系数，通过对该系数进行调整，能够生成偏向分离度和符合用户喜好的可视化结果；

本发明的调色板生成方法可适用于各类分类数据，包括但不限于散点图、折线图和柱状图等。

本领域技术人员应该明白，上述本发明的各模块或各步骤可以用通用的计算机装置来实现，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。本发明不限制于任何特定的硬件和软件的结合。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

上述虽然结合附图对本发明的具体实施方式进行了描述，但并非对本发明保护范围的限制，所属领域技术人员应该明白，在本发明的技术方案的基础上，本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

Claims

一种基于数据分布的调色板生成方法，其特征在于，包括以下步骤：

接收分类数据和颜色数据，所述颜色数据包括离散化的颜色空间；

将所述分类数据投影到可视空间，获取所述分类数据的位置信息；

基于所述位置信息度量类之间的分离度；

从离散化的颜色空间中随机选择多个颜色作为初始解，结合类之间的分离度，基于模拟退火算法寻找近似最优解，生成调色板；

基于所述调色板渲染分类数据。
如权利要求1所述的一种基于数据分布的调色板生成方法，其特征在于，所述分类数据为散点图、折线图或柱状图；获取所述分类数据的位置信息包括：

当所述分类数据为散点图时，获取各类散点中每个点的位置；

当所述分类数据为折线图时，按设定间隔对图中的折线进行离散，获取各条折线中每个离散点的位置；

当所述分类数据为柱状图时，获取各柱形的几何中心的位置。
如权利要求1所述的一种基于数据分布的调色板生成方法，其特征在于，所述基于模拟退火算法寻找近似最优解包括：

(1)从离散化的颜色空间中随机选择多个颜色组成初始解，颜色个数与分类数据的类别数目相同，并设置初始温度、降温系数与最低温度；

(2)如果当前温度大于最低温度，执行步骤(3)，否则退出迭代，输出当前解；

(3)对初始解进行随机扰动获得新解；

(4)检查新解中所有颜色的差别感觉阈限是否大于预设阈值，如果不满足，对颜色进行扰动直到满足；如果在当前差别感觉阈限下无法找到颜色差异符合要求的调色板，调整颜色使得差别感觉阈限减小直至差别感觉阈限无法减小，退出迭代，返回当前解；

(5)对当前解进行评分；如果当前解的评分优于上一个解，则对当前解做颜色分配；如果当前解的评分差于上一个解，则以一定概率接受当前解；

(6)温度降低，返回步骤(2)。
如权利要求3所述的一种基于数据分布的调色板生成方法，其特征在于，所述步骤(3)和(5)中的评分方法包括：

采用颜色组合偏好和饱和度方差对调色板进行美观性评分；

采用颜色名差异、类分离度和与背景的对比度进行调色板的可区分度评分；

对颜色组合偏好、饱和度方差、颜色名差异、类分离度和与背景的对比度进行线性加权得到调色板最终评分。
如权利要求4所述的一种基于数据分布的调色板生成方法，其特征在于，所述类分离度计算方法为：

计算两个类C _i和C _j的基于K近邻图的不分离程度：

其中n _i表示C _i类中点的数量，Ω(x _s)表示点x _s的所有邻居；当x _t的类标签为j时，δ(l(x _t)，j)＝1，否则为0；
是两个点之间的欧式距离；

计算两个类C _i和C _j的基于距离一致性的不分离程度：

其中，类C _i，C _j的中心分别为μ _i，μ _j，计算每个点
到第i个类的类内距离a(x _i)和类间距离b(x _i)：

将基于K近邻图和距离一致性的不分离度按比例组合：

ns(C _i，C _j)＝λdns(C _i，C _j)+(1-λ)kns(C _i，C _j)，

λ为用户可调整的权重；

类分离度计算方法为：

其中，Δε(c _i，c _j)表示两个颜色间的感知距离。
如权利要求3所述的一种基于数据分布的调色板生成方法，其特征在于，所述步骤(5)中颜色分配包括：

将当前解所对应的多个颜色分配到各个类并进行优化；

如果颜色重新分配的结果优于当前解，则将此结果赋予当前解，否则进行步骤(6)。
一种基于数据分布的调色板生成系统，其特征在于，包括：

数据加载模块，接收分类数据和颜色数据，所述颜色数据包括离散化的颜色空间；

数据分布确定模块，将所述分类数据投影到可视空间，获取所述分类数据的位置信息；

分离度度量模块，基于所述位置信息度量类之间的分离度；

调色板优化模块，从离散化的颜色空间中随机选择多个颜色作为初始解，结合类之间的分离度，基于模拟退火算法寻找近似最优解，生成调色板；

数据渲染模块，基于所述调色板渲染分类数据。
一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述程序时实现如权利要求1-6任一项所述的一种基于数据分布的调色板生成方法。
一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现如权利要求1-6任一项所述的一种基于数据分布的调色板生成方法。