CN107729424B

CN107729424B - 一种数据可视化方法及设备

Info

Publication number: CN107729424B
Application number: CN201710899509.8A
Authority: CN
Inventors: 吴斐然; 怀宝兴
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Cloud Computing Technologies Co Ltd
Priority date: 2017-09-28
Filing date: 2017-09-28
Publication date: 2021-07-09
Anticipated expiration: 2037-09-28
Also published as: CN107729424A

Abstract

本发明实施例公开了一种数据可视化方法及设备，该包括：设备获取M个分析对象中每个分析对象各自的第一真实评分和各自的特征向量，根据所述每个分析对象各自的第一真实评分和各自的特征向量训练出第一评分模型，进而，设备向第一评分模型输入N个分析对象的特征向量，以通过该第一评分模型分析出该N个分析对象中每个分析对象的第一测试评分，进而，设备通过N个图形元素表示该N个分析对象，可视化该N个分析对象的测试评分。通过实施本发明实施例所述的方法，可实现对N个分析对象中隐含数据的可视化，满足用户对于隐含数据可视化的需求。

Description

一种数据可视化方法及设备

技术领域

本发明涉及人工智能领域，尤其涉及一种数据可视化方法及设备。

背景技术

随着互联网技术的快速发展，大数据也随之产生。对大数据查询和分析对于人们能否及时获得决策信息非常重要。不管是对于个人还是团体、企业等，都存在着海量的业务数据、交易数据、第三方来源数据等。对于上述大数据，用户有着提取有价值的信息的需求。例如在社交网络中，个体与个体之间会发生私信、评论、转发等交互行为，这些交互行为可以被视为社交网络中个体之间的关系，两个个体之间产生的交互行为越多，表示两者的联系越紧密。联系亲密的多个个体构成社团。社团内的个体即为社团的成员。目前，对于社团或个体的分析广泛应用于组织通信行为分析、商业广告定向投放、犯罪网络研究、国家贸易关系分析等领域。

然而，现有技术中社团或个体的可视化展示仅限于对社团或个体已知数据的展示。

发明内容

本发明实施例提供一种数据可视化方法及设备，可以实现对社团或个体未知数据的可视化，将用户关注的对象突出显示。

第一方面，本发明实施例提供了数据可视化方法，包括：设备获取样本数据中M个分析对象中每个分析对象各自的第一真实评分和各自的特征向量，根据所述每个分析对象各自的第一真实评分和各自的特征向量训练出第一评分模型，进而，设备向第一评分模型输入测试数据中N个分析对象的特征向量，以通过该第一评分模型分析出该N个分析对象中每个分析对象的第一测试评分，进而，设备通过N个图形元素表示该N个分析对象，可视化该N个分析对象的测试评分。其中，第一真实评分和第一测试评分用于表征对分析对象的分析结果；目标分析对象的特征向量至少包含第一特征因子和第二特征因子，第一特征因子用于描述目标分析对象的特征，第二特征因子用于描述与目标分析对象存在第一关联关系的分析对象的特征；目标分析对象为上述M个分析对象或上述N个分析对象中的任意一个分析对象；N个图形元素与N个分析对象一一对应；M为正整数，N为正整数。

通过执行上述方法，设备通过样本数据训练第一评分模型，在将测试数据中N个分析对象的特征向量输入到第一评分模型可以计算出该N个分析对象的特征向量对应的第一测试评分，进而可视化该第一测试评分，从而实现对N个分析对象中隐含数据的可视化，满足用户对于隐含数据可视化的需求。

在一种可能的实现方式中，该目标分析对象的特征向量还包括第三特征因子，该第三特征因子用于描述针对目标分析对象进行操作时产生的人机交互信息。

通过执行上述方法，增加特征向量中的项，使得用户操作的人机交互信息参与到第一测试评分的计算，使得分析出的第一测试评分更加准确。

在又一种可能的实现方式中，设备可视化所述N个分析对象的评分的一种实施方式可以是：设备根据所述N个分析对象的第一测试评分分别设置该N个分析对象各自对应的图形元素的尺寸或颜色，形成可视化图像。

在又一种可能的实现方式中，设备通过N个图形元素表示所述N个分析对象一种实施方式可以是：设备以预设排列顺序依次设置所述N个图形元素的位置，使得按照所述预设排列顺序依次连接的所述N个图形元素的几何中心所形成的曲线呈螺旋状；其中，第K个图形元素对应第K个分析对象，所述第K个图形元素与所述第K-1个图形元素以及所述第K+1个图形元素相邻，，K为正整数，K≤N。

通过执行上述方法，设备以螺旋形分布N个分析对象对应的图像元素，提高空间利用率，提高用户体验。

在又一种可能的实现方式中，设备通过N个图形元素表示N个分析对象，可视化该N个分析对象的第一测试评分之后，设备还可以根据所述N个分析对象中每个分析对象的第一测试评分确定评分最高的前Q个分析对象，进而，设备输出该前Q个分析对象对应的图形元素以及可视化的该前Q个分析对象的第一测试评分。

通过执行上述方法，设备选择第一测试评分高的前Q个分析对象进行可视化输出，仅显示用户关心的分析对象，避免了终端分析对象同时输出造成的视觉遮挡，提高用户体验。

在又一种可能的实现方式中，设备根据N个分析对象中每个分析对象的评分确定第一测试评分最高的前Q个分析对象之前，设备还可以接收输入的缩放倍数，根据所述N个分析对象的总数以及缩放倍数调节Q值。

通过执行上述方法，实现Q值的动态变化，以及可视化所形成的可视化图像的动态展示。

在又一种可能的实现方式中，设备根据M个分析对象中每个分析对象各自的评分和各自的特征向量训练第一评分模型的一种实施方式包括：设备构建第一评分模型，根据M个分析对象中每个分析对象各自的评分和各自的特征向量，计算所述第一评分模型的损失函数，通过使所述损失函数最小化，确定所述第一评分模型。

在又一种可能的实现方式中，第一评分模型S_k＝f(v_k；ω)，其中，S_k为第k分析对象的测试评分，v_k为第k分析对象的特征向量，v_k包括第k分析对象在至少一个维度上的特征信息；ω为权重参数，ω用于指示各个维度上的特征信息的各自权重；第k分析对象的损失函数为L(S_k,f(v_k；ω)；设备通过使所述损失函数最小化，确定所述第一评分模型的一种实施方式可以是：设备获取初始权重ω⁽⁰⁾，设备将ω⁽⁰⁾输入到最小化目标函数

并进行迭代计算，若ω⁽ⁱ⁾与ω^(i-1)之差不大于第一阈值，则输出ω⁽ⁱ⁾；令ω为输出的ω⁽ⁱ⁾，确定所述第一评分模型。其中，ω⁽ⁱ⁾为第i次迭代计算得到的权重参数；

为损失项，λΩ(ω^(i-1))为正则项；ω^(i-1)为第i-1次迭代计算得到的权重参数；i为大于1的正整数。

在又一种可能的实现方式中，设备获取初始权重ω⁽⁰⁾的一种实施方式可以是：设备构建线性加权模型S_k＝g(v_k,ω₀)；将目标分析对象的第一真实评分和目标分析对象的特征向量输入到线性加权模型，计算ω⁽⁰⁾。

在又一种可能的实现方式中，

L(S'_k,f(v_k；ω))＝-logP(f(v_k；ω)|S'_k)；

其中，v_k包括第k分析对象在l个维度上的特征信息，v_k＝(v_k1,v_k2…v_kl)；ω＝(ω₁,ω₂…ω_l)ω^Tv_k＝ω₁·v_k1+ω₂·v_k2+…+ω_l·v_kl。

在又一种可能的实现方式中，每个分析对象包含多个分析节点；该方法还包括：

设备获取样本数据中R个分析节点各自的第二真实评分和各自的特征向量；

设备根据R个分析节点各自的第二真实评分和各自的特征向量训练出第二评分模型；

设备向该第二评分模型输入测试数据中S个分析节点的特征向量，以通过所述第二评分模型分析出所述S个分析节点中每个分析节点的第二测试评分；

设备通过S个图形元素表示该S个分析节点，可视化该S个分析节点的第二测试评分；

其中，第二真实评分和第二测试评分用于表征对分析节点的分析结果；目标分析节点的特征向量至少包含第四特征因子和第五特征因子，第四特征因子用于描述目标分析节点的特征，第五特征因子用于描述与目标分析节点存在第二关联关系的节点的特征；目标分析节点为R个分析节点或S个分析节点中的任意一个分析节点；R为正整数，S为正整数。

通过执行上述方法，设备通过样本数据训练第二评分模型，在将测试数据中S个分析节点的特征向量输入到第二评分模型可以计算出该S个分析节点的特征向量对应的第二测试评分，进而可视化该第二测试评分，从而实现对S个分析节点中隐含数据的可视化，满足用户对于隐含数据可视化的需求。

在又一种可能的实现方式中，该方法还包括：设备可视化所述S个研究对象之间的所述第二关联关系。

在又一种可能的实现方式中，该方法还包括：设备根据该第K分析对象中包含的每个分析节点的第二测试评分确定第K分析对象中评分最高的前P个分析节点，设备输出前P个分析节点对应的图形元素以及可视化的前P个分析节点的第二测试评分。

在又一种可能的实现方式中，设备根据第K分析对象中包含的每个分析节点的第二测试评分确定所述第K分析对象中评分最高的前P个分析节点之前，设备可以接收输入的缩放倍数，并根据第K分析对象所包含的分析节点的总数、第K分析对象对应的图形元素的尺寸和缩放倍数调节P值。

通过执行上述方法，实现P值的动态变化，以及可视化所形成的可视化图像的动态展示。

在又一种可能的实现方式中，该方法还包括：设备接收针对第T分析对象对应的第T图形元素输入的选定操作；T为不大于N的正整数；设备输出第T分析对象对应的可视化界面，其中，第T分析对象对应的可视化界面包括所述第T分析对象对应的图形元素，第T分析对象所包含的分析节点对应的图形元素和第二测试评分，以及第T分析对象所包含的分析节点之间的第二关联关系。

第二方面，本发明实施例还提供了一种数据可视化设备，所述设备包括：

获取单元，用于获取M个分析对象中每个分析对象各自的第一真实评分和各自的特征向量；

第一评分模型训练单元，用于：根据所述每个分析对象各自的第一真实评分和各自的特征向量训练出第一评分模型；

第一分析单元，用于向所述第一评分模型输入N个分析对象的特征向量，以通过所述第一评分模型分析出所述N个分析对象中每个分析对象的第一测试评分；

可视化单元，用于通过N个图形元素表示所述N个分析对象，可视化所述N个分析对象的测试评分；

其中，所述第一真实评分和所述第一测试评分用于表征对所述分析对象的分析结果；目标分析对象的特征向量至少包含第一特征因子和第二特征因子，所述第一特征因子用于描述所述目标分析对象的特征，所述第二特征因子用于描述与所述目标分析对象存在第一关联关系的分析对象的特征；所述目标分析对象为所述M个分析对象或所述N个分析对象中的任意一个分析对象；所述N个图形元素与所述N个分析对象一一对应；M为正整数，N为正整数。

在一种可能的实现方式中，，所述目标分析对象的特征向量还包括第三特征因子，所述第三特征因子用于描述针对所述目标分析对象进行操作时产生的人机交互信息。

在又一种可能的实现方式中，所述可视化单元可视化所述N个分析对象的评分，具体包括：

根据所述N个分析对象的第一测试评分分别设置所述N个分析对象各自对应的图形元素的尺寸或颜色，形成可视化图像。

在又一种可能的实现方式中，所述可视化单元通过N个图形元素表示所述N个分析对象，具体包括：

以预设排列顺序依次设置所述N个图形元素的位置，使得按照所述预设排列顺序依次连接的所述N个图形元素的几何中心所形成的曲线呈螺旋状；其中，

所述第K个图形元素对应第K个分析对象，所述第K个图形元素与所述第K-1个图形元素以及所述第K+1个图形元素相邻。

在又一种可能的实现方式中，所述可视化单元还用于：

根据所述N个分析对象中每个分析对象的第一测试评分确定评分最高的前Q个分析对象；

输出所述前Q个分析对象对应的图形元素以及可视化的所述前Q个分析对象的第一测试评分。

在又一种可能的实现方式中，所述可视化单元还用于：

接收输入的缩放倍数；

根据所述N个分析对象的总数以及所述缩放倍数调节Q值。

在又一种可能的实现方式中，所述第一评分模型训练单元具体用于：

构建第一评分模型；

根据所述每个分析对象各自的评分和各自的特征向量，计算所述第一评分模型的损失函数；

通过使所述损失函数最小化，确定所述第一评分模型。

在又一种可能的实现方式中，所述第一评分模型S_k＝f(v_k；ω)，其中，S_k为第k分析对象的测试评分，v_k为第k分析对象的特征向量，v_k包括第k分析对象在至少一个维度上的特征信息；ω为权重参数，ω用于指示各个维度上的特征信息的各自权重；所述第k分析对象的损失函数为L(S_k,f(v_k；ω)；所述第一评分模型训练单元执行所述通过使所述损失函数最小化，确定所述第一评分模型，具体包括：

获取初始权重ω⁽⁰⁾

将ω⁽⁰⁾输入到最小化目标函数

并进行迭代计算，若ω⁽ⁱ⁾与ω^(i-1)之差不大于第一阈值，则输出ω⁽ⁱ⁾；

令ω为输出的ω⁽ⁱ⁾，确定所述第一评分模型；

其中，ω⁽ⁱ⁾为第i次迭代计算得到的权重参数；

在又一种可能的实现方式中，所述第一评分模型训练单元执行所述获取初始权重ω⁽⁰⁾，具体包括：

构建线性加权模型S_k＝g(v_k,ω₀)；

将所述目标分析对象的第一真实评分和所述目标分析对象的特征向量输入到所述线性加权模型，计算ω⁽⁰⁾。

在又一种可能的实现方式中，L(S'_k,f(v_k；ω))＝-logP(f(v_k；ω)|S'_k)；

在又一种可能的实现方式中，每个分析对象包含多个分析节点；

所述获取单元还用于：获取R个分析节点各自的第二真实评分和各自的特征向量；

所述设备还包括：第二评分模型训练单元，用于根据所述R个分析节点各自的第二真实评分和各自的特征向量训练出第二评分模型；以及，第二分析单元，用于向所述第二评分模型输入S个分析节点的特征向量，以通过所述第二评分模型分析出所述S个分析节点中每个分析节点的第二测试评分；

所述可视化单元还用于：通过S个图形元素表示所述S个分析节点，可视化所述S个分析节点的第二测试评分；

其中，所述第二真实评分和所述第二测试评分用于表征对所述分析节点的分析结果；目标分析节点的特征向量至少包含第四特征因子和第五特征因子，所述第四特征因子用于描述所述目标分析节点的特征，所述第五特征因子用于描述与所述目标分析节点存在第二关联关系的节点的特征；所述目标分析节点为所述R个分析节点或所述S个分析节点中的任意一个分析节点；R为正整数，S为正整数。

在又一种可能的实现方式中，所述可视化单元还用于：

可视化所述S个研究对象之间的所述第二关联关系。

在又一种可能的实现方式中，所述可视化单元还用于：

根据所述第K分析对象中包含的每个分析节点的第二测试评分确定所述第K分析对象中评分最高的前P个分析节点；

输出所述前P个分析节点对应的图形元素以及可视化的所述前P个分析节点的第二测试评分。

在又一种可能的实现方式中，所述可视化单元还用于：

接收输入的缩放倍数，并根据所述第K分析对象所包含的分析节点的总数、所述第K分析对象对应的图形元素的尺寸和所述缩放倍数调节P值。

在又一种可能的实现方式中，所述可视化单元还用于：

接收针对第T分析对象对应的第T图形元素输入的选定操作；T为不大于N的正整数；

输出第T分析对象对应的可视化界面，其中，所述第T分析对象对应的可视化界面包括所述第T分析对象对应的图形元素，所述第T分析对象所包含的分析节点对应的图形元素和第二测试评分，以及所述第T分析对象所包含的分析节点之间的所述第二关联关系。

第三方面，本发明实施例还提供了一种数据可视化设备，所述设备包括处理器和存储器：该存储器用于存储数据和程序；该处理器调用该存储器中的程序，用于执行如下操作：

获取M个分析对象中每个分析对象各自的第一真实评分和各自的特征向量；

根据所述每个分析对象各自的第一真实评分和各自的特征向量训练出第一评分模型；

向所述第一评分模型输入N个分析对象的特征向量，以通过所述第一评分模型分析出所述N个分析对象中每个分析对象的第一测试评分；

通过N个图形元素表示所述N个分析对象，可视化所述N个分析对象的测试评分；

在一种可能的实现方式中，所述目标分析对象的特征向量还包括第三特征因子，所述第三特征因子用于描述针对所述目标分析对象进行操作时产生的人机交互信息。

在又一种可能的实现方式中，所述处理器执行所述可视化所述N个分析对象的评分，具体包括：根据所述N个分析对象的第一测试评分分别设置所述N个分析对象各自对应的图形元素的尺寸或颜色，形成可视化图像。

在又一种可能的实现方式中，所述处理器执行所述通过N个图形元素表示所述N个分析对象，具体包括：以预设排列顺序依次设置所述N个图形元素的位置，使得按照所述预设排列顺序依次连接的所述N个图形元素的几何中心所形成的曲线呈螺旋状；其中，

第K个图形元素对应第K个分析对象，所述第K个图形元素与第K-1个图形元素以及第K+1个图形元素相邻。

在又一种可能的实现方式中，所述处理器执行所述通过N个图形元素表示所述N个分析对象，可视化所述N个分析对象的第一测试评分之后，所述处理器还用于执行：

在又一种可能的实现方式中，所述处理器执行所述根据所述N个分析对象中每个分析对象的评分确定第一测试评分最高的前Q个分析对象之前，所述处理器还用于执行：

接收输入的缩放倍数；

根据所述N个分析对象的总数以及所述缩放倍数调节Q值。

在又一种可能的实现方式中，所述处理器执行所述根据所述每个分析对象各自的评分和各自的特征向量训练第一评分模型，具体包括：

构建第一评分模型；

通过使所述损失函数最小化，确定所述第一评分模型。

在又一种可能的实现方式中，所述第一评分模型S_k＝f(v_k；ω)，其中，S_k为第k分析对象的测试评分，v_k为第k分析对象的特征向量，v_k包括第k分析对象在至少一个维度上的特征信息；ω为权重参数，ω用于指示各个维度上的特征信息的各自权重；所述第k分析对象的损失函数为L(S_k,f(v_k；ω)；所述处理器执行所述通过使所述损失函数最小化，确定所述第一评分模型，具体包括：

获取初始权重ω⁽⁰⁾

将ω⁽⁰⁾输入到最小化目标函数

令ω为输出的ω⁽ⁱ⁾，确定所述第一评分模型；

其中，ω⁽ⁱ⁾为第i次迭代计算得到的权重参数；

在又一种可能的实现方式中，所述处理器执行所述获取初始权重ω⁽⁰⁾，具体包括：

构建线性加权模型S_k＝g(v_k,ω₀)；

在又一种可能的实现方式中，

L(S'_k,f(v_k；ω))＝-logP(f(v_k；ω)|S'_k)；

在又一种可能的实现方式中，每个分析对象包含多个分析节点；所述处理器还用于执行：

获取R个分析节点各自的第二真实评分和各自的特征向量；

根据所述R个分析节点各自的第二真实评分和各自的特征向量训练出第二评分模型；

向所述第二评分模型输入S个分析节点的特征向量，以通过所述第二评分模型分析出所述S个分析节点中每个分析节点的第二测试评分；

通过S个图形元素表示所述S个分析节点，可视化所述S个分析节点的第二测试评分；

在又一种可能的实现方式中，所述处理器还用于执行：可视化所述S个研究对象之间的所述第二关联关系。

在又一种可能的实现方式中，所述处理器还用于执行：

在又一种可能的实现方式中，所述处理器执行所述根据所述第K分析对象中包含的每个分析节点的第二测试评分确定所述第K分析对象中评分最高的前P个分析节点之前，所述处理器还用于执行：

在又一种可能的实现方式中，所述处理器还用于执行：

第四方面，本发明实施例还提供了一种计算机可读存储介质，该计算机可读存储介质中存储有指令，当其在计算机上运行时，使数据可视化设备执行上述第一方面所描述的方法或者第一方面的任一可能实现方式所描述的方法。

附图说明

为了更清楚地说明本发明实施例或背景技术中的技术方案，下面将对本发明实施例或背景技术中所需要使用的附图进行说明。

图1是本发明实施例提供的一种数据可视化方法的流程示意图；

图2是本发明实施例提供的一种第一评分模型优化方法的流程示意图；

图3是本发明实施例提供的一种用户交互界面的示意图；

图4A是本发明实施例提供的一种放大前可视化图像的示意性说明图；

图4B是本发明实施例提供的一种放大后可视化图像的示意性说明图；

图5是本发明实施例提供的一种分析对象对应的可视化界面的示意性说明图；

图6是本发明实施例提供的一种数据可视化设备的结构示意图；

图7是本发明实施例提供的另一种数据可视化设备的结构示意图；

图8是本发明实施例提供的又一种数据可视化设备的结构示意图。

具体实施方式

下面结合本发明实施例中的附图对本发明实施例进行描述。

下面对本发明实施例中涉及的词汇进行阐述：

本发明实施例中设备可以是服务器、也可以是终端。终端可以包括但不限于计算机、移动手机、平板电脑等。

本发明实施例中，设备可以获取到需要的数据。该数据可以是设备存储的数据，也可以是设备通过互联网从其他设备，比如终端，服务器等获取到的数据。设备所应用的数据可分为样本数据和测试数据。其中，样本数据包括真实评分(第一真实评分或第二真实评分)，用于训练评分模型(第一评分模型或第二评分模型)，以优化该评分模型。测试数据为用于通过训练生成的评分模型计算测试评分(第一测试评分或第二测试评分)。设备可以提取样本数据和/或测试数据中分析对象的数据，可以通过特征向量的方式来描述分析对象的数据。可以理解，样本数据可以是测试数据的一部分。

分析对象可以是网络中用户或团体，也可以是社交网络中用户构成的社团等，本发明不作限制。可以理解，团体可以是网站、酒店、机场等。当分析对象为社团时，分析对象还可以包括多个分析节点，该分析节点可以是社团内成员。

分析对象之间的交互行为构成分析对象之间的关联关系，分析节点之间的交互行为构成分析节点之间的关联关系。例如用户之间的交互行为，比如，第一用户与第二用户之间的转账、评论、私信行为等，可以构成用户之间的关联关系；不同社团内的用户之间的交互行为可以构成社团之间的关联关系；用户与团体之间的交互行为，比如第一用户在第一网站上的消费、访问、评论行为等，可以构成用户与团体之间的交互行为。

分析对象或分析节点之间的关联关系可以划分为多种类型，例如，转账、评论、私信等，数据分析人员可以根据需要提取其关心的关联关系对应的数据。本申请中，第一关联关系或第二关联关系为选定的一种或多种分析对象之间的关联关系。

可以通过分析对象的特征向量来描述分析对象，本发明实施例中，目标分析对象的特征向量包括至少包含第一特征因子和第二特征因子，第一特征因子用于描述目标分析对象的特征，第二特征因子用于描述与目标分析对象存在第一关联关系的对象的特征。其中，目标分析对象为样本数据或测试数据中分析对象中的任意一个分析对象。目标分析对象的特征向量还可以包括第三特征因子，该第三特征因子用于描述针对目标分析对象进行操作时产生的人机交互信息。同理，可以通过分析节点的特征向量来描述分析节点，目标分析节点的特征向量包括至少包含第四特征因子和第五特征因子，第四特征因子用于描述目标分析节点的特征，第五特征因子用于描述与目标分析节点存在第二关联关系的节点的特征。目标分析节点的特征向量还可以包括第六特征因子，该第六特征因子用于描述针对目标分析节点进行操作时产生的人机交互信息。

目标分析对象的特征为描述或限定该目标分析对象的信息，可以选取对评分(第一真实评分或第一测试评分)的结果影响较大的特征作为目标分析对象的第一特征因子。同理，目标分析节点的特征为描述或限定该目标分析节点的信息，可以选取对评分(第二真实评分或第二测试评分)的结果影响较大的特征作为目标分析节点的第四特征因子。对于不同的应用场景，分析对象或分析节点的特征的选取可以不同。例如，若要预测某一人群中每个人的进行电话诈骗的可能性，分析对象(人)的特征可以选取年龄、职业、拨号次数、拨号联系人总数等可能对分析结果影响较大的因素作为该目标分析对象的特征；若要预测某一人群中每个人对目标电视节目的喜爱程度，分析对象(人)的特征可以选取年龄、学历、浏览目标电视节目的次数、浏览其他电视节目的次数等可能对分析结果影响较大的因素作为该目标分析对象的特征。

与目标分析对象存在第一关联关系的对象可以是样本数据或测试数据中与该目标分析对象存在第一关联关系的分析对象，也可以是非分析对象。同理，与目标分析节点存在第二关联关系的节点可以是样本数据或测试数据中与该目标分析节点存在第二关联关系的分析节点，也可以是非分析节点。

与目标分析对象存在关联关系的对象的特征为描述和限定该对象的信息，同理，可以选取为对评分(第一真实评分或第一测试评分)的结果影响较大的特征作为目标分析对象的第二特征因子。与目标分析节点存在关联关系的节点的特征为描述和限定该节点的信息，同理，可以选取为对评分(第二真实评分或第二测试评分)的结果影响较大的特征作为目标分析节点的第五特征因子。

第一测试评分是对分析对象的特征向量的分析结果的反映。其中，第一评分模型建立第一测试评分与分析对象的特征向量之间的关系。同理，第二测试评分是对分析节点的特征向量的分析结果的反映。其中，第二评分模型建立第二测试评分与分析节点的特征向量之间的关系。第一评分模型或第二评分模型可以是线性加权模型或逻辑回归模型等，本发明不作限制。

请参见图1，图1是本发明实施例提供的一种数据可视化方法的流程示意图，该方法包括但不限于如下步骤：

步骤S100：设备获取M个分析对象中每个分析对象各自的第一真实评分和各自的特征向量。

其中，M个分析对象的数据为样本数据，每个分析对象的第一真实评分已知。其中，目标分析对象的特征向量至少包含第一特征因子和第二特征因子，第一特征因子用于描述目标分析对象的特征，第二特征因子用于描述与目标分析对象存在第一关联关系的分析对象的特征；目标分析对象为M个分析对象中的任意一个分析对象，第一真实评分用于表征对分析对象的分析结果；M为大于1的整数。可以理解，样本数据用于训练第一评分模型，以获得第一评分模型。

本发明实施例中，设备获取第k分析对象的特征向量的方式可以包括：

设备获取第k分析对象的固有特征向量x_k，其中，固有特征向量x_k用于描述第K分析对象在至少一个维度上的特征信息。

设备获取与第k分析对象存在第一关联关系的对象(本发明实施例中也称邻接对象)的特征向量y_k，邻接对象的特征向量y_k用于描述第k分析对象存在第一关联关系的对象在至少一个维度上的特征信息。为保证各个分析对象的特征向量的形式一致，邻接对象的特征向量y_k仅包括与第K分析对象存在第一关联关系的固定个数的对象。

则，第K分析对象的特征向量v_k可以由x_k与y_k拼接形成，其中，k为正整数，k≤M。

可选地，特征向量还可以包括第三特征因子，该第三特征因子用于描述针对该特征向量所属分析对象进行操作时产生的人机交互信息。该针对目标分析对象操作可以是在用户交互界面针对目标分析对象输入的点击操作、拖动操作等。用户对该目标分析对象点击次数越多，可反映出用户越关注该目标分析对象。其中，用户交互界面为设备在可视化第一测试评分后输出的界面，用户可以通过该用户交互界面来查看分析对象的第一测试评分，设备可以通过该用户交互界面采集人机交互信息，进一步地，该人机交互信息可用于优化第一评分模型。

可以通过交互特征向量z_k来描述对第K分析对象进行操作时产生的至少一个维度上的操作信息，此时，第K分析对象的特征向量v_k可以由x_k、y_k、z_k拼接形成。

本申请中，多个向量的拼接是指将多个向量中的元素集合在拼接后的向量中，即拼接后的向量中包括该多个向量中任一元素。

例如，x_k＝(x_k1,x_k2,…x_ka)；y_k＝(y_k1,y_k2,…y_kb)；z_k＝(z_k1,z_k2,…z_kc)；其中，a、b、c为正整数。则v_k＝(v_k1,v_k2…v_kl)＝(x_k1,x_k2,…x_ka,y_k1,y_k2,…y_kb,z_k1,z_k2,…z_kc)，l＝a+b+c。

步骤S110：设备根据M个分析对象中每个分析对象各自的评分和各自的特征向量训练出第一评分模型。

其中，第一评分模型表示第一测试评分与分析对象的特征向量之间的关系。

步骤S110可以包括步骤S111和S112。请一并参阅图2，图2是本发明实施例提供的一种第一评分模型优化方法的流程示意图。

步骤S111：设备构建第一评分模型。

其中，该第一评分模型可以是线性加权模型，也可以是逻辑回归模型。

例如，第一评分模型为逻辑回归模型，

其中，S_k为第k分析对象的第一测试评分，v_k为第k分析对象的特征向量；ω为权重参数，ω用于指示各个维度上的特征信息的各自权重，ω为未知量。

步骤S112：所述设备根据所述M个分析对象中每个分析对象各自的第一真实评分和各自的特征向量，计算所述第一评分模型的损失函数；

可以理解，损失函数是用来评价第一评分模型的第一测试评分S_k＝f(v_k,ω)与第一真实评分S'_k的不一致程度。损失函数可以是0-1损失函数、Log损失函数、Hinge损失函数、指数损失函数、感知损失函数等损失函数中的一种。本发明实施例以Log损失函数为例来描述第一评分模型的训练过程。

例如，损失函数为Log损失函数L(S'_k,f(v_k；ω))＝-logP(f(v_k；ω)|S'_k)；

其中P(f(v_k；ω)|S'_k)表示已知S'_k的条件下，权重参数ω为当前训练出来的权重参数ω的概率。如果概率越大，说明权重参数ω训练的越准确，log前面有个负号，因此，若概率越大，则损失函数的值就越小。

步骤S113：所述设备通过使所述损失函数最小化，确定所述第一评分模型。

步骤S113可以包括步骤S1131至步骤S1134。

步骤S1131：设备获取初始权重ω⁽⁰⁾；

具体地，设备构建线性加权模型S_k＝g(v_k,ω₀)；

将预设分析对象的第一真实评分和该预设分析对象的特征向量输入到所述线性加权模型，计算ω⁽⁰⁾，预设分析对象可以是样本数据中任一分析对象。

步骤S1132：设备将ω⁽⁰⁾输入到最小化目标函数，迭代求解。求解的方法包括但不限于梯度下降法、最小二乘法等，例如，最小化目标函数为：

其中，ω⁽ⁱ⁾为第i次迭代计算得到的权重参数；ω^(i-1)为第i-1次迭代计算得到的权重参数；

为损失项，λΩ(ω^(i-1))正则项，λ是正则项超参数，常用的正则方法包括：L1正则与L2正则，本发明不作限定。

步骤S1133：判断最小化目标函数是否收敛。

若ω⁽ⁱ⁾与ω^(i-1)之差不大于第一阈值，则输出ω⁽ⁱ⁾；

步骤S1134：设备输出第一评分模型。

此时，设备令ω为输出的ω⁽ⁱ⁾，代入到第一评分模型，以确定所述第一评分模型。

步骤S120：设备向所述第一评分模型输入N个分析对象的特征向量，以通过所述第一评分模型分析出所述N个分析对象中每个分析对象的第一测试评分，N为正整数。

其中，N个分析对象为测试数据中分析对象。该分析对象的特征向量也包含第一特征因子和第二特征因子，第一特征因子用于描述该分析对象的特征，第二特征因子用于描述与该分析对象存在第一关联关系的分析对象的特征。N个分析对象的特征向量与样本数据中M个分析对象的特征向量在形式上保持一致。

通过确定的第一评分模型预测测试数据中N个分析对象的第一测试评分。

步骤S130：设备通过N个图形元素表示所述N个分析对象，可视化所述N个分析对象的第一测试评分；其中，所述N个图形元素与所述N个分析对象一一对应。

可选地，设备还可以可视化N个分析对象之间的第一关联关系。

可视化该N个分析对象的第一测试评分后，设备可以形成可视化图像，该可视化图像可以包括N个分析对象对应的图形元素，以及针对该图像元素展示的第一测试评分。设备可以输出该可视化图像，也可以输出可视化图像的部分内容，而隐藏可视化图像的其他内容，以实现更好的视觉效果。

可视化图像可以是用户交互界面，该用户交互界面可以包括可视化形成的图形元素。用户可以通过该用户交互界面来直观地了解分析对象的第一测试评分。另一方面，设备可以通过该用户交互界面采集人机交互信息，进一步地，该人机交互信息可用于优化第一评分模型。

本发明一实施例中，可以将N个分析对象表示为图形元素，分析对象之间的第一关联关系表示为链接，根据分析对象的第一测试评分设置该分析对象对应的图形元素的尺寸或颜色。可选地，在可视化分析结果中，图形元素可以表示为图标或控件，链接可以表示为连线，从而将N个分析对象的第一测试评分和N个分析对象之间的关系以图像的形式直观地进行展现。

本发明一实施例中，所述设备以预设排列顺序依次设置所述N个图形元素的位置，使得按照所述预设排列顺序依次连接的所述N个图形元素的几何中心所连接形成的曲线呈螺旋状；其中，所述第K个图形元素对应第K个分析对象，所述第K个图形元素与所述第K-1个图形元素以及所述第K+1个图形元素相邻。

其中，以预设排列次序可以是以分析对象的身份信息(也称ID)的字典排序，也可以是以分析对象的第一测试评分的高低排序，还可以是以随机排序等，本发明不作限制。分析对象的ID可以是该分析对象的身份识别码、用户名或账户名等，本发明不作限制。

例如，该图形元素为圆形控件，请参阅图3，图3是本发明实施例提供的一种用户交互界面的示意图。如图3所示，设备可以输出用户交互界面，该用户交互界面上N个圆形控件随机排序，N个圆形控件的几何中心所连接形成的曲线呈螺旋状。根据分析对象的第一测试评分设置该分析对象对应的圆形控件的颜色，通过圆形控件的颜色深浅表示其对应分析对象的第一测试评分的高低。各个圆形空间可以与周围的圆形空间向切。圆形控件上的数字仅用于说明N个分析对象的排序，用户交互界面可以不包括该数字。圆形控件上还可以标注其对应的分析对象ID和/或第一测试评分等信息，圆形控件或圆形控件上的内容还可以连接该圆形控件对应的分析对象的信息，比如该分析对象的特征等。设备可以接收到针对圆形控件或针对圆形控件上内容的点击、双击、拖动等操作，并响应该操作，设备还可以记录该操作生成的人机交互信息，该人机交互信息作为分析对象的特征向量的组成部分可进一步用于第一评分模型的优化。

需要说明的是，图3仅以圆形控件为例来描述用户交互界面，可以理解，本发明实施例还可以包括其他形式的图形元素和/或用户交互界面，本发明不在赘述。

可选地，该用户交互界面还可以包括菜单或其他控件，比如图3中第一控件301、第二控件302、第三控件303、第四控件304，上述控件可用于接收用户输入的指令，执行相应的功能。例如，当设备接收到针对第一控件301的点击操作时，设备可以输出图像设置菜单或对话框等，用户可以对可视化图像中显示的分析对象进行筛选、对分析对象对应的图形元素的样式或分布进行更改或其他操作等，本发明不作限制。当设备接收到针对第二控件302的点击操作时，设备可以对样本数据进行更新，并输出更新后的可视化图像。当设备接收到针对第三控件303的点击操作时，设备可以对测试数据进行更新，并输出更新后的可视化图像。当设备接收到针对第四控件304的点击操作时，设备可以重新计算第一评分模型，并输出更新后的可视化图像。

本发明一实施例中，每个分析对象包含多个分析节点，例如分析对象为社团，则每个社团可以包括多个成员(即分析节点)。该数据可视化方法还可以包括以下步骤：

步骤S140：所述设备获取R个分析节点各自的第二真实评分和各自的特征向量。其中，目标分析节点的特征向量至少包含第四特征因子和第五特征因子，所述第四特征因子用于描述所述目标分析节点的特征，所述第五特征因子用于描述与所述目标分析节点存在第二关联关系的节点的特征；所述目标分析节点为所述R个分析节点中的任意一个分析节点；R为正整数。

步骤S150：所述设备根据所述R个分析节点各自的第二真实评分和各自的特征向量训练出第二评分模型。

步骤S160：所述设备向所述第二评分模型输入S个分析节点的特征向量，以通过所述第二评分模型分析出所述S个分析节点中每个分析节点的第二测试评分，S为正整数。

步骤S170：所述设备可视化所述S个分析节点的第二测试评分。

可以理解，可视化图像还可以包括S个分析节点对应的图形元素，以及针对该图像元素展示的第二测试评分。可选地，可视化图像中目标分析对象对应的图像元素可以包括该目标分析对象所包含所有分析节点对应的图像元素和第二测试评分。该图像元素可以是控件或标签等，本发明不作限制。本发明实施例以节点图标为例来表示分析节点对应的图形元素。

同第一评分模型训练原理类似，R个分析节点属于样本数据，R个分析节点的第二真实评分已知；S个分析节点属于测试数据，该S个节点的特征向量输入到通过样本数据训练得打的第二评分模型中输出S个分析节点的第二测试评分。第二评分模型的训练原理可以参见上述第一评分模型的训练原理中的相关描述，本发明不再赘述。

本发明一实施例中，设备可以根据调节参数、图形元素的尺寸、分析对象的总个数N等中的至少一种调节可视化图像中分析对象的显示数目Q和/或分析对象所包含的分析节点的显示数目P。该调节参数可以是界面的缩放倍数、第一测试评分范围、第二测试评分范围等。其中，Q、P为正整数，Q≤N，P≤S。

例如，用户可以输入选定的第一测试评分范围，如80-90，则设备可以根据N个分析对象中每个分析对象的第一测试评分确定满足第一测试评分范围要求的分析对象，Q即为满足要求的分析对象的数目，设备可以输出该满足要求的Q个分析对象对应的图形元素。

又例如，分析对象对应的图形元素的面积正比于该分析对象所包含的分析节点的显示数目P，使得尺寸较大的图形元素中可显示较多的多个节点标签，

可选地，设备可以根据所述N个分析对象中每个分析对象的第一测试评分确定评分最高的前Q个分析对象，并输出该前Q个分析对象对应的图形元素。同理，所述设备根据第K分析对象中包含的每个分析节点的第二测试评分确定第K分析对象中评分最高的前P个分析节点，并输出所述前P个分析节点对应的图形元素以及可视化的所述前P个分析节点的第二测试评分。其中，Q或P为可以是设备默认的数值，也可以是设备的用户输入的数值，还可以是设备根据当前条件调整的值。

设备调整Q值的一种实施方式可以是：设备接收输入的缩放倍数，例如，设备可以接收到针对可视化图像输入的缩放操作，该缩放操作指示设备对可视化图像进行缩放倍数的缩放，设备根据所述N个分析对象的总数以及所述缩放倍数调节Q值。实施本发明实施例，可以使得第一测试评分高的分析对象首先显示。同理，设备根据第K分析对象所包含的分析节点的总数、第K分析对象对应的图形元素的尺寸以及缩放倍数调节P值。可以理解，不同的分析对象对应的P值可以不同。N个分析对象包括第K分析对象，K为小于等于N的正整数。可以理解，当缩放倍数大于当前缩放倍数时，可以Q值和/或P值增大；反之，当缩放倍数小于当前缩放倍数时，可以Q值和/或P值降低。

请参阅图4A和图4B，图4A是本发明实施例提供的一种放大前可视化图像的示意性说明图。图4B是本发明实施例提供的一种放大后可视化图像的示意性说明图。随着可视化图像的放大，可视化图像中原有图形元素的尺寸不断放大，且可视化图像增加满足显示条件的分析对象。图形元素的尺寸增大，其内显示更多的分析节点。

本发明一实施例中，设备可以接收针对第T分析对象对应的第T图形元素输入的选定操作；所述设备输出第T分析对象对应的可视化界面，其中，T为不大于N的正整数，所述第T分析对象为所述N个分析对象中的任一分析对象；所述第T分析对象对应的可视化界面包括所述第T分析对象对应的图形元素，所述第T分析对象所包含的分析节点对应的图形元素和第二测试评分，以及所述第T分析对象所包含的分析节点之间的所述第二关联关系。其中，T为正整数，T≤N。可以通过分析节点对应的图形元素的颜色深浅来表示该分析节点的第二测试评分的高低。

请参阅图5，图5是本发明实施例提供的一种分析对象对应的可视化界面的示意性说明图。如图5所示的可视化界面可以展示分析对象的信息，比如分析对象的ID和第一测试评分、该分析对象所包含的P个分析节点，通过连线展示P个分析节点之间的第二关联关系，还可以通过分析节点对应的图形元素(对应图5中点)的颜色深浅来表示该分析节点的第二测试评分的高低，其中，深颜色点表示该分析节点的第二测试评分的高。P为正整数。可以理解，该可视化界面还可以显示分析节点的ID、分析节点的第二测试评分值等，本发明不再赘述。

本发明一实施例中，设备收集数据，比如，针对用户交互界面的操作所产生的人机交互信息，并将该收集到的数据更新到样本数据和/或测试数据，设备可以通过更新后的样本数据对第一评分模型或第二评分模型进行更新，并将更新后的测试数据通过更新后的模型输出第一测试评分和第二测试评分。

综上所述，本发明实施例设备通过获取M个分析对象中每个分析对象各自的第一真实评分和各自的特征向量作为样本数据，根据样本数据训练出第一评分模型，在向第一评分模型输入测试数据(N个分析对象的特征向量)，以通过第一评分模型分析出测试数据中每个分析对象的第一测试评分，进而，设备通过N个图形元素表示N个分析对象，可视化N个分析对象的测试评分，使得用户可以直观地了解研究对象的分析结果。

而且，特征向量还可以包括针对分析对象进行操作时产生的人机交互信息，使得测试评分更加准确。

为了便于理解，下面以分析对象为社团，分析节点为社团内成员为例，以分析社团的用户关注度或成员的关注度为目的，对本发明实施例一种数据可视化方法进行描述：

假设用于训练第一评分模型的样本数据包括M个社团，测试数据包括N个社团；用于训练第二评分模型的样本数据中可以包括R个成员，测试数据包括S个成员。R个成员或S个成员可以来自不同社团。

设备的用户关注某一社团，比如第K社团，通常会对该第K社团进行操作，比如浏览该第K社团的信息或浏览该第K社团内成员的信息、对该第K社团进行标注或对该第K社团内成员进行标注、检索等操作。设备可以收集该信息，并根据该信息提取出用户针对该第K社团的用户关注度(对应上述第一真实评分)。K为小于M的正整数。

设备的用户关注某一社团内某一成员，比如第K社团中第J成员通常会对该成员进行操作，比如浏览该第J成员的信息、对该第J成员进行标注、检索等操作。设备可以收集该针对该第J成员的信息，并根据该信息提取出用户针对该第J成员的用户关注度(对应上述第二真实评分)。J小于M个社团中成员总数。

可以选取社团的特征向量所包含的元素，以第K社团为例，第K社团的特征向量可以是第K社团的固有特征向量、第K社团的邻接对象的特征向量和第K社团的交互特征向量的拼接。第K社团的特征可以是第K社团的属性，第K社团的固有特征向量的表示形式可以是(第K社团成员个数，第K社团成员的平均年龄，第K社团成员的平均学历)。假设第K社团与第一社团和第二社团存在第一关联关系，第K社团的邻接对象的特征向量的表示形式可以是(第一社团成员个数，第一社团成员的平均年龄，第一社团成员的平均学历，第二社团成员个数，第二社团成员的平均年龄，第二社团成员的平均学历)。第K社团的交互特征向量的表示形式可以是(第K社团被点击次数，第K社团被检索次数，第K社团中成员被点击次数)。

将用于训练第一评分模型的样本数据中M个社团的中各个社团的用户关注度和特征向量输入到第一评分模型，通过上述方法实施例中的第一评分模型训练方法获得第一评分模型。

将测试数据中N个社团的中各个社团的特征向量输入到第一评分模型后，可计算出测试数据中N个社团的中各个社团的用户关注度。

同理，可以选取成员的特征向量所包含的元素，以第J成员为例，第J成员的特征向量可以是第J成员的固有特征向量、第J成员的邻接对象的特征向量和第J成员的交互特征向量的拼接。其中，第J成员的特征可以是第J成员的属性，第J成员的固有特征向量的表示形式可以是(第K社团成员个数，第K社团成员的平均年龄，第K社团成员的平均学历)。假设第J成员与第一成员和第二成员存在第二关联关系，第J成员的邻接对象的特征向量的表示形式可以是(第一成员的年龄，第一成员的学历，第二成员的年龄，第二成员的学历)。第J成员的交互特征向量的表示形式可以是(第J成员被点击次数，第J成员被检索次数)。

将用于训练第二评分模型的样本数据中P个成员的中各个成员的用户关注度和特征向量输入到第二评分模型，通过上述方法实施例中的第二评分模型训练方法获得第二评分模型。

将测试数据中S个成员的中各个成员的特征向量输入到第二评分模型后，可计算出测试数据中S个成员的中各个成员的用户关注度。

进而，设备可视化各个社团的用户关注度以及各个成员的用户关注度，输出可视化图像，以直观地展示出用户关注的社团和用户。

上述详细阐述了本发明实施例的方法，下面提供了本发明实施例的装置。

请参见图6，图6是本发明实施例提供的一种数据可视化设备的结构示意图，该设备60可以包括获取单元601、第一评分模型训练单元602、第一分析单元603以及可视化单元604。其中，各个单元的详细描述如下。

获取单元601，用于获取M个分析对象中每个分析对象各自的第一真实评分和各自的特征向量；

第一评分模型训练单元602，用于：根据所述每个分析对象各自的第一真实评分和各自的特征向量训练出第一评分模型；

第一分析单元603，用于向所述第一评分模型输入N个分析对象的特征向量，以通过所述第一评分模型分析出所述N个分析对象中每个分析对象的第一测试评分；

可视化单元604，用于通过N个图形元素表示所述N个分析对象，可视化所述N个分析对象的测试评分；

在又一种可能的实现方式中，所述可视化单元604可视化所述N个分析对象的评分，具体包括：

在又一种可能的实现方式中，所述可视化单元604通过N个图形元素表示所述N个分析对象，具体包括：

在又一种可能的实现方式中，所述可视化单元604还用于：

接收输入的缩放倍数；

根据所述N个分析对象的总数以及所述缩放倍数调节Q值。

在又一种可能的实现方式中，所述第一评分模型训练单元602具体用于：

构建第一评分模型；

通过使所述损失函数最小化，确定所述第一评分模型。

在又一种可能的实现方式中，所述第一评分模型S_k＝f(v_k；ω)，其中，S_k为第k分析对象的测试评分，v_k为第k分析对象的特征向量，v_k包括第k分析对象在至少一个维度上的特征信息；ω为权重参数，ω用于指示各个维度上的特征信息的各自权重；所述第k分析对象的损失函数为L(S_k,f(v_k；ω)；所述第一评分模型训练单元602执行所述通过使所述损失函数最小化，确定所述第一评分模型，具体包括：

获取初始权重ω⁽⁰⁾

将ω⁽⁰⁾输入到最小化目标函数

令ω为输出的ω⁽ⁱ⁾，确定所述第一评分模型；

其中，ω⁽ⁱ⁾为第i次迭代计算得到的权重参数；

在又一种可能的实现方式中，所述第一评分模型训练单元602执行所述获取初始权重ω⁽⁰⁾，具体包括：

构建线性加权模型S_k＝g(v_k,ω₀)；

在又一种可能的实现方式中，每个分析对象包含多个分析节点。请参见图7，图7是本发明实施例提供的另一种数据可视化设备的结构示意图，该设备70除包括图6中各个单元外还可以包括第二评分模型训练单元605、第二分析单元606。各个单元的详细描述如下：

所述获取单元601还用于：获取R个分析节点各自的第二真实评分和各自的特征向量；

所述设备还包括：第二评分模型训练单元605，用于根据所述R个分析节点各自的第二真实评分和各自的特征向量训练出第二评分模型；以及，第二分析单元606，用于向所述第二评分模型输入S个分析节点的特征向量，以通过所述第二评分模型分析出所述S个分析节点中每个分析节点的第二测试评分；

所述可视化单元604还用于：通过S个图形元素表示所述S个分析节点，可视化所述S个分析节点的第二测试评分；

在又一种可能的实现方式中，所述可视化单元604还用于：

可视化所述S个研究对象之间的所述第二关联关系。

在又一种可能的实现方式中，所述可视化单元604还用于：

在又一种可能的实现方式中，设备还可以包括更新单元，用于更新样本数据和/或测试数据，以及通过更新后的样本数据对第一评分模型或第二评分模型进行更新。

需要说明的是，各个单元的实现还可以对应参照图1所示的方法实施例的相应描述。

请参阅图8，图8是本发明实施例提供了又一种数据可视化设备的结构示意图，所述设备80包括处理器801、存储器802、至少一个通信接口或用户接口803、至少一个通信总线804。通信总线804用于实现这些组件之间的连接通信。该用户接口803可选地包括显示器(例如，触摸屏、LCD、CRT、全息成像(Holographic)或者投影(Projector)等)，键盘或者点击设备(例如，鼠标，轨迹球(trackball)，触感板或者触摸屏等)，例如，该设备包括用户接口803且该用户接口803包括显示器和触摸屏，该显示器用于显示可视化图像或用户交互界面，该触摸屏用于获取人机交互信息、缩放倍数等。

存储器802可以包括只读存储器和随机存取存储器，并向处理器801提供指令和数据。存储器802的一部分还可以包括非易失性随机存取存储器(NVRAM)。

该设备中的处理器801用于读取该存储器802中存储的程序代码，执行以下操作：

在又一种可能的实现方式中，所述处理器801执行所述可视化所述N个分析对象的评分，具体包括：根据所述N个分析对象的第一测试评分分别设置所述N个分析对象各自对应的图形元素的尺寸或颜色，形成可视化图像。

在又一种可能的实现方式中，所述处理器801执行所述通过N个图形元素表示所述N个分析对象，具体包括：以预设排列顺序依次设置所述N个图形元素的位置，使得按照所述预设排列顺序依次连接的所述N个图形元素的几何中心所形成的曲线呈螺旋状；其中，

在又一种可能的实现方式中，所述处理器801执行所述通过N个图形元素表示所述N个分析对象，可视化所述N个分析对象的第一测试评分之后，所述处理器801还用于执行：

在又一种可能的实现方式中，所述处理器801执行所述根据所述N个分析对象中每个分析对象的评分确定第一测试评分最高的前Q个分析对象之前，所述处理器801还用于执行：

接收输入的缩放倍数；

根据所述N个分析对象的总数以及所述缩放倍数调节Q值。

在又一种可能的实现方式中，所述处理器801执行所述根据所述每个分析对象各自的评分和各自的特征向量训练第一评分模型，具体包括：

构建第一评分模型；

通过使所述损失函数最小化，确定所述第一评分模型。

在又一种可能的实现方式中，所述第一评分模型S_k＝f(v_k；ω)，其中，S_k为第k分析对象的测试评分，v_k为第k分析对象的特征向量，v_k包括第k分析对象在至少一个维度上的特征信息；ω为权重参数，ω用于指示各个维度上的特征信息的各自权重；所述第k分析对象的损失函数为L(S_k,f(v_k；ω)；所述处理器801执行所述通过使所述损失函数最小化，确定所述第一评分模型，具体包括：

获取初始权重ω⁽⁰⁾

将ω⁽⁰⁾输入到最小化目标函数

令ω为输出的ω⁽ⁱ⁾，确定所述第一评分模型；

其中，ω⁽ⁱ⁾为第i次迭代计算得到的权重参数；

在又一种可能的实现方式中，所述处理器801执行所述获取初始权重ω⁽⁰⁾，具体包括：

构建线性加权模型S_k＝g(v_k,ω₀)；

在又一种可能的实现方式中，

L(S'_k,f(v_k；ω))＝-logP(f(v_k；ω)|S'_k)；

在又一种可能的实现方式中，每个分析对象包含多个分析节点；所述处理器801还用于执行：

获取R个分析节点各自的第二真实评分和各自的特征向量；

在又一种可能的实现方式中，所述处理器801还用于执行：可视化所述S个研究对象之间的所述第二关联关系。

在又一种可能的实现方式中，所述处理器801还用于执行：

在又一种可能的实现方式中，所述处理器801执行所述根据所述第K分析对象中包含的每个分析节点的第二测试评分确定所述第K分析对象中评分最高的前P个分析节点之前，所述处理器801还用于执行：

在又一种可能的实现方式中，所述处理器801还用于执行：

需要说明的是，各个指令的实现还可以对应参照图1所示的方法实施例的相应描述。

综上所述，通过实施本发明实施例，设备通过样本数据训练第一评分模型，在将测试数据中N个分析对象的特征向量输入到第一评分模型可以计算出该N个分析对象的特征向量对应的第一测试评分，进而可视化该第一测试评分，从而实现对N个分析对象中隐含数据的可视化，满足用户对于隐含数据可视化的需求。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，该流程可以由计算机程序来指令相关的硬件完成，该程序可存储于计算机可读取存储介质中，该程序在执行时，可包括如上述各方法实施例的流程。而前述的存储介质包括：ROM或随机存储记忆体RAM、磁碟或者光盘等各种可存储程序代码的介质。

Claims

1.一种数据可视化方法，其特征在于，包括：

设备获取M个分析对象中每个分析对象各自的第一真实评分和各自的特征向量；

所述设备根据所述每个分析对象各自的第一真实评分和各自的特征向量训练出第一评分模型；

所述设备向所述第一评分模型输入N个分析对象的特征向量，以通过所述第一评分模型分析出所述N个分析对象中每个分析对象的第一测试评分；

所述设备通过N个图形元素表示所述N个分析对象，可视化所述N个分析对象的测试评分；

其中，所述第一真实评分和所述第一测试评分用于表征对所述分析对象的分析结果；目标分析对象的特征向量至少包含第一特征因子和第二特征因子，所述第一特征因子用于描述所述目标分析对象的特征，所述第二特征因子用于描述与所述目标分析对象存在第一关联关系的分析对象的特征；所述目标分析对象为所述M个分析对象或所述N个分析对象中的任意一个分析对象；所述N个图形元素与所述N个分析对象一一对应；M为正整数，N为正整数；分析对象之间的交互行为构成分析对象之间的关联关系；

所述目标分析对象的特征向量还包括第三特征因子，所述第三特征因子用于描述针对所述目标分析对象进行操作时产生的人机交互信息；

所述分析对象为用户或用户组成的团体。

2.根据权利要求1所述的方法，其特征在于，所述设备可视化所述N个分析对象的评分包括：

所述设备根据所述N个分析对象的第一测试评分分别设置所述N个分析对象各自对应的图形元素的尺寸或颜色，形成可视化图像。

3.根据权利要求1所述的方法，其特征在于，所述设备通过N个图形元素表示所述N个分析对象包括：

所述设备以预设排列顺序依次设置所述N个图形元素的位置，使得按照所述预设排列顺序依次连接的所述N个图形元素的几何中心所形成的曲线呈螺旋状；其中，

第K个图形元素对应第K个分析对象，所述第K个图形元素与第K-1个图形元素以及第K+1个图形元素相邻，K为正整数，K≤N。

4.根据权利要求1所述的方法，其特征在于，所述设备通过N个图形元素表示所述N个分析对象，可视化所述N个分析对象的第一测试评分之后，所述方法还包括：

所述设备根据所述N个分析对象中每个分析对象的第一测试评分确定评分最高的前Q个分析对象；Q为正整数，Q≤N；

所述设备输出所述前Q个分析对象对应的图形元素以及可视化的所述前Q个分析对象的第一测试评分。

5.根据权利要求4所述的方法，其特征在于，所述设备根据所述N个分析对象中每个分析对象的评分确定第一测试评分最高的前Q个分析对象之前，所述方法包括：

所述设备接收输入的缩放倍数；

所述设备根据所述N个分析对象的总数以及所述缩放倍数调节Q值。

6.根据权利要求1所述的方法，其特征在于，每个分析对象包含多个分析节点；所述方法还包括：

所述设备获取R个分析节点各自的第二真实评分和各自的特征向量；

所述设备根据所述R个分析节点各自的第二真实评分和各自的特征向量训练出第二评分模型；

所述设备向所述第二评分模型输入S个分析节点的特征向量，以通过所述第二评分模型分析出所述S个分析节点中每个分析节点的第二测试评分；

所述设备通过S个图形元素表示所述S个分析节点，可视化所述S个分析节点的第二测试评分；

7.根据权利要求6所述的方法，其特征在于，所述方法还包括：

所述设备根据第K分析对象中包含的每个分析节点的第二测试评分确定所述第K分析对象中评分最高的前P个分析节点；P为正整数，P≤S；

所述设备输出所述前P个分析节点对应的图形元素以及可视化的所述前P个分析节点的第二测试评分。

8.根据权利要求7所述的方法，其特征在于，所述设备根据所述第K分析对象中包含的每个分析节点的第二测试评分确定所述第K分析对象中评分最高的前P个分析节点之前，所述方法包括：

所述设备接收输入的缩放倍数，并根据所述第K分析对象所包含的分析节点的总数、所述第K分析对象对应的图形元素的尺寸和所述缩放倍数调节P值。

9.根据权利要求6所述的方法，其特征在于，所述方法还包括：

所述设备接收针对第T分析对象对应的第T图形元素输入的选定操作；T为不大于N的正整数；

所述设备输出第T分析对象对应的可视化界面，其中，所述第T分析对象对应的可视化界面包括所述第T分析对象对应的图形元素，所述第T分析对象所包含的分析节点对应的图形元素和第二测试评分，以及所述第T分析对象所包含的分析节点之间的所述第二关联关系。

10.一种数据可视化设备，其特征在于，所述设备包括：

所述分析对象为用户或用户组成的团体。

11.根据权利要求10所述的设备，其特征在于，所述可视化单元可视化所述N个分析对象的评分，具体包括：

12.根据权利要求10所述的设备，其特征在于，所述可视化单元通过N个图形元素表示所述N个分析对象，具体包括：

13.根据权利要求10所述的设备，其特征在于，所述可视化单元还用于：

根据所述N个分析对象中每个分析对象的第一测试评分确定评分最高的前Q个分析对象；Q为正整数，Q≤N；

14.根据权利要求13所述的设备，其特征在于，所述可视化单元还用于：

接收输入的缩放倍数；

根据所述N个分析对象的总数以及所述缩放倍数调节Q值。

15.根据权利要求10所述的设备，其特征在于，每个分析对象包含多个分析节点；

16.根据权利要求15所述的设备，其特征在于，所述可视化单元还用于：

根据第K分析对象中包含的每个分析节点的第二测试评分确定所述第K分析对象中评分最高的前P个分析节点；P为正整数，P≤S；

17.根据权利要求16所述的设备，其特征在于，所述可视化单元还用于：

18.根据权利要求15所述的设备，其特征在于，所述可视化单元还用于：

19.一种数据可视化设备，其特征在于，所述设备包括处理器和存储器：所述存储器用于存储程序；所述处理器执行该存储器中的程序，使得计算机设备执行权利要求1至9任一项所述的数据可视化方法。

20.一种计算机存储介质，其特征在于，所述存储介质用于存储指令，所述指令在数据可视化设备上运行时使得所述数据可视化设备执行权利要求1-9任一项所述的方法。