CN111612077A

CN111612077A - 特征重要性可视化方法、设备及可读存储介质

Info

Publication number: CN111612077A
Application number: CN202010445870.5A
Authority: CN
Inventors: 范力欣; 张天豫; 吴锦和
Original assignee: WeBank Co Ltd
Current assignee: WeBank Co Ltd
Priority date: 2020-05-22
Filing date: 2020-05-22
Publication date: 2020-09-01

Abstract

本申请公开了一种特征重要性可视化方法、设备及可读存储介质，所述特征重要性可视化方法包括：获取各目标特征维度和各所述目标特征维度对应的样本类别，并基于预设哈希编码模型和各所述样本类别对应的预设哈希编码值，确定各所述目标特征维度对应的特征重要性值，进而基于各所述特征重要性值，确定各所述目标特征维度对应的目标比特位，进而基于各所述特征重要性值、各所述目标比特位和各所述样本类别，生成可视化特征重要性数据。本申请解决了模型解释效果差的技术问题。

Description

特征重要性可视化方法、设备及可读存储介质

技术领域

本申请涉及金融科技(Fintech)的人工智能领域，尤其涉及一种特征重要性可视化方法、设备及可读存储介质。

背景技术

随着金融科技，尤其是互联网科技金融的不断发展，越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域，但金融业也对技术提出了更高的要求，如对金融业对应待办事项的分发也有更高的要求。

随着计算机软件和人工智能的不断发展，深度学习的应用领域也越来越广泛，但是深度学习模型的内部运转原理及各个部分的组成方式，仍有待厘清，目前，通常通过Shapley重要性等方法估计模型输入特征的重要性，但是，该方法通常用于解释某一特征对模型是否重要，但是，该方法只能粗略地、大致地解释某一特征对模型的重要性，难以解释某一特征对模型的重要性的程度，进而导致对深度学习模型的模型解释的准确性较低，进而导致模型解释效果较差，且由于目前的模型解释方法仅能解释某一特征对模型是否重要，业务人员难以简单且直接地得到模型解释结果，进而进一步降低了模型解释的效果，所以，现有技术中存在模型解释效果差的技术问题。

发明内容

本申请的主要目的在于提供一种特征重要性可视化方法、设备及可读存储介质，旨在解决现有技术中模型解释效果差的技术问题。

为实现上述目的，本申请提供一种特征重要性可视化方法，所述特征重要性可视化方法应用于特征重要性可视化设备，所述特征重要性可视化方法包括：

获取各目标特征维度和各所述目标特征维度对应的样本类别，并基于预设哈希编码模型和各所述样本类别对应的预设哈希编码值，确定各所述目标特征维度对应的特征重要性值；

基于各所述特征重要性值，确定各所述目标特征维度对应的目标比特位；

基于各所述特征重要性值、各所述目标比特位和各所述样本类别，生成可视化特征重要性数据。

可选地，所述可视化特征重要性数据包括目标连接强度图，所述特征重要性值包括所述目标比特位和各所述样本类别之间的各吻合度，其中，一所述目标比特位和一所述样本类别之间存在一所述吻合度，

所述基于各所述特征重要性值、各所述目标比特位和各所述样本类别，生成可视化特征重要性数据的步骤包括：

生成各所述目标比特位对应的比特位节点和各所述目标样本类别对应的类别节点，并将各所述吻合度分别对应的所述比特位节点和所述类别节点进行连接，获得第一初始连接强度图；

获取各所述比特位节点两两之间的比特位一致性结果和各所述类别节点两两之间的类别一致性结果；

基于各所述比特位一致性结果，在所述第一初始连接强度图中对各所述比特位节点进行连接，并基于各所述类别一致性结果，对各所述类别节点进行连接，获得第二初始连接强度图；

在所述第二初始连接强度图中分别对各所述比特位节点和各所述类别节点进行聚类，获得所述目标连接强度图。

可选地，所述特征重要性值对应的特征重要性向量，

所述获取各所述比特位节点两两之间的比特位一致性结果的步骤包括：

确定各所述比特位节点对应的所述特征重要性向量，并计算各所述特征重要性向量两两之间的夹角余弦值；

基于各所述夹角余弦值，确定各所述比特位节点之间的比特位一致性结果。

可选地，所述分别对各所述比特位节点和各所述类别节点进行聚类，获得所述目标连接强度图的步骤包括：

获取各所述比特位节点之间的比特位关联性值和各所述类别节点之间的类别关联性值；

基于各所述比特位关联性值，对各所述比特位节点进行聚类，获得第一聚类结果，并基于各所述类别关联性值，对各所述类别节点进行聚类，获得第二聚类结果；

基于所述第一聚类结果和所述第二聚类结果，生成所述目标连接强度图。

可选地，所述第一聚类结果包括各所述比特位节点共同对应的一个或者多个聚类比特位节点，所述第二聚类结果包括各所述类别节点共同对应的一个或者多个聚类类别节点，

所述基于各所述比特位关联性值，对各所述比特位节点进行聚类，获得第一聚类结果，并基于各所述类别关联性值，对各所述类别节点进行聚类，获得第二聚类结果的步骤包括：

将各所述比特位关联性值分别与预设比特位关联性阀值进行比对，确定各所述比特位关联性值中大于或者等于所述预设比特位关联性阀值的各第一目标关联性值；

分别将各所述第一目标关联性值对应的相邻比特位节点进行聚类，获得各所述聚类比特位节点；

将各所述类别关联性值分别与预设类别关联性阀值进行比对，确定各所述类别关联性值中大于或者等于所述预设类别关联性阀值的各第二目标关联性值；

分别将所述第二目标关联性值对应的相邻类别节点进行聚类，获得各所述聚类类别节点。

可选地，所述基于预设哈希编码模型和各所述样本类别对应的预设哈希编码值，确定各所述目标特征维度对应的特征重要性值的步骤包括：

将各所述样本类别分别对应的样本集输入预设哈希编码模型，得到各所述样本类别分别对应的输出哈希编码值；

获取各所述样本类别对应的预设哈希编码值，并基于各所述输出哈希编码值和各所述预设哈希编码值，确定各所述目标特征维度对应的分类关联强度结果；

根据所述分类关联强度结果中的各关联强度值，确定各所述目标特征维度分别对应的特征重要性值。

可选地，所述分类关联强度结果至少包括一个关联强度值，一所述目标特征维度对应一所述关联强度值，

所述基于各所述输出哈希编码值和各所述预设哈希编码值，确定各所述目标特征维度对应的分类关联强度结果的步骤包括：

在各所述预设哈希编码值中确定各所述样本类别分别对应的同类目标哈希值和各异类目标哈希值，并在各所述输出哈希编码值中确定各所述样本类别分别对应的哈希编码值；

基于各所述样本类别分别对应的各所述哈希编码值、所述同类目标哈希值和各所述异类目标哈希值，计算各所述目标特征维度对应的所述关联强度值。

可选地，在所述将各所述样本类别分别对应的样本集输入预设哈希编码模型，得到各所述样本类别分别对应的输出哈希编码值的步骤之前，所述特征重要性可视化方法包括：

获取训练数据和待训练哈希模型，并基于预设目标哈希编码方式，生成所述训练数据对应的目标哈希编码结果；

基于所述预设哈希编码值和所述训练数据，对所述待训练哈希编码模型进行迭代训练，以优化所述待训练哈希编码模型对应的预设极化损失函数，直至所述待训练哈希编码模型达到预设迭代结束条件，获得所述预设哈希编码模型。

本申请还提供一种特征重要性可视化装置，所述特征重要性可视化装置为虚拟装置，且所述特征重要性可视化装置应用于特征重要性可视化设备，所述特征重要性可视化装置包括：

第一确定模块，用于获取各目标特征维度和各所述目标特征维度对应的样本类别，并基于预设哈希编码模型和各所述样本类别对应的预设哈希编码值，确定各所述目标特征维度对应的特征重要性值；

第二确定模块，用于基于各所述特征重要性值，确定各所述目标特征维度对应的目标比特位；

生成模块，用于基于各所述特征重要性值、各所述目标比特位和各所述样本类别，生成可视化特征重要性数据。

可选地，所述生成模块包括：

第一连接子模块，用于生成各所述目标比特位对应的比特位节点和各所述目标样本类别对应的类别节点，并将各所述吻合度分别对应的所述比特位节点和所述类别节点进行连接，获得第一初始连接强度图；

获取子模块，用于获取各所述比特位节点两两之间的比特位一致性结果和各所述类别节点两两之间的类别一致性结果；

第二连接子模块，用于基于各所述比特位一致性结果，在所述第一初始连接强度图中对各所述比特位节点进行连接，并基于各所述类别一致性结果，对各所述类别节点进行连接，获得第二初始连接强度图；

聚类子模块，用于在所述第二初始连接强度图中分别对各所述比特位节点和各所述类别节点进行聚类，获得所述目标连接强度图。

可选地，所述获取子模块包括：

第一计算单元，用于确定各所述比特位节点对应的所述特征重要性向量，并计算各所述特征重要性向量两两之间的夹角余弦值；

第一确定单元，用于基于各所述夹角余弦值，确定各所述比特位节点之间的比特位一致性结果。

可选地，所述聚类子模块包括：

获取单元，用于获取各所述比特位节点之间的比特位关联性值和各所述类别节点之间的类别关联性值；

聚类单元，用于基于各所述比特位关联性值，对各所述比特位节点进行聚类，获得第一聚类结果，并基于各所述类别关联性值，对各所述类别节点进行聚类，获得第二聚类结果；

生成单元，用于基于所述第一聚类结果和所述第二聚类结果，生成所述目标连接强度图。

可选地，所述聚类单元包括：

第一确定子单元，用于将各所述比特位关联性值分别与预设比特位关联性阀值进行比对，确定各所述比特位关联性值中大于或者等于所述预设比特位关联性阀值的各第一目标关联性值；

第一聚类子单元，用于分别将各所述第一目标关联性值对应的相邻比特位节点进行聚类，获得各所述聚类比特位节点；

第二确定子单元，用于将各所述类别关联性值分别与预设类别关联性阀值进行比对，确定各所述类别关联性值中大于或者等于所述预设类别关联性阀值的各第二目标关联性值；

第二聚类子单元，用于分别将所述第二目标关联性值对应的相邻类别节点进行聚类，获得各所述聚类类别节点。

可选地，所述第一确定模块包括：

哈希编码子模块，用于将各所述样本类别分别对应的样本集输入预设哈希编码模型，得到各所述样本类别分别对应的输出哈希编码值；

第一确定子模块，用于获取各所述样本类别对应的预设哈希编码值，并基于各所述输出哈希编码值和各所述预设哈希编码值，确定各所述目标特征维度对应的分类关联强度结果；

第二确定子模块，用于根据所述分类关联强度结果中的各关联强度值，确定各所述目标特征维度分别对应的特征重要性值。

可选地，所述第一确定子模块包括：

第二确定单元，用于在各所述预设哈希编码值中确定各所述样本类别分别对应的同类目标哈希值和各异类目标哈希值，并在各所述输出哈希编码值中确定各所述样本类别分别对应的哈希编码值；

第二计算单元，用于基于各所述样本类别分别对应的各所述哈希编码值、所述同类目标哈希值和各所述异类目标哈希值，计算各所述目标特征维度对应的所述关联强度值。

可选地，所述特征重要性可视化装置还包括：

编码模块，用于获取训练数据和待训练哈希模型，并基于预设目标哈希编码方式，生成所述训练数据对应的目标哈希编码结果；

迭代训练，用于基于所述预设哈希编码值和所述训练数据，对所述待训练哈希编码模型进行迭代训练，以优化所述待训练哈希编码模型对应的预设极化损失函数，直至所述待训练哈希编码模型达到预设迭代结束条件，获得所述预设哈希编码模型。

本申请还提供一种特征重要性可视化设备，所述特征重要性可视化设备为实体设备，所述特征重要性可视化设备包括：存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述特征重要性可视化方法的程序，所述特征重要性可视化方法的程序被处理器执行时可实现如上述的特征重要性可视化方法的步骤。

本申请还提供一种可读存储介质，所述可读存储介质上存储有实现特征重要性可视化方法的程序，所述特征重要性可视化方法的程序被处理器执行时实现如上述的特征重要性可视化方法的步骤。

本申请通过获取各目标特征维度和各所述目标特征维度对应的样本类别，并基于预设哈希编码模型和各所述样本类别对应的预设哈希编码值，确定各所述目标特征维度对应的特征重要性值，进而基于各所述特征重要性值，确定各所述目标特征维度对应的目标比特位，进而基于各所述特征重要性值、各所述目标比特位和各所述样本类别，生成可视化特征重要性数据。也即，本申请提供了一种量化测量特征重要性并进行可视化的方法，也即，在获取各目标特征维度和各所述目标特征维度对应的样本类别之后，基于预设哈希编码模型和各所述样本类别对应的预设哈希编码值即可进行各所述目标特征维度对应的特征重要性值的测量，其中，所述特征重要性值表示所述目标特征维度对模型的贡献度，进而实现了通过计算特征重要性值，量化测量各所述目标特征维度的重要性的目的，进而相比于目前的模型解释方法，本申通过计算特征重要性值的方式，可准确地且细致地测量每一特征对模型的重要性的程度，进而提高了模型解释的准确性，进而提高了模型解释效果，进一步地，基于各所述特征重要性值，进行各所述目标特征维度对应的目标比特位的确定，进而基于各所述特征重要性值、各所述目标比特位和各所述样本类别，即可进行可视化特征重要性数据的生成，进而实现了对各所述特征重要性值进行可视化的目的，提高了各所述特征重要性值的直观性和可读性，进而业务人员基于可视化特征重要性数据，可简单且直接地获得模型解释结果，进而提高了模型解释结果的直观性和可理解性，进而进一步地提高了模型解释效果，所以，解决了模型解释效果差的技术问题。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本申请的实施例，并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1为本申请特征重要性可视化方法第一实施例的流程示意图；

图2为本申请特征重要性可视化方法中所述第二初始连接强度图的示意图；

图3为本申请特征重要性可视化方法中所述目标连接强度图的示意图；

图4为本申请特征重要性可视化方法中所述预设深度极化网络的反向传播的示意图；

图5为本申请特征重要性可视化方法第二实施例的流程示意图；

图6为本申请实施例方案涉及的硬件运行环境的设备结构示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

本申请实施例提供一种特征重要性可视化方法，在本申请特征重要性可视化方法的第一实施例中，参照图1，所述特征重要性可视化方法包括：

步骤S10，获取各目标特征维度和各所述目标特征维度对应的样本类别，并基于预设哈希编码模型和各所述样本类别对应的预设哈希编码值，确定各所述目标特征维度对应的特征重要性值；

在本实施例中，一所述目标特征维度对应一个样本类别，且所述目标特征维度为对应的样本类别对应的样本集对应的待测量特征的集合，其中，所述样本集至少包括一个待测量样本，例如，假设所述样本类别为猫图像，则对应的所述目标特征维度包括毛发特征、眼睛特征等。

另外地，需要说明的是，所述预设哈希编码模型包括深度极化网络，其中，所述深度极化网络包括隐藏层和哈希层，其中，所述隐藏层为用于进行数据处理的一层或者多层神经网络，其中，所述数据处理包括卷积和池化等，所述哈希编码为用于对所述隐藏层的输出结果进行哈希的一层或者多层神经网络，所述样本集可用待测量样本矩阵进行表示，其中，所述待测量样本矩阵的每一行对应一个待测量特征，所述待测量样本矩阵的每一列对应一个待测量样本，例如，假设所述待测量样本矩阵为m*n的矩阵，则所述待测量样本矩阵对应m个所述待测量特征，对应n个所述待测量样本。

获取各目标特征维度和各所述目标特征维度对应的样本类别，并基于预设哈希编码模型和各所述样本类别对应的预设哈希编码值，确定各所述目标特征维度对应的特征重要性值，具体地，获取各目标特征维度，并确定各所述目标特征维度分别对应的样本类别，进而将各所述样本类别分别对应的样本集对应的待测量样本矩阵输入预设哈希编码模型，分别对各所述待测量样本矩阵进行哈希编码，获得每一所述待测量样本矩阵对应的各所述待测量样本的输出哈希编码值，进而获取各所述样本类别对应的预设哈希编码值，并基于每一所述样本类别对应的各所述输出哈希编码值和所述预设哈希编码值，确定各所述样本类别对应的所述目标特征维度分别对应的特征重要性值。

步骤S20，基于各所述特征重要性值，确定各所述目标特征维度对应的目标比特位。

在本实施例中，需要说明的是，所述特征重要性值为各所述目标特征维度对所述深度极化网络的重要程度的衡量值，其中，所述特征重要性值包括特征重要性表示向量，且所述特征重要性表示向量至少包括一个目标比特位，其中，每一所述目标比特位对应一所述样本类别，且所述目标比特位上的数值为所述目标比特位对应的目标特征维度与所述目标比特位对应的样本类别之间的吻合度。

基于各所述特征重要性值，确定各所述目标特征维度对应的目标比特位，具体地，分别获取每一所述特征重要性表示向量中的各目标比特位，并基于所述目标比特位和所述样本类别之间的一一映射关系和所述样本类别和所述目标特征维度之间的一一映射关系，确定各所述目标特征维度对应的目标比特位。

步骤S30，基于各所述特征重要性值、各所述目标比特位和各所述样本类别，生成可视化特征重要性数据。

在本实施例中，需要说明的是，各所述特征重要性表示向量可用特征重要性矩阵进行表示，其中，所述特征重要性矩阵为存储各所述特征重要性向量的矩阵，其中，所述特征重要性矩阵的每一列对应一所述目标比特位，所述特征重要性矩阵的每一行对应一所述样本类别，其中，所述目标比特位上的比特位数值为一所述目标比特位和一所述样本类别之间的吻合度，例如，假设所述特征重要性矩阵为K*C的矩阵，则所述特征重要性矩阵表示为K个比特位和C种目标样本分类之间的吻合度，也即所述特征重要性矩阵包括K*C个比特位数值，且若假设所述比特位数值的值域为[0.0，1.0]，则所述比特位数值越接近于1，所述比特位数值对应的所述吻合度越高，所述比特位数值越接近于0，所述比特位数值对应的所述吻合度越低。

基于各所述特征重要性值、各所述目标比特位和各所述样本类别，生成可视化特征重要性数据，具体地，生成各所述目标比特位对应的比特位节点和各所述样本类别对应的类别节点，进而基于每一所述特征重要性向量的比特位数值的大小，以不同粗细或者颜色的线段将各所述比特位节点和各所述类别节点进行连接，获得第一初始连接强度图，进而基于各所述比特位节点之间的比特位节点相似程度和各所述类别节点之间的类别节点相似程度，以不同粗细或者颜色的线段将分别将各所述比特位节点进行连接，将各所述类别节点进行连接，获得第二初始连接强度图，进一步地，分别对所述第二初始连接强度图中的各所述比特位节点和各所述类别节点进行聚类，获得目标连接强度图，如图2所示为所述第二初始连接强度图的示意图，其中，K表示比特位节点，C表示各类别节点，K₁至K₆为所述比特位节点，巴士、卡车、猫和狗均为所述类别节点，1.0、0.5和0.0均为所述特征重要性值的数值大小，如图3所示为所述目标连接强度图的示意图，其中，K_cluster表示聚类后的各比特位节点，C_cluster表示聚类后的各类别节点，K_1-2至K_3-6均为聚类后的所述比特位节点，交通和动物均为聚类后的所述类别节点，1.0、0.5和0.0均为所述特征重要性值的数值大小。

进一步地，需要说明的是，各所述比特位节点对应所述预设深度极化网络的输出层，基于所述预设深度极化网络的反向传播，在所述预设深度极化网络中可将各所述吻合度传递至更前面的深度极化网络层中，如图4所示为所述预设深度极化网络的反向传播的示意图，为将各所述吻合度传递至更前面的深度极化网络层中的示意图，其中，K^L-1表示为所述预设深度极化网络中第L-1层的深度极化网络层，K^L表示为所述预设深度极化网络中第L层的深度极化网络层，

和

均为第L-1层深度极化网络层的各神经元，

和

均为第L层深度极化网络层的各神经元，1.0、0.5和0.0均为所述特征重要性值的数值大小，也即，为各所述吻合度的数值大小，进一步地，基于用户命令，可对所述目标连接强度图的连接线段的粗细和颜色进行调整，以将经验性的逻辑判断规则融入所述目标连接强度图，进而基于所述预设深度极化网络的反向传播，实现基于经验性的逻辑判断规则，优化所述预设深度极化网络。

其中，所述可视化特征重要性数据包括目标连接强度图，所述特征重要性值包括所述目标比特位和各所述样本类别之间的各吻合度，其中，一所述目标比特位和一所述样本类别之间存在一所述吻合度，

步骤S21，生成各所述目标比特位对应的比特位节点和各所述目标样本类别对应的类别节点，并将各所述吻合度分别对应的所述比特位节点和所述类别节点进行连接，获得第一初始连接强度图；

在本实施例中，生成各所述目标比特位对应的比特位节点和各所述目标样本类别对应的类别节点，并将各所述吻合度分别对应的所述比特位节点和所述类别节点进行连接，获得第一初始连接强度图，具体地，生成各所述目标比特位对应的比特位节点和各所述样本类别对应的类别节点，并基于各所述吻合度的数值大小，以不同粗细或者颜色的线段，将每一所述吻合度对应的比特位节点和类别节点进行连接，获得所述第一初始连接强度图。

步骤S22，获取各所述比特位节点两两之间的比特位一致性结果和各所述类别节点两两之间的类别一致性结果；

在本实施例中，需要说明的是，所述比特位一致性结果为两个所述比特位节点之间的比特位节点相关程度，所述类别一致性结果为两个类别节点之间的类别节点相关程度。

获取各所述比特位节点两两之间的比特位一致性结果和各所述类别节点两两之间的类别一致性结果，具体地，获取各所述比特位节点对应的比特位表示向量，并基于各所述比特位表示向量，确定各所述比特位节点两两之间的所述比特位一致性结果，相同地，获取各所述类别节点对应的类别表示向量，并基于各所述类别表示向量，确定各所述类别节点两两之间的所述类别一致性结果。

其中，所述特征重要性值对应的特征重要性向量，

步骤S221，确定各所述比特位节点对应的所述特征重要性向量，并计算各所述特征重要性向量两两之间的夹角余弦值；

在本实施例中，需要说明的是，所述特征重要性向量为由所述比特位节点对应的各比特位数值组成的向量，例如，假设所述比特位节点连接3个类别节点，则所述比特位节点与每一所述类别节点之间均存在一比特位数值，进而假设3个所述比特位数值分别为a、b和c，则所述特征重要性向量为(a，b，c)。

确定各所述比特位节点对应的所述特征重要性向量，并计算各所述特征重要性向量两两之间的夹角余弦值，具体地，获取各所述比特位节点对应的特征重要性向量，并确定各所述特征重要性向量两两之间的特征重要性向量夹角，进而计算各所述特征重要性向量夹角的夹角余弦值。

步骤S222，基于各所述夹角余弦值，确定各所述比特位节点之间的比特位一致性结果。

在本实施例中，需要说明的是，所述比特位节点相关程度包括正相关性程度和负相关程度，所述夹角余弦值的值域为[-1，1]，其中，所述夹角余弦值越接近于1，则表示所述夹角余弦值对应的两个比特位正相关程度越高，所述夹角余弦值越接近于-1，则表示所述夹角余弦值对应的两个比特位负相关程度越高，所述夹角余弦值越接近于0，则表示所述夹角余弦值对应的两个比特位负相关程度或者正相关程度越低。

相同地，获取各所述类别节点对应的样本类别表示向量，并计算各所述样本类别表示向量两两之间的夹角余弦值，进而基于各夹角余弦值，确定各所述类别节点之间的类别一致性结果，其中，所述样本类别表示向量为由所述类别节点对应的各所述比特位数值组成的向量，例如，假设所述类别节点连接3个比特位节点，则所述类别节点与每一所述比特位节点之间均存在一比特位数值，进而假设3个所述比特位数值分别为a、b和c，则所述样本类别表示向量为(a，b，c)。

步骤S23，基于各所述比特位一致性结果，在所述第一初始连接强度图中对各所述比特位节点进行连接，并基于各所述类别一致性结果，对各所述类别节点进行连接，获得第二初始连接强度图；

在本实施例中，基于各所述比特位一致性结果，在所述第一初始连接强度图中对各所述比特位节点进行连接，并基于各所述类别一致性结果，对各所述类别节点进行连接，获得第二初始连接强度图，具体地，基于各所述比特位一致性结果对应的夹角余弦值，以不同粗细的线段，在所述第一初始连接强度图中对各所述比特位节点进行连接，其中，可为不同粗细的线段赋予不同的颜色，以标识两个所述比特位节点正相关或者负相关，相同地，基于各所述类别一致性结果对应的夹角余弦值，以不同粗细的线段，在所述第一初始连接强度图中对各所述类别节点进行连接，其中，可为不同粗细的线段赋予不同的颜色，以标识两个所述类别节点正相关或者负相关。

步骤S24，在所述第二初始连接强度图中分别对各所述比特位节点和各所述类别节点进行聚类，获得所述目标连接强度图。

在本实施例中，在所述第二初始连接强度图中分别对各所述比特位节点和各所述类别节点进行聚类，获得所述目标连接强度图，具体地，获取所述第二初始连接强度图中相邻的各比特位节点之间的比特位节点相关程度和相邻的各比特位节点之间的所述类别节点相关程度，进而基于各所述比特位节点相关程度，对各所述比特位节点进行聚类，并基于各所述类别节点相关程度，对各所述类别节点进行聚类，获得目标连接强度图。

其中，所述分别对各所述比特位节点和各所述类别节点进行聚类，获得所述目标连接强度图的步骤包括：

步骤S241，获取各所述比特位节点之间的比特位关联性值和各所述类别节点之间的类别关联性值；

在本实施例中，需要说明的是，所述比特位关联性值为所述比特位节点相关程度对应的数值，也即，为两所述特征重要性向量之间的夹角余弦值，所述类别关联性值为所述类别节点相关程度对应的数值，也即，为两所述样本类别表示向量之间的夹角余弦值。

步骤S242，基于各所述比特位关联性值，对各所述比特位节点进行聚类，获得第一聚类结果，并基于各所述类别关联性值，对各所述类别节点进行聚类，获得第二聚类结果。

在本实施例中，基于各所述比特位关联性值，对各所述比特位节点进行聚类，获得第一聚类结果，并基于各所述类别关联性值，对各所述类别节点进行聚类，获得第二聚类结果，具体地，将各所述比特位关联性值与预设比特位关联性阀值进行比对，若所述比特位关联性值大于或者等于所述预设比特位关联性阀值，则将所述比特位关联性值对应的两个相邻比特位节点合并为一个比特位合并节点，在大于或者等于所述预设比特位关联性阀值的每一所述比特位关联性值对应的相邻比特位节点均合并完毕后，将各所述比特位合并节点作为所述第一聚类结果，相同地，将各所述类别关联性值与预设类别关联性阀值进行比对，若所述类别关联性值大于或者等于所述预设类别关联性阀值，则将所述类别关联性值对应的两个相邻类别节点合并为一个类别合并节点，在大于或者等于所述预设类别关联性阀值的每一所述类别关联性值对应的相邻类别节点均合并完毕后，将各所述类别合并节点作为所述第二聚类结果，例如，假设各所述比特位节点包括a节点、b节点、c节点和d节点，且a已连接到b，b连接到c，c连接到d，且b和c、c和d之间的比特位关联性值均大于预设比特位关联性阀值，则聚类后存在a节点和b-c-d节点两个节点。

其中，所述基于各所述比特位关联性值，对各所述比特位节点进行聚类，获得第一聚类结果，并基于各所述类别关联性值，对各所述类别节点进行聚类，获得第二聚类结果的步骤包括：

步骤A10，将各所述比特位关联性值分别与预设比特位关联性阀值进行比对，确定各所述比特位关联性值中大于或者等于所述预设比特位关联性阀值的各第一目标关联性值；

在本实施例中，需要说明的是，一所述比特位关联性值对应两个比特位节点，所述预设比特位关联性阀值为预先设置好的比特位节点相关程度阀值。

将各所述比特位关联性值分别与预设比特位关联性阀值进行比对，确定各所述比特位关联性值中大于或者等于所述预设比特位关联性阀值的各第一目标关联性值，具体地，针对于每一所述比特位关联性值，将所述比特位关联性值与预设比特位关联性阀值进行比对，若所述比特位关联性值大于或者等于所述预设比特位关联性阀值，则确定所述比特位关联性值对应的两个所述比特位节点可合并为一个比特位合并节点，并将所述比特位关联性值作为所述第一目标关联性值。

步骤A20，分别将各所述第一目标关联性值对应的相邻比特位节点进行聚类，获得各所述聚类比特位节点；

在本实施例中，需要说明的是，所述相邻比特位节点包括相邻的两个比特位节点。

分别将各所述第一目标关联性值对应的相邻比特位节点进行聚类，获得各所述聚类比特位节点，具体地，针对于每一所述第一目标关联性值，对所述第一目标关联性值对应的相邻比特位节点进行合并，获得各所述比特位合并节点，并基于各所述比特位合并节点，生成各所述聚类比特位节点，例如，假设比特位合并节点A由比特位节点a和比特位节点b合并而获得，比特位合并节点B由比特位节点b和比特位节点c合并而获得，则比特位合并节点A和比特位合并节点B可合并为比特位聚类节点C，其中，所述比特位聚类节点中包括比特位节点a、比特位节点b和比特位节点c。

步骤A30，将各所述类别关联性值分别与预设类别关联性阀值进行比对，确定各所述类别关联性值中大于或者等于所述预设类别关联性阀值的各第二目标关联性值；

在本实施例中，需要说明的是，一所述类别关联性值对应两个类别节点，所述预设类别关联性阀值为预先设置好的类别节点相关程度阀值。

将各所述类别关联性值分别与预设类别关联性阀值进行比对，确定各所述类别关联性值中大于或者等于所述预设类别关联性阀值的各第二目标关联性值，具体地，针对于每一所述类别关联性值，将所述类别关联性值与预设类别关联性阀值进行比对，若所述类别关联性值大于或者等于所述预设类别关联性阀值，则确定所述类别关联性值对应的两个所述类别节点可合并为一个类别合并节点，并将所述类别关联性值作为所述第二目标关联性值，若所述类别关联性值小于所述预设类别关联性阀值，则确定所述类别关联性值对应的两个所述类别节点不可进行聚类，进而获得各所述第二目标关联性值。

步骤A40，分别将所述第二目标关联性值对应的相邻类别节点进行聚类，获得各所述聚类类别节点。

在本实施例中，需要说明的是，所述相邻类别节点包括相邻的两个类别节点。

分别将所述第二目标关联性值对应的相邻类别节点进行聚类，获得各所述聚类类别节点，具体地，针对于每一所述第二目标关联性值，对所述第二目标关联性值对应的相邻类别节点进行合并，获得各所述类别合并节点，并基于各所述类别合并节点，生成各所述聚类类别节点。

步骤S243，基于所述第一聚类结果和所述第二聚类结果，生成所述目标连接强度图。

基于所述第一聚类结果和所述第二聚类结果，生成所述目标连接强度图，具体地，基于所述第一聚类结果和所述第二聚类结果，生成所述第二初始连接强度图对应的聚类连接强度图，并确定所述聚类连接强度图是否满足预设聚类结束条件，若所述聚类连接强度图满足所述预设聚类结束条件，则将所述聚类连接强度图作为所述目标连接强度图，若所述聚类连接强度图不满足所述预设聚类结束条件，则重新对所述聚类连接强度图中的各节点进行聚类处理，直至所述聚类连接强度图满足所述预设聚类结束条件，其中，所述预设聚类结束条件为确定是否停止进行聚类的条件，其中，所述预设聚类结束条件包括达到最小节点数量、达到最大聚类次数等，每进行一次所述聚类处理，均会产生一个所述聚类连接强度图，进而可将所述第二初始连接强度图、各所述聚类连接强度图和所述目标连接强度图以预设可视化展示方式进行展示，其中，所述预设可视化展示方式包括顺序分屏展示、并行同屏展示和交叉滑动切换展示等。

本实施例通过获取各目标特征维度和各所述目标特征维度对应的样本类别，并基于预设哈希编码模型和各所述样本类别对应的预设哈希编码值，确定各所述目标特征维度对应的特征重要性值，进而基于各所述特征重要性值，确定各所述目标特征维度对应的目标比特位，进而基于各所述特征重要性值、各所述目标比特位和各所述样本类别，生成可视化特征重要性数据。也即，本实施例提供了一种量化测量特征重要性并进行可视化的方法，也即，在获取各目标特征维度和各所述目标特征维度对应的样本类别之后，基于预设哈希编码模型和各所述样本类别对应的预设哈希编码值即可进行各所述目标特征维度对应的特征重要性值的测量，其中，所述特征重要性值表示所述目标特征维度对模型的贡献度，进而实现了通过计算特征重要性值，量化测量各所述目标特征维度的重要性的目的，进而相比于目前的模型解释方法，本申通过计算特征重要性值的方式，可准确地且细致地测量每一特征对模型的重要性的程度，进而提高了模型解释的准确性，进而提高了模型解释效果，进一步地，基于各所述特征重要性值，进行各所述目标特征维度对应的目标比特位的确定，进而基于各所述特征重要性值、各所述目标比特位和各所述样本类别，即可进行可视化特征重要性数据的生成，进而实现了对各所述特征重要性值进行可视化的目的，提高了各所述特征重要性值的直观性和可读性，进而业务人员基于可视化特征重要性数据，可简单且直接地获得模型解释结果，进而提高了模型解释结果的直观性和可理解性，进而进一步地提高了模型解释效果，所以，解决了模型解释效果差的技术问题。

进一步地，参照图5，基于本申请中第一实施例，在本申请的另一实施例中，所述基于预设哈希编码模型和各所述样本类别对应的预设哈希编码值，确定各所述目标特征维度对应的特征重要性值的步骤包括：

步骤S11，将各所述样本类别分别对应的样本集输入预设哈希编码模型，得到各所述样本类别分别对应的输出哈希编码值；

在本实施例中，将各所述样本类别分别对应的样本集输入预设哈希编码模型，得到各所述样本类别分别对应的输出哈希编码值，具体地，将所述样本集对应的待测量样本矩阵输入所述深度极化网络的隐藏层，对所述待测量样本矩阵进行数据处理，获得待测量样本特征表示矩阵，其中，所述待测量样本特征表示矩阵包括所述样本集中的所有特征信息，进而把所述待测量样本特征表示矩阵输入所述哈希层，对所述待测量样本特征表示矩阵进行哈希编码，获得哈希编码结果。

其中，在所述将各所述样本类别分别对应的样本集输入预设哈希编码模型，得到各所述样本类别分别对应的输出哈希编码值的步骤之前，所述特征重要性可视化方法包括：

步骤A10，获取训练数据和待训练哈希模型，并基于预设目标哈希编码方式，生成所述训练数据对应的目标哈希编码结果；

在本实施例中，需要说明的是，在本实施例中，需要说明的是，所述待训练哈希编码模型为未训练好的神经网络模型，所述预设目标哈希编码方式可为预先设定好的任意一种哈希编码方式，所述训练数据为用于训练所述待训练哈希编码模型的训练样本，所述预设哈希编码值为所述训练样本所属的训练样本类别对应的哈希编码值，其中，一所述训练样本类别对应一所述预设哈希编码值，所述训练样本类别至少包括一个训练样本。

获取训练数据和待训练哈希编码模型，并基于预设目标哈希编码方式，生成所述训练数据对应的所述预设哈希编码值，具体地，从预设训练数据存储数据库中提取所述训练样本和待训练哈希编码模型，并基于预设目标哈希编码方式，对所述训练样本进行哈希编码，生成所述训练样本所属的训练样本类别对应的预设哈希编码值。

其中，在步骤A10中，所述预设目标哈希编码方式包括随机目标哈希编码和自适应目标哈希编码，

所述基于预设目标哈希编码方式，生成所述训练数据对应的所述预设哈希编码值的步骤包括：

步骤A11，对所述训练数据进行所述随机目标哈希编码，获得所述预设哈希编码值；

在本实施例中，需要说明的是，若所述预设目标哈希编码方式为随机目标哈希编码，则所述目标哈希编码结果中属于不同分类样本的对应的目标哈希向量之间的汉明距离应为目标汉明距离2*K*p*(1-p)，其中，K为所述目标哈希向量中比特位的数量，p为所述目标哈希向量对应的样本属于所述分类样本的概率，例如，假设训练数据包括两个分类向量，K为32比特，所述分类样本包括猫和狗，若所述分类向量对应的样本属于猫的概率为0.5，属于狗的概率为0.5，则猫对应的目标哈希向量与狗对应的目标哈希向量之间的最大汉明距离为16。

对所述训练数据进行所述随机目标哈希编码，获得所述预设哈希编码值，具体地，基于预设高斯随机方法，生成所述训练样本对应的预设哈希编码值。

步骤A12，对所述训练数据进行所述自适应目标哈希编码，获得所述预设哈希编码值。

在本实施例，对所述训练数据进行所述自适应目标哈希编码，获得所述预设哈希编码值，具体地，获取所述训练数据对应的训练样本类别的多个训练样本，以基于预设高斯随机方法分别生成各所述训练样本对应的随机哈希编码值，其中，一所述训练样本对应一个所述随机哈希编码值，进而确定各所述训练样本类别中每一所述训练样本对应的随机哈希编码值，并分别求取每一所述训练样本类别对应的各随机哈希编码值的平均值，获得各所述训练样本类别对应的平均哈希编码值，进而将所述平均哈希编码值作为对应的训练样本类别中所有训练样本对应的预设哈希编码值。

步骤A20，基于所述预设哈希编码值和所述训练数据，对所述待训练哈希编码模型进行迭代训练，以优化所述待训练哈希编码模型对应的预设极化损失函数，直至所述待训练哈希编码模型达到预设迭代结束条件，获得所述预设哈希编码模型。

在本实施例中，需要说明的是，所述预设迭代结束条件包括达到预设迭代次数阀值、预设极化损失函数收敛等，所述迭代训练包括一轮或者多轮训练。

基于所述预设哈希编码值和所述训练数据，对所述待训练哈希编码模型进行迭代训练，以优化所述待训练哈希编码模型对应的预设极化损失函数，直至所述待训练哈希编码模型达到预设迭代结束条件，获得所述预设哈希编码模型，具体地，将所述训练数据输入所述待训练哈希编码模型，以基于所述预设哈希编码值，对所述待训练哈希编码模型进行训练更新，并判断训练更新后的所述待训练哈希编码模型是否满足预设迭代结束条件，若训练更新后的所述待训练哈希编码模型满足预设迭代结束条件，则将训练更新后的所述待训练哈希编码模型作为所述预设哈希编码模型，若训练更新后的所述待训练哈希编码模型不满足预设迭代结束条件，则获取所述待训练哈希编码模型基于所述训练数据输出的初始哈希编码值，并基于所述初始哈希编码值和所述预设哈希编码值，优化所述待训练哈希编码模型的各极化输出通道对应的预设极化损失函数，并重新所述待训练哈希编码模型进行训练更新，直至训练更新后的所述待训练哈希编码模型满足预设迭代结束条件。

其中，所述基于所述预设目标哈希值和所述训练数据，对所述待训练哈希编码模型进行迭代训练，直至所述待训练哈希编码模型达到预设迭代结束条件，获得所述预设哈希编码模型的步骤包括：

步骤B21，将所述训练数据输入所述待训练哈希编码模型，以基于所述预设极化损失函数，对所述训练数据进行哈希编码，获得初始哈希编码值；

在本实施例中，所述训练数据至少包括一个训练样本，所述初始哈希编码值包括各所述训练样本对应的初始哈希编码值。

将所述训练数据输入所述待训练哈希编码模型，以基于所述预设极化损失函数，对所述训练数据进行哈希编码，获得初始哈希编码值，具体地，将所述训练样本对应的待处理训练矩阵输入所述待训练哈希编码模型，其中，所述待处理训练矩阵为训练样本的矩阵表示形式，进而对所述待处理训练矩阵进行哈希，获得训练哈希向量，进而基于所述预设极化损失函数，对所述训练哈希向量的每一比特位进行强制极化，获得所述训练哈希向量对应的训练极化向量，进而基于所述训练极化向量中每一比特位对应的极化标识，生成所述训练样本对应的初始哈希编码值，其中，所述预设极化损失函数如下所示，

L(v，t^c)＝max(m-v*t^c，0)

其中，L为所述预设极化损失函数，m为预设强制极化参数，v为所述训练哈希向量中每一哈希向量比特位上的数值，且v的绝对值大于m，t^c为所述哈希向量比特位对应的目标哈希值，所述目标哈希值为所述训练样本对应的预设哈希编码值上的比特位数值，且t^c＝{-1,+1}，且所述预设极化损失函数收敛于0，例如，假设m为1，t^c为1，v为-1，此时，L＝2，若要使得预设极化损失函数收敛于0，则需要对v进行强制极化，使得v为1，此时L＝0，进而当t^c等于1时，所述训练哈希向量比特位上的数值将朝正方向逐渐远离0，当t^c等于-1时，所述训练哈希向量比特位上的数值将朝负方向逐渐远离0，进而在极化成功后，获得的训练极化向量中每一比特位的极化标识应与对应的目标哈希值一致，进一步地，由于同一训练样本类别的预设哈希编码值相同，所以属于同一训练样本类别的各训练样本对应的训练极化向量中每一比特位上的极化标识一致，进而基于各极化标识，获得的模型输出值一致，也即，对于属于同一样本类别的模型输入样本，基于训练好的所述预设哈希编码模型可获得相同的哈希编码值。

另外地，需要说明的是，所述训练哈希向量中每一比特位均对应所述待训练哈希编码模型中的一极化输出通道，每一所述极化输出通道对应的预设强制极化参数均由对所述哈希编码模型进行训练优化而得到，进而每一所述极化输出通道对应的预设强制极化参数可能相同，也可能不同，其中，所述极化输出通道用于基于所述预设强制极化参数，通过对应的所述预设极化损失函数，强制极化所述训练哈希向量中对应的比特位上的数值，并输出所述初始哈希编码值中对应的比特位的编码数值。

步骤A22，计算所述初始哈希编码值和所述预设哈希编码值之间的训练汉明距离，并将所述训练汉明距离与预设汉明距离阀值进行比对；

在本实施例中，计算所述初始哈希编码值和所述预设哈希编码值之间的训练汉明距离，并将所述训练汉明距离与预设汉明距离阀值进行比对，具体地，将所述初始哈希编码值的每一比特位上的数值与所述预设哈希编码值的每一比特位上的数值进行比对，确定所述初始哈希编码值和所述预设哈希编码值之间比特位数值不相同的比特位数量，并将所述比特位数量作为所述训练汉明距离，并将所述训练汉明距离与预设汉明距离阀值进行比对，例如，假设所述初始哈希编码值为向量(1，1，1，1)，所述目标哈希编码结果为向量(-1，1，1，-1)，则所述比特位数量为2，则所述训练汉明距离为2。

步骤A23，若所述训练汉明距离大于所述预设汉明距离阀值，则判定所述待训练哈希层未达到所述预设迭代结束条件，并基于所述初始哈希编码值优化所述预设极化损失函数；

在本实施例中，若所述训练汉明距离大于所述预设汉明距离阀值，则判定所述待训练哈希层未达到所述预设迭代结束条件，并基于所述初始哈希编码值优化所述预设极化损失函数，具体地，若所述训练汉明距离大于所述预设汉明距离阀值，则判定所述预设极化损失函数并未在所有所述极化输出通道上收敛，也即，所述预设极化损失函数未收敛，进而判定所述待训练哈希编码模型未达到所述预设迭代结束条件，进而确定所述初始哈希编码值和所述预设哈希编码值之间的一个或者多个相异比特位，并确定各所述相异比特位对应的未收敛极化输出通道，进而调整各所述未收敛极化输出通道对应的预设极化损失函数中的预设强制极化参数，其中，所述未收敛极化输出通道为未收敛的预设极化损失函数对应的极化输出通道，其中，所述待训练哈希编码模型至少包括一个极化输出通道，且所述极化输出通道的数量与所述训练哈希向量中的比特位的数量相关，也即，一所述训练哈希向量中的比特位对应一所述极化输出通道。

步骤A24，基于优化后的所述预设极化损失函数，重新进行所述待训练哈希编码模型的训练，直至所述训练汉明距离小于或者等于所述预设汉明距离阀值；

在本实施例中，基于优化后的所述预设极化损失函数，重新进行所述待训练哈希编码模型的训练，直至所述训练汉明距离小于或者等于所述预设汉明距离阀值，具体地，重新获取所述训练数据，并基于重新获取的训练数据，对优化后的所述预设极化损失函数对应的待训练哈希编码模型重新进行迭代训练，以继续优化所述预设极化损失函数，直至所述训练汉明距离小于或者等于所述预设汉明距离阀值。

步骤A25，若所述训练汉明距离小于或者等于所述预设汉明距离阀值，则判定所述待训练哈希编码模型达到所述预设迭代结束条件，并将所述待训练哈希编码模型作为所述预设哈希编码模型。

在本实施例中，若所述训练汉明距离小于或者等于所述预设汉明距离阀值，则判定所述待训练哈希编码模型达到所述预设迭代结束条件，并将所述待训练哈希编码模型作为所述预设哈希编码模型，具体地，若所述训练汉明距离小于或者等于所述预设汉明距离阀值，则判定所述待训练哈希编码模型达到所述预设迭代结束条件，也即，所述待训练哈希编码模型中各所述极化输出通道对应的预设极化损失函数收敛，进而将所述待训练哈希编码模型作为所述预设哈希编码模型。

另外地，需要说明的是，目前基于深度学习的哈希编码方式，通常以成对相似度标签为训练目标，且在训练时需加上约束条件，进而导致在训练预设哈希编码模型时需要进行优化的参数变多，而本实施例中训练预设哈希编码模型时，只需基于简单的极化损失函数，即可完成预设哈希编码模型的优化，进行避免了以成对相似度标签为训练目标，且在训练时需加上约束条件以训练预设哈希编码模型的情况发生，进而可显著提高预设哈希编码模型构建效率。

步骤S12，获取各所述样本类别对应的预设哈希编码值，并基于各所述输出哈希编码值和各所述预设哈希编码值，确定各所述目标特征维度对应的分类关联强度结果；

在本实施例中，需要说明的是，一所述样本类别对应存在一所述预设哈希编码值，其中，所述预设哈希编码值为基于预设目标哈希编码方式，预先生成的哈希编码值，且所述预设哈希编码值为在训练所述预设哈希编码模型时，给定的各所样本类别对应的标准哈希结果，其中，所述预设目标哈希编码方式可为预先设定好的任意一种哈希编码方式。

获取各所述样本类别对应的预设哈希编码值，并基于各所述输出哈希编码值和各所述预设哈希编码值，确定各所述目标特征维度对应的分类关联强度结果，具体地，获取各所述样本类别对应的预设哈希编码值，在各所述预设哈希编码值中确定每一所述样本类别中各待测量样本对应的同类目标哈希值和各异类目标哈希值，其中，所述同类目标哈希值为所述待测量样本所述样本类别对应的预设哈希编码值，所述异类目标哈希值为除所述待测量样本所属样本类别之外其他样本类别分类对应的预设哈希编码值，例如，假设所述样本类别包括样本类别A、样本类别B和样本类别C，且所述样本类别A对应的预设哈希编码值为a，所述样本类别B对应的预设哈希编码值为b，所述样本类别C对应的预设哈希编码值为c，则对于样本类别A，所述同类目标哈希值为a，各所述异类目标哈希值为b和c，进一步地，对每一所述样本类别，均执行以下步骤：

确定所述样本类别中各待测量样本对应的输出哈希编码值，进而计算各所述输出哈希编码值与所述同类目标哈希值之间的第一汉明距离，并对各所述第一汉明距离求平均，获得第一目标汉明距离，进一步地，分别计算所述样本类别对应的各所述输出哈希编码值和各异类目标哈希值之间的第二汉明距离，其中，每一所述哈希编码值和每一所述异类目标哈希值之间均存在一所述第二汉明距离，进而对每一所述异类目标哈希值分别对应的各所述第二汉明距离求平均，获得各所述异类目标哈希值对应的第二目标汉明距离，进而将所述第一目标汉明距离和所述各第二目标汉明距离转换为分类关联强度表示向量，例如，假设所述分类关联强度表示向量为D(k，c)，则k为比特位，所述比特位为所述第一目标汉明距离和各所述第二目标汉明距离，c表示各所述输出哈希编码值对应的样本类别为第c类，进一步地，在获取各所述分类关联强度表示向量之后，则执行以下步骤：

基于各所述分类关联强度表示向量，生成各所述样本集对应的分类关联强度矩阵，并将所述分类关联强度矩阵作为所述分类关联强度结果，例如，将每一所述分类关联强度表示向量作为所述分类关联强度矩阵的一列或者一行，生成所述分类关联强度矩阵等。

另外地，为了消除随机误差，重新获取各目标特征维度对应的样本集，并基于各所述样本集，重复执行预设次数的上述步骤S11至步骤S12，获得多个分类关联强度结果，并对各所述分类关联强度结果求平均，获得目标分类关联强度结果，并对所述目标分类关联强度结果进行归一化处理，获得特征重要性结果。

所述分类关联强度结果至少包括一个关联强度值，一所述目标特征维度对应一所述关联强度值，

步骤S121，在各所述预设哈希编码值中确定各所述样本类别分别对应的同类目标哈希值和各异类目标哈希值，并在各所述输出哈希编码值中确定各所述样本类别分别对应的哈希编码值；

在本实施例中，需要说明的是，所述同类目标哈希值为所述待测量样本所述样本类别对应的预设哈希编码值，所述异类目标哈希值为除所述待测量样本所属样本类别之外其他样本类别分类对应的预设哈希编码值，且所述样本类别至少包括一个待测量样本，其中，一所述待测量样本对应一所述输出哈希编码值。

步骤S122，基于各所述样本类别分别对应的各所述哈希编码值、所述同类目标哈希值和各所述异类目标哈希值，计算各所述目标特征维度对应的所述关联强度值。

在本实施例中，需要说明的是，所述关联强度值可用分类关联强度表示向量进行表示，例如，假设所述关联强度值对应的向量为D(k，c)，则k为所述关联强度值的数值，c为所述关联强度值对应的样本类别的标识。

基于各所述样本类别分别对应的各所述哈希编码值、所述同类目标哈希值和各所述异类目标哈希值，计算各所述目标特征维度对应的所述关联强度值，具体地，针对于每一所述样本类别均执行以下步骤：

计算所述样本类别中各所述待测量样本对应的所述哈希编码值和所述同类目标哈希值之间的第一汉明距离，并对各所述第一汉明距离求平均，获得第一目标汉明距离，进一步地，计算每一所述哈希编码值和每一所述异类目标哈希值两两之间的第二汉明距离，并对每一所述异类目标哈希值分别对应的各所述第二汉明距离求平均，获得各所述异类目标哈希值对应的第二目标汉明距离，将所述第一目标汉明距离、各所述第二目标汉明距离和所述样本类别对应的样本类别标识转换为分类关联强度表示向量，例如，假设第一目标汉明距离为a，各第二目标汉明距离分别为b，m，n，所述样本类别标识为c，则所述分类关联强度表示向量为(a，b，m，n，c)。

步骤S13，根据所述分类关联强度结果中的各关联强度值，确定各所述目标特征维度分别对应的特征重要性值。

在本实施例中，需要说明的是，所述分类关联强度结果为各所述分类关联强度表示向量组成的分类关联强度矩阵，例如，假设各所述分类关联强度表示向量分别为D(k₁，c₁)、D(k₂，c₁)和D(k₃，c₃)，则所述分类关联强度矩阵为{D(k₁，c₁)，D(k₂，c₁)，D(k₃，c₃)}。

根据所述分类关联强度结果中的各关联强度值，确定各所述目标特征维度分别对应的特征重要性值，具体地，基于预设变换函数，对所述分类关联性强度结果进行归一化处理，以将各所述分类关联强度表示向量中的第一关联强度表示值和第二关联强度表示值映射至预设值域，其中，所述预设值域包括值域上阀值和值域下阀值，所述特征重要性值处于所述预设值域中，且需要说明的是，对于所述第一关联强度表示值，所述第一关联强度表示值对应的特征重要性值越接近上阀值，则表示所述第一关联强度表示值对应的样本类别对应的特征的重要性越高，且对于所述第二关联强度表示值，所述第二关联强度表示值对应的特征重要性值越接近下阀值，则表示所述第二关联强度表示值对应的样本类别对应的特征的重要性越高，进一步地，获得所述特征重要性结果，其中，所述预设变换函数为用于将所述关联强度值映射至预设值域的函数，其中，所述预设变换函数如下所示：

其中，所述预设变换函数可为如下函数之一，

1、a_kc＝1.0-～D_n(k，c)

2、a_kc＝exp(-～D_n(k，c))，其中～D_n(k，c)＝(～D_n(k，c)-Dmin)/(Dmax-Dmin)

其中，A＝[a_kc，…]为各所述特征重要性值对应的特征重要性表示矩阵，所述特征重要性表示矩阵是K*C的矩阵，其数值大小代表K个比特位与C种样本类别之间的吻合程度，也即为K个比特位对应的特征对于所述深度极化网络的重要性，其中，每一所述比特位上均存在所述第一关联强度表示值对应的特征重要性值和所述第二关联强度表示值对应的特征重要性值，～D_n(k，c)为所述分类关联强度表示向量，a_kc为归一化处理后的所述分类关联强度表示向量，Dmax为长度最长的所述分类关联强度表示向量，Dmin为长度最短的所述分类关联强度表示向量，A的值域为所述预设值域，其中，A的值域在[0.0，1.0]。

本实施例通过将各所述样本类别分别对应的样本集输入预设哈希编码模型，得到各所述样本类别分别对应的输出哈希编码值，进而获取各所述样本类别对应的预设哈希编码值，并基于各所述输出哈希编码值和各所述预设哈希编码值，确定各所述目标特征维度对应的分类关联强度结果，进而根据所述分类关联强度结果中的各关联强度值，确定各所述目标特征维度分别对应的特征重要性值。也即，本申请在确定各所述目标特征维度分别对应的样本类别之后，基于每一所述样本类别对应的输出哈希编码值和预设哈希编码值，即可确定各所述目标特征维度对应的分类关联强度结果，进而根据所述分类关联强度结果中的各关联强度值，即可确定各所述目标特征维度分别对应的特征重要性值，其中，所述特征重要性值表示所述目标特征维度对模型的贡献度，进而实现了通过计算特征重要性值，量化测量各所述目标特征维度的重要性的目的，进而相比于目前的模型解释方法，通过计算特征重要性值的方式，可准确地且细致地测量每一特征维度对模型的重要性的程度，进而提高了特征重要性测量的准确度，进而使得模型解释更加直观和准确，提高了模型解释效果，所以，解决了模型解释效果差的技术问题。

参照图6，图6是本申请实施例方案涉及的硬件运行环境的设备结构示意图。

如图6所示，该特征重要性可视化设备可以包括：处理器1001，例如CPU，存储器1005，通信总线1002。其中，通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器，也可以是稳定的存储器(non-volatile memory)，例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。

可选地，该特征重要性可视化设备还可以包括矩形用户接口、网络接口、摄像头、RF(Radio Frequency，射频)电路，传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard)，可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。

本领域技术人员可以理解，图6中示出的特征重要性可视化设备结构并不构成对特征重要性可视化设备的限定，可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

如图6所示，作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及特征重要性可视化程序。操作系统是管理和控制特征重要性可视化设备硬件和软件资源的程序，支持特征重要性可视化程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信，以及与特征重要性可视化系统中其它硬件和软件之间通信。

在图6所示的特征重要性可视化设备中，处理器1001用于执行存储器1005中存储的特征重要性可视化程序，实现上述任一项所述的特征重要性可视化方法的步骤。

本申请特征重要性可视化设备具体实施方式与上述特征重要性可视化方法各实施例基本相同，在此不再赘述。

本申请实施例还提供一种特征重要性可视化装置，所述特征重要性可视化装置应用于特征重要性可视化设备，所述特征重要性可视化装置包括：

可选地，所述生成模块包括：

可选地，所述获取子模块包括：

可选地，所述聚类子模块包括：

可选地，所述聚类单元包括：

可选地，所述第一确定模块包括：

可选地，所述第一确定子模块包括：

可选地，所述特征重要性可视化装置还包括：

本申请特征重要性可视化装置的具体实施方式与上述特征重要性可视化方法各实施例基本相同，在此不再赘述。

本申请实施例提供了一种可读存储介质，且所述可读存储介质存储有一个或者一个以上程序，所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的特征重要性可视化方法的步骤。

本申请可读存储介质具体实施方式与上述特征重要性可视化方法各实施例基本相同，在此不再赘述。

以上仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利处理范围内。

Claims

1.一种特征重要性可视化方法，其特征在于，所述特征重要性可视化方法包括：

2.如权利要求1所述特征重要性可视化方法，其特征在于，所述可视化特征重要性数据包括目标连接强度图，所述特征重要性值包括所述目标比特位和各所述样本类别之间的各吻合度，其中，一所述目标比特位和一所述样本类别之间存在一所述吻合度，

3.如权利要求2所述特征重要性可视化方法，其特征在于，所述特征重要性值对应的特征重要性向量，

4.如权利要求2所述特征重要性可视化方法，其特征在于，所述分别对各所述比特位节点和各所述类别节点进行聚类，获得所述目标连接强度图的步骤包括：

5.如权利要求4所述特征重要性可视化方法，其特征在于，所述第一聚类结果包括各所述比特位节点共同对应的一个或者多个聚类比特位节点，所述第二聚类结果包括各所述类别节点共同对应的一个或者多个聚类类别节点，

6.如权利要求1所述特征重要性可视化方法，其特征在于，所述基于预设哈希编码模型和各所述样本类别对应的预设哈希编码值，确定各所述目标特征维度对应的特征重要性值的步骤包括：

7.如权利要求6所述特征重要性可视化方法，其特征在于，所述分类关联强度结果至少包括一个关联强度值，一所述目标特征维度对应一所述关联强度值，

8.如权利要求6所述特征重要性可视化方法，其特征在于，在所述将各所述样本类别分别对应的样本集输入预设哈希编码模型，得到各所述样本类别分别对应的输出哈希编码值的步骤之前，所述特征重要性可视化方法包括：

9.一种特征重要性可视化设备，其特征在于，所述特征重要性可视化设备包括：存储器、处理器以及存储在存储器上的用于实现所述特征重要性可视化方法的程序，

所述存储器用于存储实现特征重要性可视化方法的程序；

所述处理器用于执行实现所述特征重要性可视化方法的程序，以实现如权利要求1至8中任一项所述特征重要性可视化方法的步骤。

10.一种可读存储介质，其特征在于，所述可读存储介质上存储有实现特征重要性可视化方法的程序，所述实现特征重要性可视化方法的程序被处理器执行以实现如权利要求1至8中任一项所述特征重要性可视化方法的步骤。