CN111754103A

CN111754103A - 企业风险画像方法、装置、计算机设备和可读存储介质

Info

Publication number: CN111754103A
Application number: CN202010574338.3A
Authority: CN
Inventors: 李果夫; 李毅琳; 李燕婷; 李贤杰; 高寒冰
Original assignee: Ping An Asset Management Co Ltd
Current assignee: Ping An Asset Management Co Ltd
Priority date: 2020-06-22
Filing date: 2020-06-22
Publication date: 2020-10-09

Abstract

本发明涉及区块链&人工智能&智慧城市&宏观经济，提供了一种企业风险画像方法、装置、计算机设备和可读存储介质。该方法包括：确定对目标企业进行风险画像时的目标风险指标；获取企业样本数据集；选定预选画像向量；对学习模型进行训练；将测试集中多条样本数据的预选画像向量输入训练好的学习模型，得到的输出为指标测试值；比对指标测试值和测试集中对应的指标样本值，判断训练好的学习模型的正确率是否大于或等于预设阈值；若是，获取目标企业的预选画像向量，得到画像向量，对目标企业进行风险画像。此外，本发明还涉及区块链技术，画像向量和风险画像均可存储于区块链节点中。通过本发明，能够有针对性的、准确地对企业进行风险画像。

Description

企业风险画像方法、装置、计算机设备和可读存储介质

技术领域

本发明涉及数据分析技术领域，尤其涉及一种企业风险画像方法、装置、计算机设备和可读存储介质。

背景技术

企业风险画像是通过企业基本情况、经营情况、财务情况、行业情况、融资情况、消费决策和对产品的诉求等多维度企业商业信息数据，来表征企业风险的状况，上述提到的企业各种经营数据是宏观经济分析的重要指标，企业画像数据可为宏观经济的研究提供了重要参考依据。传统的企业风险画像往往是根据过往的一些业务经验，将一大堆事实数据或者这些数据的统计量，通过罗列、组合、图表等形式进行展现。尽管这一方法可以很好的让观看者看到或者搜索到所需要的信息，但往往包含过多无用信息，难以提炼出满足某一个或一组特定任务的、有着高度针对性的信息。

因此，提供一种企业风险画像方法、装置、计算机设备和可读存储介质，以有针对性的、准确地对企业进行风险画像，成为本领域亟需解决的技术问题。

发明内容

本发明的目的是提供一种企业风险画像方法、装置、计算机设备和可读存储介质，用于解决现有技术中存在的上述技术问题。本发明还可应用于智慧城市领域中，对智慧城市建设中的相关企业进行风险画像，从而推动智慧城市的建设。本发明还可应用于宏观经济领域中，对通过对企业进行风险画像，从而能够观察、预测以及分析宏观经济的发展。

一方面，为实现上述目的，本发明提供了一种企业风险画像方法。

该企业风险画像方法包括：确定对目标企业进行风险画像时的目标风险指标；获取企业样本数据集，其中，企业样本数据集包括测试集和训练集，测试集和训练集均包括多条样本数据，样本数据包括多维向量和目标风险指标的指标样本值；在多维向量中选定若干维向量作为预选画像向量；将训练集中多条样本数据的预选画像向量和对应的指标样本值分别作为预设学习模型的输入和输出，对学习模型进行训练；将测试集中多条样本数据的预选画像向量输入训练好的学习模型，得到的输出为指标测试值；比对指标测试值和测试集中对应的指标样本值，判断训练好的学习模型的正确率是否大于或等于预设阈值；当正确率大于或等于预设阈值时，获取目标企业的预选画像向量，得到画像向量；根据画像向量对目标企业进行风险画像。

进一步地，根据画像向量对目标企业进行风险画像的步骤包括：将画像向量和训练好的学习模型输入至归因模型，得到画像向量中各维向量对应的贡献度；根据画像向量和画像向量中各维向量对应的贡献度对目标企业进行风险画像。

进一步地，在判断训练好的学习模型的正确率是否大于或等于预设阈值的步骤之后，该企业风险画像方法还包括：当正确率小于预设阈值时，在多维向量中重新选定若干维向量作为新的预选画像向量，以对学习模型重新进行训练。

进一步地，在得到画像向量之后，该企业风险画像方法还包括：将画像向量输入训练好的学习模型，得到的输出为指标画像值；根据指标画像值对目标企业进行风险画像。

进一步地，在将画像向量输入训练好的学习模型之后，该企业风险画像方法还包括：获取训练好的学习模型在输出指标画像值之前产生的中间数据；根据中间数据对目标企业进行风险画像。

进一步地，预设学习模型为基于支持向量机、神经网络或决策树构建的模型，其中：当预设学习模型为基于决策树构建的模型时，中间数据为决策点和决策路径；当预设学习模型为基于神经网络构建的模型时，中间数据为中间层向量；以及当预设学习模型为基于支持向量机构建的模型时，中间数据为支持向量。

另一方面，为实现上述目的，本发明提供了一种企业风险画像装置。

该企业风险画像装置包括：确定模块，用于确定对目标企业进行风险画像时的目标风险指标；第一获取模块，用于获取企业样本数据集，其中，企业样本数据集包括测试集和训练集，测试集和训练集均包括多条样本数据，样本数据包括多维向量和目标风险指标的指标样本值；第一处理模块，用于在多维向量中选定若干维向量作为预选画像向量；训练模块，用于将训练集中多条样本数据的预选画像向量和对应的指标样本值分别作为预设学习模型的输入和输出，对学习模型进行训练；第二处理模块，用于将测试集中多条样本数据的预选画像向量输入训练好的学习模型，得到的输出为指标测试值；判断模块，用于比对指标测试值和测试集中对应的指标样本值，判断训练好的学习模型的正确率是否大于或等于预设阈值；第二获取模块，用于当正确率大于或等于预设阈值时，获取目标企业的预选画像向量，得到画像向量；画像模块，用于根据画像向量对目标企业进行风险画像。

进一步地，画像模块包括：处理单元，用于将画像向量和训练好的学习模型输入至归因模型，得到画像向量中各维向量对应的贡献度；画像单元，用于根据画像向量和画像向量中各维向量对应的贡献度对目标企业进行风险画像。

为实现上述目的，本发明还提供一种计算机设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，该处理器执行计算机程序时实现上述方法的步骤。

为实现上述目的，本发明还提供计算机可读存储介质，包括存储数据区和存储程序区，存储数据区存储根据区块链节点的使用所创建的数据，存储程序区存储有计算机程序，该计算机程序被处理器执行时实现上述方法的步骤。

本发明提供的企业风险画像方法、装置、计算机设备和可读存储介质，能够针对特定的目标风险指标进行画像，在确定目标风险指标后，基于企业样本数据集确定出与该目标风险指标关联性高的画像向量，进而通过确定出的画像向量进行企业风险画像，在确定画像向量时，选择样本数据中的若干维向量作为预选画像向量，同时也作为学习模型的输入，将对应的目标风险指标作为学习模型的输出，利用企业样本数据集中的一部分数据对预设学习模型训练，另一部分数据对训练后的学习模型进行验证，如果验证正确率满足预设阈值，则表明预选画像向量与目标风险指标之间满足关联要求，该预选画像向量即可作为画像向量。

附图说明

图1为本发明实施例一提供的企业风险画像方法的流程图；

图2为本发明实施例二提供的企业风险画像装置的框图；

图3为本发明实施例三提供的计算机设备的硬件结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本发明，并不用于限定本发明。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

为了有针对性的、准确地对企业进行风险画像，本发明提供了一种企业风险画像方法、装置、计算机设备和可读存储介质，在该企业风险画像方法中，首先确定对目标企业进行风险画像时的目标风险指标，也即，在对目标企业进行风险画像时，针对特定的目标风险指标进行风险画像，使得风险画像具有针对性；进一步，在确定企业画像时的目标风险指标之后，获取企业样本数据集，该企业样本数据集分为两个部分，一部分为测试集，另一部分为训练集，测试集和训练集均包括多条样本数据，每一条样本数据包括多维向量和目标风险指标的指标样本值，在该多维向量中选定若干维向量作为预选画像向量，然后通过训练集对预设学习模型进行训练，具体地，将训练集中多条样本数据的预选画像向量和对应的指标样本值分别作为预设学习模型的输入和输出，对学习模型进行训练，训练完成后，通过测试集对训练好的学习模型进行测试，具体地，将测试集中多条样本数据的预选画像向量输入训练好的学习模型，得到的输出为指标测试值，在得到指标测试值以后，将每个指标测试值和测试集中对应的指标样本值进行比对，如果一个指标测试值与对应的指标样本值相匹配，则说明通过该指标样本值的样本数据进行的预警是正确的，否则，是错误的，通过比对所有的指标测试值和测试集中对应的指标样本值，能够得到该训练好的学习模型的正确率，当正确率大于或等于预设阈值时，说明通过当前的预选画像向量能够准确预警出目标风险指标，也即该预选画像向量能够准确反应出目标风险指标的情况，此时，获取目标企业的预选画像向量，得到画像向量，然后根据画像向量对目标企业进行风险画像，从中可以看出，本发明提供的企业风险画像方法，能够针对特定的目标风险指标进行画像，进一步，基于预测该目标风险指标的预警模型，能够对画像所采用的信息进行筛选，使得企业风险画像所采用的信息更有效，企业风险画像更准确。

关于本发明提供的企业风险画像方法、装置、计算机设备和可读存储介质的具体实施例，将在下文中详细描述。

实施例一

本发明实施例一提供了一种企业风险画像方法，通过该方法，能够针对特定的目标风险指标进行画像，能够对画像所采用的信息进行筛选，使得企业风险画像所采用的信息更有效和准确，具体地，图1为本发明实施例一提供的企业风险画像方法的流程图，如图1所示，该实施例一提供的企业风险画像方法包括如下的步骤S101至步骤S108。

步骤S101：确定对目标企业进行风险画像所针对的风险指标。

在对目标企业进行风险画像所针对的风险指标，也即风险画像的目标风险指标，具体地，目标风险指标可以包括实质违约、外评下调或收益率变化等，可以根据风险画像需求确定具体的风险指标。

步骤S102：获取企业样本数据集。

其中，企业样本数据集包括测试集和训练集，测试集和训练集均包括多条样本数据，样本数据包括多维向量和目标风险指标的指标样本值。

具体地，样本数据中的多维向量是指基于多个维度观察企业的数据，如宏观经济形势、行业景气度、公司财务状况、公司的股票、债券交易状况和各类公告舆情等多个维度的非结构化、半结构化或结构化的数据，对于非结构化和半结构化数据，可以进行结构化的处理。

样本数据的目标风险指标也即上述步骤S101中确定的目标风险指标，每条样本数据的多维向量对应一个目标风险指标的指标样本值，例如，不同的样本数据可以是来源于同一企业不同时期的数据，也可以是来源于不同企业同一时期的数据。

步骤S103：在多维向量中选定若干维向量作为预选画像向量。

例如，样本数据包括N维向量，该步骤中，在N维向量中选择M维向量作为预选画像向量，M小于N，在选择时可以任意选择，也可以依据经验选择与目标风险指标关联性较强的向量。

步骤S104：将训练集中多条样本数据的预选画像向量和对应的指标样本值分别作为预设学习模型的输入和输出，对学习模型进行训练。

例如，学习模型可以神经网络模型，设定初始神经网络模型的结构和初始参数，将训练集中样本数据的预选画像向量作为初始神经网络模型的输入，对应的指标样本值作为初始神经网络模型的输出，使用训练集的样本数据对初始神经网络模型进行训练，使得训练好的神经网络模型能够学习到预选画像向量与目标风险指标之间的关系。对神经网络模型的选择、神经网络模型结构参数和训练参数的设置，均可以采用现有技术中训练神经网络模型相关的方法，在此不再赘述。

步骤S105：将测试集中多条样本数据的预选画像向量输入训练好的学习模型，得到的输出为指标测试值。

例如，对于训练好的神经网络模型，将测试集中样本数据的预选画像向量作为神经网络模型的输入，通过神经网络模型进行计算后得到的输出为指标测试值，也即预选画像向量对应的目标风险指标的理论指标值。

步骤S106：比对指标测试值和测试集中对应的指标样本值，判断训练好的学习模型的正确率是否大于或等于预设阈值。

在该步骤S106中，针对测试集中的每个样本数据，将得到的指标测试值与对应的真实指标样本值进行比对，也即将通过神经网络模型计算得到的目标风险指标的理论值，与样本数据中对应的目标风险指标的实际值进行比对，如果二者一致或者二者的差值满足一致性要求，则说明针对该样本数据计算得到的目标风险指标的理论值是正确的，否则，针对该样本数据计算得到的目标风险指标的理论值是错误的，其中，目标风险指标的理论值与实际值之间的差所应满足的一致性要求，可基于目标风险指标的具体需求设定。对测试集中每个样本数据进行上述计算和比对，能够得到测试集中目标风险指标理论值正确的样本数据的数量，将该数量与测试集中样本数据的总量进行比值，即可得到训练好的学习模型的正确率。设置预设阈值，将得到的正确率与预设阈值进行比对。

步骤S107：当正确率大于或等于预设阈值时，获取目标企业的预选画像向量，得到画像向量。

通过测试集进行判断，当训练好的学习模型根据预选画像向量计算得到的目标风险指标的理论值的正确率满足预设阈值的要求时，说明该预选画像向量与目标风险指标具有相互关联的关系，预选画像向量可以作为目标风险指标的因变量，此时，将预选画像向量作为画像向量，以实现针对目标风险指标的企业风险画像。

通过测试集判断，当训练好的学习模型根据预选画像向量计算得到的目标风险指标的理论值的正确率不满足预设阈值的要求时，优选地，先重新调节初始学习模型的参数，具体如调整神经网络模型的结构和参数，利用训练集再次对初始学习模型进行训练，训练后再次通过测试集进行判断，如果经过预设次数的调整或者在预设参数范围内的调整均无法使正确率大于或等于预设阈值，说明该预选画像向量与目标风险指标不具有相互关联的关系，此时的预选画像向量不可以作为目标风险指标的因变量，则重新执行步骤S103，在多维向量中重新选定若干维向量作为预选画像向量，并再次通过训练集进行训练，通过测试集进行测试，直到训练好的学习模型根据预选画像向量计算得到的目标风险指标的理论值的正确率满足预设阈值，即可确定画像向量。

步骤S108：根据画像向量对目标企业进行风险画像。

通过上述步骤确定画像向量后，在该步骤S108中，利用画像向量对目标企业进行风险画像，具体的画像方法可采用现有技术中任意的图、表等的统计方法，本申请对此不再详述。

采用该实施例提供的企业风险画像方法，能够针对特定的目标风险指标进行画像，在确定目标风险指标后，基于企业样本数据集确定出与该目标风险指标关联性高的画像向量，进而通过确定出的画像向量进行企业风险画像，在确定画像向量时，选择样本数据中的若干维向量作为预选画像向量，同时也作为学习模型的输入，将对应的目标风险指标作为学习模型的输出，利用企业样本数据集中的一部分数据对预设学习模型训练，另一部分数据对训练后的学习模型进行验证，如果验证正确率满足预设阈值，则表明预选画像向量与目标风险指标之间满足关联要求，该预选画像向量即可作为画像向量。

此外，本发明得到的画像向量和风险画像均可以存储至区块链节点上，从而利用区块链去中心化、开放性、自治性、匿名性以及信息不可篡改的优点。

可选地，在一种实施例中，根据画像向量对目标企业进行风险画像的步骤包括：将画像向量和训练好的学习模型输入至归因模型，得到画像向量中各维向量对应的贡献度；根据画像向量和画像向量中各维向量对应的贡献度对目标企业进行风险画像。具体地，可采用现有技术中的归因模型，例如logistics回归、生存模型、probabilistic模型、markov模型等，计算出各画像向量对影响目标风险指标的重要程度，也即贡献度，从而在风险画像时，能够依据贡献度使用画像向量，例如，根据需要将贡献度高的画像向量作为图表展示的主要变量，将贡献度低的画像向量作为图表展示的次要变量。

采用该实施例提供的企业风险画像方法，对确定出的画像向量利用归因模型计算出对目标风险指标的贡献度，进而在进行风险画像时可依据贡献度选择画像向量的使用，提升企业风险画像的质量。

可选地，在一种实施例中，在得到画像向量之后，该企业风险画像方法还包括：将画像向量输入训练好的学习模型，得到的输出为指标画像值；根据指标画像值对目标企业进行风险画像。

具体地，画像向量是从企业的多维向量中选定的、与目标风险指标关联关系加强的向量，将画像向量作为训练好的学习模型的输入，该学习模型的输出为基于该画像向量影响下目标风险指标的理论值，也就是说，通过这部分向量进行训练和学习，能够得到目标风险指标理论上的值，也即指标画像值，将指标画像值同时作为风险画像的参考因素，增加风险画像的输出内容，同时也能够在风险画像时给出目标风险指标理论与实际的对比。因此，当需要针对目标风险指标理论和实际进行比对时，在使用画像向量进行风险画像的同时，也可根据指标画像值对目标企业进行风险画像。

可选地，在一种实施例中，在将画像向量输入训练好的学习模型之后，该企业风险画像方法还包括：获取训练好的学习模型在输出指标画像值之前产生的中间数据；根据中间数据对目标企业进行风险画像。

具体地，该中间数据为学习模型输入和输出之间的中间产物，通常是学习模型的输入向量之间进一步数学计算结果，这部分数据与目标风险指标也具有较强的关联性，也能够较好地反映出目标风险指标的变化，将这部分数据同时作为风险画像的参考因素，增加风险画像的输出内容。进一步可选地，在一种实施例中，预设学习模型为基于支持向量机、神经网络或决策树构建的模型，其中：当预设学习模型为基于决策树构建的模型时，中间数据为决策点和决策路径；当预设学习模型为基于神经网络构建的模型时，中间数据为中间层向量；以及当预设学习模型为基于支持向量机构建的模型时，中间数据为支持向量。因此，当需要针对目标风险指标从多个角度进行风险画像时，在使用画像向量进行风险画像的同时，也可根据中间数据对目标企业进行风险画像。

实施例二

对应于上述实施例一，本发明实施例二提供了一种企业风险画像装置，相关技术特征和技术效果与上述实施例一相对应，在该实施例中不再赘述，具体可参见上述实施例一。图2为本发明实施例二提供的企业风险画像装置的框图，如图2所示，该装置包括：确定模块201、第一获取模块202、第一处理模块203、训练模块204、第二处理模块205、判断模块206、第二获取模块207和画像模块208。

确定模块201用于确定对目标企业进行风险画像时的目标风险指标；第一获取模块202用于获取企业样本数据集，其中，企业样本数据集包括测试集和训练集，测试集和训练集均包括多条样本数据，样本数据包括多维向量和目标风险指标的指标样本值；第一处理模块203用于在多维向量中选定若干维向量作为预选画像向量；训练模块204用于将训练集中多条样本数据的预选画像向量和对应的指标样本值分别作为预设学习模型的输入和输出，对学习模型进行训练；第二处理模块205用于将测试集中多条样本数据的预选画像向量输入训练好的学习模型，得到的输出为指标测试值；判断模块206用于比对指标测试值和测试集中对应的指标样本值，判断训练好的学习模型的正确率是否大于或等于预设阈值；第二获取模块207用于当正确率大于或等于预设阈值时，获取目标企业的预选画像向量，得到画像向量；画像模块208用于根据画像向量对目标企业进行风险画像。

可选地，在一种实施例中，画像模块包括：处理单元，用于将画像向量和训练好的学习模型输入至归因模型，得到画像向量中各维向量对应的贡献度；画像单元，用于根据画像向量和画像向量中各维向量对应的贡献度对目标企业进行风险画像。

可选地，在一种实施例中，第一处理模块203还用于当正确率小于预设阈值时，在多维向量中重新选定若干维向量作为新的预选画像向量，以使训练模块204对学习模型重新进行训练。

进一步地，在得到画像向量之后，该企业风险画像装置还包括第三处理模块，用于将画像向量输入训练好的学习模型，得到的输出为指标画像值；画像模块208还用于根据指标画像值对目标企业进行风险画像。

进一步地，在将画像向量输入训练好的学习模型之后，该企业风险画像装置还包括第四处理模块，用于获取训练好的学习模型在输出指标画像值之前产生的中间数据；画像模块208还用于根据中间数据对目标企业进行风险画像。

实施例三

本发明实施例三还提供一种计算机设备，如可以执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器，或者多个服务器所组成的服务器集群)等。如图3所示，本实施例的计算机设备01至少包括但不限于：可通过系统总线相互通信连接的存储器011、处理器012，如图3所示。需要指出的是，图3仅示出了具有组件存储器011和处理器012的计算机设备01，但是应理解的是，并不要求实施所有示出的组件，可以替代的实施更多或者更少的组件。

本实施例中，存储器011(即可读存储介质)包括闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中，存储器011可以是计算机设备01的内部存储单元，例如该计算机设备01的硬盘或内存。在另一些实施例中，存储器011也可以是计算机设备01的外部存储设备，例如该计算机设备01上配备的插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(FlashCard)等。当然，存储器011还可以既包括计算机设备01的内部存储单元也包括其外部存储设备。本实施例中，存储器011通常用于存储安装于计算机设备01的操作系统和各类应用软件，例如实施例二的企业风险画像装置的程序代码等。此外，存储器011还可以用于暂时地存储已经输出或者将要输出的各类数据。

处理器012在一些实施例中可以是中央处理器(Central Processing Unit，CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器012通常用于控制计算机设备01的总体操作。本实施例中，处理器012用于运行存储器011中存储的程序代码或者处理数据，例如企业风险画像方法等。

实施例四

本实施例四还提供一种计算机可读存储介质，如闪存、硬盘、多媒体卡、卡型存储器(例如，SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等等，其上存储有计算机程序，程序被处理器执行时实现相应功能。本实施例的计算机可读存储介质用于存储发明名称，该计算机可读存储介质被处理器执行时实现实施例一的发明名称。

进一步地，所述计算机可读存储介质可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序等；存储数据区可存储根据区块链节点的使用所创建的数据等。

本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain)，本质上是一个去中心化的数据库，是一串使用密码学方法相关联产生的数据块，每一个数据块中包含了一批次网络交易的信息，用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

上述本发明实施例序号仅仅为了描述，不代表实施例的优劣。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。

以上仅为本发明的优选实施例，并非因此限制本发明的专利范围，凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本发明的专利保护范围内。

Claims

1.一种企业风险画像方法，其特征在于，包括：

确定对目标企业进行风险画像时的目标风险指标；

获取企业样本数据集，其中，所述企业样本数据集包括测试集和训练集，所述测试集和所述训练集均包括多条样本数据，所述样本数据包括多维向量和所述目标风险指标的指标样本值；

在所述多维向量中选定若干维向量作为预选画像向量；

将所述训练集中多条样本数据的所述预选画像向量和对应的所述指标样本值分别作为预设学习模型的输入和输出，对所述学习模型进行训练；

将所述测试集中多条样本数据的所述预选画像向量输入训练好的所述学习模型，得到的输出为指标测试值；

比对所述指标测试值和所述测试集中对应的所述指标样本值，判断所述训练好的学习模型的正确率是否大于或等于预设阈值；

当所述正确率大于或等于预设阈值时，获取所述目标企业的所述预选画像向量，得到画像向量；

根据所述画像向量对所述目标企业进行风险画像。

2.根据权利要求1所述的企业风险画像方法，其特征在于，根据所述画像向量对所述目标企业进行风险画像的步骤包括：

将所述画像向量和所述训练好的学习模型输入至归因模型，得到所述画像向量中各维向量对应的贡献度；

根据所述画像向量和所述画像向量中各维向量对应的贡献度对所述目标企业进行风险画像。

3.根据权利要求1所述的企业风险画像方法，其特征在于，在所述判断所述训练好的学习模型的正确率是否大于或等于预设阈值的步骤之后，所述方法还包括：

当所述正确率小于预设阈值时，在所述多维向量中重新选定若干维向量作为新的预选画像向量，以对所述学习模型重新进行训练。

4.根据权利要求1所述的企业风险画像方法，其特征在于，在得到所述画像向量之后，所述方法还包括：

将所述画像向量输入所述训练好的学习模型，得到的输出为指标画像值；

根据所述指标画像值对所述目标企业进行风险画像。

5.根据权利要求4所述的企业风险画像方法，其特征在于，在将所述画像向量输入所述训练好的学习模型之后，所述方法还包括：

获取所述训练好的学习模型在输出所述指标画像值之前产生的中间数据；

根据所述中间数据对所述目标企业进行风险画像。

6.根据权利要求5所述的企业风险画像方法，其特征在于，所述预设学习模型为基于支持向量机、神经网络或决策树构建的模型，其中：

当所述预设学习模型为基于决策树构建的模型时，所述中间数据为决策点和决策路径；

当所述预设学习模型为基于神经网络构建的模型时，所述中间数据为中间层向量；

当所述预设学习模型为基于支持向量机构建的模型时，所述中间数据为支持向量。

7.一种企业风险画像装置，其特征在于，包括：

确定模块，用于确定对目标企业进行风险画像时的目标风险指标；

第一获取模块，用于获取企业样本数据集，其中，所述企业样本数据集包括测试集和训练集，所述测试集和所述训练集均包括多条样本数据，所述样本数据包括多维向量和所述目标风险指标的指标样本值；

第一处理模块，用于在所述多维向量中选定若干维向量作为预选画像向量；

训练模块，用于将所述训练集中多条样本数据的所述预选画像向量和对应的所述指标样本值分别作为预设学习模型的输入和输出，对所述学习模型进行训练；

第二处理模块，用于将所述测试集中多条样本数据的所述预选画像向量输入训练好的所述学习模型，得到的输出为指标测试值；

判断模块，用于比对所述指标测试值和所述测试集中对应的所述指标样本值，判断所述训练好的学习模型的正确率是否大于或等于预设阈值；

第二获取模块，用于当所述正确率大于或等于预设阈值时，获取所述目标企业的所述预选画像向量，得到画像向量；

画像模块，用于根据所述画像向量对所述目标企业进行风险画像。

8.根据权利要求7所述的企业风险画像装置，其特征在于，所述画像模块包括：

处理单元，用于将所述画像向量和所述训练好的学习模型输入至归因模型，得到所述画像向量中各维向量对应的贡献度；

画像单元，用于根据所述画像向量和所述画像向量中各维向量对应的贡献度对所述目标企业进行风险画像。

9.一种计算机设备，包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6任一项所述方法的步骤。

10.一种计算机可读存储介质，包括存储数据区和存储程序区，存储数据区存储根据区块链节点的使用所创建的数据，存储程序区存储有计算机程序，其特征在于：所述计算机程序被处理器执行时实现权利要求1至6任一项所述方法的步骤。