CN111222774B

CN111222774B - 企业数据分析方法、装置及服务器

Info

Publication number: CN111222774B
Application number: CN201911400649.1A
Authority: CN
Inventors: 秦佩; 倪向东; 胡建敏; 费红琳; 胡幼华
Original assignee: Guangzhou Doctor Information Technology Research Institute Co ltd
Current assignee: Guangzhou Doctor Information Technology Research Institute Co ltd
Priority date: 2019-12-30
Filing date: 2019-12-30
Publication date: 2020-08-18
Anticipated expiration: 2039-12-30
Also published as: CN111222774A

Abstract

本发明涉及数据处理技术领域，涉及一种企业数据分析方法、装置及服务器。本发明能够对企业端的多种当前企业数据进行分析，并确定出每种当前企业数据的数据结构清单在企业端数据结构池中对应的区域的第一发展轨迹权重系数，进一步确定样本发展轨迹信息；然后对样本发展轨迹信息对应的样本数据结构清单以及每个数据结构清单进行数据特征提取，从而基于得到的第二目标特征向量和第一特征向量确定出当前企业数据对应的当前发展轨迹信息；最后在当前发展轨迹信息存在异常时生成与当前发展轨迹信息对应的当前风控策略。如此，本发明能够基于当前企业数据分析出企业端的当前发展轨迹信息并在当前发展轨迹信息出现异常时生成相应的风控策略。

Description

企业数据分析方法、装置及服务器

技术领域

本发明涉及数据处理技术领域，具体而言，涉及一种企业数据分析方法、装置及服务器。

背景技术

随着科技的发展，创业型企业如雨后春笋般涌现。创业型企业从无到有，从小规模发展到大规模需要漫长的时间积累和技术积累。在创业型企业的发展过程中，如何利用大数据分析出企业的发展轨迹以及发展过程中可能出现的风险是现阶段亟待解决的一个技术问题。

发明内容

为了至少克服现有技术中的上述不足，本发明的目的之一在于提供一种企业数据分析方法、装置及服务器。

本发明实施例的第一方面，提供了一种企业数据分析方法，应用于与企业端通信的服务器，所述方法至少包括：

按照设定时长间隔从所述企业端采集所述企业端中存储的多种当前企业数据；其中，所述当前企业数据为当前运营数据、当前财务数据、当前研发数据、当前行业数据或当前申报数据；

提取出各种当前企业数据的数据结构清单，搭建企业端数据结构池；该企业端数据结构池为多区域结构池，每个区域对应一种当前企业数据的数据结构清单，该企业端数据结构池的各个区域具有不同的第一发展轨迹权重系数；

从预设数据库中确定出与该企业端存在关联关系的样本企业端的样本发展轨迹信息；从与该企业端存在关联关系的样本企业端的样本发展轨迹信息中确定出至少一个与所述企业端数据结构池中的数据结构清单存在匹配关系的样本数据结构清单；

将所述样本数据结构清单映射至所述企业端数据结构池中得到所述样本数据结构清单在所述企业端数据结构池中的样本区域；根据所述样本区域与所述企业端数据结构池中的每个区域之间的距离确定出所述样本区域的第二发展轨迹权重系数；

分别对所述样本数据结构清单以及每个数据结构清单进行数据特征提取，得到所述样本数据结构清单对应的第一特征向量以及每个数据结构清单对应的第二特征向量；

针对每个第二特征向量，基于该第二特征向量对应的第一发展轨迹权重系数与所述第一特征向量对应的第二发展轨迹权重系数之间的比较结果对该第二特征向量进行加权，得到第二目标特征向量；确定出该第二目标特征向量与所述第一特征向量之间的相似度结果；根据确定出的每个第二目标特征向量与所述第一特征向量之间的相似度结果确定出当前企业数据对应的当前发展轨迹信息；

判断当前发展轨迹信息是否存在异常；在当前发展轨迹信息存在异常时，根据预先生成的样本发展轨迹信息的样本风控策略以及当前发展轨迹信息生成与当前发展轨迹信息对应的当前风控策略。

在一种可选的实施方式中，所述提取出各种当前企业数据的数据结构清单，搭建企业端数据结构池，包括：

针对每种当前企业数据，根据该种当前企业数据中的字符信息确定出该种当前企业数据的主题信息并基于该种当前企业数据的主题信息确定出该种当前企业数据的主题类别；

针对确定出的每个主题类别，获取与该主题类别对应的数据拆分逻辑表单并根据与该主题类别对应的数据拆分逻辑表单对该主题类别对应的当前企业数据中的结构化数据进行拆分，得到与该主题类别对应的第一数据集；

针对每个第一数据集中包括的多个数据段，按照该第一数据集对应的主题类别确定出该第一数据集对应的排序方式并按照该第一数据集对应的排序方式对该第一数据集中的多个数据段进行排序，得到与该第一数据集对应的第二数据集；

针对每个第二数据集，按照与该第二数据集对应的数据拆分逻辑表单中的逻辑向量对该第二数据集中完成排序的所有数据段进行数据逻辑连线，得到与该第二数据集对应的当前企业数据的数据结构清单；

按照设定遍历次数对得到的每个数据结构清单进行遍历，得到每一次的遍历结果；其中，每一次的遍历结果中包括对得到的每个数据结构清单进行遍历的遍历顺序以及每个数据结构清单对应的数据稳定权重值；

根据每一次的遍历结果中包括的遍历顺序和数据稳定权重值，搭建数据结构网络节点集；基于针对所述企业端的设定的数据置信度阈值将每个数据结构清单添加到所述数据结构网络节点集中，得到所述企业端数据结构池。

在一种可选的实施方式中，所述从预设数据库中确定出与该企业端存在关联关系的样本企业端的样本发展轨迹信息，包括：

根据所述多种当前企业数据中每种当前企业数据对应的存储时间信息确定出每种当前企业数据对应的上一设定时长间隔内的历史企业数据；

基于每种历史企业数据查询得到所述企业端在上一设定时长间隔内的企业发展路径信息；根据每组企业发展路径信息生成对应的用于表征所述企业端在每组企业发展路径信息下的目标数据组；针对每个目标数据组，提取该目标数据组中的每个数据节点中封装的执行函数；确定出每个目标数据组对应的所有执行函数中的每个执行函数的函数类型并根据每个函数类型确定出每个目标数据组对应的第一企业发展类型标识；基于每个第一企业发展类型标识确定出每个目标数据组对应的目标企业端，其中，每个目标数据组对应的目标企业端的第二企业发展类型标识与该目标数据组对应的第一企业发展类型标识之间的相似度大于设定值；

确定出每个目标企业端对应的目标企业发展轨迹信息并对确定出的每个目标企业发展轨迹信息先后进行字符拆分和特征提取，得到每个目标企业发展轨迹信息对应的第三特征向量；确定出每个目标数据组的第四特征向量并根据每个目标数据组对应的第一企业发展类型标识对每个目标数据组的第四特征向量进行融合得到第五特征向量；

确定分别出所述第五特征向量与每个第三特征向量之间的第一余弦距离并按照第一余弦距离由大到小的顺序对每个第三特征向量对应的目标企业发展轨迹信息进行排序得到排序序列；根据所述设定时长间隔确定出信息抓取值并按照所述信息抓取值从所述排序序列中抓取对所述信息抓取值对应数量的目标企业发展轨迹信息，得到多个待处理目标企业发展轨迹信息；针对每个待处理目标企业发展轨迹信息，基于该待处理目标企业发展轨迹信息对应的第二企业发展类型标识对该待处理目标企业发展轨迹信息对应的第三特征向量进行加权得到第六特征向量；分别确定出所述第五特征向量与每个第六特征向量之间的第二余弦距离；确定出第二余弦距离的最小值和最大值并根据所述最小值和所述最大值生成余弦距离数值区间；

根据所述企业端数据结构池中的区域总数以及各区域的数据容量的大小关系确定出所述余弦距离数值区间的区间划分次数；基于所述区间划分次数对所述余弦距离数值区间进行划分得到多个数值区间段；

根据该企业端数据结构池中的各个区域对应的第一发展轨迹权重系数确定出每个数值区间段的调整系数；基于每个数值区间段的调整系数对每个数值区间段的区间范围进行调整；统计每个数值区间内的第二余弦距离的累计数量，将最大累计数量对应的数值区间确定为目标数值区间；确定出所述目标数值区间中的最大第二余弦距离并将所述最大第二余弦距离对应的目标企业端确定为所述样本企业端并将所述最大第二余弦距离对应的待处理目标企业发展轨迹信息确定为所述样本企业端的样本发展轨迹信息。

在一种可选的实施方式中，所述判断当前发展轨迹信息是否存在异常，包括：

对当前发展轨迹信息进行轨迹模拟，确定出当前发展轨迹对应的多个轨迹节点；

针对每个轨迹节点，确定出该轨迹节点对应的目标事件并根据该轨迹节点对应的目标事件确定出该轨迹节点的有向连线的连线信息；

根据每个轨迹节点的连线信息对每个轨迹节点进行重连线得到目标发展轨迹信息；

确定出当前发展轨迹信息中的每个第一轨迹节点的第一事件输出信息并按照当前发展轨迹信息对应的第一连线信息集确定当前发展轨迹信息对应的所有第一事件输出信息的第一输出结果；确定出所述目标发展轨迹信息中的每个第二轨迹节点的第二事件输出信息并按照所述目标发展轨迹信息对应的第二连线信息集确定所述目标发展轨迹信息对应的所有第二事件输出信息的第二输出结果；

判断所述第一输出结果与所述第二输出结果之间的重叠率是否达到设定概率；在所述第一输出结果与所述第二输出结果之间的所述重叠率没有达到所述设定概率时确定当前发展轨迹信息存在异常。

本发明实施例的第二方面，提供了一种企业数据分析装置，应用于与企业端通信的服务器，所述装置至少包括：

采集模块，用于按照设定时长间隔从所述企业端采集所述企业端中存储的多种当前企业数据；其中，所述当前企业数据为当前运营数据、当前财务数据、当前研发数据、当前行业数据或当前申报数据；

提取模块，用于提取出各种当前企业数据的数据结构清单，搭建企业端数据结构池；该企业端数据结构池为多区域结构池，每个区域对应一种当前企业数据的数据结构清单，该企业端数据结构池的各个区域具有不同的第一发展轨迹权重系数；

确定模块，用于从预设数据库中确定出与该企业端存在关联关系的样本企业端的样本发展轨迹信息；从与该企业端存在关联关系的样本企业端的样本发展轨迹信息中确定出至少一个与所述企业端数据结构池中的数据结构清单存在匹配关系的样本数据结构清单；

映射模块，用于将所述样本数据结构清单映射至所述企业端数据结构池中得到所述样本数据结构清单在所述企业端数据结构池中的样本区域；根据所述样本区域与所述企业端数据结构池中的每个区域之间的距离确定出所述样本区域的第二发展轨迹权重系数；

特征提取模块，用于分别对所述样本数据结构清单以及每个数据结构清单进行数据特征提取，得到所述样本数据结构清单对应的第一特征向量以及每个数据结构清单对应的第二特征向量；

加权模块，用于针对每个第二特征向量，基于该第二特征向量对应的第一发展轨迹权重系数与所述第一特征向量对应的第二发展轨迹权重系数之间的比较结果对该第二特征向量进行加权，得到第二目标特征向量；确定出该第二目标特征向量与所述第一特征向量之间的相似度结果；根据确定出的每个第二目标特征向量与所述第一特征向量之间的相似度结果确定出当前企业数据对应的当前发展轨迹信息；

判断模块，用于判断当前发展轨迹信息是否存在异常；在当前发展轨迹信息存在异常时，根据预先生成的样本发展轨迹信息的样本风控策略以及当前发展轨迹信息生成与当前发展轨迹信息对应的当前风控策略。

在一种可选的实施方式中，所述提取模块，用于：

在一种可选的实施方式中，所述确定模块，用于：

在一种可选的实施方式中，所述判断模块，用于：

本发明实施例的第三方面，提供了一种服务器，包括处理器以及与所述处理器连接的存储器和总线；其中，所述处理器和所述存储器通过所述总线完成相互间的通信；所述处理器用于调用所述存储器中的程序指令，以执行上述的企业数据分析方法。

本发明实施例的第四方面，提供了一种可读存储介质，其上存储有程序，该程序被处理器执行时实现上述的企业数据分析方法。

本发明实施例所提供的一种企业数据分析方法、装置及服务器，能够对企业端的多种当前企业数据进行分析，并确定出每种当前企业数据的数据结构清单在企业端数据结构池中对应的区域的第一发展轨迹权重系数，进一步确定出与该企业端存在关联关系的样本企业端的样本发展轨迹信息。然后对样本发展轨迹信息对应的样本数据结构清单以及每个数据结构清单进行数据特征提取，从而基于得到的第二目标特征向量和第一特征向量确定出当前企业数据对应的当前发展轨迹信息。最后在当前发展轨迹信息存在异常时，根据预先生成的样本发展轨迹信息的样本风控策略以及当前发展轨迹信息生成与当前发展轨迹信息对应的当前风控策略。如此，能够基于样本发展轨迹信息对企业端的多种当前企业数据进行分析和处理，从而分析出企业端的当前发展轨迹信息，并判断当前发展轨迹信息是否异常，以便在当前发展轨迹信息出现异常时生成相应的风控策略。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明实施例所提供的一种企业数据分析方法的流程图。

图2为本发明实施例所提供的一种企业数据分析装置的功能模块框图。

图3为本发明实施例所提供的一种服务器的方框示意图。

图标：

200-企业数据分析装置；201-采集模块；202-提取模块；203-确定模块；204-映射模块；205-特征提取模块；206-加权模块；207-判断模块；

300-服务器；301-处理器；302-存储器；303-总线。

具体实施方式

下面将参照附图更详细地描述本发明公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

为了更好的理解上述技术方案，下面通过附图以及具体实施例对本发明技术方案做详细的说明，应当理解本发明实施例以及实施例中的具体特征是对本发明技术方案的详细的说明，而不是对本发明技术方案的限定，在不冲突的情况下，本发明实施例以及实施例中的技术特征可以相互组合。

图1为根据本发明一个实施例提供的企业数据分析方法的流程图，应用于与企业端通信的服务器，该方法可以包括以下内容：

步骤S21，按照设定时长间隔从所述企业端采集所述企业端中存储的多种当前企业数据。

在步骤S21中，所述当前企业数据为当前运营数据、当前财务数据、当前研发数据、当前行业数据或当前申报数据。

步骤S22，提取出各种当前企业数据的数据结构清单，搭建企业端数据结构池。

在步骤S22中，该企业端数据结构池为多区域结构池，每个区域对应一种当前企业数据的数据结构清单，该企业端数据结构池的各个区域具有不同的第一发展轨迹权重系数。

步骤S23，从预设数据库中确定出与该企业端存在关联关系的样本企业端的样本发展轨迹信息；从与该企业端存在关联关系的样本企业端的样本发展轨迹信息中确定出至少一个与所述企业端数据结构池中的数据结构清单存在匹配关系的样本数据结构清单。

步骤S24，将所述样本数据结构清单映射至所述企业端数据结构池中得到所述样本数据结构清单在所述企业端数据结构池中的样本区域；根据所述样本区域与所述企业端数据结构池中的每个区域之间的距离确定出所述样本区域的第二发展轨迹权重系数。

步骤S25，分别对所述样本数据结构清单以及每个数据结构清单进行数据特征提取，得到所述样本数据结构清单对应的第一特征向量以及每个数据结构清单对应的第二特征向量。

步骤S26，针对每个第二特征向量，基于该第二特征向量对应的第一发展轨迹权重系数与所述第一特征向量对应的第二发展轨迹权重系数之间的比较结果对该第二特征向量进行加权，得到第二目标特征向量；确定出该第二目标特征向量与所述第一特征向量之间的相似度结果；根据确定出的每个第二目标特征向量与所述第一特征向量之间的相似度结果确定出当前企业数据对应的当前发展轨迹信息。

步骤S27，判断当前发展轨迹信息是否存在异常；在当前发展轨迹信息存在异常时，根据预先生成的样本发展轨迹信息的样本风控策略以及当前发展轨迹信息生成与当前发展轨迹信息对应的当前风控策略。

可以理解，通过步骤S21-步骤S27，能够对企业端的多种当前企业数据进行分析，并确定出每种当前企业数据的数据结构清单在企业端数据结构池中对应的区域的第一发展轨迹权重系数，进一步确定出与该企业端存在关联关系的样本企业端的样本发展轨迹信息。然后对样本发展轨迹信息对应的样本数据结构清单以及每个数据结构清单进行数据特征提取，从而基于得到的第二目标特征向量和第一特征向量确定出当前企业数据对应的当前发展轨迹信息。最后在当前发展轨迹信息存在异常时，根据预先生成的样本发展轨迹信息的样本风控策略以及当前发展轨迹信息生成与当前发展轨迹信息对应的当前风控策略。如此，能够基于样本发展轨迹信息对企业端的多种当前企业数据进行分析和处理，从而分析出企业端的当前发展轨迹信息，并判断当前发展轨迹信息是否异常，以便在当前发展轨迹信息出现异常时生成相应的风控策略。

在具体实施时，为了确保企业端数据结构池的可靠性和准确性，在步骤S22中，所述提取出各种当前企业数据的数据结构清单，搭建企业端数据结构池，具体可以包括以下内容：

步骤S221，针对每种当前企业数据，根据该种当前企业数据中的字符信息确定出该种当前企业数据的主题信息并基于该种当前企业数据的主题信息确定出该种当前企业数据的主题类别。

步骤S222，针对确定出的每个主题类别，获取与该主题类别对应的数据拆分逻辑表单并根据与该主题类别对应的数据拆分逻辑表单对该主题类别对应的当前企业数据中的结构化数据进行拆分，得到与该主题类别对应的第一数据集。

步骤S223，针对每个第一数据集中包括的多个数据段，按照该第一数据集对应的主题类别确定出该第一数据集对应的排序方式并按照该第一数据集对应的排序方式对该第一数据集中的多个数据段进行排序，得到与该第一数据集对应的第二数据集。

步骤S224，针对每个第二数据集，按照与该第二数据集对应的数据拆分逻辑表单中的逻辑向量对该第二数据集中完成排序的所有数据段进行数据逻辑连线，得到与该第二数据集对应的当前企业数据的数据结构清单。

步骤S225，按照设定遍历次数对得到的每个数据结构清单进行遍历，得到每一次的遍历结果。

在步骤S225中，每一次的遍历结果中包括对得到的每个数据结构清单进行遍历的遍历顺序以及每个数据结构清单对应的数据稳定权重值。

步骤S226，根据每一次的遍历结果中包括的遍历顺序和数据稳定权重值，搭建数据结构网络节点集；基于针对所述企业端的设定的数据置信度阈值将每个数据结构清单添加到所述数据结构网络节点集中，得到所述企业端数据结构池。

可以理解，基于步骤S221-步骤S226，能够对每种当前企业数据进行字符信息的分析并确定出对应的主题信息和主题类别，从而从数据段层面实现数据结构清单的提取，并根据对每个数据结构清单进行遍历的每一次的遍历结果搭建企业端数据结构池，如此，能够确保企业端数据结构池的可靠性和准确性。

在具体实施时，为了确保样本发展轨迹信息与企业端的匹配度，以便后续根据样本发展轨迹信息准确确定出企业端的当前发展轨迹信息，在步骤S23中，所述从预设数据库中确定出与该企业端存在关联关系的样本企业端的样本发展轨迹信息，具体可以包括以下内容：

步骤S231，根据所述多种当前企业数据中每种当前企业数据对应的存储时间信息确定出每种当前企业数据对应的上一设定时长间隔内的历史企业数据。

步骤S232，基于每种历史企业数据查询得到所述企业端在上一设定时长间隔内的企业发展路径信息；根据每组企业发展路径信息生成对应的用于表征所述企业端在每组企业发展路径信息下的目标数据组；针对每个目标数据组，提取该目标数据组中的每个数据节点中封装的执行函数；确定出每个目标数据组对应的所有执行函数中的每个执行函数的函数类型并根据每个函数类型确定出每个目标数据组对应的第一企业发展类型标识；基于每个第一企业发展类型标识确定出每个目标数据组对应的目标企业端，其中，每个目标数据组对应的目标企业端的第二企业发展类型标识与该目标数据组对应的第一企业发展类型标识之间的相似度大于设定值。

步骤S233，确定出每个目标企业端对应的目标企业发展轨迹信息并对确定出的每个目标企业发展轨迹信息先后进行字符拆分和特征提取，得到每个目标企业发展轨迹信息对应的第三特征向量；确定出每个目标数据组的第四特征向量并根据每个目标数据组对应的第一企业发展类型标识对每个目标数据组的第四特征向量进行融合得到第五特征向量。

步骤S234，确定分别出所述第五特征向量与每个第三特征向量之间的第一余弦距离并按照第一余弦距离由大到小的顺序对每个第三特征向量对应的目标企业发展轨迹信息进行排序得到排序序列；根据所述设定时长间隔确定出信息抓取值并按照所述信息抓取值从所述排序序列中抓取对所述信息抓取值对应数量的目标企业发展轨迹信息，得到多个待处理目标企业发展轨迹信息；针对每个待处理目标企业发展轨迹信息，基于该待处理目标企业发展轨迹信息对应的第二企业发展类型标识对该待处理目标企业发展轨迹信息对应的第三特征向量进行加权得到第六特征向量；分别确定出所述第五特征向量与每个第六特征向量之间的第二余弦距离；确定出第二余弦距离的最小值和最大值并根据所述最小值和所述最大值生成余弦距离数值区间。

步骤S235，根据所述企业端数据结构池中的区域总数以及各区域的数据容量的大小关系确定出所述余弦距离数值区间的区间划分次数；基于所述区间划分次数对所述余弦距离数值区间进行划分得到多个数值区间段。

步骤S236，根据该企业端数据结构池中的各个区域对应的第一发展轨迹权重系数确定出每个数值区间段的调整系数；基于每个数值区间段的调整系数对每个数值区间段的区间范围进行调整；统计每个数值区间内的第二余弦距离的累计数量，将最大累计数量对应的数值区间确定为目标数值区间；确定出所述目标数值区间中的最大第二余弦距离并将所述最大第二余弦距离对应的目标企业端确定为所述样本企业端并将所述最大第二余弦距离对应的待处理目标企业发展轨迹信息确定为所述样本企业端的样本发展轨迹信息。

可以理解，通过步骤S231-S236，能够确保确定出样本企业端的样本发展轨迹信息与企业端是高度匹配的，如此，能够在后续根据样本发展轨迹信息准确确定出企业端的当前发展轨迹信息。

在具体实施时，为了对企业端在发展过程中出现的问题进行及时排查和检测，需要对当前发展轨迹信息进行全面地分析，为此，在步骤S27中，所述判断当前发展轨迹信息是否存在异常，具体可以包括以下内容：

步骤S2711，对当前发展轨迹信息进行轨迹模拟，确定出当前发展轨迹对应的多个轨迹节点。

步骤S2712，针对每个轨迹节点，确定出该轨迹节点对应的目标事件并根据该轨迹节点对应的目标事件确定出该轨迹节点的有向连线的连线信息。

步骤S2713，根据每个轨迹节点的连线信息对每个轨迹节点进行重连线得到目标发展轨迹信息。

步骤S2714，确定出当前发展轨迹信息中的每个第一轨迹节点的第一事件输出信息并按照当前发展轨迹信息对应的第一连线信息集确定当前发展轨迹信息对应的所有第一事件输出信息的第一输出结果；确定出所述目标发展轨迹信息中的每个第二轨迹节点的第二事件输出信息并按照所述目标发展轨迹信息对应的第二连线信息集确定所述目标发展轨迹信息对应的所有第二事件输出信息的第二输出结果。

步骤S2715，判断所述第一输出结果与所述第二输出结果之间的重叠率是否达到设定概率；在所述第一输出结果与所述第二输出结果之间的所述重叠率没有达到所述设定概率时确定当前发展轨迹信息存在异常。

可以理解，通过步骤S2711-步骤S2715，能够对当前发展轨迹信息进行全面地分析从而确定出当前发展轨迹信息是否存在异常，以实现对企业端在发展过程中出现的问题进行及时排查和检测。

在具体实施时，为了减少企业在发展过程中的风险损失，步骤S27中，所述根据预先生成的样本发展轨迹信息的样本风控策略以及当前发展轨迹信息生成与当前发展轨迹信息对应的当前风控策略，具体可以包括以下内容：

步骤S2721，从所述样本风控策略中确定出多个可调用的第一策略因子和每个第一策略因子的第一调用路径。

步骤S2722，从所述多个可调用的第一策略因子中确定出多个与第二策略因子相同的策略因子，得到多个第三策略因子，所述第二策略因子为与所述当前发展轨迹信息对应的发展轨迹优化数据集中的数据优化系数；所述发展轨迹优化数据集包括：多个数据优化系数、多个数据优化权重和多个数据优化范围区间，所述数据优化权重为所述数据优化系数的调节权重，所述数据优化范围区间为所述数据优化系数对应的待优化数据的调整区间。

步骤S2723，根据每个第三策略因子的第三调用路径确定出每个第三策略因子的调用损耗并对确定出的所有调用损耗进行加权得到目标调用损耗。

步骤S2724，按照所述目标调用损耗对每个第一策略因子的第一调用路径进行重组得到目标调用路径；根据每个目标调用路径对所述样本风控策略进行拆分得到多个策略单元，并按照每两个调用路径之间的路径重合率对所述多个策略单元进行组合，生成与当前发展轨迹信息对应的当前风控策略。

可以理解，通过步骤S2721-步骤S2724，能够对样本风控策略进行策略因子分析，并结合当前发展轨迹信息的发展轨迹优化数据集进一步生成与当前发展轨迹信息对应的当前风控策略。如此，能够基于当前风控策略对企业端的发展进行调整和规划，减少企业在发展过程中的风险损失。

在上述基础上，本发明实施例提供了一种企业数据分析装置200。图2为根据本发明一个实施例提供的一种企业数据分析装置200的功能模块框图，该企业数据分析装置200包括：

采集模块201，用于按照设定时长间隔从所述企业端采集所述企业端中存储的多种当前企业数据；其中，所述当前企业数据为当前运营数据、当前财务数据、当前研发数据、当前行业数据或当前申报数据。

提取模块202，用于提取出各种当前企业数据的数据结构清单，搭建企业端数据结构池；该企业端数据结构池为多区域结构池，每个区域对应一种当前企业数据的数据结构清单，该企业端数据结构池的各个区域具有不同的第一发展轨迹权重系数。

确定模块203，用于从预设数据库中确定出与该企业端存在关联关系的样本企业端的样本发展轨迹信息；从与该企业端存在关联关系的样本企业端的样本发展轨迹信息中确定出至少一个与所述企业端数据结构池中的数据结构清单存在匹配关系的样本数据结构清单。

映射模块204，用于将所述样本数据结构清单映射至所述企业端数据结构池中得到所述样本数据结构清单在所述企业端数据结构池中的样本区域；根据所述样本区域与所述企业端数据结构池中的每个区域之间的距离确定出所述样本区域的第二发展轨迹权重系数。

特征提取模块205，用于分别对所述样本数据结构清单以及每个数据结构清单进行数据特征提取，得到所述样本数据结构清单对应的第一特征向量以及每个数据结构清单对应的第二特征向量。

加权模块206，用于针对每个第二特征向量，基于该第二特征向量对应的第一发展轨迹权重系数与所述第一特征向量对应的第二发展轨迹权重系数之间的比较结果对该第二特征向量进行加权，得到第二目标特征向量；确定出该第二目标特征向量与所述第一特征向量之间的相似度结果；根据确定出的每个第二目标特征向量与所述第一特征向量之间的相似度结果确定出当前企业数据对应的当前发展轨迹信息。

判断模块207，用于判断当前发展轨迹信息是否存在异常；在当前发展轨迹信息存在异常时，根据预先生成的样本发展轨迹信息的样本风控策略以及当前发展轨迹信息生成与当前发展轨迹信息对应的当前风控策略。

在一种可替换的实施方式中，所述提取模块202，用于：

在一种可替换的实施方式中，所述确定模块203，用于：

在一种可替换的实施方式中，所述判断模块207，用于：

所述服务器300包括处理器和存储器，上述采集模块201、提取模块202、确定模块203、映射模块204、特征提取模块205、加权模块206和判断模块207等均作为程序单元存储在存储器中，由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核，由内核去存储器中调取相应的程序单元。内核可以设置一个或以上，通过调整内核参数基于样本发展轨迹信息对企业端的多种当前企业数据进行分析和处理，从而分析出企业端的当前发展轨迹信息，并判断当前发展轨迹信息是否异常，以便在当前发展轨迹信息出现异常时生成相应的风控策略。

本发明实施例提供了一种可读存储介质，其上存储有程序，该程序被处理器执行时实现所述企业数据分析方法。

本发明实施例提供了一种处理器，所述处理器用于运行程序，其中，所述程序运行时执行的所述企业数据分析方法如下：

A1.一种企业数据分析方法，应用于与企业端通信的服务器，所述方法至少包括：

A2.根据A1所述的企业数据分析方法，所述提取出各种当前企业数据的数据结构清单，搭建企业端数据结构池，包括：

A3.根据A1所述的企业数据分析方法，所述从预设数据库中确定出与该企业端存在关联关系的样本企业端的样本发展轨迹信息，包括：

A4.根据A1所述的企业数据分析方法，所述判断当前发展轨迹信息是否存在异常，包括：

本发明实施例中，如图3所示，服务器300包括至少一个处理器301、以及与处理器301连接的至少一个存储器302、总线303；其中，处理器301、存储器302通过总线303完成相互间的通信；处理器301用于调用存储器302中的程序指令，以执行上述的企业数据分析方法。本文中的服务器300可以是服务器、PC、PAD、手机等。

本申请是参照根据本申请实施例的方法、服务器（系统）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理服务器的处理器以产生一个机器，使得通过计算机或其他可编程数据处理服务器的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

在一个典型的配置中，服务器包括一个或多个处理器(CPU)、存储器和总线。服务器还可以包括输入/输出接口、网络接口等。

存储器可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)，存储器包括至少一个存储芯片。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存 (PRAM)、静态随机存取存储器 (SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器 (ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储服务器或任何其他非传输介质，可用于存储可以被计算服务器访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体 (transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者服务器不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者服务器所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括要素的过程、方法、商品或者服务器中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种企业数据分析方法，其特征在于，应用于与企业端通信的服务器，所述方法至少包括：

2.根据权利要求1所述的企业数据分析方法，其特征在于，所述提取出各种当前企业数据的数据结构清单，搭建企业端数据结构池，包括：

3.根据权利要求1所述的企业数据分析方法，其特征在于，所述从预设数据库中确定出与该企业端存在关联关系的样本企业端的样本发展轨迹信息，包括：

4.根据权利要求1所述的企业数据分析方法，其特征在于，所述判断当前发展轨迹信息是否存在异常，包括：

5.一种企业数据分析装置，其特征在于，应用于与企业端通信的服务器，所述装置至少包括：

6.根据权利要求5所述的企业数据分析装置，其特征在于，所述提取模块，用于：

7.根据权利要求5所述的企业数据分析装置，其特征在于，所述确定模块，用于：

8.根据权利要求5所述的企业数据分析装置，其特征在于，所述判断模块，用于：

9.一种服务器，其特征在于，包括处理器以及与所述处理器连接的存储器和总线；其中，所述处理器和所述存储器通过所述总线完成相互间的通信；所述处理器用于调用所述存储器中的程序指令，以执行上述权利要求1-4任一项所述的企业数据分析方法。

10.一种可读存储介质，其特征在于，其上存储有程序，该程序被处理器执行时实现上述权利要求1-4任一项所述的企业数据分析方法。