CN116862243A

CN116862243A - 一种基于神经网络的企业风险分析预测方法、系统及介质

Info

Publication number: CN116862243A
Application number: CN202311096562.6A
Authority: CN
Inventors: 张广志; 成立立; 于笑博; 刘增礼
Original assignee: Beiling Rongxin Datalnfo Science and Technology Ltd
Current assignee: Beiling Rongxin Datalnfo Science and Technology Ltd
Priority date: 2023-08-29
Filing date: 2023-08-29
Publication date: 2023-10-10

Abstract

本申请实施例提供了一种基于神经网络的企业风险分析预测方法、系统及介质，该方法包括：通过网络爬虫技术爬取大量数据，并输入初始模型进行训练，生成风控模型；获取企业文本数据，将企业文本数据进行预处理，抽取企业实体关系数据；将企业实体关系数据输入风控模型，得到企业风险评估信息；将企业风险评估信息与预设的评估信息进行比较，判断偏差率是否大于或等于预设的偏差率阈值；若大于或等于，则根据风险预警信息对企业风险进行预测；通过风控模型对企业文本数据进行实体关系抽取，并实现企业风险智能评估，当企业评估信息出现较大的偏差时，说明企业出现异常风险数据，根据异常风险数据对企业经营风险进行预测，提高企业风险分析的精度。

Description

一种基于神经网络的企业风险分析预测方法、系统及介质

技术领域

本申请涉及企业风险分析领域，具体而言，涉及一种基于神经网络的企业风险分析预测方法、系统及介质。

背景技术

随着企业向数字经济转型，很多企业面临着产业结构调整和数字化转型的挑战，在这一过程中，可能会存在潜在的风险，企业在生产经营过程中也可能会出现一些问题，导致企业有不同程度风险的发生。不同类型的风险对企业的影响程度不同，但都有可能给企业造成不同程度的损失在企业风险评估方法方面，初步的企业风险评估方法主要采用专家判定法，依据专家的个人经验判定企业的风险状况，但该方法主观性较强且依赖于专家经验、准确率不高，针对上述问题，目前亟待有效的技术解决方案。

发明内容

本申请实施例的目的在于提供一种基于神经网络的企业风险分析预测方法、系统及介质，可以通过风控模型对企业文本数据进行实体关系抽取，并实现企业风险智能评估，当企业评估信息出现较大的偏差时，说明企业出现异常风险数据，根据异常风险数据对企业经营风险进行预测，提高企业风险分析的精度。

本申请实施例还提供了一种基于神经网络的企业风险分析预测方法，包括：

通过网络爬虫技术爬取大量数据，并输入初始模型进行训练，生成风控模型；

获取企业文本数据，将企业文本数据进行预处理，抽取企业实体关系数据；

将企业实体关系数据输入风控模型，得到企业风险评估信息；

将企业风险评估信息与预设的评估信息进行比较，得到偏差率；

判断所述偏差率是否大于或等于预设的偏差率阈值；

若大于或等于，则生成风险预警信息，根据风险预警信息对企业风险进行预测；

若小于，则将企业风险评估信息传输至终端。

可选地，在本申请实施例所述的基于神经网络的企业风险分析预测方法中，所述通过网络爬虫技术爬取大量数据，并输入初始模型进行训练，生成风控模型，具体为：

通过网络数据库建立爬取队列，并生成数据爬取顺序，生成初始网页链接；

根据初始网页链接读取与访问初始网页，并提取网页中的数据元素；

根据数据元素提取网页特征，将网页特征与预设的特征进行相似度计算；

若相似度大于或等于预设的相似度阈值，则生成企业数据；

若小于，则将爬取队列中的下一个网页链接进行调用，并提取网页中的数据进行分析。

可选地，在本申请实施例所述的基于神经网络的企业风险分析预测方法中，所述根据初始网页链接读取与访问初始网页，并提取网页中的数据元素，具体为：

获取初始网络链接，建立爬取参数；

获取实时爬取状态信息，将实时爬取状态信息与预设爬取状态信息进行比较，得到爬取偏差率；

判断所述爬取偏差率是否大于或等于预设的偏差率阈值；

若大于或等于，则生成爬取调整信息，根据爬取调整信息对爬取参数进行实时调整；

若小于，则根据当前爬取参数读取与访问初始网页，并提取网页中的数据元素。

可选地，在本申请实施例所述的基于神经网络的企业风险分析预测方法中，所述获取企业文本数据，将企业文本数据进行预处理，抽取企业实体关系数据，具体为：

获取企业文本数据，将经预处理后的文本数据与实体词典进行匹配并对文本数据进行标注；

将标注好的文本数据和预处理的企业文本数据转换为向量进行拼接；

对拼接向量进行学习提取企业文本数据的语义特征；

根据语义特征进行实体关系抽取生成企业实体关系数据。

可选地，在本申请实施例所述的基于神经网络的企业风险分析预测方法中，所述根据语义特征进行实体关系抽取生成企业实体关系数据之后，还包括：

获取企业实体关系数据，根据企业实体关系数据生成词向量；

使用卷积神经网络捕获词向量构建的句子局部信息；

根据句子局部信息提取数据语义特征，并根据数据语义特征进行数据关系抽取，得到企业风险数据；

根据企业风险数据生成风险评价信息；

根据风险评价信息对企业风险进行等级划分。

可选地，在本申请实施例所述的基于神经网络的企业风险分析预测方法中，所述根据企业风险数据生成风险评价信息，根据风险评价信息对企业风险进行等级划分；具体为：

获取风险评价信息，将风险评价信息与预设的评价信息进行比较，得到评价值；

将所述评价值与企业风险等级的多个标准等级范围进行比较；

根据评价值计算企业风险等级；

将企业风险等级与预设的等级进行比较；

判断所述风险等级是否大于或等于预设的等级；

若大于或等于，则生成企业预警信息，根据企业预警信息生成企业风险数据；

若小于，则将企业风险评价信息进行实时监控。

第二方面，本申请实施例提供了一种基于神经网络的企业风险分析预测系统，该系统包括：存储器及处理器，所述存储器中包括基于神经网络的企业风险分析预测方法的程序，所述基于神经网络的企业风险分析预测方法的程序被所述处理器执行时实现以下步骤：

判断所述偏差率是否大于或等于预设的偏差率阈值；

若小于，则将企业风险评估信息传输至终端。

可选地，在本申请实施例所述的基于神经网络的企业风险分析预测系统中，所述通过网络爬虫技术爬取大量数据，并输入初始模型进行训练，生成风控模型，具体为：

若相似度大于或等于预设的相似度阈值，则生成企业数据；

可选地，在本申请实施例所述的基于神经网络的企业风险分析预测系统中，所述根据初始网页链接读取与访问初始网页，并提取网页中的数据元素，具体为：

获取初始网络链接，建立爬取参数；

判断所述爬取偏差率是否大于或等于预设的偏差率阈值；

第三方面，本申请实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质中包括基于神经网络的企业风险分析预测方法程序，所述基于神经网络的企业风险分析预测方法程序被处理器执行时，实现如上述任一项所述的基于神经网络的企业风险分析预测方法的步骤。

由上可知，本申请实施例提供的一种基于神经网络的企业风险分析预测方法、系统及介质，通过网络爬虫技术爬取大量数据，并输入初始模型进行训练，生成风控模型；获取企业文本数据，将企业文本数据进行预处理，抽取企业实体关系数据；将企业实体关系数据输入风控模型，得到企业风险评估信息；将企业风险评估信息与预设的评估信息进行比较，得到偏差率；判断所述偏差率是否大于或等于预设的偏差率阈值；若大于或等于，则生成风险预警信息，根据风险预警信息对企业风险进行预测；若小于，则将企业风险评估信息传输至终端；通过风控模型对企业文本数据进行实体关系抽取，并实现企业风险智能评估，当企业评估信息出现较大的偏差时，说明企业出现异常风险数据，根据异常风险数据对企业经营风险进行预测，提高企业风险分析的精度的技术。

本申请的其他特征和优点将在随后的说明书阐述，本申请的目的和优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例提供的基于神经网络的企业风险分析预测方法的流程图；

图2为本申请实施例提供的基于神经网络的企业风险分析预测方法的通过网络爬虫提取网页数据流程图；

图3为本申请实施例提供的基于神经网络的企业风险分析预测方法的网络爬虫爬取参数调整方法流程图；

图4为本申请实施例提供的基于神经网络的企业风险分析预测系统的结构示意图。

具体实施方式

下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

应注意到，相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。同时，在本申请的描述中，术语“第一”、“第二”等仅用于区分描述，而不能理解为指示或暗示相对重要性。

请参照图1，图1是本申请一些实施例中的一种基于神经网络的企业风险分析预测方法的流程图。该基于神经网络的企业风险分析预测方法用于终端设备中，该基于神经网络的企业风险分析预测方法，包括以下步骤：

S101，通过网络爬虫技术爬取大量数据，并输入初始模型进行训练，生成风控模型；

S102，获取企业文本数据，将企业文本数据进行预处理，抽取企业实体关系数据；

S103，将企业实体关系数据输入风控模型，得到企业风险评估信息，将企业风险评估信息与预设的评估信息进行比较，得到偏差率；

S104，判断偏差率是否大于或等于预设的偏差率阈值；

S105，若大于或等于，则生成风险预警信息，根据风险预警信息对企业风险进行预测；

若小于，则将企业风险评估信息传输至终端。

需要说明的是，网络爬虫是一个自动提取网页的程序，它为搜索引擎从万维网上下载网页，是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始，获得初始网页上的URL，在抓取网页的过程中，不断从当前页面上抽取新的URL放入队列，直到满足系统的一定停止条件，通过网络爬虫可以获取企业大数据，并对初始模型进行训练形成神经网络模型，提高神经网络模型的学习能力，使神经网络模型输出的结果更加精准。

请参照图2，图2是本申请一些实施例中的一种基于神经网络的企业风险分析预测方法的通过网络爬虫提取网页数据流程图。根据本发明实施例，通过网络爬虫技术爬取大量数据，并输入初始模型进行训练，生成风控模型，具体为：

S201，通过网络数据库建立爬取队列，并生成数据爬取顺序，生成初始网页链接；

S202，根据初始网页链接读取与访问初始网页，并提取网页中的数据元素；

S203，根据数据元素提取网页特征，将网页特征与预设的特征进行相似度计算；

S204，若相似度大于或等于预设的相似度阈值，则生成企业数据；

S205，若小于，则将爬取队列中的下一个网页链接进行调用，并提取网页中的数据进行分析。

需要说明的是，通过提取网页中的数据元素，并进行网页特征的提取，对网页特征进行判断，提高网页提取的数据元素的准确性，保证在模型训练过程中防止数据的冗余，提高训练效率。

请参照图3，图3是本申请一些实施例中的一种基于神经网络的企业风险分析预测方法的网络爬虫爬取参数调整方法流程图。根据本发明实施例，根据初始网页链接读取与访问初始网页，并提取网页中的数据元素，具体为：

S301，获取初始网络链接，建立爬取参数；

S302，获取实时爬取状态信息，将实时爬取状态信息与预设爬取状态信息进行比较，得到爬取偏差率；

S303，判断爬取偏差率是否大于或等于预设的偏差率阈值；

S304，若大于或等于，则生成爬取调整信息，根据爬取调整信息对爬取参数进行实时调整；

S305，若小于，则根据当前爬取参数读取与访问初始网页，并提取网页中的数据元素。

需要说明的是，在进行网页爬取过程中，通过判断爬取状态对爬取参数进行实时调整，保证网页爬取的精度，可以从网页中提取有效特征，防止无效特征对数据元素分析的干扰。

根据本发明实施例，获取企业文本数据，将企业文本数据进行预处理，抽取企业实体关系数据，具体为：

对拼接向量进行学习提取企业文本数据的语义特征；

根据语义特征进行实体关系抽取生成企业实体关系数据。

需要说明的是，通过网页爬取从专业数据库、信息披露网站、企业官网等多个渠道获取企业各类信息，如企业公告信息、企业司法信息、企业舆情信息等，构建了企业文本数据集，并通过企业文本数据抽取企业实体关系数据，企业相关文本数据集主要包括两种数据形式：第一类是有一定固定结构的企业文本数据，如企业公告、企业创新等数据，该类型的数据内容具有一定的重复性并且有较为固定的数据来源，如企业公告数据主要来源于巨潮资讯网等信息披露网站、企业创新数据等专业数据库。因此，按数据来源对这类数据进行风险类型划分。第二类是没有固定结构的文本数据，如企业舆情等，该类型数据内容呈现多样化、更新速度快。

根据本发明实施例，根据语义特征进行实体关系抽取生成企业实体关系数据之后，还包括：

使用卷积神经网络捕获词向量构建的句子局部信息；

根据企业风险数据生成风险评价信息；

根据风险评价信息对企业风险进行等级划分。

需要说明的是，通过对企业实体关系数据进行词向量划分，并提取语义特征，根据语义特征可以得到企业实体关系数据的语义，并对企业风险数据进行评价，评价值越高，说明企业风险越高，从而实现对企业风险的精准预测。

根据本发明实施例，根据企业风险数据生成风险评价信息，根据风险评价信息对企业风险进行等级划分；具体为：

将评价值与企业风险等级的多个标准等级范围进行比较；

根据评价值计算企业风险等级；

将企业风险等级与预设的等级进行比较；

判断风险等级是否大于或等于预设的等级；

若小于，则将企业风险评价信息进行实时监控。

需要说明的是，根据评价值判断该评价值处于哪一个风险等级的标准等级范围，并生成对应的风险等级，根据风险等级对企业进行实时动态预警，形成动态企业风险数据，从而可以根据企业风险数据对企业进行实时动态监控，提高企业的运行安全性。

根据本发明实施例，将标注好的文本数据和预处理的企业文本数据转换为向量进行拼接，还包括：

获取企业文本数据，将文本数据转换为向量；

利用卷积核与文本向量进行卷积运算；

不同的卷积核提取不同部位的特征信息；

将特征信息与预设的特征进行比较，得到特征偏差；

判断特征偏差是否满足预设的偏差范围；

若满足，则生成修正信息，根据修正信息对文图数据的转换参数进行修正；

若不满足，则得到文本数据语义信息。

需要说明的是，通过卷积神经网络对文本向量进行卷积运算，并判断文本特征是否满足要求，并实时对文本特征向量的转换参数进行实时调整，保证文本特征的转换精度。

请参照图4，图4是本申请一些实施例中的一种基于神经网络的企业风险分析预测系统的结构示意图。第二方面，本申请实施例提供了一种基于神经网络的企业风险分析预测系统4，该系统包括：存储器41及处理器42，存储器41中包括基于神经网络的企业风险分析预测方法的程序，基于神经网络的企业风险分析预测方法的程序被处理器执行时实现以下步骤：

判断偏差率是否大于或等于预设的偏差率阈值；

若小于，则将企业风险评估信息传输至终端。

根据本发明实施例，通过网络爬虫技术爬取大量数据，并输入初始模型进行训练，生成风控模型，具体为：

若相似度大于或等于预设的相似度阈值，则生成企业数据；

根据本发明实施例，根据初始网页链接读取与访问初始网页，并提取网页中的数据元素，具体为：

获取初始网络链接，建立爬取参数；

判断爬取偏差率是否大于或等于预设的偏差率阈值；

对拼接向量进行学习提取企业文本数据的语义特征；

根据语义特征进行实体关系抽取生成企业实体关系数据。

使用卷积神经网络捕获词向量构建的句子局部信息；

根据企业风险数据生成风险评价信息；

根据风险评价信息对企业风险进行等级划分。

将评价值与企业风险等级的多个标准等级范围进行比较；

根据评价值计算企业风险等级；

将企业风险等级与预设的等级进行比较；

判断风险等级是否大于或等于预设的等级；

若小于，则将企业风险评价信息进行实时监控。

获取企业文本数据，将文本数据转换为向量；

利用卷积核与文本向量进行卷积运算；

不同的卷积核提取不同部位的特征信息；

将特征信息与预设的特征进行比较，得到特征偏差；

判断特征偏差是否满足预设的偏差范围；

若不满足，则得到文本数据语义信息。

本发明第三方面提供了一种计算机可读存储介质，可读存储介质中包括基于神经网络的企业风险分析预测方法程序，基于神经网络的企业风险分析预测方法程序被处理器执行时，实现如上述任一项的基于神经网络的企业风险分析预测方法的步骤。

本发明公开的一种基于神经网络的企业风险分析预测方法、系统及介质，通过网络爬虫技术爬取大量数据，并输入初始模型进行训练，生成风控模型；获取企业文本数据，将企业文本数据进行预处理，抽取企业实体关系数据；将企业实体关系数据输入风控模型，得到企业风险评估信息；将企业风险评估信息与预设的评估信息进行比较，得到偏差率；判断所述偏差率是否大于或等于预设的偏差率阈值；若大于或等于，则生成风险预警信息，根据风险预警信息对企业风险进行预测；若小于，则将企业风险评估信息传输至终端；通过风控模型对企业文本数据进行实体关系抽取，并实现企业风险智能评估，当企业评估信息出现较大的偏差时，说明企业出现异常风险数据，根据异常风险数据对企业经营风险进行预测，提高企业风险分析的精度的技术。

在本申请所提供的几个实施例中，应该理解到，所揭露的设备和方法，可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，如：多个单元或组件可以结合，或可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口，设备或单元的间接耦合或通信连接，可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的，作为单元显示的部件可以是、或也可以不是物理单元；既可以位于一个地方，也可以分布到多个网络单元上；可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外，在本发明各实施例中的各功能单元可以全部集成在一个处理单元中，也可以是各单元分别单独作为一个单元，也可以两个或两个以上单元集成在一个单元中；上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储于可读取存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：移动存储设备、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、磁碟或者光盘等各种可以存储程序代码的介质。

或者，本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个可读取存储介质中。基于这样的理解，本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机、服务器、或者网络设备等）执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括：移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

Claims

1.一种基于神经网络的企业风险分析预测方法，其特征在于，包括：

判断所述偏差率是否大于或等于预设的偏差率阈值；

若小于，则将企业风险评估信息传输至终端。

2.根据权利要求1所述的基于神经网络的企业风险分析预测方法，其特征在于，所述通过网络爬虫技术爬取大量数据，并输入初始模型进行训练，生成风控模型，具体为：

若相似度大于或等于预设的相似度阈值，则生成企业数据；

3.根据权利要求2所述的基于神经网络的企业风险分析预测方法，其特征在于，所述根据初始网页链接读取与访问初始网页，并提取网页中的数据元素，具体为：

获取初始网络链接，建立爬取参数；

判断所述爬取偏差率是否大于或等于预设的偏差率阈值；

4.根据权利要求3所述的基于神经网络的企业风险分析预测方法，其特征在于，所述获取企业文本数据，将企业文本数据进行预处理，抽取企业实体关系数据，具体为：

对拼接向量进行学习提取企业文本数据的语义特征；

根据语义特征进行实体关系抽取生成企业实体关系数据。

5.根据权利要求4所述的基于神经网络的企业风险分析预测方法，其特征在于，所述根据语义特征进行实体关系抽取生成企业实体关系数据之后，还包括：

使用卷积神经网络捕获词向量构建的句子局部信息；

根据企业风险数据生成风险评价信息；

根据风险评价信息对企业风险进行等级划分。

6.根据权利要求5所述的基于神经网络的企业风险分析预测方法，其特征在于，所述根据企业风险数据生成风险评价信息，根据风险评价信息对企业风险进行等级划分；具体为：

根据评价值计算企业风险等级；

将企业风险等级与预设的等级进行比较；

判断所述风险等级是否大于或等于预设的等级；

若小于，则将企业风险评价信息进行实时监控。

7.一种基于神经网络的企业风险分析预测系统，其特征在于，该系统包括：存储器及处理器，所述存储器中包括基于神经网络的企业风险分析预测方法的程序，所述基于神经网络的企业风险分析预测方法的程序被所述处理器执行时实现以下步骤：

判断所述偏差率是否大于或等于预设的偏差率阈值；

若小于，则将企业风险评估信息传输至终端。

8.根据权利要求7所述的基于神经网络的企业风险分析预测系统，其特征在于，所述通过网络爬虫技术爬取大量数据，并输入初始模型进行训练，生成风控模型，具体为：

若相似度大于或等于预设的相似度阈值，则生成企业数据；

9.根据权利要求8所述的基于神经网络的企业风险分析预测系统，其特征在于，所述根据初始网页链接读取与访问初始网页，并提取网页中的数据元素，具体为：

获取初始网络链接，建立爬取参数；

判断所述爬取偏差率是否大于或等于预设的偏差率阈值；

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中包括基于神经网络的企业风险分析预测方法程序，所述基于神经网络的企业风险分析预测方法程序被处理器执行时，实现如权利要求1至6中任一项所述的基于神经网络的企业风险分析预测方法的步骤。