CN116402352A

CN116402352A - 一种企业风险预测方法、装置、电子设备及介质

Info

Publication number: CN116402352A
Application number: CN202310423718.0A
Authority: CN
Inventors: 方芳; 董臣令; 王玲; 曾文秋; 潘明慧; 邱震宇; 朱江涛; 叶超; 姜聪聪; 黄宇海
Original assignee: Huatai Securities Co ltd
Current assignee: Huatai Securities Co ltd
Priority date: 2023-04-20
Filing date: 2023-04-20
Publication date: 2023-07-07

Abstract

本发明公开了一种企业风险预测方法、装置、电子设备及介质，包括：根据所获取的企业经营活动数据，抽取出预定企业所需进行风险预测的主体事件信息及其关联企业的信息；基于主体事件信息及其关联企业的信息，构建主体事件序列并生成事件网络图；所述主体事件序列包括预定企业的事件链和预设的候选事件；将由所述主体事件序列生成的事件初始编码以及由所述事件网络图生成的事件传播矩阵输入预构建并训练好的风险预测模型中，获得所述预定企业的风险预测结果；风险预测模型包括图神经网络GNN和长短期记忆网络LSTM，所述风险预测模型是采用企业经营活动事件的历史数据以边缘损失函数margin loss最小为目标训练获得的。本发明有效提高了企业风险预测的准确率。

Description

一种企业风险预测方法、装置、电子设备及介质

技术领域

本发明涉及人工智能与数据处理技术领域，具体涉及一种企业风险预测方法、装置、电子设备及介质。

背景技术

传统的企业风险预测方法主要包括事件抽取、模型构建和风险事件预测三个阶段；在模型构建的阶段，通常分为基于专家经验构建的预测模型、及基于基础模型构建的预测模型。但是，基于专家经验构建的风险预测模型强依赖于专家经验的规则知识，存在规则维护成本高、应用灵活度低、无法进行场景迁移的问题，在快速变化的市场环境及多种因素的干扰下，其无法长期准确地为业务提供可靠的风险分析预警指导。

而基于基础模型构建的预测模型，主要是根据历史事件之间的前后关系的静态统计分析结果进行预测，并且一般是根据相同的事件类型进行预测的，该方法只能学习到事件之间的静态统计学信息，无法学习到各种类型的事件构成的复杂网络中的结构信息，因此不能对事件之间的关联关系进行全面的分析，也不能学习到一个事件序列中的不同事件对候选事件的影响程度信息，导致很难发现事件之间的先后关联关系；而实际上，一个事件链中的不同事件发生的先后顺序不同，导致它对候选事件发生的影响也会不同，对于风险事件预测阶段，基于历史事件之间的前后关系的静态统计分析结果进行预测的方法，没有全面考虑到企业可能在同一时间段内发生多个不同类型的事件，且企业随着时间的变化，可能产生新的事件的等情况，而这些动态变化的因素和复杂的网络结构都会导致现有的方法具有很多的局限性，其预测结果准确率也大打折扣。

发明内容

本发明的目的在于克服现有技术中的不足，提供一种企业风险预测方法、装置、电子设备及介质，能够挖掘出企业中多种类型的事件与风险之间的关系，以提高对企业的风险事件进行预测的准确性。

为达到上述目的，本发明是采用下述技术方案实现的：

第一方面，本发明提供了企业风险预测方法，所述方法包括：

根据所获取的企业经营活动数据，抽取出预定企业所需进行风险预测的主体事件信息及其关联企业的信息；

基于所述主体事件信息及其关联企业的信息，构建主体事件序列并生成事件网络图；所述主体事件序列包括预定企业的事件链和预设的候选事件；

将由所述主体事件序列生成的事件初始编码以及由所述事件网络图生成的事件传播矩阵输入预构建并训练好的风险预测模型中，获得所述预定企业的风险预测结果；

其中，风险预测模型包括图神经网络GNN和长短期记忆网络LSTM，所述风险预测模型是采用企业经营活动事件的历史数据以边缘损失函数margin loss最小为目标训练获得的。

结合第一方面，优选的，所获取的企业经营活动数据包括企业的新闻资讯、风险舆情、企业公告和企业关系图谱。

结合第一方面，优选的，所述构建主体事件序列并生成事件网络图的步骤包括：

通过机器学习的算法，将所述主体事件信息和关联企业信息中的事件和主体进行分类，并筛选出符合要求的事件类型和主体类型；

将预定企业中满足所述事件类型的经营活动事件，按照事件发生的时间先后顺序构建事件链，在事件链的尾端分别连接不同的候选事件形成多个不同的初始事件链，多个所述初始向量构成所述预定企业的主体事件序列；

结合所述主体类型内各企业发生所述事件链中的各事件的次数，通过公式(1)计算所述事件链中的各相邻事件对的权重:

式中，count(e_i,e_j)表示事件e_i发生后，事件e_j的发生次数；i＝1,2…n；j＝1,2…n；n表示事件链中的事件总数，i≠j，i≠h；ount(e_i,e_h)表示事件e_i发生后，事件e_h的发生次数；W_ij表示发生事件e_i后事件e_j相邻发生的权重；

基于所述事件链和各相邻事件对的权重，构建成一个事件网络图。

结合第一方面，优选的，所述机器学习的算法包括支持向量机SVM算法、K-Means聚类算法和卷积神经网络CNN算法。

结合第一方面，优选的，所述图神经网络GNN用于根据由事件网络图生成的事件传播矩阵的特征信息，对主体事件序列中初始事件链的各事件进行编码，得到聚合了邻居节点信息的事件编码向量。

结合第一方面，优选的，所述长短期记忆网络LSTM基于图神经网络GNN的编码结果，将时序特征融合到各事件的编码向量中，输出事件链上的事件融合编码及候选事件的融合编码。

结合第一方面，优选的，所述边缘损失函数margin loss为：

式中：p表示损失函数参数，||θ||²为L₂正则化项，γ为L₂正则化项的拟合参数，s_iy表示事件链上的事件e_i和发生在事件e_i之后的真实后续事件y间的相关分数；s_ik表示事件e_i与候选事件c_k间的相关分数，k＝1,2…m；m表示候选事件的总数；其中s_ik的计算公式如下：

式中：

表示第t次更新风险预测模型参数时学习到事件链时序信息的事件e_i的融合编码，/>

表示第t次更新风险预测模型参数时学习到事件链时序信息的候选事件c_k的融合编码。

第二方面，本发明提供了企业风险预测装置，所述装置包括：

主体事件信息抽取模块，用于根据所获取的企业经营活动数据，抽取出预定企业所需进行风险预测的主体事件信息及其关联企业的信息；

事件网络图生成模块，用于基于所述主体事件信息及其关联企业的信息，构建主体事件序列并生成事件网络图；所述主体事件序列包括预定企业的事件链和预设的候选事件；

风险预测模块，用于将由所述主体事件序列生成的事件初始编码以及由所述事件网络图生成的事件传播矩阵输入预构建并训练好的风险预测模型中，获得所述预定企业的风险预测结果；

第三方面，本发明提供了一种电子设备，包括处理器及存储介质；

所述存储介质用于存储指令；

所述处理器用于根据所述指令进行操作以执行如第一方面任一所述的企业风险预测方法的步骤。

第四方面，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时，实现如第一方面任一所述的企业风险预测方法的步骤。

与现有技术相比，本发明所达到的有益效果：

本发明所构建的风险预测模型包括图神经网络GNN和长短期记忆网络LSTM，通过图神经网络GNN来编码各类型的事件，从而学习到多种类型的事件对当前事件的影响，事件网络图中的结构信息使得事件的编码结果包含的信息更丰富；在得到图神经网络GNN的事件编码结果后，通过长短期记忆网络LSTM进一步学习事件之间的时序关系信息来更新事件的编码，使之各事件的编码向量包含时序信息，从而使得模型的预测结果会更加准确；

此外，现有技术的预测方法在风险管理场景中，只能在事件活动发生之后捕获舆情信息，针对的是已经发生的事实性事件；而本发明所构建的主体事件序列包括预定企业的事件链和预设的候选事件，通过将由所述主体事件序列生成的事件初始编码以及由所述事件网络图生成的事件传播矩阵输入至本发明所构建的风险预测模型中能够预测出未来可能发生的风险事件，如评级下调本身可能会引起信用风险的上升；结合这种新型的事件预测结果，能够帮助企业挖掘潜在的信用、财务、经营风险，从而能够进行及时的预警和处置；另外，在融资融券场景中，通过本发明所构建的风险预测模型对风险事件及时的推理预测，能够快速对受影响的标的进行预警，并辅助企业进行标的券的处置。

附图说明

图1为本发明实施例提供的企业风险预测方法流程示意图；

图2为本发明实施例提供的企业风险预测方法在运用时的框架示意图。

图3为本发明实施例提供的企业经营活动的事件链示意图；

图4为本发明实施例提供的企业经营活动的事件网络图；

图5为本发明实施例提供的风险预测模型的结构原理框图；

图6为本发明实施例提供的图神经网络GNN对事件进行编码的过程示意图；

图7为本发明实施例提供的GRU单元结构示意图；

图8为本发明实施例提供的长短期记忆网络LSTM将时序特征融合到各事件的编码向量中的过程示意图；

图9为本发明实施例提供的企业风险预测装置的结构原理框图。

具体实施方式

下面通过附图以及具体实施例对本发明技术方案做详细的说明，应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明，而不是对本申请技术方案的限定，在不冲突的情况下，本申请实施例以及实施例中的技术特征可以相互组合。

本文中术语“和/或”，仅仅是一种描述关联对象的关联关系，表示可以存在三种关系，例如，A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本文中字符"/"，一般表示前后关联对象是一种“或”的关系。

实施例一：

如图1所示，本发明实施例介绍一种企业风险预测方法，具体包括如下步骤：

步骤S1：根据所获取的企业经营活动数据，抽取出预定企业所需进行风险预测的主体事件信息及其关联企业的信息；

进一步的，所获取的企业经营活动数据包括企业的新闻资讯、风险舆情、企业公告和企业关系图谱等信息。本发明实施例通过自然语言处理技术NLP对企业命名实体、经营活动事件等内容进行识别和抽取；主要抽取出上市公司发生的事件，事件发生的时间、公司主体相关信息等，使用自然语言处理技术NLP中的词性标注、命名实体识别、依存句法关系等技术解决。

步骤S2：基于所述主体事件信息及其关联企业的信息，构建主体事件序列并生成事件网络图；所述主体事件序列包括预定企业的事件链和预设的候选事件；

步骤S3：将由所述主体事件序列生成的事件初始编码以及由所述事件网络图生成的事件传播矩阵输入预构建并训练好的风险预测模型中，获得所述预定企业的风险预测结果；

具体的，如图2所示为本发明实施例提供的企业风险预测方法的一个运用场景，利用新闻资讯及企业关系图谱等信息进行分析，挖掘出企业中多种类型的事件与风险之间的关系，从而构建风险预测模型，并基于此风险预测模型对企业的风险事件进行预测，能够实现实时展现上市公司是否存在风险，并进行预警信息的推送。

作为本发明的一种实施例，在步骤S2中，构建主体事件序列并生成事件网络图的步骤包括：

A:通过机器学习的算法，将所述主体事件信息和关联企业信息中的事件和主体进行分类，并筛选出符合要求的事件类型和主体类型；

其中，机器学习的算法包括支持向量机SVM算法、K-Means聚类算法和卷积神经网络CNN算法。需要说明的是，由于上市公司行业类型众多，属于不同行业类型的企业发生的事件之间彼此的差异很大，为了降低风险预测模型的预测误差并增加模型的鲁棒性，根据按行业类型等特征分类后的主体所发生的各类事件来建模；另一方面，企业经营活动舆情新闻和公告中会涉及众多的事件，为了降低模型的复杂度并提升模型预测转准确率，针对事件类型对所有的事件进行分类，之后再构建事件序列。

B:将预定企业中满足所述事件类型的经营活动事件，按照事件发生的时间先后顺序构建事件链(参照图3所示)，在事件链的尾端分别连接不同的候选事件形成多个不同的初始事件链，多个所述初始向量构成所述预定企业的主体事件序列；

C:结合所述主体类型内各企业发生所述事件链中的各事件的次数，通过公式(1)计算所述事件链中的各相邻事件对的权重:

D:基于所述事件链和各相邻事件对的权重，构建成一个事件网络图。

需要说明的是，事件网络图的形式表示为G＝{E,L}，其中，事件节点集E＝e₁,e₂，…e_n，企业经营活动中的某个事件的边集L＝l₁,l₂，…l_n，L表示相邻事件发生的关系；对事件链中的相邻事件对进行计数，将每对相邻事件对看作L中的一条边；每条边是一条有向边e_i→e_j，其权值表示为W_ij，即表示事件e_i和e_j两个事件相邻发生的可能性，最终构建成一个事件网络图，如图4所示。

进一步的，由于图神经网络GNN在生成节点表征时，能聚合节点的邻居节点信息，本实施例通过图神经网络GNN根据前述事件网络图对预设企业事件链中事件e_i和预先获得的候选事件c_k(k＝1,2…,m)进行编码，得到事件编码向量，用于预测最可能发生的后续事件。

具体的，图神经网络GNN的输入是事件初始编码h⁽⁰⁾和事件传播矩阵A，输出是结合事件网络图信息的事件编码向量，即聚合了邻居节点信息的事件编码表征，通过嵌入矩阵对事件进行编码得到；其中，事件传播矩阵A的元素取值即为公式(1)中计算的各相邻事件对的权重W_ij。对于图6所示的主体事件序列，输入为事件e₂、e₃、e₄和候选事件c₅、c₆的编码及其相关事件传播矩阵。

进一步说明的是，图神经网络GNN对各事件进行编码时，需要进行多次状态更新，状态更新过程表达式如下：

z^(t)＝σ(W_za^(t)+U_zh^(t-1)) (3)

r^(t)＝σ(W_ra^(t)+U_rh^(t-1)) (4)

c^(t)＝tanh (W_ca^(t)+U_c(r^(t)⊙h^(t-1))) (5)

h^(t)＝(1-z^(t))⊙h^(t-1)+z^(t)⊙c^(t) (6)

式中，

是事件传播矩阵A的一个子矩阵，n是事件链中事件个数，m是候选事件的个数，对应事件传播矩阵A中与事件有关的元素；b为偏置向量；a^(t)为第t次更新迭代时输入的信息，包含了每个方向上的激活；W_z和U_z分别表示更新门两个不同的训练参数；W_r和U_r分别表示重置门的两个不同的训练参数；W_c和U_c分别是门控图神经网络的两个训练参数；σ为sigmoid激活函数；⊙表示逐元素相乘；h^(t-1)表示第t-1次迭代更新的事件编码；；h^(t)表示第t次迭代更新的事件编码；

其中h^(t)包含的元素可表示为：

为事件链中事件e_i的编码向量，/>

为候选事件c_k的编码向量；式(2)用于不同事件之间的信息传播，这些信息传播要受到事件网络图中边的限制(包括是否有边、边的方向以及边的权重；公式(3)～(6)均为图神经网络GNN中GRU单元的计算公式，参照图7为GRU单元的结构示意图。

作为本发明的一种实施例，所述长短期记忆网络LSTM基于图神经网络GNN的编码结果，将时序特征融合到各事件的编码向量中，输出事件链上的事件融合编码及候选事件的融合编码；具体的，如图8所示，基于图神经网络GNN对事件进行编码的结果，将已知事件链上的各个事件的编码按顺序拼接成为一个事件链编码，将拼接后的事件链编码结果作为循环神经网络LSTM的输入，最终得到新的事件序列编码结果，结合事件链最后一个事件的编码，以相同的方式确定每个候选事件c_k的编码，这样候选事件c_k的编码结果就学习到了事件链中每个事件的时序信息。

进一步说明的是，本发明实施例提供的风险预测模型在预测风险事件是，针对每个候选事件计算一个分值，候选事件与整个事件链的相关性使用该候选事件与每个事件的相关分数的总和来表示，相关分数的总和最小的候选事件即为事件链的下一个预测事件；具体的，如公式(7)，给定一个事件对

和/>

两个事件之间的相关分数relation score通过计算两个向量的欧式距离得到：,

式中：

作为本发明的一种实施例，当给定一系列的事件链，每条事件链都对应着一些候选事件，其中只有一个事件是真正将要发生的事件，上述风险预测模型训练的目标是最大化真实事件对应的概率，并最小化其他候选事件的概率；其损失函数为边缘损失函数margin loss，参见下式：

式中：p表示损失函数参数，||θ||²为L₂正则化项，γ为L₂正则化项的拟合参数，s_iy表示事件链上的事件e_i和发生在事件e_i之后的真实后续事件y间的相关分数；s_ik表示事件e_i与候选事件c_k间的相关分数，k＝1,2…m；m表示候选事件的总数。

在训练上述风险预测模型前，需要先获取不同企业的事件，并根据事件发生时间构建事件链；然后根据事件链构造训练数据，任一选择其中的一个事件作为待预测真实事件，该事件前的多个事件作为输入事件进行多次训练，训练时采用梯度反向传播方法对模型参数进行更新直至损失函数收敛，待更新参数有长短期记忆网络LSTM和图神经网络GNN的重置门、更新门的参数等。

综上所述，本发明实施例提供的企业风险预测方法，引入图神经网络GNN和深度学习相结合的方式，来对事件进行分析建模，同时通过长短期记忆网络LSTM学习事件之间的时序信息和各种类型的事件间存在的复杂的关联关系，从而构建风险预测模型，脱离对传统方式中高纬度规则的依赖，使得分析更加灵活，能够适配不同的场景；使用时，通过本发明方法预测后续可能产生的经营活动事件后进行实时展现，若发生的事件可能导致风险时，给出预警信息，为企业现有业务推送实时的预警信息，提高企业对各业务的风险预判能力和产业效益。

实施例二：

如图9所示，本发明实施例提供了一种企业风险预测装置，可以用于实施实施例一所述的方法，所述装置包括：

作为本发明的一种实施例，其中，风险预测模型包括图神经网络GNN和长短期记忆网络LSTM，所述风险预测模型是采用企业经营活动事件的历史数据以边缘损失函数marginloss最小为目标训练获得的。

本发明实施例提供的企业风险预测装置与实施例一提供的企业风险预测方法基于相同的技术构思，能够产生如实施例一所述的有益效果，在本实施例中未详尽描述的内容可以参见实施例一。

实施例三：

本发明实施例提供了一种电子设备，包括处理器及存储介质；

所述存储介质用于存储指令；

处理器用于根据指令进行操作以执行根据实施例一中任一项方法的步骤。

实施例四：

本发明实施例提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时，实现如实现实施例一中任一项方法的步骤。

本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明技术原理的前提下，还可以做出若干改进和变形，这些改进和变形也应视为本发明的保护范围。

Claims

1.一种企业风险预测方法，其特征在于，所述方法包括：

2.根据权利要求1所述的企业风险预测方法，其特征在于，所获取的企业经营活动数据包括企业的新闻资讯、风险舆情、企业公告和企业关系图谱。

3.根据权利要求1所述的企业风险预测方法，其特征在于，所述构建主体事件序列并生成事件网络图的步骤包括：

4.根据权利要求3所述的企业风险预测方法，其特征在于，所述机器学习的算法包括支持向量机SVM算法、K-Means聚类算法和卷积神经网络CNN算法。

5.根据权利要求4所述的企业风险预测方法，其特征在于，所述图神经网络GNN用于根据由事件网络图生成的事件传播矩阵的特征信息，对主体事件序列中初始事件链的各事件进行编码，得到聚合了邻居节点信息的事件编码向量。

6.根据权利要求5所述的企业风险预测方法，其特征在于，所述长短期记忆网络LSTM基于图神经网络GNN的编码结果，将时序特征融合到各事件的编码向量中，输出事件链上的事件融合编码及候选事件的融合编码。

7.根据权利要求1至6任一所述的企业风险预测方法，其特征在于，所述边缘损失函数margin loss为：

式中：

8.一种企业风险预测装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，包括处理器及存储介质；

所述存储介质用于存储指令；

所述处理器用于根据所述指令进行操作以执行根据权利要求1至7任一项所述的企业风险预测方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时，实现如权利要求1至7任一项所述的企业风险预测方法的步骤。