CN113850085B

CN113850085B - 企业的等级评估方法、装置、电子设备及可读存储介质

Info

Publication number: CN113850085B
Application number: CN202111449310.8A
Authority: CN
Inventors: 张豪杰; 沈剑峰; 徐菊婷; 王晓旭; 钟浩
Original assignee: Beijing Minglue Zhaohui Technology Co Ltd
Current assignee: Beijing Minglue Zhaohui Technology Co Ltd
Priority date: 2021-12-01
Filing date: 2021-12-01
Publication date: 2022-03-29
Anticipated expiration: 2041-12-01
Also published as: CN113850085A

Abstract

本申请提供了一种企业的等级评估方法、装置、电子设备及可读存储介质，包括：获取待评估企业的多个企业相关事件信息，对多个所述企业相关事件信息根据语义进行切割，确定出多个目标字符和每个目标字符对应的编号信息；将各个目标字符按照对应的编号信息依次输入至预先训练好的实体抽取模型中，输出多个相关事件实体信息；相关事件实体信息是依据相关事件实体信息的头实体以及头实体和尾实体之间的关联关系确定出；针对于一个相关事件实体信息，对相关事件实体信息的情感进行分析确定出相关事件实体信息的评价类型；基于多个相关事件实体信息的不同评价类型的数量确定出待评估企业的等级，实现利用相关事件实体信息对企业等级进行评估的准确性。

Description

企业的等级评估方法、装置、电子设备及可读存储介质

技术领域

本申请涉及数据处理技术领域，尤其是涉及企业的等级评估方法、装置、电子设备及可读存储介质。

背景技术

随着技术的发展，当人们换工作或者是找工作时为了找到适合自己的目标企业，通常会通过关注一个企业的评价等级来确定出适合自己的目标企业，目前大多数实践是依靠朋友关系介绍或者是网上搜索目标企业的相关信息对该目标企业进行评价，但是由于相关信息过多无法便捷的确定出目标企业的等级，并且目标企业的信息动态是一直变化的，所以要持续关注目标企业的动态，需要反复查询相关信息费时费力。

现阶段，为了快速了解企业的评估等级需要通过对企业的相关事件信息中的关键词进行评估，通常对企业的相关事件信息中关键词的提取一般是使用Word2vec的Skip-gram提取词向量，但是这种方法会导致提取词向量效果不好，或者是通过简单的softmax分类器对关键词之间的关系进行预测，但是这种方法会存在关键词不准确的问题。所以，如何在企业相关事件信息中快速提取到企业的重要信息进而对企业进行评估成为了亟需解决的问题。

发明内容

有鉴于此，本申请的目的在于提供一种企业的等级评估方法、装置、电子设备及可读存储介质，通过对企业的相关事件信息的语义进行分割得到多个字符，将多个字符输入至实体抽取模型中，在实体抽取模型内根据相关事件实体信息的头实体以及头实体和尾实体之间的关联关系确定出多个相关事件实体信息，从而有效提高了相关事件实体信息的准确性以及避免了相关事件实体信息关系重叠的问题，并且利用相关事件实体信息对企业等级进行评估，提高了企业等级评估的准确性。

本申请实施例提供了一种企业的等级评估方法，所述等级评估方法包括：

获取待评估企业的多个企业相关事件信息，对多个所述企业相关事件信息根据语义进行切割，确定出多个目标字符以及每个目标字符对应的编号信息；

将各个所述目标字符按照对应的编号信息依次输入至预先训练好的实体抽取模型中，获得多个相关事件实体信息；其中，所述相关事件实体信息是依据所述相关事件实体信息的头实体以及所述头实体和尾实体之间的关联关系确定出；

针对于一个所述相关事件实体信息，对所述相关事件实体信息的情感进行分析确定出所述相关事件实体信息的评价类型；

基于多个所述相关事件实体信息的不同评价类型的数量确定出待评估企业的等级。

进一步的，针对每一个所述相关事件实体信息，通过以下步骤确定相关事件实体信息：

将多个所述目标字符输入至所述实体抽取模型中，确定出各个所述目标字符的字符编码序列；

基于确定出的多个所述目标字符的字符编码序列，确定出所述相关事件实体信息中包括的至少一个头实体以及每一个头实体的第一字符编码信息；

针对于每一个头实体，基于预设的头实体与尾实体之间的关联关系，确定出与该头实体相关联的至少一个尾实体以及每一个尾实体的第二字符编码信息；

针对于每一个第二字符编码信息，基于所述第一字符编码信息以及所述第二字符编码信息确定出所述相关事件实体信息。

进一步的，针对每一个所述头实体，通过以下步骤确定该头实体的第一字符编码信息，包括：

基于多个所述目标字符的字符编码序列，确定出该头实体的头边界以及该头实体的尾边界；

基于所述头实体的头边界以及所述头实体的尾边界，提取出该头实体；

基于所述头实体的字符编码序列，确定出所述第一字符编码信息。

进一步的，通过以下方式确定出所述头实体的头边界以及所述头实体的尾边界，包括：

基于所述实体抽取模型中包括的第一分类器以及第二分类器，对所述头实体的字符编码序列进行检测；

将所述字符编码序列中编码数值为第一目标数值的编码确定为所述头实体的头边界；

将所述字符编码序列中编码数值为第二目标数值的编码确定为所述头实体的尾边界。

进一步的，针对每一个所述尾实体，通过以下步骤确定该尾实体的第二字符编码信息：

基于多个所述目标字符的字符编码序列，确定出该尾实体的头边界以及该尾实体的尾边界；

基于所述尾实体的头边界以及所述尾实体的尾边界，提取出该尾实体；

基于所述尾实体的字符编码序列，确定出所述第二字符编码信息。

进一步的，针对于每一个第二字符编码信息，基于所述第一字符编码信息以及所述第二字符编码信息确定出所述相关事件实体信息，包括：

将所述第一字符编码信息以及所述第二字符编码信息进行信息拼接确定出目标字符编码信息；

基于所述目标字符编码信息确定出所述相关事件实体信息。

进一步的，本申请实施例还提供了一种企业的等级评估装置，所述等级评估装置包括：

切割模块，用于获取待评估企业的多个企业相关事件信息，对多个所述企业相关事件信息根据语义进行切割，确定出多个目标字符以及每个目标字符对应的编号信息；

实体输出模块，用于将各个所述目标字符按照对应的编号信息依次输入至预先训练好的实体抽取模型中，获得多个相关事件实体信息；其中，所述相关事件实体信息是依据所述相关事件实体信息的头实体以及所述头实体和尾实体之间的关联关系确定出；

评价类型确定模块，用于针对于一个所述相关事件实体信息，对所述相关事件实体信息的情感进行分析确定出所述相关事件实体信息的评价类型；

等级评估模块，用于基于多个所述相关事件实体信息的不同评价类型的数量确定出待评估企业的等级。

进一步的，所述实体输出模块通过以下步骤确定相关事件实体信息：

将该相关事件实体信息输入至所述实体抽取模型中，确定出各个所述目标字符的字符编码序列；

针对于每一个头实体，基于预设的头实体与尾实体之前的关联关系，确定出与该头实体相关联的至少一个尾实体以及每一个尾实体的第二字符编码信息；

本申请实施例还提供一种电子设备，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如上述的一种企业的等级评估方法的步骤。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如上述的一种企业的等级评估方法的步骤。

本申请提供了一种企业的等级评估方法、装置、电子设备及可读存储介质，等级评估方法包括：获取待评估企业的多个企业相关事件信息，对多个所述企业相关事件信息根据语义进行切割，确定出多个目标字符以及每个目标字符对应的编号信息；将各个目标字符按照对应的编号信息依次输入至预先训练好的实体抽取模型中，获得多个相关事件实体信息；其中，相关事件实体信息是依据相关事件实体信息的头实体以及头实体和尾实体之间的关联关系确定出；针对于一个相关事件实体信息，对相关事件实体信息的情感进行分析确定出相关事件实体信息的评价类型；基于多个相关事件实体信息的不同评价类型的数量确定出待评估企业的等级。

这样，通过对企业的相关事件信息的语义进行分割得到多个字符，将多个字符输入至实体抽取模型中，在实体抽取模型内根据相关事件实体信息的头实体以及头实体之间的关联关系确定出多个相关事件实体信息，从而有效提高了相关事件实体信息的准确性以及避免了相关事件实体信息关系重叠的问题，并且利用相关事件实体信息对企业等级进行评估，提高了企业等级评估的准确性。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本申请实施例所提供的一种企业的等级评估方法的流程图；

图2为本申请实施例所提供的相关事件实体信息的确定方法的流程图；

图3为本申请实施例所提供的一种企业的等级评估装置的结构示意图；

图4为本申请实施例所提供的一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，应当理解，本申请中的附图仅起到说明和描述的目的，并不用于限定本申请的保护范围。另外，应当理解，示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应当理解，流程图的操作可以不按顺序实现，没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外，本领域技术人员在本申请内容的指引下，可以向流程图添加一个或多个其他操作，也可以从流程图中移除一个或多个操作。

另外，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的全部其他实施例，都属于本申请保护的范围。

为了使得本领域技术人员能够使用本申请内容，结合特定应用场景“对于企业等级进行评估”，给出以下实施方式，对于本领域技术人员来说，在不脱离本申请的精神和范围的情况下，可以将这里定义的一般原理应用于其他实施例和应用场景。

本申请实施例下述方法、装置、电子设备或计算机可读存储介质可以应用于任何需要进行对企业等级进行评估的场景，本申请实施例并不对具体的应用场景作限制，任何使用本申请实施例提供的一种企业的等级评估方法、装置、电子设备及可读存储介质的方案均在本申请保护范围内。

首先，对本申请可适用的应用场景进行介绍。本申请可应用于本申请可应用于数据处理技术领域。

经研究发现，现阶段，为了快速了解企业的评估等级需要通过对企业的相关事件信息中的关键词进行评估，通常对企业的相关事件信息中关键词的提取一般是使用Word2vec的Skip-gram提取词向量，但是这种方法会导致提取词向量效果不好，或者是通过简单的softmax分类器对关键词之间的关系进行预测，但是这种方法会存在关键词不准确的问题。所以，如何在企业相关事件信息中快速提取到企业的重要信息进而对企业进行评估成为了亟需解决的问题。

现在有如下方法对企业的相关事件信息中的关键词进行提取：第一种，获取文物数据集，并对文物数据进行预处理，得到预处理后的文物数据；通过Word2vec的Skip－gram模型对预处理后的文物数据进行词向量的转化，提取句子中每个单词的词汇级别特征；使用卷积神经网络来提取文物数据中每条句子的句子级别特征；将所提取的词汇级别特征和句子级别特征进行拼接，得到拼接后的特征向量，将拼接后的特征向量作为分类任务的特征数据，接入全连接层；在全连接层将特征数据经线性变换，再通过Softmax分类器计算分类预测值，得到该句子关联关系的置信度得分，置信度得分反映句子的关系。但是，这种方法使用Word2vec的Skip-gram提取词向量，效果不如经过BERT模型提取词向量的效果好；该方法先用Word2vec的Skip-gram提取词向量，再使用卷积神经网络来提取句子向量，提取方式显得复杂。

第二种，数据集模块，用于以百科三元组为外部知识库和以海洋经济产业文本数据的新闻文本作为外部文档库，构建远程监督数据集，其中，远程监督数据集包括三元组格式的训练集和测试集；实体抽取模型模块，用于构建实体关系联合实体抽取模型，对实体关系联合实体抽取模型的参数进行初始化，其中，实体关系联合实体抽取模型包括字符LSTM层、编码层、实体提取模块和关系提取模块；训练模块，用于使用远程监督数据集对实体关系联合实体抽取模型进行训练，并使用训练好的实体关系联合实体抽取模型进行实体关系联合抽取。但是，这种方法使用LSTM来进行编码字符序列，虽然LSTM可以一定程度上缓解长距离依赖问题，但是当字符序列较长时，仍然存在捕捉长距离依赖问题。

基于此，本申请实施例提供了一种企业的等级评估方法，通过对企业的相关事件信息的语义进行分割得到多个字符，将多个字符输入至实体抽取模型中，在实体抽取模型内根据相关事件实体信息的头实体以及头实体之间的关联关系确定出多个相关事件实体信息，从而有效提高了相关事件实体信息的准确性以及避免了相关事件实体信息关系重叠的问题，并且利用相关事件实体信息对企业等级进行评估的提高了企业等级评估的准确性。

请参阅图1，图1为本申请实施例所提供的一种企业的等级评估方法的流程图。如图1中所示，本申请实施例提供的等级评估方法，包括：

S101：获取待评估企业的多个企业相关事件信息，对多个所述企业相关事件信息根据语义进行切割，确定出多个目标字符以及每个目标字符对应的编号信息。

该步骤，获取待评估企业的多个企业相关事件信息，对每一个企业相关事件信息根据词义切割得到多个目标字符，且目标字符中还携带着对应的编号信息。

这里，在本申请实施例中，可以是在多个企业中确定出待评估的企业，根据待评估企业的名称获取待评估企业的多条企业相关事件信息，其中，可以在论坛中获得该企业的相关事件信息或者是在媒体中获得该企业的相关事件信息，这里不限定企业相关事件信息的来源。

这里，企业相关事件信息为关于该企业的一些事件的报道或者是一些员工对该企业的评价等其他类型的信息。

其中，可以根据企业相关事件信息的语义进行切割获得多个目标字符，如，“特变公司高管小明出走”，则可以根据“第一公司高管小明出走”的语义切分成“第一公司”、“高管”、“小明”、“出走”或者是“第”、“一”、“公”、“司”、“高”、“管”、“小”、“明”、“出”、“走”。这里，关于如何利用语义对企业相关事件信息进行分割的方法，此部分不做限定。

其中，目标字符对应的编号信息是依据企业相关事件信息中该目标字符在企业相关事件信息中的字符位置确定出来的，如企业相关事件信息中“高管出走”则“高”的编号信息为“0”，“管”的编号信息为“1”。

S102：将各个所述目标字符按照对应的编号信息依次输入至预先训练好的实体抽取模型中，获得多个相关事件实体信息；其中，所述相关事件实体信息是依据所述相关事件实体信息的头实体以及所述头实体和尾实体之间的关联关系确定出。

该步骤中，将各个目标字符依据每个目标字符的编号顺序依次输入至预先训练好的实体抽取模型之中，输出多个相关事件实体信息，这里，相关事件实体信息是依据相关事件实体信息的头实体以及头实体和尾实体之间的关联关系确定出。

这里，相关事件实体信息为在企业相关事件信息中的实体数据的表称，且，相关事件实体信息是由至少两个目标字符组成的，如，“某国”、“第一公司”、“某国人”等。

这里，相关事件实体信息的头实体为相关事件实体信息的第一个目标字符，如，至少两个目标字符组成的相关事件实体信息为“第一公司”，则“第”为头实体。

这里，实体抽取模型是由BERT模型（Bidirectional Encoder Representationsfrom Transformers，BERT）、分类器以及其他结构训练组成的，实体抽取模型是用于对企业相关事件信息中的多个相关事件实体信息进行抽取。

其中，头实体的关联关系可以是依据专家经验进行设定的，如相关事件实体信息为“第一公司”的头实体为“第”，则头实体“第”的关联关系为公司名称，这里，头实体的关联关系也属于相关事件实体信息的关联关系，如，相关事件实体信息的“第一公司”的关联关系为公司名称。

其中，头实体的关联关系包括公司名称关系、公司人员职位关系以及其他类型的关系。

进一步的，针对每一个所述相关事件实体信息，通过以下步骤确定相关事件实体信息，请参阅图2，图2为本申请实施例所提供的相关事件实体信息的确定方法的流程图。如图2所示，通过以下步骤确定相关事件实体信息：

S1021：将多个所述目标字符输入至所述实体抽取模型中，确定出各个所述目标字符的字符编码序列。

该步骤中，将多个企业相关事件信息进行语义切割后的获得的目标字符输入至实体抽取模型之中，在实体抽取模型之中将目标字符转换成字符编码系列。

这里，目标字符的字符编码序列可以表示为“123560”，此部分不限定字符编码系列的表示类型。

其中，将多个目标字符按照编号顺序输入到实体抽取模型之中，在实体抽取模型中的BERT层会将得到的各个目标字符按照一定的转化规则将各个目标字符的字符形式转化为字符的语义编码序列，即字符编码序列，其中，可以通过字符串和字符编码之间的转换关系进行转换形成字符编码序列。

S1022：基于确定出的多个所述目标字符的字符编码序列，确定出所述相关事件实体信息中包括的至少一个头实体以及每一个头实体的第一字符编码信息。

该步骤中，根据多个目标字符的字符编码系列确定出多个相关事件实体信息中的包括的至少一个头实体以及每一个头实体的第一字符编码信息。

这里，头实体为由至少两个目标字符组成的相关事件实体信息中的首端字符，如“第一公司”则头实体为“第”，如“小明”则头实体为“小”。

其中，头实体的第一字符编码信息为多个目标字符的字符编码序列中头实体的字符编码序列，第一字符编码信息可以表示为“1226”，此部分不限定第一字符编码信息的类型以及表示形式。

进一步的，通过以下步骤确定该头实体的第一字符编码信息，包括：

A：基于多个所述目标字符的字符编码序列，确定出该头实体的头边界以及该头实体的尾边界。

其中，通过多个目标字符的字符编码序列确定出头实体的头边界和头实体的尾边界。

其中，头边界为头实体的字符编码序列中分类器的表示数值为1的编码，头边界的尾边界为头实体的字符编码序列中分类器的表示数值为0的编码；或者是，头边界为头实体的字符编码序列中分类器的表示数值为0的编码，尾边界为头实体的字符编码序列中分类器的表示数值为1的编码。如头实体“第”的字符编码序列为“1235680”则“1”表示头实体“第”的头边界，“0”表示头实体“第”的尾边界。

1)：基于所述实体抽取模型中包括的第一分类器以及第二分类器，对所述头实体的字符编码序列进行检测。

其中，根据实体抽取模型中的第一分类器和第二分类器对头实体的字符编码序列进行检测，这里，头实体的字符编码序列是从多个所述目标字符的字符编码序列确定出来的。

2)：将所述字符编码序列中编码数值为第一目标数值的编码确定为所述头实体的头边界。

其中，第一分类器对字符编码序列中的编码数值进行检测，若字符编码序列中的编码数值为第一目标数值时，则将该编码确定为头实体的头边界。

这里，第一目标数值可以为1或者是0，如，头实体“第”的字符编码序列为“130”，则“1”对应的编码为头实体的头边界。

3)：将所述字符编码序列中编码数值为第二目标数值的编码确定为所述头实体的尾边界。

其中，第二分类器对字符编码序列中的编码数值进行检测，若字符编码序列中的编码数值为第二目标数值时，则将该编码确定为头实体的尾边界。

这里，第二目标数值可以为1或者是0，如，头实体“第”的字符编码序列为“130”，则“0”对应的编码为头实体的尾边界。

其中，在对所述头实体的头边界以及所述头实体的尾边界进行检测的时候，第一分类器和第二分类器所确定的目标数值的编码是不同的，如第一分类器确定的第一目标数值为1时，则第二分类器确定的第二目标数值为0，若一分类器确定的第一目标数值为0时，则第二分类器确定的第二目标数值为1。

进一步的，通过以下方式更新所述第一分类器以及所述第二分类器的损失函数：

获取所述第一目标数值的概率值以及所述第二目标数的概率值；将所述第一目标数值的概率值基于预设次倍数进行放大，确定出第一目标数的参考概率；基于所述第一目标数值的参考概率值确定出所述第二目标数值的参考概率值；所述第一目标数值的参考概率值以及所述第二目标数值的参考概率值基于预设次倍数对所述第一分类器以及所述第二分类器的损失函数进行迭代更新，直至确定出第一目标数的参考概率值等于预设的概率值时则停止所述迭代更新。

其中，原先的损失函数为

经过n次方后的损失函数为，

其中，p为第一目标数值的概率，1-p为第二目标数值的概率，

为第一目标数值的参考概率，1-

为第二目标数值的参考概率，t为时间参数。

B：基于所述头实体的头边界以及所述头实体的尾边界，提取出该头实体。

其中，根据确定出来的头实体的头边界和头实体的尾边界对头实体进行提取，且，根据头实体的头边界和头实体尾边界的连接关系进行提取。如头实体“第”的字符编码序列为“120”则头实体的头边界为“1”，头实体的尾边界为“0”，则需要根据“1”、“0”的连接关系将“120”进行提取进而确定出头实体“第”。

C：基于所述头实体的字符编码序列，确定出所述第一字符编码信息。

其中，根据确定出来的头实体的字符编码序列，对该字符编码序列进行归一化处理确定出字符编码向量，第一字符编码信息也可以为该头实体的编码向量。

S1023：针对于每一个头实体，基于预设的头实体与尾实体之间的关联关系，确定出与该头实体相关联的至少一个尾实体以及每一个尾实体的第二字符编码信息。

该步骤中，对于每一个头实体，根据每一个头实体和多个尾实体之间的关联关系确定出与头实体相关联的至少一个尾实体以及每一个尾实体的第二字符编码信息。

这里，尾实体为由至少两个目标字符组成的相关事件实体信息中的末端字符，如“第一公司”则尾实体为“司”，如“小明”则尾实体为“明”。

这里，一个头实体和多个尾实体的之间的关联关系为一个头实体可以和多个尾实体组成不同的相关事件实体信息，如“某国”、“某国企业”可以看出在这两个相关事件实体信息中含有相同的头实体“某”但是确实有不同的尾实体“国”、“业”，所以为了保证相关事件实体信息提取的准确性通过头实体和尾实体之间的关联关系更加准确的确定出多个尾实体，如头实体“某”与尾实体“业”之间的关联关系为企业关系。

其中，尾实体的第二字符编码信息为在多个目标字符的字符编码序列中尾实体对应的编码向量。

进一步的，通过以下步骤确定该尾实体的第二字符编码信息：

a：基于多个所述目标字符的字符编码序列，确定出该尾实体的头边界以及该尾实体的尾边界。

其中，当确定出来头实体之后根据头实体与尾实体之间的关联关系可以确定出与头实体相对应尾实体的字符编码序列，在尾实体的字符编码序列中确定出该尾实体的头边界以及尾实体的尾边界。

其中，关于尾实体的头边界和尾实体的尾边界的确定方法和上述头实体的头边界和头实体的尾边界的确定方法相一致，此部分不在进行赘述。

b：基于所述尾实体的头边界以及所述尾实体的尾边界，提取出该尾实体。

其中，根据确定出来的尾实体的头边界和尾实体的尾边界，对尾实体进行提取，且，根据尾实体的头边界和头实体尾边界的连接关系进行提取。如头实体“司”的字符编码序列为“120”则头实体的头边界为“1”，头实体的尾边界为“0”，则需要根据“1”、“0”的连接关系将“120”进行提取进而确定出头实体“司”。

c：基于所述尾实体的字符编码序列，确定出所述第二字符编码信息。

其中，根据确定出来的尾实体的字符编码序列，对该字符编码序列进行归一化处理确定出字符编码向量，第二字符编码信息也可以为该尾实体的编码向量。

S1024：针对于每一个第二字符编码信息，基于所述第一字符编码信息以及所述第二字符编码信息确定出所述相关事件实体信息。

该步骤中，针对于每一个第二字符编码信息，利用第一字符编码信息和第二字符编码信息确定出多个相关事件实体信息。

这里，第二字符编码信息为尾实体的编码向量，第一字符编码信息为头实体的编码向量。

（1）：将所述第一字符编码信息以及所述第二字符编码信息进行信息拼接确定出目标字符编码信息。

其中，获取第一字符编码信息和第二字符编码信息，根据第一字符的编码信息和第二字符编码信息的字符连接关系对第一字符编码信息和第二字符编码信息进行信息拼接确定出目标字符编码信息，从而可以保证第一字符编码信息和第二编码信息之间存在的其他字符的编码信息的提取。

其中，目标字符信息是第一字符编码信息和第二字符编码信息进行信息拼接后确定出来的，且目标字符信息用于更加准确的确定出相关事件实体信息。

举例来讲，头实体“中”的第一编码信息为“120”，确定出来的尾实体“人”的第二编码信息为“130”，但是头实体的“某”和尾实体的“人”之间存在着其他字符信息“国”，其中，“国”的字符编码信息为“256”，则根据第一字符的编码信息和第二字符编码信息的连接关系进行信息拼接确定出目标字符编码信息“120256130”。

（2）：基于所述目标字符编码信息确定出所述相关事件实体信息。

其中，将目标字符编码信息进行编码信息转换确定出相关事件实体信息。如，根据第一字符的编码信息和第二字符编码信息的连接关系进行信息拼接确定出目标字符编码信息“120256130”，则将目标字符编码信息“120256130”进行编码信息转换确定出相关事件实体信息为“某国人”。

进一步的，还可以通过以下方式利用第一字符编码信息以及所述第二字符编码信息确定出所述相关事件实体信息：

所述第一字符编码信息以及所述第二字符编码信息进行基于约束矩阵进行匹配，若所述第一字符编码向量以及所述第二字符编码向量匹配成功后，则对所述相关事件实体信息进行输出。约束矩阵为：

其中，

为第一字符编码信息，

为第二字符编码信息，d为字符编码向量的维度，R为实数，m为参数，

为第一字符编码向量和第二字符编码向量进行匹配的概率信息。

在本申请实施例中，将待评估企业的多个企业相关事件信息进行切割确定出多个目标字符，将目标字符输入到预先训练好的实体抽取模型之中，实体抽取模型输出多个相关事件实体信息，如，将关于企业的一段企业相关事件信息内容进行语义分割后得到多个目标字符，将目标字符输入到实体抽取模型之中得到的相关事件实体信息为“某国”、“某国企业”、“某国企业高管”等其他相关事件实体信息进行输出，从而实现了避免在企业相关事件信息中当相关事件实体信息出现嵌套、重叠、同一相关事件实体存在多种关联关系时等其他情形下，相关事件实体信息确定不准确的技术问题。

S103：针对于一个所述相关事件实体信息，对所述相关事件实体信息的情感进行分析确定出所述相关事件实体信息的评价类型。

该步骤中，对于每一个相关事件实体信息，对相关事件实体信息的情感进行分析确定出该相关事件实体信息的评价类型。

其中，相关事件实体信息的评价类型可以包括正面评价类型、负面评价类型、中立评价类型或其他类型。

其中，可以通过计算该相关事件实体信息的情感分值确定出该相关事件实体信息的评价类型，或者是通过情感分类方法确定出该相关事件实体信息的评价类型。

S104：基于多个所述相关事件实体信息的不同评价类型的数量确定出待评估企业的等级。

该步骤中，获取多个相关事件实体信息的不同评价类型的数量，根据不同评价类型的数量对待评估企业的等级进行确定。

其中，待评估企业的等级可以为优、差、合格等其他等级。

进一步的，可以通过以下方式利用不同类型评价数量确定的该出待评估企业的等级：

基于多个所述相关事件实体信息的评价类型对所述待评估企业进行等级评估，若所述评价类型中的正面评价类型的数量小于所述评价类型中的负面评价数量，则所述待评估企业的评估等级为差，若所述评价类型中的正面评价类型的数量大于所述评价类型中的负面评价数量，则所述待评估企业的评估等级为良，此部分不限定利用不同类型评价数量确定的该出待评估企业的等级的方法。

或者是，基于多个所述相关事件实体信息的评价类型对所述待评估企业进行等级评估，若所述评价类型中的正面评价类型的数量小于预设的正面评价类型数量，则所述待评估企业的评估等级为差，若所述评价类型中的正面评价类型的数量大于所述预设的正面评价类型数量，则所述待评估企业的评估等级为良，此部分不限定利用不同类型评价数量确定的该出待评估企业的等级的方法。

在具体实施例中，获取待评估企业“第一公司”的多个企业相关事件信息，将多个企业相关事件信息利用语义进行分割得到多个目标字符，将多个目标字符输入到预先训练好的实体抽取模型之中，实体抽取模型能够更加快速全面的确定出相关事件实体信息为“第一公司”、“高管”、“出走”等一些其他的信息，对这些相关事件实体信息进行情感分析确定出相关事件实体信息的评价类型是正面评价还是负面评价，根据确定出来的评价类型的数量对“第一公司”的企业等级进行评估，其中对企业等级的评估可以为良、及格、差等其他等级，从而实现了利用该企业的相关事件信息对该企业的等级进行快速准确评估。

本申请提供了一种企业的等级评估方法，等级评估方法包括：获取待评估企业的多个企业相关事件信息，对多个所述企业相关事件信息根据语义进行切割，确定出多个目标字符以及每个目标字符对应的编号信息；将各个目标字符按照对应的编号信息依次输入至预先训练好的实体抽取模型中，输出多个相关事件实体信息；其中，相关事件实体信息是依据相关事件实体信息的头实体以及头实体和尾实体之间的关联关系确定出；针对于一个相关事件实体信息，对相关事件实体信息的情感进行分析确定出相关事件实体信息的评价类型；基于多个相关事件实体信息的不同评价类型的数量确定出待评估企业的等级。

这样，通过对企业相关事件信息的语义进行分割得到多个字符，将多个字符输入至实体抽取模型中，在实体抽取模型内根据相关事件实体信息的头实体以及头实体之间的关联关系确定出多个相关事件实体信息，从而有效提高了相关事件实体信息的准确性以及避免了相关事件实体信息关系重叠的问题，并且利用相关事件实体信息对企业等级进行评估，提高了企业等级评估的准确性。

请参阅图3为本申请实施例所提供的一种企业的等级评估装置的结构示意图。如图3中所示，所述等级评估装置300包括：

切割模块310，用于获取待评估企业的多个企业相关事件信息，对多个所述企业相关事件信息根据语义进行切割，确定出多个目标字符以及每个目标字符对应的编号信息；

实体输出模块320，用于将各个所述目标字符按照对应的编号信息依次输入至预先训练好的实体抽取模型中，获得多个相关事件实体信息；其中，所述相关事件实体信息是依据所述相关事件实体信息的头实体以及所述头实体和尾实体之间的关联关系确定出；

评价类型确定模块330，用于针对于一个所述相关事件实体信息，对所述相关事件实体信息的情感进行分析确定出所述相关事件实体信息的评价类型；

等级评估模块340，用于基于多个所述相关事件实体信息的不同评价类型的数量确定出待评估企业的等级。

进一步的，所述实体输出模块320通过以下步骤确定相关事件实体信息：

进一步的，所述实体输出模块320通过以下步骤确定该头实体的第一字符编码信息：

进一步的，所述实体输出模块320通过以下方式确定出所述头实体的头边界以及所述头实体的尾边界：

进一步的，所述实体输出模块320通过以下步骤确定该尾实体的第二字符编码信息：

进一步的，所述实体输出模块320在基于所述第一字符编码信息以及所述第二字符编码信息确定出所述相关事件实体信息时，所述实体输出模块320用于：

基于所述目标字符编码信息确定出所述相关事件实体信息。

本申请实施例提供一种企业的等级评估装置，所述等级评估装置包括：切割模块，用于获取待评估企业的多个企业相关事件信息，对多个所述企业相关事件信息根据语义进行切割，确定出多个目标字符以及每个目标字符对应的编号信息；实体输出模块，用于将各个所述目标字符按照对应的编号信息依次输入至预先训练好的实体抽取模型中，霍得多个相关事件实体信息；其中，所述相关事件实体信息是依据所述相关事件实体信息的头实体以及所述头实体和尾实体之间的关联关系确定出；评价类型确定模块，用于针对于一个所述相关事件实体信息，对所述相关事件实体信息的情感进行分析确定出所述相关事件实体信息的评价类型；等级评估模块，用于基于多个所述相关事件实体信息的不同评价类型的数量确定出待评估企业的等级。

请参阅图4，图4为本申请实施例所提供的一种电子设备的结构示意图。如图4中所示，所述电子设备400包括处理器410、存储器420和总线430。

所述存储器420存储有所述处理器410可执行的机器可读指令，当电子设备400运行时，所述处理器410与所述存储器420之间通过总线430通信，所述机器可读指令被所述处理器410执行时，可以执行如上述图1以及图2所示方法实施例中的一种企业的等级评估方法的步骤，具体实现方式可参见方法实施例，在此不再赘述。

本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时可以执行如上述图1以及图2所示方法实施例中的一种企业的等级评估方法的步骤，具体实现方式可参见方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器（Read-OnlyMemory，ROM）、随机存取存储器（RandomAccessMemory，RAM）、磁碟或者光盘等各种可以存储程序代码的介质。

最后应说明的是：以上所述实施例，仅为本申请的具体实施方式，用以说明本申请的技术方案，而非对其限制，本申请的保护范围并不局限于此，尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化，或者对其中部分技术特征进行等同替换；而这些修改、变化或者替换，并不使相应技术方案的本质脱离本申请实施例技术方案的精神和范围，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种企业的等级评估方法，其特征在于，所述等级评估方法包括：

将各个所述目标字符按照对应的编号信息依次输入至预先训练好的实体抽取模型中，获得多个相关事件实体信息；其中，所述相关事件实体信息是依据所述相关事件实体信息的头实体以及所述头实体和尾实体之间的关联关系确定出的；

基于多个所述相关事件实体信息的不同评价类型的数量确定出待评估企业的等级；

针对每一个所述相关事件实体信息，通过以下步骤确定相关事件实体信息：

2.根据权利要求1所述的等级评估方法，其特征在于，针对每一个所述头实体，通过以下步骤确定该头实体的第一字符编码信息，包括：

3.根据权利要求2所述的等级评估方法，其特征在于，通过以下方式确定出所述头实体的头边界以及所述头实体的尾边界，包括：

4.根据权利要求1所述的等级评估方法，其特征在于，针对每一个所述尾实体，通过以下步骤确定该尾实体的第二字符编码信息：

5.根据权利要求1所述的等级评估方法，其特征在于，针对于每一个第二字符编码信息，基于所述第一字符编码信息以及所述第二字符编码信息确定出所述相关事件实体信息，包括：

基于所述目标字符编码信息确定出所述相关事件实体信息。

6.一种企业的等级评估装置，其特征在于，所述等级评估装置包括：

实体输出模块，用于将各个所述目标字符按照对应的编号信息依次输入至预先训练好的实体抽取模型中，获得多个相关事件实体信息；其中，所述相关事件实体信息是依据所述相关事件实体信息的头实体以及所述头实体之间的关联关系确定出；

等级评估模块，用于基于多个所述相关事件实体信息的不同评价类型的数量确定出待评估企业的等级；

所述实体输出模块通过以下步骤确定相关事件实体信息：

7.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过所述总线进行通信，所述机器可读指令被所述处理器运行时执行如权利要求1至5任一所述的一种企业的等级评估方法的步骤。

8.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器运行时执行如权利要求1至5任一所述的一种企业的等级评估方法的步骤。