CN112668838A

CN112668838A - 一种基于自然语言解析的评分标准词库建立方法及装置

Info

Publication number: CN112668838A
Application number: CN202011453079.5A
Authority: CN
Inventors: 李志�; 谢化安; 谢志武; 李�根; 杨灿魁; 陈剑光; 佟忠正; 雷璟; 王栋; 肖琪
Original assignee: Guangdong Power Grid Co Ltd
Current assignee: Guangdong Power Grid Co Ltd
Priority date: 2020-12-11
Filing date: 2020-12-11
Publication date: 2021-04-16

Abstract

本发明涉及招标采购管理技术领域，提供一种基于自然语言解析的评分标准词库建立方法及装置，用于提高评标效率。本发明提供的基于自然语言解析的评分标准词库建立方法，包括：基于招标采购案例数据库及标的物的相关信息，建立评分知识库；通过对评分知识库进行逐条归纳整理，建立评分数据库；从所述评分数据库中提取评分关键词，基于提取的评分关键词建立评分标准词库。可以提取出大量的评分用关键词，降低专家的工作量，提高评标效率。

Description

一种基于自然语言解析的评分标准词库建立方法及装置

技术领域

本发明涉及招标采购管理技术领域，具体涉及基于自然语言解析的评分标准词库建立方法。

背景技术

按照广电企【2019】8号文《关于印发公司深化招标管理改革任务分解表的通知》整体要求，通过利用供应商数据重构等技术实现客观分智能计算、投标文件自动定位、智能辅助验真，减轻专家评标时客观分评审工作量、减少专家机械工作内容、对投标文件所提供资料进行验真。

招标采购过程中，尤其是评标过程中，专家对标的物供应商进行评价，给出选择哪家供应商的建议，涉及到很多评价意见要进行填写。专家在评选大量标的物时，需要花费大量的时间和精力撰写评价意见。具有较多评价或评分常用词的词库可以有效减低专家的工作量，提高评标效率，但现在缺乏用于这种词库。

发明内容

本发明解决的技术问题为提高评标效率，提供基于自然语言解析的评分标准词库建立方法。

为了解决上述技术问题，本发明提供的技术方案为：

基于自然语言解析的评分标准词库建立方法，包括：

基于招标采购案例数据库及标的物的相关信息，建立评分知识库；

通过对评分知识库进行逐条归纳整理，建立评分数据库；

从所述评分数据库中提取评分关键词，基于提取的评分关键词建立评分标准词库。

从历史采购案例中提取关键词，建立标准词库。

可以提取出大量的评分用关键词，降低专家的工作量，提高评标效率。

优选地，所述标的物相关信息包括采购需求说明说明和供应商信息，所述基于招标采购案例数据库及标的物相关信息，建立评分知识库的方法包括：

根据标的物采购需求说明，依据标的物重要程度和供应商进行排序，确定供应商中标的关键原因；

所述评分知识库包括标的物相关信息、供应商中标关键原因，评分内容。

优选地，建立评分数据库包括：

将评分知识库逐条归纳整理，形成招标评价的案例，其中，单条案例u标识为：

u={i，p，f，r，c}

其中i为招标采购案例编号，p为标的物相关信息，f为采购频次，r为供应商中标关键原因，c为评分内容；

评分数据库为单条案例u形成的集合。

优选地，从所述评分数据库中提取评分关键词的方法包括：

从评分数据库依次提取单条案例中的供应商中标关键原因，，进而得到中标关键原因集合R，基于中标关键原因集合R得到评分关键词。

优选地，基于中标关键原因集合R得到评分关键词的方法包括：

对单条供应商中标关键原因进行分词，得到候选关键词集合，通过所述候选关键词集合构建候选关键此图，候选关键词词图中任意两个分词之间边的权重为wji，分词Vi的权重计算公式如下：

其中，d为阻尼系数，d∈（0,1），代表从词图某一特定词只想其他任意词的概率，V_i表示指向词V_i的词集合，o(V_j)表示词V_i指向的词集合；

根据权重计算公式对候选关键词词图进行循环迭代直至收敛，最终得到各节点的权重；

将各分词的权重按照降序进行排序，选取前面一定数量的词语作为评分关键词。根据候选关键词的权重进行排序，权重大的作为评分关键词。

优选地，将所述评分关键词、所述评分关键词的上下文输入神经网络模型，所述评分关键词的上下文即所在评分关键词的前一句和下一句文本，所述神经网络模型包括：

输入层，所述输入层包括关键词编译器和上下文编译器，所述关键词编译器将评分关键词转变为词向量，所述上下文编译器将所述评分关键词的上下文转变为上下文向量；

全连接层，所述全连接层将词向量和上下文向量拼接后的向量作为输入，以包括候选词库中各候选词与评分关键词之间的特征相思苦的相似度向量作为输出；

分类层，所述分类层以所述相似度向量为输入，所述分类层将所述相似度向量归一化，得到概率向量为输出。利用神经网络对评分关键词进行扩展，丰富词库内容。

优选地，所述神经网络模型的训练方法包括：

将部分评分关键词及其对应的上下文、人工挑选的与评分关键词对应的扩展词作为训练样本；

将训练样本输入神经网络模型，获取输出的预测概率向量，所述预测概率向量中包括部分人工挑选的与评分关键词对应的扩展词及与样本不相关的候选词；

根据所述预测概率向量和人工挑选的与评分关键词对应的扩展词，计算损失函数，以最小化损失函数为训练目标，更新神经网络的参数，至神经网络收敛，得到训练好的神经网络。

基于自然语言解析的评分标准词库建立装置，包括：

知识库建立模块，所述知识库建立模块基于招标采购案例数据库及标的物的相关信息，建立评分知识库；

数据库建立模块，所述数据库建立模块通过对评分知识库进行逐条归纳整理，建立评分数据库；

词库建立模块，所述词库建立模块从所述评分数据库中提取评分关键词，基于提取的评分关键词建立评分标准词库。

一种终端，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序以实现上述的方法。

一种存储介质，存储有计算机程序，所述计算机程序可被执行以实现上述的方法。

与现有技术相比，本发明具有的有益效果为：可以提取出大量的评分用关键词，降低专家的工作量，提高评标效率。

发明人在大量实验的基础上发现从招标采购案例数据库中采集的关键词存在数量过少，不能有效提高评标效率。为此，发明人采用了多种方式对关键词进行扩展，最终发现采用神经网络模型可以有效扩展关键词，从而提高评标效率。

附图说明

图1为基于自然语言解析的评分标准词库建立方法的示意图。

图2为基于自然语言解析的评分标准词库建立装置的示意图。

具体实施方式

以下实施例是对本发明的进一步说明，不是对本发明的限制。

基于自然语言解析的评分标准词库建立方法，在本申请的一些实施例中，包括：

S100.通过对评分知识库进行逐条归纳整理，建立评分数据库；

S200.从所述评分数据库中提取评分关键词，基于提取的评分关键词建立评分标准词库。

S300.从历史采购案例中提取关键词，建立标准词库。

在本申请的一些实施例中，所述标的物相关信息包括采购需求说明说明和供应商信息，所述基于招标采购案例数据库及标的物相关信息，建立评分知识库的方法包括：

专家评标过程中，对供应商及其提供的标的物进行评价，从中的提取出的供应商关键原因可以为之后评标提供参考。

在本申请的一些实施例中，建立评分数据库包括：

u={i，p，f，r，c}

评分数据库为单条案例u形成的集合。

利用自然语言处理的方式对评分知识库进行整理，形成评分数据库。

在本申请的一些实施例中，从所述评分数据库中提取评分关键词的方法包括：

在本申请的一些实施例中，基于中标关键原因集合R得到评分关键词的方法包括：

将各分词的权重按照降序进行排序，选取前面一定数量的词语作为评分关键词。

根据候选关键词的权重进行排序，权重大的作为评分关键词。

在本申请的一些实施例中，将所述评分关键词、所述评分关键词的上下文输入神经网络模型，所述评分关键词的上下文即所在评分关键词的前一句和下一句文本，所述神经网络模型包括：

分类层，所述分类层以所述相似度向量为输入，所述分类层将所述相似度向量归一化，得到概率向量为输出。

利用神经网络对评分关键词进行扩展，丰富词库内容。候选词库也是常用的评分用词，从中筛选出有助于评分的更多关键词。

在本申请的一些实施例中，所述神经网络模型的训练方法包括：

基于自然语言解析的评分标准词库建立装置，在本申请的一些实施例中，包括：

知识库建立模块100，所述知识库建立模块100基于招标采购案例数据库及标的物的相关信息，建立评分知识库；

数据库建立模块200，所述数据库建立模块200通过对评分知识库进行逐条归纳整理，建立评分数据库；

词库建立模块300，所述词库建立模块300从所述评分数据库中提取评分关键词，基于提取的评分关键词建立评分标准词库。

在本申请的一些实施例中，所述知识库建立模块包括关键原因提取模块，所述标的物相关信息包括采购需求说明说明和供应商信息，所述基于招标采购案例数据库及标的物相关信息，所述建立评分知识库的方法包括：

所述关键原因提取模块根据标的物采购需求说明，依据标的物重要程度和供应商进行排序，确定供应商中标的关键原因；

在本申请的一些实施例中，所述数据库建立模块建立评分数据库的方法包括：

u={i，p，f，r，c}

评分数据库为单条案例u形成的集合。

在本申请的一些实施例中，还包括评分关键词提取模块，所述评分关键词提取模块从所述评分数据库中提取评分关键词的方法包括：

在本申请的一些实施例中，所述评分关键词提取模块基于中标关键原因集合R得到评分关键词的方法包括：

在本申请的一些实施例中，还包括扩增模块，所述扩展模块将所述评分关键词、所述评分关键词的上下文输入神经网络模型，所述评分关键词的上下文即所在评分关键词的前一句和下一句文本，所述神经网络模型包括：

在本申请的一些实施例中，还包括训练模块，所述训练模块训练所述神经网络模型的训练方法包括：

上列详细说明是针对本发明可行实施例的具体说明，以上实施例并非用以限制本发明的专利范围，凡未脱离本发明所为的等效实施或变更，均应包含于本案的专利范围中。

Claims

1.基于自然语言解析的评分标准词库建立方法，其特征在于，包括：

通过对评分知识库进行逐条归纳整理，建立评分数据库；

2.根据权利要求1所述的基于自然语言解析的评分标准词库建立方法，其特征在于，所述标的物相关信息包括采购需求说明说明和供应商信息，所述基于招标采购案例数据库及标的物相关信息，建立评分知识库的方法包括：

3.根据权利要求2所述的基于自然语言解析的评分标准词库建立方法，其特征在于，建立评分数据库包括：

u={i，p，f，r，c}

评分数据库为单条案例u形成的集合。

4.根据权利要求1所述的基于自然语言解析的评分标准词库建立方法，其特征在于，从所述评分数据库中提取评分关键词的方法包括：

5.根据权利要求1所述的基于自然语言解析的评分标准词库建立方法，其特征在于，基于中标关键原因集合R得到评分关键词的方法包括：

对单条供应商中标关键原因进行分词，得到候选关键词集合，通过所述候选关键词集合构建候选关键此图，候选关键词词图中任意两个分词之间边的权重为

，分词

的权重计算公式如下：

6.根据权利要求1所述的基于自然语言解析的评分标准词库建立方法，其特征在于，将所述评分关键词、所述评分关键词的上下文输入神经网络模型，所述评分关键词的上下文即所在评分关键词的前一句和下一句文本，所述神经网络模型包括：

7.根据权利要求1所述的基于自然语言解析的评分标准词库建立方法，其特征在于，所述神经网络模型的训练方法包括：

8.根据权利要求1所述的基于自然语言解析的评分标准词库建立方法装置，其特征在于，包括：

9.一种终端，其特征在于，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序以实现权利要求1~7任一项所述的方法。

10.一种存储介质，其特征在于，存储有计算机程序，所述计算机程序可被执行以实现权利要求1~7任一项所述的方法。